Return to Video

오케이 큐피드(OKCupid): 온라인 데이트의 수학 - 크리스챤 러더 (Christian Rudder)

  • 0:18 - 0:19
    안녕하세요, 제 이름은
    크리스티안 러더 (Christian Rudder) 입니다.
  • 0:19 - 0:22
    저는 오케이 큐피드 (OK Cupid) 의
    설립자 중 한사람이며,
  • 0:22 - 0:25
    오케이 큐피드는 현재 미국에서
    가장 큰 만남 주선 회사 중 하나입니다.
  • 0:25 - 0:26
    사이트 내의 거의 모든 사람들이 그러하듯,
  • 0:26 - 0:27
    저는 수학 전공을 전공했고, 여러분이 기대하듯,
  • 0:27 - 0:29
    우리는 사랑을 찾는 데에 대한
  • 0:29 - 0:30
    분석적인 접근으로 잘 알려져 있습니다.
  • 0:30 - 0:32
    우리는 그것을 매칭 알고리즘이라고 부릅니다.
  • 0:32 - 0:33
    기본적으로 오케이 큐피드의 매칭 알고리즘은
  • 0:33 - 0:36
    두 사람이 데이트를 해야 할 것인지
    결정하도록 도와줍니다.
  • 0:36 - 0:39
    저희의 모든 사업은
    이 알고리즘을 기초로 만들어졌습니다.
  • 0:39 - 0:41
    알고리즘은 뭔가 특별한 단어이고,
  • 0:41 - 0:43
    사람들은 대단한 것인양
    대화에 즐겨 사용합니다.
  • 0:43 - 0:45
    하지만 실제로 알고리즘은
    단지 문제를 해결하는
  • 0:45 - 0:48
    체계적이고 단계적인 방법일 뿐입니다.
  • 0:48 - 0:50
    따라서 그것은 결코 화려할 필요가 없어요.
  • 0:50 - 0:52
    이번 강의에게 우리가 어떻게
    우리만의 알고리즘에
  • 0:52 - 0:54
    도달하게 되었는지 알려 드리겠습니다.
  • 0:54 - 0:56
    그러면 어떻게 구축된 것인지
    이해하실 거에요.
  • 0:56 - 0:58
    이제 알고리즘이
    왜 그렇게 중요한지 아시겠어요?
  • 0:58 - 0:59
    왜 이런 강연이 있을까요?
  • 0:59 - 1:02
    글쎄요, 제가 앞서 썼던 표현 중
    중요한 문구를 잘 생각해 보세요.
  • 1:02 - 1:05
    알고리즘은 문제를 단계적으로 해결하는 방식입니다.
  • 1:05 - 1:06
    그리고 여러분이 아마도 알고 계시듯이,
  • 1:06 - 1:08
    컴퓨터는 단계별 과정에 뛰어납니다.
  • 1:08 - 1:10
    알고리즘없는 컴퓨터는
  • 1:10 - 1:13
    기본족으로 값비싼 타자기에 불과합니다.
  • 1:13 - 1:15
    컴퓨터가 일생 생활의 모든 영역에
    스며들었기 때문에,
  • 1:15 - 1:17
    알고리즘은 어디에나 있습니다.
  • 1:19 - 1:20
    오케이 큐피드의 매칭 알고리즘의
    배경이 되는 수학은
  • 1:20 - 1:22
    매우 간단합니다.
  • 1:22 - 1:23
    그것은 단지 덧셈,
  • 1:23 - 1:24
    곱셈,
  • 1:24 - 1:25
    제곱근을 사용합니다.
  • 1:25 - 1:28
    그러나 알고리즘을 구성하는 데 어려운 부분은
  • 1:28 - 1:30
    신비스러운 부분인 사람 간의 끌림을
  • 1:30 - 1:31
    어떻게 밝혀내는가 하는 것이며,
  • 1:31 - 1:34
    또 컴퓨터가 작업할 수 있도록
    구성 요소들로 나누는가 입니다.
  • 1:34 - 1:36
    사람들을 연결시키기 위해
    처음으로 필요했던 것은
  • 1:36 - 1:38
    알고리즘으로 작업할 수 있는
    어떤 형태의 자료였습니다.
  • 1:38 - 1:40
    사람들로부터 자료를 수집하는 최고의 방법은
  • 1:40 - 1:42
    그들에게 물어보는 것이었어요.
  • 1:42 - 1:44
    그래서 우리는 오케이 큐피트
    사용자들에게 질문을 하기로 했죠.
  • 1:44 - 1:47
    "언젠가 아이를 갖기를 원하세요?" 같은 것들이나
  • 1:47 - 1:49
    "얼마나 자주 양치질을 하나요?"
  • 1:49 - 1:50
    "공포 영화를 좋아하세요?"
  • 1:50 - 1:54
    또는 "신을 믿으세요?" 와 같은
    중요한 질문들이었습니다.
  • 1:54 - 1:55
    굉장히 많은 질문들이
  • 1:55 - 1:56
    선호 사항과 선호 사항 사이를
    연결시켜주는 데 유용합니다.
  • 1:56 - 1:59
    그리고 바로 그 때가
    사람들이 동일한 방식으로 대답을 할 때죠.
  • 1:59 - 2:01
    예를 들어, 공포 영화를 좋아하는 두 사람이
  • 2:01 - 2:03
    아마 공포 영화를 좋아하는 한 사람과
  • 2:03 - 2:04
    그렇지 않은 다른 한 사람 보다
  • 2:04 - 2:05
    더 잘 어울릴 거에요.
  • 2:05 - 2:06
    그러면 다음과 같은 질문에는
    어떻게 답하는지 볼까요.
  • 2:06 - 2:08
    "당신은 관심의 중심이 되고 싶은가요?"
  • 2:08 - 2:11
    만약 연인관계에 있는 두 사람 모두
    이 질문에 "네" 라고 대답한다면,
  • 2:11 - 2:13
    두 사람은 곧 큰 문제에 직면하게 될 거에요.
  • 2:13 - 2:14
    우리는 이것을 일찍 알았고,
  • 2:14 - 2:16
    각각의 질문에 대해 정보가 더 필요하고
  • 2:16 - 2:18
    이를 모아야겠다고 생각했습니다.
  • 2:18 - 2:20
    우리는 사람들에게
    자신의 대답을 구체화 할 뿐 아니라,
  • 2:20 - 2:23
    다른 사람들로부터 그들이
    원하는 대답을 구체화 하도록 요청했습니다.
  • 2:23 - 2:24
    그런 노력들은 효과가 있었습니다.
  • 2:24 - 2:26
    그러나 우리는 한 가지
    다른 차원이 필요했어요.
  • 2:26 - 2:29
    어떤 질문들은 다른 것들보다
    한 사람에 대해 훨씬 더 많은 것을 알려줍니다.
  • 2:29 - 2:32
    예를 들어, "책을 태우는 것과 깃발을 태우는 것 가운데
    어느 것이 더 나쁜가요?" 와 같은
  • 2:32 - 2:35
    정치적 질문은
  • 2:35 - 2:37
    개인의 영화에 대한 취향보다는
    그들 자신에 관해 더 알려줄 수도 있거든요.
  • 2:37 - 2:39
    그리고 모든 것들을 똑같은 비중으로
    다룬다는 것은 말이 되지 않죠.
  • 2:39 - 2:42
    그래서 우리는 마지막으로
    한 가지의 정보가 더 필요했습니다.
  • 2:42 - 2:43
    오케이 큐피드가 묻는
    모든 것들에 대해
  • 2:43 - 2:45
    사람들은 각자의 삶에서 그런 질문들이
  • 2:45 - 2:46
    어떤 역할을 하는지
    말할 기회를 갖게 됩니다.
  • 2:46 - 2:49
    이것은 무의미한 것부터
    필수적인 것까지 다양합니다.
  • 2:49 - 2:51
    그래서 지금 우리는 각 질문을 통해
  • 2:51 - 2:53
    우리의 알고리즘에 관한
    세 가지 사실을 파악하고 있습니다:
  • 2:53 - 2:54
    첫째, 여러분의 대답.
  • 2:54 - 2:56
    둘째, 여러분이 다른 누군가
  • 2:56 - 2:57
    즉, 여러분의 잠재적 상대가
  • 2:57 - 2:59
    어떻게 대답하길 원하는지.
  • 2:59 - 3:02
    셋째, 그 질문이 여러분에게
    얼마나 중요한지 하는 것이에요.
  • 3:02 - 3:04
    이런 정보들로,
  • 3:04 - 3:07
    오케이 큐피드는 두 사람이
    얼마나 잘 어울리는지 알아냅니다.
  • 3:07 - 3:09
    알고리즘은 수치들을 분석하여
    결과를 알려줍니다.
  • 3:09 - 3:11
    실제적인 예로,
  • 3:11 - 3:14
    우리가 어떻게 여러분을
    연결시켜 드리는지 살펴보겠습니다.
  • 3:14 - 3:16
    상대를 "B" 라고 하겠습니다.
  • 3:16 - 3:17
    B 와 여러분의 연결 확률은 질문들에 대한
  • 3:17 - 3:19
    두사람의 대답에 달려 있습니다.
  • 3:19 - 3:22
    공통 질문 세트를 "S" 라고 부르겠습니다.
  • 3:22 - 3:25
    매우 간단한 예로, 우리는
    공통으로 단 두개의 질문만 있는
  • 3:25 - 3:26
    작은 세트 질문 "S"를 사용합니다.
  • 3:26 - 3:28
    그리고 그것들로 연결을 계산합니다.
  • 3:28 - 3:30
    두 가지 예를 말씀 드릴께요.
  • 3:30 - 3:32
    예를 들어, 첫 질문은
    "여러분은 얼마나 지저분한가요?" 입니다.
  • 3:32 - 3:35
    그리고 가능한 대답은
  • 3:35 - 3:36
    매우 지저분한,
  • 3:36 - 3:36
    보통,
  • 3:36 - 3:38
    매우 정리된 입니다.
  • 3:38 - 3:40
    여러분이 "매우 정리된"이라고
    대답했다고 생각해 보세요.
  • 3:40 - 3:43
    그러면 여러분은 짝이 될 사람도
    "매우 정리된" 이라고 대답하길 기대할 거에요.
  • 3:43 - 3:45
    이 질문은 사람들에게 매우 중요합니다.
  • 3:45 - 3:46
    기본적으로 사람들에게는
    정리벽이 있거든요.
  • 3:46 - 3:47
    사람들은 단정하고,
  • 3:47 - 3:48
    다른 사람도 단정하길 바랍니다,
  • 3:48 - 3:49
    그것 뿐입니다.
  • 3:49 - 3:51
    B 는 다소 다르다고 생각해봅시다.
  • 3:51 - 3:54
    B는 자신에 대해 매우
    정리된 사람이라 대답하지만,
  • 3:54 - 3:55
    그는 보통이라고 말하는 사람과도
  • 3:55 - 3:57
    사이가 좋습니다.
  • 3:57 - 3:59
    그런 질문은 그에게
    그리 중요하지 않습니다.
  • 3:59 - 4:00
    두 번째 질문을 보겠습니다.
  • 4:00 - 4:02
    앞서 예로 들었던 질문입니다.
  • 4:02 - 4:04
    "여러분은 관심의 중심이 되고 싶은가요?"
  • 4:04 - 4:05
    대답은 그저 네 아니면 아니오 입니다.
  • 4:05 - 4:06
    여러분은 "아니오" 라고 대답했고,
  • 4:06 - 4:08
    여러분은 상대방도 "아니오"라고 대답하길 원하며,
  • 4:08 - 4:11
    그 질문은 여러분에게 별로
    중요하지 않다고 생각해 봅시다.
  • 4:11 - 4:12
    B는 "네" 라고 대답했고,
  • 4:12 - 4:14
    그는 자신이 주목받길 원하기 때문에
  • 4:14 - 4:16
    상대방이 "아니오"라고
    대답하길 원한다고 생각해봐요.
  • 4:16 - 4:19
    그리고 그 질문은 그 사람에게
    매우 중요합니다.
  • 4:19 - 4:22
    그러면 이것을 가지고 측정을 해 봅시다.
  • 4:22 - 4:23
    우리의 첫 단계는
  • 4:23 - 4:24
    컴퓨터를 사용해야 하기 때문에
  • 4:24 - 4:26
    "다소 중요" 나 "매우 중요"와 같은
  • 4:26 - 4:29
    생각들에 절대값을 부여해야 합니다.
  • 4:29 - 4:31
    왜냐하면 컴퓨터는 모든 것을
    수치로 필요로 하기 때문이죠.
  • 4:31 - 4:34
    오케이 큐피드는
    다음과 같은 척도를 사용합니다.
  • 4:34 - 4:36
    '무의미한'은 0
  • 4:36 - 4:38
    '조금 중요한'은 1
  • 4:38 - 4:40
    '다소 중요한'은 10
  • 4:40 - 4:42
    '매우 중요한'은 50
  • 4:42 - 4:46
    그리고 '절대적으로 필수적인'은 250 입니다.
  • 4:46 - 4:49
    다음으로 알고리즘은
    두 가지 간단한 계산을 합니다.
  • 4:49 - 4:52
    첫번째는 B의 대답들이
    얼마나 여러분을 만족시키는지,
  • 4:52 - 4:56
    즉, 여러분의 척도에서
    얼마나 많은 점수를 획득하느냐 입니다.
  • 4:56 - 4:58
    여러분은 지저분함에 관한 질문에 대한
  • 4:58 - 5:00
    B의 대답이
  • 5:00 - 5:01
    매우 중요하다고 암시했습니다.
  • 5:01 - 5:04
    그것은 50점이고 B는 그 점수를 획득했어요.
  • 5:04 - 5:06
    두번째 질문은 단지 1점입니다.
  • 5:06 - 5:08
    왜냐하면 여러분이 그것이
    중요하지 않다고 말했기 때문입니다.
  • 5:08 - 5:09
    그리고 B는 점수를 받지 못했습니다.
  • 5:09 - 5:12
    그래서 B의 대답은 51점 중
    50점을 받았습니다.
  • 5:12 - 5:14
    98% 만족스러운거죠.
  • 5:14 - 5:15
    상당히 좋습니다.
  • 5:15 - 5:17
    알고리즘의 두 번째 질문은
  • 5:17 - 5:19
    얼마나 여러분이 B를
    만족시키는지를 보는 것입니다.
  • 5:19 - 5:21
    B는 지저분함에 관한
  • 5:21 - 5:22
    여러분의 대답에 1점을
  • 5:22 - 5:25
    두번째 질문에는 10점을 부여했습니다.
  • 5:25 - 5:27
    1점과 10점을 합해서 11점 중
  • 5:27 - 5:28
    여러분은 10점을 얻었고,
  • 5:28 - 5:31
    두 사람은 두번째 질문에서
    서로를 만족시켰습니다.
  • 5:31 - 5:33
    그래서 여러분의 대답은
    11점 중 10점을 받았고,
  • 5:33 - 5:35
    B에 대해 똑같이 91% 만족하게 됩니다.
  • 5:35 - 5:36
    나쁘지 않죠.
  • 5:36 - 5:38
    마지막 단계는 이 두 수치를 합하여
  • 5:38 - 5:40
    두 사람 모두에 대한
    하나의 결과치를 만드는 작업입니다.
  • 5:40 - 5:43
    이렇게 하기 위해서는,
    알고리즘이 여러분의 점수들을 곱해야 합니다.
  • 5:43 - 5:44
    그리고 n제곱근을 구해야 합니다.
  • 5:44 - 5:47
    여기서 n은 질문의 수입니다.
  • 5:47 - 5:49
    우리가 든 예에서
  • 5:49 - 5:52
    s가 겨우 2였기 때문에,
  • 5:52 - 5:54
    우리는 98%와 91%의 곱의
  • 5:54 - 5:58
    제곱근을 구합니다.
  • 5:58 - 6:00
    이는 94%가 됩니다.
  • 6:00 - 6:03
    이 94%의 값이
    B와 여러분의 매칭 백분위입니다.
  • 6:03 - 6:05
    이것은 여러분이 서로 얼마나 만족할지
  • 6:05 - 6:06
    우리가 알고 있는 정보에 근거하여
  • 6:06 - 6:08
    수학적으로 표현한 것입니다.
  • 6:08 - 6:10
    그러면, 왜 알고리즘이
  • 6:10 - 6:12
    두 매칭 점수의 평균을 구하는 대신
  • 6:12 - 6:15
    곱셈을 해서
    제곱근을 하는걸까요?
  • 6:15 - 6:16
    일반적으로, 이 공식은
    기하 평균이라고 불립니다.
  • 6:16 - 6:18
    이것은 넓은 범위를 지닌 값들을
  • 6:18 - 6:19
    통합하여
  • 6:19 - 6:21
    매우 다른 특성들을 나타내는
    좋은 방법입니다.
  • 6:21 - 6:23
    다시 말해, 로맨틱 매칭에 있어
    완벽한 방법입니다.
  • 6:23 - 6:24
    사람들은 다양한 범위의 값과
  • 6:24 - 6:26
    수 많은 다른 정보 점수를 갖고 있습니다.
  • 6:26 - 6:27
    제가 말한 것 처럼, 영화에 관해서,
  • 6:27 - 6:28
    정치에 관해서,
  • 6:28 - 6:29
    종교에 관해서,
  • 6:29 - 6:30
    모든 것에 관해서 말이죠.
  • 6:30 - 6:32
    이것은 직관적으로도 의미가 있어요.
  • 6:32 - 6:35
    두 사람이 서로를 50% 만족시킨다면
  • 6:35 - 6:36
    한 사람이 0% 만족시키고
    다른 한 사람이 100% 만족시키는 커플보다
  • 6:36 - 6:39
    더욱 괜찮은 매칭입니다.
  • 6:39 - 6:41
    왜냐하면 애정은
    상호적이어야 하기 때문입니다.
  • 6:41 - 6:43
    앞서 예에서 들었던 것처럼
  • 6:43 - 6:46
    우리가 매우 적은 수의
    질문을 갖고 있는 경우에
  • 6:46 - 6:47
    오차를 조금만 수정하고 나면
  • 6:47 - 6:49
    계속 진행해도 좋습니다.
  • 6:49 - 6:50
    오케이 큐피드가 두 사람을 연결할 때마다
  • 6:50 - 6:52
    우리가 방금 간략하게 소개한
    과정들을 거치게 됩니다.
  • 6:52 - 6:54
    첫째, 사람들의 대답 정보를 모읍니다.
  • 6:54 - 6:57
    그리고 간단하고 수학적인 방법으로
    그들의 선택과 선호도를
  • 6:57 - 7:00
    다른 사람들의 것과 비교합니다.
  • 7:00 - 7:02
    저는 현실의 현상을 가지고
    마이크로 칩이
  • 7:02 - 7:05
    이해할 수 있는 어떤 것을 만들어 내는 능력이
  • 7:05 - 7:06
    오늘날 누구든지
  • 7:06 - 7:09
    가질 수 있는
    가장 중요한 기술이라고 생각합니다.
  • 7:09 - 7:11
    여러분이 누군가에게
    이야기를 들려주기 위해 쓰는 문장들처럼,
  • 7:11 - 7:14
    여러분은 컴퓨터에게 이야기를 들려주기 위해
    알고리즘을 사용합니다.
  • 7:14 - 7:15
    만약 여러분이 그 언어를 배운다면,
  • 7:15 - 7:16
    여러분은 여러분의 이야기를 들려줄 수 있을거에요.
  • 7:16 - 7:19
    저는 이 이야기가 어려분이
    그렇게 하도록 도울 수 있으면 좋겠습니다.
Title:
오케이 큐피드(OKCupid): 온라인 데이트의 수학 - 크리스챤 러더 (Christian Rudder)
Speaker:
Christian Rudder
Description:

전체 강의 보기: http://ed.ted.com/lessons/inside-okcupid-the-math-of-online-dating-christian-rudder

두 사람이 온라인 데이트 사이트에 가입했을 때, 그들은 공통의 관심사와 개인적인 질문들에 어떻게 대답하는지에 따라 연결됩니다. 그러나 어떻게 사이트들이 성공적인 관계 정도를 측정할 수 있을까요? 인기있는 데이팅 사이트 오케이 큐피드 (OKCupid)의 설립자, 크리스챤 러더 (Christian Rudder)는 "좋은 사람 만나기" 뒤에 있는 알고리즘을 자세히 설명합니다.

강의: 크리스챤 러더 (Christian Rudder)
동영상: TED-Ed

more » « less
Video Language:
English
Team:
closed TED
Project:
TED-Ed
Duration:
07:31
  • hitting it off는 '죽이 맞는' 이라는 형용사 보다는 명사형으로, 직역되기 보다는 의역되는 것이 좋을 것 같아 변경했습니다.

  • 안녕하세요? 중요한 것은 아니지만 여기저기 사소한 수정이 꽤 있었습니다. 예를 들어, "이는"이라는 표현은 보다 구체적으로 지칭하도록 했고 , 6:12.284 와같은 곳은 의역이 조금 지나쳐 보여서 수정했습니다. 외래어도 가능한 경우는 우리말로 바꾸었습니다. 그 밖에 수정들은 이해를 쉽게하고, 읽는데 간단하게 하도록 수정했습니다. 주요 변화는 없다고 보고 바로 publish 하도록 하겠습니다. 수고 하셨습니다.

Korean subtitles

Revisions Compare revisions