探秘OKCupid: 网络交友中的数学 -- Christian Rudder
-
0:18 - 0:19大家好,我叫 Christian Rudder,
-
0:19 - 0:22我是 OKCupid 网站的创办人之一。
-
0:22 - 0:25这个网站现在已经是
全美最大的交友网站。 -
0:25 - 0:26就象这网站上大多数其他人一样,
-
0:26 - 0:27我是学数学的,
正如你所期待的那样, -
0:27 - 0:29我们擅于分析。
-
0:29 - 0:30我们把这方法也应用在爱情上。
-
0:30 - 0:32我们把它叫做“配对算法”。
-
0:32 - 0:33基本上 OK Cupid 的配对算法
-
0:33 - 0:36帮助我们决定
两个人是否应该约会。 -
0:36 - 0:39我们的整个业务都是基于这一点。
-
0:39 - 0:41“算法”这个词说起来专业而高级,
-
0:41 - 0:43大家喜欢把它想成很大的一件事,
-
0:43 - 0:45但其实,算法只不过是一个系统的,
-
0:45 - 0:48一步一步的解决问题的方法。
-
0:48 - 0:50根本没有那么复杂。
-
0:50 - 0:52现在,我将为大家解释
-
0:52 - 0:54我们怎样得出这一个特殊的算法。
-
0:54 - 0:56你会在这看到它是怎样成形的。
-
0:56 - 0:58为什么算法如此重要?
-
0:58 - 0:59为什么我们要有这堂课?
-
0:59 - 1:02请注意我刚才提到的一个很重要的词:
-
1:02 - 1:05它们是一种"逐步"解决问题的方法,
-
1:05 - 1:06你或许也知道,
-
1:06 - 1:08电脑擅长于一步一步的运算过程。
-
1:08 - 1:10没有算法的电脑,
-
1:10 - 1:13基本上只是一个昂贵的镇纸。
-
1:13 - 1:15既然电脑已经普及到我们的日常生活,
-
1:15 - 1:17算法是无处不在。
-
1:19 - 1:20OK Cupid 配对算法背后的数学逻辑
-
1:20 - 1:22是非常简单的。
-
1:22 - 1:23就是一些加法,
-
1:23 - 1:24乘法,
-
1:24 - 1:25再来一点平方根。
-
1:25 - 1:28不过,设计这套算法的关键部分,
-
1:28 - 1:30在于要找出那些神秘的
-
1:30 - 1:31人与人之间的相互吸引力,
-
1:31 - 1:34并把它解构成电脑可以工作的部分,
-
1:34 - 1:36我们要做的第一件事
就把人和数据关联起来, -
1:36 - 1:38这样算法才能生效。
-
1:38 - 1:40要最快的从人们那里得到数据,
-
1:40 - 1:42最好就是直接询问他们。
-
1:42 - 1:44我们决定 OK Cupid
应该向用户问问题, -
1:44 - 1:47比如说:“你会想要小孩吗?”,
-
1:47 - 1:49“你多久刷一次牙?“,
-
1:49 - 1:50”你喜欢看恐怖电影么?”。
-
1:50 - 1:54也有严肃些的问题,
比如:“你相信上帝么?”。 -
1:54 - 1:55目前有很多问题
-
1:55 - 1:56在进行同类型配对上都很合适,
-
1:56 - 1:59就是当双方的答案相同时。
-
1:59 - 2:01比如,两个人都喜欢看恐怖电影
-
2:01 - 2:03可能配对得更成功。
-
2:03 - 2:04而一个人喜欢,
-
2:04 - 2:05另外一个人不喜欢的情况下,
适配度就差点。 -
2:05 - 2:06但如果碰到下面的问题 :
-
2:06 - 2:08“你喜欢成为关注的中心么?”
-
2:08 - 2:11如果交往中的双方都回答是,
-
2:11 - 2:13那他们可有大问题了。
-
2:13 - 2:14我们很早就意识到了这一点,
-
2:14 - 2:16所以我们觉得需要
-
2:16 - 2:18在每个问题再收集多一些数据。
-
2:18 - 2:20我们不仅要人们回答自己的看法,
-
2:20 - 2:23也要他们回答
他们期待对方如何回答。 -
2:23 - 2:24这方法很有效,
-
2:24 - 2:26不过我们还要再多加一个维度。
-
2:26 - 2:29有些问题能表达人们的与众不同之处。
-
2:29 - 2:32比如,关于政治的问题,
-
2:32 - 2:35“ 焚烧书籍或者国旗,
哪个更糟糕 ?” -
2:35 - 2:37这能展露人们电影口味之外的东西
-
2:37 - 2:39同时,并不是所有问题都同等重要的,
-
2:39 - 2:42所以我们最后增加了一个数据点。
-
2:42 - 2:43任何 OK Cupid 的问题,
-
2:43 - 2:45你都可以告诉我们
-
2:45 - 2:46这问题对你的重要性,
-
2:46 - 2:49它的程度从“无关”到“必要”。
-
2:49 - 2:51现在,每一个问题,
-
2:51 - 2:53我们有三个资讯提供给算法:
-
2:53 - 2:54第一,你的答案;
-
2:54 - 2:56第二,你希望别人怎么回答;
-
2:56 - 2:57也就是你潜在的对象,
-
2:57 - 2:59的答案;
-
2:59 - 3:02第三,这个问题对你有多重要?
-
3:02 - 3:04有了这些信息,
-
3:04 - 3:07OK Cupid 可以知道
两个人相处和谐程度如何。 -
3:07 - 3:09算法吃进数字,吐出答案。
-
3:09 - 3:11实际举例来说吧,
-
3:11 - 3:14看我们怎样把你和另外一个人进行配对,
-
3:14 - 3:16暂且称他为 “B”。
-
3:16 - 3:17你和 B 的适配度是基于
-
3:17 - 3:19你们双方都进行过回答的问题。
-
3:19 - 3:22姑且把这些共同问题称之为 “s”。
-
3:22 - 3:25简单举例,我们用小样本的 “s”,
-
3:25 - 3:26只需两个共同回答过的问题
-
3:26 - 3:28电脑会根据它算出适配度。
-
3:28 - 3:30这里是我们的两道简单问题:
-
3:30 - 3:32第一个是,“你有多杂乱无章?”
-
3:32 - 3:35可供选择的答案选项有
-
3:35 - 3:36非常杂乱无章,
-
3:36 - 3:36一般,
-
3:36 - 3:38和非常有条理。
-
3:38 - 3:40我们假设你回答的是“非常有条理”,
-
3:40 - 3:43你期待别人的回答是“非常有条理”,
-
3:43 - 3:45并且对你来说,这个问题非常重要。
-
3:45 - 3:46基本上你就是个井井有条的怪胎。
-
3:46 - 3:47你是整洁有条理的人,
-
3:47 - 3:48你也希望对方同样如此,
-
3:48 - 3:49就这样。
-
3:49 - 3:51我们假设 B 有些不同。
-
3:51 - 3:54他的回答是自己非常有条理,
-
3:54 - 3:55但是他也接受“一般”,
-
3:55 - 3:57如果别人是这样回答的话,
-
3:57 - 3:59这个问题于他而言不太重要。
-
3:59 - 4:00我们看第二个问题,
-
4:00 - 4:02就是我们最开始举例的:
-
4:02 - 4:04“你喜欢成为关注的中心么?”
-
4:04 - 4:05答题项只有“是”或者“否”。
-
4:05 - 4:06现在你的回答是“否”,
-
4:06 - 4:08你希望别人怎样回答这栏答的是“否”
-
4:08 - 4:11这个问题对于你不太重要。
-
4:11 - 4:12而B呢,他自己的回答是“是”,
-
4:12 - 4:14他希望别人回答“否”,
-
4:14 - 4:16因为他希望所有焦点都在他身上,
-
4:16 - 4:19而这个问题对他还算重要。
-
4:19 - 4:22现在,我们让电脑来处理一切。
-
4:22 - 4:23我们的第一步是,
-
4:23 - 4:24既然我们要用电脑来处理它,
-
4:24 - 4:26我们就需要给一些数值
-
4:26 - 4:29来定义比如“还算重要”和“非常重要”,
-
4:29 - 4:31因为电脑需要把所有资料都转化成数字。
-
4:31 - 4:34在 OK Cupid 上我们按如下级别:
-
4:34 - 4:36“无关”是 0,
-
4:36 - 4:38“不太重要”的值是1,
-
4:38 - 4:40“还算重要”的值是 10,
-
4:40 - 4:42“非常重要”的值是 50,
-
4:42 - 4:46“绝对必要”的值是 250.
-
4:46 - 4:49接下来,算法要做两个简单的计算。
-
4:49 - 4:52第一个是你对B的回答给多少分,
-
4:52 - 4:56另外一个是,你给对方答题的满分是多少?
-
4:56 - 4:58你可以指定 B 的答案
-
4:58 - 5:00在第一个有关条理性的问题上,
-
5:00 - 5:01对你是非常重要。
-
5:01 - 5:04它值50分,B 答对了。
-
5:04 - 5:06第二个问题只有1分,
-
5:06 - 5:08因为你说这问题对你不太重要,
-
5:08 - 5:09B 答错了。
-
5:09 - 5:12所以B的回答在51分满分里拿到了50分。
-
5:12 - 5:14适配满意度是 98%。
-
5:14 - 5:15非常好。
-
5:15 - 5:17算法的第二个问题是看
-
5:17 - 5:19B 对你的满意程度。
-
5:19 - 5:21B给对于你有关条理性的回答
-
5:21 - 5:22给1分,
-
5:22 - 5:25对于第二个问题的答案给10分。
-
5:25 - 5:27满分11分,就是1+10.
-
5:27 - 5:28你得到了10分,
-
5:28 - 5:31在第二个问题上,你俩彼此都满意。
-
5:31 - 5:33你的回答在B的满意度分数是10/11,
-
5:33 - 5:35百分比是91%。
-
5:35 - 5:36还不错。
-
5:36 - 5:38最后一步是把两个适配度百分比放在一起,
-
5:38 - 5:40为你们两打一个分数。
-
5:40 - 5:43为得到这点,
算法把你们两人的得分相乘, -
5:43 - 5:44然后开n次方根,
-
5:44 - 5:47n 就是问题的数目。
-
5:47 - 5:49因为“s”-- 也就是问题的数目,
-
5:49 - 5:52在这个例子里,只是“2”,
-
5:52 - 5:54我们得到的适配度百分比等于
-
5:54 - 5:5898% 乘以 91% 再开平方根。
-
5:58 - 6:00结果等于94%。
-
6:00 - 6:0394%就是你和 B 之间的适配度百分比。
-
6:03 - 6:05这是通过数学方法来表达--
-
6:05 - 6:06你们彼此之间相处的愉快程度是怎样。
-
6:06 - 6:08基于我们所知道的信息。
-
6:08 - 6:10为什么算法要相乘,而不是除?
-
6:10 - 6:12比如,把两个分数求平均值以后
-
6:12 - 6:15再开平方根?
-
6:15 - 6:16总的来说,这个公式叫几何平均数,
-
6:16 - 6:18它很适合处理
-
6:18 - 6:19差异很大的数据,
-
6:19 - 6:21以及代表不同属性的数据。
-
6:21 - 6:23换句话说,它能完美的
计算出浪漫爱情适配度。 -
6:23 - 6:24你有大范围的,
-
6:24 - 6:26数不清的数据值,
-
6:26 - 6:27就像刚说过的,有关电影的,
-
6:27 - 6:28有关政治的,
-
6:28 - 6:29有关宗教的,
-
6:29 - 6:30有关所有的一切。
-
6:30 - 6:32凭直觉讲,以下情况很有道理。
-
6:32 - 6:35两个人彼此的满意度是50%,
-
6:35 - 6:36会好过
-
6:36 - 6:39那些两个人彼此满意度是0或者100的。
-
6:39 - 6:41因为爱慕应该是互相的。
-
6:41 - 6:43在增加了对误差幅度的小修改后 --
-
6:43 - 6:46这种情况在问题量很小的时候会出现,
-
6:46 - 6:47就像我们刚举的运算实例一样--
-
6:47 - 6:49这套算法就可以运作了。
-
6:49 - 6:50任何时候当 OK Cupid 将两个人配对时,
-
6:50 - 6:52它按照我们刚介绍的步骤来運作,
-
6:52 - 6:54首先它收集你的答题的数据,
-
6:54 - 6:57然后它比较你的选项和
你期待的对方选项, -
6:57 - 7:00以简单的,数学的方法来进行。
-
7:00 - 7:02这种能将现实世界的现象,
-
7:02 - 7:05转化为电脑芯片能读取的数据的能力,
-
7:05 - 7:06我认为,
-
7:06 - 7:09是现代最重要的一种技术。
-
7:09 - 7:11就像你用话语来给一个人讲故事,
-
7:11 - 7:14你是用算法来跟电脑讲故事。
-
7:14 - 7:15如果你学会了这种语言,
-
7:15 - 7:16你就可以去讲故事了。
-
7:16 - 7:20我希望我刚才的介绍能帮助你做到这点。
- Title:
- 探秘OKCupid: 网络交友中的数学 -- Christian Rudder
- Speaker:
- Christian Rudder
- Description:
-
完整课程请见:http://ed.ted.com/lessons/inside-okcupid-the-math-of-online-dating-christian-rudder
当两个人加入交友网站,根据共同兴趣,回答一系列个人问题的,系统便会将他们自动配对。但这个网站怎样能计算出一段缘分成功牵手的几率呢?Christian Rudder,这位热门交友网站 OKCupid 的创始人之一,将向我们详细讲述"投缘"背后的算法。
- Video Language:
- English
- Team:
- closed TED
- Project:
- TED-Ed
- Duration:
- 07:31
Coco Shen edited Chinese, Simplified subtitles for Inside OKCupid: The math of online dating | ||
Coco Shen edited Chinese, Simplified subtitles for Inside OKCupid: The math of online dating | ||
Coco Shen edited Chinese, Simplified subtitles for Inside OKCupid: The math of online dating | ||
Coco Shen approved Chinese, Simplified subtitles for Inside OKCupid: The math of online dating | ||
Sharon Loh accepted Chinese, Simplified subtitles for Inside OKCupid: The math of online dating | ||
Sharon Loh edited Chinese, Simplified subtitles for Inside OKCupid: The math of online dating | ||
Sharon Loh edited Chinese, Simplified subtitles for Inside OKCupid: The math of online dating | ||
Gena Volz edited Chinese, Simplified subtitles for Inside OKCupid: The math of online dating |