如何用数据选电视剧 | Sebastian Wernicke | TEDxCambridge
-
0:21 - 0:25你们大多数人可能都没听说过Roy Price
-
0:25 - 0:28不过在2013年4月19日那天,他可能要为让你们
-
0:28 - 0:34度过无聊的22分钟负责
-
0:35 - 0:38当然有些人觉得那22分钟非常有趣
-
0:38 - 0:40不过这些人很少
-
0:40 - 0:42为什么要这样说呢,这还得追溯到
-
0:42 - 0:44Roy三年前做出的一个决定
-
0:44 - 0:49Roy Price 是亚马逊制片室的高级主管
-
0:49 - 0:52专门负责亚马逊的电视制作
-
0:52 - 0:55他47岁,很瘦,头发有点竖起
-
0:55 - 1:00推特上的签名是“电影,电视,技术,墨西哥玉米薄卷饼”
-
1:00 - 1:05Roy Pric负责为亚马逊挑选要制作的
-
1:05 - 1:09原创电视剧
-
1:09 - 1:12美国电视剧竞争非常激烈
-
1:12 - 1:14那么多的电视节目
-
1:14 - 1:17Roy也不知道选哪个
-
1:17 - 1:21他得选出特别特别好的剧
-
1:21 - 1:24也就是说,他得找
-
1:24 - 1:26在这曲线靠近最右边的电视剧
-
1:26 - 1:29这条曲线是2500多部电视剧在网站IMDB上
-
1:29 - 1:33的评分分布图
-
1:33 - 1:36评分从0到10
-
1:36 - 1:39高度表示有多少电视剧是那个分数
-
1:39 - 1:44如果你制作的电视剧超过9分,那太牛了
-
1:44 - 1:45击败了98%的电视剧
-
1:46 - 1:49这就是像“绝命毒师”,“权利的游戏”,“火线”那样的电视剧
-
1:49 - 1:52非常容易上瘾
-
1:52 - 1:55看完一季你就会
-
1:55 - 1:57非常期待下一季
-
1:57 - 1:58这就是超过9分的剧
-
1:59 - 2:01在曲线左边
-
2:01 - 2:05就是像"Toddlers and Tiaras"这种剧
-
2:05 - 2:07(笑)
-
2:07 - 2:09你们都知道在曲线左边的剧
-
2:09 - 2:11是怎样的
-
2:11 - 2:15现在,Roy Price不担心制作出曲线最左边的剧
-
2:15 - 2:18要做出比"Toddlers and Tiaras"还左边的
-
2:18 - 2:20剧脑力得多强大啊
-
2:20 - 2:24他担心的是制作出中间的那种剧
-
2:24 - 2:26很一般
-
2:26 - 2:29不好不坏
-
2:29 - 2:30看了没什么激情
-
2:30 - 2:35所以他得确保制作出靠近最右边的剧
-
2:35 - 2:37压力山大
-
2:37 - 2:39当然,这也是亚马逊
-
2:39 - 2:41第一次做这样的事情
-
2:41 - 2:45Roy Price不想冒险
-
2:45 - 2:47他要创造成功
-
2:47 - 2:49他要确保成功
-
2:49 - 2:51所以他这样做:搞一个比赛
-
2:51 - 2:55他拿了一堆电视节目的点子
-
2:55 - 2:57从这些点子中
-
2:57 - 3:01选出8个来制作电视节目
-
3:01 - 3:04每个都制做试播集
-
3:04 - 3:07将它们放到网上给人们看
-
3:07 - 3:10当亚马逊提供免费的东西时
-
3:10 - 3:11我们都买帐,对吧?
-
3:11 - 3:16所以成千上万的人收看这些节目
-
3:16 - 3:20他们没有意识到的是,当他们在看节目的时候
-
3:20 - 3:22实际上被看的是他们
-
3:22 - 3:24他们被Roy Price 和他们的团队“观看”
-
3:24 - 3:26并被记录
-
3:26 - 3:29他们记录他们什么时候点播放,什么时候点暂停
-
3:29 - 3:32哪些部分被跳过,哪些部分被重播
-
3:32 - 3:34因此他们采集了大量的数据
-
3:34 - 3:36因为他们需要这些数据
-
3:36 - 3:39来决定他们应该制作什么电视剧
-
3:39 - 3:41毫无疑问,他们收集了所有的数据
-
3:41 - 3:44他们对数据进行分析然后得到一个结果
-
3:44 - 3:45这个结果就是
-
3:45 - 3:50亚马逊应该制作一个关于四个美国共和党参议员的情景喜剧
-
3:50 - 3:52于是就做出来了
-
3:52 - 3:54有谁知道那个节目的名字吗
-
3:55 - 3:56
阿尔法屋 -
3:56 - 3:57对,阿尔法屋
-
3:58 - 4:02不过看起来记得那个节目的人不多
-
4:02 - 4:03因为它不是特别地精彩
-
4:04 - 4:05实际上它只是一个很普通的剧
-
4:05 - 4:10这条曲线的平均分是7.4
-
4:10 - 4:12而阿尔法屋是7.5分
-
4:12 - 4:14只是稍微高过平均分
-
4:14 - 4:17这个显然不是Roy Price和他的团队的目标
-
4:18 - 4:21然而,几乎与此同时
-
4:21 - 4:23在另一家公司
-
4:23 - 4:27另一个制作人却成功地使用数据分析选出了一个顶级剧
-
4:27 - 4:29他的名字就是Ted
-
4:29 - 4:32Ted Sarandos是Netflix的首席内容官
-
4:32 - 4:34和Roy一样他也要经常寻找
-
4:34 - 4:36顶级电视剧
-
4:36 - 4:38而且他也使用数据分析
-
4:38 - 4:40不过有一点不同
-
4:40 - 4:44他们不举办比赛,而是利用
-
4:44 - 4:47Netflix已经有的用户数据
-
4:47 - 4:49那就是用户对节目的评分
-
4:49 - 4:52用户观看历史,用户喜欢什么节目等等
-
4:52 - 4:54然后他们用这些数据发现
-
4:54 - 4:57观众各种零碎的信息
-
4:57 - 4:58比如他们喜欢什么节目
-
4:58 - 5:00他们喜欢哪些制片人,哪些演员
-
5:00 - 5:03当他们把这些零碎的信息汇总
-
5:03 - 5:04他们带着很大的信心
-
5:04 - 5:07决定制作
-
5:07 - 5:09关于一个参议员的剧情剧
-
5:09 - 5:12而不是四个参议员的情景喜剧
-
5:13 - 5:14你们知道那部剧吗?
-
5:14 - 5:16(笑)
-
5:16 - 5:19是的,纸牌屋。Netflix正确地选中那部剧
-
5:20 - 5:22至少前两季是这样
-
5:22 - 5:26(笑)
-
5:26 - 5:29纸牌屋在这条曲线上取得9.1的高分
-
5:29 - 5:32这就是他们想要的结果
-
5:32 - 5:34现在问题来了,发生什么事了?
-
5:35 - 5:37两家非常有竞争力的、数据处理能力非常强的公司
-
5:37 - 5:40他们收集这些庞大的数据
-
5:40 - 5:42一个起作用
-
5:42 - 5:44另一个却不起作用
-
5:44 - 5:46为什么呢?
-
5:46 - 5:49因为按照逻辑应该都起作用
-
5:49 - 5:52我的意思是,如果你收集大量的数据
-
5:52 - 5:53来做一个决定
-
5:53 - 5:56那你应该能做出一个很好的决定
-
5:56 - 5:58你有200年的数据可以依赖
-
5:58 - 6:01你通过强大的计算机将它放大
-
6:01 - 6:05你至少能得到一部好的电视剧吧?
-
6:06 - 6:09而且如果那样做数据分析不起作用
-
6:10 - 6:12那就有点可怕了
-
6:12 - 6:15因为现在我们越来越多地依赖数据
-
6:15 - 6:20来做出远比电视剧更重要的决定
-
6:21 - 6:24有人知道Multi-Health Systems这家公司吗
-
6:25 - 6:27没有人吗?好吧,这其实是好事
-
6:27 - 6:30Multi-Health Systems是一家软件公司
-
6:30 - 6:33我希望在座没有人
-
6:33 - 6:36会接触到这个软件
-
6:36 - 6:38因为如果你接触了,说明你入狱了
-
6:38 - 6:39(笑)
-
6:39 - 6:43在美国,如果有人入狱然后他们申请假释
-
6:43 - 6:47那很有可能会用到这家公司的软件进行数据分析
-
6:47 - 6:51来决定是否批准假释
-
6:51 - 6:53这和亚马逊还有 Netflix是一样的原理
-
6:53 - 6:58只不过现在是决定你是个好人还是坏人
-
6:58 - 7:01而不是预测一个电视节目是好是坏
-
7:01 - 7:07看一个一般般的电视剧22分钟确实挺糟糕的
-
7:07 - 7:09但在监狱多待几年那就更惨了
-
7:10 - 7:14不幸的是,有证据显示这个数据分析
-
7:15 - 7:19尽管包含大量数据,但却不能总是得到最佳的结果
-
7:19 - 7:21然而这不是因为像 Multi-Health Systems这样的公司
-
7:22 - 7:23不会做数据分析
-
7:23 - 7:25即使是数据分析能力很强的公司也有搞错的时候
-
7:25 - 7:28Google也不例外
-
7:29 - 7:332009年,谷歌宣布他们能够
-
7:33 - 7:37通过对谷歌搜索的数据进行分析
-
7:37 - 7:41来预测流感的爆发
-
7:41 - 7:45而且工作得很好,在新闻上产生很大反响
-
7:45 - 7:47还在自然杂志上发文
-
7:47 - 7:50可以说在学术上也是巨大成功
-
7:50 - 7:53很多年这分析都工作得很好
-
7:53 - 7:55直到有一年失败了
-
7:55 - 7:57没有人明确知道为什么
-
7:57 - 7:59那一年就是不起作用了
-
7:59 - 8:01当然这又是一个巨大的新闻
-
8:01 - 8:03自然杂志也撤回了
-
8:03 - 8:05出版的文章
-
8:06 - 8:10所以即使是像亚马逊和谷歌这种数据处理这么强的公司
-
8:10 - 8:12都有出错的时候
-
8:12 - 8:15尽管有这么多失败的例子
-
8:15 - 8:19数据分析发展很快,无论是在生活中做决定
-
8:19 - 8:21还是在工作中
-
8:21 - 8:22法律实施中
-
8:23 - 8:24医药中我们都会用到
-
8:24 - 8:28所以我们最好确保数据有用
-
8:28 - 8:31现在,我个人是看过很多这种数据不起作用的
-
8:31 - 8:33因为我在计算遗传学领域工作
-
8:33 - 8:35在这个领域工作的很多高智商的人
-
8:35 - 8:39都要利用庞大的数据来做一些重大决定
-
8:39 - 8:43比如决定癌症治疗或者开发药物
-
8:44 - 8:46这么多年,我已经发现一些
-
8:46 - 8:48关于利用数据
-
8:48 - 8:51做出成功决定
-
8:51 - 8:53还是失败决定的规律
-
8:53 - 8:57我觉得這个规律值得分享,这个规律是这样的
-
8:59 - 9:01每次当你要解决一个复杂问题时
-
9:01 - 9:02其实你是在做两件重要的事情
-
9:02 - 9:06第一是将问题分解成很多很小的一部分
-
9:06 - 9:08这样你才能更深入地去分析这些小部分
-
9:08 - 9:10然后就是第二件事
-
9:10 - 9:13你把所有这些小部分汇总起来
-
9:13 - 9:14得出你的结论
-
9:14 - 9:17有时你还再做一次
-
9:17 - 9:18但还是那两件事
-
9:18 - 9:21分解再汇总
-
9:22 - 9:24比较残酷的是
-
9:24 - 9:27数据还有数据分析
-
9:27 - 9:29只对第一部分起作用
-
9:29 - 9:32数据还有数据分析,无论多么强大
-
9:32 - 9:36只能帮你把问题分解成小部分,然后帮你理解这些小部分
-
9:36 - 9:40把数据汇总后再分析
-
9:40 - 9:41然后得出结论就不适合了
-
9:42 - 9:44不过有一种工具可以做汇总这件事
-
9:44 - 9:46那就是大脑
-
9:46 - 9:48大脑擅长一件事
-
9:48 - 9:50那就是将碎片信息重新汇总
-
9:50 - 9:52即使你的信息并不完整
-
9:52 - 9:53然后得出结论
-
9:53 - 9:56特别是专家的脑子
-
9:56 - 9:59这就是我觉得为什么Netflix会这么成功
-
9:59 - 10:03因为他们让数据还有大脑各司其职
-
10:03 - 10:06他们先使用数据了解观众的一些零碎信息
-
10:06 - 10:10如果没有数据他们不可能了解这么深入
-
10:10 - 10:12但是将这些零碎信息汇总
-
10:12 - 10:16决定要制作纸牌屋这样的电视剧
-
10:16 - 10:17这些就不是在数据里
-
10:17 - 10:21Ted Sarandos和他的团队做出要制作这样剧的决定
-
10:21 - 10:24这也意味着
-
10:24 - 10:26他们冒着很大的个人风险
-
10:26 - 10:29但是另一方面亚马逊却用了完全错误的方法
-
10:29 - 10:32他们一路上都依赖数据做决定
-
10:32 - 10:35开始他们举行电视剧点子的比赛
-
10:35 - 10:38然后他们又选择制作阿尔法屋
-
10:38 - 10:41当然对于他们这是个非常安全的决定
-
10:41 - 10:43因为他们总是将责任可以推给数据
-
10:43 - 10:45看,这就是数据告诉我们的
-
10:45 - 10:49但这也没有给他们带来预期的结果
-
10:50 - 10:55因此数据确实是做出更好决定的有用工具
-
10:55 - 10:57但我相信当数据开始驱使决定时
-
10:58 - 11:00事情就出错了
-
11:00 - 11:04无论多么强大,数据只是一个工具
-
11:04 - 11:07要记住这个,我发现一个设备非常有用
-
11:07 - 11:08你们很多人会...
-
11:09 - 11:10(笑)
-
11:10 - 11:11在数据之前
-
11:11 - 11:14这个是用来做决定的设备
-
11:14 - 11:15(笑)
-
11:15 - 11:16你们很多人都知道这个
-
11:17 - 11:18这个玩具叫做魔力8号球
-
11:18 - 11:20这个真的很神奇
-
11:20 - 11:23因为如果你要做出一个决定,是或否的问题
-
11:23 - 11:26你只需要摇这个球,就得到一个答案
-
11:26 - 11:29“很可能” 这次在这里显示的是这个结果
-
11:29 - 11:31稍后我再将它用在科技样品上
-
11:31 - 11:33(笑)
-
11:33 - 11:36在我的生命中我做过一些决定
-
11:36 - 11:39现在看来,其实我只要听从这个球就行了
-
11:39 - 11:42当然,如果你有数据
-
11:42 - 11:46你想要一些更加理智的东西来代替这个球
-
11:46 - 11:49做决定,比如数据分析
-
11:49 - 11:52但这不会改变最初的设定
-
11:52 - 11:55所以这个球会变得越来越聪明
-
11:55 - 11:58但我相信还是由我们来做决定
-
11:58 - 12:01如果我们想要在这个曲线的最右边
-
12:01 - 12:03取得非凡的成就
-
12:03 - 12:07我发现一个非常鼓舞人心的信息
-
12:07 - 12:11事实上即使面对庞大的数据
-
12:11 - 12:15做出选择仍然是值得的
-
12:16 - 12:18在你做的领域做一个专家
-
12:18 - 12:20去承担风险
-
12:20 - 12:23因为在最后,不是数据
-
12:23 - 12:27而是承担的风险让你取得曲线右边的成就
-
12:28 - 12:29谢谢
-
12:29 - 12:32掌声
- Title:
- 如何用数据选电视剧 | Sebastian Wernicke | TEDxCambridge
- Description:
-
收集越多的数据就能做出越好的决定吗?数据处理非常强的亚马逊,谷歌,Netflix发现仅仅靠数据分析不能总是得到乐观的结果。在这个演讲中,数据科学家Sebastian Wernicke向我们讲述了如果完全依赖数据来做决定会产生怎样的错误,并向我们展示了一个全新的方式去使用数据。
- Video Language:
- English
- Team:
- closed TED
- Project:
- TEDxTalks
- Duration:
- 12:40