Return to Video

如何用数据选电视剧 | Sebastian Wernicke | TEDxCambridge

  • 0:21 - 0:25
    你们大多数人可能都没听说过Roy Price
  • 0:25 - 0:28
    不过在2013年4月19日那天,他可能要为让你们
  • 0:28 - 0:34
    度过无聊的22分钟负责
  • 0:35 - 0:38
    当然有些人觉得那22分钟非常有趣
  • 0:38 - 0:40
    不过这些人很少
  • 0:40 - 0:42
    为什么要这样说呢,这还得追溯到
  • 0:42 - 0:44
    Roy三年前做出的一个决定
  • 0:44 - 0:49
    Roy Price 是亚马逊制片室的高级主管
  • 0:49 - 0:52
    专门负责亚马逊的电视制作
  • 0:52 - 0:55
    他47岁,很瘦,头发有点竖起
  • 0:55 - 1:00
    推特上的签名是“电影,电视,技术,墨西哥玉米薄卷饼”
  • 1:00 - 1:05
    Roy Pric负责为亚马逊挑选要制作的
  • 1:05 - 1:09
    原创电视剧
  • 1:09 - 1:12
    美国电视剧竞争非常激烈
  • 1:12 - 1:14
    那么多的电视节目
  • 1:14 - 1:17
    Roy也不知道选哪个
  • 1:17 - 1:21
    他得选出特别特别好的剧
  • 1:21 - 1:24
    也就是说,他得找
  • 1:24 - 1:26
    在这曲线靠近最右边的电视剧
  • 1:26 - 1:29
    这条曲线是2500多部电视剧在网站IMDB上
  • 1:29 - 1:33
    的评分分布图
  • 1:33 - 1:36
    评分从0到10
  • 1:36 - 1:39
    高度表示有多少电视剧是那个分数
  • 1:39 - 1:44
    如果你制作的电视剧超过9分,那太牛了
  • 1:44 - 1:45
    击败了98%的电视剧
  • 1:46 - 1:49
    这就是像“绝命毒师”,“权利的游戏”,“火线”那样的电视剧
  • 1:49 - 1:52
    非常容易上瘾
  • 1:52 - 1:55
    看完一季你就会
  • 1:55 - 1:57
    非常期待下一季
  • 1:57 - 1:58
    这就是超过9分的剧
  • 1:59 - 2:01
    在曲线左边
  • 2:01 - 2:05
    就是像"Toddlers and Tiaras"这种剧
  • 2:05 - 2:07
    (笑)
  • 2:07 - 2:09
    你们都知道在曲线左边的剧
  • 2:09 - 2:11
    是怎样的
  • 2:11 - 2:15
    现在,Roy Price不担心制作出曲线最左边的剧
  • 2:15 - 2:18
    要做出比"Toddlers and Tiaras"还左边的
  • 2:18 - 2:20
    剧脑力得多强大啊
  • 2:20 - 2:24
    他担心的是制作出中间的那种剧
  • 2:24 - 2:26
    很一般
  • 2:26 - 2:29
    不好不坏
  • 2:29 - 2:30
    看了没什么激情
  • 2:30 - 2:35
    所以他得确保制作出靠近最右边的剧
  • 2:35 - 2:37
    压力山大
  • 2:37 - 2:39
    当然,这也是亚马逊
  • 2:39 - 2:41
    第一次做这样的事情
  • 2:41 - 2:45
    Roy Price不想冒险
  • 2:45 - 2:47
    他要创造成功
  • 2:47 - 2:49
    他要确保成功
  • 2:49 - 2:51
    所以他这样做:搞一个比赛
  • 2:51 - 2:55
    他拿了一堆电视节目的点子
  • 2:55 - 2:57
    从这些点子中
  • 2:57 - 3:01
    选出8个来制作电视节目
  • 3:01 - 3:04
    每个都制做试播集
  • 3:04 - 3:07
    将它们放到网上给人们看
  • 3:07 - 3:10
    当亚马逊提供免费的东西时
  • 3:10 - 3:11
    我们都买帐,对吧?
  • 3:11 - 3:16
    所以成千上万的人收看这些节目
  • 3:16 - 3:20
    他们没有意识到的是,当他们在看节目的时候
  • 3:20 - 3:22
    实际上被看的是他们
  • 3:22 - 3:24
    他们被Roy Price 和他们的团队“观看”
  • 3:24 - 3:26
    并被记录
  • 3:26 - 3:29
    他们记录他们什么时候点播放,什么时候点暂停
  • 3:29 - 3:32
    哪些部分被跳过,哪些部分被重播
  • 3:32 - 3:34
    因此他们采集了大量的数据
  • 3:34 - 3:36
    因为他们需要这些数据
  • 3:36 - 3:39
    来决定他们应该制作什么电视剧
  • 3:39 - 3:41
    毫无疑问,他们收集了所有的数据
  • 3:41 - 3:44
    他们对数据进行分析然后得到一个结果
  • 3:44 - 3:45
    这个结果就是
  • 3:45 - 3:50
    亚马逊应该制作一个关于四个美国共和党参议员的情景喜剧
  • 3:50 - 3:52
    于是就做出来了
  • 3:52 - 3:54
    有谁知道那个节目的名字吗
  • 3:55 - 3:56

    阿尔法屋
  • 3:56 - 3:57
    对,阿尔法屋
  • 3:58 - 4:02
    不过看起来记得那个节目的人不多
  • 4:02 - 4:03
    因为它不是特别地精彩
  • 4:04 - 4:05
    实际上它只是一个很普通的剧
  • 4:05 - 4:10
    这条曲线的平均分是7.4
  • 4:10 - 4:12
    而阿尔法屋是7.5分
  • 4:12 - 4:14
    只是稍微高过平均分
  • 4:14 - 4:17
    这个显然不是Roy Price和他的团队的目标
  • 4:18 - 4:21
    然而,几乎与此同时
  • 4:21 - 4:23
    在另一家公司
  • 4:23 - 4:27
    另一个制作人却成功地使用数据分析选出了一个顶级剧
  • 4:27 - 4:29
    他的名字就是Ted
  • 4:29 - 4:32
    Ted Sarandos是Netflix的首席内容官
  • 4:32 - 4:34
    和Roy一样他也要经常寻找
  • 4:34 - 4:36
    顶级电视剧
  • 4:36 - 4:38
    而且他也使用数据分析
  • 4:38 - 4:40
    不过有一点不同
  • 4:40 - 4:44
    他们不举办比赛,而是利用
  • 4:44 - 4:47
    Netflix已经有的用户数据
  • 4:47 - 4:49
    那就是用户对节目的评分
  • 4:49 - 4:52
    用户观看历史,用户喜欢什么节目等等
  • 4:52 - 4:54
    然后他们用这些数据发现
  • 4:54 - 4:57
    观众各种零碎的信息
  • 4:57 - 4:58
    比如他们喜欢什么节目
  • 4:58 - 5:00
    他们喜欢哪些制片人,哪些演员
  • 5:00 - 5:03
    当他们把这些零碎的信息汇总
  • 5:03 - 5:04
    他们带着很大的信心
  • 5:04 - 5:07
    决定制作
  • 5:07 - 5:09
    关于一个参议员的剧情剧
  • 5:09 - 5:12
    而不是四个参议员的情景喜剧
  • 5:13 - 5:14
    你们知道那部剧吗?
  • 5:14 - 5:16
    (笑)
  • 5:16 - 5:19
    是的,纸牌屋。Netflix正确地选中那部剧
  • 5:20 - 5:22
    至少前两季是这样
  • 5:22 - 5:26
    (笑)
  • 5:26 - 5:29
    纸牌屋在这条曲线上取得9.1的高分
  • 5:29 - 5:32
    这就是他们想要的结果
  • 5:32 - 5:34
    现在问题来了,发生什么事了?
  • 5:35 - 5:37
    两家非常有竞争力的、数据处理能力非常强的公司
  • 5:37 - 5:40
    他们收集这些庞大的数据
  • 5:40 - 5:42
    一个起作用
  • 5:42 - 5:44
    另一个却不起作用
  • 5:44 - 5:46
    为什么呢?
  • 5:46 - 5:49
    因为按照逻辑应该都起作用
  • 5:49 - 5:52
    我的意思是,如果你收集大量的数据
  • 5:52 - 5:53
    来做一个决定
  • 5:53 - 5:56
    那你应该能做出一个很好的决定
  • 5:56 - 5:58
    你有200年的数据可以依赖
  • 5:58 - 6:01
    你通过强大的计算机将它放大
  • 6:01 - 6:05
    你至少能得到一部好的电视剧吧?
  • 6:06 - 6:09
    而且如果那样做数据分析不起作用
  • 6:10 - 6:12
    那就有点可怕了
  • 6:12 - 6:15
    因为现在我们越来越多地依赖数据
  • 6:15 - 6:20
    来做出远比电视剧更重要的决定
  • 6:21 - 6:24
    有人知道Multi-Health Systems这家公司吗
  • 6:25 - 6:27
    没有人吗?好吧,这其实是好事
  • 6:27 - 6:30
    Multi-Health Systems是一家软件公司
  • 6:30 - 6:33
    我希望在座没有人
  • 6:33 - 6:36
    会接触到这个软件
  • 6:36 - 6:38
    因为如果你接触了,说明你入狱了
  • 6:38 - 6:39
    (笑)
  • 6:39 - 6:43
    在美国,如果有人入狱然后他们申请假释
  • 6:43 - 6:47
    那很有可能会用到这家公司的软件进行数据分析
  • 6:47 - 6:51
    来决定是否批准假释
  • 6:51 - 6:53
    这和亚马逊还有 Netflix是一样的原理
  • 6:53 - 6:58
    只不过现在是决定你是个好人还是坏人
  • 6:58 - 7:01
    而不是预测一个电视节目是好是坏
  • 7:01 - 7:07
    看一个一般般的电视剧22分钟确实挺糟糕的
  • 7:07 - 7:09
    但在监狱多待几年那就更惨了
  • 7:10 - 7:14
    不幸的是,有证据显示这个数据分析
  • 7:15 - 7:19
    尽管包含大量数据,但却不能总是得到最佳的结果
  • 7:19 - 7:21
    然而这不是因为像 Multi-Health Systems这样的公司
  • 7:22 - 7:23
    不会做数据分析
  • 7:23 - 7:25
    即使是数据分析能力很强的公司也有搞错的时候
  • 7:25 - 7:28
    Google也不例外
  • 7:29 - 7:33
    2009年,谷歌宣布他们能够
  • 7:33 - 7:37
    通过对谷歌搜索的数据进行分析
  • 7:37 - 7:41
    来预测流感的爆发
  • 7:41 - 7:45
    而且工作得很好,在新闻上产生很大反响
  • 7:45 - 7:47
    还在自然杂志上发文
  • 7:47 - 7:50
    可以说在学术上也是巨大成功
  • 7:50 - 7:53
    很多年这分析都工作得很好
  • 7:53 - 7:55
    直到有一年失败了
  • 7:55 - 7:57
    没有人明确知道为什么
  • 7:57 - 7:59
    那一年就是不起作用了
  • 7:59 - 8:01
    当然这又是一个巨大的新闻
  • 8:01 - 8:03
    自然杂志也撤回了
  • 8:03 - 8:05
    出版的文章
  • 8:06 - 8:10
    所以即使是像亚马逊和谷歌这种数据处理这么强的公司
  • 8:10 - 8:12
    都有出错的时候
  • 8:12 - 8:15
    尽管有这么多失败的例子
  • 8:15 - 8:19
    数据分析发展很快,无论是在生活中做决定
  • 8:19 - 8:21
    还是在工作中
  • 8:21 - 8:22
    法律实施中
  • 8:23 - 8:24
    医药中我们都会用到
  • 8:24 - 8:28
    所以我们最好确保数据有用
  • 8:28 - 8:31
    现在,我个人是看过很多这种数据不起作用的
  • 8:31 - 8:33
    因为我在计算遗传学领域工作
  • 8:33 - 8:35
    在这个领域工作的很多高智商的人
  • 8:35 - 8:39
    都要利用庞大的数据来做一些重大决定
  • 8:39 - 8:43
    比如决定癌症治疗或者开发药物
  • 8:44 - 8:46
    这么多年,我已经发现一些
  • 8:46 - 8:48
    关于利用数据
  • 8:48 - 8:51
    做出成功决定
  • 8:51 - 8:53
    还是失败决定的规律
  • 8:53 - 8:57
    我觉得這个规律值得分享,这个规律是这样的
  • 8:59 - 9:01
    每次当你要解决一个复杂问题时
  • 9:01 - 9:02
    其实你是在做两件重要的事情
  • 9:02 - 9:06
    第一是将问题分解成很多很小的一部分
  • 9:06 - 9:08
    这样你才能更深入地去分析这些小部分
  • 9:08 - 9:10
    然后就是第二件事
  • 9:10 - 9:13
    你把所有这些小部分汇总起来
  • 9:13 - 9:14
    得出你的结论
  • 9:14 - 9:17
    有时你还再做一次
  • 9:17 - 9:18
    但还是那两件事
  • 9:18 - 9:21
    分解再汇总
  • 9:22 - 9:24
    比较残酷的是
  • 9:24 - 9:27
    数据还有数据分析
  • 9:27 - 9:29
    只对第一部分起作用
  • 9:29 - 9:32
    数据还有数据分析,无论多么强大
  • 9:32 - 9:36
    只能帮你把问题分解成小部分,然后帮你理解这些小部分
  • 9:36 - 9:40
    把数据汇总后再分析
  • 9:40 - 9:41
    然后得出结论就不适合了
  • 9:42 - 9:44
    不过有一种工具可以做汇总这件事
  • 9:44 - 9:46
    那就是大脑
  • 9:46 - 9:48
    大脑擅长一件事
  • 9:48 - 9:50
    那就是将碎片信息重新汇总
  • 9:50 - 9:52
    即使你的信息并不完整
  • 9:52 - 9:53
    然后得出结论
  • 9:53 - 9:56
    特别是专家的脑子
  • 9:56 - 9:59
    这就是我觉得为什么Netflix会这么成功
  • 9:59 - 10:03
    因为他们让数据还有大脑各司其职
  • 10:03 - 10:06
    他们先使用数据了解观众的一些零碎信息
  • 10:06 - 10:10
    如果没有数据他们不可能了解这么深入
  • 10:10 - 10:12
    但是将这些零碎信息汇总
  • 10:12 - 10:16
    决定要制作纸牌屋这样的电视剧
  • 10:16 - 10:17
    这些就不是在数据里
  • 10:17 - 10:21
    Ted Sarandos和他的团队做出要制作这样剧的决定
  • 10:21 - 10:24
    这也意味着
  • 10:24 - 10:26
    他们冒着很大的个人风险
  • 10:26 - 10:29
    但是另一方面亚马逊却用了完全错误的方法
  • 10:29 - 10:32
    他们一路上都依赖数据做决定
  • 10:32 - 10:35
    开始他们举行电视剧点子的比赛
  • 10:35 - 10:38
    然后他们又选择制作阿尔法屋
  • 10:38 - 10:41
    当然对于他们这是个非常安全的决定
  • 10:41 - 10:43
    因为他们总是将责任可以推给数据
  • 10:43 - 10:45
    看,这就是数据告诉我们的
  • 10:45 - 10:49
    但这也没有给他们带来预期的结果
  • 10:50 - 10:55
    因此数据确实是做出更好决定的有用工具
  • 10:55 - 10:57
    但我相信当数据开始驱使决定时
  • 10:58 - 11:00
    事情就出错了
  • 11:00 - 11:04
    无论多么强大,数据只是一个工具
  • 11:04 - 11:07
    要记住这个,我发现一个设备非常有用
  • 11:07 - 11:08
    你们很多人会...
  • 11:09 - 11:10
    (笑)
  • 11:10 - 11:11
    在数据之前
  • 11:11 - 11:14
    这个是用来做决定的设备
  • 11:14 - 11:15
    (笑)
  • 11:15 - 11:16
    你们很多人都知道这个
  • 11:17 - 11:18
    这个玩具叫做魔力8号球
  • 11:18 - 11:20
    这个真的很神奇
  • 11:20 - 11:23
    因为如果你要做出一个决定,是或否的问题
  • 11:23 - 11:26
    你只需要摇这个球,就得到一个答案
  • 11:26 - 11:29
    “很可能” 这次在这里显示的是这个结果
  • 11:29 - 11:31
    稍后我再将它用在科技样品上
  • 11:31 - 11:33
    (笑)
  • 11:33 - 11:36
    在我的生命中我做过一些决定
  • 11:36 - 11:39
    现在看来,其实我只要听从这个球就行了
  • 11:39 - 11:42
    当然,如果你有数据
  • 11:42 - 11:46
    你想要一些更加理智的东西来代替这个球
  • 11:46 - 11:49
    做决定,比如数据分析
  • 11:49 - 11:52
    但这不会改变最初的设定
  • 11:52 - 11:55
    所以这个球会变得越来越聪明
  • 11:55 - 11:58
    但我相信还是由我们来做决定
  • 11:58 - 12:01
    如果我们想要在这个曲线的最右边
  • 12:01 - 12:03
    取得非凡的成就
  • 12:03 - 12:07
    我发现一个非常鼓舞人心的信息
  • 12:07 - 12:11
    事实上即使面对庞大的数据
  • 12:11 - 12:15
    做出选择仍然是值得的
  • 12:16 - 12:18
    在你做的领域做一个专家
  • 12:18 - 12:20
    去承担风险
  • 12:20 - 12:23
    因为在最后,不是数据
  • 12:23 - 12:27
    而是承担的风险让你取得曲线右边的成就
  • 12:28 - 12:29
    谢谢
  • 12:29 - 12:32
    掌声
Title:
如何用数据选电视剧 | Sebastian Wernicke | TEDxCambridge
Description:

收集越多的数据就能做出越好的决定吗?数据处理非常强的亚马逊,谷歌,Netflix发现仅仅靠数据分析不能总是得到乐观的结果。在这个演讲中,数据科学家Sebastian Wernicke向我们讲述了如果完全依赖数据来做决定会产生怎样的错误,并向我们展示了一个全新的方式去使用数据。

more » « less
Video Language:
English
Team:
closed TED
Project:
TEDxTalks
Duration:
12:40

Chinese, Simplified subtitles

Revisions