[Script Info] Title: [Events] Format: Layer, Start, End, Style, Name, MarginL, MarginR, MarginV, Effect, Text Dialogue: 0,0:00:00.00,0:00:02.00,Default,,0000,0000,0000,,Erez Liberman Aiden:人说 Dialogue: 0,0:00:02.00,0:00:05.00,Default,,0000,0000,0000,,一副画面抵过一千个词 Dialogue: 0,0:00:07.00,0:00:09.00,Default,,0000,0000,0000,,但是我们在哈佛大学 Dialogue: 0,0:00:09.00,0:00:12.00,Default,,0000,0000,0000,,却在思考这是不是一定正确 Dialogue: 0,0:00:12.00,0:00:14.00,Default,,0000,0000,0000,,(众人笑) Dialogue: 0,0:00:14.00,0:00:18.00,Default,,0000,0000,0000,,我们召集了各方专家 Dialogue: 0,0:00:18.00,0:00:20.00,Default,,0000,0000,0000,,他们来自哈佛 麻省理工 Dialogue: 0,0:00:20.00,0:00:23.00,Default,,0000,0000,0000,,《英国大百科全书》 《美国传统英语字典》 Dialogue: 0,0:00:23.00,0:00:25.00,Default,,0000,0000,0000,,还有我们骄傲的赞助商 Dialogue: 0,0:00:25.00,0:00:28.00,Default,,0000,0000,0000,,谷歌 Dialogue: 0,0:00:28.00,0:00:30.00,Default,,0000,0000,0000,,我们思考了 Dialogue: 0,0:00:30.00,0:00:32.00,Default,,0000,0000,0000,,大概四年 Dialogue: 0,0:00:32.00,0:00:37.00,Default,,0000,0000,0000,,最后得出一个惊人的结论 Dialogue: 0,0:00:37.00,0:00:40.00,Default,,0000,0000,0000,,女士们先生们 一副画面可不止一千个词那么简单 Dialogue: 0,0:00:40.00,0:00:42.00,Default,,0000,0000,0000,,事实上 我们发现有时候 Dialogue: 0,0:00:42.00,0:00:47.00,Default,,0000,0000,0000,,一幅画面抵过5千亿个词 Dialogue: 0,0:00:47.00,0:00:49.00,Default,,0000,0000,0000,,Jean-Baptiste Michel: 我们是如何得出这个结论的呢 Dialogue: 0,0:00:49.00,0:00:51.00,Default,,0000,0000,0000,,是这样的 Erez和我 Dialogue: 0,0:00:51.00,0:00:53.00,Default,,0000,0000,0000,,在想怎样找到一幅展现人类文明 Dialogue: 0,0:00:53.00,0:00:56.00,Default,,0000,0000,0000,,和人文历史的画面: 历史的变迁 Dialogue: 0,0:00:56.00,0:00:58.00,Default,,0000,0000,0000,,人们在漫长岁月中写了很多书 Dialogue: 0,0:00:58.00,0:01:00.00,Default,,0000,0000,0000,,所以我们想 向他们学习的最佳方法 Dialogue: 0,0:01:00.00,0:01:02.00,Default,,0000,0000,0000,,就是把那几百万本书全都读完 Dialogue: 0,0:01:02.00,0:01:05.00,Default,,0000,0000,0000,,当然 如果用坐标来表示这样做的好处 Dialogue: 0,0:01:05.00,0:01:08.00,Default,,0000,0000,0000,,那Y轴上的值一定是极高的 Dialogue: 0,0:01:08.00,0:01:10.00,Default,,0000,0000,0000,,但问题是还有X轴 Dialogue: 0,0:01:10.00,0:01:12.00,Default,,0000,0000,0000,,也就是可行性 Dialogue: 0,0:01:12.00,0:01:14.00,Default,,0000,0000,0000,,这是极低的 Dialogue: 0,0:01:14.00,0:01:17.00,Default,,0000,0000,0000,,(众人鼓掌) Dialogue: 0,0:01:17.00,0:01:20.00,Default,,0000,0000,0000,,现在人们倾向于另一种做法 Dialogue: 0,0:01:20.00,0:01:22.00,Default,,0000,0000,0000,,那就是选择几本书进行精读 Dialogue: 0,0:01:22.00,0:01:24.00,Default,,0000,0000,0000,,可行性极高但还不够好 Dialogue: 0,0:01:24.00,0:01:27.00,Default,,0000,0000,0000,,人们真正想要的 Dialogue: 0,0:01:27.00,0:01:30.00,Default,,0000,0000,0000,,是一个既好又可行的方法 Dialogue: 0,0:01:30.00,0:01:33.00,Default,,0000,0000,0000,,结果 在水一方 有一家叫“谷歌”的公司 Dialogue: 0,0:01:33.00,0:01:35.00,Default,,0000,0000,0000,,他们在此之前的几年前就开始了一个数字化工程 Dialogue: 0,0:01:35.00,0:01:37.00,Default,,0000,0000,0000,,有可能帮我们找到这个“既好又可行”的方法 Dialogue: 0,0:01:37.00,0:01:39.00,Default,,0000,0000,0000,,他们已经将几百万本书进行了数字化 Dialogue: 0,0:01:39.00,0:01:42.00,Default,,0000,0000,0000,,这就意味着人们在电脑上点几个键 Dialogue: 0,0:01:42.00,0:01:44.00,Default,,0000,0000,0000,,就能阅读所有的书 Dialogue: 0,0:01:44.00,0:01:47.00,Default,,0000,0000,0000,,这真的是既可行又好 Dialogue: 0,0:01:48.00,0:01:50.00,Default,,0000,0000,0000,,这些书是哪里来的呢 Dialogue: 0,0:01:50.00,0:01:53.00,Default,,0000,0000,0000,,从古时候开始 人们就开始写作了 Dialogue: 0,0:01:53.00,0:01:56.00,Default,,0000,0000,0000,,这些作家写书都非常卖力 Dialogue: 0,0:01:56.00,0:01:58.00,Default,,0000,0000,0000,,几个世纪前印刷机问世了 Dialogue: 0,0:01:58.00,0:02:00.00,Default,,0000,0000,0000,,写书的过程变得简单多了 Dialogue: 0,0:02:00.00,0:02:03.00,Default,,0000,0000,0000,,自那以后 Dialogue: 0,0:02:03.00,0:02:05.00,Default,,0000,0000,0000,,作家们已经出版了 Dialogue: 0,0:02:05.00,0:02:07.00,Default,,0000,0000,0000,,1.29亿本书 Dialogue: 0,0:02:07.00,0:02:09.00,Default,,0000,0000,0000,,如果这些书没有随年月而遗失 Dialogue: 0,0:02:09.00,0:02:11.00,Default,,0000,0000,0000,,就都在图书馆里存着 Dialogue: 0,0:02:11.00,0:02:14.00,Default,,0000,0000,0000,,谷歌已经把许多书从图书馆中调了出来 Dialogue: 0,0:02:14.00,0:02:16.00,Default,,0000,0000,0000,,进行了数字化 Dialogue: 0,0:02:16.00,0:02:18.00,Default,,0000,0000,0000,,被扫描的书籍到目前已有1500万册 Dialogue: 0,0:02:18.00,0:02:21.00,Default,,0000,0000,0000,,谷歌扫描图书时 把书的格式做得很好 Dialogue: 0,0:02:21.00,0:02:23.00,Default,,0000,0000,0000,,现在我们不但有了数据 还有元数据 Dialogue: 0,0:02:23.00,0:02:26.00,Default,,0000,0000,0000,,我们掌握了这些书的出版地 Dialogue: 0,0:02:26.00,0:02:28.00,Default,,0000,0000,0000,,作者 出版时间等信息 Dialogue: 0,0:02:28.00,0:02:31.00,Default,,0000,0000,0000,,接下来 我们就要从所有这些记录中 Dialogue: 0,0:02:31.00,0:02:35.00,Default,,0000,0000,0000,,筛选出质量最高的数据 Dialogue: 0,0:02:35.00,0:02:37.00,Default,,0000,0000,0000,,最后剩下的 Dialogue: 0,0:02:37.00,0:02:40.00,Default,,0000,0000,0000,,是5百万本书 Dialogue: 0,0:02:40.00,0:02:43.00,Default,,0000,0000,0000,,5000亿个词 Dialogue: 0,0:02:43.00,0:02:45.00,Default,,0000,0000,0000,,这么多词连起来 Dialogue: 0,0:02:45.00,0:02:48.00,Default,,0000,0000,0000,,长度是人类基因组的1000倍 Dialogue: 0,0:02:48.00,0:02:50.00,Default,,0000,0000,0000,,如果把这些词连续写出来 Dialogue: 0,0:02:50.00,0:02:52.00,Default,,0000,0000,0000,,其长度相当于在地月之间 Dialogue: 0,0:02:52.00,0:02:54.00,Default,,0000,0000,0000,,往返10次以上 Dialogue: 0,0:02:54.00,0:02:58.00,Default,,0000,0000,0000,,这还仅是我们文化基因组的小小一段 Dialogue: 0,0:02:58.00,0:03:00.00,Default,,0000,0000,0000,,当然啦 Dialogue: 0,0:03:00.00,0:03:03.00,Default,,0000,0000,0000,,面对如此令人崩溃的结果 Dialogue: 0,0:03:03.00,0:03:05.00,Default,,0000,0000,0000,,(众人笑) Dialogue: 0,0:03:05.00,0:03:08.00,Default,,0000,0000,0000,,我们做了一个懂得自重的研究者 Dialogue: 0,0:03:08.00,0:03:11.00,Default,,0000,0000,0000,,应该做的事 Dialogue: 0,0:03:11.00,0:03:13.00,Default,,0000,0000,0000,,我们借鉴了XKCD(科学漫画) Dialogue: 0,0:03:13.00,0:03:15.00,Default,,0000,0000,0000,,说:" 往后站。 Dialogue: 0,0:03:15.00,0:03:17.00,Default,,0000,0000,0000,,我们要用科学来解决问题。” Dialogue: 0,0:03:17.00,0:03:19.00,Default,,0000,0000,0000,,(众人笑) Dialogue: 0,0:03:19.00,0:03:21.00,Default,,0000,0000,0000,,当然 这时我们在想 Dialogue: 0,0:03:21.00,0:03:23.00,Default,,0000,0000,0000,,何不先把数据放上去 Dialogue: 0,0:03:23.00,0:03:25.00,Default,,0000,0000,0000,,让人们通过科学来运用数据 Dialogue: 0,0:03:25.00,0:03:27.00,Default,,0000,0000,0000,,现在我们在思考 哪些数据可以公开 Dialogue: 0,0:03:27.00,0:03:29.00,Default,,0000,0000,0000,,你当然想把这所有5百万本书 Dialogue: 0,0:03:29.00,0:03:31.00,Default,,0000,0000,0000,,全文公开 Dialogue: 0,0:03:31.00,0:03:33.00,Default,,0000,0000,0000,,现在谷歌 具体地说是乔恩. 奥温特 Dialogue: 0,0:03:33.00,0:03:35.00,Default,,0000,0000,0000,,告诉教给我们一个有用的方程式 Dialogue: 0,0:03:35.00,0:03:38.00,Default,,0000,0000,0000,,你有5百万本书 那就有五百万个作者 Dialogue: 0,0:03:38.00,0:03:41.00,Default,,0000,0000,0000,,一个有5百万个原告的官司可不小啊 Dialogue: 0,0:03:41.00,0:03:43.00,Default,,0000,0000,0000,,所以尽管这是个好想法 Dialogue: 0,0:03:43.00,0:03:46.00,Default,,0000,0000,0000,,但是也极不现实 Dialogue: 0,0:03:46.00,0:03:48.00,Default,,0000,0000,0000,,(众人笑) Dialogue: 0,0:03:48.00,0:03:50.00,Default,,0000,0000,0000,,现在我们做出些许让步 Dialogue: 0,0:03:50.00,0:03:53.00,Default,,0000,0000,0000,,采用一个非常可行但稍微没那么好的方法 Dialogue: 0,0:03:53.00,0:03:55.00,Default,,0000,0000,0000,,我们不公开全书内容 Dialogue: 0,0:03:55.00,0:03:57.00,Default,,0000,0000,0000,,而是公开书本的相关统计数据 Dialogue: 0,0:03:57.00,0:03:59.00,Default,,0000,0000,0000,,拿“A gleam of happiness”这个词组做例子 Dialogue: 0,0:03:59.00,0:04:01.00,Default,,0000,0000,0000,,它有四个单词 我们称它为四字格 Dialogue: 0,0:04:01.00,0:04:03.00,Default,,0000,0000,0000,,我们会告诉你直到2008年出版的书中 Dialogue: 0,0:04:03.00,0:04:05.00,Default,,0000,0000,0000,,在1801年 1802年 1803年一直到2008年 Dialogue: 0,0:04:05.00,0:04:07.00,Default,,0000,0000,0000,,某个四字格一共出现了多少次 Dialogue: 0,0:04:07.00,0:04:09.00,Default,,0000,0000,0000,,这让我们看到 Dialogue: 0,0:04:09.00,0:04:11.00,Default,,0000,0000,0000,,这个词组在这段时期内被使用的频率 Dialogue: 0,0:04:11.00,0:04:14.00,Default,,0000,0000,0000,,我们对在这些书中的所有单词和词组都这么处理 Dialogue: 0,0:04:14.00,0:04:17.00,Default,,0000,0000,0000,,于是我们得出了一个由20亿曲线 Dialogue: 0,0:04:17.00,0:04:19.00,Default,,0000,0000,0000,,表示出文化变化的情况 Dialogue: 0,0:04:19.00,0:04:21.00,Default,,0000,0000,0000,,这20亿条曲线 Dialogue: 0,0:04:21.00,0:04:23.00,Default,,0000,0000,0000,,我们成作20亿个n字格 Dialogue: 0,0:04:23.00,0:04:25.00,Default,,0000,0000,0000,,它们告诉了我们什么 Dialogue: 0,0:04:25.00,0:04:27.00,Default,,0000,0000,0000,,这些n字格衡量的是文化的走势 Dialogue: 0,0:04:27.00,0:04:29.00,Default,,0000,0000,0000,,我来举个例子 Dialogue: 0,0:04:29.00,0:04:31.00,Default,,0000,0000,0000,,假设 我正在发财 Dialogue: 0,0:04:31.00,0:04:33.00,Default,,0000,0000,0000,,明天我告诉你我发财的情况 Dialogue: 0,0:04:33.00,0:04:36.00,Default,,0000,0000,0000,,我会说:“昨天,我发了。” Dialogue: 0,0:04:36.00,0:04:39.00,Default,,0000,0000,0000,,也可以说:“昨天,我发财了。” Dialogue: 0,0:04:39.00,0:04:42.00,Default,,0000,0000,0000,,我到底应该用哪个说法呢 Dialogue: 0,0:04:42.00,0:04:44.00,Default,,0000,0000,0000,,怎么找答案 Dialogue: 0,0:04:44.00,0:04:46.00,Default,,0000,0000,0000,,6个月以前 Dialogue: 0,0:04:46.00,0:04:48.00,Default,,0000,0000,0000,,很流行的做法是 Dialogue: 0,0:04:48.00,0:04:50.00,Default,,0000,0000,0000,,比如说 Dialogue: 0,0:04:50.00,0:04:52.00,Default,,0000,0000,0000,,你去问这位秀发飘逸的心理学家 Dialogue: 0,0:04:52.00,0:04:54.00,Default,,0000,0000,0000,,你说 Dialogue: 0,0:04:54.00,0:04:57.00,Default,,0000,0000,0000,,“史蒂夫,你是不规则动词的专家。 Dialogue: 0,0:04:57.00,0:04:59.00,Default,,0000,0000,0000,,我该怎么办啊?” Dialogue: 0,0:04:59.00,0:05:01.00,Default,,0000,0000,0000,,他会说:“大多数人说‘发财了’, Dialogue: 0,0:05:01.00,0:05:04.00,Default,,0000,0000,0000,,但有些人说‘发了’。” Dialogue: 0,0:05:04.00,0:05:06.00,Default,,0000,0000,0000,,如果你可以 Dialogue: 0,0:05:06.00,0:05:09.00,Default,,0000,0000,0000,,回到200年前 Dialogue: 0,0:05:09.00,0:05:12.00,Default,,0000,0000,0000,,问问这位秀发同样飘逸的政治家 Dialogue: 0,0:05:12.00,0:05:15.00,Default,,0000,0000,0000,,(众人笑) Dialogue: 0,0:05:15.00,0:05:17.00,Default,,0000,0000,0000,,“托马斯,我该怎么说?” Dialogue: 0,0:05:17.00,0:05:19.00,Default,,0000,0000,0000,,他会回答:“嗯,在我的时代,大多数人说‘发了’, Dialogue: 0,0:05:19.00,0:05:22.00,Default,,0000,0000,0000,,但是少数人说‘发财了’。” Dialogue: 0,0:05:22.00,0:05:24.00,Default,,0000,0000,0000,,现在我给你们看一个原始数据 Dialogue: 0,0:05:24.00,0:05:28.00,Default,,0000,0000,0000,,这是20亿本书中的其中两本书的曲线 Dialogue: 0,0:05:28.00,0:05:30.00,Default,,0000,0000,0000,,你们将看到“发了”和“发财了”这两个词 Dialogue: 0,0:05:30.00,0:05:33.00,Default,,0000,0000,0000,,随时间的推移被使用的频率 Dialogue: 0,0:05:34.00,0:05:36.00,Default,,0000,0000,0000,,这还只是 Dialogue: 0,0:05:36.00,0:05:39.00,Default,,0000,0000,0000,,20亿条曲线中的其中两条 Dialogue: 0,0:05:39.00,0:05:41.00,Default,,0000,0000,0000,,整套数据 Dialogue: 0,0:05:41.00,0:05:44.00,Default,,0000,0000,0000,,比这张幻灯片要宏伟10亿倍 Dialogue: 0,0:05:44.00,0:05:46.00,Default,,0000,0000,0000,,(众人笑) Dialogue: 0,0:05:46.00,0:05:50.00,Default,,0000,0000,0000,,(众人鼓掌) Dialogue: 0,0:05:50.00,0:05:52.00,Default,,0000,0000,0000,,很多画面都相当于5千亿个词 Dialogue: 0,0:05:52.00,0:05:54.00,Default,,0000,0000,0000,,比如这一幅 Dialogue: 0,0:05:54.00,0:05:56.00,Default,,0000,0000,0000,,如果你找“流行感冒”这一词 Dialogue: 0,0:05:56.00,0:05:58.00,Default,,0000,0000,0000,,你会看到几个全球范围内 Dialogue: 0,0:05:58.00,0:06:01.00,Default,,0000,0000,0000,,祸害人命的流感高峰 Dialogue: 0,0:06:01.00,0:06:04.00,Default,,0000,0000,0000,,如果这不足以令人信服 Dialogue: 0,0:06:04.00,0:06:06.00,Default,,0000,0000,0000,,海平面正在上升 Dialogue: 0,0:06:06.00,0:06:09.00,Default,,0000,0000,0000,,大气中二氧化碳含量和全球气温都在升高 Dialogue: 0,0:06:09.00,0:06:12.00,Default,,0000,0000,0000,,你们也可以看看这个n字格 Dialogue: 0,0:06:12.00,0:06:15.00,Default,,0000,0000,0000,,告诉尼采上帝没死 Dialogue: 0,0:06:15.00,0:06:18.00,Default,,0000,0000,0000,,你可能也认为他或许要换一个企宣了 Dialogue: 0,0:06:18.00,0:06:20.00,Default,,0000,0000,0000,,(众人笑) Dialogue: 0,0:06:20.00,0:06:23.00,Default,,0000,0000,0000,,你可以通过这个得到非常抽象的概念 Dialogue: 0,0:06:23.00,0:06:25.00,Default,,0000,0000,0000,,我跟你们说说 Dialogue: 0,0:06:25.00,0:06:27.00,Default,,0000,0000,0000,,1950年的历史 Dialogue: 0,0:06:27.00,0:06:29.00,Default,,0000,0000,0000,,在漫漫历史长河中 Dialogue: 0,0:06:29.00,0:06:31.00,Default,,0000,0000,0000,,几乎没人在意1950年 Dialogue: 0,0:06:31.00,0:06:33.00,Default,,0000,0000,0000,,1700年 1800年 1900年 Dialogue: 0,0:06:33.00,0:06:36.00,Default,,0000,0000,0000,,没有人在意 Dialogue: 0,0:06:37.00,0:06:39.00,Default,,0000,0000,0000,,20世纪三十年代和四十年代 Dialogue: 0,0:06:39.00,0:06:41.00,Default,,0000,0000,0000,,没有人在意 Dialogue: 0,0:06:41.00,0:06:43.00,Default,,0000,0000,0000,,到了四十年代中期 突然间 Dialogue: 0,0:06:43.00,0:06:45.00,Default,,0000,0000,0000,,关注度飞升 Dialogue: 0,0:06:45.00,0:06:47.00,Default,,0000,0000,0000,,人们意识到1950年快来了 Dialogue: 0,0:06:47.00,0:06:49.00,Default,,0000,0000,0000,,这一年可能非同小可啊 Dialogue: 0,0:06:49.00,0:06:52.00,Default,,0000,0000,0000,,(众人笑) Dialogue: 0,0:06:52.00,0:06:55.00,Default,,0000,0000,0000,,1950年 正如人们想象的一样 Dialogue: 0,0:06:55.00,0:06:58.00,Default,,0000,0000,0000,,没发生任何有意思的事情 Dialogue: 0,0:06:58.00,0:07:01.00,Default,,0000,0000,0000,,(众人笑) Dialogue: 0,0:07:01.00,0:07:03.00,Default,,0000,0000,0000,,人们都着了魔了 Dialogue: 0,0:07:03.00,0:07:05.00,Default,,0000,0000,0000,,无时无刻不在谈论 Dialogue: 0,0:07:05.00,0:07:08.00,Default,,0000,0000,0000,,他们1950年做过的事情 Dialogue: 0,0:07:08.00,0:07:11.00,Default,,0000,0000,0000,,他们打算在1950年做的事情 Dialogue: 0,0:07:11.00,0:07:16.00,Default,,0000,0000,0000,,后者他们1950年想要实现的梦想 Dialogue: 0,0:07:16.00,0:07:18.00,Default,,0000,0000,0000,,事实上 1950年是不同凡响的一年 Dialogue: 0,0:07:18.00,0:07:20.00,Default,,0000,0000,0000,,即使过了好多年 Dialogue: 0,0:07:20.00,0:07:23.00,Default,,0000,0000,0000,,人们还是不停地谈论那年发生的所有美好事情 Dialogue: 0,0:07:23.00,0:07:25.00,Default,,0000,0000,0000,,51年 52年 53年 Dialogue: 0,0:07:25.00,0:07:27.00,Default,,0000,0000,0000,,终于到了1954年 Dialogue: 0,0:07:27.00,0:07:29.00,Default,,0000,0000,0000,,人们醒悟过来 Dialogue: 0,0:07:29.00,0:07:33.00,Default,,0000,0000,0000,,1950年已成往事了 Dialogue: 0,0:07:33.00,0:07:35.00,Default,,0000,0000,0000,,(众人笑) Dialogue: 0,0:07:35.00,0:07:37.00,Default,,0000,0000,0000,,就这样 泡泡破了 Dialogue: 0,0:07:37.00,0:07:39.00,Default,,0000,0000,0000,,(众人笑) Dialogue: 0,0:07:39.00,0:07:41.00,Default,,0000,0000,0000,,1950年的情况 Dialogue: 0,0:07:41.00,0:07:43.00,Default,,0000,0000,0000,,以及每一年的情况 我们都记录了下来 Dialogue: 0,0:07:43.00,0:07:46.00,Default,,0000,0000,0000,,多亏了这些漂亮的图表 我们的工作顺利多了 Dialogue: 0,0:07:46.00,0:07:49.00,Default,,0000,0000,0000,,有了这些漂亮的图表 我们就能测量各种事物 Dialogue: 0,0:07:49.00,0:07:51.00,Default,,0000,0000,0000,,我们会说:“泡泡破掉的速度有多快?” Dialogue: 0,0:07:51.00,0:07:54.00,Default,,0000,0000,0000,,结果证明 我们可以对此进行精准的测量 Dialogue: 0,0:07:54.00,0:07:57.00,Default,,0000,0000,0000,,等式出来了 图表也做好了 Dialogue: 0,0:07:57.00,0:07:59.00,Default,,0000,0000,0000,,最终结果是 Dialogue: 0,0:07:59.00,0:08:02.00,Default,,0000,0000,0000,,泡泡破掉的速度 Dialogue: 0,0:08:02.00,0:08:04.00,Default,,0000,0000,0000,,每年都在加快 Dialogue: 0,0:08:04.00,0:08:09.00,Default,,0000,0000,0000,,我们对过去的遗忘不断加快 Dialogue: 0,0:08:09.00,0:08:11.00,Default,,0000,0000,0000,,好 现在给大家一些发展事业的建议 Dialogue: 0,0:08:11.00,0:08:13.00,Default,,0000,0000,0000,,如果你想成名 Dialogue: 0,0:08:13.00,0:08:15.00,Default,,0000,0000,0000,,我们可以向25位最著名的政治人物 Dialogue: 0,0:08:15.00,0:08:17.00,Default,,0000,0000,0000,,作家 演员学习 Dialogue: 0,0:08:17.00,0:08:20.00,Default,,0000,0000,0000,,如果你想早点成名 你就应该做个演员 Dialogue: 0,0:08:20.00,0:08:22.00,Default,,0000,0000,0000,,因为 演员在20来岁的时候成名 Dialogue: 0,0:08:22.00,0:08:24.00,Default,,0000,0000,0000,,你还很年轻 这是本钱 Dialogue: 0,0:08:24.00,0:08:26.00,Default,,0000,0000,0000,,如果你能等一等 那就当个作家 Dialogue: 0,0:08:26.00,0:08:28.00,Default,,0000,0000,0000,,因为你可以像马克.吐温这样 Dialogue: 0,0:08:28.00,0:08:30.00,Default,,0000,0000,0000,,成为文坛巨星 Dialogue: 0,0:08:30.00,0:08:32.00,Default,,0000,0000,0000,,如果你想到达万人之上 Dialogue: 0,0:08:32.00,0:08:34.00,Default,,0000,0000,0000,,你就不能安于现状 Dialogue: 0,0:08:34.00,0:08:36.00,Default,,0000,0000,0000,,要成为一个政治家 Dialogue: 0,0:08:36.00,0:08:38.00,Default,,0000,0000,0000,,到了快60岁的时候 你就成名了 Dialogue: 0,0:08:38.00,0:08:40.00,Default,,0000,0000,0000,,而且之后名声远扬 Dialogue: 0,0:08:40.00,0:08:43.00,Default,,0000,0000,0000,,科学家通常在年纪一大把的时候才成名 Dialogue: 0,0:08:43.00,0:08:45.00,Default,,0000,0000,0000,,生物学家和物理学家的名声 Dialogue: 0,0:08:45.00,0:08:47.00,Default,,0000,0000,0000,,通常能跟演员的名声媲美 Dialogue: 0,0:08:47.00,0:08:50.00,Default,,0000,0000,0000,,有一个错误你不要犯 那就是成为一个数学家 Dialogue: 0,0:08:50.00,0:08:52.00,Default,,0000,0000,0000,,(众人笑) Dialogue: 0,0:08:52.00,0:08:54.00,Default,,0000,0000,0000,,如果你成了数学家 Dialogue: 0,0:08:54.00,0:08:57.00,Default,,0000,0000,0000,,你会想:“太好啦,我20多岁的时候会有最辉煌的成就。” Dialogue: 0,0:08:57.00,0:08:59.00,Default,,0000,0000,0000,,谁知道 人们连睬都不睬你 Dialogue: 0,0:08:59.00,0:09:02.00,Default,,0000,0000,0000,,(众人笑) Dialogue: 0,0:09:02.00,0:09:04.00,Default,,0000,0000,0000,,n字格中 Dialogue: 0,0:09:04.00,0:09:06.00,Default,,0000,0000,0000,,有些情况更为明了 Dialogue: 0,0:09:06.00,0:09:08.00,Default,,0000,0000,0000,,这是Marc Chagall的名声起落 Dialogue: 0,0:09:08.00,0:09:10.00,Default,,0000,0000,0000,,他是出生于1887的一位艺术家 Dialogue: 0,0:09:10.00,0:09:13.00,Default,,0000,0000,0000,,他的名声起落看似乎没有什么异常 Dialogue: 0,0:09:13.00,0:09:17.00,Default,,0000,0000,0000,,他的名声越来越大 Dialogue: 0,0:09:17.00,0:09:19.00,Default,,0000,0000,0000,,然而如果你在德语书中搜索 情况就不同了 Dialogue: 0,0:09:19.00,0:09:21.00,Default,,0000,0000,0000,,在德语书中 你会看到非常奇怪的现象 Dialogue: 0,0:09:21.00,0:09:23.00,Default,,0000,0000,0000,,闻所未闻 见所未见 Dialogue: 0,0:09:23.00,0:09:25.00,Default,,0000,0000,0000,,他先是名极一时 Dialogue: 0,0:09:25.00,0:09:27.00,Default,,0000,0000,0000,,但突然之间 名声直线下落 Dialogue: 0,0:09:27.00,0:09:30.00,Default,,0000,0000,0000,,在1933年到1945年间达到了低谷 Dialogue: 0,0:09:30.00,0:09:33.00,Default,,0000,0000,0000,,后来才回升 Dialogue: 0,0:09:33.00,0:09:35.00,Default,,0000,0000,0000,,当然 实际情况是 Dialogue: 0,0:09:35.00,0:09:38.00,Default,,0000,0000,0000,,Marc Chagall是一个犹太艺术家 Dialogue: 0,0:09:38.00,0:09:40.00,Default,,0000,0000,0000,,当时身在纳粹德国 Dialogue: 0,0:09:40.00,0:09:42.00,Default,,0000,0000,0000,,这些信号 Dialogue: 0,0:09:42.00,0:09:44.00,Default,,0000,0000,0000,,实在太强了 Dialogue: 0,0:09:44.00,0:09:47.00,Default,,0000,0000,0000,,我们无需知道谁被禁了 Dialogue: 0,0:09:47.00,0:09:49.00,Default,,0000,0000,0000,,我们事实上可以 Dialogue: 0,0:09:49.00,0:09:51.00,Default,,0000,0000,0000,,通过非常基本的信号处理来找出答案 Dialogue: 0,0:09:51.00,0:09:53.00,Default,,0000,0000,0000,,这里有一个简单的方法 Dialogue: 0,0:09:53.00,0:09:55.00,Default,,0000,0000,0000,,一个人在特定时期内 Dialogue: 0,0:09:55.00,0:09:57.00,Default,,0000,0000,0000,,所拥有的知名度 Dialogue: 0,0:09:57.00,0:09:59.00,Default,,0000,0000,0000,,应当大致为他成名前与成名后知名度的平均值 Dialogue: 0,0:09:59.00,0:10:01.00,Default,,0000,0000,0000,,这么想是有道理的 Dialogue: 0,0:10:01.00,0:10:03.00,Default,,0000,0000,0000,,我们也是怎么想的 Dialogue: 0,0:10:03.00,0:10:06.00,Default,,0000,0000,0000,,我们把观察到的知名度进行对比 Dialogue: 0,0:10:06.00,0:10:08.00,Default,,0000,0000,0000,,我们把前者比上后者 Dialogue: 0,0:10:08.00,0:10:10.00,Default,,0000,0000,0000,,产生的结果叫做抑制指数 Dialogue: 0,0:10:10.00,0:10:13.00,Default,,0000,0000,0000,,如果抑制指数非常非常小 Dialogue: 0,0:10:13.00,0:10:15.00,Default,,0000,0000,0000,,那么你的知名度正在被抑制 Dialogue: 0,0:10:15.00,0:10:18.00,Default,,0000,0000,0000,,如果数值非常大 或许就表明你从宣传中获益 Dialogue: 0,0:10:19.00,0:10:21.00,Default,,0000,0000,0000,,你还可以看到 Dialogue: 0,0:10:21.00,0:10:24.00,Default,,0000,0000,0000,,压抑指数在总人数中的分布情况 Dialogue: 0,0:10:24.00,0:10:26.00,Default,,0000,0000,0000,,这里有个例子 Dialogue: 0,0:10:26.00,0:10:28.00,Default,,0000,0000,0000,,这是从没有明显抑制的英文书籍中 Dialogue: 0,0:10:28.00,0:10:30.00,Default,,0000,0000,0000,,选出的5000个人 Dialogue: 0,0:10:30.00,0:10:32.00,Default,,0000,0000,0000,,它是这个样子的 基本上以1为中心 Dialogue: 0,0:10:32.00,0:10:34.00,Default,,0000,0000,0000,,实际情况与预想差不多 Dialogue: 0,0:10:34.00,0:10:36.00,Default,,0000,0000,0000,,而这在是德文书籍中的分布情况 Dialogue: 0,0:10:36.00,0:10:38.00,Default,,0000,0000,0000,,与前者大为不同 往左偏了 Dialogue: 0,0:10:38.00,0:10:41.00,Default,,0000,0000,0000,,人们对它的关注较预期要少了两倍 Dialogue: 0,0:10:41.00,0:10:43.00,Default,,0000,0000,0000,,更重要的是 这个分布的跨度更宽 Dialogue: 0,0:10:43.00,0:10:46.00,Default,,0000,0000,0000,,不少人处于左边的部分 Dialogue: 0,0:10:46.00,0:10:49.00,Default,,0000,0000,0000,,人数比预期中少了10倍 Dialogue: 0,0:10:49.00,0:10:51.00,Default,,0000,0000,0000,,而也有不少人处于更靠右的部分 Dialogue: 0,0:10:51.00,0:10:53.00,Default,,0000,0000,0000,,他们的宣传起了作用 Dialogue: 0,0:10:53.00,0:10:56.00,Default,,0000,0000,0000,,这幅图反映了书籍记录中的审查情况 Dialogue: 0,0:10:56.00,0:10:58.00,Default,,0000,0000,0000,,我们把这种方法 Dialogue: 0,0:10:58.00,0:11:00.00,Default,,0000,0000,0000,,称作文化组学 Dialogue: 0,0:11:00.00,0:11:02.00,Default,,0000,0000,0000,,有点像基因组学 Dialogue: 0,0:11:02.00,0:11:04.00,Default,,0000,0000,0000,,只不过 基因组学是生物学上 Dialogue: 0,0:11:04.00,0:11:07.00,Default,,0000,0000,0000,,观察人类基因组序列的透镜 Dialogue: 0,0:11:07.00,0:11:09.00,Default,,0000,0000,0000,,文化组学很类似 Dialogue: 0,0:11:09.00,0:11:12.00,Default,,0000,0000,0000,,它指的是对人类文明研究的 Dialogue: 0,0:11:12.00,0:11:14.00,Default,,0000,0000,0000,,大规模数据收集分析的应用 Dialogue: 0,0:11:14.00,0:11:16.00,Default,,0000,0000,0000,,它使用的不是基因组这个透镜 Dialogue: 0,0:11:16.00,0:11:19.00,Default,,0000,0000,0000,,而是用数字化的历史记录片段作为透镜 Dialogue: 0,0:11:19.00,0:11:21.00,Default,,0000,0000,0000,,文化组学的优点是 Dialogue: 0,0:11:21.00,0:11:23.00,Default,,0000,0000,0000,,人人都会用它 Dialogue: 0,0:11:23.00,0:11:25.00,Default,,0000,0000,0000,,为什么呢 Dialogue: 0,0:11:25.00,0:11:27.00,Default,,0000,0000,0000,,这是因为这三个人 Dialogue: 0,0:11:27.00,0:11:30.00,Default,,0000,0000,0000,,谷歌的乔恩.奥温特 迈特.格雷和威尔.布洛克曼 Dialogue: 0,0:11:30.00,0:11:32.00,Default,,0000,0000,0000,,看到了n字格后 Dialogue: 0,0:11:32.00,0:11:34.00,Default,,0000,0000,0000,,说:“这太有意思了, Dialogue: 0,0:11:34.00,0:11:37.00,Default,,0000,0000,0000,,我们得让所有人都用上它。” Dialogue: 0,0:11:37.00,0:11:39.00,Default,,0000,0000,0000,,于是在我们的论文发表之前的整整两个星期中 Dialogue: 0,0:11:39.00,0:11:42.00,Default,,0000,0000,0000,,他们编了一个面向公众的Ngram Viewer版本 Dialogue: 0,0:11:42.00,0:11:45.00,Default,,0000,0000,0000,,现在你们也可以输入任何你感兴趣的单词或词组 Dialogue: 0,0:11:45.00,0:11:47.00,Default,,0000,0000,0000,,查看它的n字格 Dialogue: 0,0:11:47.00,0:11:49.00,Default,,0000,0000,0000,,并阅览所有书籍中 Dialogue: 0,0:11:49.00,0:11:51.00,Default,,0000,0000,0000,,出现n字格的例句 Dialogue: 0,0:11:51.00,0:11:53.00,Default,,0000,0000,0000,,这个词在第一天就被使用了超过一百万次 Dialogue: 0,0:11:53.00,0:11:55.00,Default,,0000,0000,0000,,这真的是最棒的一个搜索词 Dialogue: 0,0:11:55.00,0:11:58.00,Default,,0000,0000,0000,,人们总想做到最好 总想展示最好的一面 Dialogue: 0,0:11:58.00,0:12:01.00,Default,,0000,0000,0000,,但是在18世纪 人们对此并不在乎 Dialogue: 0,0:12:01.00,0:12:04.00,Default,,0000,0000,0000,,他们不想做到最好(“best”)而是“beft” Dialogue: 0,0:12:04.00,0:12:07.00,Default,,0000,0000,0000,,实际上 这是个错别字 Dialogue: 0,0:12:07.00,0:12:09.00,Default,,0000,0000,0000,,这并不是因为人们不识字 Dialogue: 0,0:12:09.00,0:12:12.00,Default,,0000,0000,0000,,而是因为当时英文字母S的写法跟现在不同 看起来像F Dialogue: 0,0:12:12.00,0:12:15.00,Default,,0000,0000,0000,,当然 谷歌没有意识到这一点 Dialogue: 0,0:12:15.00,0:12:18.00,Default,,0000,0000,0000,,于是我们对此在论文中做了报告 Dialogue: 0,0:12:18.00,0:12:20.00,Default,,0000,0000,0000,,这实际上只是一个小提示 Dialogue: 0,0:12:20.00,0:12:22.00,Default,,0000,0000,0000,,尽管这很有趣 Dialogue: 0,0:12:22.00,0:12:24.00,Default,,0000,0000,0000,,但是你在解读这些图表时 仍须非常谨慎 Dialogue: 0,0:12:24.00,0:12:27.00,Default,,0000,0000,0000,,你必须遵循基本的科学准则 Dialogue: 0,0:12:27.00,0:12:30.00,Default,,0000,0000,0000,,人们使用它来寻求各种乐趣 Dialogue: 0,0:12:30.00,0:12:37.00,Default,,0000,0000,0000,,(众人笑) Dialogue: 0,0:12:37.00,0:12:39.00,Default,,0000,0000,0000,,我们不打算多说 Dialogue: 0,0:12:39.00,0:12:42.00,Default,,0000,0000,0000,,光给你们看这些幻灯片 Dialogue: 0,0:12:42.00,0:12:45.00,Default,,0000,0000,0000,,这个用户对人们烦躁的历史很感兴趣 Dialogue: 0,0:12:45.00,0:12:48.00,Default,,0000,0000,0000,,这里有不同类型的烦躁 Dialogue: 0,0:12:48.00,0:12:51.00,Default,,0000,0000,0000,,如果你的脚趾被碰了 你会说“啊” (“argh”) Dialogue: 0,0:12:51.00,0:12:53.00,Default,,0000,0000,0000,,如果地球被外星人毁灭了 Dialogue: 0,0:12:53.00,0:12:55.00,Default,,0000,0000,0000,,开了一条星际航道 Dialogue: 0,0:12:55.00,0:12:57.00,Default,,0000,0000,0000,,那就是“啊啊啊啊啊啊啊啊” ("aaaaaaaargh") Dialogue: 0,0:12:57.00,0:12:59.00,Default,,0000,0000,0000,,这个人研究了不同长短的“啊” (“argh”) Dialogue: 0,0:12:59.00,0:13:01.00,Default,,0000,0000,0000,,从1个啊到8个啊 Dialogue: 0,0:13:01.00,0:13:03.00,Default,,0000,0000,0000,,结果 Dialogue: 0,0:13:03.00,0:13:05.00,Default,,0000,0000,0000,,那些使用频率较低的啊 Dialogue: 0,0:13:05.00,0:13:08.00,Default,,0000,0000,0000,,代表程度更高的烦躁 Dialogue: 0,0:13:08.00,0:13:11.00,Default,,0000,0000,0000,,八十年代是个例外 Dialogue: 0,0:13:11.00,0:13:13.00,Default,,0000,0000,0000,,我们猜这可能跟里根总统有关 Dialogue: 0,0:13:13.00,0:13:15.00,Default,,0000,0000,0000,,(众人笑) Dialogue: 0,0:13:15.00,0:13:18.00,Default,,0000,0000,0000,,这个数据库的用处很多 Dialogue: 0,0:13:18.00,0:13:21.00,Default,,0000,0000,0000,,但最重要的是这是一个数字化的历史记录 Dialogue: 0,0:13:21.00,0:13:23.00,Default,,0000,0000,0000,,谷歌已经开始对1500万本书进行数字化处理 Dialogue: 0,0:13:23.00,0:13:25.00,Default,,0000,0000,0000,,其中12%的书已被出版 Dialogue: 0,0:13:25.00,0:13:28.00,Default,,0000,0000,0000,,这是人类文明相当大的一部分 Dialogue: 0,0:13:28.00,0:13:31.00,Default,,0000,0000,0000,,而文明还包括更多的内容 有手稿 报纸 Dialogue: 0,0:13:31.00,0:13:33.00,Default,,0000,0000,0000,,非文字的内容 例如艺术与绘画 Dialogue: 0,0:13:33.00,0:13:35.00,Default,,0000,0000,0000,,这些内容都会出现在我们的电脑上 Dialogue: 0,0:13:35.00,0:13:37.00,Default,,0000,0000,0000,,在世界各地的电脑上 Dialogue: 0,0:13:37.00,0:13:40.00,Default,,0000,0000,0000,,如果这成真了 Dialogue: 0,0:13:40.00,0:13:42.00,Default,,0000,0000,0000,,我们对过去现在以及人类文明的认识就被改变了 Dialogue: 0,0:13:42.00,0:13:44.00,Default,,0000,0000,0000,,非常感谢大家 Dialogue: 0,0:13:44.00,0:13:47.00,Default,,0000,0000,0000,,(众人鼓掌)