0:00:01.006,0:00:06.130 历史纪录可以让我们知道[br]古希腊人如何打扮、 0:00:06.130,0:00:07.428 如何生活、 0:00:07.428,0:00:08.964 如何打仗... 0:00:08.964,0:00:11.362 但他们如何思考呢? 0:00:11.362,0:00:15.866 有一个很自然的方法就是,[br]去探索人类最深层的想法—— 0:00:15.866,0:00:17.752 我们的想像力、 0:00:17.752,0:00:19.189 意识力、 0:00:19.193,0:00:20.428 去梦想—— 0:00:20.428,0:00:22.602 是否是一样的。 0:00:22.602,0:00:24.345 另一种可能是, 0:00:24.345,0:00:28.102 去探索造就我们文化的社会变革, 0:00:28.102,0:00:32.891 这些变革也许就是[br]改变人类想法的主要因素。 0:00:32.891,0:00:35.419 对这一点,大家或许有不同的看法。 0:00:35.419,0:00:38.176 实际上,这是一个存在已久的哲学辩论。 0:00:38.644,0:00:42.811 究竟这个问题是否可以[br]通过科学来处理? 0:00:42.811,0:00:45.390 我的建议是 0:00:45.390,0:00:50.250 如同仅借由一些砖头,[br]我们得以重建希腊古都的外貌, 0:00:50.250,0:00:52.562 也可用同样的方式, 0:00:52.572,0:00:56.718 借由一些文化作品,[br]比如考古纪录、 0:00:56.718,0:00:59.935 化石,来了解人类的想法。 0:00:59.935,0:01:01.043 而实际上, 0:01:01.043,0:01:03.389 因为对人类的 0:01:03.389,0:01:06.871 古老文化书籍做了一些心理分析, 0:01:06.871,0:01:12.850 朱利安 杰尼斯在70年代,[br]发表了一个相当大胆激进的假说: 0:01:12.850,0:01:15.287 他说,3000年前的人类, 0:01:15.287,0:01:21.365 是我们现在俗称的[br]“精神分裂症患者”。 0:01:21.753,0:01:23.255 他会如此主张的原因是 0:01:23.255,0:01:26.656 依据世界各地不同的传统及位置, 0:01:26.656,0:01:28.568 这些书籍里面 0:01:28.568,0:01:31.568 所描述的人类行为 0:01:31.568,0:01:35.110 似乎不约而同地都会服从 0:01:35.110,0:01:36.684 他们认为是从神袛 0:01:36.684,0:01:40.044 那边传来的声音...... 0:01:40.044,0:01:43.682 而如今,我们会称之为“幻听”。 0:01:43.888,0:01:46.514 随着时间的洗礼, 0:01:46.518,0:01:50.163 他们开始认知到[br]那些声音是他们自己创造的, 0:01:50.163,0:01:53.128 他们就是那些内在声音的主人。 0:01:53.316,0:01:56.015 有了这样的认知,[br]他们学会了 “自省”: 0:01:56.015,0:01:59.608 一种反思自己想法的能力。 0:01:59.785,0:02:03.156 所以杰尼斯对“意识”的理论就是, 0:02:03.156,0:02:06.336 至少现今我们觉察到的“意识”、 0:02:06.336,0:02:09.920 感觉到我们能掌控[br]自我人生的感悟—— 0:02:09.920,0:02:13.237 是相当近代的文化发展。 0:02:13.456,0:02:15.236 这理论很有前瞻性, 0:02:15.236,0:02:16.493 但一个很明显的问题就是, 0:02:16.493,0:02:20.715 它是建立在极少又特殊的案例上。 0:02:21.085,0:02:22.558 所以问题是, 0:02:22.562,0:02:27.617 3000年来人类才建立起[br]自省能力的这个理论 0:02:27.617,0:02:30.631 是否可以经得起量化且客观的考验。 0:02:31.543,0:02:35.100 至于要如何做的问题,[br]也是相当简单明了。 0:02:35.100,0:02:38.544 但我的意思并非,比如,[br]柏拉图有一天突然醒来写下 0:02:38.544,0:02:40.257 “你好!我是柏拉图, 0:02:40.257,0:02:43.150 我今天拥有完整的自省意识了。”[br]那样简单而已。 0:02:43.150,0:02:45.497 (笑声) 0:02:45.497,0:02:48.860 而这鞥告诉我们,我们要找出[br]问题的本质是什么。 0:02:49.467,0:02:54.122 我们必须找到从来没有被[br]谈论过的概念。 0:02:54.434,0:02:58.888 “自省”这个词,在我们研究的 0:02:58.888,0:03:01.698 这些书本中从未出现过一次。 0:03:01.698,0:03:05.815 所以为了解决这个问题,[br]我们要建立一个字词的空间。 0:03:06.571,0:03:09.852 在这个大空间里,[br]包含了所有的词汇, 0:03:09.852,0:03:12.684 用这种方式可以衡量 0:03:12.688,0:03:16.171 两个词语彼此之间的关联程度。 0:03:16.460,0:03:17.254 举个例子, 0:03:17.254,0:03:20.532 你会想,“狗”、“猫”是比较相关的词, 0:03:20.536,0:03:24.387 但“葡萄柚”和“对数”[br]就没什么关联了。 0:03:24.809,0:03:29.486 而在这个空间里的任何[br]两个词都必须能以此衡量。 0:03:29.486,0:03:32.931 而我们有很多方式[br]可以建立起这些字的空间架构,[br] 0:03:32.931,0:03:34.498 方法一,只要请教专家就行了, 0:03:34.498,0:03:36.554 有点类似查字典。[br] 0:03:36.896,0:03:38.318 另一个可行的方法是, 0:03:38.318,0:03:42.007 当两个字词出现关联性时,[br]去追踪它们的预设状况, 0:03:42.007,0:03:44.430 它们可能会出现在同一句、 0:03:44.430,0:03:45.887 同一段落、 0:03:45.887,0:03:47.707 或同一文档中, 0:03:47.711,0:03:51.433 比偶然出现频繁得多。 0:03:52.231,0:03:54.275 在这个简单的前提下, 0:03:54.275,0:03:55.359 这个单纯且带有 0:03:55.359,0:03:57.199 运算技巧的方法 0:03:57.199,0:03:58.109 在这个复杂且高维度的 0:03:58.109,0:04:01.743 空间中必须能充分发挥作用, 0:04:01.747,0:04:04.032 而事后证明,它相当有效。 0:04:04.035,0:04:06.941 向各位介绍一下,它多有效, 0:04:06.941,0:04:11.263 我们分析了一些经常用到的词语。 0:04:11.607,0:04:12.696 首先你可以看到, 0:04:12.696,0:04:16.088 这些词语会自动地划分为[br]语义相近的相邻群组, 0:04:16.088,0:04:17.768 所以你可看到水果,身体部位, 0:04:17.768,0:04:20.784 电脑零件与科学术语等等。 0:04:21.119,0:04:25.341 演算法也可以把我们要[br]整理的概念分门别类出来。 0:04:25.852,0:04:26.507 举个例子,[br] 0:04:26.507,0:04:30.328 你可以看到,科学的术语[br]被拆解成两个子类, 0:04:30.328,0:04:32.748 分别是太空与物理的术语。 0:04:33.338,0:04:35.578 然后你会发现一件有趣的事。 0:04:35.578,0:04:37.497 举个例子,“天文学”这个词, 0:04:37.497,0:04:39.118 它现在的位置看似不太对, 0:04:39.118,0:04:41.587 却的确在正确的位置上, 0:04:41.587,0:04:43.045 它应该介于科学与 0:04:43.045,0:04:44.403 天文学术语之间, 0:04:44.403,0:04:45.961 因为天文学是一门科学 0:04:45.961,0:04:48.033 同时又包含了很多天文学术语。 0:04:48.033,0:04:49.967 我们可以持续寻找其它类似的情况。 0:04:49.967,0:04:51.461 如果你盯着这些词一阵子, 0:04:51.461,0:04:53.709 然后随机搭配连接一下这些词语, 0:04:53.709,0:04:57.928 你会觉得好像自己在做诗。 0:04:57.928,0:04:59.894 那是因为在某种程度上, 0:04:59.894,0:05:03.834 在这个空间里漫遊,[br]就像是在脑海中做诗一样。 0:05:04.027,0:05:05.568 最后, 0:05:05.568,0:05:09.702 演算法也能辨识出人类的直觉,[br] 0:05:09.702,0:05:13.628 并归纳到自省的词语范畴中。 0:05:13.632,0:05:14.869 举个例子, 0:05:14.869,0:05:18.862 比如“自我”、“內疚”、“理由”、“情绪” 0:05:18.862,0:05:20.775 与“自省”的含义非常接近, 0:05:20.775,0:05:21.740 但其它的词汇, 0:05:21.740,0:05:24.121 比如“红色”、“足球”、“蜡烛”、“香蕉” 0:05:24.121,0:05:25.633 就差很远了。 0:05:26.054,0:05:28.810 所以一旦我们建立起[br]这样的词汇空间, 0:05:28.810,0:05:31.630 有关于自省的历史, 0:05:31.630,0:05:34.023 有关与任何概念的历史, 0:05:34.027,0:05:38.760 以前被认为是抽象[br]或是有点模糊的词汇, 0:05:38.760,0:05:40.418 都可以变成实实在在的 0:05:40.418,0:05:43.216 可以被量化的科学。 0:05:44.216,0:05:46.962 而我们要做的就是,[br]拿起这些书, 0:05:46.962,0:05:48.357 把它们数字化, 0:05:48.357,0:05:51.210 然后把这些词汇映射到 0:05:51.210,0:05:53.203 词汇空间里面, 0:05:53.203,0:05:56.961 然后我们问电脑,[br]这些词汇所经过的轨迹 0:05:56.961,0:06:00.353 花了多少时间才接近自省的概念。 0:06:00.760,0:06:01.940 有了这些数据, 0:06:01.940,0:06:03.906 我们就可以分析古希腊传统中, 0:06:03.906,0:06:06.021 有关于自省的历史, 0:06:06.021,0:06:09.453 因为我们拥有最完整的文字记录。 0:06:09.631,0:06:11.870 所以我们先把这些书—— 0:06:11.870,0:06:14.194 按照时间排列—— 0:06:14.198,0:06:15.964 然后把每本书中的词汇都 0:06:15.964,0:06:17.955 投射到词语空间里面, 0:06:17.959,0:06:20.685 然后我们问电脑,这些字词[br]与自省有多少的相关性, 0:06:20.685,0:06:22.265 再把它们平均起来。 0:06:22.590,0:06:25.762 然后,我们不断地问电脑问题, 0:06:25.762,0:06:29.058 这些书就会越来越 0:06:29.058,0:06:30.836 接近自省的概念。 0:06:30.836,0:06:35.307 而这正是当时在古希腊所发生的事。[br] 0:06:35.698,0:06:38.779 各位可以看到在[br]荷马时代最古老的书籍, 0:06:38.779,0:06:42.321 与自省的相关性只有一点点。 0:06:42.321,0:06:44.465 但在大约在公元前400年左右, 0:06:44.465,0:06:49.273 这个数据却快速上涨至五倍, 0:06:49.273,0:06:51.741 这些书与自省的概念 0:06:51.741,0:06:54.039 越来越接近。 0:06:54.039,0:06:56.623 最棒的是, 0:06:56.623,0:06:57.759 我们可以问电脑, 0:06:57.759,0:07:01.976 在不同的、独立的传统文化中,[br]是否也有一样的现象。 0:07:02.962,0:07:06.112 所以,我们用同样的方法,[br]分析了传统犹太基督教的书籍, 0:07:06.112,0:07:08.883 也得到了类似的趋势。 0:07:09.548,0:07:14.147 在最古老的旧约圣经中,[br]你可以看到它缓慢地增加, 0:07:14.147,0:07:16.157 之后在新约圣经中, 0:07:16.157,0:07:18.008 它在快速地增长。 0:07:18.008,0:07:20.157 大约公元400年, 0:07:20.157,0:07:22.267 圣人奥古斯丁的《忏悔录》中 0:07:22.267,0:07:24.897 自省的词汇数量达到了最高峰。 0:07:24.897,0:07:26.825 这个信息相当重要, 0:07:26.825,0:07:30.202 因为圣人奥古斯丁已经被多位学者、 0:07:30.202,0:07:32.428 心理学家、历史学家公认为 0:07:32.428,0:07:34.536 是自省的创始人之一。[br] 0:07:35.060,0:07:38.837 有些人认为他是现代心理学之父。[br] 0:07:39.012,0:07:40.871 所以,我们演算法的优点[br] 0:07:40.871,0:07:43.701 不仅可以量化, 0:07:43.701,0:07:44.868 而且客观, 0:07:44.868,0:07:47.018 当然速度也相当快—— 0:07:47.018,0:07:49.409 几秒就可以跑完—— 0:07:49.409,0:07:52.966 并捕捉到使用传统方法[br]必须费长时间调查 0:07:52.966,0:07:55.998 才能抓到的一些重点。 0:07:56.317,0:08:00.038 这也是科学美好的地方之一, 0:08:00.038,0:08:03.462 它可以解读、归纳这想法, 0:08:03.462,0:08:06.063 然后广泛应用在许多不同的领域上。 0:08:06.769,0:08:11.500 或许最具挑战性的问题是, 0:08:11.500,0:08:14.960 我们用电脑来分析过去的[br]自我意识发展的方法, 0:08:14.960,0:08:19.127 是不是也可以告诉我们[br]自我意识的发展趋势呢? 0:08:19.550,0:08:20.954 更确切地说, 0:08:20.954,0:08:23.454 我们现在说的话, 0:08:23.454,0:08:28.664 是否可以告诉我们接下来的几天、 0:08:28.664,0:08:29.655 几个月或几年后, 0:08:29.655,0:08:31.197 我们的心智会达到什么情况。 0:08:31.867,0:08:34.580 类似的,我们现在很多人[br]都使用穿戴式侦测器, 0:08:34.580,0:08:36.401 可以侦测我们的心跳、[br] 0:08:36.401,0:08:37.720 呼吸、 0:08:37.724,0:08:39.394 基因, 0:08:39.394,0:08:43.080 让我们可以预防疾病, 0:08:43.080,0:08:46.681 我们是否可以通过[br]监控和分析我们所说的话、 0:08:46.681,0:08:49.378 发的微博、邮件和书写的文字, 0:08:49.378,0:08:54.170 来提前告诉我们,我们的心智[br]可能要发生问题了? 0:08:55.087,0:08:56.687 我跟我的兄弟, 0:08:56.687,0:08:59.681 吉列尔莫 切基, 0:08:59.681,0:09:01.696 扛起了这项任务。[br] 0:09:02.228,0:09:07.864 我们纪录分析了 34 位年轻人的谈话。 0:09:07.864,0:09:11.295 他们曾是患精神分裂症的高风险人群。 0:09:11.434,0:09:14.335 我们测量了他们第一天的谈话, 0:09:14.339,0:09:17.185 然后问电脑,从他们的话中,[br]是否可以预测出, 0:09:17.185,0:09:20.151 未來三年內, 0:09:20.151,0:09:23.170 他们会不会患上精神错乱。 0:09:23.427,0:09:25.777 但我们大失所望, 0:09:25.777,0:09:28.934 一次又一次的失败。[br] 0:09:29.793,0:09:33.695 没有足够的语义上的信息 0:09:33.699,0:09:36.512 来预测未来的心智发展。 0:09:36.716,0:09:39.915 它有能力分辨 0:09:39.915,0:09:42.584 精神病患者和健康人, 0:09:42.584,0:09:45.320 因为这有点像我们之前[br]做古文字的分析, 0:09:45.320,0:09:48.278 但没办法预测未来精神错乱的发病。 0:09:49.164,0:09:50.834 后来我们了解到,[br] 0:09:50.834,0:09:55.022 也许最关键的不是他们说了什么, 0:09:55.022,0:09:57.349 而是他们怎么说。[br] 0:09:57.679,0:09:58.929 进一步说, 0:09:58.929,0:10:01.790 不是他们说的话落在哪个[br]语义相近的群组里, 0:10:01.790,0:10:04.374 而是他们说话的方式是否会在这几个 0:10:04.374,0:10:07.119 语义相近的群组里快速地跳来跳去。 0:10:07.247,0:10:08.612 所以我们想出了一个 0:10:08.612,0:10:11.365 叫做“语义连贯性”的评估方法, 0:10:11.365,0:10:16.413 本质上就是评估谈话的持续性 0:10:16.413,0:10:19.102 是否会落在同一个[br]语义主题或类别上。 0:10:19.294,0:10:23.335 结果显示,刚刚的 34 位年轻人, 0:10:23.335,0:10:26.998 通过这个语义连贯性演算法, 0:10:26.998,0:10:29.656 预测谁会精神错乱的正确率 0:10:29.656,0:10:32.976 达到了百分之百。 0:10:32.976,0:10:36.045 目前临床上所有评估方式 0:10:36.045,0:10:37.595 都无法达到、 0:10:37.595,0:10:40.935 甚至无法接近这个数字。 0:10:42.525,0:10:46.078 在我做这项研究的时候,[br]清楚地记得一件事, 0:10:46.078,0:10:48.399 当时我坐在电脑前面,[br] 0:10:48.399,0:10:51.169 看到保罗发的一些微博—— 0:10:51.169,0:10:54.299 他是我之前在布宜诺斯艾利斯市[br]教书时的第一个学生, 0:10:54.299,0:10:56.389 当时他住在纽约。[br] 0:10:56.393,0:10:58.305 我发现微博的内容不太对劲—— 0:10:58.305,0:11:02.020 我看不懂是什么,[br]因为他写得不太清楚—— 0:11:02.020,0:11:04.097 但我有一种 0:11:04.097,0:11:07.237 强烈的直觉,一定[br]有什么地方不对劲儿了。 0:11:08.347,0:11:11.044 所以我立刻打电话给保罗, 0:11:11.044,0:11:13.333 没错,他当时感觉不太舒服。[br] 0:11:13.333,0:11:14.798 仅仅通过阅读 0:11:14.798,0:11:17.798 他微博的字里行间, 0:11:17.798,0:11:22.084 我就可以感受到他的精神健康状态, 0:11:22.084,0:11:25.937 阅读别人的用词[br]的确是个简单有效的帮助方式。 0:11:25.937,0:11:27.599 今天我要告诉各位的是,[br] 0:11:27.599,0:11:30.257 我们已经越来越能够理解 0:11:30.257,0:11:34.572 如何把我们共有的, 0:11:34.572,0:11:36.072 共享的直觉 0:11:36.072,0:11:38.102 转换成演算法。 0:11:38.102,0:11:39.547 通过这样做, 0:11:39.547,0:11:44.191 未来我们也许可以看到一种[br]全然不同的精神健康模式, 0:11:44.191,0:11:49.842 是基于一种客观、[br]量化的方式来自动分析出 0:11:49.842,0:11:51.475 我们所写的词汇, 0:11:51.475,0:11:53.140 还有我们所说的话。 0:11:53.140,0:11:54.315 谢谢。 0:11:54.315,0:11:59.888 (掌声)