0:00:01.006,0:00:06.130
历史纪录可以让我们知道[br]古希腊人如何打扮、

0:00:06.130,0:00:07.428
如何生活、

0:00:07.428,0:00:08.964
如何打仗...

0:00:08.964,0:00:11.362
但他们如何思考呢？

0:00:11.362,0:00:15.866
有一个很自然的方法就是，[br]去探索人类最深层的想法——

0:00:15.866,0:00:17.752
我们的想像力、

0:00:17.752,0:00:19.189
意识力、

0:00:19.193,0:00:20.428
去梦想——

0:00:20.428,0:00:22.602
是否是一样的。

0:00:22.602,0:00:24.345
另一种可能是，

0:00:24.345,0:00:28.102
去探索造就我们文化的社会变革，

0:00:28.102,0:00:32.891
这些变革也许就是[br]改变人类想法的主要因素。

0:00:32.891,0:00:35.419
对这一点，大家或许有不同的看法。

0:00:35.419,0:00:38.176
实际上，这是一个存在已久的哲学辩论。

0:00:38.644,0:00:42.811
究竟这个问题是否可以[br]通过科学来处理？

0:00:42.811,0:00:45.390
我的建议是

0:00:45.390,0:00:50.250
如同仅借由一些砖头，[br]我们得以重建希腊古都的外貌，

0:00:50.250,0:00:52.562
也可用同样的方式，

0:00:52.572,0:00:56.718
借由一些文化作品，[br]比如考古纪录、

0:00:56.718,0:00:59.935
化石，来了解人类的想法。

0:00:59.935,0:01:01.043
而实际上，

0:01:01.043,0:01:03.389
因为对人类的

0:01:03.389,0:01:06.871
古老文化书籍做了一些心理分析，

0:01:06.871,0:01:12.850
朱利安 杰尼斯在70年代，[br]发表了一个相当大胆激进的假说：

0:01:12.850,0:01:15.287
他说，3000年前的人类，

0:01:15.287,0:01:21.365
是我们现在俗称的[br]“精神分裂症患者”。

0:01:21.753,0:01:23.255
他会如此主张的原因是

0:01:23.255,0:01:26.656
依据世界各地不同的传统及位置，

0:01:26.656,0:01:28.568
这些书籍里面

0:01:28.568,0:01:31.568
所描述的人类行为

0:01:31.568,0:01:35.110
似乎不约而同地都会服从

0:01:35.110,0:01:36.684
他们认为是从神袛

0:01:36.684,0:01:40.044
那边传来的声音......

0:01:40.044,0:01:43.682
而如今，我们会称之为“幻听”。

0:01:43.888,0:01:46.514
随着时间的洗礼，

0:01:46.518,0:01:50.163
他们开始认知到[br]那些声音是他们自己创造的，

0:01:50.163,0:01:53.128
他们就是那些内在声音的主人。

0:01:53.316,0:01:56.015
有了这样的认知，[br]他们学会了 “自省”：

0:01:56.015,0:01:59.608
一种反思自己想法的能力。

0:01:59.785,0:02:03.156
所以杰尼斯对“意识”的理论就是，

0:02:03.156,0:02:06.336
至少现今我们觉察到的“意识”、

0:02:06.336,0:02:09.920
感觉到我们能掌控[br]自我人生的感悟——

0:02:09.920,0:02:13.237
是相当近代的文化发展。

0:02:13.456,0:02:15.236
这理论很有前瞻性，

0:02:15.236,0:02:16.493
但一个很明显的问题就是，

0:02:16.493,0:02:20.715
它是建立在极少又特殊的案例上。

0:02:21.085,0:02:22.558
所以问题是，

0:02:22.562,0:02:27.617
3000年来人类才建立起[br]自省能力的这个理论

0:02:27.617,0:02:30.631
是否可以经得起量化且客观的考验。

0:02:31.543,0:02:35.100
至于要如何做的问题，[br]也是相当简单明了。

0:02:35.100,0:02:38.544
但我的意思并非，比如，[br]柏拉图有一天突然醒来写下

0:02:38.544,0:02:40.257
“你好！我是柏拉图，

0:02:40.257,0:02:43.150
我今天拥有完整的自省意识了。”[br]那样简单而已。

0:02:43.150,0:02:45.497
（笑声）

0:02:45.497,0:02:48.860
而这鞥告诉我们，我们要找出[br]问题的本质是什么。

0:02:49.467,0:02:54.122
我们必须找到从来没有被[br]谈论过的概念。

0:02:54.434,0:02:58.888
“自省”这个词，在我们研究的

0:02:58.888,0:03:01.698
这些书本中从未出现过一次。

0:03:01.698,0:03:05.815
所以为了解决这个问题，[br]我们要建立一个字词的空间。

0:03:06.571,0:03:09.852
在这个大空间里，[br]包含了所有的词汇，

0:03:09.852,0:03:12.684
用这种方式可以衡量

0:03:12.688,0:03:16.171
两个词语彼此之间的关联程度。

0:03:16.460,0:03:17.254
举个例子，

0:03:17.254,0:03:20.532
你会想，“狗”、“猫”是比较相关的词，

0:03:20.536,0:03:24.387
但“葡萄柚”和“对数”[br]就没什么关联了。

0:03:24.809,0:03:29.486
而在这个空间里的任何[br]两个词都必须能以此衡量。

0:03:29.486,0:03:32.931
而我们有很多方式[br]可以建立起这些字的空间架构，[br]

0:03:32.931,0:03:34.498
方法一，只要请教专家就行了，

0:03:34.498,0:03:36.554
有点类似查字典。[br]

0:03:36.896,0:03:38.318
另一个可行的方法是，

0:03:38.318,0:03:42.007
当两个字词出现关联性时，[br]去追踪它们的预设状况，

0:03:42.007,0:03:44.430
它们可能会出现在同一句、

0:03:44.430,0:03:45.887
同一段落、

0:03:45.887,0:03:47.707
或同一文档中，

0:03:47.711,0:03:51.433
比偶然出现频繁得多。

0:03:52.231,0:03:54.275
在这个简单的前提下，

0:03:54.275,0:03:55.359
这个单纯且带有

0:03:55.359,0:03:57.199
运算技巧的方法

0:03:57.199,0:03:58.109
在这个复杂且高维度的

0:03:58.109,0:04:01.743
空间中必须能充分发挥作用，

0:04:01.747,0:04:04.032
而事后证明，它相当有效。

0:04:04.035,0:04:06.941
向各位介绍一下，它多有效，

0:04:06.941,0:04:11.263
我们分析了一些经常用到的词语。

0:04:11.607,0:04:12.696
首先你可以看到，

0:04:12.696,0:04:16.088
这些词语会自动地划分为[br]语义相近的相邻群组，

0:04:16.088,0:04:17.768
所以你可看到水果，身体部位，

0:04:17.768,0:04:20.784
电脑零件与科学术语等等。

0:04:21.119,0:04:25.341
演算法也可以把我们要[br]整理的概念分门别类出来。

0:04:25.852,0:04:26.507
举个例子，[br]

0:04:26.507,0:04:30.328
你可以看到，科学的术语[br]被拆解成两个子类，

0:04:30.328,0:04:32.748
分别是太空与物理的术语。

0:04:33.338,0:04:35.578
然后你会发现一件有趣的事。

0:04:35.578,0:04:37.497
举个例子，“天文学”这个词，

0:04:37.497,0:04:39.118
它现在的位置看似不太对，

0:04:39.118,0:04:41.587
却的确在正确的位置上，

0:04:41.587,0:04:43.045
它应该介于科学与

0:04:43.045,0:04:44.403
天文学术语之间，

0:04:44.403,0:04:45.961
因为天文学是一门科学

0:04:45.961,0:04:48.033
同时又包含了很多天文学术语。

0:04:48.033,0:04:49.967
我们可以持续寻找其它类似的情况。

0:04:49.967,0:04:51.461
如果你盯着这些词一阵子，

0:04:51.461,0:04:53.709
然后随机搭配连接一下这些词语，

0:04:53.709,0:04:57.928
你会觉得好像自己在做诗。

0:04:57.928,0:04:59.894
那是因为在某种程度上，

0:04:59.894,0:05:03.834
在这个空间里漫遊，[br]就像是在脑海中做诗一样。

0:05:04.027,0:05:05.568
最后，

0:05:05.568,0:05:09.702
演算法也能辨识出人类的直觉，[br]

0:05:09.702,0:05:13.628
并归纳到自省的词语范畴中。

0:05:13.632,0:05:14.869
举个例子，

0:05:14.869,0:05:18.862
比如“自我”、“內疚”、“理由”、“情绪”

0:05:18.862,0:05:20.775
与“自省”的含义非常接近，

0:05:20.775,0:05:21.740
但其它的词汇，

0:05:21.740,0:05:24.121
比如“红色”、“足球”、“蜡烛”、“香蕉”

0:05:24.121,0:05:25.633
就差很远了。

0:05:26.054,0:05:28.810
所以一旦我们建立起[br]这样的词汇空间，

0:05:28.810,0:05:31.630
有关于自省的历史，

0:05:31.630,0:05:34.023
有关与任何概念的历史，

0:05:34.027,0:05:38.760
以前被认为是抽象[br]或是有点模糊的词汇，

0:05:38.760,0:05:40.418
都可以变成实实在在的

0:05:40.418,0:05:43.216
可以被量化的科学。

0:05:44.216,0:05:46.962
而我们要做的就是，[br]拿起这些书，

0:05:46.962,0:05:48.357
把它们数字化，

0:05:48.357,0:05:51.210
然后把这些词汇映射到

0:05:51.210,0:05:53.203
词汇空间里面，

0:05:53.203,0:05:56.961
然后我们问电脑，[br]这些词汇所经过的轨迹

0:05:56.961,0:06:00.353
花了多少时间才接近自省的概念。

0:06:00.760,0:06:01.940
有了这些数据，

0:06:01.940,0:06:03.906
我们就可以分析古希腊传统中，

0:06:03.906,0:06:06.021
有关于自省的历史，

0:06:06.021,0:06:09.453
因为我们拥有最完整的文字记录。

0:06:09.631,0:06:11.870
所以我们先把这些书——

0:06:11.870,0:06:14.194
按照时间排列——

0:06:14.198,0:06:15.964
然后把每本书中的词汇都

0:06:15.964,0:06:17.955
投射到词语空间里面，

0:06:17.959,0:06:20.685
然后我们问电脑，这些字词[br]与自省有多少的相关性，

0:06:20.685,0:06:22.265
再把它们平均起来。

0:06:22.590,0:06:25.762
然后，我们不断地问电脑问题，

0:06:25.762,0:06:29.058
这些书就会越来越

0:06:29.058,0:06:30.836
接近自省的概念。

0:06:30.836,0:06:35.307
而这正是当时在古希腊所发生的事。[br]

0:06:35.698,0:06:38.779
各位可以看到在[br]荷马时代最古老的书籍，

0:06:38.779,0:06:42.321
与自省的相关性只有一点点。

0:06:42.321,0:06:44.465
但在大约在公元前400年左右，

0:06:44.465,0:06:49.273
这个数据却快速上涨至五倍，

0:06:49.273,0:06:51.741
这些书与自省的概念

0:06:51.741,0:06:54.039
越来越接近。

0:06:54.039,0:06:56.623
最棒的是，

0:06:56.623,0:06:57.759
我们可以问电脑，

0:06:57.759,0:07:01.976
在不同的、独立的传统文化中，[br]是否也有一样的现象。

0:07:02.962,0:07:06.112
所以，我们用同样的方法，[br]分析了传统犹太基督教的书籍，

0:07:06.112,0:07:08.883
也得到了类似的趋势。

0:07:09.548,0:07:14.147
在最古老的旧约圣经中，[br]你可以看到它缓慢地增加，

0:07:14.147,0:07:16.157
之后在新约圣经中，

0:07:16.157,0:07:18.008
它在快速地增长。

0:07:18.008,0:07:20.157
大约公元400年，

0:07:20.157,0:07:22.267
圣人奥古斯丁的《忏悔录》中

0:07:22.267,0:07:24.897
自省的词汇数量达到了最高峰。

0:07:24.897,0:07:26.825
这个信息相当重要，

0:07:26.825,0:07:30.202
因为圣人奥古斯丁已经被多位学者、

0:07:30.202,0:07:32.428
心理学家、历史学家公认为

0:07:32.428,0:07:34.536
是自省的创始人之一。[br]

0:07:35.060,0:07:38.837
有些人认为他是现代心理学之父。[br]

0:07:39.012,0:07:40.871
所以，我们演算法的优点[br]

0:07:40.871,0:07:43.701
不仅可以量化，

0:07:43.701,0:07:44.868
而且客观，

0:07:44.868,0:07:47.018
当然速度也相当快——

0:07:47.018,0:07:49.409
几秒就可以跑完——

0:07:49.409,0:07:52.966
并捕捉到使用传统方法[br]必须费长时间调查

0:07:52.966,0:07:55.998
才能抓到的一些重点。

0:07:56.317,0:08:00.038
这也是科学美好的地方之一，

0:08:00.038,0:08:03.462
它可以解读、归纳这想法，

0:08:03.462,0:08:06.063
然后广泛应用在许多不同的领域上。

0:08:06.769,0:08:11.500
或许最具挑战性的问题是，

0:08:11.500,0:08:14.960
我们用电脑来分析过去的[br]自我意识发展的方法，

0:08:14.960,0:08:19.127
是不是也可以告诉我们[br]自我意识的发展趋势呢？

0:08:19.550,0:08:20.954
更确切地说，

0:08:20.954,0:08:23.454
我们现在说的话，

0:08:23.454,0:08:28.664
是否可以告诉我们接下来的几天、

0:08:28.664,0:08:29.655
几个月或几年后，

0:08:29.655,0:08:31.197
我们的心智会达到什么情况。

0:08:31.867,0:08:34.580
类似的，我们现在很多人[br]都使用穿戴式侦测器，

0:08:34.580,0:08:36.401
可以侦测我们的心跳、[br]

0:08:36.401,0:08:37.720
呼吸、

0:08:37.724,0:08:39.394
基因，

0:08:39.394,0:08:43.080
让我们可以预防疾病，

0:08:43.080,0:08:46.681
我们是否可以通过[br]监控和分析我们所说的话、

0:08:46.681,0:08:49.378
发的微博、邮件和书写的文字，

0:08:49.378,0:08:54.170
来提前告诉我们，我们的心智[br]可能要发生问题了？

0:08:55.087,0:08:56.687
我跟我的兄弟，

0:08:56.687,0:08:59.681
吉列尔莫 切基，

0:08:59.681,0:09:01.696
扛起了这项任务。[br]

0:09:02.228,0:09:07.864
我们纪录分析了 34 位年轻人的谈话。

0:09:07.864,0:09:11.295
他们曾是患精神分裂症的高风险人群。

0:09:11.434,0:09:14.335
我们测量了他们第一天的谈话，

0:09:14.339,0:09:17.185
然后问电脑，从他们的话中，[br]是否可以预测出，

0:09:17.185,0:09:20.151
未來三年內，

0:09:20.151,0:09:23.170
他们会不会患上精神错乱。

0:09:23.427,0:09:25.777
但我们大失所望，

0:09:25.777,0:09:28.934
一次又一次的失败。[br]

0:09:29.793,0:09:33.695
没有足够的语义上的信息

0:09:33.699,0:09:36.512
来预测未来的心智发展。

0:09:36.716,0:09:39.915
它有能力分辨

0:09:39.915,0:09:42.584
精神病患者和健康人，

0:09:42.584,0:09:45.320
因为这有点像我们之前[br]做古文字的分析，

0:09:45.320,0:09:48.278
但没办法预测未来精神错乱的发病。

0:09:49.164,0:09:50.834
后来我们了解到，[br]

0:09:50.834,0:09:55.022
也许最关键的不是他们说了什么，

0:09:55.022,0:09:57.349
而是他们怎么说。[br]

0:09:57.679,0:09:58.929
进一步说，

0:09:58.929,0:10:01.790
不是他们说的话落在哪个[br]语义相近的群组里，

0:10:01.790,0:10:04.374
而是他们说话的方式是否会在这几个

0:10:04.374,0:10:07.119
语义相近的群组里快速地跳来跳去。

0:10:07.247,0:10:08.612
所以我们想出了一个

0:10:08.612,0:10:11.365
叫做“语义连贯性”的评估方法，

0:10:11.365,0:10:16.413
本质上就是评估谈话的持续性

0:10:16.413,0:10:19.102
是否会落在同一个[br]语义主题或类别上。

0:10:19.294,0:10:23.335
结果显示，刚刚的 34 位年轻人，

0:10:23.335,0:10:26.998
通过这个语义连贯性演算法，

0:10:26.998,0:10:29.656
预测谁会精神错乱的正确率

0:10:29.656,0:10:32.976
达到了百分之百。

0:10:32.976,0:10:36.045
目前临床上所有评估方式

0:10:36.045,0:10:37.595
都无法达到、

0:10:37.595,0:10:40.935
甚至无法接近这个数字。

0:10:42.525,0:10:46.078
在我做这项研究的时候，[br]清楚地记得一件事，

0:10:46.078,0:10:48.399
当时我坐在电脑前面，[br]

0:10:48.399,0:10:51.169
看到保罗发的一些微博——

0:10:51.169,0:10:54.299
他是我之前在布宜诺斯艾利斯市[br]教书时的第一个学生，

0:10:54.299,0:10:56.389
当时他住在纽约。[br]

0:10:56.393,0:10:58.305
我发现微博的内容不太对劲——

0:10:58.305,0:11:02.020
我看不懂是什么，[br]因为他写得不太清楚——

0:11:02.020,0:11:04.097
但我有一种

0:11:04.097,0:11:07.237
强烈的直觉，一定[br]有什么地方不对劲儿了。

0:11:08.347,0:11:11.044
所以我立刻打电话给保罗，

0:11:11.044,0:11:13.333
没错，他当时感觉不太舒服。[br]

0:11:13.333,0:11:14.798
仅仅通过阅读

0:11:14.798,0:11:17.798
他微博的字里行间，

0:11:17.798,0:11:22.084
我就可以感受到他的精神健康状态，

0:11:22.084,0:11:25.937
阅读别人的用词[br]的确是个简单有效的帮助方式。

0:11:25.937,0:11:27.599
今天我要告诉各位的是，[br]

0:11:27.599,0:11:30.257
我们已经越来越能够理解

0:11:30.257,0:11:34.572
如何把我们共有的，

0:11:34.572,0:11:36.072
共享的直觉

0:11:36.072,0:11:38.102
转换成演算法。

0:11:38.102,0:11:39.547
通过这样做，

0:11:39.547,0:11:44.191
未来我们也许可以看到一种[br]全然不同的精神健康模式，

0:11:44.191,0:11:49.842
是基于一种客观、[br]量化的方式来自动分析出

0:11:49.842,0:11:51.475
我们所写的词汇，

0:11:51.475,0:11:53.140
还有我们所说的话。

0:11:53.140,0:11:54.315
谢谢。

0:11:54.315,0:11:59.888
（掌声）