历史纪录可以让我们知道
古希腊人如何打扮、
如何生活、
如何打仗...
但他们如何思考呢?
有一个很自然的方法就是,
去探索人类最深层的想法——
我们的想像力、
意识力、
去梦想——
是否是一样的。
另一种可能是,
去探索造就我们文化的社会变革,
这些变革也许就是
改变人类想法的主要因素。
对这一点,大家或许有不同的看法。
实际上,这是一个存在已久的哲学辩论。
究竟这个问题是否可以
通过科学来处理?
我的建议是
如同仅借由一些砖头,
我们得以重建希腊古都的外貌,
也可用同样的方式,
借由一些文化作品,
比如考古纪录、
化石,来了解人类的想法。
而实际上,
因为对人类的
古老文化书籍做了一些心理分析,
朱利安 杰尼斯在70年代,
发表了一个相当大胆激进的假说:
他说,3000年前的人类,
是我们现在俗称的
“精神分裂症患者”。
他会如此主张的原因是
依据世界各地不同的传统及位置,
这些书籍里面
所描述的人类行为
似乎不约而同地都会服从
他们认为是从神袛
那边传来的声音......
而如今,我们会称之为“幻听”。
随着时间的洗礼,
他们开始认知到
那些声音是他们自己创造的,
他们就是那些内在声音的主人。
有了这样的认知,
他们学会了 “自省”:
一种反思自己想法的能力。
所以杰尼斯对“意识”的理论就是,
至少现今我们觉察到的“意识”、
感觉到我们能掌控
自我人生的感悟——
是相当近代的文化发展。
这理论很有前瞻性,
但一个很明显的问题就是,
它是建立在极少又特殊的案例上。
所以问题是,
3000年来人类才建立起
自省能力的这个理论
是否可以经得起量化且客观的考验。
至于要如何做的问题,
也是相当简单明了。
但我的意思并非,比如,
柏拉图有一天突然醒来写下
“你好!我是柏拉图,
我今天拥有完整的自省意识了。”
那样简单而已。
(笑声)
而这鞥告诉我们,我们要找出
问题的本质是什么。
我们必须找到从来没有被
谈论过的概念。
“自省”这个词,在我们研究的
这些书本中从未出现过一次。
所以为了解决这个问题,
我们要建立一个字词的空间。
在这个大空间里,
包含了所有的词汇,
用这种方式可以衡量
两个词语彼此之间的关联程度。
举个例子,
你会想,“狗”、“猫”是比较相关的词,
但“葡萄柚”和“对数”
就没什么关联了。
而在这个空间里的任何
两个词都必须能以此衡量。
而我们有很多方式
可以建立起这些字的空间架构,
方法一,只要请教专家就行了,
有点类似查字典。
另一个可行的方法是,
当两个字词出现关联性时,
去追踪它们的预设状况,
它们可能会出现在同一句、
同一段落、
或同一文档中,
比偶然出现频繁得多。
在这个简单的前提下,
这个单纯且带有
运算技巧的方法
在这个复杂且高维度的
空间中必须能充分发挥作用,
而事后证明,它相当有效。
向各位介绍一下,它多有效,
我们分析了一些经常用到的词语。
首先你可以看到,
这些词语会自动地划分为
语义相近的相邻群组,
所以你可看到水果,身体部位,
电脑零件与科学术语等等。
演算法也可以把我们要
整理的概念分门别类出来。
举个例子,
你可以看到,科学的术语
被拆解成两个子类,
分别是太空与物理的术语。
然后你会发现一件有趣的事。
举个例子,“天文学”这个词,
它现在的位置看似不太对,
却的确在正确的位置上,
它应该介于科学与
天文学术语之间,
因为天文学是一门科学
同时又包含了很多天文学术语。
我们可以持续寻找其它类似的情况。
如果你盯着这些词一阵子,
然后随机搭配连接一下这些词语,
你会觉得好像自己在做诗。
那是因为在某种程度上,
在这个空间里漫遊,
就像是在脑海中做诗一样。
最后,
演算法也能辨识出人类的直觉,
并归纳到自省的词语范畴中。
举个例子,
比如“自我”、“內疚”、“理由”、“情绪”
与“自省”的含义非常接近,
但其它的词汇,
比如“红色”、“足球”、“蜡烛”、“香蕉”
就差很远了。
所以一旦我们建立起
这样的词汇空间,
有关于自省的历史,
有关与任何概念的历史,
以前被认为是抽象
或是有点模糊的词汇,
都可以变成实实在在的
可以被量化的科学。
而我们要做的就是,
拿起这些书,
把它们数字化,
然后把这些词汇映射到
词汇空间里面,
然后我们问电脑,
这些词汇所经过的轨迹
花了多少时间才接近自省的概念。
有了这些数据,
我们就可以分析古希腊传统中,
有关于自省的历史,
因为我们拥有最完整的文字记录。
所以我们先把这些书——
按照时间排列——
然后把每本书中的词汇都
投射到词语空间里面,
然后我们问电脑,这些字词
与自省有多少的相关性,
再把它们平均起来。
然后,我们不断地问电脑问题,
这些书就会越来越
接近自省的概念。
而这正是当时在古希腊所发生的事。
各位可以看到在
荷马时代最古老的书籍,
与自省的相关性只有一点点。
但在大约在公元前400年左右,
这个数据却快速上涨至五倍,
这些书与自省的概念
越来越接近。
最棒的是,
我们可以问电脑,
在不同的、独立的传统文化中,
是否也有一样的现象。
所以,我们用同样的方法,
分析了传统犹太基督教的书籍,
也得到了类似的趋势。
在最古老的旧约圣经中,
你可以看到它缓慢地增加,
之后在新约圣经中,
它在快速地增长。
大约公元400年,
圣人奥古斯丁的《忏悔录》中
自省的词汇数量达到了最高峰。
这个信息相当重要,
因为圣人奥古斯丁已经被多位学者、
心理学家、历史学家公认为
是自省的创始人之一。
有些人认为他是现代心理学之父。
所以,我们演算法的优点
不仅可以量化,
而且客观,
当然速度也相当快——
几秒就可以跑完——
并捕捉到使用传统方法
必须费长时间调查
才能抓到的一些重点。
这也是科学美好的地方之一,
它可以解读、归纳这想法,
然后广泛应用在许多不同的领域上。
或许最具挑战性的问题是,
我们用电脑来分析过去的
自我意识发展的方法,
是不是也可以告诉我们
自我意识的发展趋势呢?
更确切地说,
我们现在说的话,
是否可以告诉我们接下来的几天、
几个月或几年后,
我们的心智会达到什么情况。
类似的,我们现在很多人
都使用穿戴式侦测器,
可以侦测我们的心跳、
呼吸、
基因,
让我们可以预防疾病,
我们是否可以通过
监控和分析我们所说的话、
发的微博、邮件和书写的文字,
来提前告诉我们,我们的心智
可能要发生问题了?
我跟我的兄弟,
吉列尔莫 切基,
扛起了这项任务。
我们纪录分析了 34 位年轻人的谈话。
他们曾是患精神分裂症的高风险人群。
我们测量了他们第一天的谈话,
然后问电脑,从他们的话中,
是否可以预测出,
未來三年內,
他们会不会患上精神错乱。
但我们大失所望,
一次又一次的失败。
没有足够的语义上的信息
来预测未来的心智发展。
它有能力分辨
精神病患者和健康人,
因为这有点像我们之前
做古文字的分析,
但没办法预测未来精神错乱的发病。
后来我们了解到,
也许最关键的不是他们说了什么,
而是他们怎么说。
进一步说,
不是他们说的话落在哪个
语义相近的群组里,
而是他们说话的方式是否会在这几个
语义相近的群组里快速地跳来跳去。
所以我们想出了一个
叫做“语义连贯性”的评估方法,
本质上就是评估谈话的持续性
是否会落在同一个
语义主题或类别上。
结果显示,刚刚的 34 位年轻人,
通过这个语义连贯性演算法,
预测谁会精神错乱的正确率
达到了百分之百。
目前临床上所有评估方式
都无法达到、
甚至无法接近这个数字。
在我做这项研究的时候,
清楚地记得一件事,
当时我坐在电脑前面,
看到保罗发的一些微博——
他是我之前在布宜诺斯艾利斯市
教书时的第一个学生,
当时他住在纽约。
我发现微博的内容不太对劲——
我看不懂是什么,
因为他写得不太清楚——
但我有一种
强烈的直觉,一定
有什么地方不对劲儿了。
所以我立刻打电话给保罗,
没错,他当时感觉不太舒服。
仅仅通过阅读
他微博的字里行间,
我就可以感受到他的精神健康状态,
阅读别人的用词
的确是个简单有效的帮助方式。
今天我要告诉各位的是,
我们已经越来越能够理解
如何把我们共有的,
共享的直觉
转换成演算法。
通过这样做,
未来我们也许可以看到一种
全然不同的精神健康模式,
是基于一种客观、
量化的方式来自动分析出
我们所写的词汇,
还有我们所说的话。
谢谢。
(掌声)