Return to Video

我如何建造出信息时间旅行机器

  • 0:00 - 0:03
    这是一张地球的图像。
  • 0:03 - 0:06
    看上去很像那非常有名的
  • 0:06 - 0:08
    从阿波罗号上发回的地球图像。
  • 0:08 - 0:10
    但这里的图像又有一些不同的地方;
  • 0:10 - 0:11
    你可以用鼠标点击它,
  • 0:11 - 0:13
    如果你点击了这个图像,
  • 0:13 - 0:16
    你也就可以放大图像中地球上的几乎任何一个地方。
  • 0:16 - 0:18
    举个例子来看,这是一张俯瞰
  • 0:18 - 0:20
    洛桑联邦理工学院校园的图像。
  • 0:20 - 0:22
    通常,你也可以像从附近的街道上一样,
  • 0:22 - 0:26
    看看这里的一座建筑是什么样子的。
  • 0:26 - 0:28
    这非常令人惊叹。
  • 0:28 - 0:31
    但这场绝妙的旅程中似乎又忽略了什么:
  • 0:31 - 0:33
    那便是时间。
  • 0:33 - 0:36
    我不确定这张图片是什么时候拍的;
  • 0:36 - 0:38
    我甚至不确定它是不是
  • 0:38 - 0:44
    和前面俯瞰学院的那张照片一起拍的。
  • 0:44 - 0:46
    在我的实验室里,我们在开发一种
  • 0:46 - 0:48
    能让我们不仅在空间里旅行的,
  • 0:48 - 0:50
    而且在时间中旅行的工具。
  • 0:50 - 0:52
    我们想探讨的问题是
  • 0:52 - 0:54
    我们有没有可能做出一种像
  • 0:54 - 0:56
    关于过去的谷歌地图一样的东西?
  • 0:56 - 0:59
    我能不能在谷歌地图的顶端添加
  • 0:59 - 1:01
    一行可以滑动变化年份的时间条,
  • 1:01 - 1:03
    来看看这里一百年前是什么样子的,
  • 1:03 - 1:04
    一千年前又是什么样子的?
  • 1:04 - 1:06
    这可能吗?
  • 1:06 - 1:09
    我能不能重新构建出过去的社交网络?
  • 1:09 - 1:12
    我能不能做出中世纪的脸书(Facebook)?
  • 1:12 - 1:16
    我,能不能做出时间机器?
  • 1:16 - 1:18
    或许我们可以直接说,“不,这不可能的。”
  • 1:18 - 1:22
    又或许我们可以从信息学的角度来思考这个问题。
  • 1:22 - 1:25
    我把这个东西叫做信息蘑菇。
  • 1:25 - 1:27
    数轴上是年代,
  • 1:27 - 1:29
    横轴上是我们能获得的关于那个年代的数字信息。
  • 1:29 - 1:33
    很显然,我们有非常多的关于过去十年的信息,
  • 1:33 - 1:36
    但在越来越久远的年代,我们能获得的信息也越来越少。
  • 1:36 - 1:39
    如果我们想做类似过去的谷歌地图、
  • 1:39 - 1:40
    过去的脸书(Facebook)这样的东西,
  • 1:40 - 1:42
    我们需要扩大图片中获得的数字信息的区域(橙色部分),
  • 1:42 - 1:44
    我们需要让这块区域变成矩形的形状。
  • 1:44 - 1:45
    那我们该怎么做呢?
  • 1:45 - 1:47
    一种方法是把所有我们能得到的资料数字化,
  • 1:47 - 1:49
    我们手边有很多过去的资料,
  • 1:49 - 1:55
    从报纸到数千的纸质图书。
  • 1:55 - 1:57
    我可以把所有这些资料数字化。
  • 1:57 - 2:00
    我可以从它们之中提取信息。
  • 2:00 - 2:04
    当然,在越来越久远的年代,我们有的资料也越来越少。
  • 2:04 - 2:06
    所以,仅仅这样可能还是不够。
  • 2:06 - 2:09
    但我还可以做一些历史学家做的事情。
  • 2:09 - 2:10
    我可以从拥有的资料信息对未知的那些事实进行推断。
  • 2:10 - 2:15
    在计算机学中我们把这个叫做模拟。
  • 2:15 - 2:16
    如果我有一本航海日志,
  • 2:16 - 2:19
    我可以这么想,这不仅仅是一本
  • 2:19 - 2:22
    关于一个威尼斯船长某次特定航程的航海日志。
  • 2:22 - 2:23
    它可以是一本
  • 2:23 - 2:26
    代表了那个年代很多类似航程的航海日志。
  • 2:26 - 2:28
    我在做的便是一个推断的过程。
  • 2:28 - 2:30
    如果我有一张建筑的照片,
  • 2:30 - 2:33
    我可以认为这不仅仅反映的是那一座特定的建筑的特征,
  • 2:33 - 2:37
    它可能也反映了同时代那些建筑的特征,
  • 2:37 - 2:41
    而那些建筑可能正是我们所知甚少的。
  • 2:41 - 2:44
    如果我们想建成一个时间机器,
  • 2:44 - 2:45
    我们需要两样东西。
  • 2:45 - 2:47
    一方面,我们需要大量的档案,
  • 2:47 - 2:50
    另一方面,我们需要一批杰出的专家。
  • 2:50 - 2:52
    我将和你们介绍的便是
  • 2:52 - 2:54
    威尼斯时间机器项目,
  • 2:54 - 2:57
    这是一个由洛桑联邦理工学院
  • 2:57 - 3:00
    和威尼斯大学合作的项目。
  • 3:00 - 3:02
    关于威尼斯很特别的一点便是,
  • 3:02 - 3:05
    它的管理模式
  • 3:05 - 3:07
    非常的官僚主义。
  • 3:07 - 3:09
    他们几乎记录下这里发生的一切,
  • 3:09 - 3:12
    而这很像今天的谷歌。
  • 3:12 - 3:13
    在威尼斯的国家档案馆,
  • 3:13 - 3:15
    你可以找到80千米长的档案资料,
  • 3:15 - 3:17
    它们记录下了过去一千多年中威尼斯人们
  • 3:17 - 3:19
    生活的方方面面。
  • 3:19 - 3:21
    你可以了解到每一艘
  • 3:21 - 3:22
    出入的小船的信息。
  • 3:22 - 3:25
    你可以了解到这座城市发生的每一丁点儿变化。
  • 3:25 - 3:29
    它们都被记录在那里。
  • 3:29 - 3:32
    我们正在开展一个长达十年的数字化项目,
  • 3:32 - 3:34
    它的目标就是
  • 3:34 - 3:35
    把这些海量的档案信息
  • 3:35 - 3:38
    全部转化成一个巨大的信息系统。
  • 3:38 - 3:40
    要达成这个目标,
  • 3:40 - 3:45
    我们每天要把450本书数字化。
  • 3:45 - 3:47
    当然,仅仅数字化是不够的,
  • 3:47 - 3:48
    这些档案中,
  • 3:48 - 3:51
    很多是用拉丁语、托斯卡纳语、
  • 3:51 - 3:52
    威尼斯方言记录下的。
  • 3:52 - 3:54
    所以你需要转写它们,
  • 3:54 - 3:56
    一些情况下你需要翻译它们,
  • 3:56 - 3:57
    你需要将它们编入索引,
  • 3:57 - 3:59
    而这显然不是件容易的事情。
  • 3:59 - 4:03
    尤其要指出的是,传统的光学字符识别方法
  • 4:03 - 4:04
    虽然对于印刷本可以使用且非常有效,
  • 4:04 - 4:08
    但对于这些手写的档案似乎并不太行之有效。
  • 4:08 - 4:10
    我们的解决方案是从语音识别这个领域
  • 4:10 - 4:13
    寻找一些启发。
  • 4:13 - 4:15
    这个领域看上去做的是一些不可能完成的事情,
  • 4:15 - 4:18
    但其实只要加上一些限制条件,
  • 4:18 - 4:20
    它们完全是可以做到的。
  • 4:20 - 4:22
    如果你有一个关于被使用的语言的
  • 4:22 - 4:23
    很好的模型;
  • 4:23 - 4:25
    如果你有一个关于一份条理清晰的
  • 4:25 - 4:27
    档案的很好的模型,
  • 4:27 - 4:28
    这便是那些行政管理的档案文献,
  • 4:28 - 4:30
    它们通常都有很好的条理;
  • 4:30 - 4:33
    如果你把这些海量的档案划分成一些小的部分,
  • 4:33 - 4:36
    其中每一个部分都和其他部分有相近的特征,
  • 4:36 - 4:40
    那么我们便有成功的机会。
  • 4:43 - 4:45
    如果我们到了那个阶段,我们便可以做一些别的事情:
  • 4:45 - 4:49
    我们可以从这些档案文献中提取事件。
  • 4:49 - 4:51
    实际上大概一百亿件事件
  • 4:51 - 4:53
    可以从这些档案中提取出来。
  • 4:53 - 4:55
    而这巨大的信息系统
  • 4:55 - 4:56
    又可以被很多种方法搜索。
  • 4:56 - 4:58
    你可以问这样的问题,
  • 4:58 - 5:01
    “1323年的时候,谁住在这个宫殿里?”
  • 5:01 - 5:03
    “1434年的时候,里亚托的一个集市里,
  • 5:03 - 5:05
    海鲷卖多少钱?
  • 5:05 - 5:06
    “穆拉诺岛的一个玻璃工人
  • 5:06 - 5:08
    大约十多年前的工资
  • 5:08 - 5:09
    是多少?”
  • 5:09 - 5:11
    因为这些信息会被用语义编码,
  • 5:11 - 5:14
    你又可以问一些更宏大的问题。
  • 5:14 - 5:16
    然后我们便需要把这些存在于空间中的信息
  • 5:16 - 5:18
    放回到它们原来的空间中去。
  • 5:18 - 5:20
    这样,我们便可以
  • 5:20 - 5:22
    重新构建出这场令人惊叹的关于这座城市的旅程,
  • 5:22 - 5:25
    让它能有一个持续的、
  • 5:25 - 5:27
    超过数千年的发展过程,
  • 5:27 - 5:29
    能让所有的时间
  • 5:29 - 5:32
    和它所在的空间环境达到一种平衡状态。
  • 5:32 - 5:33
    我们可以重新建构这场旅行,
  • 5:33 - 5:36
    用不同的方法将它图像化。
  • 5:36 - 5:39
    但当然,如果我们仅仅考察威尼斯这一座城市,我们便不能做到完全理解它
  • 5:39 - 5:41
    我们需要把它放到更大的欧洲的背景下去观察研究。
  • 5:41 - 5:44
    这便意味着我们需要记录下
  • 5:44 - 5:46
    在欧洲层面上发生的所有事情。
  • 5:46 - 5:48
    我们也可以重新建构
  • 5:48 - 5:50
    威尼斯海上帝国时期的旅程,
  • 5:50 - 5:54
    看它如何一步步控制了亚得里亚海,
  • 5:54 - 5:57
    看它如何变成那个时代
  • 5:57 - 5:59
    最强大的中世纪帝国,
  • 5:59 - 6:01
    它如何几乎控制了从东到南的
  • 6:01 - 6:04
    所有海上航线。
  • 6:05 - 6:08
    同时,因为这些海上航线
  • 6:08 - 6:10
    有着自己的模式和规律,
  • 6:10 - 6:12
    我们甚至可以做一些别的事情。
  • 6:12 - 6:14
    我们可以更进一步,
  • 6:14 - 6:17
    创造出一个模拟系统,
  • 6:17 - 6:19
    模拟出地中海区域的历史,
  • 6:19 - 6:22
    这能让我们甚至重建出
  • 6:22 - 6:24
    我们丢失的信息,
  • 6:24 - 6:27
    能让我们回答出一些别的问题。
  • 6:27 - 6:30
    比如如果你在进行路线规划,你想问,
  • 6:30 - 6:33
    “如果我在1323年6月科孚岛,
  • 6:33 - 6:36
    想前往君士坦丁堡,
  • 6:36 - 6:38
    我能在哪里找到船?”
  • 6:38 - 6:39
    或许我们可以在当时的两三天的精确度内
  • 6:39 - 6:44
    回答这个问题。
  • 6:44 - 6:45
    “它需要多少钱?”
  • 6:45 - 6:49
    “遇到海盗的几率有多少?”
  • 6:49 - 6:51
    当然,你也应该理解,
  • 6:51 - 6:53
    对于这样一个项目,最核心的科学性质疑便是
  • 6:53 - 6:57
    能否量化出
  • 6:57 - 7:00
    它每一步中的不确定性和不一致性。
  • 7:00 - 7:03
    因为到处都有错误,
  • 7:03 - 7:06
    档案中有错误,或许是船长的名字错了,
  • 7:06 - 7:09
    或许是有一些小船从来没有出过海,
  • 7:09 - 7:14
    翻译中也有错误,我们的解释可能有偏差,
  • 7:14 - 7:17
    最关键的是,如果我们加上算法的过程,
  • 7:17 - 7:20
    我们将会在信息识别、
  • 7:20 - 7:22
    信息提取中都存在错误,
  • 7:22 - 7:26
    这样我们拥有的便是非常不确定的信息资料。
  • 7:26 - 7:30
    那我们如何发现并纠正这些偏差呢?
  • 7:30 - 7:34
    我们如何表示出这种不确定性呢?
  • 7:34 - 7:36
    这是非常困难的,我们能做的
  • 7:36 - 7:38
    便是记录下我们过程中的每一步,
  • 7:38 - 7:41
    这不仅仅是翻译出那些历史信息,
  • 7:41 - 7:43
    而且是翻译出那些我们叫做元历史的信息,
  • 7:43 - 7:46
    关于那些历史是如何构建的,
  • 7:46 - 7:48
    我们要记录下每一步。
  • 7:48 - 7:50
    这当然不会保证我们真的能汇聚出
  • 7:50 - 7:52
    关于威尼斯的最可靠的过去,
  • 7:52 - 7:54
    但或许我们真的能重建出
  • 7:54 - 7:57
    一个可能的威尼斯的过去。
  • 7:57 - 7:59
    也许不仅仅有一张地图,
  • 7:59 - 8:01
    也许有很多张地图。
  • 8:01 - 8:03
    这个系统应该承认并接受这些事实,
  • 8:03 - 8:06
    因为我们必须要面对并处理这种新的不确定性,
  • 8:06 - 8:11
    它对于我们这种巨大的数据库而言确实是非常新的。
  • 8:11 - 8:13
    然后,我们应该怎样
  • 8:13 - 8:17
    和更多的人交流我们这项全新的研究呢?
  • 8:17 - 8:19
    再一次地,威尼斯在这里非常地特别,它有自己的优势。
  • 8:19 - 8:22
    在威尼斯每年有数百万的游客前来观光,
  • 8:22 - 8:23
    这使它实际上变成了
  • 8:23 - 8:26
    构建出未来博物馆的最佳的选择之一。
  • 8:26 - 8:30
    想象一下,在横轴上你看到某个特定年份的
  • 8:30 - 8:31
    重新组织建构好的地图,
  • 8:31 - 8:34
    在竖轴上,你看到完成这一重建的
  • 8:34 - 8:35
    档案资料,
  • 8:35 - 8:39
    比如说绘画作品。
  • 8:39 - 8:41
    想象一下,这样一个身临其境的系统
  • 8:41 - 8:45
    能让你深入到威尼斯的每一个特定年份去体验,
  • 8:45 - 8:48
    这显然是你应该和他人分享的经历。
  • 8:48 - 8:50
    另一方面,实际上你体验的这一切
  • 8:50 - 8:52
    都是从一份档案、一份威尼斯的手稿出发构建的,
  • 8:52 - 8:55
    你看到你能从那些档案资料中得到什么,
  • 8:55 - 8:57
    它们是如何被解读出来的,
  • 8:57 - 8:59
    那些档案中的内容又是如何被重现的。
  • 8:59 - 9:01
    这便是这样一件展览品的概念,
  • 9:01 - 9:03
    而它现在正在和这种信息系统一起
  • 9:03 - 9:06
    在日内瓦进行着。
  • 9:06 - 9:08
    总而言之,我们可以说
  • 9:08 - 9:11
    现在研究人类相关的人文学很像
  • 9:11 - 9:13
    30多年前在生命科学领域
  • 9:13 - 9:17
    发生的一场革命性的变化。
  • 9:17 - 9:22
    这真的是个规模的问题。
  • 9:22 - 9:25
    我们看到很多项目,
  • 9:25 - 9:29
    它们在做的远远超过任何一个单一的研究小组,
  • 9:29 - 9:32
    这对人文学者来说确实是非常新颖的,
  • 9:32 - 9:35
    因为他们通常适应于
  • 9:35 - 9:39
    在小的团队里工作或仅仅和一些研究者一起工作。
  • 9:39 - 9:42
    当你参观威尼斯国家档案馆的时候,
  • 9:42 - 9:44
    你会觉得这远远超过了任何一个团队能做的事情,
  • 9:44 - 9:48
    那应该是共同努力的结果。
  • 9:48 - 9:51
    所以应对这种模式的转换
  • 9:51 - 9:53
    我们应该培养出新的一代人,
  • 9:53 - 9:55
    他们便是“数字人文主义者”,
  • 9:55 - 9:57
    他们应该能准备好迎接这种转变。
  • 9:57 - 9:59
    非常感谢。
  • 9:59 - 10:03
    (鼓掌)
Title:
我如何建造出信息时间旅行机器
Speaker:
弗雷德里克·开普兰(Frederic Kaplan)
Description:

想象一下,如果你能……浏览中世纪的脸书(Facebook)?可能这个想法并不像它听起来那么遥不可及。在这个有趣的演讲中,弗雷德里克·开普兰(Frederic Kaplan)身为一位研究学者和工程师,向我们介绍了威尼斯时间机器项目。这个项目要把80千米长的书籍资料数字化,来创造模拟出威尼斯过去数千年的历史。(摄于TED威尼斯)

more » « less
Video Language:
English
Team:
closed TED
Project:
TEDTalks
Duration:
10:20

Chinese, Simplified subtitles

Revisions