我如何建造出信息时间旅行机器
-
0:00 - 0:03这是一张地球的图像。
-
0:03 - 0:06看上去很像那非常有名的
-
0:06 - 0:08从阿波罗号上发回的地球图像。
-
0:08 - 0:10但这里的图像又有一些不同的地方;
-
0:10 - 0:11你可以用鼠标点击它,
-
0:11 - 0:13如果你点击了这个图像,
-
0:13 - 0:16你也就可以放大图像中地球上的几乎任何一个地方。
-
0:16 - 0:18举个例子来看,这是一张俯瞰
-
0:18 - 0:20洛桑联邦理工学院校园的图像。
-
0:20 - 0:22通常,你也可以像从附近的街道上一样,
-
0:22 - 0:26看看这里的一座建筑是什么样子的。
-
0:26 - 0:28这非常令人惊叹。
-
0:28 - 0:31但这场绝妙的旅程中似乎又忽略了什么:
-
0:31 - 0:33那便是时间。
-
0:33 - 0:36我不确定这张图片是什么时候拍的;
-
0:36 - 0:38我甚至不确定它是不是
-
0:38 - 0:44和前面俯瞰学院的那张照片一起拍的。
-
0:44 - 0:46在我的实验室里,我们在开发一种
-
0:46 - 0:48能让我们不仅在空间里旅行的,
-
0:48 - 0:50而且在时间中旅行的工具。
-
0:50 - 0:52我们想探讨的问题是
-
0:52 - 0:54我们有没有可能做出一种像
-
0:54 - 0:56关于过去的谷歌地图一样的东西?
-
0:56 - 0:59我能不能在谷歌地图的顶端添加
-
0:59 - 1:01一行可以滑动变化年份的时间条,
-
1:01 - 1:03来看看这里一百年前是什么样子的,
-
1:03 - 1:04一千年前又是什么样子的?
-
1:04 - 1:06这可能吗?
-
1:06 - 1:09我能不能重新构建出过去的社交网络?
-
1:09 - 1:12我能不能做出中世纪的脸书(Facebook)?
-
1:12 - 1:16我,能不能做出时间机器?
-
1:16 - 1:18或许我们可以直接说,“不,这不可能的。”
-
1:18 - 1:22又或许我们可以从信息学的角度来思考这个问题。
-
1:22 - 1:25我把这个东西叫做信息蘑菇。
-
1:25 - 1:27数轴上是年代,
-
1:27 - 1:29横轴上是我们能获得的关于那个年代的数字信息。
-
1:29 - 1:33很显然,我们有非常多的关于过去十年的信息,
-
1:33 - 1:36但在越来越久远的年代,我们能获得的信息也越来越少。
-
1:36 - 1:39如果我们想做类似过去的谷歌地图、
-
1:39 - 1:40过去的脸书(Facebook)这样的东西,
-
1:40 - 1:42我们需要扩大图片中获得的数字信息的区域(橙色部分),
-
1:42 - 1:44我们需要让这块区域变成矩形的形状。
-
1:44 - 1:45那我们该怎么做呢?
-
1:45 - 1:47一种方法是把所有我们能得到的资料数字化,
-
1:47 - 1:49我们手边有很多过去的资料,
-
1:49 - 1:55从报纸到数千的纸质图书。
-
1:55 - 1:57我可以把所有这些资料数字化。
-
1:57 - 2:00我可以从它们之中提取信息。
-
2:00 - 2:04当然,在越来越久远的年代,我们有的资料也越来越少。
-
2:04 - 2:06所以,仅仅这样可能还是不够。
-
2:06 - 2:09但我还可以做一些历史学家做的事情。
-
2:09 - 2:10我可以从拥有的资料信息对未知的那些事实进行推断。
-
2:10 - 2:15在计算机学中我们把这个叫做模拟。
-
2:15 - 2:16如果我有一本航海日志,
-
2:16 - 2:19我可以这么想,这不仅仅是一本
-
2:19 - 2:22关于一个威尼斯船长某次特定航程的航海日志。
-
2:22 - 2:23它可以是一本
-
2:23 - 2:26代表了那个年代很多类似航程的航海日志。
-
2:26 - 2:28我在做的便是一个推断的过程。
-
2:28 - 2:30如果我有一张建筑的照片,
-
2:30 - 2:33我可以认为这不仅仅反映的是那一座特定的建筑的特征,
-
2:33 - 2:37它可能也反映了同时代那些建筑的特征,
-
2:37 - 2:41而那些建筑可能正是我们所知甚少的。
-
2:41 - 2:44如果我们想建成一个时间机器,
-
2:44 - 2:45我们需要两样东西。
-
2:45 - 2:47一方面,我们需要大量的档案,
-
2:47 - 2:50另一方面,我们需要一批杰出的专家。
-
2:50 - 2:52我将和你们介绍的便是
-
2:52 - 2:54威尼斯时间机器项目,
-
2:54 - 2:57这是一个由洛桑联邦理工学院
-
2:57 - 3:00和威尼斯大学合作的项目。
-
3:00 - 3:02关于威尼斯很特别的一点便是,
-
3:02 - 3:05它的管理模式
-
3:05 - 3:07非常的官僚主义。
-
3:07 - 3:09他们几乎记录下这里发生的一切,
-
3:09 - 3:12而这很像今天的谷歌。
-
3:12 - 3:13在威尼斯的国家档案馆,
-
3:13 - 3:15你可以找到80千米长的档案资料,
-
3:15 - 3:17它们记录下了过去一千多年中威尼斯人们
-
3:17 - 3:19生活的方方面面。
-
3:19 - 3:21你可以了解到每一艘
-
3:21 - 3:22出入的小船的信息。
-
3:22 - 3:25你可以了解到这座城市发生的每一丁点儿变化。
-
3:25 - 3:29它们都被记录在那里。
-
3:29 - 3:32我们正在开展一个长达十年的数字化项目,
-
3:32 - 3:34它的目标就是
-
3:34 - 3:35把这些海量的档案信息
-
3:35 - 3:38全部转化成一个巨大的信息系统。
-
3:38 - 3:40要达成这个目标,
-
3:40 - 3:45我们每天要把450本书数字化。
-
3:45 - 3:47当然,仅仅数字化是不够的,
-
3:47 - 3:48这些档案中,
-
3:48 - 3:51很多是用拉丁语、托斯卡纳语、
-
3:51 - 3:52威尼斯方言记录下的。
-
3:52 - 3:54所以你需要转写它们,
-
3:54 - 3:56一些情况下你需要翻译它们,
-
3:56 - 3:57你需要将它们编入索引,
-
3:57 - 3:59而这显然不是件容易的事情。
-
3:59 - 4:03尤其要指出的是,传统的光学字符识别方法
-
4:03 - 4:04虽然对于印刷本可以使用且非常有效,
-
4:04 - 4:08但对于这些手写的档案似乎并不太行之有效。
-
4:08 - 4:10我们的解决方案是从语音识别这个领域
-
4:10 - 4:13寻找一些启发。
-
4:13 - 4:15这个领域看上去做的是一些不可能完成的事情,
-
4:15 - 4:18但其实只要加上一些限制条件,
-
4:18 - 4:20它们完全是可以做到的。
-
4:20 - 4:22如果你有一个关于被使用的语言的
-
4:22 - 4:23很好的模型;
-
4:23 - 4:25如果你有一个关于一份条理清晰的
-
4:25 - 4:27档案的很好的模型,
-
4:27 - 4:28这便是那些行政管理的档案文献,
-
4:28 - 4:30它们通常都有很好的条理;
-
4:30 - 4:33如果你把这些海量的档案划分成一些小的部分,
-
4:33 - 4:36其中每一个部分都和其他部分有相近的特征,
-
4:36 - 4:40那么我们便有成功的机会。
-
4:43 - 4:45如果我们到了那个阶段,我们便可以做一些别的事情:
-
4:45 - 4:49我们可以从这些档案文献中提取事件。
-
4:49 - 4:51实际上大概一百亿件事件
-
4:51 - 4:53可以从这些档案中提取出来。
-
4:53 - 4:55而这巨大的信息系统
-
4:55 - 4:56又可以被很多种方法搜索。
-
4:56 - 4:58你可以问这样的问题,
-
4:58 - 5:01“1323年的时候,谁住在这个宫殿里?”
-
5:01 - 5:03“1434年的时候,里亚托的一个集市里,
-
5:03 - 5:05海鲷卖多少钱?
-
5:05 - 5:06“穆拉诺岛的一个玻璃工人
-
5:06 - 5:08大约十多年前的工资
-
5:08 - 5:09是多少?”
-
5:09 - 5:11因为这些信息会被用语义编码,
-
5:11 - 5:14你又可以问一些更宏大的问题。
-
5:14 - 5:16然后我们便需要把这些存在于空间中的信息
-
5:16 - 5:18放回到它们原来的空间中去。
-
5:18 - 5:20这样,我们便可以
-
5:20 - 5:22重新构建出这场令人惊叹的关于这座城市的旅程,
-
5:22 - 5:25让它能有一个持续的、
-
5:25 - 5:27超过数千年的发展过程,
-
5:27 - 5:29能让所有的时间
-
5:29 - 5:32和它所在的空间环境达到一种平衡状态。
-
5:32 - 5:33我们可以重新建构这场旅行,
-
5:33 - 5:36用不同的方法将它图像化。
-
5:36 - 5:39但当然,如果我们仅仅考察威尼斯这一座城市,我们便不能做到完全理解它
-
5:39 - 5:41我们需要把它放到更大的欧洲的背景下去观察研究。
-
5:41 - 5:44这便意味着我们需要记录下
-
5:44 - 5:46在欧洲层面上发生的所有事情。
-
5:46 - 5:48我们也可以重新建构
-
5:48 - 5:50威尼斯海上帝国时期的旅程,
-
5:50 - 5:54看它如何一步步控制了亚得里亚海,
-
5:54 - 5:57看它如何变成那个时代
-
5:57 - 5:59最强大的中世纪帝国,
-
5:59 - 6:01它如何几乎控制了从东到南的
-
6:01 - 6:04所有海上航线。
-
6:05 - 6:08同时,因为这些海上航线
-
6:08 - 6:10有着自己的模式和规律,
-
6:10 - 6:12我们甚至可以做一些别的事情。
-
6:12 - 6:14我们可以更进一步,
-
6:14 - 6:17创造出一个模拟系统,
-
6:17 - 6:19模拟出地中海区域的历史,
-
6:19 - 6:22这能让我们甚至重建出
-
6:22 - 6:24我们丢失的信息,
-
6:24 - 6:27能让我们回答出一些别的问题。
-
6:27 - 6:30比如如果你在进行路线规划,你想问,
-
6:30 - 6:33“如果我在1323年6月科孚岛,
-
6:33 - 6:36想前往君士坦丁堡,
-
6:36 - 6:38我能在哪里找到船?”
-
6:38 - 6:39或许我们可以在当时的两三天的精确度内
-
6:39 - 6:44回答这个问题。
-
6:44 - 6:45“它需要多少钱?”
-
6:45 - 6:49“遇到海盗的几率有多少?”
-
6:49 - 6:51当然,你也应该理解,
-
6:51 - 6:53对于这样一个项目,最核心的科学性质疑便是
-
6:53 - 6:57能否量化出
-
6:57 - 7:00它每一步中的不确定性和不一致性。
-
7:00 - 7:03因为到处都有错误,
-
7:03 - 7:06档案中有错误,或许是船长的名字错了,
-
7:06 - 7:09或许是有一些小船从来没有出过海,
-
7:09 - 7:14翻译中也有错误,我们的解释可能有偏差,
-
7:14 - 7:17最关键的是,如果我们加上算法的过程,
-
7:17 - 7:20我们将会在信息识别、
-
7:20 - 7:22信息提取中都存在错误,
-
7:22 - 7:26这样我们拥有的便是非常不确定的信息资料。
-
7:26 - 7:30那我们如何发现并纠正这些偏差呢?
-
7:30 - 7:34我们如何表示出这种不确定性呢?
-
7:34 - 7:36这是非常困难的,我们能做的
-
7:36 - 7:38便是记录下我们过程中的每一步,
-
7:38 - 7:41这不仅仅是翻译出那些历史信息,
-
7:41 - 7:43而且是翻译出那些我们叫做元历史的信息,
-
7:43 - 7:46关于那些历史是如何构建的,
-
7:46 - 7:48我们要记录下每一步。
-
7:48 - 7:50这当然不会保证我们真的能汇聚出
-
7:50 - 7:52关于威尼斯的最可靠的过去,
-
7:52 - 7:54但或许我们真的能重建出
-
7:54 - 7:57一个可能的威尼斯的过去。
-
7:57 - 7:59也许不仅仅有一张地图,
-
7:59 - 8:01也许有很多张地图。
-
8:01 - 8:03这个系统应该承认并接受这些事实,
-
8:03 - 8:06因为我们必须要面对并处理这种新的不确定性,
-
8:06 - 8:11它对于我们这种巨大的数据库而言确实是非常新的。
-
8:11 - 8:13然后,我们应该怎样
-
8:13 - 8:17和更多的人交流我们这项全新的研究呢?
-
8:17 - 8:19再一次地,威尼斯在这里非常地特别,它有自己的优势。
-
8:19 - 8:22在威尼斯每年有数百万的游客前来观光,
-
8:22 - 8:23这使它实际上变成了
-
8:23 - 8:26构建出未来博物馆的最佳的选择之一。
-
8:26 - 8:30想象一下,在横轴上你看到某个特定年份的
-
8:30 - 8:31重新组织建构好的地图,
-
8:31 - 8:34在竖轴上,你看到完成这一重建的
-
8:34 - 8:35档案资料,
-
8:35 - 8:39比如说绘画作品。
-
8:39 - 8:41想象一下,这样一个身临其境的系统
-
8:41 - 8:45能让你深入到威尼斯的每一个特定年份去体验,
-
8:45 - 8:48这显然是你应该和他人分享的经历。
-
8:48 - 8:50另一方面,实际上你体验的这一切
-
8:50 - 8:52都是从一份档案、一份威尼斯的手稿出发构建的,
-
8:52 - 8:55你看到你能从那些档案资料中得到什么,
-
8:55 - 8:57它们是如何被解读出来的,
-
8:57 - 8:59那些档案中的内容又是如何被重现的。
-
8:59 - 9:01这便是这样一件展览品的概念,
-
9:01 - 9:03而它现在正在和这种信息系统一起
-
9:03 - 9:06在日内瓦进行着。
-
9:06 - 9:08总而言之,我们可以说
-
9:08 - 9:11现在研究人类相关的人文学很像
-
9:11 - 9:1330多年前在生命科学领域
-
9:13 - 9:17发生的一场革命性的变化。
-
9:17 - 9:22这真的是个规模的问题。
-
9:22 - 9:25我们看到很多项目,
-
9:25 - 9:29它们在做的远远超过任何一个单一的研究小组,
-
9:29 - 9:32这对人文学者来说确实是非常新颖的,
-
9:32 - 9:35因为他们通常适应于
-
9:35 - 9:39在小的团队里工作或仅仅和一些研究者一起工作。
-
9:39 - 9:42当你参观威尼斯国家档案馆的时候,
-
9:42 - 9:44你会觉得这远远超过了任何一个团队能做的事情,
-
9:44 - 9:48那应该是共同努力的结果。
-
9:48 - 9:51所以应对这种模式的转换
-
9:51 - 9:53我们应该培养出新的一代人,
-
9:53 - 9:55他们便是“数字人文主义者”,
-
9:55 - 9:57他们应该能准备好迎接这种转变。
-
9:57 - 9:59非常感谢。
-
9:59 - 10:03(鼓掌)
- Title:
- 我如何建造出信息时间旅行机器
- Speaker:
- 弗雷德里克·开普兰(Frederic Kaplan)
- Description:
-
想象一下,如果你能……浏览中世纪的脸书(Facebook)?可能这个想法并不像它听起来那么遥不可及。在这个有趣的演讲中,弗雷德里克·开普兰(Frederic Kaplan)身为一位研究学者和工程师,向我们介绍了威尼斯时间机器项目。这个项目要把80千米长的书籍资料数字化,来创造模拟出威尼斯过去数千年的历史。(摄于TED威尼斯)
- Video Language:
- English
- Team:
- closed TED
- Project:
- TEDTalks
- Duration:
- 10:20
Tony Yet approved Chinese, Simplified subtitles for How to build an information time machine | ||
Neo Liu accepted Chinese, Simplified subtitles for How to build an information time machine | ||
Li Yang edited Chinese, Simplified subtitles for How to build an information time machine | ||
Li Yang edited Chinese, Simplified subtitles for How to build an information time machine | ||
Li Yang edited Chinese, Simplified subtitles for How to build an information time machine | ||
Li Yang edited Chinese, Simplified subtitles for How to build an information time machine | ||
Li Yang edited Chinese, Simplified subtitles for How to build an information time machine | ||
Li Yang edited Chinese, Simplified subtitles for How to build an information time machine |