0:00:06.347,0:00:11.306 为什么影视剧里会有那么多的星际物种 0:00:11.306,0:00:14.263 恰好都会说一口流利的英语呢? 0:00:14.263,0:00:17.886 原因很简单,因为没人希望为了看一部星际舰队 0:00:17.886,0:00:21.504 还得花上好几年时间去编译一本外星字典 0:00:21.504,0:00:23.392 但为了保证一致性, 0:00:23.392,0:00:26.789 星际迷航和其它科幻小说的编导们 0:00:26.789,0:00:30.514 就想出了万能翻译机这个点子 0:00:30.514,0:00:35.012 一个能够立马能在各种语言间进行翻译的手持设备 0:00:35.012,0:00:38.539 你们觉得万能翻译机在现实生活中是可行的吗? 0:00:38.539,0:00:42.137 现在已经有很多程序声称 0:00:42.137,0:00:45.954 他们能在各种语言间进行翻译 0:00:45.954,0:00:49.004 不管是一个字,一句话,一本书 0:00:49.004,0:00:52.337 也不管是现代英语还是古梵语 0:00:52.337,0:00:55.913 如果翻译仅仅只是在字典上查找字意的话, 0:00:55.913,0:00:59.825 这些程序完全能比人类做得更好 0:00:59.825,0:01:03.299 但实际上没那么简单 0:01:03.299,0:01:07.349 一个基于规则的翻译系统所用的词义数据 0:01:07.349,0:01:10.302 包括你能在字典上找到的所有单词 0:01:10.302,0:01:13.283 和所有能够使用的语法形态 0:01:13.283,0:01:18.925 并且得有一套规则能够区分输入语言的基本语言成分 0:01:18.925,0:01:22.396 举个看起来比较简单的例子:孩子们在吃松饼。 0:01:22.396,0:01:27.050 翻译程序会先解析这句话的句法或语法结构 0:01:27.050,0:01:29.587 通过将“孩子”定为主语 0:01:29.587,0:01:32.317 剩下的部分作为谓语 0:01:32.317,0:01:34.368 并且包含动词“吃” 0:01:34.368,0:01:37.476 和直接宾语“松饼” 0:01:37.476,0:01:44.499 或者这段话怎么才能够拆分成几个小词组 0:01:44.499,0:01:46.131 就比如说“松饼”这个词 0:01:46.131,0:01:49.832 后缀“s” 通常是表示复数 0:01:49.832,0:01:52.545 最后一步还需要理解其中的语义学 0:01:52.545,0:01:55.609 需要理解这段话中的每个部分都各自表示什么意思 0:01:55.609,0:01:57.898 为了恰当地翻译这句话 0:01:57.898,0:02:00.474 翻译程序会为将翻译的文本 0:02:00.474,0:02:04.902 参照其语言的各个要素词汇和使用规则 0:02:04.902,0:02:06.816 但这才是麻烦的地方 0:02:06.816,0:02:11.710 在一些语言的句法结构中,文字并没有特定的顺序 0:02:11.710,0:02:16.320 而且在有些语言中这句话看起来就像:松饼在吃小孩儿 0:02:16.320,0:02:18.884 词态学也是个问题 0:02:18.884,0:02:21.627 斯洛文尼亚语中区别通过使用双重后缀缺失 0:02:21.627,0:02:26.683 来区分这句话中孩子的数量,两个、三个或者更多 0:02:26.683,0:02:30.197 然后俄罗斯人不使用定冠词会让你觉得 0:02:30.197,0:02:33.325 这些孩子到底是在吃一些特定的松饼呢 0:02:33.325,0:02:36.315 还是一般含义上的松饼 0:02:36.315,0:02:39.849 结果是,就算程序翻译出来的语义是正确的 0:02:39.849,0:02:42.618 它可能还是会忽略一些细节 0:02:42.618,0:02:45.507 就比如说这些孩子到底是在吃松饼 0:02:45.537,0:02:47.544 还是在吞松饼? 0:02:47.544,0:02:51.414 另一个研究方法是:统计翻译法 0:02:51.414,0:02:54.768 这个方法是取分析那些已经被前人翻译过的 0:02:54.768,0:02:59.352 书籍、文章和文件的数据库 0:02:59.352,0:03:04.988 翻译系统可以通过找到那些不是偶然 0:03:04.988,0:03:07.979 和译文恰好匹配的资源 0:03:07.979,0:03:10.243 辨识相关的短语和句型 0:03:10.243,0:03:12.445 并存以备用 0:03:12.445,0:03:15.689 然而这种方式的翻译质量 0:03:15.689,0:03:18.449 得根据某些语言或写作风格的 0:03:18.449,0:03:21.160 初始数据库 0:03:21.160,0:03:23.117 和语库可用性而定 0:03:23.117,0:03:25.723 有一些困难,就像一些特例、非常规的事物 0:03:25.723,0:03:31.000 和人类本能上的细微区别这样的困难 0:03:31.000,0:03:35.114 导致了一些研究人员觉得我们对于语言的理解 0:03:35.114,0:03:38.945 是我们大脑生物结构的单一产物 0:03:38.945,0:03:43.151 但事实上,最著名的科幻小说通用翻译器 0:03:43.151,0:03:47.001 -“巴别塔” 是从“银河系漫游指南”中逐渐分离出来的 0:03:47.001,0:03:50.339 这翻译器不完全只是一个机器,而是一个 0:03:50.339,0:03:53.626 能以心电感应形式 0:03:53.626,0:03:57.050 从有意识生物那儿翻译他们的脑电波和神经信号的小生物 0:03:57.050,0:04:00.135 目前为止,用老办法去学一门新的语言 0:04:00.135,0:04:05.116 仍然比用目前可用的计算机程序的效果更好 0:04:05.116,0:04:07.076 但这也绝非易事, 0:04:07.076,0:04:09.279 世界上语言的绝对数量 0:04:09.279,0:04:12.944 和其使用者间的相互作用 0:04:12.944,0:04:17.739 会刺激自动翻译系统不断进步 0:04:17.739,0:04:21.304 也许等到我们遇到星际生命形态的物种时 0:04:21.304,0:04:25.129 我们就能够通过一个小发明与他们交流 0:04:25.129,0:04:28.880 又或许我们终究得编译那样一套字典。