为什么影视剧里会有那么多的星际物种

恰好都会说一口流利的英语呢？

原因很简单，因为没人希望为了看一部星际舰队

还得花上好几年时间去编译一本外星字典

但为了保证一致性，

星际迷航和其它科幻小说的编导们

就想出了万能翻译机这个点子

一个能够立马能在各种语言间进行翻译的手持设备

你们觉得万能翻译机在现实生活中是可行的吗？

现在已经有很多程序声称

他们能在各种语言间进行翻译

不管是一个字，一句话，一本书

也不管是现代英语还是古梵语

如果翻译仅仅只是在字典上查找字意的话，

这些程序完全能比人类做得更好

但实际上没那么简单

一个基于规则的翻译系统所用的词义数据

包括你能在字典上找到的所有单词

和所有能够使用的语法形态

并且得有一套规则能够区分输入语言的基本语言成分

举个看起来比较简单的例子：孩子们在吃松饼。

翻译程序会先解析这句话的句法或语法结构

通过将“孩子”定为主语

剩下的部分作为谓语

并且包含动词“吃”

和直接宾语“松饼”

或者这段话怎么才能够拆分成几个小词组

就比如说“松饼”这个词

后缀“s” 通常是表示复数

最后一步还需要理解其中的语义学

需要理解这段话中的每个部分都各自表示什么意思

为了恰当地翻译这句话

翻译程序会为将翻译的文本

参照其语言的各个要素词汇和使用规则

但这才是麻烦的地方

在一些语言的句法结构中，文字并没有特定的顺序

而且在有些语言中这句话看起来就像：松饼在吃小孩儿

词态学也是个问题

斯洛文尼亚语中区别通过使用双重后缀缺失

来区分这句话中孩子的数量，两个、三个或者更多

然后俄罗斯人不使用定冠词会让你觉得

这些孩子到底是在吃一些特定的松饼呢

还是一般含义上的松饼

结果是，就算程序翻译出来的语义是正确的

它可能还是会忽略一些细节

就比如说这些孩子到底是在吃松饼

还是在吞松饼？

另一个研究方法是：统计翻译法

这个方法是取分析那些已经被前人翻译过的

书籍、文章和文件的数据库

翻译系统可以通过找到那些不是偶然

和译文恰好匹配的资源

辨识相关的短语和句型

并存以备用

然而这种方式的翻译质量

得根据某些语言或写作风格的

初始数据库

和语库可用性而定

有一些困难，就像一些特例、非常规的事物

和人类本能上的细微区别这样的困难

导致了一些研究人员觉得我们对于语言的理解

是我们大脑生物结构的单一产物

但事实上，最著名的科幻小说通用翻译器

－“巴别塔” 是从“银河系漫游指南”中逐渐分离出来的

这翻译器不完全只是一个机器，而是一个

能以心电感应形式

从有意识生物那儿翻译他们的脑电波和神经信号的小生物

目前为止，用老办法去学一门新的语言

仍然比用目前可用的计算机程序的效果更好

但这也绝非易事，

世界上语言的绝对数量

和其使用者间的相互作用

会刺激自动翻译系统不断进步

也许等到我们遇到星际生命形态的物种时

我们就能够通过一个小发明与他们交流

又或许我们终究得编译那样一套字典。