Почему это в любом кино или по телевизору пришельцы-инопланетяне всегда так хорошо владеют английским языком? Если коротко, то потому, что зрителям не интересно, как экипаж корабля будет годами составлять словарь пришельцев. Но чтобы всё было логично, создатели «Звёздного пути» и других фантастических миров придумали понятие «универсального переводчика»: переносного устройства, которое может мгновенно переводить на разные языки. Возможен ли универсальный переводчик в реальности? На сегодняшний день есть много программ, чьи создатели утверждают, что можно взять на одном языке слово, предложение, целую книгу и перевести на почти любой язык, будь то современный английский или древний санскрит. Если бы при переводе нужно было просто отыскивать слова в словаре, то эти программы давно бы за пояс заткнули живых переводчиков. Однако в реальности всё намного сложнее. Обычная компьютерная программа-переводчик использует базу данных лексических единиц, которая включает все слова, содержащиеся в словаре, и все грамматические формы, которые они могут принимать, а также набор правил, которые определяют базовые языковые элементы исходного языка. Казалось бы, в таком простом предложении, например: «Дети едят маффины», программа вначале анализирует синтаксис или грамматическую структуру предложения, она определяет, что «дети» — это субъект, а остаток предложения — его предикат, который состоит из глагола «едят» и прямого дополнения «маффины». Затем ей необходимо вникнуть в английскую морфологическую структуру, или как язык можно разбить на небольшие значимые единицы, например, корень «маффин» и окончание «ы», указывающее на форму множественного числа. Наконец, программа должна понять семантику, что на самом деле означают различные части предложения. Чтобы правильно перевести это предложение, программа должна обладать определённым запасом словаря и правил для каждого элемента языка перевода. А вот здесь-то и кроется подвох. Синтаксис некоторых языков допускает свободный порядок слов в предложении, зато в других языках подобные перестановки могут означать, что маффины едят детей. С морфологией всё тоже не так просто. В словенском языке есть различия, едят ли двое детей, трое или более, это показывает суффикс парности, отсутствующий во многих других языках. В русском языке не существует определённого артикля, отчего непонятно, едят ли дети какие-то конкретные маффины в данный момент или просто едят маффины вообще. Наконец, даже если с семантикой и всё хорошо, программа может не понять некоторых тонкостей, например, едят ли дети маффины в смысле «mangiano» или они их «divorano». Вторым методом является статистический машинный перевод, который представляет собой анализ баз данных книг, статей, документов, которые уже переводились людьми. Благодаря тому, что находятся соответствия между текстами на исходном языке и языке перевода, такие совпадения вряд ли бывают случайными, это означает, что программа может выявлять фразы и конструкции и использовать их для будущих переводов. Однако качество такого типа переводов зависит от объёма исходной базы банных и наличия образцов для определённых языков или стилей письма. Трудности, с которыми сталкивается компьютер, когда ему попадаются исключения, нарушения норм или оттенки значений, которые люди интерпретируют интуитивно, заставило некоторых учёных предполагать, что понимание языка людьми — это уникальное явление, свойственное биологической структуре нашего мозга. Собственно, самый знаменитый фантастический универсальный переводчик Вавилонская рыбка из романа «Автостопом по галактике» и вовсе не прибор, а крошечное создание, переводившее биотоки мозга и нервные сигналы разумных существ путём телепатии. На сегодняшний день старое доброе изучение другого языка по-прежнему результативнее любой из доступных программ-переводчиков. Но это не самый лёгкий путь, а само число существующих в мире языков, а также всё возрастающее число контактов между говорящими на разных языках людьми будут только способствовать дальнейшему улучшению машинного перевода. Возможно, что к моменту встречи с представителями межгалактических цивилизаций мы сможем общаться с ними посредством крохотных девайсов, или же нам придётся по старинке садиться за составление словаря.