0:00:06.677,0:00:11.306 Почему это в любом кино или по телевизору[br]пришельцы-инопланетяне 0:00:11.306,0:00:14.483 всегда так хорошо[br]владеют английским языком? 0:00:14.483,0:00:17.886 Если коротко, то потому, что зрителям[br]не интересно, как экипаж корабля 0:00:17.886,0:00:21.774 будет годами [br]составлять словарь пришельцев. 0:00:21.774,0:00:23.392 Но чтобы всё было логично, 0:00:23.392,0:00:26.789 создатели «Звёздного пути»[br]и других фантастических миров 0:00:26.789,0:00:30.514 придумали понятие [br]«универсального переводчика»: 0:00:30.514,0:00:35.012 переносного устройства, которое может[br]мгновенно переводить на разные языки. 0:00:35.012,0:00:38.539 Возможен ли [br]универсальный переводчик в реальности? 0:00:38.539,0:00:42.137 На сегодняшний день есть много программ, [br]чьи создатели утверждают, 0:00:42.137,0:00:45.954 что можно взять на одном языке[br]слово, предложение, целую книгу 0:00:45.954,0:00:49.004 и перевести на почти любой язык, 0:00:49.004,0:00:52.337 будь то современный английский[br]или древний санскрит. 0:00:52.337,0:00:55.913 Если бы при переводе нужно было [br]просто отыскивать слова в словаре, 0:00:55.913,0:00:59.825 то эти программы давно бы [br]за пояс заткнули живых переводчиков. 0:00:59.825,0:01:03.299 Однако в реальности всё намного сложнее. 0:01:03.299,0:01:07.349 Обычная компьютерная программа-переводчик[br]использует базу данных лексических единиц, 0:01:07.349,0:01:10.302 которая включает все слова, [br]содержащиеся в словаре, 0:01:10.302,0:01:13.283 и все грамматические формы,[br]которые они могут принимать, 0:01:13.283,0:01:18.925 а также набор правил, которые определяют [br]базовые языковые элементы исходного языка. 0:01:18.925,0:01:22.396 Казалось бы, в таком простом предложении,[br]например: «Дети едят маффины», 0:01:22.396,0:01:27.050 программа вначале анализирует синтаксис[br]или грамматическую структуру предложения, 0:01:27.050,0:01:29.587 она определяет, что «дети» — это субъект, 0:01:29.587,0:01:32.317 а остаток предложения — его предикат, 0:01:32.317,0:01:34.368 который состоит из глагола «едят» 0:01:34.368,0:01:37.422 и прямого дополнения «маффины». 0:01:37.422,0:01:40.579 Затем ей необходимо вникнуть[br]в английскую морфологическую структуру, 0:01:40.579,0:01:44.681 или как язык можно разбить [br]на небольшие значимые единицы, 0:01:44.681,0:01:46.124 например, корень «маффин» 0:01:46.124,0:01:49.755 и окончание «ы», указывающее на форму[br]множественного числа. 0:01:49.755,0:01:52.449 Наконец, программа [br]должна понять семантику, 0:01:52.449,0:01:56.178 что на самом деле означают[br]различные части предложения. 0:01:56.178,0:01:58.204 Чтобы правильно [br]перевести это предложение, 0:01:58.204,0:02:01.982 программа должна обладать[br]определённым запасом словаря и правил 0:02:01.982,0:02:05.166 для каждого элемента языка перевода. 0:02:05.166,0:02:07.020 А вот здесь-то и кроется подвох. 0:02:07.020,0:02:11.820 Синтаксис некоторых языков допускает[br]свободный порядок слов в предложении, 0:02:11.820,0:02:16.954 зато в других языках подобные перестановки[br]могут означать, что маффины едят детей. 0:02:16.954,0:02:19.647 С морфологией всё тоже не так просто. 0:02:19.647,0:02:23.243 В словенском языке есть различия, [br]едят ли двое детей, трое или более, 0:02:23.243,0:02:27.097 это показывает суффикс парности, [br]отсутствующий во многих других языках. 0:02:27.097,0:02:30.532 В русском языке не существует [br]определённого артикля, отчего непонятно, 0:02:30.532,0:02:33.575 едят ли дети какие-то [br]конкретные маффины в данный момент 0:02:33.575,0:02:36.719 или просто едят маффины вообще. 0:02:36.719,0:02:39.708 Наконец, даже если [br]с семантикой и всё хорошо, 0:02:39.708,0:02:42.757 программа может [br]не понять некоторых тонкостей, 0:02:42.757,0:02:45.809 например, едят ли дети[br]маффины в смысле «mangiano» 0:02:45.809,0:02:47.794 или они их «divorano». 0:02:47.794,0:02:51.558 Вторым методом является [br]статистический машинный перевод, 0:02:51.558,0:02:55.762 который представляет собой анализ[br]баз данных книг, статей, документов, 0:02:55.762,0:02:58.978 которые уже переводились людьми. 0:02:58.978,0:03:01.318 Благодаря тому, [br]что находятся соответствия между 0:03:01.318,0:03:03.419 текстами на исходном языке [br]и языке перевода, 0:03:03.429,0:03:05.683 такие совпадения [br]вряд ли бывают случайными, 0:03:05.683,0:03:09.345 это означает, что программа может[br]выявлять фразы и конструкции 0:03:09.345,0:03:12.429 и использовать их для будущих переводов. 0:03:12.429,0:03:14.969 Однако качество такого типа переводов 0:03:14.969,0:03:17.690 зависит от объёма исходной базы банных 0:03:17.690,0:03:21.357 и наличия образцов [br]для определённых языков 0:03:21.357,0:03:23.383 или стилей письма. 0:03:23.383,0:03:25.603 Трудности, с которыми [br]сталкивается компьютер, 0:03:25.603,0:03:27.850 когда ему попадаются [br]исключения, нарушения норм 0:03:27.850,0:03:30.994 или оттенки значений, [br]которые люди интерпретируют интуитивно, 0:03:30.994,0:03:35.045 заставило некоторых учёных предполагать,[br]что понимание языка людьми — 0:03:35.045,0:03:39.251 это уникальное явление, свойственное[br]биологической структуре нашего мозга. 0:03:39.251,0:03:43.101 Собственно, самый знаменитый [br]фантастический универсальный переводчик 0:03:43.101,0:03:46.439 Вавилонская рыбка из романа [br]«Автостопом по галактике» 0:03:46.439,0:03:49.726 и вовсе не прибор, [br]а крошечное создание, 0:03:49.726,0:03:54.210 переводившее биотоки мозга [br]и нервные сигналы разумных существ 0:03:54.210,0:03:57.005 путём телепатии. 0:03:57.005,0:03:59.726 На сегодняшний день [br]старое доброе изучение другого языка 0:03:59.726,0:04:05.106 по-прежнему результативнее[br]любой из доступных программ-переводчиков. 0:04:05.106,0:04:06.749 Но это не самый лёгкий путь, 0:04:06.749,0:04:09.014 а само число существующих в мире языков, 0:04:09.014,0:04:12.989 а также всё возрастающее число контактов [br]между говорящими на разных языках людьми 0:04:12.989,0:04:18.004 будут только способствовать дальнейшему [br]улучшению машинного перевода. 0:04:18.004,0:04:19.514 Возможно, что к моменту встречи 0:04:19.514,0:04:21.719 с представителями [br]межгалактических цивилизаций 0:04:21.719,0:04:24.660 мы сможем общаться [br]с ними посредством крохотных девайсов, 0:04:24.660,0:04:29.026 или же нам придётся по старинке[br]садиться за составление словаря.