WEBVTT 00:00:06.677 --> 00:00:11.306 Як так сталося, що більшість прибульців у кіно та на телебаченні 00:00:11.306 --> 00:00:14.483 чудово розмовляють англійською? 00:00:14.483 --> 00:00:16.816 Кажучи відверто, ніхто не захоче дивитися, 00:00:16.816 --> 00:00:21.464 як екіпаж космічного корабля роками складає словник інопланетної мови. 00:00:21.464 --> 00:00:23.332 Але, щоб усе було логічно, 00:00:23.332 --> 00:00:26.789 творці серіалу "Зоряний шлях" та багатьох інших вигаданих світів 00:00:26.789 --> 00:00:30.514 запропонували концепцію універсального перекладача: 00:00:30.514 --> 00:00:34.442 портативного пристрою, котрий може миттєво здійснювати переклад. 00:00:34.442 --> 00:00:38.429 Та чи насправді можливе існування універсального перекладача? 00:00:38.429 --> 00:00:42.097 У нас вже є багато програм, котрі ніби можуть це робити: 00:00:42.097 --> 00:00:45.954 перекладати слово, речення чи цілу книгу з однієї мови 00:00:45.954 --> 00:00:49.424 майже на будь яку іншу, незважаючи на те, 00:00:49.424 --> 00:00:52.227 чи це сучасна англійська мова, чи давній санскрит. 00:00:52.227 --> 00:00:55.913 Якби переклад полягав лише у пошуку відповідного слова у словнику, 00:00:55.913 --> 00:00:59.685 то ці програми вже давно перевершили б перекладачів - людей. 00:00:59.685 --> 00:01:03.299 Насправді ж, все дещо складніше. 00:01:03.299 --> 00:01:07.349 Перекладацька програма, базована на правилах, використовує лексичну базу даних, 00:01:07.349 --> 00:01:10.302 до якої включено усі слова, котрі можна знайти у словнику 00:01:10.302 --> 00:01:13.283 і усі варіанти граматичних форм, котрих вони можуть набувати, 00:01:13.283 --> 00:01:18.825 а також ряд правил, аби розпізнати основні лінгвістичні елементи вихідної мови. 00:01:18.825 --> 00:01:22.396 Для, здавалося б, простого речення як "Діти їдять кекси" 00:01:22.396 --> 00:01:27.050 программа спершу аналізує його синтаксичну або граматичну структуру, 00:01:27.050 --> 00:01:29.587 визначаючи, що "діти" - це підмет, 00:01:29.587 --> 00:01:32.317 а решта речення - предикат, 00:01:32.317 --> 00:01:34.368 що складається з дієслова "їдять", 00:01:34.368 --> 00:01:37.422 та прямого додатка "кекси". 00:01:37.422 --> 00:01:40.249 Далі необхідно врахувати морфологію англійської мови, 00:01:40.249 --> 00:01:44.681 тобто те, як мова поділяється на найменші значимі одиниці, 00:01:44.681 --> 00:01:46.124 такі як корінь "кекс" 00:01:46.124 --> 00:01:49.755 та закінчення "-и", котре вказує на множину. 00:01:49.755 --> 00:01:52.449 І нарешті, програмі потрібно зрозуміти семантику: 00:01:52.449 --> 00:01:56.178 що саме означають різні частини речення. 00:01:56.178 --> 00:01:58.074 Аби правильно перекласти це речення, 00:01:58.074 --> 00:02:01.982 програма має проаналізувати ряд лексики та правил 00:02:01.982 --> 00:02:05.166 для кожного елемента мови перекладу. 00:02:05.166 --> 00:02:07.020 Але ось де собаку зарито. 00:02:07.020 --> 00:02:11.820 Синтаксична структура деяких мов не вимагає чіткого порядку слів у реченні, 00:02:11.820 --> 00:02:16.954 у той час як у інших, його порушення може призвести до того, що кекс з'їсть дитину. 00:02:16.954 --> 00:02:19.557 Морфологія також може становити проблему. 00:02:19.557 --> 00:02:22.287 Зокрема у словенській мові різниця між 2, 3 чи більше дітьми 00:02:22.287 --> 00:02:26.353 виражається додаванням подвійного суфіксу, що відсутнє у більшості інших мов, 00:02:26.363 --> 00:02:30.507 а в російській відсутність артиклів змусить замислитися, 00:02:30.507 --> 00:02:33.412 чи діти їдять якісь конкретні кекси, 00:02:33.412 --> 00:02:36.015 чи взагалі їх їдять. 00:02:36.819 --> 00:02:39.439 Насамкінець, навіть якщо семантика вірна, 00:02:39.439 --> 00:02:42.218 програма може не зрозуміти декотрих особливостей 00:02:42.218 --> 00:02:45.057 як, наприклад, використати слово "mangiano" чи "divorano", 00:02:45.057 --> 00:02:47.329 аби позначити дію дітей. 00:02:47.339 --> 00:02:51.454 Інший метод - це статистичний машинний переклад, 00:02:51.454 --> 00:02:55.478 при якому аналізується база даних з книжок, статей та документів 00:02:55.488 --> 00:02:58.342 вже перекладених людиною. 00:02:58.342 --> 00:03:02.868 Знаходячи співвідношення між текстом оригіналу та перекладу, 00:03:02.868 --> 00:03:05.439 котрі рідко виникають випадково, 00:03:05.439 --> 00:03:09.323 програма може виокремити відповідні фрази та моделі, 00:03:09.353 --> 00:03:11.925 котрі будуть використані для подальшого перекладу. 00:03:11.935 --> 00:03:14.989 Тим не менш, якість такого перекладу 00:03:14.999 --> 00:03:17.419 залежить від вихідної бази даних 00:03:17.419 --> 00:03:20.930 та наявності зразків для конкретної мови 00:03:20.930 --> 00:03:22.947 чи стилю мовлення. 00:03:22.977 --> 00:03:26.513 Складнощі для комп'ютера складають виключення, порушення норм 00:03:26.513 --> 00:03:30.804 та відтінки значень, котрі для людини зрозумілі на інстинктивному рівні. 00:03:30.804 --> 00:03:34.795 Саме це змусило деяких вчених припустити, що розуміння мови - 00:03:34.795 --> 00:03:38.905 це унікальне явище, зумовлене біологічною будовою нашого мозку. 00:03:38.945 --> 00:03:43.021 Насправді, один із найвідоміших вигаданих універсальних перекладачів, 00:03:43.021 --> 00:03:46.161 Вавілонська риба із роману "Путівник Галактикою", 00:03:46.161 --> 00:03:49.799 зовсім не машина, а невеличка істота, 00:03:49.809 --> 00:03:54.266 котра перекладає мозкові хвилі та нервові сигнали розумних істот 00:03:54.266 --> 00:03:56.410 за допомогою телепатії. 00:03:56.410 --> 00:03:59.845 На сьогодні, звичне нам просте вивчення мови 00:03:59.845 --> 00:04:04.706 буде більш ефективним, аніж будь-яка доступна зараз програма. 00:04:04.706 --> 00:04:06.566 Але це не просте завдання. 00:04:06.586 --> 00:04:09.189 А безліч мов у світі 00:04:09.189 --> 00:04:12.869 та зростання кількості контактів між людьми, що ними спілкуються, 00:04:12.869 --> 00:04:17.379 лише сприятимуть розвитку машинного перекладу. 00:04:17.399 --> 00:04:21.489 Можливо, до того часу, коли ми нарешті встановимо контакт із прибульцями 00:04:21.519 --> 00:04:24.859 ми матимемо змогу спілкуватися із ними за допомогою маленьких приладів, 00:04:24.859 --> 00:04:28.840 або нам все ж доведеться складати словник.