1 00:00:06,677 --> 00:00:11,306 Як так сталося, що більшість прибульців у кіно та на телебаченні 2 00:00:11,306 --> 00:00:14,483 чудово розмовляють англійською? 3 00:00:14,483 --> 00:00:16,816 Кажучи відверто, ніхто не захоче дивитися, 4 00:00:16,816 --> 00:00:21,464 як екіпаж космічного корабля роками складає словник інопланетної мови. 5 00:00:21,464 --> 00:00:23,332 Але, щоб усе було логічно, 6 00:00:23,332 --> 00:00:26,789 творці серіалу "Зоряний шлях" та багатьох інших вигаданих світів 7 00:00:26,789 --> 00:00:30,514 запропонували концепцію універсального перекладача: 8 00:00:30,514 --> 00:00:34,442 портативного пристрою, котрий може миттєво здійснювати переклад. 9 00:00:34,442 --> 00:00:38,429 Та чи насправді можливе існування універсального перекладача? 10 00:00:38,429 --> 00:00:42,097 У нас вже є багато програм, котрі ніби можуть це робити: 11 00:00:42,097 --> 00:00:45,954 перекладати слово, речення чи цілу книгу з однієї мови 12 00:00:45,954 --> 00:00:49,424 майже на будь яку іншу, незважаючи на те, 13 00:00:49,424 --> 00:00:52,227 чи це сучасна англійська мова, чи давній санскрит. 14 00:00:52,227 --> 00:00:55,913 Якби переклад полягав лише у пошуку відповідного слова у словнику, 15 00:00:55,913 --> 00:00:59,685 то ці програми вже давно перевершили б перекладачів - людей. 16 00:00:59,685 --> 00:01:03,299 Насправді ж, все дещо складніше. 17 00:01:03,299 --> 00:01:07,349 Перекладацька програма, базована на правилах, використовує лексичну базу даних, 18 00:01:07,349 --> 00:01:10,302 до якої включено усі слова, котрі можна знайти у словнику 19 00:01:10,302 --> 00:01:13,283 і усі варіанти граматичних форм, котрих вони можуть набувати, 20 00:01:13,283 --> 00:01:18,825 а також ряд правил, аби розпізнати основні лінгвістичні елементи вихідної мови. 21 00:01:18,825 --> 00:01:22,396 Для, здавалося б, простого речення як "Діти їдять кекси" 22 00:01:22,396 --> 00:01:27,050 программа спершу аналізує його синтаксичну або граматичну структуру, 23 00:01:27,050 --> 00:01:29,587 визначаючи, що "діти" - це підмет, 24 00:01:29,587 --> 00:01:32,317 а решта речення - предикат, 25 00:01:32,317 --> 00:01:34,368 що складається з дієслова "їдять", 26 00:01:34,368 --> 00:01:37,422 та прямого додатка "кекси". 27 00:01:37,422 --> 00:01:40,249 Далі необхідно врахувати морфологію англійської мови, 28 00:01:40,249 --> 00:01:44,681 тобто те, як мова поділяється на найменші значимі одиниці, 29 00:01:44,681 --> 00:01:46,124 такі як корінь "кекс" 30 00:01:46,124 --> 00:01:49,755 та закінчення "-и", котре вказує на множину. 31 00:01:49,755 --> 00:01:52,449 І нарешті, програмі потрібно зрозуміти семантику: 32 00:01:52,449 --> 00:01:56,178 що саме означають різні частини речення. 33 00:01:56,178 --> 00:01:58,074 Аби правильно перекласти це речення, 34 00:01:58,074 --> 00:02:01,982 програма має проаналізувати ряд лексики та правил 35 00:02:01,982 --> 00:02:05,166 для кожного елемента мови перекладу. 36 00:02:05,166 --> 00:02:07,020 Але ось де собаку зарито. 37 00:02:07,020 --> 00:02:11,820 Синтаксична структура деяких мов не вимагає чіткого порядку слів у реченні, 38 00:02:11,820 --> 00:02:16,954 у той час як у інших, його порушення може призвести до того, що кекс з'їсть дитину. 39 00:02:16,954 --> 00:02:19,557 Морфологія також може становити проблему. 40 00:02:19,557 --> 00:02:22,287 Зокрема у словенській мові різниця між 2, 3 чи більше дітьми 41 00:02:22,287 --> 00:02:26,353 виражається додаванням подвійного суфіксу, що відсутнє у більшості інших мов, 42 00:02:26,363 --> 00:02:30,507 а в російській відсутність артиклів змусить замислитися, 43 00:02:30,507 --> 00:02:33,412 чи діти їдять якісь конкретні кекси, 44 00:02:33,412 --> 00:02:36,015 чи взагалі їх їдять. 45 00:02:36,819 --> 00:02:39,439 Насамкінець, навіть якщо семантика вірна, 46 00:02:39,439 --> 00:02:42,218 програма може не зрозуміти декотрих особливостей 47 00:02:42,218 --> 00:02:45,057 як, наприклад, використати слово "mangiano" чи "divorano", 48 00:02:45,057 --> 00:02:47,329 аби позначити дію дітей. 49 00:02:47,339 --> 00:02:51,454 Інший метод - це статистичний машинний переклад, 50 00:02:51,454 --> 00:02:55,478 при якому аналізується база даних з книжок, статей та документів 51 00:02:55,488 --> 00:02:58,342 вже перекладених людиною. 52 00:02:58,342 --> 00:03:02,868 Знаходячи співвідношення між текстом оригіналу та перекладу, 53 00:03:02,868 --> 00:03:05,439 котрі рідко виникають випадково, 54 00:03:05,439 --> 00:03:09,323 програма може виокремити відповідні фрази та моделі, 55 00:03:09,353 --> 00:03:11,925 котрі будуть використані для подальшого перекладу. 56 00:03:11,935 --> 00:03:14,989 Тим не менш, якість такого перекладу 57 00:03:14,999 --> 00:03:17,419 залежить від вихідної бази даних 58 00:03:17,419 --> 00:03:20,930 та наявності зразків для конкретної мови 59 00:03:20,930 --> 00:03:22,947 чи стилю мовлення. 60 00:03:22,977 --> 00:03:26,513 Складнощі для комп'ютера складають виключення, порушення норм 61 00:03:26,513 --> 00:03:30,804 та відтінки значень, котрі для людини зрозумілі на інстинктивному рівні. 62 00:03:30,804 --> 00:03:34,795 Саме це змусило деяких вчених припустити, що розуміння мови - 63 00:03:34,795 --> 00:03:38,905 це унікальне явище, зумовлене біологічною будовою нашого мозку. 64 00:03:38,945 --> 00:03:43,021 Насправді, один із найвідоміших вигаданих універсальних перекладачів, 65 00:03:43,021 --> 00:03:46,161 Вавілонська риба із роману "Путівник Галактикою", 66 00:03:46,161 --> 00:03:49,799 зовсім не машина, а невеличка істота, 67 00:03:49,809 --> 00:03:54,266 котра перекладає мозкові хвилі та нервові сигнали розумних істот 68 00:03:54,266 --> 00:03:56,410 за допомогою телепатії. 69 00:03:56,410 --> 00:03:59,845 На сьогодні, звичне нам просте вивчення мови 70 00:03:59,845 --> 00:04:04,706 буде більш ефективним, аніж будь-яка доступна зараз програма. 71 00:04:04,706 --> 00:04:06,566 Але це не просте завдання. 72 00:04:06,586 --> 00:04:09,189 А безліч мов у світі 73 00:04:09,189 --> 00:04:12,869 та зростання кількості контактів між людьми, що ними спілкуються, 74 00:04:12,869 --> 00:04:17,379 лише сприятимуть розвитку машинного перекладу. 75 00:04:17,399 --> 00:04:21,489 Можливо, до того часу, коли ми нарешті встановимо контакт із прибульцями 76 00:04:21,519 --> 00:04:24,859 ми матимемо змогу спілкуватися із ними за допомогою маленьких приладів, 77 00:04:24,859 --> 00:04:28,840 або нам все ж доведеться складати словник.