Как компьютеры переводят язык людей — Иоаннис Папахимонас
-
0:07 - 0:11Почему это в любом кино или по телевизору
пришельцы-инопланетяне -
0:11 - 0:14всегда так хорошо
владеют английским языком? -
0:14 - 0:18Если коротко, то потому, что зрителям
не интересно, как экипаж корабля -
0:18 - 0:22будет годами
составлять словарь пришельцев. -
0:22 - 0:23Но чтобы всё было логично,
-
0:23 - 0:27создатели «Звёздного пути»
и других фантастических миров -
0:27 - 0:31придумали понятие
«универсального переводчика»: -
0:31 - 0:35переносного устройства, которое может
мгновенно переводить на разные языки. -
0:35 - 0:39Возможен ли
универсальный переводчик в реальности? -
0:39 - 0:42На сегодняшний день есть много программ,
чьи создатели утверждают, -
0:42 - 0:46что можно взять на одном языке
слово, предложение, целую книгу -
0:46 - 0:49и перевести на почти любой язык,
-
0:49 - 0:52будь то современный английский
или древний санскрит. -
0:52 - 0:56Если бы при переводе нужно было
просто отыскивать слова в словаре, -
0:56 - 1:00то эти программы давно бы
за пояс заткнули живых переводчиков. -
1:00 - 1:03Однако в реальности всё намного сложнее.
-
1:03 - 1:07Обычная компьютерная программа-переводчик
использует базу данных лексических единиц, -
1:07 - 1:10которая включает все слова,
содержащиеся в словаре, -
1:10 - 1:13и все грамматические формы,
которые они могут принимать, -
1:13 - 1:19а также набор правил, которые определяют
базовые языковые элементы исходного языка. -
1:19 - 1:22Казалось бы, в таком простом предложении,
например: «Дети едят маффины», -
1:22 - 1:27программа вначале анализирует синтаксис
или грамматическую структуру предложения, -
1:27 - 1:30она определяет, что «дети» — это субъект,
-
1:30 - 1:32а остаток предложения — его предикат,
-
1:32 - 1:34который состоит из глагола «едят»
-
1:34 - 1:37и прямого дополнения «маффины».
-
1:37 - 1:41Затем ей необходимо вникнуть
в английскую морфологическую структуру, -
1:41 - 1:45или как язык можно разбить
на небольшие значимые единицы, -
1:45 - 1:46например, корень «маффин»
-
1:46 - 1:50и окончание «ы», указывающее на форму
множественного числа. -
1:50 - 1:52Наконец, программа
должна понять семантику, -
1:52 - 1:56что на самом деле означают
различные части предложения. -
1:56 - 1:58Чтобы правильно
перевести это предложение, -
1:58 - 2:02программа должна обладать
определённым запасом словаря и правил -
2:02 - 2:05для каждого элемента языка перевода.
-
2:05 - 2:07А вот здесь-то и кроется подвох.
-
2:07 - 2:12Синтаксис некоторых языков допускает
свободный порядок слов в предложении, -
2:12 - 2:17зато в других языках подобные перестановки
могут означать, что маффины едят детей. -
2:17 - 2:20С морфологией всё тоже не так просто.
-
2:20 - 2:23В словенском языке есть различия,
едят ли двое детей, трое или более, -
2:23 - 2:27это показывает суффикс парности,
отсутствующий во многих других языках. -
2:27 - 2:31В русском языке не существует
определённого артикля, отчего непонятно, -
2:31 - 2:34едят ли дети какие-то
конкретные маффины в данный момент -
2:34 - 2:37или просто едят маффины вообще.
-
2:37 - 2:40Наконец, даже если
с семантикой и всё хорошо, -
2:40 - 2:43программа может
не понять некоторых тонкостей, -
2:43 - 2:46например, едят ли дети
маффины в смысле «mangiano» -
2:46 - 2:48или они их «divorano».
-
2:48 - 2:52Вторым методом является
статистический машинный перевод, -
2:52 - 2:56который представляет собой анализ
баз данных книг, статей, документов, -
2:56 - 2:59которые уже переводились людьми.
-
2:59 - 3:01Благодаря тому,
что находятся соответствия между -
3:01 - 3:03текстами на исходном языке
и языке перевода, -
3:03 - 3:06такие совпадения
вряд ли бывают случайными, -
3:06 - 3:09это означает, что программа может
выявлять фразы и конструкции -
3:09 - 3:12и использовать их для будущих переводов.
-
3:12 - 3:15Однако качество такого типа переводов
-
3:15 - 3:18зависит от объёма исходной базы банных
-
3:18 - 3:21и наличия образцов
для определённых языков -
3:21 - 3:23или стилей письма.
-
3:23 - 3:26Трудности, с которыми
сталкивается компьютер, -
3:26 - 3:28когда ему попадаются
исключения, нарушения норм -
3:28 - 3:31или оттенки значений,
которые люди интерпретируют интуитивно, -
3:31 - 3:35заставило некоторых учёных предполагать,
что понимание языка людьми — -
3:35 - 3:39это уникальное явление, свойственное
биологической структуре нашего мозга. -
3:39 - 3:43Собственно, самый знаменитый
фантастический универсальный переводчик -
3:43 - 3:46Вавилонская рыбка из романа
«Автостопом по галактике» -
3:46 - 3:50и вовсе не прибор,
а крошечное создание, -
3:50 - 3:54переводившее биотоки мозга
и нервные сигналы разумных существ -
3:54 - 3:57путём телепатии.
-
3:57 - 4:00На сегодняшний день
старое доброе изучение другого языка -
4:00 - 4:05по-прежнему результативнее
любой из доступных программ-переводчиков. -
4:05 - 4:07Но это не самый лёгкий путь,
-
4:07 - 4:09а само число существующих в мире языков,
-
4:09 - 4:13а также всё возрастающее число контактов
между говорящими на разных языках людьми -
4:13 - 4:18будут только способствовать дальнейшему
улучшению машинного перевода. -
4:18 - 4:20Возможно, что к моменту встречи
-
4:20 - 4:22с представителями
межгалактических цивилизаций -
4:22 - 4:25мы сможем общаться
с ними посредством крохотных девайсов, -
4:25 - 4:29или же нам придётся по старинке
садиться за составление словаря.
- Title:
- Как компьютеры переводят язык людей — Иоаннис Папахимонас
- Speaker:
- Ioannis Papachimonas
- Description:
-
Урок полностью: http://ed.ted.com/lessons/how-computers-translate-human-language-ioannis-papachimonas
Возможен ли в реальной жизни универсальный переводчик? На сегодняшний день существует немало программ, чьи создатели утверждают, что программы способны взять слово, предложение, целую книгу на одном языке и перевести их на почти любой другой язык. В реальности, однако, всё не так просто. Иоаннис Папахимонас расскажет, как работают эти программы машинного перевода, и заодно объяснит, почему в них иногда получается путаница.
Урок — Иоаннис Папахимонас, мультипликация — NOWAY Video Club.
- Video Language:
- English
- Team:
closed TED
- Project:
- TED-Ed
- Duration:
- 04:45
![]() |
Anna Kotova approved Russian subtitles for How computers translate human language | |
![]() |
Anna Kotova edited Russian subtitles for How computers translate human language | |
![]() |
Anna Kotova edited Russian subtitles for How computers translate human language | |
![]() |
Anna Kotova edited Russian subtitles for How computers translate human language | |
![]() |
Ростислав Голод accepted Russian subtitles for How computers translate human language | |
![]() |
Ростислав Голод edited Russian subtitles for How computers translate human language | |
![]() |
Ростислав Голод edited Russian subtitles for How computers translate human language | |
![]() |
Ростислав Голод edited Russian subtitles for How computers translate human language |