Как компютрите превеждат човешкия език? - Йоанис Папахимонас
-
0:07 - 0:11Как така всички междугалактични видове
във филмите и по телевизията -
0:11 - 0:14говорят перфектен английски език?
-
0:14 - 0:18Накратко, никой не иска да гледа
как екипаж на космически кораб -
0:18 - 0:22прекарва години да съставя
речник за извънземни. -
0:22 - 0:23За да е достоверно,
-
0:23 - 0:27създателите на "Стар Трек",
и на други научнофантастични светове, -
0:27 - 0:31въвеждат концепцията
за универсален преводач, -
0:31 - 0:35преносимо устройство,
което превежда от всеки език на момента. -
0:35 - 0:39Може ли реално да съществува
такъв универсален преводач? -
0:39 - 0:42Вече имаме много програми,
които претендират, че правят това - -
0:42 - 0:46вземат дума, изречение или цяла книга
на един език -
0:46 - 0:49и я превеждат на почти всеки друг език,
-
0:49 - 0:52независимо дали е на съвременен английски,
или на древен санскрит. -
0:52 - 0:56Ако преводът беше просто
проверка на думи в речника, -
0:56 - 1:00тези програми със сигурност
ще надминат хората. -
1:00 - 1:03Реалността обаче е малко по-сложна.
-
1:03 - 1:07Програмата за машинен превод,
базиран на правила, ползва база с лексика, -
1:07 - 1:10която включва всички думи,
които бихте намерили в речник, -
1:10 - 1:13и всичките им възможни граматични форми,
-
1:13 - 1:19плюс редица от правила за разпознаване на
базови езикови елементи в изходния език. -
1:19 - 1:22За на пръв поглед просто изречение като:
"Децата ядат кексчетата", -
1:22 - 1:27програмата първо анализира синтаксиса,
или граматическата структура, -
1:27 - 1:30като разпознава "децата" като подлога,
-
1:30 - 1:32а останалата част от изречението
като сказуемото, -
1:32 - 1:34състоящо се от глагола "ядат"
-
1:34 - 1:37и прякото допълнение "кексчетата".
-
1:37 - 1:40След това разпознава морфологията
на английския език - -
1:40 - 1:45тоест как езикът се разбива
на най-малките си смислови частици. -
1:45 - 1:46Например, при думата "кекс",
-
1:46 - 1:50където наставката "и"
показва множественото число. -
1:50 - 1:52Най-накрая, трябва да разбере семантиката,
-
1:52 - 1:56тоест какво означават
различните части на изречението. -
1:56 - 1:58За да преведе правилно това изречение,
-
1:58 - 2:02програмата ще използва
набор от думи и правила -
2:02 - 2:05за всеки един елемент от целевия език.
-
2:05 - 2:07Точно тук става сложно.
-
2:07 - 2:12Синтаксисът на някои езици позволява
думите да местят мястото си в изречението. -
2:12 - 2:17При други езици, разместването ще доведе
до това, че кексчето ще изяде детето. -
2:17 - 2:20Морфологията също може да е проблем.
-
2:20 - 2:23Словенският език разграничава думи
за две, три или повече деца, -
2:23 - 2:27използвайки наставка за двойствено число,
която липсва в много други езици. -
2:27 - 2:31Руският език няма определителен член,
което ще ви накара да се чудите -
2:31 - 2:34дали децата ядат точно определени кексчета,
-
2:34 - 2:37или по принцип обичат да ядат кексчета.
-
2:37 - 2:40Накрая, дори семантиката
да е технически правилна, -
2:40 - 2:43програмата може да пропусне
по-фините моменти, -
2:43 - 2:46като например дали децата
"ядат" кексчетата, -
2:46 - 2:48или ги "поглъщат" лакомо.
-
2:48 - 2:52Друг метод е
статистическият машинен превод, -
2:52 - 2:56при който се анализира
база от книги, статии и документи, -
2:56 - 2:59които вече са били преведени от хора.
-
2:59 - 3:03Като намира съвпадения между
изходния и преведения текст, -
3:03 - 3:05които трудно биха се комбинирали случайно,
-
3:05 - 3:09програмата идентифицира
съответните фрази и модели -
3:09 - 3:12и ги използва при бъдещи преводи.
-
3:12 - 3:15Качеството на този вид преводи
-
3:15 - 3:18зависи от големината на
първоначалната база данни, -
3:18 - 3:21от количеството модели за всеки език,
-
3:21 - 3:23както и от стиловете на писане.
-
3:23 - 3:27Трудностите, които компютрите изпитват с
изключенията, неправилните форми -
3:27 - 3:31и нюансите в значението,
хората долавят несъзнателно. -
3:31 - 3:35Това кара учените да вярват,
че начинът, по който разбираме езика, -
3:35 - 3:39е уникален продукт на
биологичната структура на мозъка. -
3:39 - 3:43Всъщност, един от най-известните
универсални преводачи - -
3:43 - 3:46Вавилонската рибка от
"Пътеводител на галактическия стопаджия" -
3:46 - 3:50изобщо не е машина, а малко същество,
-
3:50 - 3:54което "превежда" мисловните вълни
и сигналите от нервите на мислещите видове -
3:54 - 3:57чрез форма на телепатия.
-
3:57 - 4:00Засега ученето на език
по старомодния начин -
4:00 - 4:05ще ви даде по-добри резултати
от наличните компютърни програми. -
4:05 - 4:07Но това не е лесна работа,
-
4:07 - 4:09а неясното количество езици по света,
-
4:09 - 4:13както и нарастващото взаимодействие
между хората, които ги говорят, -
4:13 - 4:18продължава да стимулира
напредването на автоматичния превод. -
4:18 - 4:21Може би, докато открием
междугалактически форми на живот, -
4:21 - 4:25вече ще можем да общуваме с тях
чрез малки уреди -
4:25 - 4:29или все пак може да се наложи
да съставяме извънземен речник.
- Title:
- Как компютрите превеждат човешкия език? - Йоанис Папахимонас
- Speaker:
- Ioannis Papachimonas
- Description:
-
Вижте пълната версия на урока тук: http://ed.ted.com/lessons/how-computers-translate-human-language-ioannis-papachimonas
Възможен ли е реално универсалният преводач? Вече разполагаме с много програми, които претендират, че могат да вземат дума, изречение или цяла книга и да ги преведат на почти всеки друг език. Реалността обаче е малко по-сложна. Йоанис Папахимонас ни показва как работи машинният превод и обяснява защо той често е пълен с грешки.
Урок от Йоанис Папахимонас, анимация: NOWAY Video Club.
- Video Language:
- English
- Team:
closed TED
- Project:
- TED-Ed
- Duration:
- 04:45
![]() |
Anton Hikov approved Bulgarian subtitles for How computers translate human language | |
![]() |
Anton Hikov accepted Bulgarian subtitles for How computers translate human language | |
![]() |
Anton Hikov edited Bulgarian subtitles for How computers translate human language | |
![]() |
Tereza Stoyanova edited Bulgarian subtitles for How computers translate human language | |
![]() |
Tereza Stoyanova edited Bulgarian subtitles for How computers translate human language | |
![]() |
Tereza Stoyanova edited Bulgarian subtitles for How computers translate human language | |
![]() |
Tereza Stoyanova edited Bulgarian subtitles for How computers translate human language | |
![]() |
Tereza Stoyanova edited Bulgarian subtitles for How computers translate human language |