WEBVTT 00:00:06.677 --> 00:00:11.306 Как така всички междугалактични видове във филмите и по телевизията 00:00:11.306 --> 00:00:14.483 говорят перфектен английски език? 00:00:14.483 --> 00:00:17.886 Накратко, никой не иска да гледа как екипаж на космически кораб 00:00:17.886 --> 00:00:21.774 прекарва години да съставя речник за извънземни. 00:00:21.774 --> 00:00:23.392 За да е достоверно, 00:00:23.392 --> 00:00:26.789 създателите на "Стар Трек", и на други научнофантастични светове, 00:00:26.789 --> 00:00:30.514 въвеждат концепцията за универсален преводач, 00:00:30.514 --> 00:00:35.012 преносимо устройство, което превежда от всеки език на момента. 00:00:35.012 --> 00:00:38.539 Може ли реално да съществува такъв универсален преводач? 00:00:38.539 --> 00:00:42.137 Вече имаме много програми, които претендират, че правят това - 00:00:42.137 --> 00:00:45.954 вземат дума, изречение или цяла книга на един език 00:00:45.954 --> 00:00:49.004 и я превеждат на почти всеки друг език, 00:00:49.004 --> 00:00:52.337 независимо дали е на съвременен английски, или на древен санскрит. 00:00:52.337 --> 00:00:55.913 Ако преводът беше просто проверка на думи в речника, 00:00:55.913 --> 00:00:59.825 тези програми със сигурност ще надминат хората. 00:00:59.825 --> 00:01:03.299 Реалността обаче е малко по-сложна. 00:01:03.299 --> 00:01:07.349 Програмата за машинен превод, базиран на правила, ползва база с лексика, 00:01:07.349 --> 00:01:10.302 която включва всички думи, които бихте намерили в речник, 00:01:10.302 --> 00:01:13.283 и всичките им възможни граматични форми, 00:01:13.283 --> 00:01:18.925 плюс редица от правила за разпознаване на базови езикови елементи в изходния език. 00:01:18.925 --> 00:01:22.396 За на пръв поглед просто изречение като: "Децата ядат кексчетата", 00:01:22.396 --> 00:01:27.050 програмата първо анализира синтаксиса, или граматическата структура, 00:01:27.050 --> 00:01:29.587 като разпознава "децата" като подлога, 00:01:29.587 --> 00:01:32.317 а останалата част от изречението като сказуемото, 00:01:32.317 --> 00:01:34.368 състоящо се от глагола "ядат" 00:01:34.368 --> 00:01:37.422 и прякото допълнение "кексчетата". 00:01:37.422 --> 00:01:40.249 След това разпознава морфологията на английския език - 00:01:40.249 --> 00:01:44.681 тоест как езикът се разбива на най-малките си смислови частици. 00:01:44.681 --> 00:01:46.124 Например, при думата "кекс", 00:01:46.124 --> 00:01:49.755 където наставката "и" показва множественото число. 00:01:49.755 --> 00:01:52.449 Най-накрая, трябва да разбере семантиката, 00:01:52.449 --> 00:01:56.178 тоест какво означават различните части на изречението. 00:01:56.178 --> 00:01:58.074 За да преведе правилно това изречение, 00:01:58.074 --> 00:02:01.982 програмата ще използва набор от думи и правила 00:02:01.982 --> 00:02:05.166 за всеки един елемент от целевия език. 00:02:05.166 --> 00:02:07.020 Точно тук става сложно. 00:02:07.020 --> 00:02:11.820 Синтаксисът на някои езици позволява думите да местят мястото си в изречението. 00:02:11.820 --> 00:02:16.954 При други езици, разместването ще доведе до това, че кексчето ще изяде детето. 00:02:16.954 --> 00:02:19.647 Морфологията също може да е проблем. 00:02:19.647 --> 00:02:23.243 Словенският език разграничава думи за две, три или повече деца, 00:02:23.243 --> 00:02:27.097 използвайки наставка за двойствено число, която липсва в много други езици. 00:02:27.097 --> 00:02:30.532 Руският език няма определителен член, което ще ви накара да се чудите 00:02:30.532 --> 00:02:33.575 дали децата ядат точно определени кексчета, 00:02:33.575 --> 00:02:36.719 или по принцип обичат да ядат кексчета. 00:02:36.719 --> 00:02:39.708 Накрая, дори семантиката да е технически правилна, 00:02:39.708 --> 00:02:42.757 програмата може да пропусне по-фините моменти, 00:02:42.757 --> 00:02:45.809 като например дали децата "ядат" кексчетата, 00:02:45.809 --> 00:02:47.794 или ги "поглъщат" лакомо. 00:02:47.794 --> 00:02:51.558 Друг метод е статистическият машинен превод, 00:02:51.558 --> 00:02:55.762 при който се анализира база от книги, статии и документи, 00:02:55.762 --> 00:02:59.488 които вече са били преведени от хора. 00:02:59.488 --> 00:03:02.959 Като намира съвпадения между изходния и преведения текст, 00:03:02.959 --> 00:03:05.393 които трудно биха се комбинирали случайно, 00:03:05.393 --> 00:03:09.345 програмата идентифицира съответните фрази и модели 00:03:09.345 --> 00:03:12.429 и ги използва при бъдещи преводи. 00:03:12.429 --> 00:03:14.969 Качеството на този вид преводи 00:03:14.969 --> 00:03:17.690 зависи от големината на първоначалната база данни, 00:03:17.690 --> 00:03:21.357 от количеството модели за всеки език, 00:03:21.357 --> 00:03:23.383 както и от стиловете на писане. 00:03:23.383 --> 00:03:27.140 Трудностите, които компютрите изпитват с изключенията, неправилните форми 00:03:27.140 --> 00:03:30.994 и нюансите в значението, хората долавят несъзнателно. 00:03:30.994 --> 00:03:35.045 Това кара учените да вярват, че начинът, по който разбираме езика, 00:03:35.045 --> 00:03:39.251 е уникален продукт на биологичната структура на мозъка. 00:03:39.251 --> 00:03:43.101 Всъщност, един от най-известните универсални преводачи - 00:03:43.101 --> 00:03:46.439 Вавилонската рибка от "Пътеводител на галактическия стопаджия" 00:03:46.439 --> 00:03:49.726 изобщо не е машина, а малко същество, 00:03:49.726 --> 00:03:54.210 което "превежда" мисловните вълни и сигналите от нервите на мислещите видове 00:03:54.210 --> 00:03:57.005 чрез форма на телепатия. 00:03:57.005 --> 00:03:59.726 Засега ученето на език по старомодния начин 00:03:59.726 --> 00:04:05.106 ще ви даде по-добри резултати от наличните компютърни програми. 00:04:05.106 --> 00:04:06.749 Но това не е лесна работа, 00:04:06.749 --> 00:04:09.014 а неясното количество езици по света, 00:04:09.014 --> 00:04:12.989 както и нарастващото взаимодействие между хората, които ги говорят, 00:04:12.989 --> 00:04:18.004 продължава да стимулира напредването на автоматичния превод. 00:04:18.004 --> 00:04:21.409 Може би, докато открием междугалактически форми на живот, 00:04:21.409 --> 00:04:24.660 вече ще можем да общуваме с тях чрез малки уреди 00:04:24.660 --> 00:04:29.026 или все пак може да се наложи да съставяме извънземен речник.