1 00:00:06,677 --> 00:00:11,306 Ako je možné, že toľko medzigalaktických rás vo filmoch a TV 2 00:00:11,306 --> 00:00:14,483 náhodou ovláda perfektnú angličtinu? 3 00:00:14,483 --> 00:00:17,886 Krátka odpoveď: nikto nechce pozerať na posádku vesmírnej lode, 4 00:00:17,886 --> 00:00:21,774 ako roky kompiluje slovník k jazyku mimozemšťanov. 5 00:00:21,774 --> 00:00:23,392 Ale z dôvodu konzistentnosti 6 00:00:23,392 --> 00:00:26,789 tvorcovia Star Treku a iných sci-fi svetov 7 00:00:26,789 --> 00:00:30,514 zaviedli používanie univerzálneho prekladača, 8 00:00:30,514 --> 00:00:35,012 prenosného zariadenia, ktoré dokáže okamžite prekladať medzi všetkými jazykmi. 9 00:00:35,012 --> 00:00:38,539 Je univerzálny prekladač možný v skutočnosti? 10 00:00:38,539 --> 00:00:42,137 Už teraz máme mnoho programov, ktoré tvrdia, že to dokážu, 11 00:00:42,137 --> 00:00:45,954 zoberú si slovo, vetu, či celú knihu v jednom jazyku 12 00:00:45,954 --> 00:00:49,004 a preložia ju do takmer akéhokoľvek iného, 13 00:00:49,004 --> 00:00:52,337 či už ide o modernú angličtinu, alebo staroveký Sanskrit. 14 00:00:52,337 --> 00:00:55,913 A ak by pri preklade išlo len o vyhľadávanie slovíčok v slovníku, 15 00:00:55,913 --> 00:00:59,825 tieto programy by ľudia ani nepustili z ruky. 16 00:00:59,825 --> 00:01:03,299 Skutočnosť je však trochu zložitejšia. 17 00:01:03,299 --> 00:01:07,349 Program na základe pravidiel používa databázu slov, 18 00:01:07,349 --> 00:01:10,302 ktorá obsahuje všetky slová zo slovníka 19 00:01:10,302 --> 00:01:13,283 a všetky gramatické formy, ktoré môže mať, 20 00:01:13,283 --> 00:01:18,925 aj sadu pravidiel, podľa ktorých rozoznať základné lingvistické prvky východiskového jazyka. 21 00:01:18,925 --> 00:01:22,396 Pri zdanlivo jednoduchých vetách ako: „Deti jedia muffiny“ 22 00:01:22,396 --> 00:01:27,050 program najprv analyzuje vetnú syntax, teda gramatickú štruktúru, 23 00:01:27,050 --> 00:01:29,587 tým, že deti identifikuje ako podmet 24 00:01:29,587 --> 00:01:32,317 a zvyšok vety ako prísudok, 25 00:01:32,317 --> 00:01:34,368 ktorý pozostáva zo slova "jesť" (eat) 26 00:01:34,368 --> 00:01:37,422 a priamy predmet - "muffiny" (muffins). 27 00:01:37,422 --> 00:01:40,249 Potom potrebuje rozoznať anglickú morfológiu, 28 00:01:40,249 --> 00:01:44,681 čiže to, ako sa jazyk môže rozdeliť na najmenšie zmysluplné jednotky, 29 00:01:44,681 --> 00:01:46,124 ako je slovo muffin 30 00:01:46,124 --> 00:01:49,755 a prípona -s, ktorá sa používa na označenie množného čísla. 31 00:01:49,755 --> 00:01:52,449 Nakoniec potrebuje porozumieť sémantike, 32 00:01:52,449 --> 00:01:55,998 čiže tomu, čo vlastne znamenajú rôzne časti vety. 33 00:01:55,998 --> 00:01:58,074 Aby program túto vetu preložil správne, 34 00:01:58,074 --> 00:02:01,982 odkáže na rôzne sady slovnej zásoby a pravidiel, 35 00:02:01,982 --> 00:02:05,166 a to pre každý prvok cieľového jazyka. 36 00:02:05,166 --> 00:02:07,020 Ale tu sa to zamotáva. 37 00:02:07,020 --> 00:02:11,820 Syntax niektorých jazykov umožňuje, aby sa slová zoradili do rôzneho poradia, 38 00:02:11,820 --> 00:02:16,954 kým v iných jazykoch by z toho vzniklo, že muffiny jedia deti. 39 00:02:16,954 --> 00:02:19,647 Problémom môže byť aj morfológia. 40 00:02:19,647 --> 00:02:23,243 Slovinčina rozlišuje medzi dvoma deťmi a troma a viacerými 41 00:02:23,243 --> 00:02:27,097 pomocou prípony, ktorá v ostatných jazykoch nie je, 42 00:02:27,097 --> 00:02:30,532 kým neprítomnosť určitých členov v ruštine môže spôsobiť, že neviete, 43 00:02:30,532 --> 00:02:33,575 či deti jedia nejaké určité muffiny, 44 00:02:33,575 --> 00:02:36,419 alebo len vo všeobecnosti jedia muffiny. 45 00:02:36,419 --> 00:02:39,708 Nakoniec, dokonca aj keď je sémantika technicky správna, 46 00:02:39,708 --> 00:02:42,757 program by mohol opomenúť niektoré jemnejšie narážky, 47 00:02:42,757 --> 00:02:45,809 napríklad, či deti „margiano“ tie muffiny, 48 00:02:45,809 --> 00:02:47,794 alebo či ich „divorano“. 49 00:02:47,794 --> 00:02:51,558 Ďalšou metódou je strojový preklad pomocou štatistiky, 50 00:02:51,558 --> 00:02:55,762 ktorý analyzuje databázu kníh, článkov a dokumentov, 51 00:02:55,762 --> 00:02:59,248 ktoré už boli preložené ľuďmi. 52 00:02:59,248 --> 00:03:02,959 Hľadaním zhody medzi zdrojom a preloženými textami, 53 00:03:02,959 --> 00:03:05,393 pri ktorých nie je pravdepodobné, že sa vyskytnú náhodou, 54 00:03:05,393 --> 00:03:09,345 program vie identifikovať zodpovedajúce frázy a vzory 55 00:03:09,345 --> 00:03:12,429 a využiť ich pri budúcich prekladoch. 56 00:03:12,429 --> 00:03:14,969 Avšak kvalita takéhoto typu prekladu 57 00:03:14,969 --> 00:03:17,690 závisí od veľkosti počiatočnej databázy 58 00:03:17,690 --> 00:03:21,357 a dostupnosti vzoriek niektorých jazykov 59 00:03:21,357 --> 00:03:23,383 alebo štýlov písania. 60 00:03:23,383 --> 00:03:27,140 Problém, ktorý majú počítače s výnimkami, odchýlkami 61 00:03:27,140 --> 00:03:30,994 a odtienkami zmyslu, ktoré sú pre ľudí očividne inštinktívnejšie, 62 00:03:30,994 --> 00:03:35,045 niektorých vedcov viedol k názoru, že naše chápanie jazyka 63 00:03:35,045 --> 00:03:39,251 je jedinečným produktom našej biologickej štruktúry mozgu. 64 00:03:39,251 --> 00:03:43,101 Vlastne jeden z najslávnejších fiktívnych univerzálnych prekladačov, 65 00:03:43,101 --> 00:03:46,439 babylonská rybka z knihy „Stopárov sprievodca galaxiou“, 66 00:03:46,439 --> 00:03:49,726 nie je stroj, ale malý tvor, 67 00:03:49,726 --> 00:03:54,210 ktorý prekladá mozgové vlny a nervové signály vnímavých tvorov 68 00:03:54,210 --> 00:03:57,005 formou telepatie. 69 00:03:57,005 --> 00:03:59,726 Učenie jazyka starým spôsobom vám momentálne 70 00:03:59,726 --> 00:04:05,106 poskytne lepšie výsledky ako akýkoľvek dostupný počítačový program. 71 00:04:05,106 --> 00:04:06,749 Ale nie je to ľahká úloha, 72 00:04:06,749 --> 00:04:09,014 a už len počet jazykov na svete 73 00:04:09,014 --> 00:04:12,989 a zväčšujúca sa interakcia medzi ľuďmi, ktorí nimi hovoria, 74 00:04:12,989 --> 00:04:18,004 bude len podporovať väčšie pokroky v automatickom preklade. 75 00:04:18,004 --> 00:04:21,409 Možno kým sa stretneme s intergalaktickými formami života, 76 00:04:21,409 --> 00:04:24,660 s nimi budeme vedieť komunikovať cez malé niečo, 77 00:04:24,660 --> 00:04:29,026 alebo možno začneme aj tak vytvárať ten slovník.