WEBVTT 00:00:06.677 --> 00:00:11.306 Ako je možné, že toľko medzigalaktických rás vo filmoch a TV 00:00:11.306 --> 00:00:14.483 náhodou ovláda perfektnú angličtinu? 00:00:14.483 --> 00:00:17.886 Krátka odpoveď: nikto nechce pozerať na posádku vesmírnej lode, 00:00:17.886 --> 00:00:21.774 ako roky kompiluje slovník k jazyku mimozemšťanov. 00:00:21.774 --> 00:00:23.392 Ale z dôvodu konzistentnosti 00:00:23.392 --> 00:00:26.789 tvorcovia Star Treku a iných sci-fi svetov 00:00:26.789 --> 00:00:30.514 zaviedli používanie univerzálneho prekladača, 00:00:30.514 --> 00:00:35.012 prenosného zariadenia, ktoré dokáže okamžite prekladať medzi všetkými jazykmi. 00:00:35.012 --> 00:00:38.539 Je univerzálny prekladač možný v skutočnosti? 00:00:38.539 --> 00:00:42.137 Už teraz máme mnoho programov, ktoré tvrdia, že to dokážu, 00:00:42.137 --> 00:00:45.954 zoberú si slovo, vetu, či celú knihu v jednom jazyku 00:00:45.954 --> 00:00:49.004 a preložia ju do takmer akéhokoľvek iného, 00:00:49.004 --> 00:00:52.337 či už ide o modernú angličtinu, alebo staroveký Sanskrit. 00:00:52.337 --> 00:00:55.913 A ak by pri preklade išlo len o vyhľadávanie slovíčok v slovníku, 00:00:55.913 --> 00:00:59.825 tieto programy by ľudia ani nepustili z ruky. 00:00:59.825 --> 00:01:03.299 Skutočnosť je však trochu zložitejšia. 00:01:03.299 --> 00:01:07.349 Program na základe pravidiel používa databázu slov, 00:01:07.349 --> 00:01:10.302 ktorá obsahuje všetky slová zo slovníka 00:01:10.302 --> 00:01:13.283 a všetky gramatické formy, ktoré môže mať, 00:01:13.283 --> 00:01:18.925 aj sadu pravidiel, podľa ktorých rozoznať základné lingvistické prvky východiskového jazyka. 00:01:18.925 --> 00:01:22.396 Pri zdanlivo jednoduchých vetách ako: „Deti jedia muffiny“ 00:01:22.396 --> 00:01:27.050 program najprv analyzuje vetnú syntax, teda gramatickú štruktúru, 00:01:27.050 --> 00:01:29.587 tým, že deti identifikuje ako podmet 00:01:29.587 --> 00:01:32.317 a zvyšok vety ako prísudok, 00:01:32.317 --> 00:01:34.368 ktorý pozostáva zo slova "jesť" (eat) 00:01:34.368 --> 00:01:37.422 a priamy predmet - "muffiny" (muffins). 00:01:37.422 --> 00:01:40.249 Potom potrebuje rozoznať anglickú morfológiu, 00:01:40.249 --> 00:01:44.681 čiže to, ako sa jazyk môže rozdeliť na najmenšie zmysluplné jednotky, 00:01:44.681 --> 00:01:46.124 ako je slovo muffin 00:01:46.124 --> 00:01:49.755 a prípona -s, ktorá sa používa na označenie množného čísla. 00:01:49.755 --> 00:01:52.449 Nakoniec potrebuje porozumieť sémantike, 00:01:52.449 --> 00:01:55.998 čiže tomu, čo vlastne znamenajú rôzne časti vety. 00:01:55.998 --> 00:01:58.074 Aby program túto vetu preložil správne, 00:01:58.074 --> 00:02:01.982 odkáže na rôzne sady slovnej zásoby a pravidiel, 00:02:01.982 --> 00:02:05.166 a to pre každý prvok cieľového jazyka. 00:02:05.166 --> 00:02:07.020 Ale tu sa to zamotáva. 00:02:07.020 --> 00:02:11.820 Syntax niektorých jazykov umožňuje, aby sa slová zoradili do rôzneho poradia, 00:02:11.820 --> 00:02:16.954 kým v iných jazykoch by z toho vzniklo, že muffiny jedia deti. 00:02:16.954 --> 00:02:19.647 Problémom môže byť aj morfológia. 00:02:19.647 --> 00:02:23.243 Slovinčina rozlišuje medzi dvoma deťmi a troma a viacerými 00:02:23.243 --> 00:02:27.097 pomocou prípony, ktorá v ostatných jazykoch nie je, 00:02:27.097 --> 00:02:30.532 kým neprítomnosť určitých členov v ruštine môže spôsobiť, že neviete, 00:02:30.532 --> 00:02:33.575 či deti jedia nejaké určité muffiny, 00:02:33.575 --> 00:02:36.419 alebo len vo všeobecnosti jedia muffiny. 00:02:36.419 --> 00:02:39.708 Nakoniec, dokonca aj keď je sémantika technicky správna, 00:02:39.708 --> 00:02:42.757 program by mohol opomenúť niektoré jemnejšie narážky, 00:02:42.757 --> 00:02:45.809 napríklad, či deti „margiano“ tie muffiny, 00:02:45.809 --> 00:02:47.794 alebo či ich „divorano“. 00:02:47.794 --> 00:02:51.558 Ďalšou metódou je strojový preklad pomocou štatistiky, 00:02:51.558 --> 00:02:55.762 ktorý analyzuje databázu kníh, článkov a dokumentov, 00:02:55.762 --> 00:02:59.248 ktoré už boli preložené ľuďmi. 00:02:59.248 --> 00:03:02.959 Hľadaním zhody medzi zdrojom a preloženými textami, 00:03:02.959 --> 00:03:05.393 pri ktorých nie je pravdepodobné, že sa vyskytnú náhodou, 00:03:05.393 --> 00:03:09.345 program vie identifikovať zodpovedajúce frázy a vzory 00:03:09.345 --> 00:03:12.429 a využiť ich pri budúcich prekladoch. 00:03:12.429 --> 00:03:14.969 Avšak kvalita takéhoto typu prekladu 00:03:14.969 --> 00:03:17.690 závisí od veľkosti počiatočnej databázy 00:03:17.690 --> 00:03:21.357 a dostupnosti vzoriek niektorých jazykov 00:03:21.357 --> 00:03:23.383 alebo štýlov písania. 00:03:23.383 --> 00:03:27.140 Problém, ktorý majú počítače s výnimkami, odchýlkami 00:03:27.140 --> 00:03:30.994 a odtienkami zmyslu, ktoré sú pre ľudí očividne inštinktívnejšie, 00:03:30.994 --> 00:03:35.045 niektorých vedcov viedol k názoru, že naše chápanie jazyka 00:03:35.045 --> 00:03:39.251 je jedinečným produktom našej biologickej štruktúry mozgu. 00:03:39.251 --> 00:03:43.101 Vlastne jeden z najslávnejších fiktívnych univerzálnych prekladačov, 00:03:43.101 --> 00:03:46.439 babylonská rybka z knihy „Stopárov sprievodca galaxiou“, 00:03:46.439 --> 00:03:49.726 nie je stroj, ale malý tvor, 00:03:49.726 --> 00:03:54.210 ktorý prekladá mozgové vlny a nervové signály vnímavých tvorov 00:03:54.210 --> 00:03:57.005 formou telepatie. 00:03:57.005 --> 00:03:59.726 Učenie jazyka starým spôsobom vám momentálne 00:03:59.726 --> 00:04:05.106 poskytne lepšie výsledky ako akýkoľvek dostupný počítačový program. 00:04:05.106 --> 00:04:06.749 Ale nie je to ľahká úloha, 00:04:06.749 --> 00:04:09.014 a už len počet jazykov na svete 00:04:09.014 --> 00:04:12.989 a zväčšujúca sa interakcia medzi ľuďmi, ktorí nimi hovoria, 00:04:12.989 --> 00:04:18.004 bude len podporovať väčšie pokroky v automatickom preklade. 00:04:18.004 --> 00:04:21.409 Možno kým sa stretneme s intergalaktickými formami života, 00:04:21.409 --> 00:04:24.660 s nimi budeme vedieť komunikovať cez malé niečo, 00:04:24.660 --> 00:04:29.026 alebo možno začneme aj tak vytvárať ten slovník.