WEBVTT 00:00:06.433 --> 00:00:11.306 Zašto brojne intergalaktičke vrste u filmovima i na TV-u 00:00:11.306 --> 00:00:14.141 sasvim slučajno savršeno govore engleski? 00:00:14.321 --> 00:00:17.886 Ukratko, jer nitko ne želi gledati posadu svemirske letjelice 00:00:17.886 --> 00:00:21.496 kako godinama sastavlja izvanzemaljski rječnik. 00:00:21.654 --> 00:00:23.079 Zbog dosljednosti, 00:00:23.079 --> 00:00:26.789 tvorci Zvjezdanih staza i drugih znanstveno-fantastičnih svjetova 00:00:26.789 --> 00:00:30.514 uveli su ideju univerzalnog prevoditelja, 00:00:30.514 --> 00:00:35.012 prijenosnog uređaja koji brzo prevodi bilo koji jezik. 00:00:35.012 --> 00:00:38.409 Može li univerzalni prevoditelj postojati u stvarnom svijetu? 00:00:38.409 --> 00:00:42.137 Već postoje brojni programi koji to navodno mogu. 00:00:42.137 --> 00:00:45.954 Riječ, rečenicu, ili čak cijelu knjigu na nekom jeziku 00:00:45.954 --> 00:00:48.414 prevode na bilo koji drugi jezik, 00:00:48.774 --> 00:00:51.767 bio to suvremeni engleski jezik ili drevni sanskrt. 00:00:52.337 --> 00:00:55.913 Kada bi se prevođenje svodilo na traženje riječi u rječniku, 00:00:55.913 --> 00:00:59.335 ti bi programi odmah nadmašili ljude. 00:00:59.685 --> 00:01:02.739 Zapravo, stvar nije tako jednostavna. 00:01:03.119 --> 00:01:07.349 Sustav za prevođenje temeljen na pravilima prevodi pomoću leksičke baze podataka. 00:01:07.349 --> 00:01:10.302 U njoj se nalaze sve riječi koje se mogu naći i u rječniku 00:01:10.302 --> 00:01:12.843 i svi njihovi mogući gramatički oblici 00:01:13.167 --> 00:01:18.615 te skup pravila kojima se prepoznaju jezični elementi izvornog jezika. 00:01:18.925 --> 00:01:22.396 Za naizgled jednostavnu rečenicu, kao "Djeca jedu kolače", 00:01:22.396 --> 00:01:27.050 program prvo raščlanjuje sintaksu, to jest gramatičke strukture, 00:01:27.050 --> 00:01:29.587 prepoznajući djecu kao subjekt, 00:01:29.587 --> 00:01:31.917 a ostatak rečenice kao predikat 00:01:32.187 --> 00:01:34.368 koji se sastoji od glagola ,"jedu", 00:01:34.368 --> 00:01:37.032 i izravnog objekta "kolače". 00:01:37.282 --> 00:01:40.249 Zatim prepoznaje morfološku strukturu, 00:01:40.249 --> 00:01:44.681 to jest, kako se jezik razlaže na najmanje značenjske jedinice. 00:01:44.681 --> 00:01:46.124 Tako prepoznaje riječ "kolač" 00:01:46.124 --> 00:01:49.755 i sufiks "e" koji označava množinu. 00:01:49.755 --> 00:01:52.449 Na kraju, mora razumjeti semantiku, 00:01:52.449 --> 00:01:55.908 koje je značenje rečeničnih djelova. 00:01:56.178 --> 00:01:58.074 Za pravilan prijevod ove rečenice, 00:01:58.074 --> 00:02:01.982 program u obzir uzima brojne skupove rječničkih unosa i pravila 00:02:01.982 --> 00:02:04.486 za svaki element u ciljnom jeziku. 00:02:04.816 --> 00:02:06.889 Ovdje stvar postaje komplicirana. 00:02:06.889 --> 00:02:11.820 Sintaksa nekih jezika omogućuje slobodan raspored riječi, 00:02:11.820 --> 00:02:16.954 za druge bi primjena tog pravila uzrokovala da kolač jede dijete. 00:02:16.954 --> 00:02:19.647 I morfologija može biti problem. 00:02:19.647 --> 00:02:23.243 Slovenski razlikuje dvoje djece od troje ili više 00:02:23.243 --> 00:02:27.097 jer ima sufiks koji označava dvojinu, za razliku od brojnih drugih jezika. 00:02:27.097 --> 00:02:30.532 Ruski nema određene članove te više nije jasno 00:02:30.532 --> 00:02:33.325 jedu li djeca neke određene kolače 00:02:33.325 --> 00:02:36.109 ili bilo koje kolače. 00:02:36.519 --> 00:02:39.708 Na kraju, kada je i semantika otprilike točna, 00:02:39.708 --> 00:02:42.757 program ponekad ne uhvati finese, 00:02:42.757 --> 00:02:45.809 kao "mangiano" (jedu) li djeca kolače 00:02:45.809 --> 00:02:47.794 ili ih pak "divorano" (proždiru). 00:02:47.794 --> 00:02:51.558 Postoje i sustavi za statističko strojno prevođenje 00:02:51.558 --> 00:02:55.762 koji analiziraju baze knjiga, članaka i dokumenata 00:02:55.762 --> 00:02:59.488 koje su ljudi već preveli. 00:02:59.488 --> 00:03:02.959 Pronalaze podudarnosti izvornog i ciljnog teksta 00:03:02.959 --> 00:03:05.393 koje najvjerojatnije nisu slučajne 00:03:05.393 --> 00:03:09.345 te određuju odgovarajuće fraze i uzorke 00:03:09.345 --> 00:03:12.429 koje koriste za buduće prijevode. 00:03:12.429 --> 00:03:14.969 Unatoč tome, kvaliteta te vrste prijevoda 00:03:14.969 --> 00:03:17.690 ovisi o veličini početne baze podataka 00:03:17.690 --> 00:03:21.357 i dostupnosti uzoraka za određene jezike 00:03:21.357 --> 00:03:23.383 ili stilove pisanja. 00:03:23.383 --> 00:03:27.140 Računala imaju poteškoće s iznimkama i nepravilnostima 00:03:27.140 --> 00:03:30.994 te nijansama značenja koje ljudi instinktivno razumiju. 00:03:30.994 --> 00:03:35.045 Zbog toga neki istraživači vjeruju da je naše razumijevanje jezika 00:03:35.045 --> 00:03:39.251 jedinstven proizvod biološke strukture našeg mozga. 00:03:39.251 --> 00:03:43.101 Zapravo, jedna od najpoznatijih fiktivnih univerzalnih prevoditelja, 00:03:43.101 --> 00:03:46.439 babilonska ribica iz "Vodiča kroz galaksiju za autostopere", 00:03:46.439 --> 00:03:49.726 nije stroj, već malo stvorenje 00:03:49.726 --> 00:03:54.210 koje prevodi moždane valove i signale živaca vrsta sa sviješću 00:03:54.210 --> 00:03:57.005 jednom vrstom telepatije. 00:03:57.005 --> 00:03:59.726 Za sada, učenje jezika na staromodan način 00:03:59.726 --> 00:04:05.106 i dalje pruža bolje rezultate od trenutno dostupnih računalnih sustava. 00:04:05.106 --> 00:04:06.749 To nije jednostavno, 00:04:06.749 --> 00:04:09.014 a i sam broj jezika na svijetu, 00:04:09.014 --> 00:04:12.989 kao i sve češća interakcija među govornicima tih jezika, 00:04:12.989 --> 00:04:18.004 samo povećava napredak automatiziranog prevođenja. 00:04:18.004 --> 00:04:21.409 Možda ćemo s izvanzemaljskim vrstama koje susretnemo 00:04:21.409 --> 00:04:24.660 moći komunicirati pomoću spravice, 00:04:24.660 --> 00:04:29.026 a možda ćemo ipak morati sastavljati rječnike.