0:00:06.433,0:00:11.306 Zašto brojne intergalaktičke vrste [br]u filmovima i na TV-u 0:00:11.306,0:00:14.141 sasvim slučajno savršeno govore engleski? 0:00:14.321,0:00:17.886 Ukratko, jer nitko ne želi gledati[br]posadu svemirske letjelice 0:00:17.886,0:00:21.496 kako godinama sastavlja [br]izvanzemaljski rječnik. 0:00:21.654,0:00:23.079 Zbog dosljednosti, 0:00:23.079,0:00:26.789 tvorci Zvjezdanih staza[br]i drugih znanstveno-fantastičnih svjetova 0:00:26.789,0:00:30.514 uveli su ideju univerzalnog prevoditelja, 0:00:30.514,0:00:35.012 prijenosnog uređaja[br]koji brzo prevodi bilo koji jezik. 0:00:35.012,0:00:38.409 Može li univerzalni prevoditelj[br]postojati u stvarnom svijetu? 0:00:38.409,0:00:42.137 Već postoje brojni programi[br]koji to navodno mogu. 0:00:42.137,0:00:45.954 Riječ, rečenicu, ili čak cijelu knjigu[br]na nekom jeziku 0:00:45.954,0:00:48.414 prevode na bilo koji drugi jezik, 0:00:48.774,0:00:51.767 bio to suvremeni engleski jezik[br]ili drevni sanskrt. 0:00:52.337,0:00:55.913 Kada bi se prevođenje [br]svodilo na traženje riječi u rječniku, 0:00:55.913,0:00:59.335 ti bi programi odmah nadmašili ljude. 0:00:59.685,0:01:02.739 Zapravo, stvar nije tako jednostavna. 0:01:03.119,0:01:07.349 Sustav za prevođenje temeljen na pravilima[br]prevodi pomoću leksičke baze podataka. 0:01:07.349,0:01:10.302 U njoj se nalaze sve riječi[br]koje se mogu naći i u rječniku 0:01:10.302,0:01:12.843 i svi njihovi mogući gramatički oblici 0:01:13.167,0:01:18.615 te skup pravila kojima se prepoznaju[br]jezični elementi izvornog jezika. 0:01:18.925,0:01:22.396 Za naizgled jednostavnu rečenicu, kao[br]"Djeca jedu kolače", 0:01:22.396,0:01:27.050 program prvo raščlanjuje sintaksu,[br]to jest gramatičke strukture, 0:01:27.050,0:01:29.587 prepoznajući djecu kao subjekt, 0:01:29.587,0:01:31.917 a ostatak rečenice kao predikat 0:01:32.187,0:01:34.368 koji se sastoji od glagola ,"jedu", 0:01:34.368,0:01:37.032 i izravnog objekta "kolače". 0:01:37.282,0:01:40.249 Zatim prepoznaje morfološku strukturu, 0:01:40.249,0:01:44.681 to jest, kako se jezik razlaže[br]na najmanje značenjske jedinice. 0:01:44.681,0:01:46.124 Tako prepoznaje riječ "kolač" 0:01:46.124,0:01:49.755 i sufiks "e" koji označava množinu. 0:01:49.755,0:01:52.449 Na kraju, mora razumjeti semantiku, 0:01:52.449,0:01:55.908 koje je značenje rečeničnih djelova. 0:01:56.178,0:01:58.074 Za pravilan prijevod ove rečenice, 0:01:58.074,0:02:01.982 program u obzir uzima[br]brojne skupove rječničkih unosa i pravila 0:02:01.982,0:02:04.486 za svaki element u ciljnom jeziku. 0:02:04.816,0:02:06.889 Ovdje stvar postaje komplicirana. 0:02:06.889,0:02:11.820 Sintaksa nekih jezika[br]omogućuje slobodan raspored riječi, 0:02:11.820,0:02:16.954 za druge bi primjena tog pravila[br]uzrokovala da kolač jede dijete. 0:02:16.954,0:02:19.647 I morfologija može biti problem. 0:02:19.647,0:02:23.243 Slovenski razlikuje [br]dvoje djece od troje ili više 0:02:23.243,0:02:27.097 jer ima sufiks koji označava dvojinu,[br]za razliku od brojnih drugih jezika. 0:02:27.097,0:02:30.532 Ruski nema određene članove[br]te više nije jasno 0:02:30.532,0:02:33.325 jedu li djeca neke određene kolače 0:02:33.325,0:02:36.109 ili bilo koje kolače. 0:02:36.519,0:02:39.708 Na kraju, kada je[br]i semantika otprilike točna, 0:02:39.708,0:02:42.757 program ponekad ne uhvati finese, 0:02:42.757,0:02:45.809 kao "mangiano" (jedu) li djeca kolače 0:02:45.809,0:02:47.794 ili ih pak "divorano" (proždiru). 0:02:47.794,0:02:51.558 Postoje i sustavi za[br]statističko strojno prevođenje 0:02:51.558,0:02:55.762 koji analiziraju [br]baze knjiga, članaka i dokumenata 0:02:55.762,0:02:59.488 koje su ljudi već preveli. 0:02:59.488,0:03:02.959 Pronalaze podudarnosti[br]izvornog i ciljnog teksta 0:03:02.959,0:03:05.393 koje najvjerojatnije nisu slučajne 0:03:05.393,0:03:09.345 te određuju[br]odgovarajuće fraze i uzorke 0:03:09.345,0:03:12.429 koje koriste za buduće prijevode. 0:03:12.429,0:03:14.969 Unatoč tome, kvaliteta te vrste prijevoda 0:03:14.969,0:03:17.690 ovisi o veličini početne baze podataka 0:03:17.690,0:03:21.357 i dostupnosti uzoraka za određene jezike 0:03:21.357,0:03:23.383 ili stilove pisanja. 0:03:23.383,0:03:27.140 Računala imaju poteškoće[br]s iznimkama i nepravilnostima 0:03:27.140,0:03:30.994 te nijansama značenja[br]koje ljudi instinktivno razumiju. 0:03:30.994,0:03:35.045 Zbog toga neki istraživači vjeruju[br]da je naše razumijevanje jezika 0:03:35.045,0:03:39.251 jedinstven proizvod[br]biološke strukture našeg mozga. 0:03:39.251,0:03:43.101 Zapravo, jedna od najpoznatijih [br]fiktivnih univerzalnih prevoditelja, 0:03:43.101,0:03:46.439 babilonska ribica[br]iz "Vodiča kroz galaksiju za autostopere", 0:03:46.439,0:03:49.726 nije stroj, već malo stvorenje 0:03:49.726,0:03:54.210 koje prevodi moždane valove[br]i signale živaca vrsta sa sviješću 0:03:54.210,0:03:57.005 jednom vrstom telepatije. 0:03:57.005,0:03:59.726 Za sada, učenje jezika na staromodan način 0:03:59.726,0:04:05.106 i dalje pruža bolje rezultate [br]od trenutno dostupnih računalnih sustava. 0:04:05.106,0:04:06.749 To nije jednostavno, 0:04:06.749,0:04:09.014 a i sam broj jezika na svijetu, 0:04:09.014,0:04:12.989 kao i sve češća interakcija[br]među govornicima tih jezika, 0:04:12.989,0:04:18.004 samo povećava [br]napredak automatiziranog prevođenja. 0:04:18.004,0:04:21.409 Možda ćemo s izvanzemaljskim vrstama[br]koje susretnemo 0:04:21.409,0:04:24.660 moći komunicirati pomoću spravice, 0:04:24.660,0:04:29.026 a možda ćemo ipak[br]morati sastavljati rječnike.