WEBVTT 00:00:06.477 --> 00:00:11.306 Како то да толико интергалактичких врста у филмовима и на телевизији 00:00:11.306 --> 00:00:14.483 савршено говори енглески језик? 00:00:14.483 --> 00:00:17.886 Одговор укратко је да нико не жели да гледа посаду свемирског брода 00:00:17.886 --> 00:00:21.384 како проводи године у састављању ванземаљског речника. 00:00:21.384 --> 00:00:23.082 Ипак, да би ствари остале складне, 00:00:23.082 --> 00:00:26.789 творци „Звезданих стаза“ и других научнофантастичних светова 00:00:26.789 --> 00:00:30.334 представили су концепт универзалног преводиоца, 00:00:30.334 --> 00:00:35.012 преносног уређаја који истог тренутка може да преводи било који језик. 00:00:35.012 --> 00:00:38.249 Па, да ли је универзални преводилац могућ у стварном животу? 00:00:38.249 --> 00:00:41.807 Већ имамо многе програме који тврде да раде управо то - 00:00:41.807 --> 00:00:46.134 да узимају реч, реченицу или целу књигу на једном језику 00:00:46.134 --> 00:00:48.814 и преводе је на скоро сваки други језик, 00:00:48.814 --> 00:00:52.337 било да је у питању модерни енглески или древни санскрит. 00:00:52.337 --> 00:00:56.063 Када би се преводи сводили на пуко тражење речи у речнику, 00:00:56.063 --> 00:00:59.545 ови програми би далеко надмашили људе. 00:00:59.545 --> 00:01:02.969 Стварност је, међутим, малчице компликованија. 00:01:02.969 --> 00:01:07.209 Преводилачки програм заснован на правилима користи лексичку базу података 00:01:07.209 --> 00:01:10.302 која укључује све речи које се могу наћи у речнику 00:01:10.302 --> 00:01:13.013 и све граматичке облике које могу попримити, 00:01:13.013 --> 00:01:15.035 као и скуп правила за препознавање 00:01:15.035 --> 00:01:18.925 основних лингвистичких елемената из улазног језика. 00:01:18.925 --> 00:01:22.576 За наизглед једноставну реченицу као што је „Деца једу мафине“, 00:01:22.576 --> 00:01:26.890 програм прво рашчлањује њену синтаксу или граматичку структуру 00:01:26.890 --> 00:01:29.587 тако што препознаје реч „деца“ као субјекат, 00:01:29.587 --> 00:01:32.237 а остатак реченице као предикат, 00:01:32.237 --> 00:01:34.368 који се састоји од глагола „јести“ 00:01:34.368 --> 00:01:37.192 и директног објекта, „мафине“. 00:01:37.192 --> 00:01:40.209 Затим треба да препозна енглеску морфологију 00:01:40.209 --> 00:01:44.681 или како се језик може разложити на мање значењске јединице, 00:01:44.681 --> 00:01:46.124 као што је реч „мафин“ 00:01:46.124 --> 00:01:49.655 и енглески суфикс „с“, који се користи за означавање множине. 00:01:49.655 --> 00:01:52.449 На крају, потребно је да разуме семантику, 00:01:52.449 --> 00:01:55.788 то јест, шта различити делови реченице заиста значе. 00:01:55.788 --> 00:01:57.914 Да би превео ову реченицу ваљано, 00:01:57.914 --> 00:02:01.982 програм ће се ослонити на различите скупове речника и правила 00:02:01.982 --> 00:02:04.816 за сваки елемент циљног језика. 00:02:04.816 --> 00:02:06.840 Међутим, овде ствари постају компликоване. 00:02:06.840 --> 00:02:09.160 Синтакса неких језика дозвољава 00:02:09.160 --> 00:02:11.820 да речи буду распоређене на било који начин, 00:02:11.820 --> 00:02:16.684 док би код других, на тај начин, мафин јео дете. 00:02:16.684 --> 00:02:19.347 Морфологија, такође, може представљати проблем. 00:02:19.347 --> 00:02:22.993 Словеначки језик прави разлику између двоје и троје деце, 00:02:22.993 --> 00:02:26.747 користећи двојни суфикс који не постоји у многим другим језицима, 00:02:26.747 --> 00:02:30.532 док вас непостојање одређених чланова у руском може оставити са питањем 00:02:30.532 --> 00:02:33.575 да ли деца једу неке посебне мафине 00:02:33.575 --> 00:02:36.559 или једу мафине уопште. 00:02:36.559 --> 00:02:39.828 Коначно, чак и када је семантика технички тачна, 00:02:39.828 --> 00:02:42.707 програм може испустити финесе, 00:02:42.707 --> 00:02:45.539 као што су да ли деца једу мафине 00:02:45.539 --> 00:02:47.524 или их прождиру (на италијанском). 00:02:47.524 --> 00:02:51.378 Још један метод је статистички машински превод, 00:02:51.378 --> 00:02:55.912 који анализира базу података књига, чланака и докумената 00:02:55.912 --> 00:02:59.108 које су људи већ превели. 00:02:59.108 --> 00:03:02.959 Проналажењем подударности између извора и преведеног текста 00:03:02.959 --> 00:03:05.393 које се ретко случајно јављају, 00:03:05.393 --> 00:03:09.345 програм може да препозна одговарајуће фразе и обрасце 00:03:09.345 --> 00:03:12.259 и да их користи за будуће преводе. 00:03:12.259 --> 00:03:14.969 Међутим, квалитет оваквог превођења 00:03:14.969 --> 00:03:17.690 зависи од опширности почетне базе података, 00:03:17.690 --> 00:03:21.357 као и доступности узорака за одређене језике 00:03:21.357 --> 00:03:23.073 или стилова писања. 00:03:23.073 --> 00:03:27.140 Потешкоће које компјутери имају везане за изузетке, неправилности 00:03:27.140 --> 00:03:30.994 и нијансе у значењу за које се чини да су људима урођене 00:03:30.994 --> 00:03:35.045 навеле су неке истраживаче да поверују да је наше разумевање језика 00:03:35.045 --> 00:03:38.981 јединствени производ наше биолошке мождане структуре. 00:03:38.981 --> 00:03:43.261 Заправо, један од најпознатијих фиктивних универзалних преводилаца, 00:03:43.261 --> 00:03:46.439 вавилонска рибица из „Аутостоперског водича кроз галаксију“ 00:03:46.439 --> 00:03:49.936 није уопште машина, већ мало створење које преводи 00:03:49.936 --> 00:03:54.370 мождане таласе и нервне сигнале врста које осећају надржаје 00:03:54.370 --> 00:03:56.865 кроз облик телепатије. 00:03:56.865 --> 00:03:59.896 За сада, учење језика на старомодан начин 00:03:59.896 --> 00:04:04.976 даће вам боље резултате него било који тренутно доступан програм. 00:04:04.976 --> 00:04:06.749 Међутим, ово није лак задатак, 00:04:06.749 --> 00:04:09.214 а бројност светских језика, 00:04:09.214 --> 00:04:12.899 као и повећана интеракција између људи који их користе 00:04:12.899 --> 00:04:18.004 само ће наставити да подстичу развој аутоматског превођења. 00:04:18.004 --> 00:04:21.409 Можда ћемо, када се будемо срели са интергалактичким животним облицима, 00:04:21.409 --> 00:04:25.070 моћи да комуницирамо са њима кроз малену направу, 00:04:25.070 --> 00:04:29.026 или ћемо можда ипак морати да започнемо састављање оног речника.