0:00:06.307,0:00:11.306 Hoe komt het dat zoveel[br]buitenaardse wezens in films en op tv 0:00:11.306,0:00:14.213 toevallig perfect Engels spreken? 0:00:14.213,0:00:17.886 Het korte antwoord is dat je[br]geen ruimteschipbemanning wilt zien 0:00:17.886,0:00:21.484 dat jaren bezig is om een woordenboek[br]Buitenaards-Engels samen te stellen. 0:00:21.484,0:00:23.192 Maar om consequent te blijven, 0:00:23.192,0:00:26.789 hebben de makers van Star Trek[br]en andere science-fiction 0:00:26.789,0:00:30.324 een universele vertaler bedacht. 0:00:30.324,0:00:34.822 Een draagbaar apparaat dat ogenblikkelijk[br]alle talen kan vertalen. 0:00:34.822,0:00:38.219 Is zo'n universele vertaler[br]in het echte leven mogelijk? 0:00:38.219,0:00:42.027 Er bestaan al veel programma's[br]die beweren dat te doen. 0:00:42.027,0:00:45.954 Een woord, een zin of een compleet boek[br]in een bepaalde taal 0:00:45.954,0:00:48.784 vertalen naar bijna elke andere taal, 0:00:48.784,0:00:52.247 of het nou modern Engels[br]of Oud-Sanskriet is. 0:00:52.247,0:00:55.913 Als vertalen alleen zou bestaan[br]uit woorden opzoeken in een woordenboek, 0:00:55.913,0:00:59.625 dan zouden die programma's[br]de mens makkelijk verslaan. 0:00:59.625,0:01:03.199 De realiteit is echter veel ingewikkelder. 0:01:03.199,0:01:07.349 Een op regels gebaseerd vertaalprogramma[br]gebruikt een lexicale database, 0:01:07.349,0:01:10.302 die alle woorden bevat[br]die in een woordenboek staan 0:01:10.302,0:01:13.073 met alle grammaticale vormen[br]die ze kunnen hebben, 0:01:13.073,0:01:18.705 en een aantal regels om de taalelementen[br]van de brontaal te herkennen. 0:01:18.705,0:01:22.396 Voor een ogenschijnlijk eenvoudige zin[br]als 'De kinderen eten de muffins' 0:01:22.396,0:01:27.050 zoekt het programma eerst uit[br]wat de syntax of grammaticale structuur is 0:01:27.050,0:01:29.587 door de kinderen[br]als onderwerp te benoemen 0:01:29.587,0:01:32.287 en de rest van de zin als gezegde, 0:01:32.287,0:01:34.328 bestaande uit het werkwoord 'eten' 0:01:34.328,0:01:37.382 en het lijdend voorwerp 'de muffins'. 0:01:37.382,0:01:40.249 Daarna moet het de Engelse[br]woordstructuur herkennen, 0:01:40.249,0:01:44.681 oftewel hoe de taal kan worden opgedeeld[br]in de kleinste stukjes met betekenis, 0:01:44.681,0:01:47.394 zoals het woord 'muffin'[br]en het aanhangsel 's', 0:01:47.394,0:01:49.755 dat het meervoud aangeeft. 0:01:49.755,0:01:52.449 Tot slot moet het de semantiek begrijpen: 0:01:52.449,0:01:56.088 wat de verschillende zinsdelen betekenen. 0:01:56.088,0:01:58.024 Om deze zin netjes te vertalen, 0:01:58.024,0:02:01.982 zou het programma moeten verwijzen[br]naar een andere woordenschat en regels 0:02:01.982,0:02:04.946 voor elk onderdeel in de doeltaal. 0:02:04.946,0:02:06.770 Hier wordt het lastiger. 0:02:06.770,0:02:11.820 Soms kan de syntax van een taal toestaan[br]dat de woordvolgorde niet uitmaakt, 0:02:11.820,0:02:16.774 terwijl dat bij andere talen betekent[br]dat de muffin het kind eet. 0:02:16.774,0:02:19.647 Morfologie kan ook nog[br]roet in het eten gooien. 0:02:19.647,0:02:23.083 Slovenen maken onderscheid[br]tussen twee en drie of meer kinderen 0:02:23.083,0:02:26.847 door twee achtervoegsels te gebruiken[br]die veel andere talen niet hebben, 0:02:26.847,0:02:30.532 terwijl je je door het Russische gebrek[br]aan lidwoorden blijft afvragen 0:02:30.532,0:02:33.575 of de kinderen bepaalde muffins eten, 0:02:33.575,0:02:36.719 of muffins in het algemeen. 0:02:36.719,0:02:39.708 Zelfs als de semantiek technisch klopt, 0:02:39.708,0:02:42.637 kan het programma nog steeds[br]de finesses missen, 0:02:42.637,0:02:45.719 bijvoorbeeld of de kinderen[br]de muffins 'mangiano' 0:02:45.719,0:02:47.714 of 'divorano'. 0:02:47.714,0:02:51.558 Een andere methode is[br]de statistische machinevertaling, 0:02:51.558,0:02:55.762 die een database analyseert[br]met boeken, artikelen en documenten 0:02:55.762,0:02:59.268 die al zijn vertaald door de mens. 0:02:59.268,0:03:02.959 Door overeenkomsten te zoeken[br]tussen de bron en de vertaalde tekst 0:03:02.959,0:03:05.393 die niet toevallig lijken te bestaan, 0:03:05.393,0:03:09.345 kan het programma overeenkomstige[br]uitdrukkingen en patronen vinden, 0:03:09.345,0:03:12.259 en ze gebruiken voor[br]toekomstige vertalingen. 0:03:12.259,0:03:14.839 De kwaliteit van dit soort vertalingen 0:03:14.839,0:03:17.690 hangt echter af[br]van de grootte van de database 0:03:17.690,0:03:23.187 en de aanwezigheid van voorbeelden[br]voor bepaalde talen of schrijfstijlen. 0:03:23.187,0:03:27.140 Het probleem dat computers hebben[br]met uitzonderingen, onregelmatigheden 0:03:27.140,0:03:30.994 en nuances die mensen[br]instinctief aanvoelen, 0:03:30.994,0:03:35.045 hebben bij onderzoekers geleid[br]tot de gedachte dat taalbegrip 0:03:35.045,0:03:39.251 het unieke resultaat is[br]van onze biologische hersenstructuur. 0:03:39.251,0:03:43.101 Een van de beroemdste[br]fictieve universele vertalers, 0:03:43.101,0:03:46.439 Babelvis uit 'The Hitchhiker's[br]Guide to the Galaxy', 0:03:46.439,0:03:49.726 is immers geen machine,[br]maar een klein wezen 0:03:49.726,0:03:54.210 dat de hersengolven en zenuwsignalen[br]van levende soorten vertaalt 0:03:54.210,0:03:57.005 via een soort telepathie. 0:03:57.005,0:03:59.986 Voorlopig geeft het leren van een taal[br]op de ouderwetse manier 0:03:59.986,0:04:04.816 betere resultaten dan[br]welk computerprogramma ook. 0:04:04.816,0:04:06.749 Dat is niet eenvoudig. 0:04:06.749,0:04:09.014 Het grote aantal talen op de wereld 0:04:09.014,0:04:12.989 en de toenemende interactie[br]tussen de sprekers ervan 0:04:12.989,0:04:18.004 zal het automatisch vertalen[br]alleen maar sneller doen verbeteren. 0:04:18.004,0:04:21.409 Tegen de tijd dat we[br]buitenaardse levensvormen ontdekken, 0:04:21.409,0:04:24.660 kunnen we wellicht praten via een gadget, 0:04:24.660,0:04:29.026 of we moeten alsnog[br]dat woordenboek schrijven.