Hoe komt het dat zoveel
buitenaardse wezens in films en op tv

toevallig perfect Engels spreken?

Het korte antwoord is dat je
geen ruimteschipbemanning wilt zien

dat jaren bezig is om een woordenboek
Buitenaards-Engels samen te stellen.

Maar om consequent te blijven,

hebben de makers van Star Trek
en andere science-fiction

een universele vertaler bedacht.

Een draagbaar apparaat dat ogenblikkelijk
alle talen kan vertalen.

Is zo'n universele vertaler
in het echte leven mogelijk?

Er bestaan al veel programma's
die beweren dat te doen.

Een woord, een zin of een compleet boek
in een bepaalde taal

vertalen naar bijna elke andere taal,

of het nou modern Engels
of Oud-Sanskriet is.

Als vertalen alleen zou bestaan
uit woorden opzoeken in een woordenboek,

dan zouden die programma's
de mens makkelijk verslaan.

De realiteit is echter veel ingewikkelder.

Een op regels gebaseerd vertaalprogramma
gebruikt een lexicale database,

die alle woorden bevat
die in een woordenboek staan

met alle grammaticale vormen
die ze kunnen hebben,

en een aantal regels om de taalelementen
van de brontaal te herkennen.

Voor een ogenschijnlijk eenvoudige zin
als 'De kinderen eten de muffins'

zoekt het programma eerst uit
wat de syntax of grammaticale structuur is

door de kinderen
als onderwerp te benoemen

en de rest van de zin als gezegde,

bestaande uit het werkwoord 'eten'

en het lijdend voorwerp 'de muffins'.

Daarna moet het de Engelse
woordstructuur herkennen,

oftewel hoe de taal kan worden opgedeeld
in de kleinste stukjes met betekenis,

zoals het woord 'muffin'
en het aanhangsel 's',

dat het meervoud aangeeft.

Tot slot moet het de semantiek begrijpen:

wat de verschillende zinsdelen betekenen.

Om deze zin netjes te vertalen,

zou het programma moeten verwijzen
naar een andere woordenschat en regels

voor elk onderdeel in de doeltaal.

Hier wordt het lastiger.

Soms kan de syntax van een taal toestaan
dat de woordvolgorde niet uitmaakt,

terwijl dat bij andere talen betekent
dat de muffin het kind eet.

Morfologie kan ook nog
roet in het eten gooien.

Slovenen maken onderscheid
tussen twee en drie of meer kinderen

door twee achtervoegsels te gebruiken
die veel andere talen niet hebben,

terwijl je je door het Russische gebrek
aan lidwoorden blijft afvragen

of de kinderen bepaalde muffins eten,

of muffins in het algemeen.

Zelfs als de semantiek technisch klopt,

kan het programma nog steeds
de finesses missen,

bijvoorbeeld of de kinderen
de muffins 'mangiano'

of 'divorano'.

Een andere methode is
de statistische machinevertaling,

die een database analyseert
met boeken, artikelen en documenten

die al zijn vertaald door de mens.

Door overeenkomsten te zoeken
tussen de bron en de vertaalde tekst

die niet toevallig lijken te bestaan,

kan het programma overeenkomstige
uitdrukkingen en patronen vinden,

en ze gebruiken voor
toekomstige vertalingen.

De kwaliteit van dit soort vertalingen

hangt echter af
van de grootte van de database

en de aanwezigheid van voorbeelden
voor bepaalde talen of schrijfstijlen.

Het probleem dat computers hebben
met uitzonderingen, onregelmatigheden

en nuances die mensen
instinctief aanvoelen,

hebben bij onderzoekers geleid
tot de gedachte dat taalbegrip

het unieke resultaat is
van onze biologische hersenstructuur.

Een van de beroemdste
fictieve universele vertalers,

Babelvis uit 'The Hitchhiker's
Guide to the Galaxy',

is immers geen machine,
maar een klein wezen

dat de hersengolven en zenuwsignalen
van levende soorten vertaalt

via een soort telepathie.

Voorlopig geeft het leren van een taal
op de ouderwetse manier

betere resultaten dan
welk computerprogramma ook.

Dat is niet eenvoudig.

Het grote aantal talen op de wereld

en de toenemende interactie
tussen de sprekers ervan

zal het automatisch vertalen
alleen maar sneller doen verbeteren.

Tegen de tijd dat we
buitenaardse levensvormen ontdekken,

kunnen we wellicht praten via een gadget,

of we moeten alsnog
dat woordenboek schrijven.