Hoe komt het dat zoveel buitenaardse wezens in films en op tv toevallig perfect Engels spreken? Het korte antwoord is dat je geen ruimteschipbemanning wilt zien dat jaren bezig is om een woordenboek Buitenaards-Engels samen te stellen. Maar om consequent te blijven, hebben de makers van Star Trek en andere science-fiction een universele vertaler bedacht. Een draagbaar apparaat dat ogenblikkelijk alle talen kan vertalen. Is zo'n universele vertaler in het echte leven mogelijk? Er bestaan al veel programma's die beweren dat te doen. Een woord, een zin of een compleet boek in een bepaalde taal vertalen naar bijna elke andere taal, of het nou modern Engels of Oud-Sanskriet is. Als vertalen alleen zou bestaan uit woorden opzoeken in een woordenboek, dan zouden die programma's de mens makkelijk verslaan. De realiteit is echter veel ingewikkelder. Een op regels gebaseerd vertaalprogramma gebruikt een lexicale database, die alle woorden bevat die in een woordenboek staan met alle grammaticale vormen die ze kunnen hebben, en een aantal regels om de taalelementen van de brontaal te herkennen. Voor een ogenschijnlijk eenvoudige zin als 'De kinderen eten de muffins' zoekt het programma eerst uit wat de syntax of grammaticale structuur is door de kinderen als onderwerp te benoemen en de rest van de zin als gezegde, bestaande uit het werkwoord 'eten' en het lijdend voorwerp 'de muffins'. Daarna moet het de Engelse woordstructuur herkennen, oftewel hoe de taal kan worden opgedeeld in de kleinste stukjes met betekenis, zoals het woord 'muffin' en het aanhangsel 's', dat het meervoud aangeeft. Tot slot moet het de semantiek begrijpen: wat de verschillende zinsdelen betekenen. Om deze zin netjes te vertalen, zou het programma moeten verwijzen naar een andere woordenschat en regels voor elk onderdeel in de doeltaal. Hier wordt het lastiger. Soms kan de syntax van een taal toestaan dat de woordvolgorde niet uitmaakt, terwijl dat bij andere talen betekent dat de muffin het kind eet. Morfologie kan ook nog roet in het eten gooien. Slovenen maken onderscheid tussen twee en drie of meer kinderen door twee achtervoegsels te gebruiken die veel andere talen niet hebben, terwijl je je door het Russische gebrek aan lidwoorden blijft afvragen of de kinderen bepaalde muffins eten, of muffins in het algemeen. Zelfs als de semantiek technisch klopt, kan het programma nog steeds de finesses missen, bijvoorbeeld of de kinderen de muffins 'mangiano' of 'divorano'. Een andere methode is de statistische machinevertaling, die een database analyseert met boeken, artikelen en documenten die al zijn vertaald door de mens. Door overeenkomsten te zoeken tussen de bron en de vertaalde tekst die niet toevallig lijken te bestaan, kan het programma overeenkomstige uitdrukkingen en patronen vinden, en ze gebruiken voor toekomstige vertalingen. De kwaliteit van dit soort vertalingen hangt echter af van de grootte van de database en de aanwezigheid van voorbeelden voor bepaalde talen of schrijfstijlen. Het probleem dat computers hebben met uitzonderingen, onregelmatigheden en nuances die mensen instinctief aanvoelen, hebben bij onderzoekers geleid tot de gedachte dat taalbegrip het unieke resultaat is van onze biologische hersenstructuur. Een van de beroemdste fictieve universele vertalers, Babelvis uit 'The Hitchhiker's Guide to the Galaxy', is immers geen machine, maar een klein wezen dat de hersengolven en zenuwsignalen van levende soorten vertaalt via een soort telepathie. Voorlopig geeft het leren van een taal op de ouderwetse manier betere resultaten dan welk computerprogramma ook. Dat is niet eenvoudig. Het grote aantal talen op de wereld en de toenemende interactie tussen de sprekers ervan zal het automatisch vertalen alleen maar sneller doen verbeteren. Tegen de tijd dat we buitenaardse levensvormen ontdekken, kunnen we wellicht praten via een gadget, of we moeten alsnog dat woordenboek schrijven.