Hogyan lehetséges, hogy sok, filmekben és tévében szereplő intergalaktikus faj tökéletesen beszél angolul? A rövid válasz az, hogy senki nem akarja végignézni, ahogy egy csillaghajó legénysége éveket tölt egy szótár összeállításával. De hogy következetesek maradjanak, a Star Trek és más tudományos-fantasztikus világok alkotói, bevezették az univerzális fordítóeszköz fogalmát. Ez egy hordozható eszköz, amely azonnal fordít bármely két nyelv között. Létezik ilyen univerzális fordítóeszköz a valóságban? Sok program tudja elvileg megcsinálni azt, hogy vesz egy szót, mondatot, vagy egy egész könyvet egy nyelven és lefordítja szinte bármely másikra, legyen az mai angol vagy ősi szanszkrit. És ha a fordítás csak annyiból állna, hogy megtaláljunk szavakat a szótárban, ezek a programok leköröznék az embereket. A valóság azonban egy kicsit bonyolultabb. A szabályokon alapuló fordítóprogram lexikális adatbázist használ, ami tartalmaz minden szótárban megtalálható szót, annak minden lehetséges nyelvtani alakjával, és egy szabályhalmazt, amivel felismeri a nyelvészeti alkotóelemeket a bemeneti nyelvben. Egy olyan egyszerűnek tűnő mondatot, mint "The children eat the muffins," a program először szintaktikailag elemez, vagyis a nyelvtani struktúrát nézi, és azonosítja, hogy a "the children" az alany, és a mondat további része az állítmány, ami az "eat" igéből és a "the muffins" tárgyból áll. Ezután következik az angol morfológiai elemzés, avagy hogyan lehet a nyelvet a legkisebb értelmes egységekre bontani, mint például a "muffin" szó és az "s" utótag, ami [az angolban] a többesszámot jelenti. Végül értenie kell a szemantikát, vagyis a mondat különböző részeinek jelentését. A mondat megfelelő lefordításához a program a célnyelv minden egyes elemére egy másik szó- és szabályhalmazt alkalmaz. És itt válik trükkössé a dolog. Pár nyelv szintaxisa lehetővé teszi, hogy a szavak bármilyen sorrendben legyenek, míg más nyelveken, ha így teszünk, akkor a muffin eszi meg a gyereket. A morfológia is problémás lehet. A szlovén különbséget tesz kettő, és három vagy több gyerek között a más nyelveken nem létező dupla utótag használatával. Az oroszban pedig a határozott névelők hiánya miatt azon gondolkodsz, hogy a gyerekek néhány konkrét muffint esznek vagy csak általában esznek muffint. Végül, még ha a szemantika gyakorlatilag helyes is, a program eltévesztheti a finomabb részleteket, mint például, hogy a gyerekek "mangiano" (megeszik) a muffinokat, vagy "divorano" (felfalják) azokat. Egy másik módszer a statisztikai gépi fordítás, ami egy olyan könyvekből, cikkekből és dokumentumokból álló adatbázist elemez, amit emberek már lefordítottak. Ha egyezéseket talál a forrás- és a célszövegek között, amik nem valószínű, hogy véletlenül fordulnak elő, a program összetartozó frázisokat és mintázatokat azonosíthat, és használhatja őket jövőbeni fordításokban. Viszont az effajta fordítás minősége függ a kezdeti adatbázis nagyságától, és attól, hogy mennyi minta áll rendelkezésre bizonyos nyelveken illetve bizonyos stílusú írásokból. Az emberek számára ösztönösen érezhető kivételek, szabálytalanságok és jelentésárnyalatok, amik a gépeknek nehézséget okoznak, azt a benyomást keltik a kutatókban, hogy a nyelv megértése biológiai agyunk struktúrájának egyedi terméke. Az egyik legismertebb kitalált univerzális fordítóeszköz, a Bábel-hal, a Galaxis útikalauz stopposoknak című alkotásból, valójában nem is egy gép, hanem egy apró teremtmény, amely az élőlények agyhullámait és idegjelzéseit egyféle telepátián keresztül fordítja le. Egyelőre a régimódi nyelvtanulás még mindig jobb eredményeket hoz, mint bármelyik jelenleg elérhető számítógépes program. De ez nem egyszerű feladat, a világ nyelveinek puszta száma, illetve a növekvő interakció a nyelveket beszélők között, továbbra is viszi előre az automatizált fordítás fejlesztését. Talán mire találkozunk az intergalaktikus életformákkal, tudunk majd kommunikálni velük egy apró kütyüvel. Vagy lehet mégis el kell kezdenünk összeállítani azt a szótárat.