Hogyan lehetséges, hogy sok, filmekben
és tévében szereplő intergalaktikus faj
tökéletesen beszél angolul?
A rövid válasz az, hogy senki
nem akarja végignézni,
ahogy egy csillaghajó legénysége
éveket tölt egy szótár összeállításával.
De hogy következetesek
maradjanak, a Star Trek
és más tudományos-fantasztikus
világok alkotói,
bevezették az univerzális
fordítóeszköz fogalmát.
Ez egy hordozható eszköz, amely
azonnal fordít bármely két nyelv között.
Létezik ilyen univerzális
fordítóeszköz a valóságban?
Sok program tudja elvileg megcsinálni azt,
hogy vesz egy szót, mondatot,
vagy egy egész könyvet egy nyelven
és lefordítja szinte bármely másikra,
legyen az mai angol vagy ősi szanszkrit.
És ha a fordítás csak annyiból állna,
hogy megtaláljunk szavakat a szótárban,
ezek a programok leköröznék az embereket.
A valóság azonban egy kicsit bonyolultabb.
A szabályokon alapuló fordítóprogram
lexikális adatbázist használ,
ami tartalmaz minden szótárban
megtalálható szót,
annak minden lehetséges nyelvtani
alakjával, és egy szabályhalmazt,
amivel felismeri a nyelvészeti
alkotóelemeket a bemeneti nyelvben.
Egy olyan egyszerűnek tűnő mondatot, mint
"The children eat the muffins,"
a program először szintaktikailag elemez,
vagyis a nyelvtani struktúrát nézi,
és azonosítja, hogy
a "the children" az alany,
és a mondat további része az állítmány,
ami az "eat" igéből
és a "the muffins" tárgyból áll.
Ezután következik
az angol morfológiai elemzés,
avagy hogyan lehet a nyelvet
a legkisebb értelmes egységekre bontani,
mint például a "muffin" szó
és az "s" utótag, ami [az angolban]
a többesszámot jelenti.
Végül értenie kell a szemantikát,
vagyis a mondat különböző
részeinek jelentését.
A mondat megfelelő lefordításához
a program a célnyelv minden egyes elemére
egy másik szó- és szabályhalmazt alkalmaz.
És itt válik trükkössé a dolog.
Pár nyelv szintaxisa lehetővé teszi, hogy
a szavak bármilyen sorrendben legyenek,
míg más nyelveken, ha így teszünk,
akkor a muffin eszi meg a gyereket.
A morfológia is problémás lehet.
A szlovén különbséget tesz kettő,
és három vagy több gyerek között
a más nyelveken nem létező
dupla utótag használatával.
Az oroszban pedig a határozott névelők
hiánya miatt azon gondolkodsz,
hogy a gyerekek néhány
konkrét muffint esznek
vagy csak általában esznek muffint.
Végül, még ha a szemantika
gyakorlatilag helyes is,
a program eltévesztheti
a finomabb részleteket,
mint például, hogy a gyerekek
"mangiano" (megeszik) a muffinokat,
vagy "divorano" (felfalják) azokat.
Egy másik módszer
a statisztikai gépi fordítás,
ami egy olyan könyvekből, cikkekből és
dokumentumokból álló adatbázist elemez,
amit emberek már lefordítottak.
Ha egyezéseket talál a forrás-
és a célszövegek között,
amik nem valószínű, hogy
véletlenül fordulnak elő,
a program összetartozó frázisokat
és mintázatokat azonosíthat,
és használhatja őket
jövőbeni fordításokban.
Viszont az effajta fordítás minősége
függ a kezdeti adatbázis nagyságától,
és attól, hogy mennyi minta áll
rendelkezésre bizonyos nyelveken
illetve bizonyos stílusú írásokból.
Az emberek számára
ösztönösen érezhető kivételek,
szabálytalanságok és jelentésárnyalatok,
amik a gépeknek nehézséget okoznak,
azt a benyomást keltik a kutatókban,
hogy a nyelv megértése
biológiai agyunk struktúrájának
egyedi terméke.
Az egyik legismertebb
kitalált univerzális fordítóeszköz,
a Bábel-hal, a Galaxis útikalauz
stopposoknak című alkotásból,
valójában nem is egy gép,
hanem egy apró teremtmény,
amely az élőlények agyhullámait
és idegjelzéseit egyféle telepátián
keresztül fordítja le.
Egyelőre a régimódi nyelvtanulás
még mindig jobb eredményeket hoz,
mint bármelyik jelenleg elérhető
számítógépes program.
De ez nem egyszerű feladat,
a világ nyelveinek puszta száma,
illetve a növekvő interakció
a nyelveket beszélők között,
továbbra is viszi előre
az automatizált fordítás fejlesztését.
Talán mire találkozunk
az intergalaktikus életformákkal,
tudunk majd kommunikálni velük
egy apró kütyüvel.
Vagy lehet mégis el kell kezdenünk
összeállítani azt a szótárat.