Comment se fait-il que tant de races intergalactiques dans les films et les séries parlent parfaitement l'anglais ? La réponse courte est que personne ne veut voir l'équipage d'un vaisseau passer des années à compiler un dictionnaire alien. Mais pour la cohérence de la chose, les créateurs de Star Trek et d'autres mondes de science-fiction ont introduit le concept d'un traducteur universel, un appareil portatif qui peut traduire instantanément n'importe quelle langue. Peut-on créer un traducteur universel dans la vraie vie ? Il existe déjà de nombreux programmes qui prétendent pourvoir faire cela, en prenant un mot, une phrase, ou un livre entier dans une langue et le traduire dans quasiment n'importe quelle autre langue, que ce soit l'anglais moderne ou l'ancien sanskrit. Et si pour traduire, il suffisait de chercher des mots dans un dictionnaire, ces programmes seraient partout. La réalité est, cependant, un peu plus compliquée. Un programme de traduction basé sur des règles utilise une base de données lexicale, qui inclut tous les mots trouvés dans un dictionnaire et toutes les formes grammaticales qu'elles peuvent contenir, et un jeu de règles permettant de reconnaître les bases des éléments linguistiques de la langue source. Pour un phrase apparemment simple comme « les enfants mangent les muffins », le programme analyse la syntaxe, ou la structure grammaticale, en identifiant « les enfants » comme sujet et le reste de la phrase comme prédicat consistant du verbe « mangent » et du complément d'objet direct « les muffins ». Il doit ensuite reconnaître la morphologie anglaise, ou la séparation de la langue dans ses plus petites unités ayant un sens, comme le mot « muffin » et le suffixe « s », utilisé pour indiquer le pluriel. De plus, il a besoin de comprendre la sémantique, ce que les différentes parties de la phrase veulent dire. Pour traduire cette phrase correctement, le programme devra consulter un jeu de règles et de vocabulaires différents pour chaque élément de la langue cible. Mais c'est là que ça devient compliqué. La syntaxe de certaines langues permet aux mots d'être désordonnés, alors que dans d'autres, cela pourrait conduire au « muffin mange l'enfant ». La morphologie pose aussi un problème. En slovène, on distingue entre deux ans et plus en utilisant d'un double suffixe absent dans la plupart des autres langues, lorsqu'en russe le manque d'articles définis vous fera demander si les enfants mangeaient un type particulier de muffins, ou juste des muffins en général. Finalement, même quand la sémantique est techniquement correcte, le programme peut manquer les points plus complexes, comme si les enfants ont « mangé » les muffins, ou s'ils les ont « dévorés ». L'autre méthode est une machine de traduction statistique, qui analyse une base de données de livres, d'articles et de documents qui ont déjà été traduits par des humains. En trouvant des correspondances entre la source et le texte traduit qui ont peu de chance de se produire par accident, le programme peut identifier des expressions et des schémas correspondants, et les utiliser pour des traductions futures. Cependant, la qualité de ce type de traduction dépend de la taille de la base de données initiale et de la disponibilité d’échantillons pour certaines langues ou styles d'écriture. La difficulté que les ordinateurs ont avec les exceptions, les irrégularités et les nuances du sens qui semblent être instinctives pour les humains a amené certains chercheurs à penser que notre compréhension du langage est un produit propre à la structure biologique de notre cerveau. En fait, un des traducteurs universels fictifs les plus connus, le poisson Babel du « Guide du voyageur galactique », n'est pas du tout une machine, mais une petite créature qui traduit les ondes cérébrales et les signaux nerveux de races sensibles grâce à une forme de télépathie. Pour l'instant, apprendre une langue à l'ancienne vous donnera de meilleurs résultats que n'importe quel logiciel existant. Mais ce n'est pas facile, et le simple nombre de langues dans le monde, en plus des interactions croissantes de personnes qui les parlent, vont seulement continuer à stimuler des avancées dans la traduction automatique. Peut-être que lorsque nous rencontrerons des formes de vie intergalactiques, nous serons capables de communiquer avec eux à travers un petit dispositif, ou peut-être que nous devrons quand même compiler ce petit dictionnaire après tout.