0:00:06.677,0:00:08.306 Comment se fait-il [br] 0:00:08.306,0:00:11.306 que tant de races intergalactiques[br]dans les films et les séries 0:00:11.306,0:00:14.483 parlent parfaitement l'anglais ? 0:00:14.483,0:00:17.886 La réponse courte est que personne[br]ne veut voir l'équipage d'un vaisseau 0:00:17.886,0:00:21.774 passer des années[br]à compiler un dictionnaire alien. 0:00:21.774,0:00:23.392 Mais pour la cohérence[br]de la chose, 0:00:23.392,0:00:26.789 les créateurs de Star Trek et[br]d'autres mondes de science-fiction 0:00:26.789,0:00:30.514 ont introduit le concept[br]d'un traducteur universel, 0:00:30.514,0:00:35.012 un appareil portatif qui peut traduire[br]instantanément n'importe quelle langue. 0:00:35.012,0:00:38.539 Peut-on créer un traducteur universel[br]dans la vraie vie ? 0:00:38.539,0:00:42.137 Il existe déjà de nombreux programmes[br]qui prétendent pourvoir faire cela, 0:00:42.137,0:00:45.954 en prenant un mot, une phrase,[br]ou un livre entier dans une langue 0:00:45.954,0:00:49.004 et le traduire dans quasiment[br]n'importe quelle autre langue, 0:00:49.004,0:00:52.337 que ce soit l'anglais moderne ou[br]l'ancien sanskrit. 0:00:52.337,0:00:55.913 Et si pour traduire, il suffisait[br]de chercher des mots dans un dictionnaire, 0:00:55.913,0:00:59.825 ces programmes seraient partout. 0:00:59.825,0:01:03.299 La réalité est, cependant,[br]un peu plus compliquée. 0:01:03.299,0:01:04.569 Un programme de traduction 0:01:04.569,0:01:07.349 basé sur des règles utilise[br]une base de données lexicale, 0:01:07.349,0:01:10.302 qui inclut tous les mots[br]trouvés dans un dictionnaire 0:01:10.302,0:01:13.283 et toutes les formes grammaticales [br]qu'elles peuvent contenir, 0:01:13.283,0:01:15.925 et un jeu de règles[br]permettant de reconnaître 0:01:15.925,0:01:18.925 les bases des éléments linguistiques[br]de la langue source. 0:01:18.925,0:01:22.506 Pour un phrase apparemment simple[br]comme « les enfants mangent les muffins », 0:01:22.506,0:01:27.050 le programme analyse la syntaxe,[br]ou la structure grammaticale, 0:01:27.050,0:01:29.587 en identifiant « les enfants » comme sujet 0:01:29.587,0:01:32.317 et le reste de la phrase comme prédicat 0:01:32.317,0:01:34.368 consistant du verbe « mangent » 0:01:34.368,0:01:37.422 et du complément d'objet direct [br]« les muffins ». 0:01:37.422,0:01:40.249 Il doit ensuite reconnaître[br]la morphologie anglaise, 0:01:40.249,0:01:44.681 ou la séparation de la langue dans[br]ses plus petites unités ayant un sens, 0:01:44.681,0:01:46.124 comme le mot « muffin » 0:01:46.124,0:01:49.755 et le suffixe « s »,[br]utilisé pour indiquer le pluriel. 0:01:49.755,0:01:52.449 De plus, il a besoin[br]de comprendre la sémantique, 0:01:52.449,0:01:56.178 ce que les différentes parties de[br]la phrase veulent dire. 0:01:56.178,0:01:58.074 Pour traduire[br]cette phrase correctement, 0:01:58.074,0:02:01.982 le programme devra consulter un jeu[br]de règles et de vocabulaires différents 0:02:01.982,0:02:05.166 pour chaque élément de la langue cible. 0:02:05.166,0:02:07.020 Mais c'est là que ça devient compliqué. 0:02:07.020,0:02:11.820 La syntaxe de certaines langues[br]permet aux mots d'être désordonnés, 0:02:11.820,0:02:13.954 alors que dans d'autres, 0:02:13.954,0:02:16.954 cela pourrait conduire[br]au « muffin mange l'enfant ». 0:02:16.954,0:02:19.647 La morphologie pose aussi un problème. 0:02:19.647,0:02:23.243 En slovène, on distingue entre[br]deux ans et plus 0:02:23.243,0:02:27.097 en utilisant d'un double suffixe[br]absent dans la plupart des autres langues, 0:02:27.097,0:02:30.532 lorsqu'en russe le manque d'articles[br]définis vous fera demander 0:02:30.532,0:02:33.575 si les enfants mangeaient[br]un type particulier de muffins, 0:02:33.575,0:02:36.679 ou juste des muffins en général. 0:02:36.679,0:02:39.708 Finalement, même quand la sémantique[br]est techniquement correcte, 0:02:39.708,0:02:42.757 le programme peut manquer[br]les points plus complexes, 0:02:42.757,0:02:45.809 comme si les enfants[br]ont « mangé » les muffins, 0:02:45.809,0:02:47.794 ou s'ils les ont « dévorés ». 0:02:47.794,0:02:51.558 L'autre méthode est [br]une machine de traduction statistique, 0:02:51.558,0:02:55.762 qui analyse une base de données de livres,[br]d'articles et de documents 0:02:55.762,0:02:59.488 qui ont déjà été traduits par des humains. 0:02:59.488,0:03:02.959 En trouvant des correspondances[br]entre la source et le texte traduit 0:03:02.959,0:03:05.393 qui ont peu de chance[br]de se produire par accident, 0:03:05.393,0:03:09.345 le programme peut identifier des[br]expressions et des schémas correspondants, 0:03:09.345,0:03:12.429 et les utiliser pour[br]des traductions futures. 0:03:12.429,0:03:14.969 Cependant, la qualité[br]de ce type de traduction 0:03:14.969,0:03:17.690 dépend de la taille[br]de la base de données initiale 0:03:17.690,0:03:21.357 et de la disponibilité d’échantillons[br]pour certaines langues 0:03:21.357,0:03:23.383 ou styles d'écriture. 0:03:23.383,0:03:27.140 La difficulté que les ordinateurs ont[br]avec les exceptions, les irrégularités 0:03:27.140,0:03:30.994 et les nuances du sens qui semblent[br]être instinctives pour les humains 0:03:30.994,0:03:35.045 a amené certains chercheurs à penser[br]que notre compréhension du langage 0:03:35.045,0:03:39.251 est un produit propre à la structure[br]biologique de notre cerveau. 0:03:39.251,0:03:43.101 En fait, un des traducteurs universels [br]fictifs les plus connus, 0:03:43.101,0:03:46.439 le poisson Babel[br]du « Guide du voyageur galactique », 0:03:46.439,0:03:49.726 n'est pas du tout une machine,[br]mais une petite créature 0:03:49.726,0:03:54.210 qui traduit les ondes cérébrales[br]et les signaux nerveux de races sensibles 0:03:54.210,0:03:57.005 grâce à une forme de télépathie. 0:03:57.005,0:03:59.726 Pour l'instant, apprendre[br]une langue à l'ancienne 0:03:59.726,0:04:05.106 vous donnera de meilleurs résultats que[br]n'importe quel logiciel existant. 0:04:05.106,0:04:06.749 Mais ce n'est pas facile, 0:04:06.749,0:04:09.014 et le simple nombre[br]de langues dans le monde, 0:04:09.014,0:04:12.989 en plus des interactions croissantes[br]de personnes qui les parlent, 0:04:12.989,0:04:17.764 vont seulement continuer à stimuler des[br]avancées dans la traduction automatique. 0:04:17.764,0:04:21.329 Peut-être que lorsque nous rencontrerons[br]des formes de vie intergalactiques, 0:04:21.329,0:04:24.990 nous serons capables de communiquer[br]avec eux à travers un petit dispositif, 0:04:24.990,0:04:29.026 ou peut-être que nous devrons quand même[br]compiler ce petit dictionnaire après tout.