1 00:00:06,677 --> 00:00:11,306 ¿Cómo es posible que tantas especies intergalácticas en películas y series 2 00:00:11,306 --> 00:00:14,483 resulten hablar inglés perfecto? 3 00:00:14,483 --> 00:00:17,886 La respuesta breve es que nadie quiere ver a un equipo de la nave 4 00:00:17,886 --> 00:00:21,644 pasar años compilando un diccionario alienígena. 5 00:00:21,644 --> 00:00:23,442 Pero para mantener la consistencia, 6 00:00:23,442 --> 00:00:26,789 los creadores de Star Trek y otros mundos de ciencia ficción 7 00:00:26,789 --> 00:00:30,514 introdujeron el concepto de traductor universal, 8 00:00:30,514 --> 00:00:35,012 un dispositivo portable que traduce al instante entre cualquier idioma. 9 00:00:35,012 --> 00:00:38,539 ¿Es posible un traductor universal en la vida real? 10 00:00:38,539 --> 00:00:42,137 Ya tenemos muchos programas que dicen hacer exactamente eso, 11 00:00:42,137 --> 00:00:45,954 tomar una palabra, una oración, o un libro entero en un idioma 12 00:00:45,954 --> 00:00:49,004 y traducirlo a casi cualquier otro, 13 00:00:49,004 --> 00:00:52,337 sea inglés moderno o sánscrito antiguo. 14 00:00:52,337 --> 00:00:55,913 Y si la traducción fuera solo cuestión de buscar palabras en un diccionario, 15 00:00:55,913 --> 00:00:59,825 estos programas superarían a los humanos. 16 00:00:59,825 --> 00:01:03,299 La realidad, sin embargo, es un poco más complicada. 17 00:01:03,299 --> 00:01:07,179 Un programa de traducción basado en reglas, usa una base de datos léxica 18 00:01:07,179 --> 00:01:10,302 que tiene todas las palabras que uno encuentra en un diccionario 19 00:01:10,302 --> 00:01:13,283 y las formas gramaticales que estas pueden adoptar y reglas 20 00:01:13,283 --> 00:01:18,715 para reconocer los elementos lingüísticos básicos en el idioma de entrada. 21 00:01:18,865 --> 00:01:22,396 Para una oración aparentemente simple como "The children eat the muffins", 22 00:01:22,396 --> 00:01:27,050 el programa primero analiza su sintaxis, o estructura gramatical, 23 00:01:27,050 --> 00:01:29,587 identificando "children" [niños] como sujeto, 24 00:01:29,587 --> 00:01:32,317 y el resto de la oración como predicado 25 00:01:32,317 --> 00:01:34,368 que tiene un verbo "eat" [comer], 26 00:01:34,368 --> 00:01:37,422 y un objeto directo "the muffins". 27 00:01:37,422 --> 00:01:40,249 Luego tiene que reconocer la morfología del inglés, 28 00:01:40,249 --> 00:01:44,681 o cómo descomponer el idioma en unidades significativas más pequeñas, 29 00:01:44,681 --> 00:01:46,124 como la palabra "muffin" 30 00:01:46,124 --> 00:01:49,755 y el sufijo "s", usado para indicar el plural. 31 00:01:49,755 --> 00:01:52,449 Finalmente, tiene que entender la semántica, 32 00:01:52,449 --> 00:01:55,848 qué significan realmente las partes de la oración. 33 00:01:55,918 --> 00:01:58,194 Para traducir esta oración de manera apropiada, 34 00:01:58,194 --> 00:02:01,982 el programa hará referencia a distintos vocabularios y reglas 35 00:02:01,982 --> 00:02:05,166 para cada elemento del idioma destino. 36 00:02:05,166 --> 00:02:07,020 Pero aquí la cosa se complica. 37 00:02:07,020 --> 00:02:11,820 La sintaxis de algunos idiomas permiten ordenar palabras en cualquier orden, 38 00:02:11,820 --> 00:02:16,954 mientras que otras, harían que el "muffin" se coma al niño. 39 00:02:16,954 --> 00:02:19,647 La morfología puede también suponer un problema. 40 00:02:19,647 --> 00:02:23,243 El esloveno distingue entre dos niños y tres o más 41 00:02:23,243 --> 00:02:26,897 mediante un sufijo dual ausente en muchos otros idiomas, 42 00:02:26,987 --> 00:02:30,532 mientras que la falta de artículos definidos del ruso podría dejar la duda 43 00:02:30,532 --> 00:02:33,575 de si los niños están comiendo algunos muffins en particular, 44 00:02:33,575 --> 00:02:36,719 o solo comen muffins en general. 45 00:02:36,719 --> 00:02:39,708 Finalmente, incluso si la semántica es técnicamente correcta, 46 00:02:39,708 --> 00:02:42,757 el programa puede errar en sus puntos más finos, 47 00:02:42,757 --> 00:02:45,809 por ejemplo si los niños "comen" los muffins, 48 00:02:45,809 --> 00:02:47,794 o los "devoran". 49 00:02:47,794 --> 00:02:51,558 Otro método es la traducción automática estadística, 50 00:02:51,558 --> 00:02:55,762 que analiza una base de datos de libros, artículos y documentos 51 00:02:55,762 --> 00:02:59,488 que ya ha sido traducida por humanos. 52 00:02:59,488 --> 00:03:02,959 Encontrando concordancias entre textos fuente y traducidos, 53 00:03:02,959 --> 00:03:05,393 que es poco probable que ocurran por casualidad, 54 00:03:05,393 --> 00:03:09,345 el programa puede identificar frases y patrones que se corresponden, 55 00:03:09,345 --> 00:03:12,429 y usarlos para futuras traducciones. 56 00:03:12,429 --> 00:03:14,969 Sin embargo, la calidad de este tipo de traducción 57 00:03:14,969 --> 00:03:17,690 depende del tamaño de la base de datos inicial 58 00:03:17,690 --> 00:03:21,357 y la disponibilidad de muestras para ciertos idiomas 59 00:03:21,357 --> 00:03:23,383 o estilos de escritura. 60 00:03:23,383 --> 00:03:27,140 La dificultad que tienen las máquinas con las excepciones, irregularidades 61 00:03:27,140 --> 00:03:30,994 y los matices de significado que parecen instintivos a los humanos 62 00:03:30,994 --> 00:03:35,045 llevaron a algunos investigadores a creer que la comprensión de la lengua 63 00:03:35,045 --> 00:03:39,251 es un producto único de la estructura cerebral biológica. 64 00:03:39,251 --> 00:03:43,101 De hecho, uno de los traductores universales más famosos de la ficción, 65 00:03:43,101 --> 00:03:46,439 el pez Babel de "The Hitchhiker's Guide to the Galaxy", 66 00:03:46,439 --> 00:03:49,726 no es una máquina sino una pequeña criatura 67 00:03:49,726 --> 00:03:54,210 que traduce las ondas cerebrales y las señales nerviosas de especies sensibles 68 00:03:54,210 --> 00:03:57,005 mediante una forma de telepatía. 69 00:03:57,005 --> 00:03:59,726 Por ahora, aprender un idioma a la antigua 70 00:03:59,726 --> 00:04:05,106 todavía dará mejores resultados que los programas informáticos actuales. 71 00:04:05,106 --> 00:04:06,749 Pero esto no es tarea fácil, 72 00:04:06,749 --> 00:04:09,014 y la inmensa cantidad de idiomas del mundo, 73 00:04:09,014 --> 00:04:12,989 así como la creciente interacción de las personas que los hablan, 74 00:04:12,989 --> 00:04:18,004 no hará más que estimular un mayor avance en la traducción automática. 75 00:04:18,004 --> 00:04:21,409 Quizá cuando encontremos formas de vida intergalácticas, 76 00:04:21,409 --> 00:04:24,660 podremos comunicarnos con ellos a través de un pequeño aparatito, 77 00:04:24,660 --> 00:04:29,026 o puede que empecemos a compilar ese diccionario, después de todo.