WEBVTT 00:00:06.677 --> 00:00:11.306 ¿Cómo es posible que tantas especies intergalácticas en películas y series 00:00:11.306 --> 00:00:14.483 resulten hablar inglés perfecto? 00:00:14.483 --> 00:00:17.886 La respuesta breve es que nadie quiere ver a un equipo de la nave 00:00:17.886 --> 00:00:21.644 pasar años compilando un diccionario alienígena. 00:00:21.644 --> 00:00:23.442 Pero para mantener la consistencia, 00:00:23.442 --> 00:00:26.789 los creadores de Star Trek y otros mundos de ciencia ficción 00:00:26.789 --> 00:00:30.514 introdujeron el concepto de traductor universal, 00:00:30.514 --> 00:00:35.012 un dispositivo portable que traduce al instante entre cualquier idioma. 00:00:35.012 --> 00:00:38.539 ¿Es posible un traductor universal en la vida real? 00:00:38.539 --> 00:00:42.137 Ya tenemos muchos programas que dicen hacer exactamente eso, 00:00:42.137 --> 00:00:45.954 tomar una palabra, una oración, o un libro entero en un idioma 00:00:45.954 --> 00:00:49.004 y traducirlo a casi cualquier otro, 00:00:49.004 --> 00:00:52.337 sea inglés moderno o sánscrito antiguo. 00:00:52.337 --> 00:00:55.913 Y si la traducción fuera solo cuestión de buscar palabras en un diccionario, 00:00:55.913 --> 00:00:59.825 estos programas superarían a los humanos. 00:00:59.825 --> 00:01:03.299 La realidad, sin embargo, es un poco más complicada. 00:01:03.299 --> 00:01:07.179 Un programa de traducción basado en reglas, usa una base de datos léxica 00:01:07.179 --> 00:01:10.302 que tiene todas las palabras que uno encuentra en un diccionario 00:01:10.302 --> 00:01:13.283 y las formas gramaticales que estas pueden adoptar y reglas 00:01:13.283 --> 00:01:18.715 para reconocer los elementos lingüísticos básicos en el idioma de entrada. 00:01:18.865 --> 00:01:22.396 Para una oración aparentemente simple como "The children eat the muffins", 00:01:22.396 --> 00:01:27.050 el programa primero analiza su sintaxis, o estructura gramatical, 00:01:27.050 --> 00:01:29.587 identificando "children" [niños] como sujeto, 00:01:29.587 --> 00:01:32.317 y el resto de la oración como predicado 00:01:32.317 --> 00:01:34.368 que tiene un verbo "eat" [comer], 00:01:34.368 --> 00:01:37.422 y un objeto directo "the muffins". 00:01:37.422 --> 00:01:40.249 Luego tiene que reconocer la morfología del inglés, 00:01:40.249 --> 00:01:44.681 o cómo descomponer el idioma en unidades significativas más pequeñas, 00:01:44.681 --> 00:01:46.124 como la palabra "muffin" 00:01:46.124 --> 00:01:49.755 y el sufijo "s", usado para indicar el plural. 00:01:49.755 --> 00:01:52.449 Finalmente, tiene que entender la semántica, 00:01:52.449 --> 00:01:55.848 qué significan realmente las partes de la oración. 00:01:55.918 --> 00:01:58.194 Para traducir esta oración de manera apropiada, 00:01:58.194 --> 00:02:01.982 el programa hará referencia a distintos vocabularios y reglas 00:02:01.982 --> 00:02:05.166 para cada elemento del idioma destino. 00:02:05.166 --> 00:02:07.020 Pero aquí la cosa se complica. 00:02:07.020 --> 00:02:11.820 La sintaxis de algunos idiomas permiten ordenar palabras en cualquier orden, 00:02:11.820 --> 00:02:16.954 mientras que otras, harían que el "muffin" se coma al niño. 00:02:16.954 --> 00:02:19.647 La morfología puede también suponer un problema. 00:02:19.647 --> 00:02:23.243 El esloveno distingue entre dos niños y tres o más 00:02:23.243 --> 00:02:26.897 mediante un sufijo dual ausente en muchos otros idiomas, 00:02:26.987 --> 00:02:30.532 mientras que la falta de artículos definidos del ruso podría dejar la duda 00:02:30.532 --> 00:02:33.575 de si los niños están comiendo algunos muffins en particular, 00:02:33.575 --> 00:02:36.719 o solo comen muffins en general. 00:02:36.719 --> 00:02:39.708 Finalmente, incluso si la semántica es técnicamente correcta, 00:02:39.708 --> 00:02:42.757 el programa puede errar en sus puntos más finos, 00:02:42.757 --> 00:02:45.809 por ejemplo si los niños "comen" los muffins, 00:02:45.809 --> 00:02:47.794 o los "devoran". 00:02:47.794 --> 00:02:51.558 Otro método es la traducción automática estadística, 00:02:51.558 --> 00:02:55.762 que analiza una base de datos de libros, artículos y documentos 00:02:55.762 --> 00:02:59.488 que ya ha sido traducida por humanos. 00:02:59.488 --> 00:03:02.959 Encontrando concordancias entre textos fuente y traducidos, 00:03:02.959 --> 00:03:05.393 que es poco probable que ocurran por casualidad, 00:03:05.393 --> 00:03:09.345 el programa puede identificar frases y patrones que se corresponden, 00:03:09.345 --> 00:03:12.429 y usarlos para futuras traducciones. 00:03:12.429 --> 00:03:14.969 Sin embargo, la calidad de este tipo de traducción 00:03:14.969 --> 00:03:17.690 depende del tamaño de la base de datos inicial 00:03:17.690 --> 00:03:21.357 y la disponibilidad de muestras para ciertos idiomas 00:03:21.357 --> 00:03:23.383 o estilos de escritura. 00:03:23.383 --> 00:03:27.140 La dificultad que tienen las máquinas con las excepciones, irregularidades 00:03:27.140 --> 00:03:30.994 y los matices de significado que parecen instintivos a los humanos 00:03:30.994 --> 00:03:35.045 llevaron a algunos investigadores a creer que la comprensión de la lengua 00:03:35.045 --> 00:03:39.251 es un producto único de la estructura cerebral biológica. 00:03:39.251 --> 00:03:43.101 De hecho, uno de los traductores universales más famosos de la ficción, 00:03:43.101 --> 00:03:46.439 el pez Babel de "The Hitchhiker's Guide to the Galaxy", 00:03:46.439 --> 00:03:49.726 no es una máquina sino una pequeña criatura 00:03:49.726 --> 00:03:54.210 que traduce las ondas cerebrales y las señales nerviosas de especies sensibles 00:03:54.210 --> 00:03:57.005 mediante una forma de telepatía. 00:03:57.005 --> 00:03:59.726 Por ahora, aprender un idioma a la antigua 00:03:59.726 --> 00:04:05.106 todavía dará mejores resultados que los programas informáticos actuales. 00:04:05.106 --> 00:04:06.749 Pero esto no es tarea fácil, 00:04:06.749 --> 00:04:09.014 y la inmensa cantidad de idiomas del mundo, 00:04:09.014 --> 00:04:12.989 así como la creciente interacción de las personas que los hablan, 00:04:12.989 --> 00:04:18.004 no hará más que estimular un mayor avance en la traducción automática. 00:04:18.004 --> 00:04:21.409 Quizá cuando encontremos formas de vida intergalácticas, 00:04:21.409 --> 00:04:24.660 podremos comunicarnos con ellos a través de un pequeño aparatito, 00:04:24.660 --> 00:04:29.026 o puede que empecemos a compilar ese diccionario, después de todo.