WEBVTT 00:00:06.677 --> 00:00:11.306 Como é que tantas espécies intergalácticas, nos cinemas e na TV, 00:00:11.306 --> 00:00:14.483 falam um inglês tão perfeito? 00:00:14.483 --> 00:00:18.149 A resposta rápida é que ninguém quer ver a tripulação de uma nave espacial 00:00:18.149 --> 00:00:21.774 passar anos a compilar um dicionário extraterrestre. 00:00:21.774 --> 00:00:23.692 Mas, para tornar as coisas consistentes, 00:00:23.692 --> 00:00:26.789 os criadores do Star Trek e de outros mundos da ficção científica 00:00:26.789 --> 00:00:30.514 introduziram o conceito dum tradutor universal, 00:00:30.514 --> 00:00:35.012 um aparelho portátil que traduz instantaneamente qualquer língua. 00:00:35.012 --> 00:00:38.539 Será então possível na vida real um tradutor universal? 00:00:38.539 --> 00:00:42.137 Já temos muitos programas que afirmam fazer isso, 00:00:42.137 --> 00:00:45.954 agarrando numa palavra, numa frase, ou num livro inteiro numa língua 00:00:45.954 --> 00:00:49.004 e traduzindo-o em quase todas as outras, 00:00:49.004 --> 00:00:52.337 seja em inglês moderno ou em sânscrito antigo. 00:00:52.337 --> 00:00:56.067 Se a tradução fosse apenas uma questão de procurar palavras num dicionário, 00:00:56.067 --> 00:00:59.552 estes programas dariam cartas aos seres humanos. 00:00:59.825 --> 00:01:03.008 Mas a realidade é um pouco mais complicada. 00:01:03.299 --> 00:01:07.494 Um programa de tradução com base em regras usa uma base de dados de vocábulos, 00:01:07.494 --> 00:01:10.674 o que inclui todas as palavras que encontramos num dicionário 00:01:10.674 --> 00:01:13.283 e todas as formas gramaticais que elas podem assumir, 00:01:13.283 --> 00:01:14.943 e um conjunto de regras 00:01:14.943 --> 00:01:18.743 para reconhecer os elementos linguísticos básicos na língua inicial. 00:01:18.925 --> 00:01:22.614 Para uma frase aparentemente simples como "As crianças comem os bolos", 00:01:22.614 --> 00:01:27.050 o programa analisa primeiro a sintaxe, ou estrutura gramatical, 00:01:27.050 --> 00:01:29.841 identificando "as crianças" como o sujeito 00:01:29.841 --> 00:01:32.407 e o resto da frase como o predicado 00:01:32.407 --> 00:01:34.677 que é formado por um verbo "comer" 00:01:34.677 --> 00:01:37.267 e por um complemento direto, "os bolos". 00:01:37.422 --> 00:01:40.249 Depois precisa de reconhecer a sua morfologia 00:01:40.249 --> 00:01:42.235 ou seja, como a língua pode ser dividida 00:01:42.235 --> 00:01:44.681 nas suas unidades significativas mais pequenas, 00:01:44.681 --> 00:01:46.524 como a palavra "bolos" 00:01:46.524 --> 00:01:49.473 e o sufixo "s" usado para indicar o plural. 00:01:49.755 --> 00:01:52.739 Por fim, precisa de compreender a semântica, 00:01:52.739 --> 00:01:56.178 o que significam realmente as diferentes partes da frase. 00:01:56.178 --> 00:01:58.210 Para traduzir esta frase devidamente, 00:01:58.210 --> 00:02:02.363 o programa tem que se referir a um conjunto diferente de vocabulário e de regras 00:02:02.363 --> 00:02:05.166 para cada elemento da língua de destino. 00:02:05.166 --> 00:02:07.020 Mas é aqui que a coisa se complica. 00:02:07.020 --> 00:02:08.820 A sintaxe de algumas línguas permite 00:02:08.820 --> 00:02:11.983 que as palavras se arranjem por uma ordem qualquer 00:02:11.983 --> 00:02:16.954 enquanto noutras, fazer isso pode fazer com que "os bolos comam as crianças". 00:02:16.954 --> 00:02:19.647 A morfologia também levanta um problema, 00:02:19.647 --> 00:02:23.243 o esloveno distingue entre duas crianças e três ou mais 00:02:23.243 --> 00:02:27.097 usando um sufixo dual que não existe em muitas outras línguas, 00:02:27.097 --> 00:02:30.686 enquanto a falta de artigos definidos, no russo, podem deixar-nos na incerteza 00:02:30.686 --> 00:02:33.765 se as crianças estão a comer determinados bolos especiais 00:02:33.765 --> 00:02:36.719 ou a comer quaisquer bolos em geral. 00:02:36.719 --> 00:02:39.708 Por fim, mesmo que a semântica esteja tecnicamente correta, 00:02:39.708 --> 00:02:42.757 o programa pode ignorar pormenores mais ténues 00:02:42.757 --> 00:02:45.809 como se as crianças "mangiano" os bolos 00:02:45.809 --> 00:02:47.794 ou os "divorano". 00:02:47.794 --> 00:02:51.558 Outro método é a tradução automática por estatística, 00:02:51.558 --> 00:02:55.762 que analisa uma base de dados de livros, artigos e documentos 00:02:55.762 --> 00:02:58.951 que já foram traduzidos por pessoas. 00:02:59.488 --> 00:03:02.959 Encontrando correspondências entre texto original e traduzido 00:03:02.959 --> 00:03:05.393 que improvavelmente ocorrem por acaso, 00:03:05.393 --> 00:03:09.345 o programa identifica frases e padrões correspondentes, 00:03:09.345 --> 00:03:12.429 e usa-os para traduções posteriores. 00:03:12.429 --> 00:03:15.141 Mas a qualidade deste tipo de tradução 00:03:15.141 --> 00:03:17.817 depende do tamanho da base de dados inicial 00:03:17.817 --> 00:03:21.357 e a disponibilidade de amostras para certas línguas 00:03:21.357 --> 00:03:23.446 ou estilos de escrita. 00:03:23.446 --> 00:03:27.140 A dificuldade que os computadores têm com as exceções, as irregularidades 00:03:27.140 --> 00:03:28.930 e os cambiantes de sentido que, 00:03:28.930 --> 00:03:31.494 segundo parece, são instintivos nos seres humanos, 00:03:31.494 --> 00:03:35.190 levou alguns investigadores a crer que a nossa compreensão da linguagem 00:03:35.190 --> 00:03:39.251 é um produto único da nossa estrutura cerebral biológica. 00:03:39.251 --> 00:03:43.437 Na verdade, um dos tradutores universais de ficção, mais conhecidos, 00:03:43.437 --> 00:03:46.684 o Babel fish de "À Boleia Pela Galáxia", 00:03:46.684 --> 00:03:49.989 não é nenhuma máquina, é uma pequena criatura 00:03:49.989 --> 00:03:54.373 que traduz as ondas cerebrais e os sinais nervosos de espécies sensíveis 00:03:54.373 --> 00:03:57.005 através duma forma de telepatia. 00:03:57.005 --> 00:03:59.853 Para já, aprender uma língua à moda antiga 00:03:59.853 --> 00:04:02.106 ainda nos dá melhores resultados 00:04:02.106 --> 00:04:05.106 do que qualquer programa de computador atualmente disponível. 00:04:05.106 --> 00:04:07.003 Mas não é uma tarefa fácil, 00:04:07.003 --> 00:04:09.568 e a considerável quantidade de línguas no mundo, 00:04:09.568 --> 00:04:13.216 assim como a crescente interação entre as pessoas que as falam, 00:04:13.216 --> 00:04:18.004 continuarão a estimular maiores progressos na tradução automática. 00:04:18.176 --> 00:04:21.609 Talvez que, na altura em que encontrarmos formas de vida intergalácticas, 00:04:21.609 --> 00:04:24.950 possamos comunicar com elas através dum pequeno aparelho 00:04:24.987 --> 00:04:29.026 ou tenhamos que começar a compilar esse dicionário.