1 00:00:06,677 --> 00:00:11,306 Como é que tantas espécies intergalácticas, nos cinemas e na TV, 2 00:00:11,306 --> 00:00:14,483 falam um inglês tão perfeito? 3 00:00:14,483 --> 00:00:18,149 A resposta rápida é que ninguém quer ver a tripulação de uma nave espacial 4 00:00:18,149 --> 00:00:21,774 passar anos a compilar um dicionário extraterrestre. 5 00:00:21,774 --> 00:00:23,692 Mas, para tornar as coisas consistentes, 6 00:00:23,692 --> 00:00:26,789 os criadores do Star Trek e de outros mundos da ficção científica 7 00:00:26,789 --> 00:00:30,514 introduziram o conceito dum tradutor universal, 8 00:00:30,514 --> 00:00:35,012 um aparelho portátil que traduz instantaneamente qualquer língua. 9 00:00:35,012 --> 00:00:38,539 Será então possível na vida real um tradutor universal? 10 00:00:38,539 --> 00:00:42,137 Já temos muitos programas que afirmam fazer isso, 11 00:00:42,137 --> 00:00:45,954 agarrando numa palavra, numa frase, ou num livro inteiro numa língua 12 00:00:45,954 --> 00:00:49,004 e traduzindo-o em quase todas as outras, 13 00:00:49,004 --> 00:00:52,337 seja em inglês moderno ou em sânscrito antigo. 14 00:00:52,337 --> 00:00:56,067 Se a tradução fosse apenas uma questão de procurar palavras num dicionário, 15 00:00:56,067 --> 00:00:59,552 estes programas dariam cartas aos seres humanos. 16 00:00:59,825 --> 00:01:03,008 Mas a realidade é um pouco mais complicada. 17 00:01:03,299 --> 00:01:07,494 Um programa de tradução com base em regras usa uma base de dados de vocábulos, 18 00:01:07,494 --> 00:01:10,674 o que inclui todas as palavras que encontramos num dicionário 19 00:01:10,674 --> 00:01:13,283 e todas as formas gramaticais que elas podem assumir, 20 00:01:13,283 --> 00:01:14,943 e um conjunto de regras 21 00:01:14,943 --> 00:01:18,743 para reconhecer os elementos linguísticos básicos na língua inicial. 22 00:01:18,925 --> 00:01:22,614 Para uma frase aparentemente simples como "As crianças comem os bolos", 23 00:01:22,614 --> 00:01:27,050 o programa analisa primeiro a sintaxe, ou estrutura gramatical, 24 00:01:27,050 --> 00:01:29,841 identificando "as crianças" como o sujeito 25 00:01:29,841 --> 00:01:32,407 e o resto da frase como o predicado 26 00:01:32,407 --> 00:01:34,677 que é formado por um verbo "comer" 27 00:01:34,677 --> 00:01:37,267 e por um complemento direto, "os bolos". 28 00:01:37,422 --> 00:01:40,249 Depois precisa de reconhecer a sua morfologia 29 00:01:40,249 --> 00:01:42,235 ou seja, como a língua pode ser dividida 30 00:01:42,235 --> 00:01:44,681 nas suas unidades significativas mais pequenas, 31 00:01:44,681 --> 00:01:46,524 como a palavra "bolos" 32 00:01:46,524 --> 00:01:49,473 e o sufixo "s" usado para indicar o plural. 33 00:01:49,755 --> 00:01:52,739 Por fim, precisa de compreender a semântica, 34 00:01:52,739 --> 00:01:56,178 o que significam realmente as diferentes partes da frase. 35 00:01:56,178 --> 00:01:58,210 Para traduzir esta frase devidamente, 36 00:01:58,210 --> 00:02:02,363 o programa tem que se referir a um conjunto diferente de vocabulário e de regras 37 00:02:02,363 --> 00:02:05,166 para cada elemento da língua de destino. 38 00:02:05,166 --> 00:02:07,020 Mas é aqui que a coisa se complica. 39 00:02:07,020 --> 00:02:08,820 A sintaxe de algumas línguas permite 40 00:02:08,820 --> 00:02:11,983 que as palavras se arranjem por uma ordem qualquer 41 00:02:11,983 --> 00:02:16,954 enquanto noutras, fazer isso pode fazer com que "os bolos comam as crianças". 42 00:02:16,954 --> 00:02:19,647 A morfologia também levanta um problema, 43 00:02:19,647 --> 00:02:23,243 o esloveno distingue entre duas crianças e três ou mais 44 00:02:23,243 --> 00:02:27,097 usando um sufixo dual que não existe em muitas outras línguas, 45 00:02:27,097 --> 00:02:30,686 enquanto a falta de artigos definidos, no russo, podem deixar-nos na incerteza 46 00:02:30,686 --> 00:02:33,765 se as crianças estão a comer determinados bolos especiais 47 00:02:33,765 --> 00:02:36,719 ou a comer quaisquer bolos em geral. 48 00:02:36,719 --> 00:02:39,708 Por fim, mesmo que a semântica esteja tecnicamente correta, 49 00:02:39,708 --> 00:02:42,757 o programa pode ignorar pormenores mais ténues 50 00:02:42,757 --> 00:02:45,809 como se as crianças "mangiano" os bolos 51 00:02:45,809 --> 00:02:47,794 ou os "divorano". 52 00:02:47,794 --> 00:02:51,558 Outro método é a tradução automática por estatística, 53 00:02:51,558 --> 00:02:55,762 que analisa uma base de dados de livros, artigos e documentos 54 00:02:55,762 --> 00:02:58,951 que já foram traduzidos por pessoas. 55 00:02:59,488 --> 00:03:02,959 Encontrando correspondências entre texto original e traduzido 56 00:03:02,959 --> 00:03:05,393 que improvavelmente ocorrem por acaso, 57 00:03:05,393 --> 00:03:09,345 o programa identifica frases e padrões correspondentes, 58 00:03:09,345 --> 00:03:12,429 e usa-os para traduções posteriores. 59 00:03:12,429 --> 00:03:15,141 Mas a qualidade deste tipo de tradução 60 00:03:15,141 --> 00:03:17,817 depende do tamanho da base de dados inicial 61 00:03:17,817 --> 00:03:21,357 e a disponibilidade de amostras para certas línguas 62 00:03:21,357 --> 00:03:23,446 ou estilos de escrita. 63 00:03:23,446 --> 00:03:27,140 A dificuldade que os computadores têm com as exceções, as irregularidades 64 00:03:27,140 --> 00:03:28,930 e os cambiantes de sentido que, 65 00:03:28,930 --> 00:03:31,494 segundo parece, são instintivos nos seres humanos, 66 00:03:31,494 --> 00:03:35,190 levou alguns investigadores a crer que a nossa compreensão da linguagem 67 00:03:35,190 --> 00:03:39,251 é um produto único da nossa estrutura cerebral biológica. 68 00:03:39,251 --> 00:03:43,437 Na verdade, um dos tradutores universais de ficção, mais conhecidos, 69 00:03:43,437 --> 00:03:46,684 o Babel fish de "À Boleia Pela Galáxia", 70 00:03:46,684 --> 00:03:49,989 não é nenhuma máquina, é uma pequena criatura 71 00:03:49,989 --> 00:03:54,373 que traduz as ondas cerebrais e os sinais nervosos de espécies sensíveis 72 00:03:54,373 --> 00:03:57,005 através duma forma de telepatia. 73 00:03:57,005 --> 00:03:59,853 Para já, aprender uma língua à moda antiga 74 00:03:59,853 --> 00:04:02,106 ainda nos dá melhores resultados 75 00:04:02,106 --> 00:04:05,106 do que qualquer programa de computador atualmente disponível. 76 00:04:05,106 --> 00:04:07,003 Mas não é uma tarefa fácil, 77 00:04:07,003 --> 00:04:09,568 e a considerável quantidade de línguas no mundo, 78 00:04:09,568 --> 00:04:13,216 assim como a crescente interação entre as pessoas que as falam, 79 00:04:13,216 --> 00:04:18,004 continuarão a estimular maiores progressos na tradução automática. 80 00:04:18,176 --> 00:04:21,609 Talvez que, na altura em que encontrarmos formas de vida intergalácticas, 81 00:04:21,609 --> 00:04:24,950 possamos comunicar com elas através dum pequeno aparelho 82 00:04:24,987 --> 00:04:29,026 ou tenhamos que começar a compilar esse dicionário.