0:00:06.677,0:00:11.306 Como é que nos filmes e na TV[br]tantos seres intergalácticos 0:00:11.306,0:00:14.483 conseguem falar português perfeitamente? 0:00:14.483,0:00:17.886 A resposta é que ninguém quer assistir[br]à tripulação de uma nave espacial 0:00:17.886,0:00:21.364 passar anos compilando[br]um dicionário alienígena. 0:00:21.364,0:00:24.822 Para manter as coisas consistentes,[br]os criadores de "Guerra nas Estrelas" 0:00:24.822,0:00:26.789 e de outros mundos de ficção científica 0:00:26.789,0:00:30.514 introduziram o conceito[br]de um tradutor universal, 0:00:30.514,0:00:35.012 um aparelho portátil que pode traduzir[br]instantaneamente qualquer língua. 0:00:35.012,0:00:38.539 Mas é possível um tradutor[br]universal na vida real? 0:00:38.539,0:00:42.137 Já existem muitos programas[br]que dizem fazer isso, 0:00:42.137,0:00:45.954 que pegam uma palavra, sentença,[br]ou mesmo um livro inteiro, em uma língua 0:00:45.954,0:00:49.004 e traduzem para quase[br]qualquer outro idioma, 0:00:49.004,0:00:52.337 seja inglês moderno ou sânscrito antigo. 0:00:52.337,0:00:55.913 Se a tradução fosse apenas uma questão[br]de procurar palavras num dicionário, 0:00:55.913,0:00:59.825 esses programas dariam[br]um baile nos seres humanos. 0:00:59.825,0:01:03.299 A realidade, no entanto,[br]é um pouco mais complicada. 0:01:03.299,0:01:07.349 Um programa de tradução baseado[br]em regras usa uma base de dados lexical, 0:01:07.349,0:01:10.302 que inclui todas as palavras[br]constantes de um dicionário 0:01:10.302,0:01:14.343 e as formas gramaticais que elas podem[br]tomar e, assim, estabelece regras 0:01:14.343,0:01:18.925 para reconhecer os elementos linguísticos[br]básicos da língua de origem. 0:01:18.925,0:01:22.476 Numa sentença aparentemente simples[br]como: "As crianças comem os bolos", 0:01:22.476,0:01:27.050 primeiro o programa analisa a sintaxe,[br]ou a estrutura gramatical, 0:01:27.050,0:01:29.587 identifica "as crianças" como o sujeito, 0:01:29.587,0:01:32.317 e o resto da sentença como o predicado, 0:01:32.317,0:01:34.368 que consiste no verbo "comer" 0:01:34.368,0:01:37.422 e em um objeto direto, "os bolos". 0:01:37.422,0:01:40.249 Ele então precisa reconhecer[br]a morfologia do português 0:01:40.249,0:01:44.681 ou como a língua pode se dividir[br]em unidades menores de significado, 0:01:44.681,0:01:46.124 tais como a palavra "bolo" 0:01:46.124,0:01:49.755 e o sufixo "s" para indicar o plural. 0:01:49.755,0:01:52.449 Finalmente, é necessário[br]entender a semântica, 0:01:52.449,0:01:56.128 ou seja, o significado das diferentes[br]partes de uma sentença. 0:01:56.128,0:01:58.184 Para traduzir essa sentença adequadamente, 0:01:58.184,0:02:01.982 o programa precisa se remeter a um grupo[br]diferente de vocabulário e regras 0:02:01.982,0:02:05.166 para cada elemento da língua de destino. 0:02:05.166,0:02:07.020 Mas é aqui que a coisa complica. 0:02:07.020,0:02:11.820 A sintaxe de algumas línguas permite[br]o arranjo das palavras em qualquer ordem. 0:02:11.820,0:02:16.954 enquanto, em outras, ao se fazer isso,[br]poderíamos fazer "o bolo comer a criança". 0:02:16.954,0:02:19.647 A morfologia pode também ser um problema. 0:02:19.647,0:02:23.243 O esloveno distingue entre[br]duas crianças e três ou mais, 0:02:23.243,0:02:26.857 usando um sufixo dual, ausente[br]em tantas outras línguas, 0:02:26.857,0:02:29.047 enquanto a falta[br]do artigo definido no russo 0:02:29.047,0:02:30.532 pode nos deixar em dúvida 0:02:30.532,0:02:33.575 se as crianças estão comendo[br]alguns bolos em particular 0:02:33.575,0:02:36.719 ou apenas comendo bolos em geral. 0:02:36.719,0:02:39.708 Finalmente, mesmo quando a semântica[br]está tecnicamente correta, 0:02:39.708,0:02:42.757 o programa pode deixar[br]de perceber questões mais sutis, 0:02:42.757,0:02:45.809 tais como saber se as crianças[br]"mangiano" os bolos 0:02:45.809,0:02:47.794 ou se elas "divorano" os bolos. 0:02:47.794,0:02:51.558 Um outro método é a máquina[br]de tradução estatística, 0:02:51.558,0:02:55.762 que analisa uma base de dados[br]de livros, artigos e documentos 0:02:55.762,0:02:59.488 já traduzidos por humanos. 0:02:59.488,0:03:02.959 Ao encontrar correspondência[br]entre a fonte e a tradução feita, 0:03:02.959,0:03:05.393 improváveis de ocorrer por acaso, 0:03:05.393,0:03:09.345 o programa consegue identificar[br]frases e padrões correspondentes, 0:03:09.345,0:03:12.429 e os usa para futuras traduções. 0:03:12.429,0:03:14.969 No entanto, a qualidade[br]desse tipo de tradução 0:03:14.969,0:03:17.690 depende do tamanho[br]da base de dados inicial 0:03:17.690,0:03:21.357 e da disponibilidade de amostras[br]em determinadas línguas, 0:03:21.357,0:03:23.383 ou de estilos de escrita. 0:03:23.383,0:03:27.140 A dificuldade que os computadores têm[br]com as exceções, irregularidades 0:03:27.140,0:03:28.580 e matizes de significado, 0:03:28.580,0:03:30.994 algo que os humanos[br]percebem instintivamente, 0:03:30.994,0:03:35.045 tem levado alguns pesquisadores a crer[br]que nossa compreensão da língua 0:03:35.045,0:03:39.251 é um produto singular[br]da estrutura biológica do nosso cérebro. 0:03:39.251,0:03:43.101 Na verdade, um dos mais famosos[br]tradutores universais da ficção, 0:03:43.101,0:03:46.439 o peixe Babel de "O Guia[br]dos Mochileiros das Galáxias", 0:03:46.439,0:03:49.726 não é de forma alguma uma máquina,[br]mas uma pequena criatura 0:03:49.726,0:03:54.210 que traduz as ondas cerebrais[br]e os sinais nervosos de espécies sensíveis 0:03:54.210,0:03:57.005 através de uma forma de telepatia. 0:03:57.005,0:03:59.726 Por ora, aprender uma língua à moda antiga 0:03:59.726,0:04:05.106 vai dar melhor resultado do que qualquer[br]programa de computador disponível. 0:04:05.106,0:04:06.749 Mas isso não é uma tarefa fácil, 0:04:06.749,0:04:09.014 e o elevado número de línguas do mundo, 0:04:09.014,0:04:12.989 assim como a crescente interação[br]entre as pessoas que as falam, 0:04:12.989,0:04:18.004 vão apenas continuar a estimular[br]avanços na tradução automática. 0:04:18.004,0:04:21.409 Quem sabe, quando encontrarmos[br]formas de vida intergalácticas, 0:04:21.409,0:04:24.660 sejamos capazes de nos comunicar[br]com eles por meio de um aparelhinho 0:04:24.660,0:04:29.026 ou no fim sejamos obrigados[br]a começar a compilar aquele dicionário.