Gostaria de começar com um exercício mental. Imaginem que estamos 4000 anos no futuro. A civilização tal como a conhecemos deixou de existir -- não há livros, não há aparelhos eletrónicos, não há Facebook ou Twitter. Todo o conhecimento da língua inglesa e do alfabeto inglês se perdeu. Agora imaginem arqueólogos a escavar por entre os escombros de uma das nossas cidades. O que é que encontrariam? Bem, talvez algumas peças retangulares de plástico com estranhos símbolos. Talvez algumas peças circulares de metal. Talvez alguns recipientes cilíndricos com alguns símbolos. E talvez uma arqueóloga se torne uma celebridade instantânea quando ela descobrir -- enterradas nas colinas algures na América do Norte -- versões gigantescas destes mesmos símbolos. Agora perguntemo-nos, o que tais artefactos poderiam dizer sobre nós a pessoas a 4000 anos no futuro? Esta não é uma questão hipotética. De facto, este é exatamente o tipo de questão com que nos confrontamos quando tentamos compreender a civilização do Vale do Indo, que existiu há 4000 anos. A civilização do Indo era quase contemporânea das muito mais bem conhecidas civilizações egípcia e mesopotâmica, mas era, na verdade, muito maior do que qualquer destas duas civilizações. Ocupava a área de aproximadamente um milhão de quilómetros quadrados, cobrindo o que é agora o Paquistão, o noroeste da Índia e partes do Afeganistão e do Irão. Dado que era uma civilização tão vasta, poder-se-ia esperar encontrar poderosos governantes, reis, e enormes monumentos a glorificar estes poderosos reis. De facto, o que os arqueólogos encontraram não foi nada disso. Eles encontraram pequenos objetos tais como estes. Aqui está um exemplo de um destes objetos. Bem, obviamente que este é uma réplica. Mas quem é esta pessoa? Um rei? Um deus? Um sacerdote? Ou talvez uma pessoa comum como vocês ou eu? Não sabemos. Mas o povo do Indo também deixou artefactos com escrita. Bem, não, peças de plástico não, mas selos de pedra, placas de cobre, cerâmica e, surpreendentemente, um enorme quadro com símbolos, que foi encontrado enterrado perto do portão de uma cidade. Agora, não sabemos se diz Hollywood, ou até Bollywood, tanto quanto sabemos. Na verdade, nem sequer sabemos o que qualquer um destes objetos diz. E isso é porque a escrita do Indo está indecifrada. Não sabemos o que qualquer um destes símbolos quer dizer. Os símbolos são mais vulgarmente encontrados nos selos. Vocês veem ali em cima um desses objetos. É o objeto quadrado com o animal semelhante a um unicórnio. Ora, eis uma magnífica peça de arte. Então, quão grande pensam vocês que é? Talvez assim? Ou talvez assim? Bem, deixem-me mostrar-vos. Aqui está uma réplica de um desses selos. Tem apenas cerca de 2,54 cm x 2,54 cm de tamanho -- bem pequenino. Então para que é que estes foram usados? Sabemos que estes foram usados para selar etiquetas de barro que eram atadas a pacotes de bens enviados de um lugar para outro. Estão a ver aquelas guias de remessa que recebem nas caixas da FedEx? Estes eram usados para fazer esse tipo de guias de remessa. Poderão pensar sobre o que estes objetos contêm, em termos do seu texto. Talvez eles sejam o nome do remetente ou alguma informação sobre os bens que estão a ser enviados de um lugar para outro -- não sabemos. Precisamos de decifrar a escrita para responder a essa questão. Decifrar a escrita não é apenas um "puzzle" intelectual; tornou-se realmente uma questão que ficou profundamente interligada com a política e a história cultural do Sul da Ásia. De facto, a escrita tornou-se um campo de batalha entre três diferentes grupos de pessoas. Primeiro, há um grupo de pessoas que são muito apaixonadas na sua crença de que a escrita do Indo não representa de todo uma linguagem. Estas pessoas acreditam que os símbolos são muito semelhantes ao tipo de símbolos que se encontram nos sinais de trânsito ou aos emblemas que se encontram nos escudos. Há um segundo grupo de pessoas que creem que a escrita do Indo representa uma linguagem indo-europeia. Se olharem para um mapa da Índia hoje, verão que a maioria das línguas faladas no norte da Índia pertence à família das línguas indo-europeias. Por isso, algumas pessoas creem que a escrita do Indo representa uma antiga língua indo-europeia, tal como o sânscrito. Há um último grupo de pessoas que creem que as pessoas do Indo eram os ancestrais das pessoas que vivem no sul da Índia hoje. Estas pessoas creem que a escrita do Indo representa uma antiga forma da família linguística dravidiana, que é a família linguística falada na maior parte do sul da Índia hoje. E os proponentes desta teoria apontam para a pequena bolsa de pessoas falantes de dravidiano no norte, na realidade, perto do Afeganistão, e dizem que talvez, algures no passado, as línguas dravidianas fossem faladas por toda a Índia, e que isso sugere que a civilização do Indo fosse talvez também dravidiana. Qual destas hipóteses pode ser verdadeira? Não sabemos, mas talvez se vocês decifrassem a escrita, pudessem ser capazes de responder a esta questão. Mas decifrar a escrita é uma tarefa muito desafiadora. Primeiro, não há uma Pedra de Roseta. Não quero dizer o "software"; quero dizer um antigo artefacto que contém no mesmo texto tanto um texto conhecido como um texto desconhecido. Não temos um artefacto assim para a escrita do Indo. E, além disso, nem sequer sabemos que língua é que eles falavam. E para piorar ainda mais as coisas, a maioria dos textos que temos são extremamente curtos. Como vos mostrei, eles são, geralmente, encontrados nestes selos minúsculos. E por isso, dados estes obstáculos formidáveis, poder-nos-emos perguntar e preocupar se seremos alguma vez capazes de decifrar a escrita do Indo. No resto da minha palestra, gostaria de vos dizer como aprendi a deixar de me preocupar e a adorar o desafio colocado pela escrita do Indo. Sempre me senti fascinado pela escrita do Indo desde que li sobre ela num manual do 3.º Ciclo. E porque é que me senti fascinado? Bem, é a última grande escrita indecifrada do mundo antigo. A minha carreira fez com que me tornasse um neurocientista computacional, por isso, no meu emprego de dia, eu crio modelos computacionais do cérebro para tentar compreender como é que o cérebro faz predições, como é que o cérebro toma decisões, como é que o cérebro aprende, e por aí fora. Mas em 2007, o meu caminho cruzou-se de novo com a escrita do Indo. Foi quando estive na Índia, e tive a maravilhosa oportunidade de me encontrar com alguns cientistas indianos que estavam a usar modelos computacionais para tentar analisar a escrita. E assim foi então que compreendi que havia uma oportunidade para mim de colaborar com estes cientistas, e, portanto, atirei-me a essa oportunidade. E gostaria de descrever alguns dos resultados que encontrámos. Ou melhor ainda, vamos todos decifrar coletivamente. Estão prontos? A primeira coisa a fazer quando têm uma escrita indecifrada, é tentar perceber a direção da escrita. Aqui estão dois textos que contêm alguns símbolos. Conseguem dizer-me se a direção da escrita é da direita para a esquerda ou da esquerda para a direita? Vou dar-vos alguns segundos. Ok. Da direita para a esquerda, quantos? Ok. Da esquerda para a direita? Oh, é quase 50/50. Ok. A resposta é: se olharem para o lado esquerdo dos dois textos, vão reparar que há um amontoar de símbolos, e parece que há 4000 anos, quando os escribas estavam a escrever da direita para a esquerda, faltou-lhes espaço. E, por isso, eles tiveram de comprimir o símbolo. Um dos símbolos está por baixo do texto no topo. Isto sugere que a direção da escrita era provavelmente da direita para a esquerda. É uma das primeiras coisas que sabemos, que a direcionalidade é um aspeto fundamental das escritas linguísticas. E a escrita do Indo tem agora esta propriedade particular. Que outras propriedades da linguagem mostra a escrita? As línguas contêm padrões. Se vos der a letra Q e pedir para predizerem a próxima letra, qual é que pensam que poderá ser? A maioria de vós disse U, que está certo. Agora se eu vos pedir para predizerem mais uma letra, qual é que pensam que poderá ser? Agora há várias opiniões. Há o E. Podia ser o I. Podia ser o A, mas certamente que não o B, C ou D, certo? A escrita do Indo também exibe tipos semelhantes de padrões. Há muitos textos que começam com este símbolo em forma de diamante. E isto, por sua vez, tende a ser seguido por este símbolo parecido com aspas. E isto é muito semelhante a um exemplo Q e U. Este símbolo pode, por sua vez, ser seguido por estes símbolos parecidos com peixes e alguns outros signos, mas nunca por estes outros signos no fundo. E além disso, há alguns signos que realmente preferem o final dos textos, tal como este signo em forma de jarro. E acontece que este signo, é o signo que mais frequentemente ocorre na escrita. Dados tais padrões, aqui estava a nossa ideia. A ideia era usar um computador para aprender estes padrões, e, portanto, demos ao computador os textos existentes. E o computador aprendeu um modelo estatístico de quais os símbolos que tendem a ocorrer juntos e quais os símbolos que tendem a seguir-se uns aos outros. Dado o modelo computacional, podemos testar o modelo essencialmente por perguntas. Podemos deliberadamente apagar alguns símbolos, e podemos pedir-lhe para predizer os símbolos em falta. Aqui estão alguns exemplos. Podem considerar isto como, talvez, o mais antigo jogo da Roda da Fortuna. (Risos) O que descobrimos foi que o computador foi bem-sucedido em 75% dos casos na predição do símbolo correto. No resto dos casos, tipicamente, a segunda melhor resposta ou terceira melhor resposta era a resposta certa. Há também uso prático para este procedimento particular. Há muitos destes textos que estão danificados. Aqui está um exemplo de um desses textos. Podemos usar o modelo computacional para tentar completar este texto e fazer a melhor predição de resposta. Aqui está um exemplo de um símbolo que foi predito. E isto podia ser realmente útil conforme tentamos decifrar a escrita ao gerar mais dados que consigamos analisar. Agora, aqui está uma outra coisa que podem fazer com o modelo computacional. Imaginem um macaco sentado a um teclado. Penso que poderão obter um amontoado de letras ao acaso, parecido com este. Um amontoado de letras ao acaso, assim, tem uma entropia muito alta. Este é um termo da teoria da física e da informação. Mas imaginem só que é realmente um amontoado de letras ao acaso. Quantos de vós alguma vez entornaram café em cima de um teclado? Poder-se-ão ter deparado com o teclado bloqueado portanto, o mesmo símbolo a ser repetido uma e outra vez. Este tipo de sequência tem uma entropia muito baixa porque não há variação nenhuma. A linguagem, por outro lado, tem um nível de entropia intermédio; nem é demasiado rígido, nem é demasiado ao acaso. Então e a escrita do Indo? Aqui está um gráfico que marca as entropias de todo um grupo de sequências. Mesmo no topo, encontram a sequência uniformemente ao acaso, que é um amontoado de letras ao acaso -- e, curiosamente, encontramos também a sequência do ADN do genoma humano e da música instrumental. E ambas são muito, muito flexíveis, pelo que é por isso que vocês as encontram na variação muito alta. Na parte mais baixa do final da escala, vocês encontram uma sequência rígida, de todos os A, e encontram também um programa de computador, neste caso, na linguagem Fortran, que obedece realmente a regras rígidas. As escritas linguísticas ocupam a variação média. Agora, então e a escrita do Indo? Nós descobrimos que a escrita do Indo, insere-se na variação das escritas linguísticas. Quando este resultado foi publicado pela primeira vez, foi muito controverso. Houve pessoas que fizeram um alarido, e estas pessoas eram aquelas que acreditavam que a escrita do Indo não representa uma língua. Eu comecei até a receber correio de ódio. Os meus alunos disseram que eu deveria pensar seriamente em obter alguma proteção. Quem imaginaria que a decifração poderia ser uma profissão perigosa? O que é que este resultado realmente mostra? Mostra que a escrita do Indo partilha uma propriedade importante da linguagem. Portanto, como diz o ditado, se parece uma escrita linguística e funciona como uma escrita linguística, então, talvez tenhamos uma escrita linguística nas mãos. Que outra evidência há de que a escrita poderia realmente codificar linguagem? Bem as escritas linguísticas realmente codificam múltiplas línguas. Assim, por exemplo, aqui está a mesma frase escrita em inglês e a mesma frase escrita em neerlandês usando as mesmas letras do alfabeto. Se vocês não souberem neerlandês e só souberem inglês e eu vos der algumas palavras em neerlandês, dir-me-ão que estas palavras contêm alguns padrões muito invulgares. Algumas coisas não estão certas, e vocês dirão que estas palavras provavelmente não são palavras inglesas. A mesma coisa acontece no caso da escrita do Indo. O computador encontrou vários textos -- dois deles são mostrados aqui -- que têm padrões muito invulgares. Então, por exemplo, o primeiro texto: há uma duplicação deste signo em forma de jarro. Este signo é o que mais frequentemente ocorre na escrita do Indo, e é apenas neste texto que ele surge duplicado. Porque é que é assim? Voltámos atrás para vermos onde é que estes textos em particular foram encontrados, e acontece que foram encontrados muito, muito longe do Vale do Indo. Eles foram encontrados no Iraque e Irão atuais. E porque é que eles foram lá encontrados? O que não vos disse é que o povo do Indo era muito, muito empreendedor. Eles costumavam fazer comércio com povos muito longe de onde viviam. E assim, neste caso, eles estavam a viajar por mar até à Mesopotâmia, o Iraque atual. E o que parece ter acontecido aqui é que os comerciantes do Indo, os mercadores, estavam a usar esta escrita para escrever uma língua estrangeira. Tal como o nosso exemplo do inglês e do neerlandês. E isso explicaria porque é que temos estes estranhos padrões que são muito diferentes dos tipos de padrões que vocês veem no texto dos achados no Vale do Indo. Isto sugere que a mesma escrita, a escrita do Indo, poderia ser usada para escrever línguas diferentes. Os resultados que temos até agora parecem apontar para a conclusão de que a escrita do Indo provavelmente representa mesmo uma língua. Se representa mesmo uma língua, então como é que lemos os símbolos? Esse é o nosso próximo grande desafio. Então vão reparar que muitos dos símbolos se parecem com imagens de humanos, de insetos, de peixes, de aves. Muitas escritas antigas usam o "princípio de rebus", que é, usar imagens para representar palavras. Então, como exemplo, aqui está uma palavra. Conseguem escrevê-la usando imagens? Vou dar-vos alguns segundos. Conseguiram? Ok. Ótimo. Aqui está a minha solução. Podiam usar a imagem de uma abelha [bee] seguida da imagem de uma folha [leaf] -- e temos "crença" [belief], certo? Poderia haver outras soluções. No caso da escrita do Indo, o problema é o contrário. Vocês têm de descobrir o som de cada uma destas imagens de maneira a que a sequência inteira faça sentido. Então, isto é tal e qual um "puzzle" de palavras cruzadas, exceto que isto é a mãe de todos os "puzzles" de palavras cruzadas, porque o que está em jogo é tão importante, caso se consiga resolver. Os meus colegas, Iravatham Mahadevan e Asko Parpola têm estado a fazer algum avanço neste problema em particular. E gostaria de vos dar um rápido exemplo do trabalho do Parpola. Aqui está um texto realmente curto. Ele contém sete traços verticais seguidos por este signo em forma de peixe. E quero mencionar que estes selos eram usados para selar etiquetas de barro que eram atadas a pacotes de bens, portanto, é bastante provável que estas etiquetas, pelo menos algumas delas, contenham nomes de mercadores. E acontece que na Índia há uma longa tradição de nomes baseados em horóscopos e constelações de estrelas presentes no momento do nascimento. Nas línguas dravidianas, a palavra para "peixe" é "meen" que, por acaso, soa como a palavra para estrela. e assim, sete estrelas representariam "elu meen" que é a palavra dravidiana para a constelação da Ursa Maior. Do mesmo modo, há outra sequência de seis estrelas, e que se traduz por "aru meen" que é o antigo nome dravidiano para a constelação das estrelas Plêiades. E finalmente, há outras combinações, tais como este signo de peixe, com algo que parece um telhado por cima dele. E isso podia ser traduzido por "mey meen" que é o antigo nome dravidiano para o planeta Saturno. Então, isto foi bastante entusiasmante. Parece que estamos a chegar a algum lado. Mas isto prova que estes selos contêm nomes dravidianos baseados em planetas e constelações de estrelas? Bem, ainda não. Não temos maneira de validar estas leituras particulares, mas se cada vez mais destas leituras começarem a fazer sentido, e se sequências cada vez mais longas parecerem estar corretas, então saberemos que estamos no caminho certo. Hoje, podemos escrever uma palavra como TED em hieróglifos egípcios e em escrita cuneiforme, porque ambas foram decifradas no século XIX. A decifração destas duas escritas possibilitou a estas civilizações falar-nos outra vez diretamente. Os maias começaram a falar-nos no século XX, mas a civilização do Indo permanece silenciosa. Porque é que nos devemos preocupar? A civilização do Indo não pertence apenas aos indianos do sul ou aos indianos do norte ou aos paquistaneses; pertence-nos a todos. Estes são os nossos antepassados -- vossos e meus. Eles foram silenciados por um infeliz acidente da História. Se decifrarmos a escrita, possibilitar-lhes-emos que nos falem outra vez. O que nos diriam? O que descobriríamos sobre eles? Sobre nós? Mal posso esperar para descobrir. Obrigado. (Aplausos)