Gostaria de começar
com um exercício mental.
Imaginem que estamos 4000 anos no futuro.
A civilização tal como a conhecemos
deixou de existir
-- não há livros,
não há aparelhos eletrónicos,
não há Facebook ou Twitter.
Todo o conhecimento
da língua inglesa e do alfabeto inglês
se perdeu.
Agora imaginem arqueólogos
a escavar por entre os escombros
de uma das nossas cidades.
O que é que encontrariam?
Bem, talvez algumas peças
retangulares de plástico
com estranhos símbolos.
Talvez algumas peças circulares de metal.
Talvez alguns recipientes cilíndricos
com alguns símbolos.
E talvez uma arqueóloga
se torne uma celebridade instantânea
quando ela descobrir
-- enterradas nas colinas
algures na América do Norte --
versões gigantescas
destes mesmos símbolos.
Agora perguntemo-nos,
o que tais artefactos
poderiam dizer sobre nós
a pessoas a 4000 anos no futuro?
Esta não é uma questão hipotética.
De facto, este é exatamente o tipo
de questão com que nos confrontamos
quando tentamos compreender
a civilização do Vale do Indo,
que existiu há 4000 anos.
A civilização do Indo
era quase contemporânea
das muito mais bem conhecidas
civilizações egípcia e mesopotâmica,
mas era, na verdade, muito maior
do que qualquer destas duas civilizações.
Ocupava a área
de aproximadamente um milhão
de quilómetros quadrados,
cobrindo o que é agora o Paquistão,
o noroeste da Índia
e partes do Afeganistão e do Irão.
Dado que era uma civilização tão vasta,
poder-se-ia esperar encontrar
poderosos governantes, reis,
e enormes monumentos a glorificar
estes poderosos reis.
De facto,
o que os arqueólogos
encontraram não foi nada disso.
Eles encontraram pequenos objetos
tais como estes.
Aqui está um exemplo de um destes objetos.
Bem, obviamente que este é uma réplica.
Mas quem é esta pessoa?
Um rei? Um deus?
Um sacerdote?
Ou talvez uma pessoa comum
como vocês ou eu?
Não sabemos.
Mas o povo do Indo
também deixou artefactos com escrita.
Bem, não, peças de plástico não,
mas selos de pedra, placas de cobre,
cerâmica e, surpreendentemente,
um enorme quadro com símbolos,
que foi encontrado enterrado
perto do portão de uma cidade.
Agora, não sabemos se diz Hollywood,
ou até Bollywood, tanto quanto sabemos.
Na verdade, nem sequer sabemos
o que qualquer um destes objetos diz.
E isso é porque a escrita do Indo
está indecifrada.
Não sabemos o que qualquer um
destes símbolos quer dizer.
Os símbolos são mais vulgarmente
encontrados nos selos.
Vocês veem ali em cima um desses objetos.
É o objeto quadrado com o animal
semelhante a um unicórnio.
Ora, eis uma magnífica peça de arte.
Então, quão grande pensam vocês que é?
Talvez assim?
Ou talvez assim?
Bem, deixem-me mostrar-vos.
Aqui está uma réplica de um desses selos.
Tem apenas cerca de 2,54 cm x 2,54 cm
de tamanho
-- bem pequenino.
Então para que é que estes foram usados?
Sabemos que estes foram usados
para selar etiquetas de barro
que eram atadas a pacotes de bens
enviados de um lugar para outro.
Estão a ver aquelas guias de remessa
que recebem nas caixas da FedEx?
Estes eram usados para fazer
esse tipo de guias de remessa.
Poderão pensar
sobre o que estes objetos contêm,
em termos do seu texto.
Talvez eles sejam o nome do remetente
ou alguma informação sobre os bens
que estão a ser enviados de um lugar
para outro -- não sabemos.
Precisamos de decifrar a escrita
para responder a essa questão.
Decifrar a escrita
não é apenas um "puzzle" intelectual;
tornou-se realmente uma questão
que ficou profundamente interligada
com a política e a história cultural
do Sul da Ásia.
De facto, a escrita tornou-se
um campo de batalha
entre três diferentes grupos de pessoas.
Primeiro, há um grupo de pessoas
que são muito apaixonadas na sua crença
de que a escrita do Indo
não representa de todo uma linguagem.
Estas pessoas acreditam que os símbolos
são muito semelhantes
ao tipo de símbolos que se encontram
nos sinais de trânsito
ou aos emblemas
que se encontram nos escudos.
Há um segundo grupo de pessoas
que creem que a escrita do Indo
representa uma linguagem indo-europeia.
Se olharem para um mapa da Índia hoje,
verão que a maioria das línguas
faladas no norte da Índia
pertence à família
das línguas indo-europeias.
Por isso, algumas pessoas creem
que a escrita do Indo
representa uma antiga língua
indo-europeia, tal como o sânscrito.
Há um último grupo de pessoas
que creem que as pessoas do Indo
eram os ancestrais das pessoas
que vivem no sul da Índia hoje.
Estas pessoas creem que a escrita do Indo
representa uma antiga forma
da família linguística dravidiana,
que é a família linguística falada
na maior parte do sul da Índia hoje.
E os proponentes desta teoria
apontam para a pequena bolsa de pessoas
falantes de dravidiano no norte,
na realidade, perto do Afeganistão,
e dizem que talvez, algures no passado,
as línguas dravidianas
fossem faladas por toda a Índia,
e que isso sugere
que a civilização do Indo
fosse talvez também dravidiana.
Qual destas hipóteses
pode ser verdadeira?
Não sabemos, mas talvez se vocês
decifrassem a escrita,
pudessem ser capazes de responder
a esta questão.
Mas decifrar a escrita
é uma tarefa muito desafiadora.
Primeiro, não há uma Pedra de Roseta.
Não quero dizer o "software";
quero dizer um antigo artefacto
que contém no mesmo texto
tanto um texto conhecido
como um texto desconhecido.
Não temos um artefacto assim
para a escrita do Indo.
E, além disso, nem sequer sabemos
que língua é que eles falavam.
E para piorar ainda mais as coisas,
a maioria dos textos que temos
são extremamente curtos.
Como vos mostrei, eles são, geralmente,
encontrados nestes selos minúsculos.
E por isso, dados estes obstáculos
formidáveis,
poder-nos-emos perguntar e preocupar
se seremos alguma vez capazes
de decifrar a escrita do Indo.
No resto da minha palestra,
gostaria de vos dizer
como aprendi a deixar de me preocupar
e a adorar o desafio colocado
pela escrita do Indo.
Sempre me senti fascinado
pela escrita do Indo
desde que li sobre ela
num manual do 3.º Ciclo.
E porque é que me senti fascinado?
Bem, é a última grande escrita indecifrada
do mundo antigo.
A minha carreira fez com que me tornasse
um neurocientista computacional,
por isso, no meu emprego de dia,
eu crio modelos computacionais do cérebro
para tentar compreender
como é que o cérebro faz predições,
como é que o cérebro toma decisões,
como é que o cérebro aprende,
e por aí fora.
Mas em 2007, o meu caminho
cruzou-se de novo com a escrita do Indo.
Foi quando estive na Índia,
e tive a maravilhosa oportunidade
de me encontrar
com alguns cientistas indianos
que estavam a usar modelos computacionais
para tentar analisar a escrita.
E assim foi então que compreendi
que havia uma oportunidade para mim
de colaborar com estes cientistas,
e, portanto,
atirei-me a essa oportunidade.
E gostaria de descrever
alguns dos resultados que encontrámos.
Ou melhor ainda,
vamos todos decifrar coletivamente.
Estão prontos?
A primeira coisa a fazer
quando têm uma escrita indecifrada,
é tentar perceber a direção da escrita.
Aqui estão dois textos
que contêm alguns símbolos.
Conseguem dizer-me
se a direção da escrita
é da direita para a esquerda
ou da esquerda para a direita?
Vou dar-vos alguns segundos.
Ok. Da direita para a esquerda, quantos?
Ok. Da esquerda para a direita?
Oh, é quase 50/50. Ok.
A resposta é:
se olharem para o lado esquerdo
dos dois textos,
vão reparar que há um amontoar
de símbolos,
e parece que há 4000 anos,
quando os escribas estavam a escrever
da direita para a esquerda,
faltou-lhes espaço.
E, por isso, eles tiveram de comprimir
o símbolo.
Um dos símbolos está por baixo
do texto no topo.
Isto sugere que a direção da escrita era
provavelmente da direita para a esquerda.
É uma das primeiras coisas que sabemos,
que a direcionalidade é um aspeto
fundamental das escritas linguísticas.
E a escrita do Indo tem agora
esta propriedade particular.
Que outras propriedades da linguagem
mostra a escrita?
As línguas contêm padrões.
Se vos der a letra Q
e pedir para predizerem a próxima letra,
qual é que pensam que poderá ser?
A maioria de vós disse U, que está certo.
Agora se eu vos pedir
para predizerem mais uma letra,
qual é que pensam que poderá ser?
Agora há várias opiniões.
Há o E. Podia ser o I. Podia ser o A,
mas certamente que não
o B, C ou D, certo?
A escrita do Indo também exibe
tipos semelhantes de padrões.
Há muitos textos que começam
com este símbolo em forma de diamante.
E isto, por sua vez, tende a ser seguido
por este símbolo parecido com aspas.
E isto é muito semelhante
a um exemplo Q e U.
Este símbolo pode, por sua vez,
ser seguido por estes símbolos
parecidos com peixes
e alguns outros signos,
mas nunca por estes outros signos
no fundo.
E além disso, há alguns signos
que realmente preferem o final dos textos,
tal como este signo em forma de jarro.
E acontece que este signo,
é o signo que mais frequentemente
ocorre na escrita.
Dados tais padrões,
aqui estava a nossa ideia.
A ideia era usar um computador
para aprender estes padrões,
e, portanto, demos ao computador
os textos existentes.
E o computador
aprendeu um modelo estatístico
de quais os símbolos
que tendem a ocorrer juntos
e quais os símbolos
que tendem a seguir-se uns aos outros.
Dado o modelo computacional,
podemos testar o modelo
essencialmente por perguntas.
Podemos deliberadamente apagar
alguns símbolos,
e podemos pedir-lhe para predizer
os símbolos em falta.
Aqui estão alguns exemplos.
Podem considerar isto
como, talvez, o mais antigo jogo
da Roda da Fortuna.
(Risos)
O que descobrimos
foi que o computador foi bem-sucedido
em 75% dos casos
na predição do símbolo correto.
No resto dos casos,
tipicamente, a segunda melhor resposta
ou terceira melhor resposta
era a resposta certa.
Há também uso prático
para este procedimento particular.
Há muitos destes textos
que estão danificados.
Aqui está um exemplo
de um desses textos.
Podemos usar o modelo computacional
para tentar completar este texto
e fazer a melhor predição de resposta.
Aqui está um exemplo
de um símbolo que foi predito.
E isto podia ser realmente útil
conforme tentamos decifrar a escrita
ao gerar mais dados
que consigamos analisar.
Agora, aqui está uma outra coisa que
podem fazer com o modelo computacional.
Imaginem um macaco
sentado a um teclado.
Penso que poderão obter um amontoado
de letras ao acaso, parecido com este.
Um amontoado de letras ao acaso, assim,
tem uma entropia muito alta.
Este é um termo
da teoria da física e da informação.
Mas imaginem só que é realmente
um amontoado de letras ao acaso.
Quantos de vós alguma vez entornaram café
em cima de um teclado?
Poder-se-ão ter deparado
com o teclado bloqueado
portanto, o mesmo símbolo
a ser repetido uma e outra vez.
Este tipo de sequência
tem uma entropia muito baixa
porque não há variação nenhuma.
A linguagem, por outro lado,
tem um nível de entropia intermédio;
nem é demasiado rígido,
nem é demasiado ao acaso.
Então e a escrita do Indo?
Aqui está um gráfico que marca
as entropias
de todo um grupo de sequências.
Mesmo no topo, encontram a sequência
uniformemente ao acaso,
que é um amontoado de letras ao acaso
-- e, curiosamente, encontramos também
a sequência do ADN do genoma humano
e da música instrumental.
E ambas são muito, muito flexíveis,
pelo que é por isso que vocês as encontram
na variação muito alta.
Na parte mais baixa do final da escala,
vocês encontram uma sequência rígida,
de todos os A,
e encontram também um programa
de computador,
neste caso, na linguagem Fortran,
que obedece realmente a regras rígidas.
As escritas linguísticas
ocupam a variação média.
Agora, então e a escrita do Indo?
Nós descobrimos que a escrita do Indo,
insere-se na variação
das escritas linguísticas.
Quando este resultado foi publicado
pela primeira vez, foi muito controverso.
Houve pessoas que fizeram um alarido,
e estas pessoas
eram aquelas que acreditavam
que a escrita do Indo
não representa uma língua.
Eu comecei até a receber correio de ódio.
Os meus alunos disseram
que eu deveria pensar seriamente
em obter alguma proteção.
Quem imaginaria que a decifração
poderia ser uma profissão perigosa?
O que é que este resultado
realmente mostra?
Mostra que a escrita do Indo
partilha uma propriedade importante
da linguagem.
Portanto, como diz o ditado,
se parece uma escrita linguística
e funciona como uma escrita linguística,
então, talvez tenhamos
uma escrita linguística nas mãos.
Que outra evidência há
de que a escrita poderia realmente
codificar linguagem?
Bem as escritas linguísticas
realmente codificam múltiplas línguas.
Assim, por exemplo,
aqui está a mesma frase escrita em inglês
e a mesma frase escrita em neerlandês
usando as mesmas letras do alfabeto.
Se vocês não souberem neerlandês
e só souberem inglês
e eu vos der algumas palavras
em neerlandês,
dir-me-ão que estas palavras contêm
alguns padrões muito invulgares.
Algumas coisas não estão certas,
e vocês dirão que estas palavras
provavelmente não são palavras inglesas.
A mesma coisa acontece
no caso da escrita do Indo.
O computador encontrou vários textos
-- dois deles são mostrados aqui --
que têm padrões muito invulgares.
Então, por exemplo, o primeiro texto:
há uma duplicação deste signo
em forma de jarro.
Este signo
é o que mais frequentemente ocorre
na escrita do Indo,
e é apenas neste texto
que ele surge duplicado.
Porque é que é assim?
Voltámos atrás para vermos
onde é que estes textos em particular
foram encontrados,
e acontece que foram encontrados
muito, muito longe do Vale do Indo.
Eles foram encontrados
no Iraque e Irão atuais.
E porque é que eles foram lá encontrados?
O que não vos disse
é que o povo do Indo
era muito, muito empreendedor.
Eles costumavam fazer comércio
com povos muito longe de onde viviam.
E assim, neste caso,
eles estavam a viajar por mar
até à Mesopotâmia, o Iraque atual.
E o que parece ter acontecido aqui
é que os comerciantes do Indo,
os mercadores,
estavam a usar esta escrita
para escrever uma língua estrangeira.
Tal como o nosso exemplo do inglês
e do neerlandês.
E isso explicaria porque é que temos
estes estranhos padrões
que são muito diferentes
dos tipos de padrões
que vocês veem no texto
dos achados no Vale do Indo.
Isto sugere que a mesma escrita,
a escrita do Indo,
poderia ser usada para escrever
línguas diferentes.
Os resultados que temos até agora
parecem apontar para a conclusão
de que a escrita do Indo provavelmente
representa mesmo uma língua.
Se representa mesmo uma língua,
então como é que lemos os símbolos?
Esse é o nosso próximo grande desafio.
Então vão reparar que muitos dos símbolos
se parecem com imagens
de humanos, de insetos,
de peixes, de aves.
Muitas escritas antigas
usam o "princípio de rebus",
que é, usar imagens
para representar palavras.
Então, como exemplo,
aqui está uma palavra.
Conseguem escrevê-la usando imagens?
Vou dar-vos alguns segundos.
Conseguiram?
Ok. Ótimo.
Aqui está a minha solução.
Podiam usar a imagem
de uma abelha [bee]
seguida da imagem de uma folha [leaf]
-- e temos "crença" [belief], certo?
Poderia haver outras soluções.
No caso da escrita do Indo,
o problema é o contrário.
Vocês têm de descobrir o som
de cada uma destas imagens
de maneira a que a sequência inteira
faça sentido.
Então, isto é tal e qual um "puzzle"
de palavras cruzadas,
exceto que isto é a mãe de todos
os "puzzles" de palavras cruzadas,
porque o que está em jogo
é tão importante,
caso se consiga resolver.
Os meus colegas,
Iravatham Mahadevan e Asko Parpola
têm estado a fazer algum avanço
neste problema em particular.
E gostaria de vos dar um rápido exemplo
do trabalho do Parpola.
Aqui está um texto realmente curto.
Ele contém sete traços verticais
seguidos por este signo em forma de peixe.
E quero mencionar
que estes selos eram usados
para selar etiquetas de barro
que eram atadas a pacotes de bens,
portanto, é bastante provável que
estas etiquetas, pelo menos algumas delas,
contenham nomes de mercadores.
E acontece que na Índia
há uma longa tradição
de nomes baseados em horóscopos
e constelações de estrelas
presentes no momento do nascimento.
Nas línguas dravidianas,
a palavra para "peixe" é "meen"
que, por acaso,
soa como a palavra para estrela.
e assim, sete estrelas
representariam "elu meen"
que é a palavra dravidiana
para a constelação da Ursa Maior.
Do mesmo modo,
há outra sequência de seis estrelas,
e que se traduz por "aru meen"
que é o antigo nome dravidiano
para a constelação das estrelas Plêiades.
E finalmente, há outras combinações,
tais como este signo de peixe,
com algo que parece um telhado
por cima dele.
E isso podia ser traduzido por "mey meen"
que é o antigo nome dravidiano
para o planeta Saturno.
Então, isto foi bastante entusiasmante.
Parece que estamos a chegar
a algum lado.
Mas isto prova
que estes selos contêm nomes dravidianos
baseados em planetas
e constelações de estrelas?
Bem, ainda não.
Não temos maneira de validar
estas leituras particulares,
mas se cada vez mais destas leituras
começarem a fazer sentido,
e se sequências cada vez mais longas
parecerem estar corretas,
então saberemos
que estamos no caminho certo.
Hoje, podemos escrever uma palavra
como TED
em hieróglifos egípcios
e em escrita cuneiforme,
porque ambas foram decifradas
no século XIX.
A decifração destas duas escritas
possibilitou a estas civilizações
falar-nos outra vez diretamente.
Os maias começaram a falar-nos
no século XX,
mas a civilização do Indo
permanece silenciosa.
Porque é que nos devemos preocupar?
A civilização do Indo não pertence
apenas aos indianos do sul
ou aos indianos do norte
ou aos paquistaneses;
pertence-nos a todos.
Estes são os nossos antepassados
-- vossos e meus.
Eles foram silenciados
por um infeliz acidente da História.
Se decifrarmos a escrita,
possibilitar-lhes-emos
que nos falem outra vez.
O que nos diriam?
O que descobriríamos sobre eles?
Sobre nós?
Mal posso esperar para descobrir.
Obrigado.
(Aplausos)