Eu gostaria de começar com um exercício hipotético.
Imagine que ele acontece 4.000 anos no futuro.
A civilização como a conhecemos
deixou de existir --
sem livros,
sem aparelhos eletrônicos,
sem Facebook ou Twiter.
Todo conhecimento da língua e do alfabeto ingleses
foi perdido.
Agora imagine arqueólogos
cavando nos escombros de uma de nossas cidades.
O que eles poderiam encontrar?
Bem, talvez alguns pedaços retangulares de plástico
com símbolos estranhos.
Talvez alguns pedaços circulares de metal.
Talvez alguns recipientes cilíndricos
com alguns símbolos.
E talvez uma arqueóloga se torne uma celebridade instantânea
quando ela decobre --
enterrada nas colinas de algum lugar na América do Norte --
grandes quantidades de versões destes mesmos símbolos.
Agora, vamos perguntar a nós mesmos,
o que tais artefatos poderiam dizer sobre nós
para pessoas a 4.000 anos no futuro?
Esta não é uma questão hipotética.
De fato, é exatamente o tipo de questão que encaramos
quando tentamos entender a civilização do Vale do Indo,
que existiu 4.000 anos atrás.
A civilização do Indo era, grosso modo, contemporânea
às muito mais conhecidas civilizações egípcia e mesopotâmica,
mas era realmente muito maior que qualquer uma dessas duas civilizações.
Ela ocupou a área
de aproximadamente um milhão de quilômetros quadrados,
abrangendo o que é agora o Paquistão,
o Noroeste da Índia
e partes do Afeganistão e Irã.
Considerando-se que era uma civilização tão vasta,
você esperaria encontrar governantes realmente poderosos, reis,
e monumentos gigantescos glorificando esses reis poderosos.
De fato,
o que arqueólogos encontraram não foi nada disso.
Eles encontraram pequenos objetos como estes.
Aqui está um exemplo de um desses objetos.
Bem, obviamente isto é uma réplica.
Mas, quem é esta pessoa?
Um rei? Um deus?
Um sacerdote?
Ou, talvez, uma pessoa comum
como você ou eu?
Não sabemos.
Mas o povo do Indo também deixou artefatos com escritos.
Bem, não, não peças de plástico,
mas selos de pedra, plaquetas de cobre,
cerâmica e, surpreendentemente,
uma grande placa de símbolos,
que foi encontrada enterrada perto do portão de uma cidade.
Não sabemos se ela diz Hollywood,
ou mesmo Bollywood nessa questão.
De verdade, não sabemos mesmo
o que diz qualquer um desses objetos.
E isso ocorre porque a escritura do Indo não foi decifrada.
Não sabemos o que qualquer um desses símbolos significa.
Os símbolos são mais comumente encontrados em selos.
Aqui vocês veem um desses objetos.
É um objeto quadrado com um animal em forma de unicórnio.
Esta é uma magnífica peça de arte.
Quão grande vocês acham que ela é?
Talvez deste tamanho?
Ou talvez deste?
Bem, permitam-me mostrar-lhes.
Aqui está uma réplica de um desses selos.
Ele tem o tamanho de uma polegada por uma polegada --
bastante pequeno.
Então, para que eles eram usados?
Sabemos que estes eram usados para estampar etiquetas de argila
que eram anexadas a fardos de mercadorias remetidas de um lugar para outro.
Sabem aquelas tiras de embalagem que vocês têm nas caixas FedEx?
Estes eram usados para fazer esse tipo de etiqueta de embalagem.
Agora vocês podem imaginar o que estes objetos contêm
em termos de textos.
Talvez eles sejam o nome do remetente
ou alguma informação sobre as mercadorias
que estão sendo enviadas de um lugar para o outro -- nós não sabemos.
Precisamos decifrar a escritura para responder esta questão.
Decifrar a escritura
não é apenas um quebra-cabeças intelectual;
na verdade tornou-se uma questão
profundamente entrelaçada
com a política e a história cultural do Sul da Ásia.
Na verdade, a escritura se tornou um campo de batalha de todo tipo
entre três diferentes grupos de pessoas.
Primeiramente, há um grupo de pessoas
que são muito passionais na sua crença
de que as escrituras do Indo
não representam nenhuma língua.
Essas pessoas acreditam que os símbolos
são muito semelhantes ao tipo de símbolos que você encontra em sinais de trânsito
ou os emblemas que você encontra em escudos.
Há um segundo grupo de pessoas
que acredita que a escritura do Indo representa uma língua indo-europeia.
Se você olhar para um mapa da Índia hoje,
verá que a maioria das línguas faladas no Norte da Índia
pertence à família das línguas indo-europeias.
Então, algumas pessoas acreditam que a escritura do Indo
representa uma antiga língua indo-europeia como o sânscrito.
Há um último grupo de pessoas
que acredita que os povos do Indo
eram os ancestrais das pessoas que vivem no Sul da Índia hoje.
Estas pessoas acreditam que a escritura do Indo
representa uma forma antiga
da família de línguas dravídicas,
que é a família de línguas faladas na maior parte do Sul da Índia hoje.
E os proponentes desta teoria
apontam para aquele pequeno bolsão de pessoas que falam dravídico no Norte,
de fato, perto do Afeganistão,
e dizem que, talvez, em alguma época no passado,
as línguas dravídicas fossem faladas em toda a Índia
e que isto sugere
que talvez a civilização do Indo seja também dravidiana.
Agora, qual dessas hipóteses pode ser verdadeira?
Não sabemos, mas talvez se você decifrasse a escritura,
seria capaz de responder esta questão.
Mas, decifrar a escritura é uma tarefa muito desafiante.
Primeiro, não há Pedra de Rosetta.
Não me refiro ao software;
refiro-me ao artefato antigo
que contém no mesmo texto
tanto um texto conhecido como um texto desconhecido.
Não temos esse artefato para a escritura do Indo.
E, além disso, nem mesmo sabemos qual língua eles falavam.
E para tornar o assunto ainda pior,
a maioria dos textos que temos são extremamente curtos.
Como lhes mostrei, eles são geralmente encontrados nestes selos
que são muito, muito pequenos.
Então, considerados esses obstáculos formidáveis,
uma pessoa pode questionar-se e mesmo preocupar-se
se alguém algum dia será capaz de decifrar a escritura do Indo.
Então, no restante de minha apresentação,
eu gostaria de contar-lhes como aprendi a parar de me preocupar
e a amar o desafio apresentado pela escritura do Indo.
Sempre fui fascinado pela escritura do Indo
desde que li sobre ela em um livro da escola de ensino médio
E por que eu era fascinado?
Bem, esta é a última e a maior escritura não decifrada no mundo antigo.
Minha trajetória profissional levou-me a ser um neurocientista computacional
então em meu trabalho diário,
crio modelos computacionais do cérebro
para tentar entender como o cérebro elabora predições,
como o cérebro toma decisões,
como o cérebro aprende e assim por diante.
Mas, em 2007, meu caminho cruzou novamente com a escritura do Indo.
Isto foi quando eu estava na Índia,
e tive a maravilhosa oportunidade
de encontrar-me com alguns cientistas indianos
que estavam usando modelos computacionais para tentar analisar a escritura.
E foi então que percebi
que havia uma oportunidade de eu colaborar com esses cientistas,
e me agarrei àquela oportunidade.
E eu gostaria de descrever alguns dos resultados que encontramos.
Ou melhor ainda, vamos todos decifrar coletivamente.
Estão prontos?
A primeira coisa que você precisa fazer quando tem uma escrita não decifrada
é tentar descobrir a direção da escrita.
Então, aqui estão dois textos que contêm alguns símbolos.
Vocês podem me dizer
se a direção da escrita é da direita para a esquerda ou da esquerda para a direita?
Vou dar-lhes alguns segundos.
OK. Da direita para a esquerda, quantos? OK.
Ok. Da esquerda para a direita?
Oh, é quase meio a meio. OK.
Então a resposta é:
se você olhar para o lado esquerdo dos dois textos,
você notará que há um aglomerado de símbolos,
e parece que, 4.000 anos atrás,
quando os escribas estavam escrevendo da direita para a esquerda,
eles ficaram sem espaço.
Então eles tiveram que encaixar o símbolo.
Um dos símbolos está abaixo do texto no topo.
Isto sugere que a direção da escrita
era provavelmente da direita para a esquerda.
E esta é uma das primeiras coisas que sabemos,
que o direcionamento é um aspecto chave de escritas linguísticas.
E a escritura do Indo agora tem
essa propriedade específica.
Que outras propriedades da linguagem a escritura mostra?
Línguas contêm padrões.
Se eu lhe dou a letra Q
e peço para você predizer a próxima letra, qual você acha que seria?
A maioria disse U, o que está correto.
Agora, se peço para você predizer mais uma letra,
qual você acha que seria?
Agora há várias possibilidades. Existe o E. Poderia ser I. Poderia ser A,
mas certamente não B, C ou D, certo?
A escritura Indo também exibe tipos semelhantes de padrões.
Há muitos textos que começam com este símbolo em forma de diamante.
E este, por sua vez, tende a ser seguido
por este símbolo em forma de aspas.
E isto é muito similar ao exemplo do Q e U.
Este símbolo pode também ser seguido
por estes símbolos em forma de peixe e alguns outros signos,
mas nunca por estes outros signos abaixo.
E além disso, há alguns signos
que realmente preferem o final dos textos,
como este signo em forma de jarra.
E este signo, de fato, é o que
mais frequentemente ocorre na escritura.
Dados esses padrões, aqui vai nossa ideia.
A ideia foi usar um computador
para aprender esses padrões,
e, então, colocamos no computador os textos existentes.
E o computador aprendeu um modelo estatístico
de quais símbolos tendem a ocorrer juntos
e quais símbolos tendem a seguir uns aos outros.
Dado o modelo computacional,
podemos testar o modelo essencialmente questionando-o.
Então poderíamos deliberadamente apagar alguns símbolos,
e pedir-lhe para predizer os símbolos faltantes.
Aqui estão alguns exemplos.
Você pode considerar isto
talvez como o mais antigo jogo
da Roda da Fortuna.
O que encontramos
foi que o computador tinha sucesso em 75 por cento dos casos
ao predizer o símbolo correto.
No restante dos casos,
tipicamente a segunda ou a terceira opções era a resposta correta.
Há também um uso prático
para este procedimento específico.
Há muitos destes textos que estão danificados.
Aqui está um exemplo de um desses textos.
E podemos usar o modelo computacional agora para tentar completar este texto
e fazer a melhor predição.
Aqui está um exemplo de um símbolo que foi predito.
E isso pode ser realmente útil à medida que tentamos decifrar a escritura,
gerando mais dados que podemos analisar.
Aqui, temos uma outra coisa que pode ser feita com o modelo computacional.
Imaginem um macaco
dedilhando um teclado.
Penso que se poderia obter um conjunto errático de letras que se parece com este.
Tal conjunto errático de letras
é considerado como tendo uma entropia muito alta.
Este é um termo da física e da teoria da informação.
Mas, apenas imagine que é realmente um conjunto errático de letras.
Qual de vocês alguma vez já derramou café no teclado?
Você pode ter-se deparado com um teclado travado --
basicamente o mesmo símbolo sendo repetido indefinidamente.
Este tipo de sequência é considerada como tendo uma entropia muito baixa
porque não há nenhuma variação.
A língua, por outro lado, têm um grau intermediário de entropia;
não é nem muito rígida,
nem muito errática.
E a escritura do Indo?
Aqui está um gráfico que esquematiza as entropias de um bloco de sequências.
No topo encontra-se a sequência uniformemente errática,
que é o conjunto errático de letras --
e, interessante, também encontramos
a sequência do DNA do genoma humano e a música instrumental.
E ambas são muito, muito flexíveis,
e é por isso que se encontram na mais alta variação.
Na parte mais baixa da escala,
encontra-se a sequência rígida, a sequência de todos os A,
e também se encontra um programa de computador,
neste caso em linguagem Fortran,
que obecede regras realmente estritas.
Escritos linguísticos
ocupam a variação mediana.
E a escritura do Indo?
Descobrimos que a escritura do Indo
na verdade encaixa-se dentro da variação dos escritos linguísticos.
Quando este resultado foi publicado pela primeira vez,
levantou grande controvérsia.
Houve pessoas que clamaram por justiça,
e estas pessoas eram aquelas que acreditavam
que a escritura do Indo não representa um idioma.
Comecei a receber correspondência ameaçadora.
Meus alunos disseram
que eu deveria pensar seriamente em obter alguma proteção.
Quem teria imaginado
que decifrar poderia ser uma profissão perigosa?
O que este resultado realmente mostra?
Ele mostra que a escritura do Indo
compartilha uma importante propriedade da língua.
Então, como diz o velho adágio,
se parece com um escrito linguístico
e age como um escrito linguístico,
então, talvez tenhamos um escrito linguístico em nossas mãos.
Que outra evidência existe
de que a escritura poderia realmente codificar uma língua?
Bem, escritos linguísticos podem realmente codificar múltiplas línguas.
Por exemplo, aqui está a uma sentença escrita em inglês
e a mesma sentença escrita em holandês,
usando as mesmas letras do alfabeto.
Se você não conhece holandês e conhece somente inglês
e eu lhe dou algumas palavras em holandês,
você me dirá que essas palavras contêm
alguns padrões muito incomuns.
Algums coisas não estão certas,
e você dirá que essas palavras são provavelmente não inglesas.
A mesma coisa acontece no caso da escritura do Indo.
O computador encontrou vários textos --
dois deles são mostrados aqui --
que têm padrões muito incomuns.
Por exemplo, o primeiro texto:
há um par desse signo em forma de jarra.
Este é o signo que mais frequentemente ocorre
na escritura do Indo,
e é apenas neste texto
que ele ocorre como um par.
Por que isso se apresenta assim?
Voltamos e observamos onde estes textos específicos foram encontrados,
e acontece que eles foram encontrados
muito, muito distantes do Vale do Indo.
Foram encontrados no que é atualmente o Iraque e o Irã.
E por que foram encontrados lá?
O que não lhes contei é que
o povo do Indo era muito, muito empreendedor.
Eles costumavam comerciar com povos muito distantes de onde eles viviam.
E assim, neste caso, eles estavam viajando pelo mar
todo o caminho para a Mesopotâmia, atualmente Iraque.
E o que parece ter acontecido aqui
é que os comerciantes do Indo, os mercadores,
estavam usando esta escrita pra grafar uma língua estrangeira.
É exatamente como nosso exemplo de inglês e holandês.
E isso explicaria por que temos estes padrões estranhos
que são muito diferentes dos tipos de padrões que se observam nos textos
que são encontrados dentro do Vale do Indo.
Isto sugere que o mesmo escrito, a escritura do Indo,
poderia ser usada para escrever diferentes línguas.
Os resultados que temos até agora parecem apontar para a conclusão
de que a escritura do Indo provavelmente representa uma língua.
Se ela realmente representa uma língua,
então, como lemos os símbolos?
Este é o nosso próximo grande desafio.
Vocês perceberam que muitos dos símbolos
parecem desenhos de humanos, de insetos,
de peixes, de pássaros.
Muitos escritos antigos
usam o princípio do rébus,
que é usar gravuras para representar palavras.
Então, como um exemplo, aqui está uma palavra.
Vocês podem escrevê-la usando gravuras?
Vou dar-lhes alguns segundos.
Conseguiram?
OK. Ótimo.
Aqui está minha solução.
Você poderia usar o desenho de uma abelha (bee > bi) seguido pelo desenho de uma folha (leaf > lif) --
e isto forma "crença" (belief > bilif), certo?
Poderia haver outras soluções.
No caso da escritura do Indo,
o problema está invertido.
Você tem que imaginar os sons de cada uma destas gravuras
de modo que a sequência inteira faça sentido.
Então, é como se isto fosse apenas um quebra-cabeças,
a não ser pelo fato de que aqui está a mãe de todos os quebra-cabeças,
porque o que está em jogo é muito alto se você solucioná-lo.
Meus colegas, Iravatham Mahadevan e Asko Parpola,
têm tido algum progresso neste problema específico.
E, gostaria de apresentar-lhes um rápido exemplo do trabalho de Parpola.
Aqui está um trecho realmente curto.
Ele contém sete traços verticais seguidos deste signo em forma de peixe.
E quero mencionar que estes selos eram usados
para estampar etiquetas de argila
que eram anexadas a fardos de mercadorias,
então, é muito provavel que estas etiquetas, ao menos algumas delas,
contenham nomes dos mercadores.
E acontece que na Índia
existe uma longa tradição
de nomes serem baseados em horóscopos
e constelações presentes à época do nascimento.
Nas línguas dravídicas,
a palavra para peixe é "meen"
que soa exatamente igual à palavra para estrela.
Então sete estrelas
seriam representadas por "elu meen"
que é a palavra dravídica
para Big Dipper - conjunto de sete estrelas na constelação da Ursa Maior.
Da mesma forma, há uma outra sequência de seis estrelas,
e isso se traduz por "aru meen"
que é o antigo nome dravídico
para a constelação de Plêiades.
Finalmente, há outras combinações,
tal como este signo em forma de peixe com algo que parece um telhado no topo.
E ele poderia ser traduzido como "mey meen"
que é o antigo nome dravídico para o planeta Saturno.
Então, isto foi muito excitante.
Parece que estamos conseguindo alguma coisa.
Mas isto prova
que estes selos contêm nomes dravídicos
baseados em planetas e constelações?
Bem, não ainda.
Então, não temos como validar
estas leituras específicas,
mas, se mais e mais dessas leituras começarem a fazer sentido
e se sequências cada vez mais longas
parecerem estar corretas,
então sabemos que estamos no caminho certo.
Hoje,
podemos escrever uma palavra como TED
em hieroglifos egípcios ou na escrita cuneiforme
porque ambos foram decifrados
no século XIX.
Decifrar essas duas escritas
possibilitou a essas duas civilizações falar de novo conosco diretamente
Os Maias
começaram a falar conosco no século XX,
mas a civilização do Indo permanece silenciosa.
Por que deveríamos nos importar?
A civilização do Indo não pertence
apenas aos indianos do Sul ou do Norte
ou aos paquistaneses;
ela pertence a todos nós.
Esses são nossos ancestrais --
seus e meus.
Eles foram silenciados
por um acidente histórico infeliz.
Se decifrássemos a escrita,
tornaríamos possível para eles falar conosco novamente.
O que eles nos diriam?
O que descobriríamos sobre eles? Sobre nós?
Mal posso esperar para descobrir.
Obrigado.
(Aplausos)