Ik wil beginnen met een gedachtenexperiment.
Stel je voor dat het over 4000 jaar is, in de toekomst.
Onze beschaving van nu
bestaat niet meer.
Geen boeken,
geen elektronische apparaten,
geen Facebook of Twitter.
Alle kennis van de Engelse taal en het Engelse alfabet
is verloren gegaan.
Dan zijn er archeologen
die in de ruïnes van een van onze steden graven.
Wat zouden ze vinden?
Misschien wat rechthoekige stukjes plastic
met vreemde symbolen erop.
Misschien wat cirkelvormige stukjes metaal.
Misschien wat cylindervormige houders
met wat symbolen erop.
En misschien wordt een van de archeologen wel wereldberoemd
door haar ontdekking,
ergens in de heuvels van Noord-Amerika,
van enorme versies van diezelfde symbolen.
Laten we ons eens afvragen
wat dat soort voorwerpen over ons vertellen
aan mensen die over 4000 jaar leven.
Dat is geen hypothetische vraag.
Het is zelfs precies de soort vraag die we hebben
als we proberen de beschaving van de Indusvallei te begrijpen
die 4000 jaar geleden bestond.
De Indusbeschaving viel ongeveer samen
met de beter bekende Egyptische en Mesopotamische beschavingen,
maar was veel groter dan elk van die twee beschavingen.
Het ging om een gebied
van ongeveer een miljoen vierkante kilometer
op de plaats van het huidige Pakistan,
Noordwest-India,
en delen van Afghanistan en Iran.
Omdat het zo'n grote beschaving was,
zou je misschien sterke leiders verwachten, koningen,
en enorme monumenten ter ere van die sterke koningen.
In werkelijkheid
hebben archeologen niets van dat alles gevonden.
Ze hebben kleine voorwerpen gevonden, zoals deze.
Dit is een voorbeeld van zo'n voorwerp.
Het is natuurlijk een replica.
Maar wie is dit?
Een koning? Een god?
Een priester?
Of misschien gewoon iemand
zoals jij of ik?
We weten het niet.
Maar het Indusvolk heeft ook voorwerpen achtergelaten waarop is geschreven.
Geen stukjes plastic,
maar stenen zegels, koperen tabletten,
aardewerk en, heel verrassend,
één groot bord
dat in de grond bij de poort van een stad is gevonden.
We weten niet of er Hollywood op staat
of misschien zelfs Bollywood.
We weten niet eens
wat er op al deze voorwerpen staat.
Dat komt doordat het Indusschrift niet is ontcijferd.
We weten niet wat deze symbolen betekenen.
De symbolen komen vooral voor op zegels.
Hier zie je zo'n voorwerp.
Het vierkante ding met het eenhoornachtige dier erop.
Dat is een mooi stukje kunst.
Hoe groot denk je dat het is?
Zo groot misschien?
Of misschien zo groot?
Ik ga het laten zien.
Dit is een replica van een van de zegels.
Het is ongeveer 2,5 centimeter in het vierkant,
behoorlijk klein.
Waar werden ze voor gebruikt?
We weten dat ze werken gebruikt voor het stempelen van kleitabletjes
die aan bundels goederen werden bevestigd die naar een andere plaats werden gestuurd.
Ken je de verzendbrieven die bij pakketjes van de koerier zitten?
Deze dingen werden gebruikt voor dat soort verzendbrieven.
Je vraagt je misschien af wat er op die voorwerpen staat
wat betreft de tekst.
Misschien is het de naam van de afzender
of informatie over de goederen
die naar een andere plaats worden verzonden. We weten het niet.
We moeten het schrift ontcijferen om die vraag te beantwoorden.
Het ontcijferen van het schrift
is niet zomaar een intellectuele puzzel.
Het is een vraag geworden
die nauw verbonden is geraakt
met de politiek en de culturele geschiedenis van Zuid-Azië.
Het schrift is een soort strijdtoneel geworden
tussen drie verschillende groepen mensen.
Allereerst is er een groep mensen
die gepassioneerd geloven
dat het Indusschrift
helemaal geen taal vertegenwoordigt.
Deze mensen geloven dat de symbolen
lijken op het soort symbolen dat je op verkeersborden ziet
of de emblemen op wapens.
Dan is er een tweede groep mensen
die geloven dat het Indusschrift een Indo-Europese taal vertegenwoordigt.
Als je kijkt naar een kaart van het huidige India
zie je dat de meeste talen die in Noord-India worden gesproken
bij de Indo-Europese taalfamilie horen.
Dus sommige mensen geloven dat het Indusscript
een oude Indo-Europese taal zoals Sanskriet vertegenwoordigt.
Ten slotte is er een groep mensen
die geloven dat het Indusvolk
de voorouders waren van mensen die tegenwoordig in Zuid-India wonen.
Die mensen geloven dat het Indusscript
een oude vorm vertegenwoordigt
van de Dravidische taalfamilie
de taalfamilie die nu in een groot deel van Zuid-India wordt gesproken.
De voorstanders van deze theorie
wijzen naar dat kleine gebied in het Noorden waar Dravidisch wordt gesproken
in de buurt van Afghanistan
en ze zeggen dat misschien ooit vroeger
overal in India Dravidische talen werden gesproken
en dat het dus mogelijk is
dat de Indusbeschaving misschien ook Dravidisch is.
Welk van deze hypotheses kan kloppen?
We weten het niet, maar als je het schrift ontcijfert,
kun je die vraag misschien beantwoorden.
Maar het ontcijferen van het schrift is een enorme uitdaging.
Ten eerste is er geen Steen van Rosetta.
Ik heb het niet over de software
maar over een oud voorwerp
waarop dezelfde tekst staat
in een bekende taal en een onbekende taal.
Zo'n voorwerp hebben we niet voor het Indusschrift.
Bovendien weten we niet eens welke taal ze spraken.
En om het nog erger te maken,
zijn de meeste teksten die we hebben heel kort.
Ik liet al zien dat ze meestal op deze zegels staan,
die heel erg klein zijn.
Met deze flinke hindernissen
kun je je afvragen
of het ons ooit zal lukken om het Indusschrift te ontcijferen.
In de rest van mijn voordracht
wil ik jullie vertellen waarom ik me daar nu geen zorgen meer over maak
en ik van de uitdaging van het Indusscript ben gaan houden.
Ik ben al gefascineerd door het Indusscript
sinds ik er op school in een lesboek over las.
Waarom vond ik het zo fascinerend?
Het is het laatste belangrijke niet-ontcijferde schrift uit de oudheid.
Ik ben uiteindelijk computer-neurowetenschapper geworden,
dus in mijn gewone baan
maak ik computermodellen van de hersenen
om te leren begrijpen hoe de hersenen voorspellingen doen,
hoe de hersenen beslissingen nemen,
hoe de hersenen leren, enzovoort.
Maar in 2007 kruiste het Indusschrift mijn pad weer.
Ik was toen in India
en kreeg de prachtige kans
om een aantal Indiase wetenschappers te ontmoeten
die het schrift probeerden te analyseren met computermodellen.
Toen realiseerde ik me
dat ik de mogelijkheid had om met die wetenschappers samen te werken.
Ik greep die kans meteen aan.
Ik wil wat van onze resultaten beschrijven.
Of nog beter: laten we samen gaan ontcijferen.
Zijn jullie er klaar voor?
Het eerste wat je moet doen met een niet-ontcijferd schrift
is uitzoeken wat de schrijfrichting is.
Dit zijn twee teksten met wat symbolen erin.
Kan je me vertellen
of de schrijfrichting van rechts naar links of van links naar rechts is?
Je krijgt een paar seconden.
Oke. Hoeveel denken van rechts naar links?
Oke. Van links naar rechts?
Het is bijna 50/50.
Het antwoord is:
Als je naar de linkerkant van de twee teksten kijkt,
zie je dat de tekens dichter bij elkaar staan.
Het lijkt erop dat 4000 jaar geleden,
toen de schrijver van rechts naar links schreef,
er niet genoeg ruimte was.
Het teken werd erbij gepropt.
Een van de tekens staat ook onder de tekst aan de bovenkant.
Het lijkt er dus op dat de schrijfrichting
waarschijnlijk van rechts naar links was.
Dat is een van de eerste dingen die we weten,
dat richting een belangrijk aspect is van linguïstisch schrift.
Het Indusschrift heeft dus
deze bepaalde eigenschap.
Welke eigenschappen van taal zouden we kunnen zien?
Talen bevatten patronen.
Als ik je de letter Q geef
en je vraag te voorspellen wat de volgende letter is, wat denk je dan?
De meesten zeiden U, en dat klopt.
Als ik je ook de volgende letter zou vragen,
welke zou dat dan zijn, denk je?
Er zijn verschillende mogelijkheden. E, of I. Misschien A.
Maar zeker niet B, C of D, of wel?
Het Indusschrift heeft net zulke patronen.
Er zijn veel teksten die beginnen met dit ruitvormige symbool.
En dat wordt op zijn beurt vaak gevolgd
door dit symbool dat lijkt op aanhalingstekens.
Net zoals het voorbeeld van de Q en de U.
Dit symbool kan weer worden gevolgd
door deze visachtige symbolen en wat andere tekens,
maar nooit door die tekens onderaan.
Daarnaast zijn er wat tekens
die bij voorkeur aan het eind van teksten staan,
zoals dit komvormige teken.
Dit teken is trouwens
het meest voorkomende teken in het schrift.
Door deze patronen kregen we een idee.
Het idee was om een computer te gebruiken
om die patronen te leren.
We gaven de computer de bestaande teksten.
En de computer leerde een statistisch model
van welke symbolen meestal samen voorkomen
en welke symbolen meestal op elkaar volgen.
Als we het computermodel hebben,
kunnen we het model testen door het te ondervragen.
We kunnen met opzet wat symbolen wissen
en het model vragen de ontbrekende symbolen te voorspellen.
Hier zijn wat voorbeelden.
Je kan dit zien
als misschien wel de oudste versie
van het Rad van Fortuin.
We ontdekten
dat het de computer in 75 procent van de gevallen lukte
om het juiste symbool te voorspellen.
In de rest van de gevallen
was meestal de tweede of derde suggestie het goede antwoord.
Er is ook een praktisch nut
voor deze procedure.
Veel teksten zijn beschadigd.
Dit is een voorbeeld van zo'n tekst.
Met het computermodel kunnen we proberen deze tekst aan te vullen
met een zo goed mogelijke voorspelling.
Dit is een voorbeeld van een symbool dat is voorspeld.
Dit kan erg nuttig zijn als we het schrift proberen te ontcijferen.
We kunnen meer gegevens genereren om te analyseren.
We kunnen nog iets anders doen met het computermodel.
Stel je een aap voor
die achter een toetsenbord zit.
Dan krijg je een willekeurige mix van letters die er zo uitziet.
Van zo'n willekeurige mix van letters
wordt gezegd dat deze een zeer hoge entropie heeft.
Dat is een term uit de natuurkunde en informatietheorie.
Maar het is gewoon een zeer willekeurige mix van letters.
Wie heeft er wel eens koffie op een toetsenbord geknoeid?
Dan hebt u misschien wel eens last gehad van een vastzittend toetsenbord.
Hetzelfde symbool wordt dan steeds weer herhaald.
Zo'n soort reeks heeft een heel lage entropie
omdat er helemaal geen variatie is.
Taal heeft daarentegen een gemiddeld entropieniveau,
niet heel rigide
maar ook niet te willekeurig.
Hoe zit het met het Indusschrift?
Dit is een grafiek met de entropieën van een heleboel reeksen.
Helemaal bovenaan staat de volledig willekeurige reeks
die een willekeurige mix van letters is.
Wat interessant is, is dat daar ook
de DNA-volgorde van het menselijke genoom en instrumentale muziek staan.
Die zijn allebei heel erg flexibel
en dus hebben ze een zeer grote variatie.
Helemaal onder aan de schaal
zie je een rigide reeks, een reeks met alleen A's.
Daar staat ook een computerprogramma,
in dit geval in de taal Fortran,
waarvoor zeer strikte regels gelden.
Linguïstisch schrift
zit in het middelste bereik.
Maar hoe zit het met het Indusschrift?
We ontdekten dat het Indusschrift
binnen het bereik van linguïstisch schrift valt.
Toen dit resultaat voor het eerst werd gepubliceerd,
was het zeer controversieel.
Sommige mensen schreeuwden het haast uit.
Dat waren de mensen die geloofden
dat het Indusschrift geen taal vertegenwoordigt.
Ik kreeg zelfs haatmails.
Mijn studenten vonden
dat ik erover moest denken om me te laten beveiligen.
Wie had ooit gedacht
dat ontcijferen zo'n gevaarlijk beroep zou zijn?
Wat betekent dit resultaat nu eigenlijk?
Het betekent dat het Indusschrift
een belangrijke eigenschap van taal deelt.
Zoals in het bekende gezegde
'als het eruit ziet als een linguïstisch schrift,
en het zich gedraagt als een linguïstisch schrift,
dan hebben we misschien een linguïstisch schrift te pakken.'
Wat is er nog meer voor bewijs
dat het schrift een taal zou kunnen coderen?
Linguïstisch schrift kan meerdere talen coderen.
Hier staat bijvoorbeeld een zin die in het Engels is geschreven
en dezelfde zin die in het Nederlands is geschreven
met dezelfde letters van het alfabet.
Als je geen Nederlands spreekt en alleen maar Engels,
en ik je wat Nederlandse woorden laat zien,
zul je zeggen dat er in die woorden
ongebruikelijke patronen zitten.
Sommige dingen kloppen niet
en je zult zeggen dat het waarschijnlijk geen Engelse woorden zijn.
Hetzelfde gebeurt bij het Indusschrift.
De computer heeft verschillende teksten gevonden --
dit zijn twee voorbeelden --
met zeer ongebruikelijke patronen.
Neem bijvoorbeeld de eerste tekst.
Daarin wordt het komvormige teken verdubbeld.
Dat teken is het meest voorkomende teken
in het Indusschrift,
en alleen in deze tekst
komt het voor als een dubbel paar.
Waarom is dat zo?
We gingen kijken waar deze teksten zijn gevonden
en het blijkt dat ze zijn gevonden
ergens heel ver weg van de Indusvallei.
Ze zijn gevonden in het huidige Irak en Iran.
Waarom zijn ze daar gevonden?
Er is iets wat ik nog niet heb verteld.
Het Indusvolk was heel ondernemend.
Ze handelden met mensen die behoorlijk ver weg leefden.
In dit geval reisden ze over zee,
helemaal naar Mesopotamië, het huidige Irak.
En het lijkt erop dat daar
de Indushandelaren, de kooplieden,
dit schrift gebruikten om een vreemde taal op te schrijven.
Net zoals ons voorbeeld met Engels en Nederlands.
Dat zou deze vreemde patronen verklaren
die erg afwijken van het soort patronen in de teksten
die zijn gevonden in de Indusvallei.
Het lijkt er dus op dat hetzelfde schrift, het Indusschrift,
kon worden gebruikt om verschillende talen op te schrijven.
De resultaten tot nu toe lijken op de conclusie te wijzen
dat het Indusscript waarschijnlijk inderdaad taal vertegenwoordigt.
Dus als het taal vertegenwoordigt,
hoe moeten we de symbolen dan lezen?
Dat is de volgende grote uitdaging.
Je ziet dat veel van de symbolen
lijken op plaatjes van mensen, van insecten,
van vissen, van vogels.
De meeste oude schriften
gebruiken het rebusprincipe.
Er worden plaatjes gebruikt om woorden te vertegenwoordigen.
Hier is bijvoorbeeld een woord.
Kan je dat met plaatjes schrijven?
Ik geef je een paar seconden.
Heb je het?
Oke. Geweldig.
Dit is mijn oplossing.
Een plaatje van een bij gevolgd door een plaatje van een blad
vormen in het Engels 'belief'.
Er zijn andere oplossingen mogelijk.
In het geval van het Indusschrift
is het probleem omgekeerd.
Je moet de geluiden van elk van deze plaatjes ontdekken
zodat de hele reeks betekenis krijgt.
Het lijkt op een kruiswoordpuzzel,
alleen is het de moeder van alle kruiswoordpuzzels,
omdat er zoveel van afhangt als je hem oplost.
Mijn collega's Iravatham Mahadevan en Asko Parpola
zijn al een eindje op weg met dit probleem.
Ik geef een kort voorbeeld van Parpola's werk.
Dit is een heel korte tekst.
Hij bevat zeven vertikale strepen gevolgd door een visachtig teken.
Ik moet zeggen dat deze zegels werden gebruikt
voor het stempelen van kleitabletjes
die werden bevestigd aan bundels goederen.
Het is dus goed mogelijk dat in elk geval sommige ervan
namen van kooplieden bevatten.
En het blijkt dat er in India
een lange traditie is
om namen te baseren op horoscopen
en constellaties op het moment van de geboorte.
In Dravidische talen
is het woord voor vis 'meen'
en dat klinkt precies als het woord voor ster.
Zeven sterren
staat dus voor 'elu meen'
en dat is het Dravidische woord
voor het sterrenbeeld de Grote Beer.
Zo is er een andere reeks van zes sterren,
wat vertaald 'aru meen' is,
en dat is de oude Dravidische naam
voor het sterrenbeeld de Plejaden.
Ten slotte zijn er andere combinaties
zoals dit visteken met iets dat lijkt op een dakje er bovenop.
Dat kan worden vertaald als 'mey meen'
en dat is de oude Dravidische naam voor de planeet Saturnus.
Dat was behoorlijk spannend.
Het lijkt erop dat we goed op weg zijn.
Maar bewijst dit
dat deze zegels Dravidische namen bevatten
die zijn gebaseerd op planeten en sterrenbeelden?
Nog niet.
We kunnen niet controleren
of deze lezingen kloppen.
Maar als steeds meer lezingen betekenis lijken te hebben,
en als steeds langere reeksen
lijken te kloppen,
weten we dat we op het goede spoor zitten.
Tegenwoordig
kunnen we een woord zoals TED schrijven
in Egyptische hiërogliefen en in spijkerschrift,
want die zijn allebei ontcijferd
in de negentiende eeuw.
Door de ontcijfering van deze twee schriften
kunnen deze beschavingen weer rechtstreeks tot ons spreken.
De Maya's
begonnen in de twintigste eeuw tegen ons te spreken,
maar de Indusbeschaving is nog stil.
Waarom moet ons dat iets kunnen schelen?
De Indusbeschaving is niet alleen
van de Zuid-Indiase of de Noord-Indiase bevolking
of van de Pakistani.
Ze is van ons allemaal.
Dit zijn onze voorouders,
van jou en van mij.
Hen is het zwijgen opgelegd
door een ongelukkige historische gebeurtenis.
Als we het schrift ontcijferen,
kunnen we ze weer tot ons laten spreken.
Wat zouden ze ons vertellen?
Wat zouden we over ze ontdekken? En over ons?
Ik ben heel benieuwd.
Bedankt.
(Applaus)