Ik wil beginnen met een gedachtenexperiment. Stel je voor dat het over 4000 jaar is, in de toekomst. Onze beschaving van nu bestaat niet meer. Geen boeken, geen elektronische apparaten, geen Facebook of Twitter. Alle kennis van de Engelse taal en het Engelse alfabet is verloren gegaan. Dan zijn er archeologen die in de ruïnes van een van onze steden graven. Wat zouden ze vinden? Misschien wat rechthoekige stukjes plastic met vreemde symbolen erop. Misschien wat cirkelvormige stukjes metaal. Misschien wat cylindervormige houders met wat symbolen erop. En misschien wordt een van de archeologen wel wereldberoemd door haar ontdekking, ergens in de heuvels van Noord-Amerika, van enorme versies van diezelfde symbolen. Laten we ons eens afvragen wat dat soort voorwerpen over ons vertellen aan mensen die over 4000 jaar leven. Dat is geen hypothetische vraag. Het is zelfs precies de soort vraag die we hebben als we proberen de beschaving van de Indusvallei te begrijpen die 4000 jaar geleden bestond. De Indusbeschaving viel ongeveer samen met de beter bekende Egyptische en Mesopotamische beschavingen, maar was veel groter dan elk van die twee beschavingen. Het ging om een gebied van ongeveer een miljoen vierkante kilometer op de plaats van het huidige Pakistan, Noordwest-India, en delen van Afghanistan en Iran. Omdat het zo'n grote beschaving was, zou je misschien sterke leiders verwachten, koningen, en enorme monumenten ter ere van die sterke koningen. In werkelijkheid hebben archeologen niets van dat alles gevonden. Ze hebben kleine voorwerpen gevonden, zoals deze. Dit is een voorbeeld van zo'n voorwerp. Het is natuurlijk een replica. Maar wie is dit? Een koning? Een god? Een priester? Of misschien gewoon iemand zoals jij of ik? We weten het niet. Maar het Indusvolk heeft ook voorwerpen achtergelaten waarop is geschreven. Geen stukjes plastic, maar stenen zegels, koperen tabletten, aardewerk en, heel verrassend, één groot bord dat in de grond bij de poort van een stad is gevonden. We weten niet of er Hollywood op staat of misschien zelfs Bollywood. We weten niet eens wat er op al deze voorwerpen staat. Dat komt doordat het Indusschrift niet is ontcijferd. We weten niet wat deze symbolen betekenen. De symbolen komen vooral voor op zegels. Hier zie je zo'n voorwerp. Het vierkante ding met het eenhoornachtige dier erop. Dat is een mooi stukje kunst. Hoe groot denk je dat het is? Zo groot misschien? Of misschien zo groot? Ik ga het laten zien. Dit is een replica van een van de zegels. Het is ongeveer 2,5 centimeter in het vierkant, behoorlijk klein. Waar werden ze voor gebruikt? We weten dat ze werken gebruikt voor het stempelen van kleitabletjes die aan bundels goederen werden bevestigd die naar een andere plaats werden gestuurd. Ken je de verzendbrieven die bij pakketjes van de koerier zitten? Deze dingen werden gebruikt voor dat soort verzendbrieven. Je vraagt je misschien af wat er op die voorwerpen staat wat betreft de tekst. Misschien is het de naam van de afzender of informatie over de goederen die naar een andere plaats worden verzonden. We weten het niet. We moeten het schrift ontcijferen om die vraag te beantwoorden. Het ontcijferen van het schrift is niet zomaar een intellectuele puzzel. Het is een vraag geworden die nauw verbonden is geraakt met de politiek en de culturele geschiedenis van Zuid-Azië. Het schrift is een soort strijdtoneel geworden tussen drie verschillende groepen mensen. Allereerst is er een groep mensen die gepassioneerd geloven dat het Indusschrift helemaal geen taal vertegenwoordigt. Deze mensen geloven dat de symbolen lijken op het soort symbolen dat je op verkeersborden ziet of de emblemen op wapens. Dan is er een tweede groep mensen die geloven dat het Indusschrift een Indo-Europese taal vertegenwoordigt. Als je kijkt naar een kaart van het huidige India zie je dat de meeste talen die in Noord-India worden gesproken bij de Indo-Europese taalfamilie horen. Dus sommige mensen geloven dat het Indusscript een oude Indo-Europese taal zoals Sanskriet vertegenwoordigt. Ten slotte is er een groep mensen die geloven dat het Indusvolk de voorouders waren van mensen die tegenwoordig in Zuid-India wonen. Die mensen geloven dat het Indusscript een oude vorm vertegenwoordigt van de Dravidische taalfamilie de taalfamilie die nu in een groot deel van Zuid-India wordt gesproken. De voorstanders van deze theorie wijzen naar dat kleine gebied in het Noorden waar Dravidisch wordt gesproken in de buurt van Afghanistan en ze zeggen dat misschien ooit vroeger overal in India Dravidische talen werden gesproken en dat het dus mogelijk is dat de Indusbeschaving misschien ook Dravidisch is. Welk van deze hypotheses kan kloppen? We weten het niet, maar als je het schrift ontcijfert, kun je die vraag misschien beantwoorden. Maar het ontcijferen van het schrift is een enorme uitdaging. Ten eerste is er geen Steen van Rosetta. Ik heb het niet over de software maar over een oud voorwerp waarop dezelfde tekst staat in een bekende taal en een onbekende taal. Zo'n voorwerp hebben we niet voor het Indusschrift. Bovendien weten we niet eens welke taal ze spraken. En om het nog erger te maken, zijn de meeste teksten die we hebben heel kort. Ik liet al zien dat ze meestal op deze zegels staan, die heel erg klein zijn. Met deze flinke hindernissen kun je je afvragen of het ons ooit zal lukken om het Indusschrift te ontcijferen. In de rest van mijn voordracht wil ik jullie vertellen waarom ik me daar nu geen zorgen meer over maak en ik van de uitdaging van het Indusscript ben gaan houden. Ik ben al gefascineerd door het Indusscript sinds ik er op school in een lesboek over las. Waarom vond ik het zo fascinerend? Het is het laatste belangrijke niet-ontcijferde schrift uit de oudheid. Ik ben uiteindelijk computer-neurowetenschapper geworden, dus in mijn gewone baan maak ik computermodellen van de hersenen om te leren begrijpen hoe de hersenen voorspellingen doen, hoe de hersenen beslissingen nemen, hoe de hersenen leren, enzovoort. Maar in 2007 kruiste het Indusschrift mijn pad weer. Ik was toen in India en kreeg de prachtige kans om een aantal Indiase wetenschappers te ontmoeten die het schrift probeerden te analyseren met computermodellen. Toen realiseerde ik me dat ik de mogelijkheid had om met die wetenschappers samen te werken. Ik greep die kans meteen aan. Ik wil wat van onze resultaten beschrijven. Of nog beter: laten we samen gaan ontcijferen. Zijn jullie er klaar voor? Het eerste wat je moet doen met een niet-ontcijferd schrift is uitzoeken wat de schrijfrichting is. Dit zijn twee teksten met wat symbolen erin. Kan je me vertellen of de schrijfrichting van rechts naar links of van links naar rechts is? Je krijgt een paar seconden. Oke. Hoeveel denken van rechts naar links? Oke. Van links naar rechts? Het is bijna 50/50. Het antwoord is: Als je naar de linkerkant van de twee teksten kijkt, zie je dat de tekens dichter bij elkaar staan. Het lijkt erop dat 4000 jaar geleden, toen de schrijver van rechts naar links schreef, er niet genoeg ruimte was. Het teken werd erbij gepropt. Een van de tekens staat ook onder de tekst aan de bovenkant. Het lijkt er dus op dat de schrijfrichting waarschijnlijk van rechts naar links was. Dat is een van de eerste dingen die we weten, dat richting een belangrijk aspect is van linguïstisch schrift. Het Indusschrift heeft dus deze bepaalde eigenschap. Welke eigenschappen van taal zouden we kunnen zien? Talen bevatten patronen. Als ik je de letter Q geef en je vraag te voorspellen wat de volgende letter is, wat denk je dan? De meesten zeiden U, en dat klopt. Als ik je ook de volgende letter zou vragen, welke zou dat dan zijn, denk je? Er zijn verschillende mogelijkheden. E, of I. Misschien A. Maar zeker niet B, C of D, of wel? Het Indusschrift heeft net zulke patronen. Er zijn veel teksten die beginnen met dit ruitvormige symbool. En dat wordt op zijn beurt vaak gevolgd door dit symbool dat lijkt op aanhalingstekens. Net zoals het voorbeeld van de Q en de U. Dit symbool kan weer worden gevolgd door deze visachtige symbolen en wat andere tekens, maar nooit door die tekens onderaan. Daarnaast zijn er wat tekens die bij voorkeur aan het eind van teksten staan, zoals dit komvormige teken. Dit teken is trouwens het meest voorkomende teken in het schrift. Door deze patronen kregen we een idee. Het idee was om een computer te gebruiken om die patronen te leren. We gaven de computer de bestaande teksten. En de computer leerde een statistisch model van welke symbolen meestal samen voorkomen en welke symbolen meestal op elkaar volgen. Als we het computermodel hebben, kunnen we het model testen door het te ondervragen. We kunnen met opzet wat symbolen wissen en het model vragen de ontbrekende symbolen te voorspellen. Hier zijn wat voorbeelden. Je kan dit zien als misschien wel de oudste versie van het Rad van Fortuin. We ontdekten dat het de computer in 75 procent van de gevallen lukte om het juiste symbool te voorspellen. In de rest van de gevallen was meestal de tweede of derde suggestie het goede antwoord. Er is ook een praktisch nut voor deze procedure. Veel teksten zijn beschadigd. Dit is een voorbeeld van zo'n tekst. Met het computermodel kunnen we proberen deze tekst aan te vullen met een zo goed mogelijke voorspelling. Dit is een voorbeeld van een symbool dat is voorspeld. Dit kan erg nuttig zijn als we het schrift proberen te ontcijferen. We kunnen meer gegevens genereren om te analyseren. We kunnen nog iets anders doen met het computermodel. Stel je een aap voor die achter een toetsenbord zit. Dan krijg je een willekeurige mix van letters die er zo uitziet. Van zo'n willekeurige mix van letters wordt gezegd dat deze een zeer hoge entropie heeft. Dat is een term uit de natuurkunde en informatietheorie. Maar het is gewoon een zeer willekeurige mix van letters. Wie heeft er wel eens koffie op een toetsenbord geknoeid? Dan hebt u misschien wel eens last gehad van een vastzittend toetsenbord. Hetzelfde symbool wordt dan steeds weer herhaald. Zo'n soort reeks heeft een heel lage entropie omdat er helemaal geen variatie is. Taal heeft daarentegen een gemiddeld entropieniveau, niet heel rigide maar ook niet te willekeurig. Hoe zit het met het Indusschrift? Dit is een grafiek met de entropieën van een heleboel reeksen. Helemaal bovenaan staat de volledig willekeurige reeks die een willekeurige mix van letters is. Wat interessant is, is dat daar ook de DNA-volgorde van het menselijke genoom en instrumentale muziek staan. Die zijn allebei heel erg flexibel en dus hebben ze een zeer grote variatie. Helemaal onder aan de schaal zie je een rigide reeks, een reeks met alleen A's. Daar staat ook een computerprogramma, in dit geval in de taal Fortran, waarvoor zeer strikte regels gelden. Linguïstisch schrift zit in het middelste bereik. Maar hoe zit het met het Indusschrift? We ontdekten dat het Indusschrift binnen het bereik van linguïstisch schrift valt. Toen dit resultaat voor het eerst werd gepubliceerd, was het zeer controversieel. Sommige mensen schreeuwden het haast uit. Dat waren de mensen die geloofden dat het Indusschrift geen taal vertegenwoordigt. Ik kreeg zelfs haatmails. Mijn studenten vonden dat ik erover moest denken om me te laten beveiligen. Wie had ooit gedacht dat ontcijferen zo'n gevaarlijk beroep zou zijn? Wat betekent dit resultaat nu eigenlijk? Het betekent dat het Indusschrift een belangrijke eigenschap van taal deelt. Zoals in het bekende gezegde 'als het eruit ziet als een linguïstisch schrift, en het zich gedraagt als een linguïstisch schrift, dan hebben we misschien een linguïstisch schrift te pakken.' Wat is er nog meer voor bewijs dat het schrift een taal zou kunnen coderen? Linguïstisch schrift kan meerdere talen coderen. Hier staat bijvoorbeeld een zin die in het Engels is geschreven en dezelfde zin die in het Nederlands is geschreven met dezelfde letters van het alfabet. Als je geen Nederlands spreekt en alleen maar Engels, en ik je wat Nederlandse woorden laat zien, zul je zeggen dat er in die woorden ongebruikelijke patronen zitten. Sommige dingen kloppen niet en je zult zeggen dat het waarschijnlijk geen Engelse woorden zijn. Hetzelfde gebeurt bij het Indusschrift. De computer heeft verschillende teksten gevonden -- dit zijn twee voorbeelden -- met zeer ongebruikelijke patronen. Neem bijvoorbeeld de eerste tekst. Daarin wordt het komvormige teken verdubbeld. Dat teken is het meest voorkomende teken in het Indusschrift, en alleen in deze tekst komt het voor als een dubbel paar. Waarom is dat zo? We gingen kijken waar deze teksten zijn gevonden en het blijkt dat ze zijn gevonden ergens heel ver weg van de Indusvallei. Ze zijn gevonden in het huidige Irak en Iran. Waarom zijn ze daar gevonden? Er is iets wat ik nog niet heb verteld. Het Indusvolk was heel ondernemend. Ze handelden met mensen die behoorlijk ver weg leefden. In dit geval reisden ze over zee, helemaal naar Mesopotamië, het huidige Irak. En het lijkt erop dat daar de Indushandelaren, de kooplieden, dit schrift gebruikten om een vreemde taal op te schrijven. Net zoals ons voorbeeld met Engels en Nederlands. Dat zou deze vreemde patronen verklaren die erg afwijken van het soort patronen in de teksten die zijn gevonden in de Indusvallei. Het lijkt er dus op dat hetzelfde schrift, het Indusschrift, kon worden gebruikt om verschillende talen op te schrijven. De resultaten tot nu toe lijken op de conclusie te wijzen dat het Indusscript waarschijnlijk inderdaad taal vertegenwoordigt. Dus als het taal vertegenwoordigt, hoe moeten we de symbolen dan lezen? Dat is de volgende grote uitdaging. Je ziet dat veel van de symbolen lijken op plaatjes van mensen, van insecten, van vissen, van vogels. De meeste oude schriften gebruiken het rebusprincipe. Er worden plaatjes gebruikt om woorden te vertegenwoordigen. Hier is bijvoorbeeld een woord. Kan je dat met plaatjes schrijven? Ik geef je een paar seconden. Heb je het? Oke. Geweldig. Dit is mijn oplossing. Een plaatje van een bij gevolgd door een plaatje van een blad vormen in het Engels 'belief'. Er zijn andere oplossingen mogelijk. In het geval van het Indusschrift is het probleem omgekeerd. Je moet de geluiden van elk van deze plaatjes ontdekken zodat de hele reeks betekenis krijgt. Het lijkt op een kruiswoordpuzzel, alleen is het de moeder van alle kruiswoordpuzzels, omdat er zoveel van afhangt als je hem oplost. Mijn collega's Iravatham Mahadevan en Asko Parpola zijn al een eindje op weg met dit probleem. Ik geef een kort voorbeeld van Parpola's werk. Dit is een heel korte tekst. Hij bevat zeven vertikale strepen gevolgd door een visachtig teken. Ik moet zeggen dat deze zegels werden gebruikt voor het stempelen van kleitabletjes die werden bevestigd aan bundels goederen. Het is dus goed mogelijk dat in elk geval sommige ervan namen van kooplieden bevatten. En het blijkt dat er in India een lange traditie is om namen te baseren op horoscopen en constellaties op het moment van de geboorte. In Dravidische talen is het woord voor vis 'meen' en dat klinkt precies als het woord voor ster. Zeven sterren staat dus voor 'elu meen' en dat is het Dravidische woord voor het sterrenbeeld de Grote Beer. Zo is er een andere reeks van zes sterren, wat vertaald 'aru meen' is, en dat is de oude Dravidische naam voor het sterrenbeeld de Plejaden. Ten slotte zijn er andere combinaties zoals dit visteken met iets dat lijkt op een dakje er bovenop. Dat kan worden vertaald als 'mey meen' en dat is de oude Dravidische naam voor de planeet Saturnus. Dat was behoorlijk spannend. Het lijkt erop dat we goed op weg zijn. Maar bewijst dit dat deze zegels Dravidische namen bevatten die zijn gebaseerd op planeten en sterrenbeelden? Nog niet. We kunnen niet controleren of deze lezingen kloppen. Maar als steeds meer lezingen betekenis lijken te hebben, en als steeds langere reeksen lijken te kloppen, weten we dat we op het goede spoor zitten. Tegenwoordig kunnen we een woord zoals TED schrijven in Egyptische hiërogliefen en in spijkerschrift, want die zijn allebei ontcijferd in de negentiende eeuw. Door de ontcijfering van deze twee schriften kunnen deze beschavingen weer rechtstreeks tot ons spreken. De Maya's begonnen in de twintigste eeuw tegen ons te spreken, maar de Indusbeschaving is nog stil. Waarom moet ons dat iets kunnen schelen? De Indusbeschaving is niet alleen van de Zuid-Indiase of de Noord-Indiase bevolking of van de Pakistani. Ze is van ons allemaal. Dit zijn onze voorouders, van jou en van mij. Hen is het zwijgen opgelegd door een ongelukkige historische gebeurtenis. Als we het schrift ontcijferen, kunnen we ze weer tot ons laten spreken. Wat zouden ze ons vertellen? Wat zouden we over ze ontdekken? En over ons? Ik ben heel benieuwd. Bedankt. (Applaus)