0:00:00.000,0:00:02.000 Erez Lieberman Aiden: Alle ved 0:00:02.000,0:00:05.000 at et billede siger mere end tusind ord 0:00:07.000,0:00:09.000 Men på Harvard 0:00:09.000,0:00:12.000 spurgte vi os selv, om det egentlig er sandt. 0:00:12.000,0:00:14.000 (Latter) 0:00:14.000,0:00:18.000 Så vi samlede et hold eksperter, 0:00:18.000,0:00:20.000 både fra Harvard, MIT, 0:00:20.000,0:00:23.000 The American Heritage Dictionary, The Encyclopedia Britannica 0:00:23.000,0:00:25.000 og sågar vores stolte sponsor... 0:00:25.000,0:00:28.000 The Google. 0:00:28.000,0:00:30.000 Og vi har funderet over dette 0:00:30.000,0:00:32.000 i cirka fire år. 0:00:32.000,0:00:37.000 Og vores konklusion er overraskende. 0:00:37.000,0:00:40.000 Mine damer og herrer, et billede siger ikke mere end tusind ord. 0:00:40.000,0:00:42.000 Det viste sig faktisk at nogle billeder 0:00:42.000,0:00:47.000 siger mere end 500 milliarder ord. 0:00:47.000,0:00:49.000 Jean-Baptiste Michel: Hvordan når vi denne konklusion? 0:00:49.000,0:00:51.000 Erez og jeg tænkte på, hvordan man 0:00:51.000,0:00:53.000 kunne få overblik over menneskets kultur og historie - 0:00:53.000,0:00:56.000 - og ændringen over tid. 0:00:56.000,0:00:58.000 Der skrevet så mange bøger gennem tiderne. 0:00:58.000,0:01:00.000 Så vi tænkte at man kan lære mest af alle disse bøger 0:01:00.000,0:01:02.000 ved at læse dem alle sammen. 0:01:02.000,0:01:05.000 Hvis der er en skala for, hvor fantastisk det er 0:01:05.000,0:01:08.000 må det selvfølgelig ligge meget, meget højt (Awesome). 0:01:08.000,0:01:10.000 Problemet er, at der også er en X-akse, 0:01:10.000,0:01:12.000 og det aksen for, om det også er praktisk. 0:01:12.000,0:01:14.000 Den er meget, meget lav. 0:01:14.000,0:01:17.000 (Bifald) 0:01:17.000,0:01:20.000 Folk bruger som regel en anden tilgang, 0:01:20.000,0:01:22.000 Man tager nogle få kilder og læser dem meget omhyggeligt. 0:01:22.000,0:01:24.000 Dette er meget praktisk, men ikke særlig fantastisk. 0:01:24.000,0:01:27.000 Det bedste må være 0:01:27.000,0:01:30.000 at nå til dette fantastiske men alligevel praktiske område. 0:01:30.000,0:01:33.000 Et firma på den anden side af floden - Google - 0:01:33.000,0:01:35.000 startede et digitaliseringsprojekt for nogle år siden 0:01:35.000,0:01:37.000 og det kan måske gøre denne tilgang mulig. 0:01:37.000,0:01:39.000 De har digitaliseret millioner af bøger. 0:01:39.000,0:01:42.000 Man kan således bruge computerbaserede metoder 0:01:42.000,0:01:44.000 til at læse alle bøgerne med et enkelt klik. 0:01:44.000,0:01:47.000 Det er meget praktisk og ekstremt fantastisk. 0:01:48.000,0:01:50.000 ELA: Nu skal I høre, hvor bøger stammer fra. 0:01:50.000,0:01:53.000 Der har altid eksisteret forfattere. 0:01:53.000,0:01:56.000 Disse forfattere har bestræbt sig på at skrive bøger. 0:01:56.000,0:01:58.000 Og det blev væsentligt nemmere 0:01:58.000,0:02:00.000 da trykpressen blev opfundet for nogle hundrede år siden. 0:02:00.000,0:02:03.000 Siden da, er det lykkedes forfattere 0:02:03.000,0:02:05.000 at udgive bøger 0:02:05.000,0:02:07.000 129 millioner gange. 0:02:07.000,0:02:09.000 Hvis disse bøger ikke er gået tabt for historien, 0:02:09.000,0:02:11.000 findes de på et bibliotek et sted, 0:02:11.000,0:02:14.000 og mange bøgerne er blevet taget fra hylderne 0:02:14.000,0:02:16.000 og er blevet digitaliseret af Google, 0:02:16.000,0:02:18.000 som til dato har scannet 15 millioner bøger. 0:02:18.000,0:02:21.000 Når Google digitaliserer en bog, får den et rigtig fint format. 0:02:21.000,0:02:23.000 Nu har vi både data og metada. 0:02:23.000,0:02:26.000 Vi har f.eks. oplysninger om, hvor den blev udgivet, 0:02:26.000,0:02:28.000 hvem forfatteren var, og hvornår den blev udgivet. 0:02:28.000,0:02:31.000 Og vi går gennem alle disse arkiver 0:02:31.000,0:02:35.000 og udelukker alle data, der ikke er af højeste kvalitet. 0:02:35.000,0:02:37.000 Det, der er tilbage, er en samling 0:02:37.000,0:02:40.000 på fem millioner bøger, 0:02:40.000,0:02:43.000 500 milliarder ord, 0:02:43.000,0:02:45.000 en tegnstreng, der er tusind gange længere 0:02:45.000,0:02:48.000 end menneskets arvemasse. 0:02:48.000,0:02:50.000 Hvis teksten blev skrevet ud, 0:02:50.000,0:02:52.000 ville den nå herfra til månen og tilbage igen 0:02:52.000,0:02:54.000 10 gange! 0:02:54.000,0:02:58.000 - Et sandt brudstykke af vores kulturelle arvemasse. 0:02:58.000,0:03:00.000 Det vi gjorde, 0:03:00.000,0:03:03.000 da vi stod over for så vanvittige sammenligninger... 0:03:03.000,0:03:05.000 (Latter) 0:03:05.000,0:03:08.000 var, hvad enhver forskere med respekt for sig selv 0:03:08.000,0:03:11.000 ville have gjort. 0:03:11.000,0:03:13.000 Vi gjorde som i tegneserien XKCD, 0:03:13.000,0:03:15.000 og sagde "Gør plads! 0:03:15.000,0:03:17.000 Vi prøver med videnskab". 0:03:17.000,0:03:19.000 (Latter) 0:03:19.000,0:03:21.000 JM: Først tænkte vi selvfølgelig, 0:03:21.000,0:03:23.000 "Vi gør bare data tilgængelige, 0:03:23.000,0:03:25.000 så andre kan bruge videnskab på dem." 0:03:25.000,0:03:27.000 Nu tænker vi "Hvilke data kan vi lægge ud?" 0:03:27.000,0:03:29.000 Egentlig vil vi gerne tage bøgerne 0:03:29.000,0:03:31.000 og lægge teksten fra alle fem millioner bøger ud. 0:03:31.000,0:03:33.000 Men Google - og særligt Jon Orwant - 0:03:33.000,0:03:35.000 fortalte om en ligning, vi skulle lære. 0:03:35.000,0:03:38.000 Vi har altså fem millioner forfattere 0:03:38.000,0:03:41.000 altså fem millioner, der gerne vil sagsøge os. 0:03:41.000,0:03:43.000 Så selvom det ville være virkelig, virkelig fantastisk, 0:03:43.000,0:03:46.000 ville det også være helt ekstremt upraktisk. 0:03:46.000,0:03:48.000 (Latter) 0:03:48.000,0:03:50.000 Igen lod vi os overtale 0:03:50.000,0:03:53.000 og fulgte den praktiske tilgang, der var lidt mindre fantastisk. 0:03:53.000,0:03:55.000 I stedet for at lægge den fulde tekst ud ville vi 0:03:55.000,0:03:57.000 gøre statistikker om bøgerne tilgængelige. 0:03:57.000,0:03:59.000 Et eksempel er "A gleam of happiness" - Et glimpt af lykke 0:03:59.000,0:04:01.000 Det er fire ord - det vi kalder et fire-gram 0:04:01.000,0:04:03.000 Vi vil nu fortælle jer, hvor mange gange et bestemt fire-gram 0:04:03.000,0:04:05.000 optrådte i bøger i 1801, 1802, 1803, 0:04:05.000,0:04:07.000 og helt op til 2008 0:04:07.000,0:04:09.000 Det giver os en tidsserie, der viser hvor hyppigt 0:04:09.000,0:04:11.000 denne ene sætning er blevet brugt over tid. 0:04:11.000,0:04:14.000 Det gør vi for alle ord og udtryk i disse bøger. 0:04:14.000,0:04:17.000 Det giver os en stor tabel med to milliarder linjer 0:04:17.000,0:04:19.000 som viser hvordan kulturen har ændret sig. 0:04:19.000,0:04:21.000 ELA: Disse to milliarder linjer 0:04:21.000,0:04:23.000 som vi kalder to milliarder n-grammer... 0:04:23.000,0:04:25.000 Hvad fortæller de os? 0:04:25.000,0:04:27.000 De enkelte n-grammer måler kulturelle tendenser. 0:04:27.000,0:04:29.000 Lad mig give et eksempel. 0:04:29.000,0:04:31.000 Jeg vil sige, at jeg trives, 0:04:31.000,0:04:33.000 i morgen siger jeg så, hvor godt jeg havde det. 0:04:33.000,0:04:36.000 Jeg ville sige "I går trivedes (throve) jeg". 0:04:36.000,0:04:39.000 Man kan også bruge "thrived" i stedet for "throve". 0:04:39.000,0:04:42.000 Hvilket af de to ord skal jeg bruge? 0:04:42.000,0:04:44.000 Hvor skulle jeg vide det fra? 0:04:44.000,0:04:46.000 Indtil for seks måneder siden 0:04:46.000,0:04:48.000 var den anerkendte metode på dette område 0:04:48.000,0:04:50.000 at du f.eks. kunne få fat i 0:04:50.000,0:04:52.000 denne psykolog med lækkert hår 0:04:52.000,0:04:54.000 og spørge ham: 0:04:54.000,0:04:57.000 "Steve, du er ekspert i uregelmæssige verber. 0:04:57.000,0:04:59.000 Hvad skal jeg gøre?" 0:04:59.000,0:05:01.000 Og han ville sige: "De fleste mennesker bruger "thrived" 0:05:01.000,0:05:04.000 men nogle siger "throve". 0:05:04.000,0:05:06.000 Og du vidste også - mere eller mindre - 0:05:06.000,0:05:09.000 at hvis du gik 200 år tilbage i tiden 0:05:09.000,0:05:12.000 og spurgte denne statsmand med ligeså lækkert hår: 0:05:12.000,0:05:15.000 (Latter) 0:05:15.000,0:05:17.000 "Tom, hvad ville du sige?" 0:05:17.000,0:05:19.000 Han ville sige: "På min tid brugte de fleste "throve, 0:05:19.000,0:05:22.000 mens andre brugte "thrived". 0:05:22.000,0:05:24.000 Så nu vil jeg bare vise jer rå data. 0:05:24.000,0:05:28.000 To rækker i denne tabel ud af to millarder poster. 0:05:28.000,0:05:30.000 Den viser hyppigheden pr. år 0:05:30.000,0:05:33.000 af "thrived" og "throve" over tid. 0:05:34.000,0:05:36.000 Det her er kun to 0:05:36.000,0:05:39.000 ud af to milliarder rækker. 0:05:39.000,0:05:41.000 Så hele datasættet 0:05:41.000,0:05:44.000 er en milliard gange mere fantastisk end dette slide. 0:05:44.000,0:05:46.000 (Latter) 0:05:46.000,0:05:50.000 (Bifald) 0:05:50.000,0:05:52.000 JM: Der er jo mange andre billeder, der siger mere end 500 milliarder ord. 0:05:52.000,0:05:54.000 For eksempel dette. 0:05:54.000,0:05:56.000 Hvis vi bare ser på influenza, 0:05:56.000,0:05:58.000 vil I se høje udslag på de tidspunkter, hvor I vidste 0:05:58.000,0:06:01.000 at der var store globale influenzaepidemier. 0:06:01.000,0:06:04.000 ELA: Hvis du ikke er overbevist, 0:06:04.000,0:06:06.000 stiger vandstanden i havene - 0:06:06.000,0:06:09.000 det gør CO2-indholdet i atmosfæren og den globale temperatur også. 0:06:09.000,0:06:12.000 JM: Prøv også at kaste et blik på dette n-gram, 0:06:12.000,0:06:15.000 og det fortæller Nietzsche, at Gud ikke er død, 0:06:15.000,0:06:18.000 selvom du måske også synes, han har brug for en bedre ///presseagent. 0:06:18.000,0:06:20.000 (Latter) 0:06:20.000,0:06:23.000 ELA: Man kan få nogle ret abstrakte begreber med disse ting. 0:06:23.000,0:06:25.000 Lad mig f.eks. fortælle jer historien 0:06:25.000,0:06:27.000 om året 1950. 0:06:27.000,0:06:29.000 I den største del af vores historie 0:06:29.000,0:06:31.000 har ingen interesseret sig en pind for 1950. 0:06:31.000,0:06:33.000 I 1700 og 1800 og 1900 0:06:33.000,0:06:36.000 var ingen interesseret. 0:06:37.000,0:06:39.000 Op gennem 30'erne og 40'erne 0:06:39.000,0:06:41.000 var ingen interesseret. 0:06:41.000,0:06:43.000 Pludselig, midt i 40'erne, 0:06:43.000,0:06:45.000 blev der hvisket i krogene. 0:06:45.000,0:06:47.000 Folk indså at 1950 var noget, der ville ske, 0:06:47.000,0:06:49.000 og det kunne være noget stort. 0:06:49.000,0:06:52.000 (Latter) 0:06:52.000,0:06:55.000 Men det der gjorde folk allermest interesseret i 1950 0:06:55.000,0:06:58.000 var året 1950. 0:06:58.000,0:07:01.000 (Latter) 0:07:01.000,0:07:03.000 Folk var som besat. 0:07:03.000,0:07:05.000 De kunne ikke lade være med at tale 0:07:05.000,0:07:08.000 om alt det, de lavede i 1950, 0:07:08.000,0:07:11.000 alt det de planlagde at skulle gøre i 1950, 0:07:11.000,0:07:16.000 og alle drømmene om, hvad de ville opnå i 1950. 0:07:16.000,0:07:18.000 Faktisk var 1950 så fascinerende 0:07:18.000,0:07:20.000 at folk i flere år efter 0:07:20.000,0:07:23.000 bare blev ved med at tale om alle de utrolige ting, der skete - 0:07:23.000,0:07:25.000 i 1951, 1952 og 1953. 0:07:25.000,0:07:27.000 Omsider i 1954 0:07:27.000,0:07:29.000 var der en der vågnede op og indså 0:07:29.000,0:07:33.000 at 1950 var blevet noget passé. 0:07:33.000,0:07:35.000 (Latter) 0:07:35.000,0:07:37.000 Og uden videre sprang boblen. 0:07:37.000,0:07:39.000 (Latter) 0:07:39.000,0:07:41.000 Og historien om 1950 0:07:41.000,0:07:43.000 er historien om alle de år, vi har registreret, 0:07:43.000,0:07:46.000 med et lille tvist, fordi vi nu har disse fine grafer. 0:07:46.000,0:07:49.000 Og fordi vi har disse fine grafer, kan vi nu måle ting. 0:07:49.000,0:07:51.000 Vi kan sige "Hvor hurtigt springer boblen?" 0:07:51.000,0:07:54.000 Og de viser sig, at vi kan måle dette meget præcist. 0:07:54.000,0:07:57.000 Der blev udledt ligninger, og der opstillet grafer, 0:07:57.000,0:07:59.000 og nettoresultatet er 0:07:59.000,0:08:02.000 at det viser sig, at boblen springer hurtigere og hurtigere 0:08:02.000,0:08:04.000 for hvert år der går. 0:08:04.000,0:08:09.000 Vi mister interessen for fortiden hurtigere. 0:08:09.000,0:08:11.000 JM: Og nu et godt karrieretip: 0:08:11.000,0:08:13.000 For de af jer, der vil være berømte, 0:08:13.000,0:08:15.000 kan vi lære af de 25 mest berømte politiske personligheder, 0:08:15.000,0:08:17.000 forfattere, skuespillere osv. 0:08:17.000,0:08:20.000 Så hvis du vil være berømt tidligt, skal du være skuespiller, 0:08:20.000,0:08:22.000 fordi berømmelsen så begynder at stige, nrå du er sidst i 20'erne – 0:08:22.000,0:08:24.000 Du er stadig ung, og det er virkelig skønt. 0:08:24.000,0:08:26.000 Men hvis du kan vente lidt, skal du blive forfatter, 0:08:26.000,0:08:28.000 fordi så opnår meget stor berømmelse, 0:08:28.000,0:08:30.000 som f.eks. Mark Twain: Ekstremt berømt. 0:08:30.000,0:08:32.000 Men hvis du vil helt til toppen, 0:08:32.000,0:08:34.000 skal du udskyde den tilfredsstillelse, det er 0:08:34.000,0:08:36.000 at blive berømt - og selvfølgelig blive politiker. 0:08:36.000,0:08:38.000 Her vil du blive berømt, når du er i slutningen af 50'erne, 0:08:38.000,0:08:40.000 og blive meget, meget berømt derefter. 0:08:40.000,0:08:43.000 Videnskabsfolk plejer også at blive berømte, når de er meget ældre. 0:08:43.000,0:08:45.000 For eksempel biologer og fysikere 0:08:45.000,0:08:47.000 bliver næsten ligeså berømte som skuespillere. 0:08:47.000,0:08:50.000 En fejl, du ikke skal begå, er at blive matematiker. 0:08:50.000,0:08:52.000 (Latter) 0:08:52.000,0:08:54.000 Hvis du gør det, 0:08:54.000,0:08:57.000 tænker du måske "Herligt! Jeg leverer mit bedste arbejde, når jeg er i 20'erne" 0:08:57.000,0:08:59.000 Men tænk engang... stort set ingen lægger mærke til det. 0:08:59.000,0:09:02.000 (Latter) 0:09:02.000,0:09:04.000 ELA: Der er mere nøgterne observationer 0:09:04.000,0:09:06.000 blandt n-grammerne. 0:09:06.000,0:09:08.000 Her er f.eks. Marc Chagalls livsforløb, 0:09:08.000,0:09:10.000 som kunster født i 1887. 0:09:10.000,0:09:13.000 Og dette ligner det normale forløb for en berømt person. 0:09:13.000,0:09:17.000 Han bliver mere og mere berømt, 0:09:17.000,0:09:19.000 bare ikke hvis vi ser på tysk. 0:09:19.000,0:09:21.000 På tysk ser vi noget ganske bizart, 0:09:21.000,0:09:23.000 noget man stort set aldrig ser, 0:09:23.000,0:09:25.000 og det er, at han bliver ekstremt berømt 0:09:25.000,0:09:27.000 hvorefter berømmelsen falder brat 0:09:27.000,0:09:30.000 og er på nulpunktet mellem 1933 og 1945, 0:09:30.000,0:09:33.000 hvorefter berømmelsen vender tilbage. 0:09:33.000,0:09:35.000 Og de vi selvfølgelig kan se 0:09:35.000,0:09:38.000 er at Marc Chagall var jødisk kunstner 0:09:38.000,0:09:40.000 i nazi-Tyskland 0:09:40.000,0:09:42.000 Disse signaler 0:09:42.000,0:09:44.000 er faktisk så stærk, 0:09:44.000,0:09:47.000 at vi ikke behøver at vide, at en person er blevet censureret. 0:09:47.000,0:09:49.000 Vi kan faktisk regne det ud 0:09:49.000,0:09:51.000 ved hjælp af meget grundlæggende behandling af signalerne. 0:09:51.000,0:09:53.000 Her er en simpel måde at gøre det på. 0:09:53.000,0:09:55.000 Det er rimeligt at forvente 0:09:55.000,0:09:57.000 at en persons berømmelse i en given periode 0:09:57.000,0:09:59.000 vil være nogenlunde gennemsnittet af berømmelsen før 0:09:59.000,0:10:01.000 og berømmelsen efter perioden. 0:10:01.000,0:10:03.000 Så det er nogenlunde, det vi forventer. 0:10:03.000,0:10:06.000 Og vi sammenligner med den berømmelse, vi kan aflæse. 0:10:06.000,0:10:08.000 Og så dividerer vi bare den ene med den anden 0:10:08.000,0:10:10.000 så vi får noget, vi kalder et undertrykkelsesindeks. 0:10:10.000,0:10:13.000 Hvis undertrykkelsesindekset er meget, meget, meget lavt, 0:10:13.000,0:10:15.000 er der stor sandsynlighed for at du er undertrykt. 0:10:15.000,0:10:18.000 Hvis det er meget højt, får du måske hjælp af propaganda. 0:10:19.000,0:10:21.000 JM: Nu kan man faktisk se på 0:10:21.000,0:10:24.000 fordelingen af undertrykkelsesindekser over hele populationer. 0:10:24.000,0:10:26.000 For eksempel her: 0:10:26.000,0:10:28.000 Dette undertrykkelsesindeks er for 5.000 personer 0:10:28.000,0:10:30.000 taget fra engelske bøger uden nogen kendt undertrykkelse. 0:10:30.000,0:10:32.000 Det ville være på denne måde, tæt centreret om ét. 0:10:32.000,0:10:34.000 Det man kan aflæse, er grundlæggende som forventet. 0:10:34.000,0:10:36.000 Dette er fordelingen, som den ses i Tyskland. 0:10:36.000,0:10:38.000 Meget anderledes... den er forskudt til venstre. 0:10:38.000,0:10:41.000 Folk talte dobbelt så lidt om det, som de burde. 0:10:41.000,0:10:43.000 Men vigtigere er, at fordelingen er meget bredere. 0:10:43.000,0:10:46.000 Der er mange personer, der ender ude til venstre i fordelingen, 0:10:46.000,0:10:49.000 som der bliver talt 10 gange så lidt om, som der burde. 0:10:49.000,0:10:51.000 Men der er også personer ude til højre, 0:10:51.000,0:10:53.000 som synes at være hjulpet af propaganda. 0:10:53.000,0:10:56.000 Dette er kendetegnende for censur i bogregisteret. 0:10:56.000,0:10:58.000 ELA: Denne metode 0:10:58.000,0:11:00.000 kalder vi "culturomics". 0:11:00.000,0:11:02.000 Det er lidt ligesom genforskning 0:11:02.000,0:11:04.000 Genomics - genforskning - er et nærbillede af biologi 0:11:04.000,0:11:07.000 hvor man ser på sekvenser af baser i arvemassen. 0:11:07.000,0:11:09.000 Culturomics minder om dette. 0:11:09.000,0:11:12.000 Det er en analyse af en kæmpe samling data 0:11:12.000,0:11:14.000 anvendt på studiet af menneskets kultur. 0:11:14.000,0:11:16.000 I stedet for at bruge arvemassen som perspektiv, 0:11:16.000,0:11:19.000 bruges digitaliserede stykker af historisk materiale. 0:11:19.000,0:11:21.000 Det gode ved culturomics er 0:11:21.000,0:11:23.000 at alle kan gøre det. 0:11:23.000,0:11:25.000 Hvorfor kan alle gøre det? 0:11:25.000,0:11:27.000 Alle kan gøre det, fordi disse tre herrer, 0:11:27.000,0:11:30.000 Jon Orwant, Matt Gray og Will Brockman hos Google, 0:11:30.000,0:11:32.000 så prototypen af Ngram Viewer, 0:11:32.000,0:11:34.000 og sagde, "Det er så sjovt, 0:11:34.000,0:11:37.000 at vi må gøre det tilgængeligt for alle." 0:11:37.000,0:11:39.000 På nøjagtig de to uger inden offentliggørelsen af vores rapport 0:11:39.000,0:11:42.000 kodede de en version af Ngram Viewer til almen brug. 0:11:42.000,0:11:45.000 Du kan så skrive et vilkårligt ord, du er interesseret i 0:11:45.000,0:11:47.000 og straks se det tilhørende n-gram, 0:11:47.000,0:11:49.000 og du kan gennemse eksempler på alle bøger 0:11:49.000,0:11:51.000 som dit n-gram optræder i. 0:11:51.000,0:11:53.000 Dette blev brugt over en million gang første dag, 0:11:53.000,0:11:55.000 og dette er den bedste af alle søgninger. 0:11:55.000,0:11:58.000 Så folk ønsker at yde deres bedste. 0:11:58.000,0:12:01.000 Men i det 18. årh. var folk ligeglade med alt det. 0:12:01.000,0:12:04.000 De ville ikke gøre bedste, de ville være "beft". 0:12:04.000,0:12:07.000 Dette var selvfølgelig bare en fejl. 0:12:07.000,0:12:09.000 Man stræbte ikke efter middelmådighed, 0:12:09.000,0:12:12.000 men tidligere skrev man S anderledes, nærmest som et f. 0:12:12.000,0:12:15.000 Det opdagede Google selvfølgelig ikke dengang, 0:12:15.000,0:12:18.000 så vi skrev det i den videnskabelige artikel. 0:12:18.000,0:12:20.000 Dette minder os om, at 0:12:20.000,0:12:22.000 selvom det er rigtig sjovt, 0:12:22.000,0:12:24.000 at fortolke disse grafer, skal man være forsigtig 0:12:24.000,0:12:27.000 og overholde de videnskabelige standarder. 0:12:27.000,0:12:30.000 Folk har brugt dette til mange sjove formål. 0:12:30.000,0:12:37.000 (Latter) 0:12:37.000,0:12:39.000 Vi behøver faktisk ikke tale, 0:12:39.000,0:12:42.000 vi viser bare alle slides og tier stille. 0:12:42.000,0:12:45.000 Denne person var interesseret i frustrationens historie. 0:12:45.000,0:12:48.000 Der er forskellige typer frustration. 0:12:48.000,0:12:51.000 Hvis slår tåen, er der ét A i "argh". 0:12:51.000,0:12:53.000 Hvis Jorden udslettes af Vogonerne 0:12:53.000,0:12:55.000 for at gøre plads til en intergalaktisk ekspresrute, 0:12:55.000,0:12:57.000 er det et "aaaaaaaargh" med otte A'er. 0:12:57.000,0:12:59.000 Personen undersøger alle udgaver af "argh" 0:12:59.000,0:13:01.000 fra ét til otte A'er. 0:13:01.000,0:13:03.000 Og det viser sig 0:13:03.000,0:13:05.000 at de mindst hyppige "argh" vedrører 0:13:05.000,0:13:08.000 vedrører ting, der er mere frustrerende 0:13:08.000,0:13:11.000 men sjovt nok ikke i de tidlige 80'ere. 0:13:11.000,0:13:13.000 Vi tror det kan være noget med Reagan. 0:13:13.000,0:13:15.000 (Latter) 0:13:15.000,0:13:18.000 Disse data kan bruges til mange ting, 0:13:18.000,0:13:21.000 men grundlaget er, at historien bliver digitaliseret. 0:13:21.000,0:13:23.000 Google er begyndt at digitalisere 15 millioner bøger. 0:13:23.000,0:13:25.000 Det er 12 % af alle bøger, der er udgivet. 0:13:25.000,0:13:28.000 Det er en god klump af menneskets kultur. 0:13:28.000,0:13:31.000 Kultur er meget mere: manuskripter, aviser 0:13:31.000,0:13:33.000 noget er ikke tekst, f.eks. kunst og malerier. 0:13:33.000,0:13:35.000 Disse vil alle findes på vores computere, 0:13:35.000,0:13:37.000 på computere i hele verden. 0:13:37.000,0:13:40.000 Og når det sker, ændrer det den måde 0:13:40.000,0:13:42.000 vi forstår vores fortid, vores nutid og menneskets kultur. 0:13:42.000,0:13:44.000 Mange tak. 0:13:44.000,0:13:47.000 (Bifald)