0:00:00.156,0:00:03.683 Wir sind bei The Rundown, ich bin Hari Sreenivasan, und heute reden wir über Wörter. 0:00:03.683,0:00:09.732 Ich spreche jetzt mit Lexikographin Erin McKean, Vorsitzende und Gründerin von wordnik.com . 0:00:09.732,0:00:10.885 Danke, dass Sie bei uns sind. 0:00:10.885,0:00:12.535 Sehr gerne. Ich danke auch. 0:00:12.535,0:00:18.356 Google hat kürzlich eine Internetseite, oder vielleicht eher eine Datenbank veröffentlicht, zusammen mit Leuten aus Harvard: 0:00:18.356,0:00:23.531 NGRAM. Damit kann man Wörter suchen, in tausenden 0:00:23.531,0:00:28.427 von Büchern, Zeitschriften usw. aus den letzten Jahrzehnten. 0:00:28.427,0:00:30.250 Wie haben Sie reagiert, als Sie das erste Mal davon gehört haben? 0:00:30.250,0:00:36.033 Wir waren begeistert, als wir hörten, dass Google die NGRAM-Daten unter einer sehr offenen Lizenz veröffentlichen würde, 0:00:36.033,0:00:41.181 denn das bedeutet, dass viele Leute auf die Daten zugreifen und coole Sachen mit ihnen ausprobieren können. 0:00:41.181,0:00:44.957 Und genau darum geht es uns ja bei Wordnik: Mit Wörtern coole Sachen machen. 0:00:44.957,0:00:50.320 Also, die Daten stammen aus etwa 5 Prozent des Google-Books Bestandes, 0:00:50.320,0:00:53.878 was nicht viel ist, aber es ist schon ein Haufen Wörter. 0:00:53.878,0:00:59.966 Was erfährt man über die englische Sprache, wenn man Zugang zu [Daten über] das Vorkommen von Wörtern über die Jahre hat? 0:00:59.966,0:01:07.814 Die wissenschaftlichen Grundlagen des NGRAM-Betrachtungsprogramms sind vergleichbar mit -- 0:01:07.814,0:01:10.696 sagen wir mal, früheren Antibiotika. 0:01:10.696,0:01:16.173 Sie sind nicht sehr zielgenau. Man kann schlecht unterscheiden zwischen 0:01:16.173,0:01:19.151 z.B. dem Wort "pretty" im Sinne von "hübsch" 0:01:19.151,0:01:23.670 und dem Wort "pretty" in einer Konstruktion wie "That was a pretty neat thing" ["ganz schön", "ziemlich"]. 0:01:23.670,0:01:29.233 Benutzen wir heutzutage mehr neue Wörter? Wächst die englische Sprache schneller als früher? 0:01:29.233,0:01:36.768 Das können wir jetzt besser messen als je zuvor. In dem Aufsatz, den 0:01:36.768,0:01:40.232 Google- und Harvard-Forscher in Science veröffentlicht haben, 0:01:40.232,0:01:45.124 sagen sie, sie haben beobachtet, dass jetzt mehr neue Wörter auftauchen. 0:01:45.124,0:01:49.897 Es gibt noch etwas, bei dem ich mich sehr gefreut habe, von Google- und Harvard-Leuten bestätigt zu werden: 0:01:49.897,0:01:54.082 Sie schätzen, dass 52 Prozent der von ihnen untersuchten Wörter 0:01:54.082,0:01:56.752 in den Wörterbüchern, die sie heranzogen, nicht vorkamen. 0:01:56.752,0:01:58.259 Wie ist das überhaupt möglich? 0:01:58.259,0:02:02.972 Nun, es gibt viele, viele Wörter, die nur einmal vorkommen, sogenannte "nonce words" [einmalige Wörter], 0:02:02.972,0:02:06.746 für die es in einem gedruckten Wörterbuch einfach nicht genug Platz gibt. 0:02:06.746,0:02:09.724 Und -- für die, die Wordnik nicht kennen -- was ist der Unterschied, 0:02:09.724,0:02:12.963 ob ich auf Wordnik gehe oder auf eins der anderen Onlinewörterbücher? 0:02:12.963,0:02:17.691 Wordnik enthält etwa sechsmal so viele Wörter wie die meisten anderen Onlinewörterbücher. 0:02:17.691,0:02:22.994 Wir zeigen so viel Information, wie möglich, über so viele Wörter, wie möglich. 0:02:22.994,0:02:26.260 Wenn es eine Definition aus einem herkömmlichen Wörterbuch gibt, zeigen wir die. 0:02:26.260,0:02:29.264 Aber wenn wir nur drei wirklich gute Sätze haben aus 0:02:29.264,0:02:32.842 z.B. dem Wall Street Journal oder Forbes oder der Huffington Post, dann zeigen wir die an 0:02:32.842,0:02:38.824 und sagen: "Hey, dieses Wort wird von echten JournalistInnen benutzt. Ihr könnt ihre Sätze als Modell nehmen." 0:02:38.824,0:02:40.888 Da das neue Jahr vor der Tür steht: 0:02:40.888,0:02:46.139 Was würden Sie sagen sind diee Top-Wörter des Jahres 2010 oder 2011? 0:02:46.139,0:02:50.371 Das ist interessant. Die Leute wollen immer die Top-Wörter des Jahres wissen, aber meistens 0:02:50.371,0:02:58.024 wachsen Wörter unbemerkt heran, wie Samen in der Erde, und brauchen Zeit, um ins allgemeine Bewusstsein durchzubrechen. 0:02:58.024,0:03:02.805 Ein paar Wörter, die mich in letzter Zeit sehr interessieren, sind alle irgendwie 0:03:02.805,0:03:08.343 negative Wörter über die Auswirkung von Technologie, wie "geoslavery" ["Geosklaverei"]. 0:03:08.343,0:03:10.798 Und was heißt "geoslavery"? 0:03:10.798,0:03:17.773 "Geoslavery" ist ein Begriff dafür, dass mit all diesen GPS-Funktionen und Mobiltelefon-Tracking 0:03:17.773,0:03:25.949 Partner und Ehegatten missbräuchlich Geodaten verwenden können, um ihre Partner besser zu kontrollieren, 0:03:25.949,0:03:29.189 um ihrem Verhalten effektiv Grenzen zu setzen. 0:03:29.189,0:03:31.331 Was ist noch so ein Pflänzchen, dass gerade aus der Erde bricht? 0:03:31.331,0:03:39.167 Eins, das mir sehr gefällt, ist das Wort "aftercrimes" ["Nach-Taten"], in Analogie zu "aftershocks" ["Nachbeben"]. 0:03:39.167,0:03:43.869 Das sind kleine Straftaten, die in einem Gebiet begangen werden, nachdem dort eine schwere Straftat verübt wurde. 0:03:43.869,0:03:49.381 Was ist das Endziel von Wordnik? Soll es das Top-Wörterbuch für alle werden? 0:03:49.381,0:03:52.803 Wir versuchen, die ganze englische Sprache zu kartieren. 0:03:52.803,0:03:55.285 Was wir wirklich gerne einmal sein wollen: ein Navigationssystem für Wörter, 0:03:55.285,0:03:58.707 das so viel Information über so viele Wörter wie nur möglich anzeigt. 0:03:58.707,0:04:02.364 Erin McKean, CEO und Gründerin von Wordnik, Lexikographin. 0:04:02.364,0:04:04.480 Danke, dass Sie bei uns waren, und fröhliches Worteln. 0:04:04.480,0:04:06.100 Vielen Dank. 0:04:06.100,0:04:09.123 Ich bin Hari Sreenivasan, das ist The Rundown. Bleiben Sie dran.