1 00:00:00,156 --> 00:00:03,683 Wir sind bei The Rundown, ich bin Hari Sreenivasan, und heute reden wir über Wörter. 2 00:00:03,683 --> 00:00:09,732 Ich spreche jetzt mit Lexikographin Erin McKean, Vorsitzende und Gründerin von wordnik.com . 3 00:00:09,732 --> 00:00:10,885 Danke, dass Sie bei uns sind. 4 00:00:10,885 --> 00:00:12,535 Sehr gerne. Ich danke auch. 5 00:00:12,535 --> 00:00:18,356 Google hat kürzlich eine Internetseite, oder vielleicht eher eine Datenbank veröffentlicht, zusammen mit Leuten aus Harvard: 6 00:00:18,356 --> 00:00:23,531 NGRAM. Damit kann man Wörter suchen, in tausenden 7 00:00:23,531 --> 00:00:28,427 von Büchern, Zeitschriften usw. aus den letzten Jahrzehnten. 8 00:00:28,427 --> 00:00:30,250 Wie haben Sie reagiert, als Sie das erste Mal davon gehört haben? 9 00:00:30,250 --> 00:00:36,033 Wir waren begeistert, als wir hörten, dass Google die NGRAM-Daten unter einer sehr offenen Lizenz veröffentlichen würde, 10 00:00:36,033 --> 00:00:41,181 denn das bedeutet, dass viele Leute auf die Daten zugreifen und coole Sachen mit ihnen ausprobieren können. 11 00:00:41,181 --> 00:00:44,957 Und genau darum geht es uns ja bei Wordnik: Mit Wörtern coole Sachen machen. 12 00:00:44,957 --> 00:00:50,320 Also, die Daten stammen aus etwa 5 Prozent des Google-Books Bestandes, 13 00:00:50,320 --> 00:00:53,878 was nicht viel ist, aber es ist schon ein Haufen Wörter. 14 00:00:53,878 --> 00:00:59,966 Was erfährt man über die englische Sprache, wenn man Zugang zu [Daten über] das Vorkommen von Wörtern über die Jahre hat? 15 00:00:59,966 --> 00:01:07,814 Die wissenschaftlichen Grundlagen des NGRAM-Betrachtungsprogramms sind vergleichbar mit -- 16 00:01:07,814 --> 00:01:10,696 sagen wir mal, früheren Antibiotika. 17 00:01:10,696 --> 00:01:16,173 Sie sind nicht sehr zielgenau. Man kann schlecht unterscheiden zwischen 18 00:01:16,173 --> 00:01:19,151 z.B. dem Wort "pretty" im Sinne von "hübsch" 19 00:01:19,151 --> 00:01:23,670 und dem Wort "pretty" in einer Konstruktion wie "That was a pretty neat thing" ["ganz schön", "ziemlich"]. 20 00:01:23,670 --> 00:01:29,233 Benutzen wir heutzutage mehr neue Wörter? Wächst die englische Sprache schneller als früher? 21 00:01:29,233 --> 00:01:36,768 Das können wir jetzt besser messen als je zuvor. In dem Aufsatz, den 22 00:01:36,768 --> 00:01:40,232 Google- und Harvard-Forscher in Science veröffentlicht haben, 23 00:01:40,232 --> 00:01:45,124 sagen sie, sie haben beobachtet, dass jetzt mehr neue Wörter auftauchen. 24 00:01:45,124 --> 00:01:49,897 Es gibt noch etwas, bei dem ich mich sehr gefreut habe, von Google- und Harvard-Leuten bestätigt zu werden: 25 00:01:49,897 --> 00:01:54,082 Sie schätzen, dass 52 Prozent der von ihnen untersuchten Wörter 26 00:01:54,082 --> 00:01:56,752 in den Wörterbüchern, die sie heranzogen, nicht vorkamen. 27 00:01:56,752 --> 00:01:58,259 Wie ist das überhaupt möglich? 28 00:01:58,259 --> 00:02:02,972 Nun, es gibt viele, viele Wörter, die nur einmal vorkommen, sogenannte "nonce words" [einmalige Wörter], 29 00:02:02,972 --> 00:02:06,746 für die es in einem gedruckten Wörterbuch einfach nicht genug Platz gibt. 30 00:02:06,746 --> 00:02:09,724 Und -- für die, die Wordnik nicht kennen -- was ist der Unterschied, 31 00:02:09,724 --> 00:02:12,963 ob ich auf Wordnik gehe oder auf eins der anderen Onlinewörterbücher? 32 00:02:12,963 --> 00:02:17,691 Wordnik enthält etwa sechsmal so viele Wörter wie die meisten anderen Onlinewörterbücher. 33 00:02:17,691 --> 00:02:22,994 Wir zeigen so viel Information, wie möglich, über so viele Wörter, wie möglich. 34 00:02:22,994 --> 00:02:26,260 Wenn es eine Definition aus einem herkömmlichen Wörterbuch gibt, zeigen wir die. 35 00:02:26,260 --> 00:02:29,264 Aber wenn wir nur drei wirklich gute Sätze haben aus 36 00:02:29,264 --> 00:02:32,842 z.B. dem Wall Street Journal oder Forbes oder der Huffington Post, dann zeigen wir die an 37 00:02:32,842 --> 00:02:38,824 und sagen: "Hey, dieses Wort wird von echten JournalistInnen benutzt. Ihr könnt ihre Sätze als Modell nehmen." 38 00:02:38,824 --> 00:02:40,888 Da das neue Jahr vor der Tür steht: 39 00:02:40,888 --> 00:02:46,139 Was würden Sie sagen sind diee Top-Wörter des Jahres 2010 oder 2011? 40 00:02:46,139 --> 00:02:50,371 Das ist interessant. Die Leute wollen immer die Top-Wörter des Jahres wissen, aber meistens 41 00:02:50,371 --> 00:02:58,024 wachsen Wörter unbemerkt heran, wie Samen in der Erde, und brauchen Zeit, um ins allgemeine Bewusstsein durchzubrechen. 42 00:02:58,024 --> 00:03:02,805 Ein paar Wörter, die mich in letzter Zeit sehr interessieren, sind alle irgendwie 43 00:03:02,805 --> 00:03:08,343 negative Wörter über die Auswirkung von Technologie, wie "geoslavery" ["Geosklaverei"]. 44 00:03:08,343 --> 00:03:10,798 Und was heißt "geoslavery"? 45 00:03:10,798 --> 00:03:17,773 "Geoslavery" ist ein Begriff dafür, dass mit all diesen GPS-Funktionen und Mobiltelefon-Tracking 46 00:03:17,773 --> 00:03:25,949 Partner und Ehegatten missbräuchlich Geodaten verwenden können, um ihre Partner besser zu kontrollieren, 47 00:03:25,949 --> 00:03:29,189 um ihrem Verhalten effektiv Grenzen zu setzen. 48 00:03:29,189 --> 00:03:31,331 Was ist noch so ein Pflänzchen, dass gerade aus der Erde bricht? 49 00:03:31,331 --> 00:03:39,167 Eins, das mir sehr gefällt, ist das Wort "aftercrimes" ["Nach-Taten"], in Analogie zu "aftershocks" ["Nachbeben"]. 50 00:03:39,167 --> 00:03:43,869 Das sind kleine Straftaten, die in einem Gebiet begangen werden, nachdem dort eine schwere Straftat verübt wurde. 51 00:03:43,869 --> 00:03:49,381 Was ist das Endziel von Wordnik? Soll es das Top-Wörterbuch für alle werden? 52 00:03:49,381 --> 00:03:52,803 Wir versuchen, die ganze englische Sprache zu kartieren. 53 00:03:52,803 --> 00:03:55,285 Was wir wirklich gerne einmal sein wollen: ein Navigationssystem für Wörter, 54 00:03:55,285 --> 00:03:58,707 das so viel Information über so viele Wörter wie nur möglich anzeigt. 55 00:03:58,707 --> 00:04:02,364 Erin McKean, CEO und Gründerin von Wordnik, Lexikographin. 56 00:04:02,364 --> 00:04:04,480 Danke, dass Sie bei uns waren, und fröhliches Worteln. 57 00:04:04,480 --> 00:04:06,100 Vielen Dank. 58 00:04:06,100 --> 00:04:09,123 Ich bin Hari Sreenivasan, das ist The Rundown. Bleiben Sie dran.