WEBVTT 00:00:00.156 --> 00:00:03.683 Wir sind bei The Rundown, ich bin Hari Sreenivasan, und heute reden wir über Wörter. 00:00:03.683 --> 00:00:09.732 Ich spreche jetzt mit Lexikographin Erin McKean, Vorsitzende und Gründerin von wordnik.com . 00:00:09.732 --> 00:00:10.885 Danke, dass Sie bei uns sind. 00:00:10.885 --> 00:00:12.535 Sehr gerne. Ich danke auch. 00:00:12.535 --> 00:00:18.356 Google hat kürzlich eine Internetseite, oder vielleicht eher eine Datenbank veröffentlicht, zusammen mit Leuten aus Harvard: 00:00:18.356 --> 00:00:23.531 NGRAM. Damit kann man Wörter suchen, in tausenden 00:00:23.531 --> 00:00:28.427 von Büchern, Zeitschriften usw. aus den letzten Jahrzehnten. 00:00:28.427 --> 00:00:30.250 Wie haben Sie reagiert, als Sie das erste Mal davon gehört haben? 00:00:30.250 --> 00:00:36.033 Wir waren begeistert, als wir hörten, dass Google die NGRAM-Daten unter einer sehr offenen Lizenz veröffentlichen würde, 00:00:36.033 --> 00:00:41.181 denn das bedeutet, dass viele Leute auf die Daten zugreifen und coole Sachen mit ihnen ausprobieren können. 00:00:41.181 --> 00:00:44.957 Und genau darum geht es uns ja bei Wordnik: Mit Wörtern coole Sachen machen. 00:00:44.957 --> 00:00:50.320 Also, die Daten stammen aus etwa 5 Prozent des Google-Books Bestandes, 00:00:50.320 --> 00:00:53.878 was nicht viel ist, aber es ist schon ein Haufen Wörter. 00:00:53.878 --> 00:00:59.966 Was erfährt man über die englische Sprache, wenn man Zugang zu [Daten über] das Vorkommen von Wörtern über die Jahre hat? 00:00:59.966 --> 00:01:07.814 Die wissenschaftlichen Grundlagen des NGRAM-Betrachtungsprogramms sind vergleichbar mit -- 00:01:07.814 --> 00:01:10.696 sagen wir mal, früheren Antibiotika. 00:01:10.696 --> 00:01:16.173 Sie sind nicht sehr zielgenau. Man kann schlecht unterscheiden zwischen 00:01:16.173 --> 00:01:19.151 z.B. dem Wort "pretty" im Sinne von "hübsch" 00:01:19.151 --> 00:01:23.670 und dem Wort "pretty" in einer Konstruktion wie "That was a pretty neat thing" ["ganz schön", "ziemlich"]. 00:01:23.670 --> 00:01:29.233 Benutzen wir heutzutage mehr neue Wörter? Wächst die englische Sprache schneller als früher? 00:01:29.233 --> 00:01:36.768 Das können wir jetzt besser messen als je zuvor. In dem Aufsatz, den 00:01:36.768 --> 00:01:40.232 Google- und Harvard-Forscher in Science veröffentlicht haben, 00:01:40.232 --> 00:01:45.124 sagen sie, sie haben beobachtet, dass jetzt mehr neue Wörter auftauchen. 00:01:45.124 --> 00:01:49.897 Es gibt noch etwas, bei dem ich mich sehr gefreut habe, von Google- und Harvard-Leuten bestätigt zu werden: 00:01:49.897 --> 00:01:54.082 Sie schätzen, dass 52 Prozent der von ihnen untersuchten Wörter 00:01:54.082 --> 00:01:56.752 in den Wörterbüchern, die sie heranzogen, nicht vorkamen. 00:01:56.752 --> 00:01:58.259 Wie ist das überhaupt möglich? 00:01:58.259 --> 00:02:02.972 Nun, es gibt viele, viele Wörter, die nur einmal vorkommen, sogenannte "nonce words" [einmalige Wörter], 00:02:02.972 --> 00:02:06.746 für die es in einem gedruckten Wörterbuch einfach nicht genug Platz gibt. 00:02:06.746 --> 00:02:09.724 Und -- für die, die Wordnik nicht kennen -- was ist der Unterschied, 00:02:09.724 --> 00:02:12.963 ob ich auf Wordnik gehe oder auf eins der anderen Onlinewörterbücher? 00:02:12.963 --> 00:02:17.691 Wordnik enthält etwa sechsmal so viele Wörter wie die meisten anderen Onlinewörterbücher. 00:02:17.691 --> 00:02:22.994 Wir zeigen so viel Information, wie möglich, über so viele Wörter, wie möglich. 00:02:22.994 --> 00:02:26.260 Wenn es eine Definition aus einem herkömmlichen Wörterbuch gibt, zeigen wir die. 00:02:26.260 --> 00:02:29.264 Aber wenn wir nur drei wirklich gute Sätze haben aus 00:02:29.264 --> 00:02:32.842 z.B. dem Wall Street Journal oder Forbes oder der Huffington Post, dann zeigen wir die an 00:02:32.842 --> 00:02:38.824 und sagen: "Hey, dieses Wort wird von echten JournalistInnen benutzt. Ihr könnt ihre Sätze als Modell nehmen." 00:02:38.824 --> 00:02:40.888 Da das neue Jahr vor der Tür steht: 00:02:40.888 --> 00:02:46.139 Was würden Sie sagen sind diee Top-Wörter des Jahres 2010 oder 2011? 00:02:46.139 --> 00:02:50.371 Das ist interessant. Die Leute wollen immer die Top-Wörter des Jahres wissen, aber meistens 00:02:50.371 --> 00:02:58.024 wachsen Wörter unbemerkt heran, wie Samen in der Erde, und brauchen Zeit, um ins allgemeine Bewusstsein durchzubrechen. 00:02:58.024 --> 00:03:02.805 Ein paar Wörter, die mich in letzter Zeit sehr interessieren, sind alle irgendwie 00:03:02.805 --> 00:03:08.343 negative Wörter über die Auswirkung von Technologie, wie "geoslavery" ["Geosklaverei"]. 00:03:08.343 --> 00:03:10.798 Und was heißt "geoslavery"? 00:03:10.798 --> 00:03:17.773 "Geoslavery" ist ein Begriff dafür, dass mit all diesen GPS-Funktionen und Mobiltelefon-Tracking 00:03:17.773 --> 00:03:25.949 Partner und Ehegatten missbräuchlich Geodaten verwenden können, um ihre Partner besser zu kontrollieren, 00:03:25.949 --> 00:03:29.189 um ihrem Verhalten effektiv Grenzen zu setzen. 00:03:29.189 --> 00:03:31.331 Was ist noch so ein Pflänzchen, dass gerade aus der Erde bricht? 00:03:31.331 --> 00:03:39.167 Eins, das mir sehr gefällt, ist das Wort "aftercrimes" ["Nach-Taten"], in Analogie zu "aftershocks" ["Nachbeben"]. 00:03:39.167 --> 00:03:43.869 Das sind kleine Straftaten, die in einem Gebiet begangen werden, nachdem dort eine schwere Straftat verübt wurde. 00:03:43.869 --> 00:03:49.381 Was ist das Endziel von Wordnik? Soll es das Top-Wörterbuch für alle werden? 00:03:49.381 --> 00:03:52.803 Wir versuchen, die ganze englische Sprache zu kartieren. 00:03:52.803 --> 00:03:55.285 Was wir wirklich gerne einmal sein wollen: ein Navigationssystem für Wörter, 00:03:55.285 --> 00:03:58.707 das so viel Information über so viele Wörter wie nur möglich anzeigt. 00:03:58.707 --> 00:04:02.364 Erin McKean, CEO und Gründerin von Wordnik, Lexikographin. 00:04:02.364 --> 00:04:04.480 Danke, dass Sie bei uns waren, und fröhliches Worteln. 00:04:04.480 --> 00:04:06.100 Vielen Dank. 00:04:06.100 --> 00:04:09.123 Ich bin Hari Sreenivasan, das ist The Rundown. Bleiben Sie dran.