WEBVTT 00:00:06.416 --> 00:00:09.507 Wie kommt es, dass so viele intergalaktische Arten 00:00:09.507 --> 00:00:14.345 in Film und Fernsehen zufällig perfekt Englisch sprechen? 00:00:14.345 --> 00:00:18.071 Kurz gesagt: Niemand will einer Raumschiffcrew dabei zusehen, 00:00:18.071 --> 00:00:21.501 wie sie jahrelang ein Alienwörterbuch erstellt. 00:00:21.501 --> 00:00:23.268 Aber um konsistent zu bleiben, 00:00:23.268 --> 00:00:27.440 haben die Schöpfer von Star Trek und anderen Science-Fiction-Welten 00:00:27.440 --> 00:00:30.614 das Konzept eines Universalübersetzers eingeführt, 00:00:30.614 --> 00:00:34.892 ein tragbares Gerät, das sofort jede Sprache übersetzen kann. 00:00:34.892 --> 00:00:38.319 Ist ein Universalübersetzer aber auch im echten Leben möglich? 00:00:38.319 --> 00:00:42.027 Wir haben schon jetzt viele Programme, die behaupten, genau das zu tun, 00:00:42.027 --> 00:00:46.294 ein Wort, einen Satz, oder ein gesamtes Buch aus einer Sprache 00:00:46.294 --> 00:00:48.794 in fast jede andere zu übersetzen, 00:00:48.794 --> 00:00:52.097 sei es nun modernes Englisch oder antikes Sanskrit. 00:00:52.097 --> 00:00:54.133 Wäre Übersetzung nur eine Frage 00:00:54.133 --> 00:00:56.133 des Nachschlagens von Wörtern, 00:00:56.133 --> 00:00:59.535 würden diese Programme Menschen locker übertreffen. 00:00:59.535 --> 00:01:03.179 Die Realität ist aber etwas komplizierter. 00:01:03.179 --> 00:01:07.379 Ein regelbasiertes Übersetzungsprogramm verwendet eine lexikalische Datenbank, 00:01:07.379 --> 00:01:10.722 die alle Wörter enthält, die in einem Wörterbuch stehen, 00:01:10.722 --> 00:01:13.733 sowie alle grammatikalischen Formen, die sie annehmen können, 00:01:13.733 --> 00:01:18.625 und Regeln zum Erkennen sprachlicher Grundelemente der Eingabesprache. 00:01:18.625 --> 00:01:22.566 Für einen scheinbar einfachen Satz wie "Die Kinder essen die Muffins", 00:01:22.566 --> 00:01:26.910 zerlegt das Programm zuerst seine Syntax oder grammatikalische Struktur, 00:01:26.910 --> 00:01:29.587 indem es die Kinder als Subjekt identifiziert, 00:01:29.587 --> 00:01:32.157 und den Rest des Satzes als Prädikat, 00:01:32.157 --> 00:01:34.268 das aus dem Verb "essen", 00:01:34.268 --> 00:01:37.142 und dem direkten Objekt "die Muffins" besteht. 00:01:37.142 --> 00:01:40.269 Es muss dann die englische Morphologie erkennen, 00:01:40.269 --> 00:01:43.381 oder wie Sprache in seine kleinsten bedeutungstragenden Einheiten 00:01:43.381 --> 00:01:44.824 zerlegt werden kann, 00:01:44.824 --> 00:01:46.195 wie z. B. das Wort Muffin 00:01:46.195 --> 00:01:49.501 und das Suffix "s", das den Plural kennzeichnet. 00:01:49.501 --> 00:01:52.602 Zu guter Letzt muss es die Semantik verstehen: 00:01:52.602 --> 00:01:55.928 was die verschiedenen Teile des Satzes tatsächlich bedeuten. 00:01:55.928 --> 00:01:57.911 Um diesen Satz richtig zu übersetzen, 00:01:57.911 --> 00:02:00.686 würde das Programm für jedes Element in der Zielsprache 00:02:00.686 --> 00:02:04.835 auf einen anderen Wortschatz und ein anderes Regelwerk verweisen. 00:02:04.835 --> 00:02:06.865 Aber hier wird es knifflig. 00:02:06.865 --> 00:02:09.601 Die Syntax mancher Sprachen lässt es zu, 00:02:09.601 --> 00:02:12.845 dass Wörter in beliebiger Reihenfolge angeordnet werden können, 00:02:12.845 --> 00:02:16.748 während das in anderen dazu führen würde, dass der Muffin das Kind isst. 00:02:16.748 --> 00:02:19.447 Auch Morphologie kann ein Problem darstellen. 00:02:19.447 --> 00:02:22.010 Slowenisch unterscheidet mithilfe eines Dualsuffixes 00:02:22.010 --> 00:02:26.897 zwischen zwei, drei oder mehr Kindern, was es in vielen Sprachen nicht gibt. 00:02:26.897 --> 00:02:30.857 Russisch hat keine bestimmten Artikel wodurch man sich vielleicht fragt, 00:02:30.857 --> 00:02:33.457 ob die Kinder bestimmte Muffins essen 00:02:33.457 --> 00:02:36.770 oder einfach nur Muffins im Allgemeinen. 00:02:36.770 --> 00:02:39.736 Sogar bei korrekter Semantik 00:02:39.736 --> 00:02:42.658 könnte das Programm die Feinheiten übersehen, 00:02:42.658 --> 00:02:47.477 also ob die Kinder die Muffins "mangiano" oder "divorano". 00:02:47.477 --> 00:02:51.700 Eine andere Methode ist die statistische maschinelle Übersetzung, 00:02:51.700 --> 00:02:56.091 die eine Datenbank von Büchern, Artikeln und Dokumenten überprüft, 00:02:56.091 --> 00:02:59.356 die schon von Menschen übersetzt wurden. 00:02:59.356 --> 00:03:02.952 Indem sie Treffer zwischen der Quelle und dem übersetzten Text findet, 00:03:02.952 --> 00:03:05.405 die vermutlich nicht zufällig auftreten, 00:03:05.405 --> 00:03:09.643 kann das Programm übereinstimmende Phrasen und Muster erkennen 00:03:09.643 --> 00:03:12.403 und sie für zukünftige Übersetzungen verwenden. 00:03:12.403 --> 00:03:15.279 Jedoch hängt die Qualität dieser Art von Übersetzungen 00:03:15.279 --> 00:03:17.745 von der Größe der ursprünglichen Datenbank 00:03:17.745 --> 00:03:21.147 und der Verfügbarkeit von Beispielen in bestimmten Sprachen 00:03:21.147 --> 00:03:23.227 oder Schreibstilen ab. 00:03:23.227 --> 00:03:26.968 Die Schwierigkeiten, die Computer mit Ausnahmen, Unregelmäßigkeiten 00:03:26.968 --> 00:03:31.230 und Bedeutungsnuancen haben, die Menschen intuitiv erfassen, 00:03:31.230 --> 00:03:35.289 lässt einige Forscher glauben, dass unser Sprachverständnis 00:03:35.289 --> 00:03:39.172 ein einzigartiges Erzeugnis unserer biologischen Hirnstrukturen ist. 00:03:39.172 --> 00:03:43.269 Eigentlich ist nämlich der berühmteste fiktive Universalübersetzer, 00:03:43.269 --> 00:03:46.632 der Babelfisch aus "Per Anhalter durch die Galaxis", 00:03:46.632 --> 00:03:50.145 gar keine Maschine, sondern eine kleine Kreatur, 00:03:50.145 --> 00:03:54.352 die die Hirnströme und Nervensignale von fühlenden Arten 00:03:54.352 --> 00:03:56.941 durch eine Form von Telepathie übersetzt. 00:03:56.941 --> 00:04:01.861 Fürs Erste erzielt das Sprachenlernen auf altmodische Art bessere Ergebnisse 00:04:01.861 --> 00:04:04.988 als jedes, momentan verfügbare Computerprogramm. 00:04:04.988 --> 00:04:06.949 Aber das ist keine leichte Aufgabe, 00:04:06.949 --> 00:04:09.575 und die schiere Anzahl an Sprachen in der Welt 00:04:09.575 --> 00:04:13.199 sowie die zunehmende Interaktion zwischen den Menschen, die sie sprechen, 00:04:13.199 --> 00:04:18.095 werden die automatische Übersetzung zu weiteren Fortschritten anspornen. 00:04:18.095 --> 00:04:21.486 Wenn wir einmal auf intergalaktische Lebensformen treffen, 00:04:21.486 --> 00:04:25.212 können wir vielleicht mit ihnen durch ein winziges Ding kommunizieren, 00:04:25.212 --> 00:04:29.262 oder wir müssen am Ende doch noch dieses Wörterbuch erstellen.