1 00:00:06,416 --> 00:00:09,507 Wie kommt es, dass so viele intergalaktische Arten 2 00:00:09,507 --> 00:00:14,345 in Film und Fernsehen zufällig perfekt Englisch sprechen? 3 00:00:14,345 --> 00:00:18,071 Kurz gesagt: Niemand will einer Raumschiffcrew dabei zusehen, 4 00:00:18,071 --> 00:00:21,501 wie sie jahrelang ein Alienwörterbuch erstellt. 5 00:00:21,501 --> 00:00:23,268 Aber um konsistent zu bleiben, 6 00:00:23,268 --> 00:00:27,440 haben die Schöpfer von Star Trek und anderen Science-Fiction-Welten 7 00:00:27,440 --> 00:00:30,614 das Konzept eines Universalübersetzers eingeführt, 8 00:00:30,614 --> 00:00:34,892 ein tragbares Gerät, das sofort jede Sprache übersetzen kann. 9 00:00:34,892 --> 00:00:38,319 Ist ein Universalübersetzer aber auch im echten Leben möglich? 10 00:00:38,319 --> 00:00:42,027 Wir haben schon jetzt viele Programme, die behaupten, genau das zu tun, 11 00:00:42,027 --> 00:00:46,294 ein Wort, einen Satz, oder ein gesamtes Buch aus einer Sprache 12 00:00:46,294 --> 00:00:48,794 in fast jede andere zu übersetzen, 13 00:00:48,794 --> 00:00:52,097 sei es nun modernes Englisch oder antikes Sanskrit. 14 00:00:52,097 --> 00:00:54,133 Wäre Übersetzung nur eine Frage 15 00:00:54,133 --> 00:00:56,133 des Nachschlagens von Wörtern, 16 00:00:56,133 --> 00:00:59,535 würden diese Programme Menschen locker übertreffen. 17 00:00:59,535 --> 00:01:03,179 Die Realität ist aber etwas komplizierter. 18 00:01:03,179 --> 00:01:07,379 Ein regelbasiertes Übersetzungsprogramm verwendet eine lexikalische Datenbank, 19 00:01:07,379 --> 00:01:10,722 die alle Wörter enthält, die in einem Wörterbuch stehen, 20 00:01:10,722 --> 00:01:13,733 sowie alle grammatikalischen Formen, die sie annehmen können, 21 00:01:13,733 --> 00:01:18,625 und Regeln zum Erkennen sprachlicher Grundelemente der Eingabesprache. 22 00:01:18,625 --> 00:01:22,566 Für einen scheinbar einfachen Satz wie "Die Kinder essen die Muffins", 23 00:01:22,566 --> 00:01:26,910 zerlegt das Programm zuerst seine Syntax oder grammatikalische Struktur, 24 00:01:26,910 --> 00:01:29,587 indem es die Kinder als Subjekt identifiziert, 25 00:01:29,587 --> 00:01:32,157 und den Rest des Satzes als Prädikat, 26 00:01:32,157 --> 00:01:34,268 das aus dem Verb "essen", 27 00:01:34,268 --> 00:01:37,142 und dem direkten Objekt "die Muffins" besteht. 28 00:01:37,142 --> 00:01:40,269 Es muss dann die englische Morphologie erkennen, 29 00:01:40,269 --> 00:01:43,381 oder wie Sprache in seine kleinsten bedeutungstragenden Einheiten 30 00:01:43,381 --> 00:01:44,824 zerlegt werden kann, 31 00:01:44,824 --> 00:01:46,195 wie z. B. das Wort Muffin 32 00:01:46,195 --> 00:01:49,501 und das Suffix "s", das den Plural kennzeichnet. 33 00:01:49,501 --> 00:01:52,602 Zu guter Letzt muss es die Semantik verstehen: 34 00:01:52,602 --> 00:01:55,928 was die verschiedenen Teile des Satzes tatsächlich bedeuten. 35 00:01:55,928 --> 00:01:57,911 Um diesen Satz richtig zu übersetzen, 36 00:01:57,911 --> 00:02:00,686 würde das Programm für jedes Element in der Zielsprache 37 00:02:00,686 --> 00:02:04,835 auf einen anderen Wortschatz und ein anderes Regelwerk verweisen. 38 00:02:04,835 --> 00:02:06,865 Aber hier wird es knifflig. 39 00:02:06,865 --> 00:02:09,601 Die Syntax mancher Sprachen lässt es zu, 40 00:02:09,601 --> 00:02:12,845 dass Wörter in beliebiger Reihenfolge angeordnet werden können, 41 00:02:12,845 --> 00:02:16,748 während das in anderen dazu führen würde, dass der Muffin das Kind isst. 42 00:02:16,748 --> 00:02:19,447 Auch Morphologie kann ein Problem darstellen. 43 00:02:19,447 --> 00:02:22,010 Slowenisch unterscheidet mithilfe eines Dualsuffixes 44 00:02:22,010 --> 00:02:26,897 zwischen zwei, drei oder mehr Kindern, was es in vielen Sprachen nicht gibt. 45 00:02:26,897 --> 00:02:30,857 Russisch hat keine bestimmten Artikel wodurch man sich vielleicht fragt, 46 00:02:30,857 --> 00:02:33,457 ob die Kinder bestimmte Muffins essen 47 00:02:33,457 --> 00:02:36,770 oder einfach nur Muffins im Allgemeinen. 48 00:02:36,770 --> 00:02:39,736 Sogar bei korrekter Semantik 49 00:02:39,736 --> 00:02:42,658 könnte das Programm die Feinheiten übersehen, 50 00:02:42,658 --> 00:02:47,477 also ob die Kinder die Muffins "mangiano" oder "divorano". 51 00:02:47,477 --> 00:02:51,700 Eine andere Methode ist die statistische maschinelle Übersetzung, 52 00:02:51,700 --> 00:02:56,091 die eine Datenbank von Büchern, Artikeln und Dokumenten überprüft, 53 00:02:56,091 --> 00:02:59,356 die schon von Menschen übersetzt wurden. 54 00:02:59,356 --> 00:03:02,952 Indem sie Treffer zwischen der Quelle und dem übersetzten Text findet, 55 00:03:02,952 --> 00:03:05,405 die vermutlich nicht zufällig auftreten, 56 00:03:05,405 --> 00:03:09,643 kann das Programm übereinstimmende Phrasen und Muster erkennen 57 00:03:09,643 --> 00:03:12,403 und sie für zukünftige Übersetzungen verwenden. 58 00:03:12,403 --> 00:03:15,279 Jedoch hängt die Qualität dieser Art von Übersetzungen 59 00:03:15,279 --> 00:03:17,745 von der Größe der ursprünglichen Datenbank 60 00:03:17,745 --> 00:03:21,147 und der Verfügbarkeit von Beispielen in bestimmten Sprachen 61 00:03:21,147 --> 00:03:23,227 oder Schreibstilen ab. 62 00:03:23,227 --> 00:03:26,968 Die Schwierigkeiten, die Computer mit Ausnahmen, Unregelmäßigkeiten 63 00:03:26,968 --> 00:03:31,230 und Bedeutungsnuancen haben, die Menschen intuitiv erfassen, 64 00:03:31,230 --> 00:03:35,289 lässt einige Forscher glauben, dass unser Sprachverständnis 65 00:03:35,289 --> 00:03:39,172 ein einzigartiges Erzeugnis unserer biologischen Hirnstrukturen ist. 66 00:03:39,172 --> 00:03:43,269 Eigentlich ist nämlich der berühmteste fiktive Universalübersetzer, 67 00:03:43,269 --> 00:03:46,632 der Babelfisch aus "Per Anhalter durch die Galaxis", 68 00:03:46,632 --> 00:03:50,145 gar keine Maschine, sondern eine kleine Kreatur, 69 00:03:50,145 --> 00:03:54,352 die die Hirnströme und Nervensignale von fühlenden Arten 70 00:03:54,352 --> 00:03:56,941 durch eine Form von Telepathie übersetzt. 71 00:03:56,941 --> 00:04:01,861 Fürs Erste erzielt das Sprachenlernen auf altmodische Art bessere Ergebnisse 72 00:04:01,861 --> 00:04:04,988 als jedes, momentan verfügbare Computerprogramm. 73 00:04:04,988 --> 00:04:06,949 Aber das ist keine leichte Aufgabe, 74 00:04:06,949 --> 00:04:09,575 und die schiere Anzahl an Sprachen in der Welt 75 00:04:09,575 --> 00:04:13,199 sowie die zunehmende Interaktion zwischen den Menschen, die sie sprechen, 76 00:04:13,199 --> 00:04:18,095 werden die automatische Übersetzung zu weiteren Fortschritten anspornen. 77 00:04:18,095 --> 00:04:21,486 Wenn wir einmal auf intergalaktische Lebensformen treffen, 78 00:04:21,486 --> 00:04:25,212 können wir vielleicht mit ihnen durch ein winziges Ding kommunizieren, 79 00:04:25,212 --> 00:04:29,262 oder wir müssen am Ende doch noch dieses Wörterbuch erstellen.