< Return to Video

Wie Computer die menschliche Sprache übersetzen – Ioannis Papachimonas

  • 0:06 - 0:10
    Wie kommt es, dass so viele
    intergalaktische Arten
  • 0:10 - 0:14
    in Film und Fernsehen zufällig
    perfekt Englisch sprechen?
  • 0:14 - 0:18
    Kurz gesagt: Niemand will
    einer Raumschiffcrew dabei zusehen,
  • 0:18 - 0:22
    wie sie jahrelang
    ein Alienwörterbuch erstellt.
  • 0:22 - 0:23
    Aber um konsistent zu bleiben,
  • 0:23 - 0:27
    haben die Schöpfer von Star Trek
    und anderen Science-Fiction-Welten
  • 0:27 - 0:31
    das Konzept eines
    Universalübersetzers eingeführt,
  • 0:31 - 0:35
    ein tragbares Gerät, das sofort
    jede Sprache übersetzen kann.
  • 0:35 - 0:38
    Ist ein Universalübersetzer aber
    auch im echten Leben möglich?
  • 0:38 - 0:42
    Wir haben schon jetzt viele Programme,
    die behaupten, genau das zu tun,
  • 0:42 - 0:46
    ein Wort, einen Satz, oder
    ein gesamtes Buch aus einer Sprache
  • 0:46 - 0:49
    in fast jede andere zu übersetzen,
  • 0:49 - 0:52
    sei es nun modernes Englisch
    oder antikes Sanskrit.
  • 0:52 - 0:54
    Wäre Übersetzung nur eine Frage
  • 0:54 - 0:56
    des Nachschlagens von Wörtern,
  • 0:56 - 1:00
    würden diese Programme
    Menschen locker übertreffen.
  • 1:00 - 1:03
    Die Realität ist aber etwas komplizierter.
  • 1:03 - 1:07
    Ein regelbasiertes Übersetzungsprogramm
    verwendet eine lexikalische Datenbank,
  • 1:07 - 1:11
    die alle Wörter enthält,
    die in einem Wörterbuch stehen,
  • 1:11 - 1:14
    sowie alle grammatikalischen Formen,
    die sie annehmen können,
  • 1:14 - 1:19
    und Regeln zum Erkennen sprachlicher
    Grundelemente der Eingabesprache.
  • 1:19 - 1:23
    Für einen scheinbar einfachen Satz
    wie "Die Kinder essen die Muffins",
  • 1:23 - 1:27
    zerlegt das Programm zuerst seine Syntax
    oder grammatikalische Struktur,
  • 1:27 - 1:30
    indem es die Kinder
    als Subjekt identifiziert,
  • 1:30 - 1:32
    und den Rest des Satzes als Prädikat,
  • 1:32 - 1:34
    das aus dem Verb "essen",
  • 1:34 - 1:37
    und dem direkten Objekt
    "die Muffins" besteht.
  • 1:37 - 1:40
    Es muss dann die englische
    Morphologie erkennen,
  • 1:40 - 1:43
    oder wie Sprache in seine kleinsten
    bedeutungstragenden Einheiten
  • 1:43 - 1:45
    zerlegt werden kann,
  • 1:45 - 1:46
    wie z. B. das Wort Muffin
  • 1:46 - 1:50
    und das Suffix "s",
    das den Plural kennzeichnet.
  • 1:50 - 1:53
    Zu guter Letzt muss es
    die Semantik verstehen:
  • 1:53 - 1:56
    was die verschiedenen
    Teile des Satzes tatsächlich bedeuten.
  • 1:56 - 1:58
    Um diesen Satz richtig zu übersetzen,
  • 1:58 - 2:01
    würde das Programm
    für jedes Element in der Zielsprache
  • 2:01 - 2:05
    auf einen anderen Wortschatz
    und ein anderes Regelwerk verweisen.
  • 2:05 - 2:07
    Aber hier wird es knifflig.
  • 2:07 - 2:10
    Die Syntax mancher Sprachen lässt es zu,
  • 2:10 - 2:13
    dass Wörter in beliebiger Reihenfolge
    angeordnet werden können,
  • 2:13 - 2:17
    während das in anderen dazu führen würde,
    dass der Muffin das Kind isst.
  • 2:17 - 2:19
    Auch Morphologie kann
    ein Problem darstellen.
  • 2:19 - 2:22
    Slowenisch unterscheidet
    mithilfe eines Dualsuffixes
  • 2:22 - 2:27
    zwischen zwei, drei oder mehr Kindern,
    was es in vielen Sprachen nicht gibt.
  • 2:27 - 2:31
    Russisch hat keine bestimmten Artikel
    wodurch man sich vielleicht fragt,
  • 2:31 - 2:33
    ob die Kinder bestimmte Muffins essen
  • 2:33 - 2:37
    oder einfach nur Muffins im Allgemeinen.
  • 2:37 - 2:40
    Sogar bei korrekter Semantik
  • 2:40 - 2:43
    könnte das Programm
    die Feinheiten übersehen,
  • 2:43 - 2:47
    also ob die Kinder die Muffins
    "mangiano" oder "divorano".
  • 2:47 - 2:52
    Eine andere Methode ist die
    statistische maschinelle Übersetzung,
  • 2:52 - 2:56
    die eine Datenbank von Büchern,
    Artikeln und Dokumenten überprüft,
  • 2:56 - 2:59
    die schon von Menschen übersetzt wurden.
  • 2:59 - 3:03
    Indem sie Treffer zwischen der Quelle
    und dem übersetzten Text findet,
  • 3:03 - 3:05
    die vermutlich nicht zufällig auftreten,
  • 3:05 - 3:10
    kann das Programm übereinstimmende
    Phrasen und Muster erkennen
  • 3:10 - 3:12
    und sie für zukünftige
    Übersetzungen verwenden.
  • 3:12 - 3:15
    Jedoch hängt die Qualität
    dieser Art von Übersetzungen
  • 3:15 - 3:18
    von der Größe der
    ursprünglichen Datenbank
  • 3:18 - 3:21
    und der Verfügbarkeit von Beispielen
    in bestimmten Sprachen
  • 3:21 - 3:23
    oder Schreibstilen ab.
  • 3:23 - 3:27
    Die Schwierigkeiten, die Computer
    mit Ausnahmen, Unregelmäßigkeiten
  • 3:27 - 3:31
    und Bedeutungsnuancen haben,
    die Menschen intuitiv erfassen,
  • 3:31 - 3:35
    lässt einige Forscher glauben,
    dass unser Sprachverständnis
  • 3:35 - 3:39
    ein einzigartiges Erzeugnis unserer
    biologischen Hirnstrukturen ist.
  • 3:39 - 3:43
    Eigentlich ist nämlich der
    berühmteste fiktive Universalübersetzer,
  • 3:43 - 3:47
    der Babelfisch aus
    "Per Anhalter durch die Galaxis",
  • 3:47 - 3:50
    gar keine Maschine,
    sondern eine kleine Kreatur,
  • 3:50 - 3:54
    die die Hirnströme und
    Nervensignale von fühlenden Arten
  • 3:54 - 3:57
    durch eine Form von Telepathie übersetzt.
  • 3:57 - 4:02
    Fürs Erste erzielt das Sprachenlernen
    auf altmodische Art bessere Ergebnisse
  • 4:02 - 4:05
    als jedes, momentan
    verfügbare Computerprogramm.
  • 4:05 - 4:07
    Aber das ist keine leichte Aufgabe,
  • 4:07 - 4:10
    und die schiere Anzahl
    an Sprachen in der Welt
  • 4:10 - 4:13
    sowie die zunehmende Interaktion
    zwischen den Menschen, die sie sprechen,
  • 4:13 - 4:18
    werden die automatische Übersetzung
    zu weiteren Fortschritten anspornen.
  • 4:18 - 4:21
    Wenn wir einmal auf intergalaktische
    Lebensformen treffen,
  • 4:21 - 4:25
    können wir vielleicht mit ihnen durch
    ein winziges Ding kommunizieren,
  • 4:25 - 4:29
    oder wir müssen am Ende doch noch
    dieses Wörterbuch erstellen.
Title:
Wie Computer die menschliche Sprache übersetzen – Ioannis Papachimonas
Speaker:
Ioannis Papachimonas
Description:

Die ganze Lektion unter: http://ed.ted.com/lessons/how-computers-translate-human-language-ioannis-papachimonas

Ist ein Universalübersetzer in der Realität möglich? Wir haben bereits viele Programme, die behaupten, ein Wort, einen Satz oder ein ganzes Buch von einer Sprache in fast jede andere zu übersetzen. Die Wirklichkeit ist allerdings ein bisschen komplizierter. Ioannis Papachimonas stellt dar, wie diese maschinellen Übersetzer funktionieren und erklärt, warum sie häufig ein wenig durcheinanderkommen.

Lektion von Ioannis Papachimonas, Animation von NOWAY Video Club.

more » « less
Video Language:
English
Team:
closed TED
Project:
TED-Ed
Duration:
04:45
Nadine Hennig edited German subtitles for How computers translate human language
Angelika Lueckert Leon approved German subtitles for How computers translate human language
Angelika Lueckert Leon edited German subtitles for How computers translate human language
Angelika Lueckert Leon accepted German subtitles for How computers translate human language
Angelika Lueckert Leon edited German subtitles for How computers translate human language
Johannes Duschner edited German subtitles for How computers translate human language
Angelika Lueckert Leon declined German subtitles for How computers translate human language
Angelika Lueckert Leon edited German subtitles for How computers translate human language
Show all

German subtitles

Revisions Compare revisions