コンピュータが人間の言葉を翻訳する仕組み ― イオアニス・パパチモナス
-
0:07 - 0:11映画やテレビに出てくる宇宙人の多くが
苦もなく完璧な英語を話すのは -
0:11 - 0:14一体どういうわけなんでしょうか
-
0:14 - 0:18端的に言えば
宇宙船の乗組員が何年もかけて -
0:18 - 0:22宇宙人語の辞書を編纂している姿なんて
誰も見たくないからです -
0:22 - 0:23しかし辻褄を合わせる意味で
-
0:23 - 0:27スタートレックなどSF業界の製作者たちは
-
0:27 - 0:31万能翻訳機というコンセプトを
世に送り出しました -
0:31 - 0:35どんな言語間の翻訳も即座にできる
携帯機器です -
0:35 - 0:39では現実の世界に万能翻訳機は
存在し得るのでしょうか -
0:39 - 0:42それが可能だと言い張る
プログラムはたくさんあります -
0:42 - 0:46単語でも文でも 本を丸ごと1冊でも
-
0:46 - 0:49ある言語から
別の たいていの言語に翻訳でき -
0:49 - 0:52現代英語も古代サンスクリット語も
お手のものです -
0:52 - 0:56もし翻訳というものが
ただ単語を辞書で調べるだけのことなら -
0:56 - 1:00こうしたプログラムは
人間の力を越えていると言えるでしょう -
1:00 - 1:03しかし実際のところは もっと複雑です
-
1:03 - 1:07規則に基づくタイプの翻訳プログラムは
-
1:07 - 1:10辞書に載っているすべての単語や
その単語が取りうる― -
1:10 - 1:13文法的に正しいすべての形を含んだ
語彙のデータベースと -
1:13 - 1:19入力言語の基本的な言語的要素を
認識するための一連の規則を用います -
1:19 - 1:22「その子たちはマフィンを食べる」は
一見 単純そうな文ですが -
1:22 - 1:27プログラムは まず構文
つまり文法的な構造を解析します -
1:27 - 1:30「その子たち」が主語で
-
1:30 - 1:32残りの部分は述語であり
-
1:32 - 1:34その中には動詞の「食べる」と
-
1:34 - 1:37直接目的語「マフィン」があることを
割り出します -
1:37 - 1:40続いて英語の形態論に沿って
識別する必要があります -
1:40 - 1:45意味を持つ最小単位にまで
言語を分解するのです -
1:45 - 1:46たとえば「マフィン」という語と
-
1:46 - 1:50複数を示す接尾辞「s」とは
別々になります -
1:50 - 1:52最後に意味論の理解が必要です
-
1:52 - 1:56文の各部分が実際にどういう意味か
判断するのです -
1:56 - 1:58この文を正しく翻訳するために
-
1:58 - 2:02プログラムは
翻訳後の要素1つ1つに対して -
2:02 - 2:05その言語の語彙や規則を参照しますが
-
2:05 - 2:07ここが微妙なところです
-
2:07 - 2:12構文的に語順を自由に入れ替えてよい
言語もあれば -
2:12 - 2:17入れ替えると「マフィンが子どもを食べる」に
なってしまう言語もあります -
2:17 - 2:20形態論が問題になることもあります
-
2:20 - 2:23スロベニア語では「2人の子ども」と
「3人以上の子ども」は区別され -
2:23 - 2:27他の多くの言語にはない双数形を示す
接尾辞を使います -
2:27 - 2:31ロシア語には定冠詞がないので
子どもたちが食べているのは -
2:31 - 2:34ある特定のマフィンなのか
一般的なマフィンなのか -
2:34 - 2:37戸惑ってしまうかもしれません
-
2:37 - 2:40最後に プログラムは意味論に関して
間違いではなくても -
2:40 - 2:43細かいところを取りこぼす場合があります
-
2:43 - 2:46たとえば子どもたちがマフィンを
「普通に食べる」か -
2:46 - 2:48「ガツガツむさぼる」か拾いきれません
-
2:48 - 2:52また別の方法として
統計的機械翻訳というのがあります -
2:52 - 2:56すでに人間の手で翻訳されている
本や記事や文書の -
2:56 - 2:59データベースを分析する方法です
-
2:59 - 3:03このプログラムでは
偶然には起こりにくいと考えられる― -
3:03 - 3:05原文と翻訳が一致する箇所を探すことで
-
3:05 - 3:09対応する表現やパターンを特定しておき
-
3:09 - 3:12それを後々 翻訳に利用します
-
3:12 - 3:15しかし このタイプの翻訳の質は
-
3:15 - 3:18初期のデータベースの規模や
-
3:18 - 3:21目的の言語のサンプルや
文体のサンプルが -
3:21 - 3:23どれだけ使えるかに かかっています
-
3:23 - 3:27コンピュータは例外や変則的な表現
ニュアンスの違いに苦労しますが -
3:27 - 3:31これは人間なら本能的にわかるものです
-
3:31 - 3:35このため研究者の中には
私たちの言語理解を -
3:35 - 3:39人間の脳の生物学的構造が生む
特徴だと考える人もいます -
3:39 - 3:43事実 もっとも有名な架空の万能翻訳機は
-
3:43 - 3:46『銀河ヒッチハイク・ガイド』に登場する
バベル魚ですが -
3:46 - 3:50あれは機械などではなく
小さな生き物で -
3:50 - 3:54知覚を持つ生物の脳波と神経信号を
テレパシーという形で -
3:54 - 3:57翻訳するというものでした
-
3:57 - 4:00今のところは まだ
昔ながらの言語学習の方が -
4:00 - 4:05世の中の どのコンピュータプログラムより
良い結果を出しますが -
4:05 - 4:07言語学習は簡単ではありませんし
-
4:07 - 4:09世界中には数多くの言語があり
-
4:09 - 4:13それを話す人々の間で
交流が増えていることにも後押しされて -
4:13 - 4:18自動翻訳は今後
進歩していく一方でしょう -
4:18 - 4:21きっと私たちが
宇宙の生命体に出会う頃には -
4:21 - 4:25小型の装置を通じて
コミュニケーションが可能になっているでしょう -
4:25 - 4:29あるいは結局 例の辞書の編纂に
着手しているかもしれませんけどね
- Title:
- コンピュータが人間の言葉を翻訳する仕組み ― イオアニス・パパチモナス
- Speaker:
- Ioannis Papachimonas
- Description:
-
万能翻訳機が現実の世界に登場する日は来るのでしょうか?単語であれ文であれ、あるいは本を丸ごとであれ、ある言語から別のどんな言語にでも翻訳できるとうたわれているプログラムはすでにたくさんあります。しかし実際のところ、話はもっと複雑です。イオアニス・パパチモナスが機械翻訳の仕組みを紹介し、そのような翻訳がなぜメチャクチャになりやすいか解説します。
講師:イオアニス・パパチモナス、アニメーション:NOWAY Video Club
*このビデオの教材 : http://ed.ted.com/lessons/how-computers-translate-human-language-ioannis-papachimonas - Video Language:
- English
- Team:
closed TED
- Project:
- TED-Ed
- Duration:
- 04:45
![]() |
Emi Kamiya approved Japanese subtitles for How computers translate human language | |
![]() |
Tomoyuki Suzuki accepted Japanese subtitles for How computers translate human language | |
![]() |
Tomoyuki Suzuki edited Japanese subtitles for How computers translate human language | |
![]() |
Tomoyuki Suzuki edited Japanese subtitles for How computers translate human language | |
![]() |
Tomoyuki Suzuki edited Japanese subtitles for How computers translate human language | |
![]() |
Emi Kamiya edited Japanese subtitles for How computers translate human language | |
![]() |
Emi Kamiya edited Japanese subtitles for How computers translate human language |