0:00:06.677,0:00:11.306 映画やテレビに出てくる宇宙人の多くが[br]苦もなく完璧な英語を話すのは 0:00:11.306,0:00:14.483 一体どういうわけなんでしょうか 0:00:14.483,0:00:17.886 端的に言えば[br]宇宙船の乗組員が何年もかけて 0:00:17.886,0:00:21.774 宇宙人語の辞書を編纂している姿なんて[br]誰も見たくないからです 0:00:21.774,0:00:23.392 しかし辻褄を合わせる意味で 0:00:23.392,0:00:26.789 スタートレックなどSF業界の製作者たちは 0:00:26.789,0:00:30.514 万能翻訳機というコンセプトを[br]世に送り出しました 0:00:30.514,0:00:35.012 どんな言語間の翻訳も即座にできる[br]携帯機器です 0:00:35.012,0:00:38.539 では現実の世界に万能翻訳機は[br]存在し得るのでしょうか 0:00:38.539,0:00:42.137 それが可能だと言い張る[br]プログラムはたくさんあります 0:00:42.137,0:00:45.954 単語でも文でも 本を丸ごと1冊でも 0:00:45.954,0:00:49.004 ある言語から[br]別の たいていの言語に翻訳でき 0:00:49.004,0:00:52.337 現代英語も古代サンスクリット語も[br]お手のものです 0:00:52.337,0:00:55.913 もし翻訳というものが[br]ただ単語を辞書で調べるだけのことなら 0:00:55.913,0:00:59.825 こうしたプログラムは[br]人間の力を越えていると言えるでしょう 0:00:59.825,0:01:03.299 しかし実際のところは もっと複雑です 0:01:03.299,0:01:07.349 規則に基づくタイプの翻訳プログラムは 0:01:07.349,0:01:10.302 辞書に載っているすべての単語や[br]その単語が取りうる― 0:01:10.302,0:01:13.283 文法的に正しいすべての形を含んだ[br]語彙のデータベースと 0:01:13.283,0:01:18.925 入力言語の基本的な言語的要素を[br]認識するための一連の規則を用います 0:01:18.925,0:01:22.396 「その子たちはマフィンを食べる」は[br]一見 単純そうな文ですが 0:01:22.396,0:01:27.050 プログラムは まず構文[br]つまり文法的な構造を解析します 0:01:27.050,0:01:29.587 「その子たち」が主語で 0:01:29.587,0:01:32.317 残りの部分は述語であり 0:01:32.317,0:01:34.368 その中には動詞の「食べる」と 0:01:34.368,0:01:37.422 直接目的語「マフィン」があることを[br]割り出します 0:01:37.422,0:01:40.249 続いて英語の形態論に沿って[br]識別する必要があります 0:01:40.249,0:01:44.681 意味を持つ最小単位にまで[br]言語を分解するのです 0:01:44.681,0:01:46.124 たとえば「マフィン」という語と 0:01:46.124,0:01:49.755 複数を示す接尾辞「s」とは[br]別々になります 0:01:49.755,0:01:52.449 最後に意味論の理解が必要です 0:01:52.449,0:01:56.178 文の各部分が実際にどういう意味か[br]判断するのです 0:01:56.178,0:01:58.074 この文を正しく翻訳するために 0:01:58.074,0:02:01.982 プログラムは[br]翻訳後の要素1つ1つに対して 0:02:01.982,0:02:05.166 その言語の語彙や規則を参照しますが 0:02:05.166,0:02:07.020 ここが微妙なところです 0:02:07.020,0:02:11.820 構文的に語順を自由に入れ替えてよい[br]言語もあれば 0:02:11.820,0:02:16.954 入れ替えると「マフィンが子どもを食べる」に[br]なってしまう言語もあります 0:02:16.954,0:02:19.647 形態論が問題になることもあります 0:02:19.647,0:02:23.243 スロベニア語では「2人の子ども」と[br]「3人以上の子ども」は区別され 0:02:23.243,0:02:27.097 他の多くの言語にはない双数形を示す[br]接尾辞を使います 0:02:27.097,0:02:30.532 ロシア語には定冠詞がないので[br]子どもたちが食べているのは 0:02:30.532,0:02:33.575 ある特定のマフィンなのか[br]一般的なマフィンなのか 0:02:33.575,0:02:36.719 戸惑ってしまうかもしれません 0:02:36.719,0:02:39.708 最後に プログラムは意味論に関して[br]間違いではなくても 0:02:39.708,0:02:42.757 細かいところを取りこぼす場合があります 0:02:42.757,0:02:45.809 たとえば子どもたちがマフィンを[br]「普通に食べる」か 0:02:45.809,0:02:47.794 「ガツガツむさぼる」か拾いきれません 0:02:47.794,0:02:51.558 また別の方法として[br]統計的機械翻訳というのがあります 0:02:51.558,0:02:55.762 すでに人間の手で翻訳されている[br]本や記事や文書の 0:02:55.762,0:02:59.488 データベースを分析する方法です 0:02:59.488,0:03:02.959 このプログラムでは[br]偶然には起こりにくいと考えられる― 0:03:02.959,0:03:05.393 原文と翻訳が一致する箇所を探すことで 0:03:05.393,0:03:09.345 対応する表現やパターンを特定しておき 0:03:09.345,0:03:12.429 それを後々 翻訳に利用します 0:03:12.429,0:03:14.969 しかし このタイプの翻訳の質は 0:03:14.969,0:03:17.690 初期のデータベースの規模や 0:03:17.690,0:03:21.357 目的の言語のサンプルや[br]文体のサンプルが 0:03:21.357,0:03:23.383 どれだけ使えるかに かかっています 0:03:23.383,0:03:27.140 コンピュータは例外や変則的な表現[br]ニュアンスの違いに苦労しますが 0:03:27.140,0:03:30.994 これは人間なら本能的にわかるものです 0:03:30.994,0:03:35.045 このため研究者の中には[br]私たちの言語理解を 0:03:35.045,0:03:39.251 人間の脳の生物学的構造が生む[br]特徴だと考える人もいます 0:03:39.251,0:03:43.101 事実 もっとも有名な架空の万能翻訳機は 0:03:43.101,0:03:46.439 『銀河ヒッチハイク・ガイド』に登場する[br]バベル魚ですが 0:03:46.439,0:03:49.726 あれは機械などではなく[br]小さな生き物で 0:03:49.726,0:03:54.210 知覚を持つ生物の脳波と神経信号を[br]テレパシーという形で 0:03:54.210,0:03:57.005 翻訳するというものでした 0:03:57.005,0:03:59.726 今のところは まだ[br]昔ながらの言語学習の方が 0:03:59.726,0:04:05.106 世の中の どのコンピュータプログラムより[br]良い結果を出しますが 0:04:05.106,0:04:06.749 言語学習は簡単ではありませんし 0:04:06.749,0:04:09.014 世界中には数多くの言語があり 0:04:09.014,0:04:12.989 それを話す人々の間で[br]交流が増えていることにも後押しされて 0:04:12.989,0:04:18.004 自動翻訳は今後[br]進歩していく一方でしょう 0:04:18.004,0:04:21.409 きっと私たちが[br]宇宙の生命体に出会う頃には 0:04:21.409,0:04:24.660 小型の装置を通じて[br]コミュニケーションが可能になっているでしょう 0:04:24.660,0:04:29.026 あるいは結局 例の辞書の編纂に[br]着手しているかもしれませんけどね