0:00:00.420,0:00:04.660 Google 翻訳は、短い文や文書だけでなく、 ウェブサイト全体でさえも瞬時に翻訳できる 0:00:04.660,0:00:07.680 無料ツールです。 0:00:07.680,0:00:12.099 仕組みはどうなっているのでしょうか。「部屋にたくさんの 翻訳者が集まって...」という場面を想像するかもしれませんが、 0:00:12.099,0:00:17.470 実際にはすべてコンピュータが翻訳しています。 Google 翻訳には、「統計的機械翻訳」という手法が 0:00:17.470,0:00:22.520 採用されています。簡単に言えば、大量の テキストの中から発見されたパターンに基づいて訳文 0:00:22.520,0:00:25.439 を生成する手法です。 0:00:25.439,0:00:30.539 基本から考えてみましょう。誰かに言語を一から 教える場合は、まず単語の意味を教え、次に文を 0:00:30.539,0:00:34.809 構成するためのルールとして文法を教えます。 コンピュータも同じ方法、つまり語彙と 0:00:34.809,0:00:42.379 文法を学習する方法で外国語を 習得できます。 0:00:42.379,0:00:46.309 しかし言語は非常に複雑です。外国語を学んだことの ある人なら、ほとんどすべての文法に 0:00:46.309,0:00:51.679 例外があることはご存じでしょう。こうした例外をもれなく、 例外の例外まですべてコンピュータに教え込もうとすると、 0:00:51.679,0:00:57.239 翻訳の品質が低下し始めます。 0:00:57.239,0:01:01.779 Google 翻訳のアプローチは違います。コンピュータに すべての文法を教え込むのではなく、 0:01:01.779,0:01:07.060 コンピュータ自体が文法を発見できるようにしました。 人間の翻訳者によって翻訳された大量の文書を、 0:01:07.060,0:01:10.619 コンピュータが解析して文法を発見するのです。 そのための翻訳済みテキストは、 0:01:10.619,0:01:19.950 世界中の書籍、国連などの組織、 ウェブサイトから集められました。 0:01:19.950,0:01:23.810 コンピュータは、このテキストをスキャンして、 統計的に有意なパターン、つまり原文と訳文の 0:01:23.810,0:01:27.969 間のパターンが偶発的でないものを探します。 コンピュータが見つけた翻訳パターンは、 0:01:27.969,0:01:33.829 今後同じような文を翻訳する際に 利用されます。この手順を何十億回と 0:01:33.829,0:01:38.710 繰り返すことで、膨大な数の翻訳パターンが 発見され、とても優秀なコンピュータ プログラムが 0:01:38.710,0:01:43.700 できあがります。 0:01:43.700,0:01:48.399 ただし、言語によっては利用できる翻訳済み文書が 少なく、ソフトウェアで検出された翻訳パターンが 0:01:48.399,0:01:53.049 あまり多くない場合もあります。そのため、 Google 翻訳の品質は、言語やその 0:01:53.049,0:01:58.479 組み合わせによって異なります。まだ常に完璧に 翻訳できるわけではありませんが、 0:01:58.479,0:02:03.240 随時新しい翻訳済みテキストを 追加していくことで、機械翻訳の精度は 0:02:03.240,0:02:05.539 上がります。 0:02:05.539,0:02:09.670 次に Google 翻訳で文やウェブページを 翻訳するときは、このような大量の文書とパターンから 0:02:09.670,0:02:17.650 一瞬で訳文が生成されるのだということを 思い出してみてください。 0:02:17.650,0:02:19.260 すごいと思いませんか? 0:02:19.260,9:59:59.000 translate.google.com でお試しください。