WEBVTT 00:00:00.420 --> 00:00:04.660 Google 翻訳は、短い文や文書だけでなく、 ウェブサイト全体でさえも瞬時に翻訳できる 00:00:04.660 --> 00:00:07.680 無料ツールです。 00:00:07.680 --> 00:00:12.099 仕組みはどうなっているのでしょうか。「部屋にたくさんの 翻訳者が集まって...」という場面を想像するかもしれませんが、 00:00:12.099 --> 00:00:17.470 実際にはすべてコンピュータが翻訳しています。 Google 翻訳には、「統計的機械翻訳」という手法が 00:00:17.470 --> 00:00:22.520 採用されています。簡単に言えば、大量の テキストの中から発見されたパターンに基づいて訳文 00:00:22.520 --> 00:00:25.439 を生成する手法です。 00:00:25.439 --> 00:00:30.539 基本から考えてみましょう。誰かに言語を一から 教える場合は、まず単語の意味を教え、次に文を 00:00:30.539 --> 00:00:34.809 構成するためのルールとして文法を教えます。 コンピュータも同じ方法、つまり語彙と 00:00:34.809 --> 00:00:42.379 文法を学習する方法で外国語を 習得できます。 00:00:42.379 --> 00:00:46.309 しかし言語は非常に複雑です。外国語を学んだことの ある人なら、ほとんどすべての文法に 00:00:46.309 --> 00:00:51.679 例外があることはご存じでしょう。こうした例外をもれなく、 例外の例外まですべてコンピュータに教え込もうとすると、 00:00:51.679 --> 00:00:57.239 翻訳の品質が低下し始めます。 00:00:57.239 --> 00:01:01.779 Google 翻訳のアプローチは違います。コンピュータに すべての文法を教え込むのではなく、 00:01:01.779 --> 00:01:07.060 コンピュータ自体が文法を発見できるようにしました。 人間の翻訳者によって翻訳された大量の文書を、 00:01:07.060 --> 00:01:10.619 コンピュータが解析して文法を発見するのです。 そのための翻訳済みテキストは、 00:01:10.619 --> 00:01:19.950 世界中の書籍、国連などの組織、 ウェブサイトから集められました。 00:01:19.950 --> 00:01:23.810 コンピュータは、このテキストをスキャンして、 統計的に有意なパターン、つまり原文と訳文の 00:01:23.810 --> 00:01:27.969 間のパターンが偶発的でないものを探します。 コンピュータが見つけた翻訳パターンは、 00:01:27.969 --> 00:01:33.829 今後同じような文を翻訳する際に 利用されます。この手順を何十億回と 00:01:33.829 --> 00:01:38.710 繰り返すことで、膨大な数の翻訳パターンが 発見され、とても優秀なコンピュータ プログラムが 00:01:38.710 --> 00:01:43.700 できあがります。 00:01:43.700 --> 00:01:48.399 ただし、言語によっては利用できる翻訳済み文書が 少なく、ソフトウェアで検出された翻訳パターンが 00:01:48.399 --> 00:01:53.049 あまり多くない場合もあります。そのため、 Google 翻訳の品質は、言語やその 00:01:53.049 --> 00:01:58.479 組み合わせによって異なります。まだ常に完璧に 翻訳できるわけではありませんが、 00:01:58.479 --> 00:02:03.240 随時新しい翻訳済みテキストを 追加していくことで、機械翻訳の精度は 00:02:03.240 --> 00:02:05.539 上がります。 00:02:05.539 --> 00:02:09.670 次に Google 翻訳で文やウェブページを 翻訳するときは、このような大量の文書とパターンから 00:02:09.670 --> 00:02:17.650 一瞬で訳文が生成されるのだということを 思い出してみてください。 00:02:17.650 --> 00:02:19.260 すごいと思いませんか? 00:02:19.260 --> 99:59:59.999 translate.google.com でお試しください。