Google 翻訳は、短い文や文書だけでなく、 ウェブサイト全体でさえも瞬時に翻訳できる 無料ツールです。 仕組みはどうなっているのでしょうか。「部屋にたくさんの 翻訳者が集まって...」という場面を想像するかもしれませんが、 実際にはすべてコンピュータが翻訳しています。 Google 翻訳には、「統計的機械翻訳」という手法が 採用されています。簡単に言えば、大量の テキストの中から発見されたパターンに基づいて訳文 を生成する手法です。 基本から考えてみましょう。誰かに言語を一から 教える場合は、まず単語の意味を教え、次に文を 構成するためのルールとして文法を教えます。 コンピュータも同じ方法、つまり語彙と 文法を学習する方法で外国語を 習得できます。 しかし言語は非常に複雑です。外国語を学んだことの ある人なら、ほとんどすべての文法に 例外があることはご存じでしょう。こうした例外をもれなく、 例外の例外まですべてコンピュータに教え込もうとすると、 翻訳の品質が低下し始めます。 Google 翻訳のアプローチは違います。コンピュータに すべての文法を教え込むのではなく、 コンピュータ自体が文法を発見できるようにしました。 人間の翻訳者によって翻訳された大量の文書を、 コンピュータが解析して文法を発見するのです。 そのための翻訳済みテキストは、 世界中の書籍、国連などの組織、 ウェブサイトから集められました。 コンピュータは、このテキストをスキャンして、 統計的に有意なパターン、つまり原文と訳文の 間のパターンが偶発的でないものを探します。 コンピュータが見つけた翻訳パターンは、 今後同じような文を翻訳する際に 利用されます。この手順を何十億回と 繰り返すことで、膨大な数の翻訳パターンが 発見され、とても優秀なコンピュータ プログラムが できあがります。 ただし、言語によっては利用できる翻訳済み文書が 少なく、ソフトウェアで検出された翻訳パターンが あまり多くない場合もあります。そのため、 Google 翻訳の品質は、言語やその 組み合わせによって異なります。まだ常に完璧に 翻訳できるわけではありませんが、 随時新しい翻訳済みテキストを 追加していくことで、機械翻訳の精度は 上がります。 次に Google 翻訳で文やウェブページを 翻訳するときは、このような大量の文書とパターンから 一瞬で訳文が生成されるのだということを 思い出してみてください。 すごいと思いませんか? translate.google.com でお試しください。