-
Google 翻訳は、短い文や文書だけでなく、 ウェブサイト全体でさえも瞬時に翻訳できる
-
無料ツールです。
-
仕組みはどうなっているのでしょうか。「部屋にたくさんの 翻訳者が集まって...」という場面を想像するかもしれませんが、
-
実際にはすべてコンピュータが翻訳しています。 Google 翻訳には、「統計的機械翻訳」という手法が
-
採用されています。簡単に言えば、大量の テキストの中から発見されたパターンに基づいて訳文
-
を生成する手法です。
-
基本から考えてみましょう。誰かに言語を一から 教える場合は、まず単語の意味を教え、次に文を
-
構成するためのルールとして文法を教えます。 コンピュータも同じ方法、つまり語彙と
-
文法を学習する方法で外国語を 習得できます。
-
しかし言語は非常に複雑です。外国語を学んだことの ある人なら、ほとんどすべての文法に
-
例外があることはご存じでしょう。こうした例外をもれなく、 例外の例外まですべてコンピュータに教え込もうとすると、
-
翻訳の品質が低下し始めます。
-
Google 翻訳のアプローチは違います。コンピュータに すべての文法を教え込むのではなく、
-
コンピュータ自体が文法を発見できるようにしました。 人間の翻訳者によって翻訳された大量の文書を、
-
コンピュータが解析して文法を発見するのです。 そのための翻訳済みテキストは、
-
世界中の書籍、国連などの組織、 ウェブサイトから集められました。
-
コンピュータは、このテキストをスキャンして、 統計的に有意なパターン、つまり原文と訳文の
-
間のパターンが偶発的でないものを探します。 コンピュータが見つけた翻訳パターンは、
-
今後同じような文を翻訳する際に 利用されます。この手順を何十億回と
-
繰り返すことで、膨大な数の翻訳パターンが 発見され、とても優秀なコンピュータ プログラムが
-
できあがります。
-
ただし、言語によっては利用できる翻訳済み文書が 少なく、ソフトウェアで検出された翻訳パターンが
-
あまり多くない場合もあります。そのため、 Google 翻訳の品質は、言語やその
-
組み合わせによって異なります。まだ常に完璧に 翻訳できるわけではありませんが、
-
随時新しい翻訳済みテキストを 追加していくことで、機械翻訳の精度は
-
上がります。
-
次に Google 翻訳で文やウェブページを 翻訳するときは、このような大量の文書とパターンから
-
一瞬で訳文が生成されるのだということを 思い出してみてください。
-
すごいと思いませんか?
-
translate.google.com でお試しください。