Переводчик Google – бесплатный инструмент для мгновенного перевода предложений,
документов и целых веб-сайтов.
Как же это работает? Может показаться, что у нас в подвале сидит батальон фей-полиглотов, но на самом деле
все переводят компьютеры. Они используют технологию "статистического машинного перевода". Другими
словами, компьютеры создают перевод из фрагментов, найденных среди огромного
количества текстов.
Но не будем забегать вперед. Приступая к изучению нового языка, можно начать с заучивания слов
и правил грамматики, объясняющих принципы построения предложения. Компьютер может
выучить иностранный язык похожим образом, усваивая словарный запас и правила.
Но язык – сложная материя: любой, изучавший иностранные языки, подтвердит, что практически
каждое правило имеет исключения. Если попытаться учесть в компьютерной программе все эти исключения,
а также исключения из исключений, качество перевода начнет ухудшаться.
Переводчик Google действует по-другому. Вместо того чтобы учить компьютеры всем правилам языка, мы
позволяем им самостоятельно вырабатывать правила. Это происходит во время анализа миллиардов текстов, которые
уже были переведены человеком. Мы берем эти тексты из книг и документов, принадлежащих
таким организациям, как ООН, а также с веб-сайтов со всего света.
Эти тексты сканируются в наших компьютерах с целью нахождения статистически значимых фрагментов:
совпадений пар переводов и оригиналов, которые не могут быть случайными. Подобный фрагмент,
найденный компьютером, может в дальнейшем использоваться для перевода аналогичных тестов.
Если повторить эту процедуру много миллиардов раз, то получится база данных с миллиардами фрагментов
и одна очень "умная" компьютерная программа.
Однако для некоторых языков пока существует небольшое число переведенных текстов, поэтому для них наша
программа обнаружила меньше фрагментов, чем для других языков. Вот почему качество наших переводов
различно для разных языков и языковых пар. Мы знаем, что наши переводы не всегда совершенны,
но продолжаем обрабатывать все новые и новые переведенные тексты. Это делает наши компьютеры умнее,
а наши переводы – лучше.
Поэтому, когда вы будете в очередной раз переводить предложение или веб-страницу в Переводчике
Google, представьте себе миллионы документов и миллиарды фрагментов, которые были обработаны, для того чтобы
за долю секунду осуществить ваш перевод.
Здорово, правда?
Проверьте, как это работает, на сайте translate.google.com.