WEBVTT 00:00:00.420 --> 00:00:04.660 Переводчик Google – бесплатный инструмент для мгновенного перевода предложений, 00:00:04.660 --> 00:00:07.680 документов и целых веб-сайтов. 00:00:07.680 --> 00:00:12.099 Как же это работает? Может показаться, что у нас в подвале сидит батальон фей-полиглотов, но на самом деле 00:00:12.099 --> 00:00:17.470 все переводят компьютеры. Они используют технологию "статистического машинного перевода". Другими 00:00:17.470 --> 00:00:22.520 словами, компьютеры создают перевод из фрагментов, найденных среди огромного 00:00:22.520 --> 00:00:25.439 количества текстов. 00:00:25.439 --> 00:00:30.539 Но не будем забегать вперед. Приступая к изучению нового языка, можно начать с заучивания слов 00:00:30.539 --> 00:00:34.809 и правил грамматики, объясняющих принципы построения предложения. Компьютер может 00:00:34.809 --> 00:00:42.379 выучить иностранный язык похожим образом, усваивая словарный запас и правила. 00:00:42.379 --> 00:00:46.309 Но язык – сложная материя: любой, изучавший иностранные языки, подтвердит, что практически 00:00:46.309 --> 00:00:51.679 каждое правило имеет исключения. Если попытаться учесть в компьютерной программе все эти исключения, 00:00:51.679 --> 00:00:57.239 а также исключения из исключений, качество перевода начнет ухудшаться. 00:00:57.239 --> 00:01:01.779 Переводчик Google действует по-другому. Вместо того чтобы учить компьютеры всем правилам языка, мы 00:01:01.779 --> 00:01:07.060 позволяем им самостоятельно вырабатывать правила. Это происходит во время анализа миллиардов текстов, которые 00:01:07.060 --> 00:01:10.619 уже были переведены человеком. Мы берем эти тексты из книг и документов, принадлежащих 00:01:10.619 --> 00:01:19.950 таким организациям, как ООН, а также с веб-сайтов со всего света. 00:01:19.950 --> 00:01:23.810 Эти тексты сканируются в наших компьютерах с целью нахождения статистически значимых фрагментов: 00:01:23.810 --> 00:01:27.969 совпадений пар переводов и оригиналов, которые не могут быть случайными. Подобный фрагмент, 00:01:27.969 --> 00:01:33.829 найденный компьютером, может в дальнейшем использоваться для перевода аналогичных тестов. 00:01:33.829 --> 00:01:38.710 Если повторить эту процедуру много миллиардов раз, то получится база данных с миллиардами фрагментов 00:01:38.710 --> 00:01:43.700 и одна очень "умная" компьютерная программа. 00:01:43.700 --> 00:01:48.399 Однако для некоторых языков пока существует небольшое число переведенных текстов, поэтому для них наша 00:01:48.399 --> 00:01:53.049 программа обнаружила меньше фрагментов, чем для других языков. Вот почему качество наших переводов 00:01:53.049 --> 00:01:58.479 различно для разных языков и языковых пар. Мы знаем, что наши переводы не всегда совершенны, 00:01:58.479 --> 00:02:03.240 но продолжаем обрабатывать все новые и новые переведенные тексты. Это делает наши компьютеры умнее, 00:02:03.240 --> 00:02:05.539 а наши переводы – лучше. 00:02:05.539 --> 00:02:09.670 Поэтому, когда вы будете в очередной раз переводить предложение или веб-страницу в Переводчике 00:02:09.670 --> 00:02:15.349 Google, представьте себе миллионы документов и миллиарды фрагментов, которые были обработаны, для того чтобы 00:02:15.349 --> 00:02:17.650 за долю секунду осуществить ваш перевод. 00:02:17.650 --> 00:02:19.260 Здорово, правда? 00:02:19.260 --> 99:59:59.999 Проверьте, как это работает, на сайте translate.google.com.