[Script Info] Title: [Events] Format: Layer, Start, End, Style, Name, MarginL, MarginR, MarginV, Effect, Text Dialogue: 0,0:00:00.00,0:00:05.73,Default,,0000,0000,0000,,Google Wave: Обработка естественных языков. Dialogue: 0,0:00:05.73,0:00:08.23,Default,,0000,0000,0000,,Вайтлоу: Привет. Я Кэйси Вайтлоу. Dialogue: 0,0:00:08.23,0:00:09.23,Default,,0000,0000,0000,,Я технический руководитель Dialogue: 0,0:00:09.23,0:00:10.57,Default,,0000,0000,0000,,группы обработки естественных языков Dialogue: 0,0:00:10.57,0:00:12.50,Default,,0000,0000,0000,,здесь в Сиднее,\Nи сегодня я собираюсь немного Dialogue: 0,0:00:12.50,0:00:13.90,Default,,0000,0000,0000,,поговорить с вами Dialogue: 0,0:00:13.90,0:00:16.60,Default,,0000,0000,0000,,о тех крутых вещах,\Nкоторые мы внедрили в Google Wave. Dialogue: 0,0:00:16.60,0:00:18.83,Default,,0000,0000,0000,,Одна из главных целей, Dialogue: 0,0:00:18.83,0:00:21.83,Default,,0000,0000,0000,,преследуемых нами в Google Wave - \Nэто эффективность. Dialogue: 0,0:00:21.83,0:00:23.73,Default,,0000,0000,0000,,Мы хотим, чтобы пользователи \Nпродолжали эффективно работать Dialogue: 0,0:00:23.73,0:00:25.73,Default,,0000,0000,0000,,как при чтении,\Nтак и при наборе текста. Dialogue: 0,0:00:25.73,0:00:27.60,Default,,0000,0000,0000,,Один из способов, \Nкоторый мы разработали для этой цели Dialogue: 0,0:00:27.60,0:00:29.27,Default,,0000,0000,0000,,- это наша\Nсистема проверки орфографии. Dialogue: 0,0:00:29.27,0:00:32.23,Default,,0000,0000,0000,,Мы бы хотели, чтобы\Nпользователи могли Dialogue: 0,0:00:32.23,0:00:34.53,Default,,0000,0000,0000,,сосредоточиться на том, что они пишут\Nи не беспокоиться Dialogue: 0,0:00:34.53,0:00:36.80,Default,,0000,0000,0000,,опечатались они где-нибудь, \Nили нет. Dialogue: 0,0:00:36.80,0:00:39.00,Default,,0000,0000,0000,,Мы считаем, что если люди \Nмогли бы чуть-чуть расслабиться Dialogue: 0,0:00:39.00,0:00:41.10,Default,,0000,0000,0000,,или просто печатать на 5% быстрее, Dialogue: 0,0:00:41.10,0:00:43.40,Default,,0000,0000,0000,,то они бы тратили \Nна 5% меньше времени на набор текста. Dialogue: 0,0:00:43.40,0:00:45.73,Default,,0000,0000,0000,,Итак, я приведу пример. Dialogue: 0,0:00:45.73,0:00:47.80,Default,,0000,0000,0000,,Это, наверное, \Nсамый легкий способ для объяснения. Dialogue: 0,0:00:47.80,0:00:51.13,Default,,0000,0000,0000,,Представим, что Вы хотите встретиться\Nс кем-то из друзей. Dialogue: 0,0:00:51.13,0:00:52.30,Default,,0000,0000,0000,,Вы договариваетесь о встрече. Dialogue: 0,0:00:52.30,0:00:54.53,Default,,0000,0000,0000,,И пишете... Dialogue: 0,0:00:54.53,0:00:56.47,Default,,0000,0000,0000,,[пишет]\NLet's [Давай] Dialogue: 0,0:00:56.47,0:00:58.43,Default,,0000,0000,0000,,met [встретились]... Dialogue: 0,0:00:58.43,0:01:00.07,Default,,0000,0000,0000,,упс... Dialogue: 0,0:01:00.07,0:01:03.77,Default,,0000,0000,0000,,tomorrow [завтра]. Dialogue: 0,0:01:03.77,0:01:05.57,Default,,0000,0000,0000,,Вы видите, что\Nя допустил ошибку Dialogue: 0,0:01:05.57,0:01:07.52,Default,,0000,0000,0000,,Я тут написал "met" [встретились],\Nвместо "meet" [встретимся]. Dialogue: 0,0:01:07.52,0:01:09.50,Default,,0000,0000,0000,,Мой палец пропустил букву "e". Dialogue: 0,0:01:09.50,0:01:13.53,Default,,0000,0000,0000,,Мы реализовали проверку орфографии Dialogue: 0,0:01:13.53,0:01:16.97,Default,,0000,0000,0000,,путем создания автоматизированного \Nучастника и назвали его Спелли. Dialogue: 0,0:01:16.97,0:01:19.77,Default,,0000,0000,0000,,Он работает прямо как\Nещё один пользователь, Dialogue: 0,0:01:19.77,0:01:21.77,Default,,0000,0000,0000,,который участвует \Nв волне наравне с вами Dialogue: 0,0:01:21.77,0:01:24.33,Default,,0000,0000,0000,,Итак, Спелли на волне\Nс вами, Dialogue: 0,0:01:24.33,0:01:29.27,Default,,0000,0000,0000,,и он может увидеть, что вы\Nнаписали "Let's met tomorrow" \N[Давай встретились завтра] Dialogue: 0,0:01:29.27,0:01:31.37,Default,,0000,0000,0000,,и попробует проверить\Nправильность написанного. Dialogue: 0,0:01:31.37,0:01:32.90,Default,,0000,0000,0000,,По каждому слову... Dialogue: 0,0:01:32.90,0:01:35.53,Default,,0000,0000,0000,,У него нет никаких \Nсловарей, Dialogue: 0,0:01:35.53,0:01:39.53,Default,,0000,0000,0000,,так что он не может знать, \Nправильное ли слово "met" [встретились] Dialogue: 0,0:01:39.53,0:01:40.83,Default,,0000,0000,0000,,или ошибка. Dialogue: 0,0:01:40.83,0:01:43.10,Default,,0000,0000,0000,,Для начала он \Nпредлагает список Dialogue: 0,0:01:43.10,0:01:46.63,Default,,0000,0000,0000,,возможных кандидатов\Nдля исправления этого слова. Dialogue: 0,0:01:46.63,0:01:50.37,Default,,0000,0000,0000,,Например, это могут быть Dialogue: 0,0:01:50.37,0:01:53.40,Default,,0000,0000,0000,,"meat" [мясо], т.е. еда... Dialogue: 0,0:01:53.40,0:01:56.87,Default,,0000,0000,0000,,или "meet" [встретимся], правильный\Nвариант в нашем случае. Dialogue: 0,0:01:56.87,0:01:59.37,Default,,0000,0000,0000,,Вы можете придумать ещё\Nмножество подобных вариантов. Dialogue: 0,0:01:59.37,0:02:02.20,Default,,0000,0000,0000,,Например "set" [установим], \Nили "net" [сеть], \Nили "me" [мне] — Dialogue: 0,0:02:02.20,0:02:05.37,Default,,0000,0000,0000,,все варианты слов, \Nкакие мы могли бы рассматривать, Dialogue: 0,0:02:05.37,0:02:09.20,Default,,0000,0000,0000,,чтоб понять, что же вы \Nна самом деле хотели написать. Dialogue: 0,0:02:09.20,0:02:12.73,Default,,0000,0000,0000,,Мы научились у Интернета, Dialogue: 0,0:02:12.73,0:02:14.93,Default,,0000,0000,0000,,какого рода опечатки \Nдопускают люди, Dialogue: 0,0:02:14.93,0:02:17.20,Default,,0000,0000,0000,,и какие варианты более\Nили менее подходят. Dialogue: 0,0:02:17.20,0:02:18.83,Default,,0000,0000,0000,,Итак мы понимаем, что,\Nк примеру, Dialogue: 0,0:02:18.83,0:02:20.63,Default,,0000,0000,0000,,случайная вставка буквы "a" Dialogue: 0,0:02:20.63,0:02:22.30,Default,,0000,0000,0000,,вполне вероятна, Dialogue: 0,0:02:22.30,0:02:25.43,Default,,0000,0000,0000,,а пропуск самой первой буквы слова Dialogue: 0,0:02:25.43,0:02:28.47,Default,,0000,0000,0000,,менее вероятен\Nв данном случае. Dialogue: 0,0:02:28.47,0:02:32.67,Default,,0000,0000,0000,,Итак, у нас есть некие предположения,\Nи далее мы собираемся Dialogue: 0,0:02:32.67,0:02:34.67,Default,,0000,0000,0000,,оценить наши предположения\Nв контексте. Dialogue: 0,0:02:34.67,0:02:38.07,Default,,0000,0000,0000,,Некоторые сервисы Google уже используют Dialogue: 0,0:02:38.07,0:02:40.43,Default,,0000,0000,0000,,подобную статистическую\Nязыковую модель, Dialogue: 0,0:02:40.43,0:02:42.47,Default,,0000,0000,0000,,например, Google Переводчик, Dialogue: 0,0:02:42.47,0:02:44.37,Default,,0000,0000,0000,,который обрабатывает информацию Dialogue: 0,0:02:44.37,0:02:46.13,Default,,0000,0000,0000,,о том, как используется язык. Dialogue: 0,0:02:46.13,0:02:47.97,Default,,0000,0000,0000,,Данные системы обучались Интернетом, Dialogue: 0,0:02:47.97,0:02:49.73,Default,,0000,0000,0000,,прорабатывая миллиарды веб-страниц, Dialogue: 0,0:02:49.73,0:02:51.22,Default,,0000,0000,0000,,и дали нам по-настоящему хорошее представление Dialogue: 0,0:02:51.22,0:02:53.73,Default,,0000,0000,0000,,о том, как же на самом деле\Nобщаются люди. Dialogue: 0,0:02:53.73,0:02:55.43,Default,,0000,0000,0000,,Далее мы бы оценивали Dialogue: 0,0:02:55.43,0:02:58.83,Default,,0000,0000,0000,,вероятность правильности предложений\Nтипа "Давай встретились завтра" Dialogue: 0,0:02:58.83,0:03:02.07,Default,,0000,0000,0000,,и "Давай мясо завтра" - они менее вероятны, Dialogue: 0,0:03:02.07,0:03:03.77,Default,,0000,0000,0000,,и "Давай встретимся завтра" Dialogue: 0,0:03:03.77,0:03:06.27,Default,,0000,0000,0000,,которое больше похоже на правду, \Nнежели предыдущие. Dialogue: 0,0:03:06.27,0:03:08.30,Default,,0000,0000,0000,,Для этого мы совмещаем статистическую модель\Nс нашей моделью ошибок, Dialogue: 0,0:03:08.30,0:03:10.20,Default,,0000,0000,0000,,которая высчитает вероятность каждой \Nопечатки, Dialogue: 0,0:03:10.20,0:03:13.83,Default,,0000,0000,0000,,не учитывая контекст, для финального определения Dialogue: 0,0:03:13.83,0:03:15.90,Default,,0000,0000,0000,,тех слов, Dialogue: 0,0:03:15.90,0:03:19.20,Default,,0000,0000,0000,,которые вы могли подразумевать при написании. Dialogue: 0,0:03:19.20,0:03:22.00,Default,,0000,0000,0000,,Так, в данном случае мы бы предложили \N"встретимся" [meet]. Dialogue: 0,0:03:22.00,0:03:25.47,Default,,0000,0000,0000,,Как только мы поняли, что в слове ошибка, Dialogue: 0,0:03:25.47,0:03:29.10,Default,,0000,0000,0000,,мы должны отобразить \Nэту информацию в Google Wave-клиенте, Dialogue: 0,0:03:29.10,0:03:31.67,Default,,0000,0000,0000,,чтобы пользователь мог увидеть ее Dialogue: 0,0:03:31.67,0:03:34.70,Default,,0000,0000,0000,,и исправить ее вручную, либо же автоматически. Dialogue: 0,0:03:34.70,0:03:36.07,Default,,0000,0000,0000,,Наша система проверки орфографии Dialogue: 0,0:03:36.07,0:03:38.83,Default,,0000,0000,0000,,несколько отличается от существующих систем. Dialogue: 0,0:03:38.83,0:03:42.00,Default,,0000,0000,0000,,Одно из отличий в том, \Nчто система работает на сервере. Dialogue: 0,0:03:42.00,0:03:44.10,Default,,0000,0000,0000,,А это значит, что качество проверки Dialogue: 0,0:03:44.10,0:03:46.03,Default,,0000,0000,0000,,орфографии не зависит Dialogue: 0,0:03:46.03,0:03:49.43,Default,,0000,0000,0000,,от того, с какого устройства Вы работаете. Dialogue: 0,0:03:49.43,0:03:52.77,Default,,0000,0000,0000,,Так что независимо от того, используете ли Вы\Nстационарный компьютер Dialogue: 0,0:03:52.77,0:03:56.00,Default,,0000,0000,0000,,или же ноутбук - вы получите такую же \Nкачественную проверку орфографии. Dialogue: 0,0:03:56.00,0:03:57.90,Default,,0000,0000,0000,,Это же справедливо и в языковом плане, Dialogue: 0,0:03:57.90,0:03:59.47,Default,,0000,0000,0000,,то есть мы реализовали это Dialogue: 0,0:03:59.47,0:04:01.27,Default,,0000,0000,0000,,и для других алфавитных языков. Dialogue: 0,0:04:01.27,0:04:06.67,Default,,0000,0000,0000,,Как я говорил, мы используем огромные \Nстатистические языковые модели. Dialogue: 0,0:04:06.67,0:04:07.80,Default,,0000,0000,0000,,Под огромными я подразумеваю Dialogue: 0,0:04:07.80,0:04:09.80,Default,,0000,0000,0000,,модели с миллиардами слов. Dialogue: 0,0:04:09.80,0:04:12.03,Default,,0000,0000,0000,,Которые вылились в много-много гигабайт данных. Dialogue: 0,0:04:12.03,0:04:15.50,Default,,0000,0000,0000,,Их невозможно запустить на одной машине, Dialogue: 0,0:04:15.50,0:04:17.60,Default,,0000,0000,0000,,но это совсем не проблематично в датацентре, Dialogue: 0,0:04:17.60,0:04:19.23,Default,,0000,0000,0000,,где множество машин работают Dialogue: 0,0:04:19.23,0:04:22.20,Default,,0000,0000,0000,,над языковой и орфографической моделью вместе. Dialogue: 0,0:04:22.20,0:04:27.17,Default,,0000,0000,0000,,Более того, мы можем сделать эту орфографическую\Nсистему Dialogue: 0,0:04:27.17,0:04:28.73,Default,,0000,0000,0000,,доступной всем пользователям, Dialogue: 0,0:04:28.73,0:04:30.77,Default,,0000,0000,0000,,поэтому стоимость в расчете на пользователя\Nочень незначительна. Dialogue: 0,0:04:30.77,0:04:33.53,Default,,0000,0000,0000,,Поэтому для нас это очень выгодно. Dialogue: 0,0:04:33.53,0:04:35.67,Default,,0000,0000,0000,,После того, как приходит осознание, что\Nу вас есть система, Dialogue: 0,0:04:35.67,0:04:37.80,Default,,0000,0000,0000,,которая поддерживает совместное одновременное \Nредактирование, Dialogue: 0,0:04:37.80,0:04:39.50,Default,,0000,0000,0000,,которая обладает структурированной моделью\Nданных, Dialogue: 0,0:04:39.50,0:04:42.67,Default,,0000,0000,0000,,и что вы можете менять\Nпользовательский интерфейс, Dialogue: 0,0:04:42.67,0:04:45.17,Default,,0000,0000,0000,,приглашая удаленных участников, Dialogue: 0,0:04:45.17,0:04:47.20,Default,,0000,0000,0000,,тогда действительно понимаешь, что \Nнет предела совершенству. Dialogue: 0,0:04:47.20,0:04:49.43,Default,,0000,0000,0000,,Я имею ввиду,\Nчто мы можем применять Dialogue: 0,0:04:49.43,0:04:51.37,Default,,0000,0000,0000,,все существующие технологии обработки\Nестественных языков, Dialogue: 0,0:04:51.40,0:04:53.10,Default,,0000,0000,0000,,типа проверки орфографии\Nили перевода Dialogue: 0,0:04:53.10,0:04:55.67,Default,,0000,0000,0000,,и продолжаем искать\Nновые приложения, Dialogue: 0,0:04:55.67,0:04:57.67,Default,,0000,0000,0000,,так как наши способы и методы\Nобщения постоянно меняются. Dialogue: 0,0:04:57.67,0:05:00.87,Default,,0000,0000,0000,,Я считаю, нас ждут\Nпо-настоящему удивительные времена.