0:00:05.970,0:00:12.100 Привет, меня зовут Джон. Я руковожу командой поиска[br]и машинного обучения в Google 0:00:12.100,0:00:16.363 Меня очень вдохновляет то, что люди по всему миру 0:00:16.363,0:00:19.758 обращаются к поисковым машинам, чтобы найти ответы[br]на тривиальные вопросы 0:00:19.758,0:00:21.704 и на очень важные вопросы. 0:00:21.704,0:00:24.972 Это большая ответственность - предоставить как можно[br]лучшие ответы. 0:00:26.725,0:00:31.218 Привет, меня зовут Акшая. Я работаю в команде поиска[br]в Bing. 0:00:31.499,0:00:35.860 Иногда, когда мы рассматриваем проблемы искусственного[br]интеллекта и машинного обучения, 0:00:35.885,0:00:39.185 нам также нужно выяснить, как это будут[br]использовать, 0:00:39.185,0:00:42.257 потому что в действительности мы хотим внести свой[br]вклад в общество. 0:00:43.267,0:00:45.833 Зададим простой вопрос: 0:00:45.833,0:00:49.406 Сколько времени занимает путешествие к Марсу? 0:00:49.406,0:00:51.507 Откуда берутся эти результаты? 0:00:51.507,0:00:55.895 И почему эти ответы выведены в начале? 0:00:55.895,0:01:00.234 ОК, давайте посмотрим, как поисковая машина превращает[br]Ваш запрос на результаты. 0:01:00.234,0:01:06.213 Первое, что нужно знать - когда Вы задаете поиск,[br]поисковая машина не уходит в Интернет 0:01:06.213,0:01:09.029 чтобы поискать информацию на сайтах в режиме реального[br]времени. 0:01:09.029,0:01:14.978 Потому что сейчас существуют миллиарды сайтов, и[br]ежеминутно создаются сотни новых. 0:01:14.978,0:01:18.670 Поэтому если бы поисковой машине пришлось пересматривать[br]каждый из них при каждом запросе 0:01:18.670,0:01:20.689 это бы занимало вечность. 0:01:20.689,0:01:25.767 Поэтому для ускорения поиска, поисковые машины[br]постоянно сканируют Интернет заранее 0:01:25.767,0:01:28.984 И записывают информацию, которая может позже помочь[br]Вашему запросу. 0:01:28.984,0:01:32.721 Так, если Вы будете искать завтрашнюю путешествие,[br]поисковая машина 0:01:32.721,0:01:36.597 уже имеет нужную информацию, чтобы выдать ее[br]сразу. 0:01:36.988,0:01:39.046 Вот как это работает. 0:01:39.234,0:01:41.980 Интернет - это сеть страниц, связанных между собой[br]гиперссылками. 0:01:41.980,0:01:46.301 Поисковые машины должны постоянно запущены программы,[br]которые называются пауками. 0:01:46.795,0:01:50.724 Они перемещаются между страницами и собирают информацию[br]о них. 0:01:50.724,0:01:55.519 Найдя гиперссылки паук переходит по нему, пока не[br]пересмотрит все страницы, 0:01:55.519,0:01:59.382 которые сможет найти во всем Интернете. Для каждой[br]посещенной страницы 0:01:59.382,0:02:03.805 паук записывает всю информацию, которая может[br]понадобиться для поиска, в специальную 0:02:03.805,0:02:06.316 базу данных, которая называется поисковым[br]индексом. 0:02:06.316,0:02:11.807 Вернемся к предыдущему запросу, и посмотрим, как[br]поисковая машина 0:02:11.807,0:02:13.417 получает результаты. 0:02:13.417,0:02:17.286 Когда Вы спросили Сколько времени занимает путешествие[br]к Марсу? 0:02:17.286,0:02:21.075 поисковая машина ищет каждое из этих слов в поисковом[br]индексе и сразу 0:02:21.075,0:02:25.432 имеет список всех страниц в Интернете, которые[br]содержат эти слова. 0:02:25.432,0:02:31.437 Но простое совпадение возвращает миллионы страниц,[br]нужно еще найти наилучшее соответствие 0:02:31.437,0:02:33.576 и показать ее в начале. 0:02:33.576,0:02:39.344 Здесь все становится сложнее, потому что поисковая[br]машина время должен угадать, что именно Вы ищете. 0:02:39.344,0:02:43.560 Каждая поисковая машина имеет собственный алгоритм[br]для построения рейтинга страниц, основываясь 0:02:43.560,0:02:45.343 на предположении о том, что Вам нужно. 0:02:45.343,0:02:50.997 Например, алгоритм может проверять, поисковые слова[br]содержатся в заголовке страницы, 0:02:50.997,0:02:58.902 или эти слова размещены рядом, или любые другие[br]расчеты, которые помогут лучше 0:02:58.902,0:03:03.089 определить, какие страницы Вы бы хотели увидеть, а[br]какие - нет. 0:03:03.089,0:03:07.944 Google изобрел самый известный алгоритм показа[br]наиболее подходящих результатов поиска. 0:03:07.944,0:03:12.166 Он учитывает, сколько других веб-страниц содержат[br]ссылку на эту страницу. 0:03:12.166,0:03:15.783 Идея заключается в том, что если многие другие сайты[br]считает, что эта страница является интересной, 0:03:15.783,0:03:18.399 то возможно Вам она тоже подойдет. 0:03:18.399,0:03:22.579 Этот алгоритм называется Page Rank. Но не потому,[br]что он строит рейтинг страниц, 0:03:22.579,0:03:28.007 а потому, что он назван в честь его автора и[br]соучредителя Google - Ларри Пейджа. 0:03:28.007,0:03:31.471 Поскольку сайты могут зарабатывать деньги за посещение[br]пользователями, спамеры 0:03:31.471,0:03:35.819 пытаются найти все лучшие способы обыграть поисковые[br]алгоритмы, чтобы их 0:03:35.819,0:03:38.521 страницы показывались выше в результатах. 0:03:38.521,0:03:42.163 Поисковые машины регулярно обновляют свои алгоритмы,[br]чтобы не дать фейковых 0:03:42.163,0:03:44.767 и ненадежным сайтам добраться до вершины результатов[br]поиска. 0:03:44.767,0:03:50.164 Но в конце концов, Вы сами должны учитывать, насколько[br]сайт является надежным, проверяя 0:03:50.164,0:03:54.014 его адрес и убеждаясь, что это надежный источник. 0:03:54.014,0:03:56.548 Поисковые программы постоянно совершенствуются,[br]чтобы улучшить алгоритмы и давать 0:03:56.548,0:04:01.231 лучшие результаты, и быстрее, чем конкуренты. 0:04:01.231,0:04:04.943 Современные поисковые машины даже используют[br]информацию, которую Вы явно не давали, чтобы 0:04:04.943,0:04:07.463 сузить результаты поиска. 0:04:07.463,0:04:10.897 Например, если Вы будете искать "площадки для выгула[br]собак" 0:04:10.897,0:04:14.155 много поисковых машин выдаст результаты по площадок[br]неподалеку 0:04:14.155,0:04:18.233 даже если Вы не указали свое местоположение. 0:04:18.233,0:04:22.481 Современные поисковые машины понимают больше, чем[br]просто слова на страницах. 0:04:22.481,0:04:27.348 Но и их значение, чтобы показать именно то, что Вы[br]ищете. 0:04:27.348,0:04:31.756 Например, если Вы ищете "найшдвиший питчер" 0:04:31.756,0:04:34.590 Вы получите информацию о спортсмене. 0:04:34.680,0:04:37.840 Если же Вы ищете "самый питчер", то получите информацию[br]о кувшин. 0:04:39.474,0:04:42.435 Чтобы лучше понимать слова, мы используем так[br]называемое машинное обучение. 0:04:42.435,0:04:44.539 Это вид искусственного интеллекта, который помогает[br]поисковым алгоритмам не только находить 0:04:47.257,0:04:50.993 отдельные слова или фразы на страницах, но и понимать[br]значение этих слов. 0:04:50.993,0:04:57.432 Интернет экспоненциально растет, но если команды,[br]которые соответствуют 0:04:57.432,0:05:00.234 за разработку поисковых машин, хорошо выполнять свою[br]работу, 0:05:00.234,0:05:04.306 то информация, которая Вам нужна, всегда будет[br]доступна за несколько кликов.