ИНТЕРНЕТ КАК РАБОТАЕТ ПОИСК Привет, меня зовут Джон. Я руковожу командой поиска и машинного обучения в Google Меня очень вдохновляет то, что люди по всему миру обращаются к поисковым машинам, чтобы получить ответы на тривиальные и на очень важные вопросы. Это большая ответственность — дать им лучшие ответы. Привет, меня зовут Акшая. Я работаю в команде поиска в Bing. Мы часто используем искусственный интеллект и машинное обучение. Нам также нужно выяснить, как это будут использовать пользователи, потому что мы хотим внести свой вклад в общество. Зададим простой вопрос: Сколько времени займет путешествие к Марсу? Откуда берутся эти результаты? И почему эти ответы выведены в начале? Давайте посмотрим, как поисковая машина превращает ваш запрос в результат. Первое, что нужно знать — когда вы задаете вопрос, поисковый движок не уходит в Интернет чтобы искать информацию на сайтах в режиме реального времени. Сейчас существуют миллиарды сайтов, и ежеминутно создаются сотни новых. Если бы поисковой машине пришлось пересматривать каждый из них при каждом запросе это занимало бы вечность. Поэтому для ускорения поиска поисковые движки постоянно сканируют интернет заранее и записывают информацию, которая может позже помочь ответить на ваш вопрос. Так, если вы ищете информацию о путешествии на Марс, поисковый движок уже имеет нужную информацию, чтобы дать вам ответ. Вот как это работает. Интернет — это сеть страниц, связанных между собой гиперссылками. Поисковые движки постоянно запускают программы, которые называются пауками. Они перемещаются по страницам и собирают информацию о них. Найдя гиперссылки, паук переходит по ним, пока не просмотрит все страницы, которые сможет найти во всем интернете. О каждой посещенной странице паук записывает всю информацию, которая может понадобиться для поиска, в специальную базу данных, которая называется поисковым индексом. Вернемся к предыдущему запросу, и посмотрим, как поисковый движок получает результаты. Когда вы спросили, сколько времени занимает путешествие к Марсу, поисковая машина ищет каждое из этих слов в поисковом индексе и сразу получает список всех страниц в Интернете, которые содержат эти слова. Но простое совпадение возвращает миллионы страниц, поэтому поисковому движку нужно найти лучшее соответствие и показать его в начале. Здесь все становится сложнее, потому что поисковый движок должен угадать, что именно вы ищете. Каждый поисковый движок имеет собственный алгоритм для построения рейтинга страниц, основываясь на предположении о том, что вам нужно. Например, алгоритм может проверять, поисковые слова содержатся в заголовке страницы, или эти слова размещены рядом, или любые другие расчеты, которые помогут лучше определить, какие страницы Вы бы хотели увидеть, а какие - нет. Google изобрел самый известный алгоритм показа наиболее подходящих результатов поиска. Он учитывает, сколько других веб-страниц содержат ссылку на эту страницу. Идея заключается в том, что если многие другие сайты считает, что эта страница является интересной, то возможно Вам она тоже подойдет. Этот алгоритм называется Page Rank. Но не потому, что он строит рейтинг страниц, а потому, что он назван в честь его автора и соучредителя Google - Ларри Пейджа. Поскольку сайты могут зарабатывать деньги за посещение пользователями, спамеры пытаются найти все лучшие способы обыграть поисковые алгоритмы, чтобы их страницы показывались выше в результатах. Поисковые машины регулярно обновляют алгоритмы, чтобы не дать фейковым и ненадежным сайтам добраться до вершины результатов поиска. Но в конце концов, Вы сами должны учитывать, насколько сайт является надежным, проверяя его адрес и убеждаясь, что это надежный источник. Поисковые программы постоянно совершенствуются, чтобы улучшить алгоритмы и давать лучшие результаты, и быстрее, чем конкуренты. Современные поисковые машины даже используют информацию, которую Вы явно не давали, чтобы сузить результаты поиска. Например, если Вы будете искать "площадки для выгула собак" много поисковых машин выдаст результаты по площадок неподалеку даже если Вы не указали свое местоположение. Современные поисковые машины понимают больше, чем просто слова на страницах. Но и их значение, чтобы показать именно то, что Вы ищете. Например, если Вы ищете "найшдвиший питчер" Вы получите информацию о спортсмене. Если же Вы ищете "самый питчер", то получите информацию о кувшин. Чтобы лучше понимать слова, мы используем так называемое машинное обучение. Это вид искусственного интеллекта, который помогает поисковым алгоритмам не только находить отдельные слова или фразы на страницах, но и понимать значение этих слов. Интернет экспоненциально растет, но если команды, которые соответствуют за разработку поисковых машин, хорошо выполнять свою работу, то информация, которая Вам нужна, всегда будет доступна за несколько кликов.