< Return to Video

The Internet: How Search Works

  • 0:06 - 0:12
    Привет, меня зовут Джон. Я руковожу командой поиска
    и машинного обучения в Google
  • 0:12 - 0:16
    Меня очень вдохновляет то, что люди по всему миру
  • 0:16 - 0:20
    обращаются к поисковым машинам, чтобы найти ответы
    на тривиальные вопросы
  • 0:20 - 0:22
    и на очень важные вопросы.
  • 0:22 - 0:25
    Это большая ответственность - предоставить как можно
    лучшие ответы.
  • 0:27 - 0:31
    Привет, меня зовут Акшая. Я работаю в команде поиска
    в Bing.
  • 0:31 - 0:36
    Иногда, когда мы рассматриваем проблемы искусственного
    интеллекта и машинного обучения,
  • 0:36 - 0:39
    нам также нужно выяснить, как это будут
    использовать,
  • 0:39 - 0:42
    потому что в действительности мы хотим внести свой
    вклад в общество.
  • 0:43 - 0:46
    Зададим простой вопрос:
  • 0:46 - 0:49
    Сколько времени занимает путешествие к Марсу?
  • 0:49 - 0:52
    Откуда берутся эти результаты?
  • 0:52 - 0:56
    И почему эти ответы выведены в начале?
  • 0:56 - 1:00
    ОК, давайте посмотрим, как поисковая машина превращает
    Ваш запрос на результаты.
  • 1:00 - 1:06
    Первое, что нужно знать - когда Вы задаете поиск,
    поисковая машина не уходит в Интернет
  • 1:06 - 1:09
    чтобы поискать информацию на сайтах в режиме реального
    времени.
  • 1:09 - 1:15
    Потому что сейчас существуют миллиарды сайтов, и
    ежеминутно создаются сотни новых.
  • 1:15 - 1:19
    Поэтому если бы поисковой машине пришлось пересматривать
    каждый из них при каждом запросе
  • 1:19 - 1:21
    это бы занимало вечность.
  • 1:21 - 1:26
    Поэтому для ускорения поиска, поисковые машины
    постоянно сканируют Интернет заранее
  • 1:26 - 1:29
    И записывают информацию, которая может позже помочь
    Вашему запросу.
  • 1:29 - 1:33
    Так, если Вы будете искать завтрашнюю путешествие,
    поисковая машина
  • 1:33 - 1:37
    уже имеет нужную информацию, чтобы выдать ее
    сразу.
  • 1:37 - 1:39
    Вот как это работает.
  • 1:39 - 1:42
    Интернет - это сеть страниц, связанных между собой
    гиперссылками.
  • 1:42 - 1:46
    Поисковые машины должны постоянно запущены программы,
    которые называются пауками.
  • 1:47 - 1:51
    Они перемещаются между страницами и собирают информацию
    о них.
  • 1:51 - 1:56
    Найдя гиперссылки паук переходит по нему, пока не
    пересмотрит все страницы,
  • 1:56 - 1:59
    которые сможет найти во всем Интернете. Для каждой
    посещенной страницы
  • 1:59 - 2:04
    паук записывает всю информацию, которая может
    понадобиться для поиска, в специальную
  • 2:04 - 2:06
    базу данных, которая называется поисковым
    индексом.
  • 2:06 - 2:12
    Вернемся к предыдущему запросу, и посмотрим, как
    поисковая машина
  • 2:12 - 2:13
    получает результаты.
  • 2:13 - 2:17
    Когда Вы спросили Сколько времени занимает путешествие
    к Марсу?
  • 2:17 - 2:21
    поисковая машина ищет каждое из этих слов в поисковом
    индексе и сразу
  • 2:21 - 2:25
    имеет список всех страниц в Интернете, которые
    содержат эти слова.
  • 2:25 - 2:31
    Но простое совпадение возвращает миллионы страниц,
    нужно еще найти наилучшее соответствие
  • 2:31 - 2:34
    и показать ее в начале.
  • 2:34 - 2:39
    Здесь все становится сложнее, потому что поисковая
    машина время должен угадать, что именно Вы ищете.
  • 2:39 - 2:44
    Каждая поисковая машина имеет собственный алгоритм
    для построения рейтинга страниц, основываясь
  • 2:44 - 2:45
    на предположении о том, что Вам нужно.
  • 2:45 - 2:51
    Например, алгоритм может проверять, поисковые слова
    содержатся в заголовке страницы,
  • 2:51 - 2:59
    или эти слова размещены рядом, или любые другие
    расчеты, которые помогут лучше
  • 2:59 - 3:03
    определить, какие страницы Вы бы хотели увидеть, а
    какие - нет.
  • 3:03 - 3:08
    Google изобрел самый известный алгоритм показа
    наиболее подходящих результатов поиска.
  • 3:08 - 3:12
    Он учитывает, сколько других веб-страниц содержат
    ссылку на эту страницу.
  • 3:12 - 3:16
    Идея заключается в том, что если многие другие сайты
    считает, что эта страница является интересной,
  • 3:16 - 3:18
    то возможно Вам она тоже подойдет.
  • 3:18 - 3:23
    Этот алгоритм называется Page Rank. Но не потому,
    что он строит рейтинг страниц,
  • 3:23 - 3:28
    а потому, что он назван в честь его автора и
    соучредителя Google - Ларри Пейджа.
  • 3:28 - 3:31
    Поскольку сайты могут зарабатывать деньги за посещение
    пользователями, спамеры
  • 3:31 - 3:36
    пытаются найти все лучшие способы обыграть поисковые
    алгоритмы, чтобы их
  • 3:36 - 3:39
    страницы показывались выше в результатах.
  • 3:39 - 3:42
    Поисковые машины регулярно обновляют свои алгоритмы,
    чтобы не дать фейковых
  • 3:42 - 3:45
    и ненадежным сайтам добраться до вершины результатов
    поиска.
  • 3:45 - 3:50
    Но в конце концов, Вы сами должны учитывать, насколько
    сайт является надежным, проверяя
  • 3:50 - 3:54
    его адрес и убеждаясь, что это надежный источник.
  • 3:54 - 3:57
    Поисковые программы постоянно совершенствуются,
    чтобы улучшить алгоритмы и давать
  • 3:57 - 4:01
    лучшие результаты, и быстрее, чем конкуренты.
  • 4:01 - 4:05
    Современные поисковые машины даже используют
    информацию, которую Вы явно не давали, чтобы
  • 4:05 - 4:07
    сузить результаты поиска.
  • 4:07 - 4:11
    Например, если Вы будете искать "площадки для выгула
    собак"
  • 4:11 - 4:14
    много поисковых машин выдаст результаты по площадок
    неподалеку
  • 4:14 - 4:18
    даже если Вы не указали свое местоположение.
  • 4:18 - 4:22
    Современные поисковые машины понимают больше, чем
    просто слова на страницах.
  • 4:22 - 4:27
    Но и их значение, чтобы показать именно то, что Вы
    ищете.
  • 4:27 - 4:32
    Например, если Вы ищете "найшдвиший питчер"
  • 4:32 - 4:35
    Вы получите информацию о спортсмене.
  • 4:35 - 4:38
    Если же Вы ищете "самый питчер", то получите информацию
    о кувшин.
  • 4:39 - 4:42
    Чтобы лучше понимать слова, мы используем так
    называемое машинное обучение.
  • 4:42 - 4:45
    Это вид искусственного интеллекта, который помогает
    поисковым алгоритмам не только находить
  • 4:47 - 4:51
    отдельные слова или фразы на страницах, но и понимать
    значение этих слов.
  • 4:51 - 4:57
    Интернет экспоненциально растет, но если команды,
    которые соответствуют
  • 4:57 - 5:00
    за разработку поисковых машин, хорошо выполнять свою
    работу,
  • 5:00 - 5:04
    то информация, которая Вам нужна, всегда будет
    доступна за несколько кликов.
Title:
The Internet: How Search Works
Description:

more » « less
Video Language:
English
Team:
Code.org
Project:
How Internet Works
Duration:
05:13

Russian subtitles

Revisions Compare revisions