< Return to Video

The Internet: How Search Works

  • 0:00 - 0:06
    ИНТЕРНЕТ
    КАК РАБОТАЕТ ПОИСК
  • 0:06 - 0:08
    Привет, меня зовут Джон.
  • 0:08 - 0:11
    Я руковожу командой поиска
    и машинного обучения в Google
  • 0:12 - 0:14
    Меня очень вдохновляет то,
  • 0:14 - 0:16
    что люди по всему миру
  • 0:16 - 0:18
    обращаются к поисковым системам,
  • 0:18 - 0:19
    чтобы получить ответы
  • 0:19 - 0:20
    на тривиальные
  • 0:20 - 0:22
    и на очень важные вопросы.
  • 0:22 - 0:23
    Это большая ответственность —
  • 0:23 - 0:25
    дать им лучшие ответы.
  • 0:27 - 0:29
    Привет, меня зовут Акшая.
  • 0:29 - 0:31
    Я работаю в команде поиска в Bing.
  • 0:31 - 0:33
    Мы часто используем
  • 0:33 - 0:35
    искусственный интеллект
  • 0:35 - 0:36
    и машинное обучение.
  • 0:36 - 0:38
    Нам также нужно выяснить,
  • 0:38 - 0:39
    как это будут использовать пользователи,
  • 0:39 - 0:41
    потому что мы хотим внести
  • 0:41 - 0:42
    свой вклад в общество.
  • 0:43 - 0:46
    Зададим простой вопрос:
  • 0:46 - 0:49
    Сколько времени
    займет путешествие к Марсу?
  • 0:49 - 0:52
    Откуда берутся эти результаты?
  • 0:52 - 0:55
    И почему эти ответы показаны первыми?
  • 0:56 - 0:57
    Давайте посмотрим,
  • 0:57 - 0:59
    как поисковая система превращает
  • 0:59 - 1:00
    ваш запрос в результат.
  • 1:00 - 1:03
    Первое, что нужно знать —
  • 1:03 - 1:04
    когда вы задаете вопрос,
  • 1:04 - 1:06
    поисковый движок не уходит в Интернет
  • 1:06 - 1:07
    чтобы искать информацию на сайтах
  • 1:07 - 1:08
    в режиме реального времени.
  • 1:08 - 1:11
    Сейчас существуют миллиарды сайтов,
  • 1:11 - 1:14
    и ежеминутно создаются сотни новых.
  • 1:14 - 1:16
    Если бы поисковой системе пришлось
  • 1:16 - 1:18
    пересматривать каждый из них
  • 1:18 - 1:19
    при каждом запросе
  • 1:19 - 1:20
    это заняло бы вечность.
  • 1:21 - 1:22
    Поэтому для ускорения поиска
  • 1:22 - 1:24
    поисковые системы постоянно
  • 1:24 - 1:25
    сканируют интернет заранее
  • 1:25 - 1:26
    и записывают информацию,
  • 1:26 - 1:28
    которая может позже помочь
  • 1:28 - 1:29
    ответить на ваш вопрос.
  • 1:29 - 1:31
    То есть, когда вы ищете информацию
  • 1:31 - 1:32
    о путешествии на Марс,
  • 1:32 - 1:33
    поисковая система
  • 1:33 - 1:35
    уже имеет нужную информацию,
  • 1:35 - 1:36
    чтобы дать вам ответ.
  • 1:37 - 1:38
    Вот как это работает.
  • 1:39 - 1:40
    Интернет — это сеть страниц,
  • 1:40 - 1:42
    связанных между собой гиперссылками.
  • 1:42 - 1:44
    Поисковые движки постоянно
  • 1:44 - 1:45
    запускают программы,
  • 1:45 - 1:46
    которые называются "пауками".
  • 1:46 - 1:48
    Они перемещаются по страницам
  • 1:48 - 1:50
    и собирают информацию о них.
  • 1:50 - 1:52
    Найдя гиперссылки,
  • 1:52 - 1:54
    паук переходит по ним,
  • 1:54 - 1:56
    пока не просмотрит все страницы,
  • 1:56 - 1:57
    которые сможет найти во всем интернете.
  • 1:57 - 1:59
    О каждой посещенной странице
  • 1:59 - 2:01
    паук записывает всю информацию,
  • 2:01 - 2:02
    которая может понадобиться для поиска,
  • 2:02 - 2:04
    в специальную базу данных,
  • 2:04 - 2:06
    которая называется
  • 2:06 - 2:06
    поисковым индексом.
  • 2:08 - 2:10
    Вернемся к предыдущему запросу,
  • 2:10 - 2:12
    и посмотрим, как поисковая система
  • 2:12 - 2:13
    получает результаты.
  • 2:13 - 2:15
    Когда вы спросили,
  • 2:15 - 2:17
    сколько времени занимает
    путешествие к Марсу,
  • 2:17 - 2:18
    поисковая машина ищет
  • 2:18 - 2:19
    каждое из этих слов
  • 2:19 - 2:20
    в поисковом индексе
  • 2:20 - 2:22
    и сразу получает список
  • 2:22 - 2:23
    всех страниц в Интернете,
  • 2:23 - 2:25
    которые содержат эти слова.
  • 2:25 - 2:27
    Но простое совпадение
  • 2:27 - 2:29
    возвращает миллионы страниц,
  • 2:29 - 2:31
    поэтому поисковой системе
  • 2:31 - 2:32
    нужно найти лучшее соответствие
  • 2:32 - 2:33
    и показать его первым.
  • 2:33 - 2:35
    Здесь все становится сложнее,
  • 2:35 - 2:37
    потому что поисковая система
  • 2:37 - 2:38
    должна угадать, что именно вы ищете.
  • 2:39 - 2:41
    Каждая поисковая система
  • 2:41 - 2:42
    использует собственный алгоритм
  • 2:42 - 2:43
    для построения рейтинга страниц,
  • 2:43 - 2:44
    основываясь на предположении
  • 2:44 - 2:45
    о том, что вам нужно.
  • 2:45 - 2:51
    Например, алгоритм может проверять, поисковые слова
    содержатся в заголовке страницы,
  • 2:51 - 2:59
    или эти слова размещены рядом, или любые другие
    расчеты, которые помогут лучше
  • 2:59 - 3:03
    определить, какие страницы Вы бы хотели увидеть, а
    какие - нет.
  • 3:03 - 3:08
    Google изобрел самый известный алгоритм показа
    наиболее подходящих результатов поиска.
  • 3:08 - 3:12
    Он учитывает, сколько других веб-страниц содержат
    ссылку на эту страницу.
  • 3:12 - 3:16
    Идея заключается в том, что если многие другие сайты
    считает, что эта страница является интересной,
  • 3:16 - 3:18
    то возможно Вам она тоже подойдет.
  • 3:18 - 3:23
    Этот алгоритм называется Page Rank. Но не потому,
    что он строит рейтинг страниц,
  • 3:23 - 3:28
    а потому, что он назван в честь его автора и
    соучредителя Google - Ларри Пейджа.
  • 3:28 - 3:31
    Поскольку сайты могут зарабатывать деньги за посещение
    пользователями, спамеры
  • 3:31 - 3:36
    пытаются найти все лучшие способы обыграть поисковые
    алгоритмы, чтобы их
  • 3:36 - 3:39
    страницы показывались выше в результатах.
  • 3:39 - 3:40
    Поисковые машины регулярно
    обновляют алгоритмы,
  • 3:40 - 3:42
    чтобы не дать фейковым
  • 3:42 - 3:45
    и ненадежным сайтам добраться до вершины результатов
    поиска.
  • 3:45 - 3:50
    Но в конце концов, Вы сами должны учитывать, насколько
    сайт является надежным, проверяя
  • 3:50 - 3:54
    его адрес и убеждаясь, что это надежный источник.
  • 3:54 - 3:57
    Поисковые программы постоянно совершенствуются,
    чтобы улучшить алгоритмы и давать
  • 3:57 - 4:01
    лучшие результаты, и быстрее, чем конкуренты.
  • 4:01 - 4:05
    Современные поисковые машины даже используют
    информацию, которую Вы явно не давали, чтобы
  • 4:05 - 4:07
    сузить результаты поиска.
  • 4:07 - 4:11
    Например, если Вы будете искать "площадки для выгула
    собак"
  • 4:11 - 4:14
    много поисковых машин выдаст результаты по площадок
    неподалеку
  • 4:14 - 4:18
    даже если Вы не указали свое местоположение.
  • 4:18 - 4:22
    Современные поисковые машины понимают больше, чем
    просто слова на страницах.
  • 4:22 - 4:27
    Но и их значение, чтобы показать именно то, что Вы
    ищете.
  • 4:27 - 4:32
    Например, если Вы ищете "найшдвиший питчер"
  • 4:32 - 4:35
    Вы получите информацию о спортсмене.
  • 4:35 - 4:38
    Если же Вы ищете "самый питчер", то получите информацию
    о кувшин.
  • 4:39 - 4:42
    Чтобы лучше понимать слова, мы используем так
    называемое машинное обучение.
  • 4:42 - 4:45
    Это вид искусственного интеллекта, который помогает
    поисковым алгоритмам не только находить
  • 4:47 - 4:51
    отдельные слова или фразы на страницах, но и понимать
    значение этих слов.
  • 4:51 - 4:57
    Интернет экспоненциально растет, но если команды,
    которые соответствуют
  • 4:57 - 5:00
    за разработку поисковых машин, хорошо выполнять свою
    работу,
  • 5:00 - 5:04
    то информация, которая Вам нужна, всегда будет
    доступна за несколько кликов.
Title:
The Internet: How Search Works
Description:

more » « less
Video Language:
English
Team:
Code.org
Project:
How Internet Works
Duration:
05:13

Russian subtitles

Revisions Compare revisions