< Return to Video

The Internet: How Search Works

  • 0:00 - 0:06
    ИНТЕРНЕТ
    КАК РАБОТАЕТ ПОИСК
  • 0:06 - 0:08
    Привет, меня зовут Джон.
  • 0:08 - 0:11
    Я руковожу командой поиска
    и машинного обучения в Google
  • 0:12 - 0:14
    Меня очень вдохновляет то,
  • 0:14 - 0:16
    что люди по всему миру
  • 0:16 - 0:18
    обращаются к поисковым системам,
  • 0:18 - 0:19
    чтобы получить ответы
  • 0:19 - 0:20
    на тривиальные
  • 0:20 - 0:22
    и на очень важные вопросы.
  • 0:22 - 0:23
    Это большая ответственность —
  • 0:23 - 0:25
    дать им лучшие ответы.
  • 0:27 - 0:29
    Привет, меня зовут Акшая.
  • 0:29 - 0:31
    Я работаю в команде поиска в Bing.
  • 0:31 - 0:33
    Мы часто используем
  • 0:33 - 0:35
    искусственный интеллект
  • 0:35 - 0:36
    и машинное обучение.
  • 0:36 - 0:38
    Нам также нужно выяснить,
  • 0:38 - 0:39
    как это будут использовать пользователи,
  • 0:39 - 0:41
    потому что мы хотим внести
  • 0:41 - 0:42
    свой вклад в общество.
  • 0:43 - 0:46
    Зададим простой вопрос:
  • 0:46 - 0:49
    Сколько времени
    займет путешествие к Марсу?
  • 0:49 - 0:52
    Откуда берутся эти результаты?
  • 0:52 - 0:55
    И почему эти ответы показаны первыми?
  • 0:56 - 0:57
    Давайте посмотрим,
  • 0:57 - 0:59
    как поисковая система превращает
  • 0:59 - 1:00
    ваш запрос в результат.
  • 1:00 - 1:03
    Первое, что нужно знать —
  • 1:03 - 1:04
    когда вы задаете вопрос,
  • 1:04 - 1:06
    поисковый движок не уходит в Интернет
  • 1:06 - 1:07
    чтобы искать информацию на сайтах
  • 1:07 - 1:08
    в режиме реального времени.
  • 1:08 - 1:11
    Сейчас существуют миллиарды сайтов,
  • 1:11 - 1:14
    и ежеминутно создаются сотни новых.
  • 1:14 - 1:16
    Если бы поисковой системе пришлось
  • 1:16 - 1:18
    пересматривать каждый из них
  • 1:18 - 1:19
    при каждом запросе
  • 1:19 - 1:20
    это заняло бы вечность.
  • 1:21 - 1:22
    Поэтому для ускорения поиска
  • 1:22 - 1:24
    поисковые системы постоянно
  • 1:24 - 1:25
    сканируют интернет заранее
  • 1:25 - 1:26
    и записывают информацию,
  • 1:26 - 1:28
    которая может позже помочь
  • 1:28 - 1:29
    ответить на ваш вопрос.
  • 1:29 - 1:31
    То есть, когда вы ищете информацию
  • 1:31 - 1:32
    о путешествии на Марс,
  • 1:32 - 1:33
    поисковая система
  • 1:33 - 1:35
    уже имеет нужную информацию,
  • 1:35 - 1:36
    чтобы дать вам ответ.
  • 1:37 - 1:38
    Вот как это работает.
  • 1:39 - 1:40
    Интернет — это сеть страниц,
  • 1:40 - 1:42
    связанных между собой гиперссылками.
  • 1:42 - 1:44
    Поисковые движки постоянно
  • 1:44 - 1:45
    запускают программы,
  • 1:45 - 1:46
    которые называются "пауками".
  • 1:46 - 1:48
    Они перемещаются по страницам
  • 1:48 - 1:50
    и собирают информацию о них.
  • 1:50 - 1:52
    Найдя гиперссылки,
  • 1:52 - 1:54
    паук переходит по ним,
  • 1:54 - 1:56
    пока не просмотрит все страницы,
  • 1:56 - 1:57
    которые сможет найти во всем интернете.
  • 1:57 - 1:59
    О каждой посещенной странице
  • 1:59 - 2:01
    паук записывает всю информацию,
  • 2:01 - 2:02
    которая может понадобиться для поиска,
  • 2:02 - 2:04
    в специальную базу данных,
  • 2:04 - 2:05
    которая называется
  • 2:05 - 2:06
    "поисковый индекс".
  • 2:08 - 2:10
    Вернемся к предыдущему запросу,
  • 2:10 - 2:12
    и посмотрим, как поисковая система
  • 2:12 - 2:13
    получает результаты.
  • 2:13 - 2:15
    Когда вы спросили,
  • 2:15 - 2:17
    сколько времени занимает
    путешествие к Марсу,
  • 2:17 - 2:18
    поисковая машина ищет
  • 2:18 - 2:19
    каждое из этих слов
  • 2:19 - 2:20
    в поисковом индексе
  • 2:20 - 2:22
    и сразу получает список
  • 2:22 - 2:23
    всех страниц в Интернете,
  • 2:23 - 2:25
    которые содержат эти слова.
  • 2:25 - 2:27
    Но простое совпадение
  • 2:27 - 2:29
    возвращает миллионы страниц,
  • 2:29 - 2:31
    поэтому поисковой системе
  • 2:31 - 2:32
    нужно найти лучшее соответствие
  • 2:32 - 2:33
    и показать его первым.
  • 2:33 - 2:35
    Здесь все становится сложнее,
  • 2:35 - 2:37
    потому что поисковая система
  • 2:37 - 2:38
    должна угадать, что именно вы ищете.
  • 2:39 - 2:41
    Каждая поисковая система
  • 2:41 - 2:42
    использует собственный алгоритм
  • 2:42 - 2:43
    для построения рейтинга страниц,
  • 2:43 - 2:44
    основываясь на предположении
  • 2:44 - 2:45
    о том, что вам нужно.
  • 2:45 - 2:48
    Например, алгоритм может проверять,
  • 2:48 - 2:50
    содержатся ли искомые слова
  • 2:50 - 2:51
    в заголовке страницы,
  • 2:51 - 2:55
    или эти слова находятся рядом друг с другом,
  • 2:55 - 2:57
    или использовать другие расчеты,
  • 2:57 - 2:59
    которые помогут лучше определить,
  • 2:59 - 3:01
    какие страницы вы бы хотели бы видеть,
  • 3:01 - 3:03
    а какие — нет.
  • 3:03 - 3:06
    Google изобрел самый известный алгоритм
  • 3:06 - 3:08
    выбора наиболее подходящих
    результатов поиска.
  • 3:08 - 3:10
    Он учитывает, сколько других веб-страниц
  • 3:10 - 3:12
    содержат ссылку на эту страницу.
  • 3:12 - 3:13
    Идея заключается в том,
  • 3:13 - 3:15
    что если многие другие сайты считают
  • 3:15 - 3:17
    эту страницу интересной,
  • 3:17 - 3:18
    то, возможно, вам она тоже подойдет.
  • 3:18 - 3:21
    Этот алгоритм называется
    Пейдж Рэнк (Рейтинг страницы).
  • 3:21 - 3:23
    Но не потому, что он создает рейтинг страниц,
  • 3:23 - 3:25
    а потому, что назван в честь
  • 3:25 - 3:28
    его автора и соучредителя Google —
    Ларри Пейджа.
  • 3:28 - 3:30
    Поскольку сайты могут зарабатывать деньги
  • 3:30 - 3:32
    за посещение пользователями,
  • 3:32 - 3:33
    спамеры пытаются найти способы,
  • 3:33 - 3:36
    чтобы обмануть поисковые алгоритмы,
    и сделать так, чтобы
  • 3:36 - 3:39
    их страницы показывались
    выше в результатах.
  • 3:39 - 3:40
    Поисковые системы регулярно
  • 3:40 - 3:41
    обновляют алгоритмы,
  • 3:41 - 3:43
    чтобы не дать фейковым
  • 3:43 - 3:44
    и ненадежным сайтам
  • 3:44 - 3:45
    добраться до вершины
    результатов поиска.
  • 3:45 - 3:48
    Но, в конце концов,
    вы сами должны следить,
  • 3:48 - 3:50
    насколько надежным является сайт,
  • 3:50 - 3:52
    проверяя его адрес
  • 3:52 - 3:54
    и убеждаясь, что это надежный источник.
  • 3:54 - 3:56
    Поисковые программы
    постоянно совершенствуются,
  • 3:56 - 3:58
    улучшая алгоритмы, чтобы выдавать
  • 3:58 - 4:01
    результаты лучше и быстрее, чем конкуренты.
  • 4:01 - 4:03
    Современные поисковые движки
  • 4:03 - 4:04
    используют даже ту информацию,
  • 4:04 - 4:06
    которую вы не давали явным образом,
  • 4:06 - 4:07
    чтобы сузить результаты поиска.
  • 4:07 - 4:09
    Например, если Вы будете искать
  • 4:09 - 4:11
    "площадки для выгула собак",
  • 4:11 - 4:13
    многие поисковые системы
    выдадут результаты
  • 4:13 - 4:15
    с площадками неподалеку от вас,
  • 4:15 - 4:18
    даже если вы не указали
    свое местоположение.
  • 4:18 - 4:19
    Современные поисковые системы
  • 4:19 - 4:21
    понимают больше,
  • 4:21 - 4:22
    чем просто слова на страницах.
  • 4:22 - 4:25
    Они анализируют их значение,
  • 4:25 - 4:27
    чтобы показать вам именно то,
    что вы ищете.
  • 4:27 - 4:29
    Например, если вы ищете
  • 4:29 - 4:31
    "fast pitcher"
  • 4:31 - 4:33
    Вы получите информацию о спортсмене.
  • 4:33 - 4:36
    Если же вы ищете "large pitcher",
  • 4:36 - 4:38
    то получите информацию о кувшине.
  • 4:39 - 4:40
    Чтобы лучше понимать слова,
  • 4:40 - 4:42
    мы используем машинное обучение.
  • 4:42 - 4:44
    Это вид искусственного интеллекта,
  • 4:44 - 4:47
    который помогает поисковым алгоритмам
  • 4:47 - 4:49
    не только находить отдельные слова
    или фразы на страницах,
  • 4:49 - 4:52
    но и понимать значение этих слов.
  • 4:54 - 4:56
    Интернет растет экспоненциально,
  • 4:56 - 4:57
    но если команды, которые
  • 4:57 - 4:59
    разрабатывают поисковые алгоритмы,
  • 4:59 - 5:01
    хорошо выполнять свою работу,
  • 5:01 - 5:02
    нужная вам информация
  • 5:02 - 5:03
    всегда будет доступна
  • 5:03 - 5:05
    за несколько кликов.
Title:
The Internet: How Search Works
Description:

more » « less
Video Language:
English
Team:
Code.org
Project:
How Internet Works
Duration:
05:13

Russian subtitles

Revisions Compare revisions