WEBVTT 00:00:05.970 --> 00:00:12.100 Привіт, мене звати Джон. Я керую командою пошуку та машинного навчання в Google 00:00:12.100 --> 00:00:16.363 Мене надзвичайно надихає те, що люди по всьому світі 00:00:16.363 --> 00:00:19.758 звертаються до пошукових машин, щоб знайти відповіді на тривіальні питання 00:00:19.758 --> 00:00:21.704 і на дуже важливі питання. 00:00:21.704 --> 00:00:24.972 Це велика відповідальність - надати якомога кращі відповіді. 00:00:26.725 --> 00:00:31.218 Привіт, мене звата Ачая. Я працюю в команді пошуку в Bing. 00:00:31.499 --> 00:00:35.860 Часом, коли ми розглядаємо проблеми штучного інтелекту та машинного навчання, 00:00:35.885 --> 00:00:39.185 нам також потрібно з'ясувати, як це будуть використовувати, 00:00:39.185 --> 00:00:42.257 тому що насправді ми хочемо зробити свій внесок у суспільство. 00:00:43.267 --> 00:00:45.833 Задамо просте питання: 00:00:45.833 --> 00:00:49.406 Скільки часу займає подорож до Марсу? 00:00:49.406 --> 00:00:51.507 Звідки беруться ці результати? 00:00:51.507 --> 00:00:55.895 І чому ці відповіді виведені на початку? 00:00:55.895 --> 00:01:00.234 ОК, давайте подивимось, як пошукова машина перетворює Ваш запит на результати. 00:01:00.234 --> 00:01:06.213 Перше, що потрібно знати - коли Ви задаєте пошук, пошукова машина не вирушає в Інтернет 00:01:06.213 --> 00:01:09.029 щоб пошукати інформацію на сайтах у режимі реального часу. 00:01:09.029 --> 00:01:14.978 Тому що зараз існують мільярди сайтів, і щохвилини створюються сотні нових. 00:01:14.978 --> 00:01:18.670 Тож якби пошуковій машині довелось переглядати кожен із них при кожному запиті 00:01:18.670 --> 00:01:20.689 це би займало вічність. 00:01:20.689 --> 00:01:25.767 Тож для пришвидшення пошуку, пошукові машини постійно сканують Інтернет заздалегідь 00:01:25.767 --> 00:01:28.984 І записують інформацію, яка може пізніше допомогти з Вашим запитом. 00:01:28.984 --> 00:01:32.721 Так, якщо Ви шукатимете завтрашню подорож, пошукова машина 00:01:32.721 --> 00:01:36.597 вже має потрібну інформацію, щоб видати її одразу. 00:01:36.988 --> 00:01:39.046 Ось як це працює. 00:01:39.234 --> 00:01:41.980 Інтернет - це мережа сторінок, пов'язаних між собою гіперпосиланнями. 00:01:41.980 --> 00:01:46.301 Пошукові машини мають постійно запущені програми, які називаються павуками. 00:01:46.795 --> 00:01:50.724 Вони переміщуються між сторінками і збирають інформацію про них. 00:01:50.724 --> 00:01:55.519 Знайшовши гіперпосилання, павук переходить по ньому, поки не перегляне усі сторінки, 00:01:55.519 --> 00:01:59.382 які зможе знайти в усьому Інтернеті. Для кожної відвіданої сторінки 00:01:59.382 --> 00:02:03.805 павук записує всю інформацію, яка може знадобитись для пошуку, в спеціальну 00:02:03.805 --> 00:02:06.316 базу даних, яка називається пошуковим індексом. 00:02:06.316 --> 00:02:11.807 Повернімось до попереднього запиту, і подивимось, як пошукова машина 00:02:11.807 --> 00:02:13.417 отримує результати. 00:02:13.417 --> 00:02:17.286 Коли Ви спитали Скільки часу займає подорож до Марсу? 00:02:17.286 --> 00:02:21.075 пошукова машина шукає кожне з цих слів у пошуковому індексі і одразу 00:02:21.075 --> 00:02:25.432 має список всіх сторінок в Інтернеті, які містять ці слова. 00:02:25.432 --> 00:02:31.437 Але простий збіг повертає мільйони сторінок, потрібно ще виявити найкращу відповідність 00:02:31.437 --> 00:02:33.576 і показати її на початку. 00:02:33.576 --> 00:02:39.344 Тут все стає складніше, бо пошукова машина часом має вгадати, що саме Ви шукаєте. 00:02:39.344 --> 00:02:43.560 Кожна пошукова машина має власний алгоритм для побудови рейтингу сторінок, базуючись 00:02:43.560 --> 00:02:45.343 на припущенні щодо того, що Вам потрібно. 00:02:45.343 --> 00:02:50.997 Наприклад, алгоритм може перевіряти, чи пошукові слова містяться у заголовку сторінки, 00:02:50.997 --> 00:02:58.902 чи ці слова розміщені поряд, чи будь-які інші розрахунки, які допоможуть краще 00:02:58.902 --> 00:03:03.089 визначити, які сторінки Ви би хотіли побачити, а які - ні. 00:03:03.089 --> 00:03:07.944 Google винайшов найвідоміший алгоритм показу найвідповідніших результатів пошуку. 00:03:07.944 --> 00:03:12.166 Він враховує, скільки інших веб-сторінок містять посилання на цю сторінку. 00:03:12.166 --> 00:03:15.783 Ідея полягає в тому, що якщо багато інших сайтів вважає, що ця сторінка є цікавою, 00:03:15.783 --> 00:03:18.399 то можливо Вам вона теж підійде. 00:03:18.399 --> 00:03:22.579 Цей алгоритм називається Page Rank. Але не тому, що він будує рейтинг сторінок, 00:03:22.579 --> 00:03:28.007 а тому, що він названий на честь його автора та співзасновника Google - Ларі Пейджа. 00:03:28.007 --> 00:03:31.471 Оскільки сайти можуть заробляти гроші за відвідування користувачами, спамери 00:03:31.471 --> 00:03:35.819 намагаються знайти все кращі способи обіграти пошукові алгоритми, щоб їхні 00:03:35.819 --> 00:03:38.521 сторінки показувались вище у результатах. 00:03:38.521 --> 00:03:42.163 Пошукові машини регулярно оновлюють свої алгоритми, щоб не дати фейковим 00:03:42.163 --> 00:03:44.767 та ненадійним сайтам дістатись до вершини результатів пошуку. 00:03:44.767 --> 00:03:50.164 Але зрештою, Ви самі маєте враховувати, наскільки сайт є надійним, перевіряючи 00:03:50.164 --> 00:03:54.014 його адресу і переконуючись, що це надійне джерело. 00:03:54.014 --> 00:03:56.548 Пошукові програми постійно вдосконалюються, щоб покращити алгоритми і давати 00:03:56.548 --> 00:04:01.231 кращі результати, і швидше, ніж конкуренти. 00:04:01.231 --> 00:04:04.943 Сучасні пошукові машини навіть використовують інформацію, яку Ви явно не давали, щоб 00:04:04.943 --> 00:04:07.463 звузити результати пошуку. 00:04:07.463 --> 00:04:10.897 Наприклад, якщо Ви шукатимете "майданчики для вигулу собак" 00:04:10.897 --> 00:04:14.155 багато пошукових машин видасть результати щодо майданчиків неподалік, 00:04:14.155 --> 00:04:18.233 навіть якщо Ви не вказали своє місце розташування. 00:04:18.233 --> 00:04:22.481 Сучасні пошукові машини розуміють більше, ніж просто слова на сторінках. 00:04:22.481 --> 00:04:27.348 Але й їхнє значення, щоб показати саме те, що Ви шукаєте. 00:04:27.348 --> 00:04:31.756 Наприклад, якщо Ви шукаєте "найшдвиший пітчер" 00:04:31.756 --> 00:04:34.590 Ви отримаєте інформацію про спортсмена. 00:04:34.680 --> 00:04:37.840 Якщо ж Ви шукаєте "найбільший пітчер", то отримаєте інформацію про глечик. 00:04:39.474 --> 00:04:42.435 Щоб краще розуміти слова, ми використовуємо так зване машинне навчання. 00:04:42.435 --> 00:04:44.539 Це вид штучного інтелекту, який допомагає пошуковим алгоритмам не лише знаходити 00:04:47.257 --> 00:04:50.993 окремі слова чи фрази на сторінках, але й розуміти значення цих слів. 00:04:50.993 --> 00:04:57.432 Інтернет експоненціально зростає, але якщо команди, які відповідають 00:04:57.432 --> 00:05:00.234 за розробку пошукових машин, добре виконуватимуть свою роботу, 00:05:00.234 --> 00:05:04.306 то інформація, яка Вам потрібна, завжди буде доступна за кілька кліків.