1 00:00:05,970 --> 00:00:12,100 Привіт, мене звати Джон. Я керую командою пошуку та машинного навчання в Google 2 00:00:12,100 --> 00:00:16,363 Мене надзвичайно надихає те, що люди по всьому світі 3 00:00:16,363 --> 00:00:19,758 звертаються до пошукових машин, щоб знайти відповіді на тривіальні питання 4 00:00:19,758 --> 00:00:21,704 і на дуже важливі питання. 5 00:00:21,704 --> 00:00:24,972 Це велика відповідальність - надати якомога кращі відповіді. 6 00:00:26,725 --> 00:00:31,218 Привіт, мене звата Ачая. Я працюю в команді пошуку в Bing. 7 00:00:31,499 --> 00:00:35,860 Часом, коли ми розглядаємо проблеми штучного інтелекту та машинного навчання, 8 00:00:35,885 --> 00:00:39,185 нам також потрібно з'ясувати, як це будуть використовувати, 9 00:00:39,185 --> 00:00:42,257 тому що насправді ми хочемо зробити свій внесок у суспільство. 10 00:00:43,267 --> 00:00:45,833 Задамо просте питання: 11 00:00:45,833 --> 00:00:49,406 Скільки часу займає подорож до Марсу? 12 00:00:49,406 --> 00:00:51,507 Звідки беруться ці результати? 13 00:00:51,507 --> 00:00:55,895 І чому ці відповіді виведені на початку? 14 00:00:55,895 --> 00:01:00,234 ОК, давайте подивимось, як пошукова машина перетворює Ваш запит на результати. 15 00:01:00,234 --> 00:01:06,213 Перше, що потрібно знати - коли Ви задаєте пошук, пошукова машина не вирушає в Інтернет 16 00:01:06,213 --> 00:01:09,029 щоб пошукати інформацію на сайтах у режимі реального часу. 17 00:01:09,029 --> 00:01:14,978 Тому що зараз існують мільярди сайтів, і щохвилини створюються сотні нових. 18 00:01:14,978 --> 00:01:18,670 Тож якби пошуковій машині довелось переглядати кожен із них при кожному запиті 19 00:01:18,670 --> 00:01:20,689 це би займало вічність. 20 00:01:20,689 --> 00:01:25,767 Тож для пришвидшення пошуку, пошукові машини постійно сканують Інтернет заздалегідь 21 00:01:25,767 --> 00:01:28,984 І записують інформацію, яка може пізніше допомогти з Вашим запитом. 22 00:01:28,984 --> 00:01:32,721 Так, якщо Ви шукатимете завтрашню подорож, пошукова машина 23 00:01:32,721 --> 00:01:36,597 вже має потрібну інформацію, щоб видати її одразу. 24 00:01:36,988 --> 00:01:39,046 Ось як це працює. 25 00:01:39,234 --> 00:01:41,980 Інтернет - це мережа сторінок, пов'язаних між собою гіперпосиланнями. 26 00:01:41,980 --> 00:01:46,301 Пошукові машини мають постійно запущені програми, які називаються павуками. 27 00:01:46,795 --> 00:01:50,724 Вони переміщуються між сторінками і збирають інформацію про них. 28 00:01:50,724 --> 00:01:55,519 Знайшовши гіперпосилання, павук переходить по ньому, поки не перегляне усі сторінки, 29 00:01:55,519 --> 00:01:59,382 які зможе знайти в усьому Інтернеті. Для кожної відвіданої сторінки 30 00:01:59,382 --> 00:02:03,805 павук записує всю інформацію, яка може знадобитись для пошуку, в спеціальну 31 00:02:03,805 --> 00:02:06,316 базу даних, яка називається пошуковим індексом. 32 00:02:06,316 --> 00:02:11,807 Повернімось до попереднього запиту, і подивимось, як пошукова машина 33 00:02:11,807 --> 00:02:13,417 отримує результати. 34 00:02:13,417 --> 00:02:17,286 Коли Ви спитали Скільки часу займає подорож до Марсу? 35 00:02:17,286 --> 00:02:21,075 пошукова машина шукає кожне з цих слів у пошуковому індексі і одразу 36 00:02:21,075 --> 00:02:25,432 має список всіх сторінок в Інтернеті, які містять ці слова. 37 00:02:25,432 --> 00:02:31,437 Але простий збіг повертає мільйони сторінок, потрібно ще виявити найкращу відповідність 38 00:02:31,437 --> 00:02:33,576 і показати її на початку. 39 00:02:33,576 --> 00:02:39,344 Тут все стає складніше, бо пошукова машина часом має вгадати, що саме Ви шукаєте. 40 00:02:39,344 --> 00:02:43,560 Кожна пошукова машина має власний алгоритм для побудови рейтингу сторінок, базуючись 41 00:02:43,560 --> 00:02:45,343 на припущенні щодо того, що Вам потрібно. 42 00:02:45,343 --> 00:02:50,997 Наприклад, алгоритм може перевіряти, чи пошукові слова містяться у заголовку сторінки, 43 00:02:50,997 --> 00:02:58,902 чи ці слова розміщені поряд, чи будь-які інші розрахунки, які допоможуть краще 44 00:02:58,902 --> 00:03:03,089 визначити, які сторінки Ви би хотіли побачити, а які - ні. 45 00:03:03,089 --> 00:03:07,944 Google винайшов найвідоміший алгоритм показу найвідповідніших результатів пошуку. 46 00:03:07,944 --> 00:03:12,166 Він враховує, скільки інших веб-сторінок містять посилання на цю сторінку. 47 00:03:12,166 --> 00:03:15,783 Ідея полягає в тому, що якщо багато інших сайтів вважає, що ця сторінка є цікавою, 48 00:03:15,783 --> 00:03:18,399 то можливо Вам вона теж підійде. 49 00:03:18,399 --> 00:03:22,579 Цей алгоритм називається Page Rank. Але не тому, що він будує рейтинг сторінок, 50 00:03:22,579 --> 00:03:28,007 а тому, що він названий на честь його автора та співзасновника Google - Ларі Пейджа. 51 00:03:28,007 --> 00:03:31,471 Оскільки сайти можуть заробляти гроші за відвідування користувачами, спамери 52 00:03:31,471 --> 00:03:35,819 намагаються знайти все кращі способи обіграти пошукові алгоритми, щоб їхні 53 00:03:35,819 --> 00:03:38,521 сторінки показувались вище у результатах. 54 00:03:38,521 --> 00:03:42,163 Пошукові машини регулярно оновлюють свої алгоритми, щоб не дати фейковим 55 00:03:42,163 --> 00:03:44,767 та ненадійним сайтам дістатись до вершини результатів пошуку. 56 00:03:44,767 --> 00:03:50,164 Але зрештою, Ви самі маєте враховувати, наскільки сайт є надійним, перевіряючи 57 00:03:50,164 --> 00:03:54,014 його адресу і переконуючись, що це надійне джерело. 58 00:03:54,014 --> 00:03:56,548 Пошукові програми постійно вдосконалюються, щоб покращити алгоритми і давати 59 00:03:56,548 --> 00:04:01,231 кращі результати, і швидше, ніж конкуренти. 60 00:04:01,231 --> 00:04:04,943 Сучасні пошукові машини навіть використовують інформацію, яку Ви явно не давали, щоб 61 00:04:04,943 --> 00:04:07,463 звузити результати пошуку. 62 00:04:07,463 --> 00:04:10,897 Наприклад, якщо Ви шукатимете "майданчики для вигулу собак" 63 00:04:10,897 --> 00:04:14,155 багато пошукових машин видасть результати щодо майданчиків неподалік, 64 00:04:14,155 --> 00:04:18,233 навіть якщо Ви не вказали своє місце розташування. 65 00:04:18,233 --> 00:04:22,481 Сучасні пошукові машини розуміють більше, ніж просто слова на сторінках. 66 00:04:22,481 --> 00:04:27,348 Але й їхнє значення, щоб показати саме те, що Ви шукаєте. 67 00:04:27,348 --> 00:04:31,756 Наприклад, якщо Ви шукаєте "найшдвиший пітчер" 68 00:04:31,756 --> 00:04:34,590 Ви отримаєте інформацію про спортсмена. 69 00:04:34,680 --> 00:04:37,840 Якщо ж Ви шукаєте "найбільший пітчер", то отримаєте інформацію про глечик. 70 00:04:39,474 --> 00:04:42,435 Щоб краще розуміти слова, ми використовуємо так зване машинне навчання. 71 00:04:42,435 --> 00:04:44,539 Це вид штучного інтелекту, який допомагає пошуковим алгоритмам не лише знаходити 72 00:04:47,257 --> 00:04:50,993 окремі слова чи фрази на сторінках, але й розуміти значення цих слів. 73 00:04:50,993 --> 00:04:57,432 Інтернет експоненціально зростає, але якщо команди, які відповідають 74 00:04:57,432 --> 00:05:00,234 за розробку пошукових машин, добре виконуватимуть свою роботу, 75 00:05:00,234 --> 00:05:04,306 то інформація, яка Вам потрібна, завжди буде доступна за кілька кліків.