0:00:05.970,0:00:12.100 Привіт, мене звати Джон. Я керую командою [br]пошуку та машинного навчання в Google 0:00:12.100,0:00:16.363 Мене надзвичайно надихає те,[br]що люди по всьому світі 0:00:16.363,0:00:19.758 звертаються до пошукових машин,[br]щоб знайти відповіді на тривіальні питання 0:00:19.758,0:00:21.704 і на дуже важливі питання. 0:00:21.704,0:00:24.972 Це велика відповідальність - [br]надати якомога кращі відповіді. 0:00:26.725,0:00:31.218 Привіт, мене звати Акшая.[br]Я працюю в команді пошуку в Bing. 0:00:31.499,0:00:35.860 Часом, коли ми розглядаємо проблеми [br]штучного інтелекту та машинного навчання, 0:00:35.885,0:00:39.185 нам також потрібно з'ясувати,[br]як це будуть використовувати, 0:00:39.185,0:00:42.257 тому що насправді ми хочемо [br]зробити свій внесок у суспільство. 0:00:43.267,0:00:45.833 Задамо просте питання: 0:00:45.833,0:00:49.406 Скільки часу займає подорож до Марсу? 0:00:49.406,0:00:51.507 Звідки беруться ці результати? 0:00:51.507,0:00:55.895 І чому ці відповіді виведені на початку? 0:00:55.895,0:01:00.234 ОК, давайте подивимось, як пошукова машина[br]перетворює Ваш запит на результати. 0:01:00.234,0:01:06.213 Перше, що потрібно знати - коли Ви задаєте пошук,[br]пошукова машина не вирушає в Інтернет 0:01:06.213,0:01:09.029 щоб пошукати інформацію на сайтах[br]у режимі реального часу. 0:01:09.029,0:01:14.978 Тому що зараз існують мільярди сайтів,[br]і щохвилини створюються сотні нових. 0:01:14.978,0:01:18.670 Тож якби пошуковій машині довелось [br]переглядати кожен із них при кожному запиті 0:01:18.670,0:01:20.689 це би займало вічність. 0:01:20.689,0:01:25.767 Тож для пришвидшення пошуку, пошукові[br]машини постійно сканують Інтернет заздалегідь 0:01:25.767,0:01:28.984 І записують інформацію, яка може пізніше[br]допомогти з Вашим запитом. 0:01:28.984,0:01:32.721 Так, якщо Ви шукатимете [br]завтрашню подорож, пошукова машина 0:01:32.721,0:01:36.597 вже має потрібну інформацію, щоб [br]видати її одразу. 0:01:36.988,0:01:39.046 Ось як це працює. 0:01:39.234,0:01:41.980 Інтернет - це мережа сторінок, пов'язаних[br]між собою гіперпосиланнями. 0:01:41.980,0:01:46.301 Пошукові машини мають постійно запущені[br]програми, які називаються павуками. 0:01:46.795,0:01:50.724 Вони переміщуються між сторінками і[br]збирають інформацію про них. 0:01:50.724,0:01:55.519 Знайшовши гіперпосилання, павук переходить[br]по ньому, поки не перегляне усі сторінки, 0:01:55.519,0:01:59.382 які зможе знайти в усьому Інтернеті.[br]Для кожної відвіданої сторінки 0:01:59.382,0:02:03.805 павук записує всю інформацію, яка може [br]знадобитись для пошуку, в спеціальну 0:02:03.805,0:02:06.316 базу даних, яка називається [br]пошуковим індексом. 0:02:06.316,0:02:11.807 Повернімось до попереднього запиту,[br]і подивимось, як пошукова машина 0:02:11.807,0:02:13.417 отримує результати. 0:02:13.417,0:02:17.286 Коли Ви спитали [br]Скільки часу займає подорож до Марсу? 0:02:17.286,0:02:21.075 пошукова машина шукає кожне з цих слів[br]у пошуковому індексі і одразу 0:02:21.075,0:02:25.432 має список всіх сторінок в Інтернеті, які[br]містять ці слова. 0:02:25.432,0:02:31.437 Але простий збіг повертає мільйони сторінок,[br]потрібно ще виявити найкращу відповідність 0:02:31.437,0:02:33.576 і показати її на початку. 0:02:33.576,0:02:39.344 Тут все стає складніше, бо пошукова машина[br]часом має вгадати, що саме Ви шукаєте. 0:02:39.344,0:02:43.560 Кожна пошукова машина має власний алгоритм[br]для побудови рейтингу сторінок, базуючись 0:02:43.560,0:02:45.343 на припущенні щодо того, що Вам потрібно. 0:02:45.343,0:02:50.997 Наприклад, алгоритм може перевіряти, чи [br]пошукові слова містяться у заголовку сторінки, 0:02:50.997,0:02:58.902 чи ці слова розміщені поряд, чи будь-які [br]інші розрахунки, які допоможуть краще 0:02:58.902,0:03:03.089 визначити, які сторінки Ви би хотіли[br]побачити, а які - ні. 0:03:03.089,0:03:07.944 Google винайшов найвідоміший алгоритм[br]показу найвідповідніших результатів пошуку. 0:03:07.944,0:03:12.166 Він враховує, скільки інших веб-сторінок[br]містять посилання на цю сторінку. 0:03:12.166,0:03:15.783 Ідея полягає в тому, що якщо багато інших[br]сайтів вважає, що ця сторінка є цікавою, 0:03:15.783,0:03:18.399 то можливо Вам вона теж підійде. 0:03:18.399,0:03:22.579 Цей алгоритм називається Page Rank.[br]Але не тому, що він будує рейтинг сторінок, 0:03:22.579,0:03:28.007 а тому, що він названий на честь його автора [br]та співзасновника Google - Ларі Пейджа. 0:03:28.007,0:03:31.471 Оскільки сайти можуть заробляти гроші [br]за відвідування користувачами, спамери 0:03:31.471,0:03:35.819 намагаються знайти все кращі способи[br]обіграти пошукові алгоритми, щоб їхні 0:03:35.819,0:03:38.521 сторінки показувались вище у результатах. 0:03:38.521,0:03:42.163 Пошукові машини регулярно оновлюють [br]свої алгоритми, щоб не дати фейковим 0:03:42.163,0:03:44.767 та ненадійним сайтам дістатись до вершини[br]результатів пошуку. 0:03:44.767,0:03:50.164 Але зрештою, Ви самі маєте враховувати,[br]наскільки сайт є надійним, перевіряючи 0:03:50.164,0:03:54.014 його адресу і переконуючись, що це [br]надійне джерело. 0:03:54.014,0:03:56.548 Пошукові програми постійно вдосконалюються,[br]щоб покращити алгоритми і давати 0:03:56.548,0:04:01.231 кращі результати, і швидше, ніж конкуренти. 0:04:01.231,0:04:04.943 Сучасні пошукові машини навіть використовують[br]інформацію, яку Ви явно не давали, щоб 0:04:04.943,0:04:07.463 звузити результати пошуку. 0:04:07.463,0:04:10.897 Наприклад, якщо Ви шукатимете[br]"майданчики для вигулу собак" 0:04:10.897,0:04:14.155 багато пошукових машин видасть[br]результати щодо майданчиків неподалік, 0:04:14.155,0:04:18.233 навіть якщо Ви не вказали [br]своє місце розташування. 0:04:18.233,0:04:22.481 Сучасні пошукові машини розуміють[br]більше, ніж просто слова на сторінках. 0:04:22.481,0:04:27.348 Але й їхнє значення, щоб показати[br]саме те, що Ви шукаєте. 0:04:27.348,0:04:31.756 Наприклад, якщо Ви шукаєте [br]"найшдвиший пітчер" 0:04:31.756,0:04:34.590 Ви отримаєте інформацію про спортсмена. 0:04:34.680,0:04:37.840 Якщо ж Ви шукаєте "найбільший пітчер",[br]то отримаєте інформацію про глечик. 0:04:39.474,0:04:42.435 Щоб краще розуміти слова, ми використовуємо[br]так зване машинне навчання. 0:04:42.435,0:04:44.539 Це вид штучного інтелекту, який допомагає [br]пошуковим алгоритмам не лише знаходити 0:04:47.257,0:04:50.993 окремі слова чи фрази на сторінках,[br]але й розуміти значення цих слів. 0:04:50.993,0:04:57.432 Інтернет експоненціально зростає, [br]але якщо команди, які відповідають 0:04:57.432,0:05:00.234 за розробку пошукових машин, добре[br]виконуватимуть свою роботу, 0:05:00.234,0:05:04.306 то інформація, яка Вам потрібна, завжди[br]буде доступна за кілька кліків.