WEBVTT 00:00:01.640 --> 00:00:04.880 Колись, щоб комп'ютер для вас щось зробив, 00:00:04.890 --> 00:00:06.450 його потрібно було спочатку запрограмувати. 00:00:06.450 --> 00:00:09.860 Тим з присутніх, хто ніколи сам не програмував, я поясню, що для цього 00:00:09.860 --> 00:00:13.360 доводиться до найменших подробиць описувати 00:00:13.360 --> 00:00:16.730 кожну-кожнісіньку комп'ютерну команду, 00:00:16.730 --> 00:00:19.100 щоб досягнути своєї мети. 00:00:19.100 --> 00:00:22.590 А якщо ви не знаєте, як і що потрібно виконати, 00:00:22.590 --> 00:00:24.650 завдання стає величезним викликом. 00:00:24.650 --> 00:00:28.080 Перед таким викликом опинився Артур Семюел. 00:00:28.130 --> 00:00:32.210 В 1956 році він хотів налаштувати комп'ютер таким чином, 00:00:32.210 --> 00:00:34.550 щоб той виграв у нього в шашки. 00:00:34.550 --> 00:00:36.590 Як можна вручну написати програму, 00:00:36.590 --> 00:00:39.690 яка дозволить грати краще за тебе в шашки? 00:00:40.390 --> 00:00:42.120 Нарешті, він здогадався: 00:00:42.120 --> 00:00:45.840 він налаштував комп'ютер грати проти самого себе тисячі разів 00:00:45.840 --> 00:00:48.360 і таким чином навчив його грати в шашки. 00:00:48.360 --> 00:00:51.540 І це насправді спрацювало, бо до 1962 року 00:00:51.540 --> 00:00:55.248 цей комп'ютер вже переграв чемпіона штату Конектикут. 00:00:55.558 --> 00:00:58.528 Так Артур Семюел започаткував комп'ютерне навчання, 00:00:58.528 --> 00:01:00.258 і я вдячний йому за це, 00:01:00.258 --> 00:01:03.008 адже я - експерт з комп'ютерного навчання. 00:01:03.008 --> 00:01:04.708 Я був президентом спільноти Kaggle, 00:01:04.708 --> 00:01:07.908 в якій більше 200 тисяч експертів з комп'ютерного навчання. 00:01:07.908 --> 00:01:09.928 Kaggle влаштовує змагання 00:01:09.928 --> 00:01:13.628 з розв'язання задач, які раніше не було розв'язано. 00:01:13.628 --> 00:01:17.288 Сотні змагань завершилися блискуче. 00:01:17.468 --> 00:01:19.938 Ось в такому сприятливому середовищі 00:01:19.938 --> 00:01:23.888 я дізнався, що комп'ютерне навчання могло для нас зробити в минулому, 00:01:23.888 --> 00:01:25.818 а також зараз і в майбутньому. 00:01:25.818 --> 00:01:30.678 Напевно, Google - найбільший комерційний успіх комп'ютерного навчання. 00:01:30.678 --> 00:01:33.778 Google показав, що можна використовувати 00:01:33.778 --> 00:01:36.648 алгоритм на основі комп'ютерного навчання 00:01:36.648 --> 00:01:38.238 для пошуку інформації. 00:01:38.438 --> 00:01:42.198 З того часу комп'ютерне навчання мало великий комерційний успіх. 00:01:42.318 --> 00:01:45.244 Компанії Amazon і Netflix використовують комп'ютерне навчання 00:01:45.250 --> 00:01:47.878 для маркетингу товарів, що можуть вам сподобатись, 00:01:47.878 --> 00:01:49.898 і фільмів, які ви захочете подивитись. 00:01:49.898 --> 00:01:51.698 Інколи від того стає моторошно. 00:01:51.698 --> 00:01:53.658 Такі компанії як LinkedIn та Facebook 00:01:53.658 --> 00:01:56.248 показують хто, можливо, є вашим другом, 00:01:56.248 --> 00:01:58.228 а ви й не здогадуєтесь, як це налаштовано. 00:01:58.228 --> 00:02:01.196 Вони використовують можливості комп'ютерного навчання. 00:02:01.196 --> 00:02:04.146 Це алгоритми, які навчились опрацьовувати дані, 00:02:04.146 --> 00:02:07.396 а не були запрограмовані вручну. 00:02:07.396 --> 00:02:09.886 Саме тому IBM вдалося за допомогою комп'ютера Watson 00:02:09.886 --> 00:02:12.226 перемогти двох світових лідерів у грі "Jeopardy", 00:02:12.226 --> 00:02:14.282 відповівши на складні питання, як-от: 00:02:14.282 --> 00:02:16.954 "В 2003 році старовинна пластина "Лев з Німруду" зникла 00:02:16.954 --> 00:02:19.996 з національного музею цього міста (разом з іншими експонатами)". 00:02:20.756 --> 00:02:23.525 Завдяки саме цій технології ми маємо самокеровані автівки. 00:02:23.525 --> 00:02:28.492 Доволі важливо, скажімо, відрізняти дерево від пішохода. 00:02:28.492 --> 00:02:31.422 Ми не знаємо, як написати таку програму, 00:02:31.422 --> 00:02:34.072 але завдяки комп'ютерному навчанню тепер це можливо. 00:02:34.072 --> 00:02:37.412 Власне кажучи, це авто проїхало понад мільйон миль 00:02:37.412 --> 00:02:39.692 звичайними дорогами і без жодної аварії. 00:02:41.432 --> 00:02:44.112 Тепер ми знаємо, що комп'ютери здатні вчитися, 00:02:44.112 --> 00:02:46.132 а також вони здатні навчитися робити речі, 00:02:46.132 --> 00:02:48.852 яких ми не вміємо робити, 00:02:48.852 --> 00:02:51.733 або вони зроблять їх краще за нас. 00:02:51.733 --> 00:02:55.943 Чудовим прикладом комп'ютерного навчання 00:02:55.943 --> 00:02:58.323 був проект Kaggle під моїм керівництвом, 00:02:58.323 --> 00:03:01.913 на якому група Geoffrey Hinton 00:03:01.913 --> 00:03:03.463 з університету Торонто 00:03:03.463 --> 00:03:05.843 перемогла в змаганні з автоматичного підбору ліків. 00:03:06.143 --> 00:03:08.993 Незвичайним було не тільки те, що вони обійшли 00:03:08.993 --> 00:03:13.003 компанію Merck і міжнародну академічну спільноту в розробці алгоритму, 00:03:13.003 --> 00:03:18.056 а й те, що жоден з членів команди не мав освіти з хімії, біології чи медичних наук, 00:03:18.056 --> 00:03:20.226 а виконали вони це завдання за два тижні. 00:03:20.226 --> 00:03:22.416 Як їм це вдалось? 00:03:22.416 --> 00:03:25.336 Вони використали надзвичайний алгоритм глибинного навчання. 00:03:25.336 --> 00:03:28.216 Ця подія була настільки важливою, що про її успіх написали 00:03:28.286 --> 00:03:31.406 на першій сторінці New York Times кілька тижнів потому. 00:03:31.406 --> 00:03:34.146 Ось на фото зліва Джеффрі Гінтон. 00:03:34.146 --> 00:03:37.736 Алгоритм глибинного навчання створено 00:03:37.736 --> 00:03:40.296 як аналог функції людського мозку 00:03:40.296 --> 00:03:44.138 і тому, теоритично, він не має обмежень у роботі. 00:03:44.138 --> 00:03:47.768 Що більше даних і часу обчислення ви додаєте, то кращим він стає. 00:03:47.768 --> 00:03:50.618 Інша надзвичайна особливість алгоритму глибинного навчання 00:03:50.618 --> 00:03:52.868 була висвітлена у статті з New York Times, 00:03:52.868 --> 00:03:54.707 і я вам її зараз продемонструю. 00:03:56.047 --> 00:04:00.427 Йдеться про здатність комп'ютерів слухати і розуміти. 00:04:00.507 --> 00:04:04.849 (Відео) Річард Рашід: "Я завершу цей огляд, 00:04:05.249 --> 00:04:09.009 звернувшись до вас китайською мовою. 00:04:09.739 --> 00:04:13.599 Суть в тому, що я використав велику кількість даних 00:04:13.599 --> 00:04:14.919 різних мовців китайською 00:04:14.919 --> 00:04:18.599 і конвертував китайський текст на мовлення 00:04:18.599 --> 00:04:25.019 за допомогою системи конвертації. 00:04:25.019 --> 00:04:29.129 Далі ми використали годину мого власного звучання 00:04:29.129 --> 00:04:31.819 для моделювання звичайної системи перетворення тексту 00:04:31.819 --> 00:04:36.361 в моє мовлення. 00:04:36.361 --> 00:04:38.901 Повторюсь: результат не є ідеальним. 00:04:38.901 --> 00:04:41.551 Насправді, там є декілька помилок. 00:04:41.551 --> 00:04:43.401 (Говорить китайською) 00:04:44.041 --> 00:04:48.421 (Оплески) 00:04:49.451 --> 00:04:52.741 Ще багато потрібно зробити в цьому напрямку". 00:04:53.021 --> 00:04:56.671 (Говорить китайською) 00:04:56.671 --> 00:05:01.351 (Оплески) 00:05:01.351 --> 00:05:04.731 Джеремі Говард: Це було на конференції з комп'ютерного навчання в Китаї. 00:05:04.741 --> 00:05:07.421 Взагалі, не часто можна розраховувати на бурхливі оплески 00:05:07.421 --> 00:05:09.011 під час наукової конференції, 00:05:09.011 --> 00:05:12.311 а ось на конференціях TEDx все може бути, тож - не соромтесь. 00:05:12.688 --> 00:05:16.048 Все, що ви тут побачили, відбулось з застосуванням глибинного навчання. 00:05:16.048 --> 00:05:17.014 (Оплески) Дякую. 00:05:17.014 --> 00:05:19.314 Транскрипція англійською - це глибинне навчання. 00:05:19.314 --> 00:05:22.844 Переклад китайською і текст у верхньому правому кутку - глибинне навчання, 00:05:22.844 --> 00:05:26.014 і відновлення голосу - також глибинне навчання. 00:05:26.014 --> 00:05:29.244 Глибинне навчання - це надзвичайний алгоритм. 00:05:29.244 --> 00:05:32.344 Здається, цей єдиний алгоритм здатен зробити майже все. 00:05:32.344 --> 00:05:35.054 І я дізнався, що на рік раніше він також навчився бачити. 00:05:35.054 --> 00:05:37.574 В німецькому змаганні з розпізнавання дорожних знаків - 00:05:37.574 --> 00:05:39.584 German Traffic Sign Recognition Benchmark - 00:05:39.584 --> 00:05:42.834 алгоритм глибинного навчання розпізнавав такі дорожні знаки, як цей. 00:05:43.654 --> 00:05:47.474 Він не тільки навчився розпізнавати знаки краще за інші алгоритми, 00:05:47.474 --> 00:05:51.264 але й зробив це вдвічі краще за людей, як засвідчив рейтинг переможців. 00:05:51.824 --> 00:05:54.044 Так до 2011 року ми вже мали перший комп'ютер, 00:05:54.044 --> 00:05:56.954 який міг бачити краще за людей. 00:05:57.439 --> 00:05:59.489 Багато змінилося з того часу. 00:05:59.489 --> 00:06:02.519 В 2012 році Google анонсував про те, що алгоритм 00:06:02.519 --> 00:06:04.999 глибинного навчання мав переглянути відео в YouTube 00:06:04.999 --> 00:06:07.841 і опрацювати дані 16 000 комп'ютерів протягом місяця. 00:06:07.861 --> 00:06:14.031 Комп'ютер, переглядаючи відео, вивчив концепції "люди" і "коти". 00:06:14.031 --> 00:06:16.381 Майже так само вчаться люди. 00:06:16.381 --> 00:06:19.121 Люди вчаться не з того, що їм кажуть, начебто вони бачать, 00:06:19.121 --> 00:06:22.451 але розуміючи, що ті речі означають. 00:06:22.451 --> 00:06:25.821 Також в 2012 році Джеффрі Гінтон, якого ми бачили раніше, 00:06:25.821 --> 00:06:28.681 переміг у відомому змаганні ImageNet, 00:06:28.681 --> 00:06:34.255 вирахувавши, що зображено на 1,5 мільйонах фотографій. 00:06:34.255 --> 00:06:37.785 На 2014 рік ми досягли 6% частоти помилок 00:06:37.785 --> 00:06:39.235 в розпізнаванні зображень. 00:06:39.235 --> 00:06:41.265 Це краще за людські результати. 00:06:41.265 --> 00:06:45.035 Комп'ютери справді добре вправляються з такими завданнями, 00:06:45.035 --> 00:06:47.314 і це вже використовують у виробництві. 00:06:47.314 --> 00:06:50.354 Наприклад, Google оголосив торік, 00:06:50.354 --> 00:06:54.334 що вони позначили на карті кожен клаптик Франції за дві години. 00:06:54.334 --> 00:06:55.994 А зробили вони це так. 00:06:55.994 --> 00:06:59.184 Вони завантажили зображення вулиць в алгоритм глибинного навчання, 00:06:59.184 --> 00:07:02.694 щоб розпізнати і прочитати номери будинків. 00:07:02.698 --> 00:07:05.088 Тільки уявіть, скільки часу знадобилось би раніше: 00:07:05.088 --> 00:07:08.268 десятки людей, багато років. 00:07:08.268 --> 00:07:10.188 Подібне відбувається в Китаї. 00:07:10.188 --> 00:07:14.218 Baidu - найбільша пошукова система в Китаї, 00:07:14.218 --> 00:07:16.498 і те, що ви бачите в верхньому лівому кутку, 00:07:16.498 --> 00:07:20.478 є прикладом фото, яке я завантажив у систему глибинного навчання Baidu. 00:07:20.478 --> 00:07:24.248 Нижче ви побачите, як система розпізнала фото 00:07:24.248 --> 00:07:26.475 і знайшла подібні йому. 00:07:26.475 --> 00:07:29.215 Підібрані фото мають подібний фон, 00:07:29.215 --> 00:07:30.855 подібний ракурс голови, 00:07:30.875 --> 00:07:32.665 деякі навіть з висунутим язичком. 00:07:32.665 --> 00:07:35.595 Зрозуміло, пошук відбувся не за текстом веб-сторінки. 00:07:35.595 --> 00:07:37.105 Я завантажив тільки фотографію. 00:07:37.105 --> 00:07:41.125 Тепер ми маємо комп'ютери, які дійсно розуміють, що вони бачать, 00:07:41.125 --> 00:07:42.735 і тому можуть в реальному часі 00:07:42.735 --> 00:07:46.305 вести пошук по базах сотень мільйонів зображень. 00:07:46.305 --> 00:07:49.245 Що ж означає ця здатність комп'ютерів бачити? 00:07:49.245 --> 00:07:51.295 Вони не тільки бачать. 00:07:51.295 --> 00:07:53.775 Насправді, алгоритм глибинного навчання може більше. 00:07:53.775 --> 00:07:56.565 Тепер алгоритм глибинного навчання розуміє 00:07:56.565 --> 00:07:59.385 складні речення з нюансами, як ось це. 00:07:59.385 --> 00:08:00.695 Бачите, відповідно до 00:08:00.695 --> 00:08:03.285 Стенфордської символьної системи, 00:08:03.285 --> 00:08:05.485 червона крапка зверху означає, 00:08:05.485 --> 00:08:07.385 що тут виражено негативний сантимент. 00:08:07.385 --> 00:08:10.805 Алгоритм глибинного навчання вже наближається до людського розуміння, 00:08:10.805 --> 00:08:15.917 про які речі йдеться в реченні і що саме про них. 00:08:15.917 --> 00:08:19.057 Також алгоритм глибинного навчання було використано 00:08:19.057 --> 00:08:21.947 для читання китайською майже на рівні носія китайської мови. 00:08:21.947 --> 00:08:23.977 Цей алгоритм розробляли в Швейцарії люди, 00:08:23.977 --> 00:08:27.257 які не розуміють і не говорять китайською. 00:08:27.257 --> 00:08:29.607 Як вже було сказано, система глибинного навчання 00:08:29.607 --> 00:08:31.597 є найкращою в світі для таких цілей, 00:08:31.597 --> 00:08:35.877 навіть у порівнянні з носієм мови. 00:08:36.717 --> 00:08:41.627 Всі ці функції моя компанія зібрала в єдину систему. 00:08:41.627 --> 00:08:44.187 Ось малюнки без тексту. 00:08:44.187 --> 00:08:46.537 Я ввожу сюди речення, 00:08:46.537 --> 00:08:49.517 система одночасно розпізнає, що зображено на цих малюнках, 00:08:49.517 --> 00:08:51.187 а потім шукає малюнки, 00:08:51.187 --> 00:08:54.354 які відповідають введеному тексту. 00:08:54.354 --> 00:08:57.184 Отже, ви бачите, що система насправді розпізнає мої речення 00:08:57.184 --> 00:08:59.334 і також розпізнає ці малюнки. 00:08:59.334 --> 00:09:01.904 Я знаю - щось подібне вже є у Google, 00:09:01.904 --> 00:09:04.644 де ви вводите текст, і він знайде вам відповідний малюнок, 00:09:04.644 --> 00:09:08.094 але насправді буде знайдено веб-сторінку відповідно до тексту. 00:09:08.094 --> 00:09:11.094 Розпізнавання зображення - це зовсім інша справа. 00:09:11.094 --> 00:09:14.354 Лише кілька місяців тому комп'ютерові вдалося зробити це вперше. 00:09:17.104 --> 00:09:21.184 Тепер ми переконались, що комп'ютери навчились не тільки бачити, а й читати, 00:09:21.184 --> 00:09:24.954 а також, як було показано, вони розпізнають те, що чують. 00:09:24.954 --> 00:09:28.394 Можливо, я вас вже не здивую, коли я скажу, що вони вміють і писати. 00:09:28.394 --> 00:09:33.174 Ось текст, який я вчора згенерував, з алгоритмом глибинного навчання. 00:09:33.174 --> 00:09:36.474 А ось текст, що було згенеровано Стенфордською системою. 00:09:36.474 --> 00:09:38.854 Кожне з цих речень було створено за допомогою 00:09:38.854 --> 00:09:43.114 алгоритму глибинного навчання для опису цих малюнків. 00:09:43.114 --> 00:09:45.444 Цей алгоритм ніколи раніше не бачив 00:09:45.444 --> 00:09:47.584 чоловіка в чорній сорочці з гітарою в руках. 00:09:47.584 --> 00:09:50.254 Він бачив раніше чоловіка, він бачив раніше чорний колір, 00:09:50.254 --> 00:09:51.404 він бачив раніше гітару, 00:09:51.404 --> 00:09:55.694 але цей новий опис малюнка він створив самостійно. 00:09:55.694 --> 00:09:59.204 Поки ми ще не досягли рівня людських можливостей, але ми дуже близько. 00:09:59.204 --> 00:10:01.504 Тестування показало, що кожна четверта людина 00:10:01.504 --> 00:10:04.451 обирала згенерований комп'ютером варіант. 00:10:04.451 --> 00:10:06.321 Ця система існує тільки два тижні, 00:10:06.321 --> 00:10:08.791 тож за таких темпів протягом наступного року 00:10:08.791 --> 00:10:13.340 комп'ютерний алгоритм перевершить людські можливості. 00:10:13.340 --> 00:10:16.420 Отже, комп'ютери можуть також писати. 00:10:16.420 --> 00:10:19.890 Якщо складемо все до купи, то матимемо дуже цікаві перспективи. 00:10:19.890 --> 00:10:21.380 Наприклад, в медицині: 00:10:21.380 --> 00:10:23.910 бостонська команда оголосила, що вони відкрили 00:10:23.910 --> 00:10:26.910 десятки нових важливих клінічних характеристик пухлин, 00:10:26.910 --> 00:10:32.220 які допоможуть лікарям прогнозувати розвиток раку. 00:10:32.220 --> 00:10:37.860 Так само, група в Стенфорді оголосила 00:10:37.860 --> 00:10:40.560 про розроблену на основі огляду тканин під збільшенням 00:10:40.560 --> 00:10:43.140 систему комп'ютерного навчання, яка 00:10:43.140 --> 00:10:47.430 визначає шанси на виживання хворих на рак краще за патологів. 00:10:47.430 --> 00:10:50.760 Завдяки цим двом розробкам не тільки прогнози стали точнішими, 00:10:50.760 --> 00:10:53.280 а й було започатковано нову інформативну науку. 00:10:53.280 --> 00:10:56.980 В першому випадку це були нові, зрозумілі радіологам клінічні індикатори. 00:10:56.980 --> 00:10:59.670 У випадку патології, комп'ютерна система фактично 00:10:59.670 --> 00:11:04.170 винайшла, що оточення ракових клітин так само важливе 00:11:04.170 --> 00:11:09.260 при визначенні діагнозу, як і самі ракові клітини. 00:11:09.260 --> 00:11:14.630 Це спростовує інформацію, якої навчали патологів роками. 00:11:14.630 --> 00:11:17.910 В розробці систем брали участь медичні експерти 00:11:17.910 --> 00:11:21.530 та фахівці з комп'ютерного навчання, 00:11:21.530 --> 00:11:24.280 але з минулого року ми пішли ще далі. 00:11:24.280 --> 00:11:27.820 Це приклад виявлених за допомогою мікроскопа 00:11:27.820 --> 00:11:30.350 ракових областей тканини людського тіла. 00:11:30.350 --> 00:11:33.970 Ця система може виявити 00:11:33.970 --> 00:11:37.040 такі області точніше, або так само точно, 00:11:37.040 --> 00:11:39.720 як патологи, але створена вона виключно за допомогою 00:11:39.720 --> 00:11:41.960 глибинного навчання, без медичної експертизи, 00:11:41.960 --> 00:11:44.730 людьми без спеціальних знань в цій області. 00:11:44.730 --> 00:11:47.190 Ось приклад нейронного поділу. 00:11:47.190 --> 00:11:50.810 Тепер ми можемо поділяти нейрони так само точно, як людина, 00:11:50.810 --> 00:11:53.690 але систему було розроблено за допомогою глибинного навчання 00:11:53.690 --> 00:11:56.920 людьми, що не мали базових знань в медицині. 00:11:56.920 --> 00:12:00.150 Я не маю базових знать в медицині, проте 00:12:00.150 --> 00:12:02.020 виявляюсь достатньо кваліфікованим, щоб 00:12:02.020 --> 00:12:04.110 започаткувати нову медичну компанію, 00:12:04.110 --> 00:12:06.020 що я і зробив. 00:12:06.020 --> 00:12:07.710 Мене жахала така ідея, але в теорії 00:12:07.710 --> 00:12:10.650 здавалось цілком можливим виконувати важливу медичну роботу, 00:12:10.650 --> 00:12:16.140 використовуючи тільки ці техніки аналізу даних. 00:12:16.140 --> 00:12:18.620 На щастя, відгуки були фантастичні 00:12:18.620 --> 00:12:23.320 не тільки в медіа, а й серед прихильної медичної спільноти. 00:12:23.320 --> 00:12:27.470 Теоритично ми можемо всебічно аналізувати дані 00:12:27.470 --> 00:12:30.360 проміжного етапу медичного процесу, 00:12:30.360 --> 00:12:33.430 а лікарям залишити їх роботу. 00:12:33.430 --> 00:12:35.030 Я наведу приклад. 00:12:35.030 --> 00:12:37.360 Щоб згенерувати новий медичний діагностичний тест, 00:12:37.360 --> 00:12:39.980 нам потрібно 15 хвилин. 00:12:39.980 --> 00:12:41.930 Я продемонструю це прямо зараз, 00:12:41.930 --> 00:12:45.420 тільки я видалив деякі частини, щоб скоротити його до трьох хвилин. 00:12:45.420 --> 00:12:48.500 Замість створення медичного клінічного тесту, 00:12:48.500 --> 00:12:51.850 я покажу вам тест діагностики зображень автівок, 00:12:51.850 --> 00:12:54.070 щоб усім було зрозуміло. 00:12:54.070 --> 00:12:55.090 Отже, ми починаємо 00:12:55.090 --> 00:12:57.670 з приблизно 1,5 мільйонів зображень автівок. 00:12:57.670 --> 00:12:59.850 Я хочу створити інструмент для сортування 00:12:59.850 --> 00:13:02.700 їх відповідно до кута фотозйомки. 00:13:02.700 --> 00:13:04.800 Жодна фотографія не позначена, 00:13:04.800 --> 00:13:05.980 тож я почну з нуля. 00:13:05.980 --> 00:13:08.120 За допомогою алгоритму глибинного навчання, 00:13:08.120 --> 00:13:09.420 можна автоматично визначити 00:13:09.420 --> 00:13:12.170 елементи конструкції на цих зображеннях. 00:13:12.170 --> 00:13:14.550 Добре в цьому те, що людина може працювати разом 00:13:14.550 --> 00:13:15.800 з комп'ютером. 00:13:15.800 --> 00:13:17.960 Людина, як ви бачите, 00:13:17.960 --> 00:13:20.630 показує комп'ютеру 00:13:20.630 --> 00:13:22.280 стосовно якої частини 00:13:22.280 --> 00:13:24.120 комп'ютер буде 00:13:24.120 --> 00:13:25.280 вдосконалювати алгоритм. 00:13:25.280 --> 00:13:27.480 Ці системи глибинного навчання працюють в 00:13:27.480 --> 00:13:29.180 16-тисяч вимірному просторі, 00:13:29.180 --> 00:13:31.750 тож ви бачите, як комп'ютер обертає фото в просторі, 00:13:31.750 --> 00:13:35.000 намагаючись знайти нові елементи структури. 00:13:35.000 --> 00:13:36.780 Коли це йому вдасться, 00:13:36.780 --> 00:13:40.790 людина, яка керує ним, зможе вибрати потрібні елементи. 00:13:40.790 --> 00:13:45.790 Ось комп'ютер вдало знайшов елементи, наприклад, кути. 00:13:45.790 --> 00:13:47.380 Поступово, керуючи процесом, 00:13:47.380 --> 00:13:49.720 ми даємо комп'ютеру знати, які саме 00:13:49.720 --> 00:13:51.530 структури ми шукаємо. 00:13:51.530 --> 00:13:53.920 Уявіть, якби патолог під час діагностичного тесту 00:13:53.920 --> 00:13:57.170 ідентифікував області патології, 00:13:57.170 --> 00:13:58.710 або якби радіолог ідентифікував 00:13:58.710 --> 00:14:02.310 потенційно небезпечні вузлики. 00:14:02.310 --> 00:14:04.850 Іноді алгоритм не справляється. 00:14:04.850 --> 00:14:06.820 В такому разі він стає дещо безпорадний. 00:14:06.820 --> 00:14:11.450 Передні та задні частини автівок перемішані. 00:14:11.450 --> 00:14:14.670 Тепер слід уважно вручну 00:14:14.670 --> 00:14:16.760 виділити тільки фронтальні, 00:14:16.760 --> 00:14:19.310 щоб зорієнтувати комп'ютер на саме 00:14:19.310 --> 00:14:21.520 цей тип групування, який нас цікавить. 00:14:21.520 --> 00:14:23.080 Ми це робимо деякий час, 00:14:23.080 --> 00:14:24.780 я перескочу трохи, 00:14:24.780 --> 00:14:26.890 потім ми тренуємо алгоритм глибинного навчання 00:14:26.890 --> 00:14:28.800 на основі кількох сотень деталей 00:14:28.800 --> 00:14:30.450 і сподіваємось, що він навчився. 00:14:30.450 --> 00:14:32.460 Бачите, він почав прибирати 00:14:32.460 --> 00:14:33.740 деякі з малюнків, 00:14:33.740 --> 00:14:35.410 показуючи цим, що він вже розрізняє, 00:14:35.410 --> 00:14:38.230 як це робити самостійно. 00:14:38.230 --> 00:14:41.130 Тепер можна використати концепцію подібних зображень. 00:14:41.130 --> 00:14:43.230 І ви бачите, що комп'ютер тепер 00:14:43.230 --> 00:14:47.250 здатен знайти тільки передні частини машин. 00:14:47.250 --> 00:14:53.660 Отже, можна визнати, що комп'ютер вправно виконав завдання. 00:14:53.660 --> 00:14:59.530 Іноді буває так, що й після цього складно відсортувати групи. 00:14:59.530 --> 00:15:03.400 В такому випадку після деякого часу 00:15:03.400 --> 00:15:05.930 обертання зображень, 00:15:05.930 --> 00:15:08.220 лівосторонні і правосторонні все ще перемішані. 00:15:08.220 --> 00:15:10.360 Тоді ми знову підказуємо комп'ютеру 00:15:10.360 --> 00:15:13.200 і командуємо йому знайти 00:15:13.200 --> 00:15:15.400 за допомогою алгоритму глибинного навчання 00:15:15.400 --> 00:15:18.090 проекцію, яка відсортує лівосторонні від правосторонніх. 00:15:18.090 --> 00:15:21.010 І після такої підказки - ага, ок, цей процес завершено. 00:15:21.010 --> 00:15:26.270 Йому вдалось відсортувати ці об'єкти. 00:15:26.270 --> 00:15:28.730 В чому ідея? 00:15:28.730 --> 00:15:32.250 Йдеться не про заміщення людини комп'ютером, а про співпрацю. 00:15:39.550 --> 00:15:43.110 Те, що могла зробити команда з 5-6 людей 00:15:43.110 --> 00:15:45.100 за майже 7 років, одна людина зробить 00:15:45.100 --> 00:15:47.880 самостійно за 15 хвилин. 00:15:50.240 --> 00:15:53.690 Для такого процесу потрібно 4 або 5 повторювань. 00:15:53.690 --> 00:15:56.020 Бачите, 62 відсотки з 1,5 мільйонів зображень 00:15:56.020 --> 00:15:57.560 відсортовано правильно. 00:15:58.980 --> 00:16:02.760 Тепер можна доволі швидко перевіряти великі масиви 00:16:02.760 --> 00:16:05.680 на присутність там помилок. 00:16:05.680 --> 00:16:09.600 Якщо такі знайдуться, вкажемо комп'ютерові на них. 00:16:09.600 --> 00:16:12.660 Застосувавши той самий процес 00:16:12.660 --> 00:16:14.630 для кожної окремої групи, 00:16:14.630 --> 00:16:17.560 матимемо результат: 80 % з 1,5 мільйона зображень успішно класифіковано. 00:16:17.560 --> 00:16:19.640 Залишиться тільки 00:16:19.640 --> 00:16:23.220 знайти невелику кількість хибно класифікованих об'єктів 00:16:23.220 --> 00:16:25.810 і розібратись з ними. 00:16:25.810 --> 00:16:27.840 Завдяки цьому підходові, ми за 15 хвилин 00:16:27.840 --> 00:16:31.970 досягли 97 % рівня класифікування. 00:16:31.970 --> 00:16:36.580 Такі прийоми дають нам змогу побороти 00:16:36.580 --> 00:16:39.610 величезний брак медичної експертизи в світі. 00:16:39.610 --> 00:16:42.100 Згідно з даними Світового економічного форуму, 00:16:42.100 --> 00:16:45.290 країнам, що розвиваються, в 10-20 разів бракує терапевтів, 00:16:45.290 --> 00:16:47.840 і знадобиться 300 років, аби навчити достатньо людей, 00:16:47.840 --> 00:16:50.590 які могли б компенсувати цей брак. 00:16:50.590 --> 00:16:53.690 Уявіть, наскільки ми можемо покращити результати їхньої діяльності 00:16:53.690 --> 00:16:56.460 завдяки підходу глибинного навчання. 00:16:56.460 --> 00:16:58.690 Мене дуже надихають такі перспективи. 00:16:58.690 --> 00:17:01.280 Водночас, я стурбований проблемами. 00:17:01.280 --> 00:17:04.390 Кожна територія на мапі, зафарбована синім кольором, є місцем, 00:17:04.390 --> 00:17:08.170 де 80 % зайнятості припадає на послуги. 00:17:08.170 --> 00:17:09.960 Які послуги? 00:17:09.960 --> 00:17:11.470 Ось ці. 00:17:11.470 --> 00:17:15.630 Такі, що комп'ютери тільки навчилися виконувати. 00:17:15.630 --> 00:17:19.450 Отже, 80 % зайнятості розвинених країн - 00:17:19.450 --> 00:17:21.970 це робота, яку комп'ютери щойно навчились виконувати. 00:17:21.970 --> 00:17:23.400 До чого я веду? 00:17:23.400 --> 00:17:24.830 Авжеж, все буде добре. 00:17:24.830 --> 00:17:25.990 Їм знайдуть іншу роботу. 00:17:25.990 --> 00:17:28.690 Наприклад, буде більше спеціалістів з обробки даних. 00:17:28.690 --> 00:17:29.510 Не зовсім так. 00:17:29.510 --> 00:17:32.630 Спеціаліст з обробки даних швидко створює такі речі. 00:17:32.630 --> 00:17:35.600 Наприклад, ці чотири алгоритми написав один хлопець. 00:17:35.600 --> 00:17:38.330 Ви можете аргументувати, що все це вже проходили раніше, 00:17:38.330 --> 00:17:44.380 і коли речі змінювались, з'являлись нові робочі місця. 00:17:44.380 --> 00:17:46.490 А якими вони будуть? 00:17:46.490 --> 00:17:48.370 Важко сказати, тому що 00:17:48.370 --> 00:17:51.100 людська діяльність покращується поступово, 00:17:51.100 --> 00:17:53.670 а система глибинного навчання - 00:17:53.670 --> 00:17:56.860 в геометричній прогресії. 00:17:56.860 --> 00:17:57.760 Зараз ми тут. 00:17:57.760 --> 00:18:00.560 Поки що ми оцінюємо ситуацію і кажемо: "Комп'ютерам далеко 00:18:00.560 --> 00:18:03.240 до людського розуму". Правда? 00:18:03.240 --> 00:18:06.660 Але за п'ять років комп'ютери перевершать свої показники. 00:18:06.660 --> 00:18:10.530 Тож нам слід вже зараз починати думати про потенціал. 00:18:10.530 --> 00:18:12.360 Звісно, історія вже знала такі часи. 00:18:12.360 --> 00:18:13.980 Під час індустріальної революції 00:18:13.980 --> 00:18:17.670 потужності збільшилися завдяки двигунам. 00:18:17.670 --> 00:18:20.810 Справа в тому, що речі не змінювались з того часу. 00:18:20.810 --> 00:18:22.510 Існувало соціальне розшарування. 00:18:22.510 --> 00:18:25.950 Але після впровадження потужностей двигунів 00:18:25.950 --> 00:18:28.180 в усі сфери життя, воно зменшилось. 00:18:28.180 --> 00:18:29.770 Революція комп'ютерного навчання 00:18:29.770 --> 00:18:32.600 відрізняється від індустріальної. 00:18:32.600 --> 00:18:35.620 Тому що революція комп'ютерного навчання ніколи не зупиниться. 00:18:35.620 --> 00:18:38.620 Що кращою стане інтелектуальна діяльність комп'ютерів, 00:18:38.620 --> 00:18:42.860 то більше інших комп'ютерів з 00:18:42.860 --> 00:18:44.770 кращими потужностями вони створять. 00:18:44.770 --> 00:18:47.250 Світ ще ніколи не відчував змін такого масштабу. 00:18:47.250 --> 00:18:50.970 Ваші уявлення про обмеженість можливостей змінено. 00:18:50.970 --> 00:18:52.750 Ці зміни вже впливають на нас. 00:18:52.750 --> 00:18:56.400 За останні 25 років зріс кругообіг капіталу, 00:18:56.400 --> 00:19:01.420 а продуктивність праці була сталою, навіть трохи зменшилась. 00:19:01.420 --> 00:19:04.140 Тож, я заохочую нас до обговорення вже зараз. 00:19:04.150 --> 00:19:07.180 Знаю, що люди часто нехтують цим питанням, 00:19:07.180 --> 00:19:08.780 коли я до них звертаюсь. 00:19:08.780 --> 00:19:11.050 Комп'ютери не можуть розвивати думок, 00:19:11.050 --> 00:19:16.200 не мають емоцій, не розуміють поезію, ми не тямимо до кінця, як вони працюють. 00:19:16.200 --> 00:19:17.370 То що з того? 00:19:17.370 --> 00:19:19.180 Комп'ютери вже виконують речі, якими 00:19:19.180 --> 00:19:21.900 люди заробляють собі на життя. 00:19:21.900 --> 00:19:27.170 Тож нам варто подумати, як змінити наші соціальну 00:19:27.170 --> 00:19:29.860 і економічну структури, враховуючи нову реальність. 00:19:29.860 --> 00:19:30.590 Дякую. 00:19:30.590 --> 00:19:31.290 (Оплески)