WEBVTT

00:00:01.640 --> 00:00:04.880
Колись, щоб комп'ютер
для вас щось зробив,

00:00:04.890 --> 00:00:06.450
його потрібно було спочатку
запрограмувати.

00:00:06.450 --> 00:00:09.860
Тим з присутніх, хто ніколи сам не програмував,
я поясню, що для цього

00:00:09.860 --> 00:00:13.360
доводиться до найменших
подробиць описувати

00:00:13.360 --> 00:00:16.730
кожну-кожнісіньку комп'ютерну команду,

00:00:16.730 --> 00:00:19.100
щоб досягнути своєї мети.

00:00:19.100 --> 00:00:22.590
А якщо ви не знаєте, 
як і що потрібно виконати,

00:00:22.590 --> 00:00:24.650
завдання стає
величезним викликом.

00:00:24.650 --> 00:00:28.080
Перед таким викликом
опинився Артур Семюел.

00:00:28.130 --> 00:00:32.210
В 1956 році він хотів 
налаштувати комп'ютер таким чином,

00:00:32.210 --> 00:00:34.550
щоб той виграв у нього в шашки.

00:00:34.550 --> 00:00:36.590
Як можна вручну написати програму,

00:00:36.590 --> 00:00:39.690
яка дозволить грати краще за тебе в шашки?

00:00:40.390 --> 00:00:42.120
Нарешті, він здогадався:

00:00:42.120 --> 00:00:45.840
він налаштував комп'ютер грати
проти самого себе тисячі разів

00:00:45.840 --> 00:00:48.360
і таким чином навчив його грати в шашки.

00:00:48.360 --> 00:00:51.540
І це насправді спрацювало,
бо до 1962 року

00:00:51.540 --> 00:00:55.248
цей комп'ютер вже переграв 
чемпіона штату Конектикут.

00:00:55.558 --> 00:00:58.528
Так Артур Семюел започаткував 
комп'ютерне навчання,

00:00:58.528 --> 00:01:00.258
і я вдячний йому за це,

00:01:00.258 --> 00:01:03.008
адже я - експерт з комп'ютерного навчання.

00:01:03.008 --> 00:01:04.708
Я був президентом спільноти Kaggle,

00:01:04.708 --> 00:01:07.908
в якій більше 200 тисяч експертів 
з комп'ютерного навчання.

00:01:07.908 --> 00:01:09.928
Kaggle влаштовує змагання

00:01:09.928 --> 00:01:13.628
з розв'язання задач, 
які раніше не було розв'язано.

00:01:13.628 --> 00:01:17.288
Сотні змагань завершилися блискуче.

00:01:17.468 --> 00:01:19.938
Ось в такому сприятливому середовищі

00:01:19.938 --> 00:01:23.888
я дізнався, що комп'ютерне навчання
могло для нас зробити в минулому,

00:01:23.888 --> 00:01:25.818
а також зараз і в майбутньому.

00:01:25.818 --> 00:01:30.678
Напевно, Google - найбільший комерційний 
успіх комп'ютерного навчання.

00:01:30.678 --> 00:01:33.778
Google показав, що можна використовувати

00:01:33.778 --> 00:01:36.648
алгоритм на основі комп'ютерного навчання

00:01:36.648 --> 00:01:38.238
для пошуку інформації.

00:01:38.438 --> 00:01:42.198
З того часу комп'ютерне навчання мало
великий комерційний успіх.

00:01:42.318 --> 00:01:45.244
Компанії Amazon і Netflix
використовують комп'ютерне навчання

00:01:45.250 --> 00:01:47.878
для маркетингу товарів, 
що можуть вам сподобатись,

00:01:47.878 --> 00:01:49.898
і фільмів, які ви захочете подивитись.

00:01:49.898 --> 00:01:51.698
Інколи від того стає моторошно.

00:01:51.698 --> 00:01:53.658
Такі компанії як LinkedIn та Facebook

00:01:53.658 --> 00:01:56.248
показують хто, можливо, є вашим другом,

00:01:56.248 --> 00:01:58.228
а ви й не здогадуєтесь, як це налаштовано.

00:01:58.228 --> 00:02:01.196
Вони використовують можливості 
комп'ютерного навчання.

00:02:01.196 --> 00:02:04.146
Це алгоритми, 
які навчились опрацьовувати дані,

00:02:04.146 --> 00:02:07.396
а не були запрограмовані вручну.

00:02:07.396 --> 00:02:09.886
Саме тому IBM вдалося за допомогою
комп'ютера Watson

00:02:09.886 --> 00:02:12.226
перемогти двох світових лідерів 
у грі "Jeopardy",

00:02:12.226 --> 00:02:14.282
відповівши на складні питання, 
як-от:

00:02:14.282 --> 00:02:16.954
"В 2003 році старовинна пластина 
"Лев з Німруду" зникла

00:02:16.954 --> 00:02:19.996
з національного музею 
цього міста (разом з іншими експонатами)".

00:02:20.756 --> 00:02:23.525
Завдяки саме цій технології ми маємо 
самокеровані автівки.

00:02:23.525 --> 00:02:28.492
Доволі важливо, скажімо, 
відрізняти дерево від пішохода.

00:02:28.492 --> 00:02:31.422
Ми не знаємо, як написати таку програму, 


00:02:31.422 --> 00:02:34.072
але завдяки комп'ютерному навчанню
тепер це можливо.

00:02:34.072 --> 00:02:37.412
Власне кажучи, це авто проїхало 
понад мільйон миль

00:02:37.412 --> 00:02:39.692
звичайними дорогами і без жодної аварії.

00:02:41.432 --> 00:02:44.112
Тепер ми знаємо, 
що комп'ютери здатні вчитися,

00:02:44.112 --> 00:02:46.132
а також вони здатні навчитися робити речі,

00:02:46.132 --> 00:02:48.852
яких ми не вміємо робити,

00:02:48.852 --> 00:02:51.733
або вони зроблять їх краще за нас.

00:02:51.733 --> 00:02:55.943
Чудовим прикладом комп'ютерного навчання

00:02:55.943 --> 00:02:58.323
був проект Kaggle під моїм керівництвом,

00:02:58.323 --> 00:03:01.913
на якому група Geoffrey Hinton 


00:03:01.913 --> 00:03:03.463
з університету Торонто

00:03:03.463 --> 00:03:05.843
перемогла в змаганні 
з автоматичного підбору ліків.

00:03:06.143 --> 00:03:08.993
Незвичайним було не тільки те, 
що вони обійшли

00:03:08.993 --> 00:03:13.003
компанію Merck і міжнародну 
академічну спільноту в розробці алгоритму,

00:03:13.003 --> 00:03:18.056
а й те, що жоден з членів команди не мав 
освіти з хімії, біології чи медичних наук,

00:03:18.056 --> 00:03:20.226
а виконали вони це завдання за два тижні.

00:03:20.226 --> 00:03:22.416
Як їм це вдалось?

00:03:22.416 --> 00:03:25.336
Вони використали надзвичайний 
алгоритм глибинного навчання.

00:03:25.336 --> 00:03:28.216
Ця подія була настільки важливою, 
що про її успіх написали

00:03:28.286 --> 00:03:31.406
на першій сторінці New York Times 
кілька тижнів потому.

00:03:31.406 --> 00:03:34.146
Ось на фото зліва Джеффрі Гінтон.

00:03:34.146 --> 00:03:37.736
Алгоритм глибинного навчання створено


00:03:37.736 --> 00:03:40.296
як аналог функції людського мозку

00:03:40.296 --> 00:03:44.138
і тому, теоритично, 
він не має обмежень у роботі.


00:03:44.138 --> 00:03:47.768
Що більше даних і часу обчислення 
ви додаєте, то кращим він стає.

00:03:47.768 --> 00:03:50.618
Інша надзвичайна особливість 
алгоритму глибинного навчання

00:03:50.618 --> 00:03:52.868
була висвітлена у статті з New York Times,

00:03:52.868 --> 00:03:54.707
і я вам її зараз продемонструю.

00:03:56.047 --> 00:04:00.427
Йдеться про здатність комп'ютерів 
слухати і розуміти.

00:04:00.507 --> 00:04:04.849
(Відео) Річард Рашід: 
"Я завершу цей огляд,

00:04:05.249 --> 00:04:09.009
звернувшись до вас китайською мовою.

00:04:09.739 --> 00:04:13.599
Суть в тому, 
що я використав велику кількість даних

00:04:13.599 --> 00:04:14.919
різних мовців китайською

00:04:14.919 --> 00:04:18.599
і конвертував китайський текст 
на мовлення

00:04:18.599 --> 00:04:25.019
за допомогою системи конвертації.

00:04:25.019 --> 00:04:29.129
Далі ми використали годину 
мого власного звучання

00:04:29.129 --> 00:04:31.819
для моделювання звичайної 
системи перетворення тексту

00:04:31.819 --> 00:04:36.361
в моє мовлення.

00:04:36.361 --> 00:04:38.901
Повторюсь: результат не є ідеальним.

00:04:38.901 --> 00:04:41.551
Насправді, там є декілька помилок.

00:04:41.551 --> 00:04:43.401
(Говорить китайською)

00:04:44.041 --> 00:04:48.421
(Оплески)

00:04:49.451 --> 00:04:52.741
Ще багато потрібно зробити 
в цьому напрямку".

00:04:53.021 --> 00:04:56.671
(Говорить китайською)

00:04:56.671 --> 00:05:01.351
(Оплески)

00:05:01.351 --> 00:05:04.731
Джеремі Говард: Це було на конференції 
з комп'ютерного навчання в Китаї.

00:05:04.741 --> 00:05:07.421
Взагалі, не часто можна розраховувати на
бурхливі оплески

00:05:07.421 --> 00:05:09.011
під час наукової конференції,

00:05:09.011 --> 00:05:12.311
а ось на конференціях TEDx все може бути,
тож - не соромтесь.

00:05:12.688 --> 00:05:16.048
Все, що ви тут побачили, відбулось
з застосуванням глибинного навчання.

00:05:16.048 --> 00:05:17.014
(Оплески) Дякую.

00:05:17.014 --> 00:05:19.314
Транскрипція англійською - 
це глибинне навчання.

00:05:19.314 --> 00:05:22.844
Переклад китайською і текст у верхньому 
правому кутку - глибинне навчання,

00:05:22.844 --> 00:05:26.014
і відновлення голосу - 
також глибинне навчання.

00:05:26.014 --> 00:05:29.244
Глибинне навчання - 
це надзвичайний алгоритм.

00:05:29.244 --> 00:05:32.344
Здається, цей єдиний алгоритм 
здатен зробити майже все.

00:05:32.344 --> 00:05:35.054
І я дізнався, що на рік раніше 
він також навчився бачити.

00:05:35.054 --> 00:05:37.574
В німецькому змаганні 
з розпізнавання дорожних знаків -

00:05:37.574 --> 00:05:39.584
German Traffic Sign 
Recognition Benchmark -

00:05:39.584 --> 00:05:42.834
алгоритм глибинного навчання 
розпізнавав такі дорожні знаки, як цей.

00:05:43.654 --> 00:05:47.474
Він не тільки навчився розпізнавати знаки 
краще за інші алгоритми,

00:05:47.474 --> 00:05:51.264
але й зробив це вдвічі краще за людей,
як засвідчив рейтинг переможців.

00:05:51.824 --> 00:05:54.044
Так до 2011 року 
ми вже мали перший комп'ютер,

00:05:54.044 --> 00:05:56.954
який міг бачити краще за людей.

00:05:57.439 --> 00:05:59.489
Багато змінилося з того часу.

00:05:59.489 --> 00:06:02.519
В 2012 році Google анонсував про те, 
що алгоритм

00:06:02.519 --> 00:06:04.999
глибинного навчання 
мав переглянути відео в YouTube

00:06:04.999 --> 00:06:07.841
і опрацювати дані 16 000 комп'ютерів 
протягом місяця.

00:06:07.861 --> 00:06:14.031
Комп'ютер, переглядаючи відео, 
вивчив концепції "люди" і "коти".

00:06:14.031 --> 00:06:16.381
Майже так само вчаться люди.

00:06:16.381 --> 00:06:19.121
Люди вчаться не з того, 
що їм кажуть, начебто вони бачать,

00:06:19.121 --> 00:06:22.451
але розуміючи, що ті речі означають.

00:06:22.451 --> 00:06:25.821
Також в 2012 році Джеффрі Гінтон, 
якого ми бачили раніше,

00:06:25.821 --> 00:06:28.681
переміг у відомому змаганні ImageNet,

00:06:28.681 --> 00:06:34.255
вирахувавши, що зображено 
на 1,5 мільйонах фотографій.

00:06:34.255 --> 00:06:37.785
На 2014 рік ми досягли 6% частоти помилок

00:06:37.785 --> 00:06:39.235
в розпізнаванні зображень.

00:06:39.235 --> 00:06:41.265
Це краще за людські результати.

00:06:41.265 --> 00:06:45.035
Комп'ютери справді добре вправляються 
з такими завданнями,

00:06:45.035 --> 00:06:47.314
і це вже використовують у виробництві.

00:06:47.314 --> 00:06:50.354
Наприклад, Google оголосив торік,

00:06:50.354 --> 00:06:54.334
що вони позначили на карті 
кожен клаптик Франції за дві години.

00:06:54.334 --> 00:06:55.994
А зробили вони це так.

00:06:55.994 --> 00:06:59.184
Вони завантажили зображення вулиць 
в алгоритм глибинного навчання,

00:06:59.184 --> 00:07:02.694
щоб розпізнати і 
прочитати номери будинків.

00:07:02.698 --> 00:07:05.088
Тільки уявіть, 
скільки часу знадобилось би раніше:

00:07:05.088 --> 00:07:08.268
десятки людей, багато років.

00:07:08.268 --> 00:07:10.188
Подібне відбувається в Китаї.

00:07:10.188 --> 00:07:14.218
Baidu - найбільша пошукова система 
в Китаї,

00:07:14.218 --> 00:07:16.498
і те, що ви бачите 
в верхньому лівому кутку,

00:07:16.498 --> 00:07:20.478
є прикладом фото, яке я завантажив 
у систему глибинного навчання Baidu.

00:07:20.478 --> 00:07:24.248
Нижче ви побачите, 
як система розпізнала фото

00:07:24.248 --> 00:07:26.475
і знайшла подібні йому.

00:07:26.475 --> 00:07:29.215
Підібрані фото мають подібний фон,

00:07:29.215 --> 00:07:30.855
подібний ракурс голови,

00:07:30.875 --> 00:07:32.665
деякі навіть з висунутим язичком.

00:07:32.665 --> 00:07:35.595
Зрозуміло, пошук відбувся 
не за текстом веб-сторінки.

00:07:35.595 --> 00:07:37.105
Я завантажив тільки фотографію.

00:07:37.105 --> 00:07:41.125
Тепер ми маємо комп'ютери, які
дійсно розуміють, що вони бачать,

00:07:41.125 --> 00:07:42.735
і тому можуть в реальному часі

00:07:42.735 --> 00:07:46.305
вести пошук по базах 
сотень мільйонів зображень.

00:07:46.305 --> 00:07:49.245
Що ж означає ця здатність 
комп'ютерів бачити?

00:07:49.245 --> 00:07:51.295
Вони не тільки бачать.

00:07:51.295 --> 00:07:53.775
Насправді, алгоритм глибинного навчання 
може більше.

00:07:53.775 --> 00:07:56.565
Тепер алгоритм глибинного навчання розуміє

00:07:56.565 --> 00:07:59.385
складні речення з нюансами, як ось це.

00:07:59.385 --> 00:08:00.695
Бачите, відповідно до

00:08:00.695 --> 00:08:03.285
Стенфордської символьної системи,

00:08:03.285 --> 00:08:05.485
червона крапка зверху означає,


00:08:05.485 --> 00:08:07.385
що тут виражено негативний сантимент.

00:08:07.385 --> 00:08:10.805
Алгоритм глибинного навчання вже 
наближається до людського розуміння,

00:08:10.805 --> 00:08:15.917
про які речі йдеться в реченні
і що саме про них.

00:08:15.917 --> 00:08:19.057
Також алгоритм глибинного навчання 
було використано

00:08:19.057 --> 00:08:21.947
для читання китайською майже 
на рівні носія китайської мови.

00:08:21.947 --> 00:08:23.977
Цей алгоритм розробляли в Швейцарії люди, 


00:08:23.977 --> 00:08:27.257
які не розуміють і не говорять китайською.

00:08:27.257 --> 00:08:29.607
Як вже було сказано, 
система глибинного навчання

00:08:29.607 --> 00:08:31.597
є найкращою в світі для таких цілей, 


00:08:31.597 --> 00:08:35.877
навіть у порівнянні з носієм мови.

00:08:36.717 --> 00:08:41.627
Всі ці функції моя компанія зібрала 
в єдину систему.

00:08:41.627 --> 00:08:44.187
Ось малюнки без тексту.

00:08:44.187 --> 00:08:46.537
Я ввожу сюди речення,

00:08:46.537 --> 00:08:49.517
система одночасно розпізнає,
що зображено на цих малюнках,

00:08:49.517 --> 00:08:51.187
а потім шукає малюнки,

00:08:51.187 --> 00:08:54.354
які відповідають введеному тексту.

00:08:54.354 --> 00:08:57.184
Отже, ви бачите, що система насправді 
розпізнає мої речення

00:08:57.184 --> 00:08:59.334
і також розпізнає ці малюнки.

00:08:59.334 --> 00:09:01.904
Я знаю - щось подібне вже є у Google,

00:09:01.904 --> 00:09:04.644
де ви вводите текст,
і він знайде вам відповідний малюнок,

00:09:04.644 --> 00:09:08.094
але насправді буде знайдено 
веб-сторінку відповідно до тексту.

00:09:08.094 --> 00:09:11.094
Розпізнавання зображення - 
це зовсім інша справа.

00:09:11.094 --> 00:09:14.354
Лише кілька місяців тому
комп'ютерові вдалося зробити це вперше.

00:09:17.104 --> 00:09:21.184
Тепер ми переконались, що комп'ютери 
навчились не тільки бачити, а й читати,

00:09:21.184 --> 00:09:24.954
а також, як було показано, 
вони розпізнають те, що чують.

00:09:24.954 --> 00:09:28.394
Можливо, я вас вже не здивую, 
коли я скажу, що вони вміють і писати.

00:09:28.394 --> 00:09:33.174
Ось текст, який я вчора згенерував, 
з алгоритмом глибинного навчання.

00:09:33.174 --> 00:09:36.474
А ось текст, що було згенеровано 
Стенфордською системою.

00:09:36.474 --> 00:09:38.854
Кожне з цих речень було створено 
за допомогою

00:09:38.854 --> 00:09:43.114
алгоритму глибинного навчання 
для опису цих малюнків.

00:09:43.114 --> 00:09:45.444
Цей алгоритм ніколи раніше не бачив

00:09:45.444 --> 00:09:47.584
чоловіка в чорній сорочці 
з гітарою в руках.

00:09:47.584 --> 00:09:50.254
Він бачив раніше чоловіка,
він бачив раніше чорний колір,

00:09:50.254 --> 00:09:51.404
він бачив раніше гітару,

00:09:51.404 --> 00:09:55.694
але цей новий опис малюнка 
він створив самостійно.

00:09:55.694 --> 00:09:59.204
Поки ми ще не досягли рівня 
людських можливостей, але ми дуже близько.

00:09:59.204 --> 00:10:01.504
Тестування показало, 
що кожна четверта людина

00:10:01.504 --> 00:10:04.451
обирала згенерований комп'ютером варіант.

00:10:04.451 --> 00:10:06.321
Ця система існує тільки два тижні,

00:10:06.321 --> 00:10:08.791
тож за таких темпів протягом 
наступного року

00:10:08.791 --> 00:10:13.340
комп'ютерний алгоритм перевершить
людські можливості.

00:10:13.340 --> 00:10:16.420
Отже, комп'ютери можуть також писати.

00:10:16.420 --> 00:10:19.890
Якщо складемо все до купи, 
то матимемо дуже цікаві перспективи.

00:10:19.890 --> 00:10:21.380
Наприклад, в медицині: 


00:10:21.380 --> 00:10:23.910
бостонська команда оголосила, 
що вони відкрили

00:10:23.910 --> 00:10:26.910
десятки нових важливих 
клінічних характеристик пухлин,

00:10:26.910 --> 00:10:32.220
які допоможуть лікарям прогнозувати 
розвиток раку.

00:10:32.220 --> 00:10:37.860
Так само, група в Стенфорді оголосила

00:10:37.860 --> 00:10:40.560
про розроблену на основі огляду тканин 
під збільшенням

00:10:40.560 --> 00:10:43.140
систему комп'ютерного навчання, яка

00:10:43.140 --> 00:10:47.430
визначає шанси на виживання хворих на рак 
краще за патологів.

00:10:47.430 --> 00:10:50.760
Завдяки цим двом розробкам 
не тільки прогнози стали точнішими,

00:10:50.760 --> 00:10:53.280
а й було започатковано 
нову інформативну науку.

00:10:53.280 --> 00:10:56.980
В першому випадку це були нові, 
зрозумілі радіологам клінічні індикатори.

00:10:56.980 --> 00:10:59.670
У випадку патології, 
комп'ютерна система фактично

00:10:59.670 --> 00:11:04.170
винайшла, що оточення ракових клітин 
так само важливе

00:11:04.170 --> 00:11:09.260
при визначенні діагнозу, 
як і самі ракові клітини.

00:11:09.260 --> 00:11:14.630
Це спростовує інформацію, якої навчали
патологів роками.

00:11:14.630 --> 00:11:17.910
В розробці систем брали участь 
медичні експерти

00:11:17.910 --> 00:11:21.530
та фахівці з комп'ютерного навчання,

00:11:21.530 --> 00:11:24.280
але з минулого року ми пішли ще далі.

00:11:24.280 --> 00:11:27.820
Це приклад виявлених
за допомогою мікроскопа

00:11:27.820 --> 00:11:30.350
ракових областей тканини людського тіла.

00:11:30.350 --> 00:11:33.970
Ця система може виявити

00:11:33.970 --> 00:11:37.040
такі області точніше, або так само точно,

00:11:37.040 --> 00:11:39.720
як патологи, але створена вона 
виключно за допомогою

00:11:39.720 --> 00:11:41.960
глибинного навчання, 
без медичної експертизи,

00:11:41.960 --> 00:11:44.730
людьми без спеціальних знань 
в цій області.

00:11:44.730 --> 00:11:47.190
Ось приклад нейронного поділу.

00:11:47.190 --> 00:11:50.810
Тепер ми можемо поділяти нейрони 
так само точно, як людина,

00:11:50.810 --> 00:11:53.690
але систему було розроблено за допомогою 
глибинного навчання

00:11:53.690 --> 00:11:56.920
людьми, що не мали базових знань 
в медицині.

00:11:56.920 --> 00:12:00.150
Я не маю базових знать в медицині, проте

00:12:00.150 --> 00:12:02.020
виявляюсь достатньо кваліфікованим, щоб

00:12:02.020 --> 00:12:04.110
започаткувати нову медичну компанію,

00:12:04.110 --> 00:12:06.020
що я і зробив.

00:12:06.020 --> 00:12:07.710
Мене жахала така ідея, але в теорії

00:12:07.710 --> 00:12:10.650
здавалось цілком можливим виконувати 
важливу медичну роботу,

00:12:10.650 --> 00:12:16.140
використовуючи тільки 
ці техніки аналізу даних.

00:12:16.140 --> 00:12:18.620
На щастя, відгуки були фантастичні

00:12:18.620 --> 00:12:23.320
не тільки в медіа, а й серед прихильної 
медичної спільноти.

00:12:23.320 --> 00:12:27.470
Теоритично ми можемо 
всебічно аналізувати дані

00:12:27.470 --> 00:12:30.360
проміжного етапу медичного процесу,

00:12:30.360 --> 00:12:33.430
а лікарям залишити їх роботу.

00:12:33.430 --> 00:12:35.030
Я наведу приклад.

00:12:35.030 --> 00:12:37.360
Щоб згенерувати новий 
медичний діагностичний тест,

00:12:37.360 --> 00:12:39.980
нам потрібно 15 хвилин.

00:12:39.980 --> 00:12:41.930
Я продемонструю це прямо зараз,

00:12:41.930 --> 00:12:45.420
тільки я видалив деякі частини, 
щоб скоротити його до трьох хвилин.

00:12:45.420 --> 00:12:48.500
Замість створення медичного 
клінічного тесту,

00:12:48.500 --> 00:12:51.850
я покажу вам тест діагностики 
зображень автівок,

00:12:51.850 --> 00:12:54.070
щоб усім було зрозуміло.

00:12:54.070 --> 00:12:55.090
Отже, ми починаємо

00:12:55.090 --> 00:12:57.670
з приблизно 1,5 мільйонів 
зображень автівок.

00:12:57.670 --> 00:12:59.850
Я хочу створити інструмент 
для сортування

00:12:59.850 --> 00:13:02.700
їх відповідно до кута фотозйомки.

00:13:02.700 --> 00:13:04.800
Жодна фотографія не позначена,

00:13:04.800 --> 00:13:05.980
тож я почну з нуля.

00:13:05.980 --> 00:13:08.120
За допомогою 
алгоритму глибинного навчання,

00:13:08.120 --> 00:13:09.420
можна автоматично визначити

00:13:09.420 --> 00:13:12.170
елементи конструкції на цих зображеннях.

00:13:12.170 --> 00:13:14.550
Добре в цьому те, що людина 
може працювати разом

00:13:14.550 --> 00:13:15.800
з комп'ютером.

00:13:15.800 --> 00:13:17.960
Людина, як ви бачите,

00:13:17.960 --> 00:13:20.630
показує комп'ютеру

00:13:20.630 --> 00:13:22.280
стосовно якої частини

00:13:22.280 --> 00:13:24.120
комп'ютер буде

00:13:24.120 --> 00:13:25.280
вдосконалювати алгоритм.

00:13:25.280 --> 00:13:27.480
Ці системи глибинного навчання працюють в

00:13:27.480 --> 00:13:29.180
16-тисяч вимірному просторі,

00:13:29.180 --> 00:13:31.750
тож ви бачите, як комп'ютер
обертає фото в просторі,

00:13:31.750 --> 00:13:35.000
намагаючись знайти 
нові елементи структури.

00:13:35.000 --> 00:13:36.780
Коли це йому вдасться,

00:13:36.780 --> 00:13:40.790
людина, яка керує ним, зможе вибрати
потрібні елементи.

00:13:40.790 --> 00:13:45.790
Ось комп'ютер вдало знайшов елементи, 
наприклад, кути.

00:13:45.790 --> 00:13:47.380
Поступово, керуючи процесом,

00:13:47.380 --> 00:13:49.720
ми даємо комп'ютеру знати, які саме

00:13:49.720 --> 00:13:51.530
структури ми шукаємо.

00:13:51.530 --> 00:13:53.920
Уявіть, якби патолог під час 
діагностичного тесту

00:13:53.920 --> 00:13:57.170
ідентифікував області патології,

00:13:57.170 --> 00:13:58.710
або якби радіолог ідентифікував

00:13:58.710 --> 00:14:02.310
потенційно небезпечні вузлики.

00:14:02.310 --> 00:14:04.850
Іноді алгоритм не справляється.

00:14:04.850 --> 00:14:06.820
В такому разі він стає дещо безпорадний.

00:14:06.820 --> 00:14:11.450
Передні та задні частини автівок 
перемішані.

00:14:11.450 --> 00:14:14.670
Тепер слід уважно вручну

00:14:14.670 --> 00:14:16.760
виділити тільки фронтальні,

00:14:16.760 --> 00:14:19.310
щоб зорієнтувати комп'ютер на саме

00:14:19.310 --> 00:14:21.520
цей тип групування, який нас цікавить.

00:14:21.520 --> 00:14:23.080
Ми це робимо деякий час,

00:14:23.080 --> 00:14:24.780
я перескочу трохи,

00:14:24.780 --> 00:14:26.890
потім ми тренуємо алгоритм 
глибинного навчання

00:14:26.890 --> 00:14:28.800
на основі кількох сотень деталей

00:14:28.800 --> 00:14:30.450
і сподіваємось, що він навчився.

00:14:30.450 --> 00:14:32.460
Бачите, він почав прибирати

00:14:32.460 --> 00:14:33.740
деякі з малюнків,

00:14:33.740 --> 00:14:35.410
показуючи цим, що він вже розрізняє,

00:14:35.410 --> 00:14:38.230
як це робити самостійно.

00:14:38.230 --> 00:14:41.130
Тепер можна використати концепцію
подібних зображень.

00:14:41.130 --> 00:14:43.230
І ви бачите, що комп'ютер тепер

00:14:43.230 --> 00:14:47.250
здатен знайти тільки 
передні частини машин.

00:14:47.250 --> 00:14:53.660
Отже, можна визнати, що комп'ютер 
вправно виконав завдання.

00:14:53.660 --> 00:14:59.530
Іноді буває так, що й після цього складно
відсортувати групи.

00:14:59.530 --> 00:15:03.400
В такому випадку після деякого часу

00:15:03.400 --> 00:15:05.930
обертання зображень,

00:15:05.930 --> 00:15:08.220
лівосторонні і правосторонні 
все ще перемішані.

00:15:08.220 --> 00:15:10.360
Тоді ми знову підказуємо комп'ютеру

00:15:10.360 --> 00:15:13.200
і командуємо йому знайти

00:15:13.200 --> 00:15:15.400
за допомогою алгоритму глибинного навчання

00:15:15.400 --> 00:15:18.090
проекцію, яка відсортує лівосторонні 
від правосторонніх.

00:15:18.090 --> 00:15:21.010
І після такої підказки - ага, 
ок, цей процес завершено.

00:15:21.010 --> 00:15:26.270
Йому вдалось відсортувати ці об'єкти.

00:15:26.270 --> 00:15:28.730
В чому ідея?

00:15:28.730 --> 00:15:32.250
Йдеться не про заміщення людини 
комп'ютером, а про співпрацю.

00:15:39.550 --> 00:15:43.110
Те, що могла зробити команда з 5-6 людей

00:15:43.110 --> 00:15:45.100
за майже 7 років, одна людина зробить

00:15:45.100 --> 00:15:47.880
самостійно за 15 хвилин.

00:15:50.240 --> 00:15:53.690
Для такого процесу потрібно 4 або 5 
повторювань.

00:15:53.690 --> 00:15:56.020
Бачите, 62 відсотки 
з 1,5 мільйонів зображень

00:15:56.020 --> 00:15:57.560
відсортовано правильно.

00:15:58.980 --> 00:16:02.760
Тепер можна доволі швидко перевіряти 
великі масиви

00:16:02.760 --> 00:16:05.680
на присутність там помилок.

00:16:05.680 --> 00:16:09.600
Якщо такі знайдуться, 
вкажемо комп'ютерові на них.

00:16:09.600 --> 00:16:12.660
Застосувавши той самий процес

00:16:12.660 --> 00:16:14.630
для кожної окремої групи,

00:16:14.630 --> 00:16:17.560
матимемо результат: 80 % з 1,5 мільйона зображень
успішно класифіковано.

00:16:17.560 --> 00:16:19.640
Залишиться тільки

00:16:19.640 --> 00:16:23.220
знайти невелику кількість 
хибно класифікованих об'єктів

00:16:23.220 --> 00:16:25.810
і розібратись з ними.

00:16:25.810 --> 00:16:27.840
Завдяки цьому підходові, ми за 15 хвилин

00:16:27.840 --> 00:16:31.970
досягли 97 % рівня класифікування.

00:16:31.970 --> 00:16:36.580
Такі прийоми дають нам змогу побороти

00:16:36.580 --> 00:16:39.610
величезний брак 
медичної експертизи в світі.

00:16:39.610 --> 00:16:42.100
Згідно з даними Світового 
економічного форуму,

00:16:42.100 --> 00:16:45.290
країнам, що розвиваються, 
в 10-20 разів бракує терапевтів,

00:16:45.290 --> 00:16:47.840
і знадобиться 300 років,
аби навчити достатньо людей,

00:16:47.840 --> 00:16:50.590
які могли б компенсувати цей брак.

00:16:50.590 --> 00:16:53.690
Уявіть, наскільки ми можемо 
покращити результати їхньої діяльності

00:16:53.690 --> 00:16:56.460
завдяки підходу 
глибинного навчання.

00:16:56.460 --> 00:16:58.690
Мене дуже надихають такі перспективи.

00:16:58.690 --> 00:17:01.280
Водночас, я стурбований проблемами.

00:17:01.280 --> 00:17:04.390
Кожна територія на мапі, 
зафарбована синім кольором, є місцем,

00:17:04.390 --> 00:17:08.170
де 80 % зайнятості припадає на послуги.

00:17:08.170 --> 00:17:09.960
Які послуги?

00:17:09.960 --> 00:17:11.470
Ось ці.

00:17:11.470 --> 00:17:15.630
Такі, що комп'ютери тільки 
навчилися виконувати.

00:17:15.630 --> 00:17:19.450
Отже, 80 % зайнятості розвинених країн -

00:17:19.450 --> 00:17:21.970
це робота, яку комп'ютери щойно 
навчились виконувати.

00:17:21.970 --> 00:17:23.400
До чого я веду?

00:17:23.400 --> 00:17:24.830
Авжеж, все буде добре.

00:17:24.830 --> 00:17:25.990
Їм знайдуть іншу роботу.

00:17:25.990 --> 00:17:28.690
Наприклад, буде більше спеціалістів 
з обробки даних.

00:17:28.690 --> 00:17:29.510
Не зовсім так.

00:17:29.510 --> 00:17:32.630
Спеціаліст з обробки даних 
швидко створює такі речі.

00:17:32.630 --> 00:17:35.600
Наприклад, ці чотири алгоритми 
написав один хлопець.

00:17:35.600 --> 00:17:38.330
Ви можете аргументувати, 
що все це вже проходили раніше,

00:17:38.330 --> 00:17:44.380
і коли речі змінювались, 
з'являлись нові робочі місця.

00:17:44.380 --> 00:17:46.490
А якими вони будуть?

00:17:46.490 --> 00:17:48.370
Важко сказати, тому що

00:17:48.370 --> 00:17:51.100
людська діяльність покращується поступово,

00:17:51.100 --> 00:17:53.670
а система глибинного навчання -

00:17:53.670 --> 00:17:56.860
в геометричній прогресії.

00:17:56.860 --> 00:17:57.760
Зараз ми тут.

00:17:57.760 --> 00:18:00.560
Поки що ми оцінюємо ситуацію і кажемо: 
"Комп'ютерам далеко

00:18:00.560 --> 00:18:03.240
до людського розуму". Правда?

00:18:03.240 --> 00:18:06.660
Але за п'ять років комп'ютери перевершать 
свої показники.

00:18:06.660 --> 00:18:10.530
Тож нам слід вже зараз починати думати 
про потенціал.

00:18:10.530 --> 00:18:12.360
Звісно, історія вже знала такі часи.

00:18:12.360 --> 00:18:13.980
Під час індустріальної революції

00:18:13.980 --> 00:18:17.670
потужності збільшилися завдяки двигунам.

00:18:17.670 --> 00:18:20.810
Справа в тому, 
що речі не змінювались з того часу.

00:18:20.810 --> 00:18:22.510
Існувало соціальне розшарування.

00:18:22.510 --> 00:18:25.950
Але після впровадження 
потужностей двигунів

00:18:25.950 --> 00:18:28.180
в усі сфери життя, воно зменшилось.

00:18:28.180 --> 00:18:29.770
Революція комп'ютерного навчання

00:18:29.770 --> 00:18:32.600
відрізняється від індустріальної.

00:18:32.600 --> 00:18:35.620
Тому що революція комп'ютерного навчання
ніколи не зупиниться.

00:18:35.620 --> 00:18:38.620
Що кращою стане 
інтелектуальна діяльність комп'ютерів,

00:18:38.620 --> 00:18:42.860
то більше інших комп'ютерів з

00:18:42.860 --> 00:18:44.770
кращими потужностями вони створять.

00:18:44.770 --> 00:18:47.250
Світ ще ніколи не відчував змін
такого масштабу.

00:18:47.250 --> 00:18:50.970
Ваші уявлення про обмеженість 
можливостей змінено.

00:18:50.970 --> 00:18:52.750
Ці зміни вже впливають на нас.

00:18:52.750 --> 00:18:56.400
За останні 25 років зріс 
кругообіг капіталу,

00:18:56.400 --> 00:19:01.420
а продуктивність праці була сталою,
навіть трохи зменшилась.

00:19:01.420 --> 00:19:04.140
Тож, я заохочую нас 
до обговорення вже зараз.

00:19:04.150 --> 00:19:07.180
Знаю, що люди часто нехтують 
цим питанням,

00:19:07.180 --> 00:19:08.780
коли я до них звертаюсь.

00:19:08.780 --> 00:19:11.050
Комп'ютери не можуть розвивати думок, 


00:19:11.050 --> 00:19:16.200
не мають емоцій, не розуміють поезію, 
ми не тямимо до кінця, як вони працюють.

00:19:16.200 --> 00:19:17.370
То що з того?

00:19:17.370 --> 00:19:19.180
Комп'ютери вже виконують речі, якими

00:19:19.180 --> 00:19:21.900
люди заробляють собі на життя.

00:19:21.900 --> 00:19:27.170
Тож нам варто подумати, 
як змінити наші соціальну

00:19:27.170 --> 00:19:29.860
і економічну структури, 
враховуючи нову реальність.

00:19:29.860 --> 00:19:30.590
Дякую.

00:19:30.590 --> 00:19:31.290
(Оплески)