Колись, щоб комп'ютер для вас щось зробив, його потрібно було спочатку запрограмувати. Тим з присутніх, хто ніколи сам не програмував, я поясню, що для цього доводиться до найменших подробиць описувати кожну-кожнісіньку комп'ютерну команду, щоб досягнути своєї мети. А якщо ви не знаєте, як і що потрібно виконати, завдання стає величезним викликом. Перед таким викликом опинився Артур Семюел. В 1956 році він хотів налаштувати комп'ютер таким чином, щоб той виграв у нього в шашки. Як можна вручну написати програму, яка дозволить грати краще за тебе в шашки? Нарешті, він здогадався: він налаштував комп'ютер грати проти самого себе тисячі разів і таким чином навчив його грати в шашки. І це насправді спрацювало, бо до 1962 року цей комп'ютер вже переграв чемпіона штату Конектикут. Так Артур Семюел започаткував комп'ютерне навчання, і я вдячний йому за це, адже я - експерт з комп'ютерного навчання. Я був президентом спільноти Kaggle, в якій більше 200 тисяч експертів з комп'ютерного навчання. Kaggle влаштовує змагання з розв'язання задач, які раніше не було розв'язано. Сотні змагань завершилися блискуче. Ось в такому сприятливому середовищі я дізнався, що комп'ютерне навчання могло для нас зробити в минулому, а також зараз і в майбутньому. Напевно, Google - найбільший комерційний успіх комп'ютерного навчання. Google показав, що можна використовувати алгоритм на основі комп'ютерного навчання для пошуку інформації. З того часу комп'ютерне навчання мало великий комерційний успіх. Компанії Amazon і Netflix використовують комп'ютерне навчання для маркетингу товарів, що можуть вам сподобатись, і фільмів, які ви захочете подивитись. Інколи від того стає моторошно. Такі компанії як LinkedIn та Facebook показують хто, можливо, є вашим другом, а ви й не здогадуєтесь, як це налаштовано. Вони використовують можливості комп'ютерного навчання. Це алгоритми, які навчились опрацьовувати дані, а не були запрограмовані вручну. Саме тому IBM вдалося за допомогою комп'ютера Watson перемогти двох світових лідерів у грі "Jeopardy", відповівши на складні питання, як-от: "В 2003 році старовинна пластина "Лев з Німруду" зникла з національного музею цього міста (разом з іншими експонатами)". Завдяки саме цій технології ми маємо самокеровані автівки. Доволі важливо, скажімо, відрізняти дерево від пішохода. Ми не знаємо, як написати таку програму, але завдяки комп'ютерному навчанню тепер це можливо. Власне кажучи, це авто проїхало понад мільйон миль звичайними дорогами і без жодної аварії. Тепер ми знаємо, що комп'ютери здатні вчитися, а також вони здатні навчитися робити речі, яких ми не вміємо робити, або вони зроблять їх краще за нас. Чудовим прикладом комп'ютерного навчання був проект Kaggle під моїм керівництвом, на якому група Geoffrey Hinton з університету Торонто перемогла в змаганні з автоматичного підбору ліків. Незвичайним було не тільки те, що вони обійшли компанію Merck і міжнародну академічну спільноту в розробці алгоритму, а й те, що жоден з членів команди не мав освіти з хімії, біології чи медичних наук, а виконали вони це завдання за два тижні. Як їм це вдалось? Вони використали надзвичайний алгоритм глибинного навчання. Ця подія була настільки важливою, що про її успіх написали на першій сторінці New York Times кілька тижнів потому. Ось на фото зліва Джеффрі Гінтон. Алгоритм глибинного навчання створено як аналог функції людського мозку і тому, теоритично, він не має обмежень у роботі. Що більше даних і часу обчислення ви додаєте, то кращим він стає. Інша надзвичайна особливість алгоритму глибинного навчання була висвітлена у статті з New York Times, і я вам її зараз продемонструю. Йдеться про здатність комп'ютерів слухати і розуміти. (Відео) Річард Рашід: "Я завершу цей огляд, звернувшись до вас китайською мовою. Суть в тому, що я використав велику кількість даних різних мовців китайською і конвертував китайський текст на мовлення за допомогою системи конвертації. Далі ми використали годину мого власного звучання для моделювання звичайної системи перетворення тексту в моє мовлення. Повторюсь: результат не є ідеальним. Насправді, там є декілька помилок. (Говорить китайською) (Оплески) Ще багато потрібно зробити в цьому напрямку". (Говорить китайською) (Оплески) Джеремі Говард: Це було на конференції з комп'ютерного навчання в Китаї. Взагалі, не часто можна розраховувати на бурхливі оплески під час наукової конференції, а ось на конференціях TEDx все може бути, тож - не соромтесь. Все, що ви тут побачили, відбулось з застосуванням глибинного навчання. (Оплески) Дякую. Транскрипція англійською - це глибинне навчання. Переклад китайською і текст у верхньому правому кутку - глибинне навчання, і відновлення голосу - також глибинне навчання. Глибинне навчання - це надзвичайний алгоритм. Здається, цей єдиний алгоритм здатен зробити майже все. І я дізнався, що на рік раніше він також навчився бачити. В німецькому змаганні з розпізнавання дорожних знаків - German Traffic Sign Recognition Benchmark - алгоритм глибинного навчання розпізнавав такі дорожні знаки, як цей. Він не тільки навчився розпізнавати знаки краще за інші алгоритми, але й зробив це вдвічі краще за людей, як засвідчив рейтинг переможців. Так до 2011 року ми вже мали перший комп'ютер, який міг бачити краще за людей. Багато змінилося з того часу. В 2012 році Google анонсував про те, що алгоритм глибинного навчання мав переглянути відео в YouTube і опрацювати дані 16 000 комп'ютерів протягом місяця. Комп'ютер, переглядаючи відео, вивчив концепції "люди" і "коти". Майже так само вчаться люди. Люди вчаться не з того, що їм кажуть, начебто вони бачать, але розуміючи, що ті речі означають. Також в 2012 році Джеффрі Гінтон, якого ми бачили раніше, переміг у відомому змаганні ImageNet, вирахувавши, що зображено на 1,5 мільйонах фотографій. На 2014 рік ми досягли 6% частоти помилок в розпізнаванні зображень. Це краще за людські результати. Комп'ютери справді добре вправляються з такими завданнями, і це вже використовують у виробництві. Наприклад, Google оголосив торік, що вони позначили на карті кожен клаптик Франції за дві години. А зробили вони це так. Вони завантажили зображення вулиць в алгоритм глибинного навчання, щоб розпізнати і прочитати номери будинків. Тільки уявіть, скільки часу знадобилось би раніше: десятки людей, багато років. Подібне відбувається в Китаї. Baidu - найбільша пошукова система в Китаї, і те, що ви бачите в верхньому лівому кутку, є прикладом фото, яке я завантажив у систему глибинного навчання Baidu. Нижче ви побачите, як система розпізнала фото і знайшла подібні йому. Підібрані фото мають подібний фон, подібний ракурс голови, деякі навіть з висунутим язичком. Зрозуміло, пошук відбувся не за текстом веб-сторінки. Я завантажив тільки фотографію. Тепер ми маємо комп'ютери, які дійсно розуміють, що вони бачать, і тому можуть в реальному часі вести пошук по базах сотень мільйонів зображень. Що ж означає ця здатність комп'ютерів бачити? Вони не тільки бачать. Насправді, алгоритм глибинного навчання може більше. Тепер алгоритм глибинного навчання розуміє складні речення з нюансами, як ось це. Бачите, відповідно до Стенфордської символьної системи, червона крапка зверху означає, що тут виражено негативний сантимент. Алгоритм глибинного навчання вже наближається до людського розуміння, про які речі йдеться в реченні і що саме про них. Також алгоритм глибинного навчання було використано для читання китайською майже на рівні носія китайської мови. Цей алгоритм розробляли в Швейцарії люди, які не розуміють і не говорять китайською. Як вже було сказано, система глибинного навчання є найкращою в світі для таких цілей, навіть у порівнянні з носієм мови. Всі ці функції моя компанія зібрала в єдину систему. Ось малюнки без тексту. Я ввожу сюди речення, система одночасно розпізнає, що зображено на цих малюнках, а потім шукає малюнки, які відповідають введеному тексту. Отже, ви бачите, що система насправді розпізнає мої речення і також розпізнає ці малюнки. Я знаю - щось подібне вже є у Google, де ви вводите текст, і він знайде вам відповідний малюнок, але насправді буде знайдено веб-сторінку відповідно до тексту. Розпізнавання зображення - це зовсім інша справа. Лише кілька місяців тому комп'ютерові вдалося зробити це вперше. Тепер ми переконались, що комп'ютери навчились не тільки бачити, а й читати, а також, як було показано, вони розпізнають те, що чують. Можливо, я вас вже не здивую, коли я скажу, що вони вміють і писати. Ось текст, який я вчора згенерував, з алгоритмом глибинного навчання. А ось текст, що було згенеровано Стенфордською системою. Кожне з цих речень було створено за допомогою алгоритму глибинного навчання для опису цих малюнків. Цей алгоритм ніколи раніше не бачив чоловіка в чорній сорочці з гітарою в руках. Він бачив раніше чоловіка, він бачив раніше чорний колір, він бачив раніше гітару, але цей новий опис малюнка він створив самостійно. Поки ми ще не досягли рівня людських можливостей, але ми дуже близько. Тестування показало, що кожна четверта людина обирала згенерований комп'ютером варіант. Ця система існує тільки два тижні, тож за таких темпів протягом наступного року комп'ютерний алгоритм перевершить людські можливості. Отже, комп'ютери можуть також писати. Якщо складемо все до купи, то матимемо дуже цікаві перспективи. Наприклад, в медицині: бостонська команда оголосила, що вони відкрили десятки нових важливих клінічних характеристик пухлин, які допоможуть лікарям прогнозувати розвиток раку. Так само, група в Стенфорді оголосила про розроблену на основі огляду тканин під збільшенням систему комп'ютерного навчання, яка визначає шанси на виживання хворих на рак краще за патологів. Завдяки цим двом розробкам не тільки прогнози стали точнішими, а й було започатковано нову інформативну науку. В першому випадку це були нові, зрозумілі радіологам клінічні індикатори. У випадку патології, комп'ютерна система фактично винайшла, що оточення ракових клітин так само важливе при визначенні діагнозу, як і самі ракові клітини. Це спростовує інформацію, якої навчали патологів роками. В розробці систем брали участь медичні експерти та фахівці з комп'ютерного навчання, але з минулого року ми пішли ще далі. Це приклад виявлених за допомогою мікроскопа ракових областей тканини людського тіла. Ця система може виявити такі області точніше, або так само точно, як патологи, але створена вона виключно за допомогою глибинного навчання, без медичної експертизи, людьми без спеціальних знань в цій області. Ось приклад нейронного поділу. Тепер ми можемо поділяти нейрони так само точно, як людина, але систему було розроблено за допомогою глибинного навчання людьми, що не мали базових знань в медицині. Я не маю базових знать в медицині, проте виявляюсь достатньо кваліфікованим, щоб започаткувати нову медичну компанію, що я і зробив. Мене жахала така ідея, але в теорії здавалось цілком можливим виконувати важливу медичну роботу, використовуючи тільки ці техніки аналізу даних. На щастя, відгуки були фантастичні не тільки в медіа, а й серед прихильної медичної спільноти. Теоритично ми можемо всебічно аналізувати дані проміжного етапу медичного процесу, а лікарям залишити їх роботу. Я наведу приклад. Щоб згенерувати новий медичний діагностичний тест, нам потрібно 15 хвилин. Я продемонструю це прямо зараз, тільки я видалив деякі частини, щоб скоротити його до трьох хвилин. Замість створення медичного клінічного тесту, я покажу вам тест діагностики зображень автівок, щоб усім було зрозуміло. Отже, ми починаємо з приблизно 1,5 мільйонів зображень автівок. Я хочу створити інструмент для сортування їх відповідно до кута фотозйомки. Жодна фотографія не позначена, тож я почну з нуля. За допомогою алгоритму глибинного навчання, можна автоматично визначити елементи конструкції на цих зображеннях. Добре в цьому те, що людина може працювати разом з комп'ютером. Людина, як ви бачите, показує комп'ютеру стосовно якої частини комп'ютер буде вдосконалювати алгоритм. Ці системи глибинного навчання працюють в 16-тисяч вимірному просторі, тож ви бачите, як комп'ютер обертає фото в просторі, намагаючись знайти нові елементи структури. Коли це йому вдасться, людина, яка керує ним, зможе вибрати потрібні елементи. Ось комп'ютер вдало знайшов елементи, наприклад, кути. Поступово, керуючи процесом, ми даємо комп'ютеру знати, які саме структури ми шукаємо. Уявіть, якби патолог під час діагностичного тесту ідентифікував області патології, або якби радіолог ідентифікував потенційно небезпечні вузлики. Іноді алгоритм не справляється. В такому разі він стає дещо безпорадний. Передні та задні частини автівок перемішані. Тепер слід уважно вручну виділити тільки фронтальні, щоб зорієнтувати комп'ютер на саме цей тип групування, який нас цікавить. Ми це робимо деякий час, я перескочу трохи, потім ми тренуємо алгоритм глибинного навчання на основі кількох сотень деталей і сподіваємось, що він навчився. Бачите, він почав прибирати деякі з малюнків, показуючи цим, що він вже розрізняє, як це робити самостійно. Тепер можна використати концепцію подібних зображень. І ви бачите, що комп'ютер тепер здатен знайти тільки передні частини машин. Отже, можна визнати, що комп'ютер вправно виконав завдання. Іноді буває так, що й після цього складно відсортувати групи. В такому випадку після деякого часу обертання зображень, лівосторонні і правосторонні все ще перемішані. Тоді ми знову підказуємо комп'ютеру і командуємо йому знайти за допомогою алгоритму глибинного навчання проекцію, яка відсортує лівосторонні від правосторонніх. І після такої підказки - ага, ок, цей процес завершено. Йому вдалось відсортувати ці об'єкти. В чому ідея? Йдеться не про заміщення людини комп'ютером, а про співпрацю. Те, що могла зробити команда з 5-6 людей за майже 7 років, одна людина зробить самостійно за 15 хвилин. Для такого процесу потрібно 4 або 5 повторювань. Бачите, 62 відсотки з 1,5 мільйонів зображень відсортовано правильно. Тепер можна доволі швидко перевіряти великі масиви на присутність там помилок. Якщо такі знайдуться, вкажемо комп'ютерові на них. Застосувавши той самий процес для кожної окремої групи, матимемо результат: 80 % з 1,5 мільйона зображень успішно класифіковано. Залишиться тільки знайти невелику кількість хибно класифікованих об'єктів і розібратись з ними. Завдяки цьому підходові, ми за 15 хвилин досягли 97 % рівня класифікування. Такі прийоми дають нам змогу побороти величезний брак медичної експертизи в світі. Згідно з даними Світового економічного форуму, країнам, що розвиваються, в 10-20 разів бракує терапевтів, і знадобиться 300 років, аби навчити достатньо людей, які могли б компенсувати цей брак. Уявіть, наскільки ми можемо покращити результати їхньої діяльності завдяки підходу глибинного навчання. Мене дуже надихають такі перспективи. Водночас, я стурбований проблемами. Кожна територія на мапі, зафарбована синім кольором, є місцем, де 80 % зайнятості припадає на послуги. Які послуги? Ось ці. Такі, що комп'ютери тільки навчилися виконувати. Отже, 80 % зайнятості розвинених країн - це робота, яку комп'ютери щойно навчились виконувати. До чого я веду? Авжеж, все буде добре. Їм знайдуть іншу роботу. Наприклад, буде більше спеціалістів з обробки даних. Не зовсім так. Спеціаліст з обробки даних швидко створює такі речі. Наприклад, ці чотири алгоритми написав один хлопець. Ви можете аргументувати, що все це вже проходили раніше, і коли речі змінювались, з'являлись нові робочі місця. А якими вони будуть? Важко сказати, тому що людська діяльність покращується поступово, а система глибинного навчання - в геометричній прогресії. Зараз ми тут. Поки що ми оцінюємо ситуацію і кажемо: "Комп'ютерам далеко до людського розуму". Правда? Але за п'ять років комп'ютери перевершать свої показники. Тож нам слід вже зараз починати думати про потенціал. Звісно, історія вже знала такі часи. Під час індустріальної революції потужності збільшилися завдяки двигунам. Справа в тому, що речі не змінювались з того часу. Існувало соціальне розшарування. Але після впровадження потужностей двигунів в усі сфери життя, воно зменшилось. Революція комп'ютерного навчання відрізняється від індустріальної. Тому що революція комп'ютерного навчання ніколи не зупиниться. Що кращою стане інтелектуальна діяльність комп'ютерів, то більше інших комп'ютерів з кращими потужностями вони створять. Світ ще ніколи не відчував змін такого масштабу. Ваші уявлення про обмеженість можливостей змінено. Ці зміни вже впливають на нас. За останні 25 років зріс кругообіг капіталу, а продуктивність праці була сталою, навіть трохи зменшилась. Тож, я заохочую нас до обговорення вже зараз. Знаю, що люди часто нехтують цим питанням, коли я до них звертаюсь. Комп'ютери не можуть розвивати думок, не мають емоцій, не розуміють поезію, ми не тямимо до кінця, як вони працюють. То що з того? Комп'ютери вже виконують речі, якими люди заробляють собі на життя. Тож нам варто подумати, як змінити наші соціальну і економічну структури, враховуючи нову реальність. Дякую. (Оплески)