1 00:00:00,880 --> 00:00:06,623 Altădată, dacă voiai ca un computer să facă ceva nou, trebuia să-l programezi. 2 00:00:06,623 --> 00:00:09,858 Pentru cei care nu aveți experiența asta, 3 00:00:09,858 --> 00:00:13,257 programarea presupune să stabilești în cele mai mici detalii 4 00:00:13,257 --> 00:00:16,859 fiecare pas pe care i-l ceri calculatorului 5 00:00:16,859 --> 00:00:19,088 pentru a obține ce dorești. 6 00:00:19,548 --> 00:00:24,881 Dacă vrei să faci ceva ce n-ai putea face tu însuți, atunci îți va fi foarte greu. 7 00:00:24,881 --> 00:00:28,308 Foarte greu i-a fost și unui anumit Arthur Samuel. 8 00:00:28,308 --> 00:00:34,258 În 1956 dorea să programeze un calculator care să-l învingă la dame. 9 00:00:34,258 --> 00:00:38,310 Cum faci să programezi calculatorul în cele mai mici detalii 10 00:00:38,310 --> 00:00:40,530 încât să joace dame mai bine decât tine? 11 00:00:40,530 --> 00:00:42,124 I-a venit o idee: 12 00:00:42,124 --> 00:00:46,064 a pus calculatorul să joace cu el însuși de mii de ori 13 00:00:46,064 --> 00:00:48,561 ca să învețe să joace dame. 14 00:00:49,031 --> 00:00:50,204 Ideea a mers. 15 00:00:50,204 --> 00:00:54,891 În 1962 calculatorul acesta l-a învins pe campionul statului Connecticut. 16 00:00:55,431 --> 00:00:58,374 Arthur Samuel a fost părintele învățării automate. 17 00:00:58,374 --> 00:01:03,049 Eu îi sunt recunoscător pentru că și eu mă ocup cu învățarea automată. 18 00:01:03,049 --> 00:01:04,475 Am fost președinte la Kaggle, 19 00:01:04,475 --> 00:01:08,333 o comunitate cu peste 200 000 de practicanți ai învățării automate. 20 00:01:08,333 --> 00:01:13,940 Kaggle organizează competiții pentru rezolvarea problemelor încă nerezolvate. 21 00:01:13,940 --> 00:01:16,960 Și a avut sute de reușite. 22 00:01:17,530 --> 00:01:19,942 Din poziția mea avantajoasă am aflat 23 00:01:19,942 --> 00:01:23,885 ce putea face învățarea automată în trecut, ce poate face azi 24 00:01:23,885 --> 00:01:26,354 și ce ar putea face în viitor. 25 00:01:26,354 --> 00:01:30,876 Probabil primul mare succes al învățării automate a fost Google. 26 00:01:30,876 --> 00:01:34,097 Google a demonstrat că poți găsi informații 27 00:01:34,097 --> 00:01:38,733 folosind un algoritm computerizat bazat pe învățarea automată. 28 00:01:38,733 --> 00:01:42,316 De atunci s-au înregistrat numeroase succese comerciale în domeniu. 29 00:01:42,316 --> 00:01:45,606 Companii ca Amazon și Netflix folosesc învățarea automată 30 00:01:45,606 --> 00:01:47,973 pentru a vă sugera ce ați vrea să cumpărați, 31 00:01:47,973 --> 00:01:49,897 ce filme ați vrea să vedeți. 32 00:01:49,897 --> 00:01:51,701 Uneori aproape că te sperie: 33 00:01:51,701 --> 00:01:56,305 de exemplu LinkedIn și Facebook îți spun cine ți-ar putea fi prieten 34 00:01:56,305 --> 00:01:58,232 și habar n-ai cum au procedat. 35 00:01:58,232 --> 00:02:01,199 Se folosește puterea învățării automate. 36 00:02:01,199 --> 00:02:06,847 Sunt algoritmi care învață din date, fără să fie programați manual. 37 00:02:07,529 --> 00:02:10,164 Tot așa a avut succes și IBM 38 00:02:10,164 --> 00:02:13,819 cu Watson, care a învins cei doi campioni mondiali la „Jeopardy”, 39 00:02:13,819 --> 00:02:17,034 răspunzând la întrebări incredibil de subtile și complexe ca: 40 00:02:17,034 --> 00:02:19,766 [Anticul „Leu din Nimrud” a dispărut din muzeul național al acestui oraș în 2003 (împreună cu multe altele).] 41 00:02:19,766 --> 00:02:23,468 Tot astfel azi avem primele mașini care se conduc singure. 42 00:02:23,468 --> 00:02:28,795 A face diferența între un copac și un pieton, de exemplu, e important. 43 00:02:28,795 --> 00:02:31,460 Nu știm să scriem de mână astfel de programe, 44 00:02:31,460 --> 00:02:34,056 dar prin învățare automată acum e posibil. 45 00:02:34,066 --> 00:02:39,390 Mașina aceasta a mers peste 1 milion de km fără accidente, pe șosele obișnuite. 46 00:02:40,660 --> 00:02:44,318 Acum știm: calculatoarele pot învăța, 47 00:02:44,318 --> 00:02:46,233 ba chiar pot învăța să facă lucruri 48 00:02:46,233 --> 00:02:49,058 pe care uneori nici noi nu știm să le facem 49 00:02:49,058 --> 00:02:51,980 sau poate le fac mai bine decât noi. 50 00:02:51,980 --> 00:02:55,981 Unul din cele mai uimitoare exemple de învățare automată din câte am văzut 51 00:02:55,981 --> 00:02:58,523 a fost într-un proiect al meu de la Kaggle, 52 00:02:58,523 --> 00:03:03,507 în care echipa lui Geoffrey Hinton de la Universitatea din Toronto 53 00:03:03,507 --> 00:03:06,410 a câștigat un concurs de descoperire automată a drogurilor. 54 00:03:06,410 --> 00:03:08,991 Extraordinar a fost nu că au surclasat 55 00:03:08,991 --> 00:03:13,000 toți algoritmii dezvoltați de Merck sau de comunitatea academică, 56 00:03:13,000 --> 00:03:18,161 ci faptul că nimeni din echipă nu avea pregătire în chimie sau biologie 57 00:03:18,161 --> 00:03:20,472 și au reușit în două săptămâni. 58 00:03:20,472 --> 00:03:22,421 Cum au reușit? 59 00:03:22,421 --> 00:03:25,462 Au folosit un algoritm numit învățare profundă. 60 00:03:25,462 --> 00:03:27,487 Succesul lor a fost atât de important 61 00:03:27,487 --> 00:03:31,518 încât a apărut pe prima pagină a New York Times după câteva săptămâni. 62 00:03:31,518 --> 00:03:34,080 Iată-l pe Geoffrey Hinton aici în stânga. 63 00:03:34,080 --> 00:03:38,491 Învățarea profundă e un algoritm inspirat din funcționarea creierului 64 00:03:38,491 --> 00:03:43,894 și astfel, teoretic, e un algoritm fără limitări în ceea ce poate face. 65 00:03:43,894 --> 00:03:48,615 Cu cât îi dai mai multe date și timp de calcul, cu atât devine mai bun. 66 00:03:48,615 --> 00:03:52,929 New York Times a prezentat în articol încă un rezultat al învățării profunde, 67 00:03:52,929 --> 00:03:54,751 pe care vi-l arăt acum. 68 00:03:56,071 --> 00:03:59,806 Demonstrează că computerele pot asculta și înțelege. 69 00:04:01,746 --> 00:04:06,651 (Video) Richard Rashid: Ultimul pas pe care vreau să-l pot face 70 00:04:06,651 --> 00:04:10,236 e să vorbesc cu voi în chineză. 71 00:04:11,818 --> 00:04:18,688 Ideea de bază e că am stocat informații de la mulți vorbitori de chineză 72 00:04:18,688 --> 00:04:21,429 și am realizat un sistem de sinteză vocală 73 00:04:21,429 --> 00:04:26,170 care convertește textul chinezesc în chineza vorbită. 74 00:04:26,990 --> 00:04:30,334 Apoi am folosit o probă de circa o oră cu vocea mea 75 00:04:30,334 --> 00:04:36,154 pentru a modula sistemul standard încât să sune ca vocea mea. 76 00:04:36,782 --> 00:04:39,756 Repet, rezultatul nu e perfect. 77 00:04:39,756 --> 00:04:41,806 Există multe erori. 78 00:04:41,806 --> 00:04:44,592 (În chineză) 79 00:04:44,592 --> 00:04:49,447 (Aplauze) 80 00:04:49,447 --> 00:04:52,355 Mai sunt multe de făcut aici. 81 00:04:53,595 --> 00:04:56,904 (În chineză) 82 00:04:56,904 --> 00:05:00,774 (Aplauze) 83 00:05:01,464 --> 00:05:04,831 Jeremy Howard: Asta a fost o conferință de învățare automată din China. 84 00:05:04,831 --> 00:05:09,227 La conferințele științifice rareori se aud aplauze spontane. 85 00:05:09,227 --> 00:05:12,267 Dar la conferințele TEDx faceți cum doriți. 86 00:05:12,757 --> 00:05:15,479 Tot ce ați văzut se bazează pe învățarea profundă. 87 00:05:15,479 --> 00:05:16,801 (Aplauze) Mulțumesc. 88 00:05:16,801 --> 00:05:19,238 Transcrierea în engleză era cu învățare profundă. 89 00:05:19,238 --> 00:05:22,342 La fel și traducerea în chineză și textul din dreapta sus. 90 00:05:22,342 --> 00:05:26,011 Sinteza vocii – tot învățare profundă. 91 00:05:26,561 --> 00:05:29,472 Învățarea profundă e extraordinară. 92 00:05:29,472 --> 00:05:32,338 E un singur algoritm, care pare să poată face orice. 93 00:05:32,338 --> 00:05:35,765 Am aflat că înainte cu un an învățase și să vadă. 94 00:05:35,765 --> 00:05:39,678 Într-o competiție obscură din Germania de recunoaștere a indicatoarelor rutiere, 95 00:05:39,678 --> 00:05:43,870 a învățat să recunoască indicatoare rutiere precum acesta. 96 00:05:43,870 --> 00:05:47,399 A recunoscut indicatoarele mai bine decât orice alt algoritm 97 00:05:47,399 --> 00:05:51,887 și conform clasamentului chiar mai bine decât oamenii, de vreo două ori mai bine. 98 00:05:51,887 --> 00:05:57,261 Deci până în 2011 a apărut primul calculator care vede mai bine ca oamenii. 99 00:05:57,741 --> 00:05:59,490 De atunci s-au întâmplat multe. 100 00:05:59,490 --> 00:06:04,377 În 2012 Google a anunțat că a pus un algoritm să se uite pe YouTube 101 00:06:04,377 --> 00:06:07,767 și să ronțăie datele cu 16000 de calculatoare timp de o lună, 102 00:06:07,767 --> 00:06:12,389 învățând singur despre concepte ca oamenii și pisicile 103 00:06:12,389 --> 00:06:14,019 doar privind videoclipuri. 104 00:06:14,029 --> 00:06:16,380 Tot cam așa învață și omul. 105 00:06:16,380 --> 00:06:19,089 Oamenii nu învață din explicații despre ce văd, 106 00:06:19,089 --> 00:06:22,059 ci din propria experiență cu lucrurile. 107 00:06:22,559 --> 00:06:26,248 În 2012, Geoffrey Hinton, cel de adineauri 108 00:06:26,248 --> 00:06:29,026 a câștigat celebra competiție ImageNet, 109 00:06:29,026 --> 00:06:34,279 încercând să-și dea seama ce reprezintă 1,5 milioane de imagini. 110 00:06:34,279 --> 00:06:39,148 În 2014 eroarea de recunoaștere a imaginilor a scăzut la 6%. 111 00:06:39,148 --> 00:06:41,266 Din nou mai bine ca oamenii. 112 00:06:41,786 --> 00:06:45,038 Mașinile se descurcă extraordinar de bine, 113 00:06:45,038 --> 00:06:47,233 iar acum sunt folosite în industrie. 114 00:06:47,233 --> 00:06:50,430 De exemplu, Google a anunțat anul trecut 115 00:06:50,430 --> 00:06:55,019 că a cartografiat toate locurile din Franța în două ore. 116 00:06:55,019 --> 00:06:58,509 Au făcut asta încărcând imagini ale străzilor 117 00:06:58,509 --> 00:07:02,924 într-un algoritm de învățare profundă care citește numărul străzii. 118 00:07:02,924 --> 00:07:05,085 Imaginați-vă cât ar fi durat altădată: 119 00:07:05,085 --> 00:07:08,291 zeci de oameni, mulți ani. 120 00:07:08,801 --> 00:07:10,344 Asta se întâmplă și în China. 121 00:07:10,344 --> 00:07:14,508 Baidu este ca un fel de Google, cred. 122 00:07:15,078 --> 00:07:20,767 Aici în stânga sus vedeți o poză încărcată de mine în acest sistem, 123 00:07:20,767 --> 00:07:24,449 iar jos vedeți că sistemul a înțeles ce reprezintă poza 124 00:07:24,449 --> 00:07:26,537 și a găsit imagini similare. 125 00:07:26,537 --> 00:07:29,215 Acestea au un fundal asemănător, 126 00:07:29,215 --> 00:07:31,135 direcții similare ale fețelor, 127 00:07:31,135 --> 00:07:32,967 unele chiar cu limba afară. 128 00:07:32,967 --> 00:07:35,618 Nu e ca și cum ai vedea textul unei pagini de internet. 129 00:07:35,618 --> 00:07:37,402 Am încărcat doar o imagine. 130 00:07:37,402 --> 00:07:40,936 Avem acum calculatoare care înțeleg ce văd 131 00:07:40,936 --> 00:07:42,936 și astfel pot căuta în baze de date 132 00:07:42,936 --> 00:07:45,743 cu sute de milioane de imagini în timp real. 133 00:07:46,143 --> 00:07:49,092 Ce înseamnă faptul că văd? 134 00:07:49,542 --> 00:07:51,300 Și nu numai că văd. 135 00:07:51,300 --> 00:07:54,134 Învățarea profundă a ajuns mai departe. 136 00:07:54,134 --> 00:07:56,747 Propoziții complexe și nuanțate ca aceasta 137 00:07:56,747 --> 00:07:59,575 sunt inteligibile prin algoritmi de învățare profundă. 138 00:07:59,575 --> 00:08:03,924 Aici vedeți cum un sistem de la Stanford arată prin bulina roșie de sus 139 00:08:03,924 --> 00:08:07,633 că a înțeles conotația negativă a acestei propoziții. 140 00:08:07,633 --> 00:08:10,491 Învățarea profundă are acum performanțe aproape umane 141 00:08:10,491 --> 00:08:15,487 în a înțelege despre ce e propoziția și ce comunică ea. 142 00:08:16,577 --> 00:08:19,165 Învățarea profundă se folosește la a citi în chineză 143 00:08:19,165 --> 00:08:22,181 aproape de nivelul de vorbitor nativ. 144 00:08:22,181 --> 00:08:24,282 Algoritmul a fost dezvoltat în Elveția 145 00:08:24,282 --> 00:08:27,331 de oameni care nu vorbesc și nu înțeleg deloc chineză. 146 00:08:27,791 --> 00:08:32,588 Învățarea profundă e cea mai bună soluție din lume pentru așa ceva, 147 00:08:32,588 --> 00:08:35,678 chiar și față de înțelegerea umană naturală. 148 00:08:37,198 --> 00:08:39,869 Iată un sistem pus la punct de compania mea, 149 00:08:39,869 --> 00:08:41,841 care combină toate acestea. 150 00:08:41,841 --> 00:08:44,400 Aceste imagini nu sunt însoțite de text 151 00:08:44,400 --> 00:08:46,919 și pe măsură ce tastez propoziții aici 152 00:08:46,919 --> 00:08:51,172 înțelege în timp real imaginile, își dă seama despre ce e vorba 153 00:08:51,172 --> 00:08:54,352 și găsește imagini similare cu cele din textul scris de mine. 154 00:08:54,352 --> 00:08:59,161 După cum vedeți, înțelege atât propozițiile cât și imaginile. 155 00:08:59,601 --> 00:09:01,890 Știu că ați văzut ceva similar pe Google: 156 00:09:01,890 --> 00:09:04,791 – tastați ceva și vă arată imagini –, 157 00:09:04,791 --> 00:09:08,333 dar acolo de fapt caută pagini de internet după text. 158 00:09:08,333 --> 00:09:10,821 E cu totul altceva decât a înțelege imaginile. 159 00:09:10,821 --> 00:09:15,442 Calculatoarele au învățat să facă asta abia acum câteva luni. 160 00:09:17,647 --> 00:09:21,359 Așadar calculatoarele nu doar văd, ci pot și citi. 161 00:09:21,359 --> 00:09:24,462 Și desigur am demonstrat că înțeleg ce aud. 162 00:09:24,892 --> 00:09:28,446 Atunci nu vă va mira dacă vă spun că pot să și scrie. 163 00:09:28,446 --> 00:09:32,870 Iată un text pe care l-am generat ieri cu un algoritm de învățare profundă. 164 00:09:34,020 --> 00:09:37,279 Iată și un text generat de un algoritm de la Stanford. 165 00:09:37,279 --> 00:09:39,311 Fiecare propoziție a fost generată 166 00:09:39,311 --> 00:09:43,111 de un algoritm de învățare profundă pentru a descrie imaginile. 167 00:09:43,111 --> 00:09:47,730 Algoritmul nu mai văzuse un bărbat în cămașă neagră cântând la chitară. 168 00:09:47,730 --> 00:09:51,535 Mai văzuse un bărbat, culoarea neagră, o chitară, 169 00:09:51,535 --> 00:09:55,885 dar a generat singur o descriere nouă a acestei imagini. 170 00:09:56,334 --> 00:09:59,231 Încă n-am atins performanța umană, dar ne apropiem. 171 00:09:59,231 --> 00:10:03,185 La testare oamenii preferă descrierile generate de calculator 172 00:10:03,185 --> 00:10:04,801 cam o dată din patru. 173 00:10:04,801 --> 00:10:07,052 Sistemul are abia două săptămâni, 174 00:10:07,052 --> 00:10:11,454 deci probabil într-un an algoritmul va depăși performanța umană 175 00:10:11,454 --> 00:10:14,048 la cum avansează lucrurile. 176 00:10:14,048 --> 00:10:16,440 Deci calculatoarele pot și să scrie. 177 00:10:16,440 --> 00:10:19,705 Toate astea la un loc creează niște șanse fantastice. 178 00:10:19,705 --> 00:10:24,244 De exemplu, în medicină, o echipă din Boston a anunțat că a descoperit 179 00:10:24,244 --> 00:10:26,846 zeci de caracteristici relevante clinic 180 00:10:26,846 --> 00:10:31,459 ale tumorilor care ajută doctorii să prezică apariția cancerului. 181 00:10:32,499 --> 00:10:34,470 Similar, la Stanford 182 00:10:34,470 --> 00:10:38,362 un grup a anunțat că cercetând la microscop țesuturile 183 00:10:38,362 --> 00:10:43,219 au realizat un sistem cu învățare automată care reușește mai bine ca patologii umani 184 00:10:43,219 --> 00:10:47,016 să prevadă proporția de supraviețuire a pacienților cu cancer. 185 00:10:47,466 --> 00:10:50,761 În ambele cazuri previziunile au fost mai exacte 186 00:10:50,761 --> 00:10:53,246 și au ajutat și la progresul științific. 187 00:10:53,246 --> 00:10:58,088 În cazul radiologiei au apărut indicatori clinici înțeleși de om. 188 00:10:58,088 --> 00:10:59,668 În cazul patologiei 189 00:10:59,668 --> 00:11:04,420 sistemul computerizat a descoperit că celulele din jurul cancerului 190 00:11:04,420 --> 00:11:07,771 sunt la fel de importante ca cele canceroase 191 00:11:07,771 --> 00:11:09,533 în stabilirea diagnosticului. 192 00:11:09,533 --> 00:11:14,604 Asta infirmă ce spun cursurile de patologie de multe decenii încoace. 193 00:11:15,464 --> 00:11:17,905 În ambele cazuri, sistemele au fost realizate 194 00:11:17,905 --> 00:11:21,534 de experți în medicină împreună cu experți în învățare automată, 195 00:11:21,534 --> 00:11:24,284 dar anul trecut am depășit și acest prag. 196 00:11:24,284 --> 00:11:28,257 Iată un exemplu de identificare a zonelor canceroase 197 00:11:28,257 --> 00:11:30,112 a țesutului uman la microscop. 198 00:11:30,932 --> 00:11:34,704 Sistemul prezentat aici poate identifica acele zone mai exact 199 00:11:34,704 --> 00:11:37,620 sau cam la fel de exact ca patologii umani 200 00:11:37,620 --> 00:11:41,325 dar a fost realizat prin învățare profundă fără competențe medicale 201 00:11:41,325 --> 00:11:43,813 de oameni care nu aveau pregătire în domeniu. 202 00:11:44,733 --> 00:11:47,650 La fel, iată segmentarea unui neuron. 203 00:11:47,650 --> 00:11:50,781 Acum putem segmenta neuroni la fel de precis ca oamenii, 204 00:11:50,781 --> 00:11:55,818 dar sistemul a fost realizat prin învățare profundă, fără cunoștințe de medicină. 205 00:11:57,148 --> 00:12:00,151 Atunci eu, deși nu am pregătire în medicină, 206 00:12:00,151 --> 00:12:03,961 se pare să sunt calificat să pornesc o firmă de medicină. 207 00:12:03,961 --> 00:12:05,580 Ceea ce am și făcut. 208 00:12:06,390 --> 00:12:08,022 Mi-a fost puțin frică să fac asta, 209 00:12:08,022 --> 00:12:10,722 dar teoria pare să sugereze ca poți 210 00:12:10,722 --> 00:12:16,128 să faci ceva foarte util în medicină folosind doar metode de analiză a datelor. 211 00:12:16,138 --> 00:12:19,762 Din fericire reacțiile au fost fantastice, atât din partea presei, 212 00:12:19,762 --> 00:12:23,191 dar și comunitatea medicală ne-a sprijinit foarte mult. 213 00:12:23,191 --> 00:12:27,359 Ideea e că putem să luăm partea mijlocie a procesului medical 214 00:12:27,359 --> 00:12:30,361 și s-o transformăm în analiză de date, pe cât posibil, 215 00:12:30,361 --> 00:12:33,425 lăsând apoi doctorii să-și facă meseria. 216 00:12:33,425 --> 00:12:37,369 Să vă dau un exemplu: acum ne trebuie 15 minute 217 00:12:37,369 --> 00:12:40,436 pentru a stabili o analiză nouă pentru diagnosticul medical. 218 00:12:40,436 --> 00:12:45,327 O să vă arăt acum, dar l-am redus la trei minute prin eliminarea unor părți. 219 00:12:45,327 --> 00:12:48,768 În loc de crearea unei analize pentru diagnosticul medical, 220 00:12:48,768 --> 00:12:52,149 o să vă arăt analiza imaginilor de mașini, 221 00:12:52,149 --> 00:12:54,385 ca să înțelegem toți. 222 00:12:54,385 --> 00:12:57,528 Începem cu circa 1,5 milioane de imagini de mașini 223 00:12:57,528 --> 00:13:02,816 și vreau să creez ceva care le clasifică după unghiul din care au fost pozate. 224 00:13:02,816 --> 00:13:06,588 Imaginile nu sunt deloc marcate, trebuie să pornesc de la zero. 225 00:13:07,078 --> 00:13:12,228 Algoritmul nostru de învățare profundă găsește automat structurile din imagini. 226 00:13:12,228 --> 00:13:15,851 Partea bună e că acum oamenii și calculatoarele pot colabora. 227 00:13:15,851 --> 00:13:17,951 Aici vedeți cum omul 228 00:13:17,961 --> 00:13:20,907 îi arată calculatorului zonele de interes 229 00:13:20,907 --> 00:13:25,499 pe care să se bazeze calculatorul pentru a îmbunătăți algoritmul. 230 00:13:25,959 --> 00:13:29,671 Sistemele de învățare profundă operează într-un spațiu cu 16 000 dimensiuni 231 00:13:29,671 --> 00:13:32,962 și vedeți cum se rotește calculatorul prin acest spațiu 232 00:13:32,962 --> 00:13:35,226 pentru a găsi noi zone de structură. 233 00:13:35,226 --> 00:13:37,018 Când reușește, 234 00:13:37,018 --> 00:13:40,930 omul care îl conduce poate indica zonele interesante. 235 00:13:40,930 --> 00:13:46,076 Aici calculatorul a găsit anumite zone, de exemplu, cu unghiuri. 236 00:13:46,076 --> 00:13:49,704 Pe măsură ce continuăm, îi dăm calculatorului mai multe date 237 00:13:49,704 --> 00:13:52,186 despre ce fel de structuri căutăm. 238 00:13:52,186 --> 00:13:57,722 Într-o analiză medicală aici ar putea fi un patolog care identifică zone patogene 239 00:13:57,722 --> 00:14:02,505 sau un radiolog care indică nodulii cu probleme posibile. 240 00:14:03,025 --> 00:14:05,105 Uneori algoritmului îi poate fi greu. 241 00:14:05,105 --> 00:14:09,367 Iată un caz în care s-a încurcat: a amestecat fața și spatele mașinilor. 242 00:14:09,367 --> 00:14:11,435 Aici trebuie să fim mai atenți, 243 00:14:11,435 --> 00:14:14,803 să separăm manual fața și spatele 244 00:14:14,803 --> 00:14:18,030 și apoi să-i spunem calculatorului că acesta e 245 00:14:18,030 --> 00:14:21,376 un tip de grup care ne interesează. 246 00:14:21,816 --> 00:14:24,200 Continuăm o vreme, sărim peste câte ceva 247 00:14:24,200 --> 00:14:26,515 și apoi antrenăm algoritmul de învățare automată 248 00:14:26,515 --> 00:14:28,678 pe baza celor câteva sute de lucruri 249 00:14:28,678 --> 00:14:30,216 și sperăm că a avansat. 250 00:14:30,216 --> 00:14:32,688 Vedeți, acum începe să estompeze anumite imagini, 251 00:14:32,688 --> 00:14:37,792 arătând că începe să înțeleagă singur să recunoască o parte din ele. 252 00:14:38,332 --> 00:14:43,251 Putem folosi acest concept de imagini similare și astfel vedeți 253 00:14:43,251 --> 00:14:47,512 cum calculatorul poate găsi doar mașinile pozate din față. 254 00:14:47,512 --> 00:14:50,267 Acum omul poate spune calculatorului: 255 00:14:50,267 --> 00:14:53,041 „Da, ai făcut o treabă bună.” 256 00:14:54,031 --> 00:14:59,629 Sigur, uneori chiar și acum separarea grupurilor e dificilă. 257 00:14:59,629 --> 00:15:04,002 Aici chiar după ce am lăsat o vreme calculatorul să încerce rotațiile, 258 00:15:04,002 --> 00:15:08,412 vedem că pozele făcute din stânga și cele din dreapta sunt amestecate. 259 00:15:08,412 --> 00:15:10,615 Putem da calculatorului sugestii: 260 00:15:10,615 --> 00:15:15,877 caută o proiecție care separă cât mai bine părțile stângă și dreaptă 261 00:15:15,877 --> 00:15:18,111 folosind algoritmul de învățare profundă. 262 00:15:18,111 --> 00:15:21,021 Apoi uite, sugestia a dus la succes. 263 00:15:21,021 --> 00:15:25,619 A reușit să găsească un mod de a analiza obiectele încât să le separe. 264 00:15:26,999 --> 00:15:29,926 Ați prins ideea: 265 00:15:29,926 --> 00:15:37,346 e o situație în care omul nu e înlocuit de calculator, 266 00:15:37,346 --> 00:15:39,738 ci lucrează împreună cu el. 267 00:15:39,738 --> 00:15:45,243 Am înlocuit munca unei echipe de 5–6 oameni timp de vreo șapte ani, 268 00:15:45,243 --> 00:15:49,768 cu ceva care îi ia 15 minute unui om care lucrează singur. 269 00:15:51,577 --> 00:15:54,096 Procesul necesită 4–5 iterații. 270 00:15:54,096 --> 00:15:58,748 Am ajuns la 62% de clasificare corectă a 1,5 milioane de imagini. 271 00:15:58,748 --> 00:16:03,124 În acest stadiu putem începe să prelucrăm rapid secțiuni mari 272 00:16:03,124 --> 00:16:05,401 și să verificăm să nu rămână greșeli, 273 00:16:05,401 --> 00:16:09,488 iar dacă sunt greșeli îi spunem calculatorului. 274 00:16:09,488 --> 00:16:12,443 Folosind acest proces la fiecare din diferitele grupuri 275 00:16:12,443 --> 00:16:17,881 am ajuns la o proporție de succes de 80% în a clasifica cele 1,5 milioane de poze. 276 00:16:18,321 --> 00:16:23,278 Acum mai rămâne doar să găsim puținele imagini care n-au fost clasificate corect 277 00:16:23,278 --> 00:16:25,892 și să încercăm să înțelegem de ce. 278 00:16:26,382 --> 00:16:32,078 Procedând astfel în 15 minute ajungem la proporții de clasificare de 97%. 279 00:16:32,954 --> 00:16:36,433 Această tehnică ne-ar putea ajuta să rezolvăm o problemă majoră, 280 00:16:36,433 --> 00:16:39,247 și anume lipsa de competență medicală din lume. 281 00:16:39,247 --> 00:16:41,440 Forumul Mondial Economic spune 282 00:16:41,440 --> 00:16:45,484 că ne trebuie de 10–20 de ori mai mulți medici în țările în curs de dezvoltare 283 00:16:45,484 --> 00:16:47,799 și că ar dura cam 300 de ani 284 00:16:47,799 --> 00:16:51,008 pentru a forma oameni și a acoperi lipsa. 285 00:16:51,008 --> 00:16:56,270 Ce-ar fi dacă le-am crește eficiența folosind tehnicile de învățare profundă? 286 00:16:56,840 --> 00:17:01,123 Mă bucură această șansă, dar mă și îngrijorează problemele. 287 00:17:01,123 --> 00:17:04,399 Problema e că toate zonele albastre de pe harta aceasta 288 00:17:04,399 --> 00:17:08,173 reprezintă locuri unde în servicii lucrează 80% dintre angajați. 289 00:17:08,173 --> 00:17:09,957 Ce sunt serviciile? 290 00:17:09,957 --> 00:17:11,471 Acestea sunt serviciile. 291 00:17:12,021 --> 00:17:15,863 Exact asta au învățat recent calculatoarele să facă. 292 00:17:16,783 --> 00:17:21,573 Deci 80% din munca din lumea dezvoltată acum știe și calculatorul s-o facă. 293 00:17:22,306 --> 00:17:23,403 Ce înseamnă asta? 294 00:17:23,403 --> 00:17:25,770 Lasă, o să apară alte locuri de muncă, 295 00:17:25,770 --> 00:17:28,548 de exemplu în cercetarea datelor. 296 00:17:28,548 --> 00:17:29,510 De fapt nu prea. 297 00:17:29,510 --> 00:17:32,048 Cercetarea datelor nu cere mult timp. 298 00:17:32,048 --> 00:17:35,876 Acești patru algoritmi au fost construiți de un singur om. 299 00:17:35,876 --> 00:17:38,878 Poate vă gândiți că s-a mai întâmplat 300 00:17:38,878 --> 00:17:44,074 și am văzut deja rezultatele: când apare ceva nou apar și alte locuri de muncă. 301 00:17:44,074 --> 00:17:46,024 Dar care vor fi acestea? 302 00:17:46,494 --> 00:17:48,366 E greu de estimat, 303 00:17:48,366 --> 00:17:51,223 pentru că performanța umană crește încet, 304 00:17:51,223 --> 00:17:57,058 dar știm că sistemul de învățare profundă crește exponențial în capacitate. 305 00:17:57,058 --> 00:17:58,415 Ne aflăm aici. 306 00:17:58,415 --> 00:18:00,304 Acum vedem ce se întâmplă 307 00:18:00,304 --> 00:18:03,179 și ne gândim: calculatoarele sunt încă proaste, nu? 308 00:18:03,179 --> 00:18:06,769 Dar în cinci ani calculatoarele vor ieși din acest grafic. 309 00:18:06,769 --> 00:18:10,526 Așa că trebuie să ne gândim de pe acum la această capacitate. 310 00:18:10,526 --> 00:18:13,877 Am mai văzut asta odată, desigur: la Revoluția Industrială 311 00:18:13,877 --> 00:18:16,707 motoarele au produs un salt de capacitate. 312 00:18:17,987 --> 00:18:20,826 Dar după un timp situația s-a stabilizat. 313 00:18:20,826 --> 00:18:22,410 Au existat perturbări sociale, 314 00:18:22,410 --> 00:18:26,043 dar după ce inginerii au învățat să folosească noua putere peste tot 315 00:18:26,043 --> 00:18:28,612 lucrurile s-au stabilizat bine. 316 00:18:28,612 --> 00:18:32,342 Revoluția Învățării Automate va diferi mult de Revoluția Industrială 317 00:18:32,342 --> 00:18:35,562 pentru că lucrurile nu se vor stabiliza niciodată. 318 00:18:35,562 --> 00:18:38,710 Cu cât calculatorul va fi mai bun la activități intelectuale, 319 00:18:38,710 --> 00:18:43,248 cu atât vor construi calculatoare mai bune la activități intelectuale. 320 00:18:43,248 --> 00:18:47,284 Atunci va avea loc o schimbare nouă pe care omenirea n-o cunoaște, 321 00:18:47,284 --> 00:18:50,640 încât ce știam că e posibil nu mai e valabil. 322 00:18:51,150 --> 00:18:52,628 Deja simțim efectul. 323 00:18:52,628 --> 00:18:56,649 În vreme ce productivitatea capitalului a crescut în ultimii 25 de ani, 324 00:18:56,649 --> 00:19:00,416 productivitatea muncii a rămas constantă, ba chiar a scăzut un pic. 325 00:19:02,286 --> 00:19:04,346 Aș vrea să înceapă discuția aceasta. 326 00:19:04,346 --> 00:19:07,069 Adesea când vorbesc despre asta 327 00:19:07,069 --> 00:19:08,587 lumea respinge ideea. 328 00:19:08,587 --> 00:19:13,308 Păi calculatoarele nu gândesc cu adevărat, nu au emoții, nu înțeleg poezia, 329 00:19:13,308 --> 00:19:15,888 nu prea înțelegem cum funcționează. 330 00:19:15,888 --> 00:19:17,157 Și ce dacă? 331 00:19:17,157 --> 00:19:19,178 Computerele pot face azi lucruri 332 00:19:19,178 --> 00:19:21,975 pentru care oamenii muncesc mult timp și sunt plătiți. 333 00:19:21,975 --> 00:19:23,985 E momentul să începem să ne gândim 334 00:19:23,985 --> 00:19:28,408 cum ne vom adapta structurile sociale și economice 335 00:19:28,408 --> 00:19:30,320 în fața acestei noi realități. 336 00:19:30,320 --> 00:19:31,410 Mulțumesc. 337 00:19:31,410 --> 00:19:32,440 (Applauze)