Romanian subtitles

← Implicațiile minunate și îngrozitoare ale calculatoarelor care pot învăța

Get Embed Code
30 Languages

Showing Revision 47 created 08/06/2015 by Adrian Dobroiu.

  1. Altădată, dacă voiai ca un computer
    să facă ceva nou, trebuia să-l programezi.
  2. Pentru cei care nu aveți experiența asta,
  3. programarea presupune să stabilești
    în cele mai mici detalii
  4. fiecare pas pe care
    i-l ceri calculatorului
  5. pentru a obține ce dorești.
  6. Dacă vrei să faci ceva ce n-ai putea face
    tu însuți, atunci îți va fi foarte greu.
  7. Foarte greu i-a fost și unui anumit
    Arthur Samuel.

  8. În 1956 dorea să programeze
    un calculator care să-l învingă la dame.
  9. Cum faci să programezi calculatorul
    în cele mai mici detalii
  10. încât să joace dame mai bine decât tine?
  11. I-a venit o idee:
  12. a pus calculatorul să joace
    cu el însuși de mii de ori
  13. ca să învețe să joace dame.
  14. Ideea a mers.
  15. În 1962 calculatorul acesta l-a învins pe
    campionul statului Connecticut.
  16. Arthur Samuel a fost părintele
    învățării automate.

  17. Eu îi sunt recunoscător pentru că și eu
    mă ocup cu învățarea automată.
  18. Am fost președinte la Kaggle,
  19. o comunitate cu peste 200 000
    de practicanți ai învățării automate.
  20. Kaggle organizează competiții pentru
    rezolvarea problemelor încă nerezolvate.
  21. Și a avut sute de reușite.
  22. Din poziția mea avantajoasă am aflat
  23. ce putea face învățarea automată
    în trecut, ce poate face azi
  24. și ce ar putea face în viitor.
  25. Probabil primul mare succes
    al învățării automate a fost Google.
  26. Google a demonstrat
    că poți găsi informații
  27. folosind un algoritm computerizat
    bazat pe învățarea automată.
  28. De atunci s-au înregistrat numeroase
    succese comerciale în domeniu.
  29. Companii ca Amazon și Netflix
    folosesc învățarea automată
  30. pentru a vă sugera
    ce ați vrea să cumpărați,
  31. ce filme ați vrea să vedeți.
  32. Uneori aproape că te sperie:
  33. de exemplu LinkedIn și Facebook
    îți spun cine ți-ar putea fi prieten
  34. și habar n-ai cum au procedat.
  35. Se folosește puterea învățării automate.
  36. Sunt algoritmi care învață din date,
    fără să fie programați manual.

  37. Tot așa a avut succes și IBM
  38. cu Watson, care a învins
    cei doi campioni mondiali la „Jeopardy”,
  39. răspunzând la întrebări
    incredibil de subtile și complexe ca:
  40. [Anticul „Leu din Nimrud” a dispărut
    din muzeul național al acestui oraș în 2003
    (împreună cu multe altele).]
  41. Tot astfel azi avem primele mașini
    care se conduc singure.
  42. A face diferența între un copac
    și un pieton, de exemplu, e important.
  43. Nu știm să scriem de mână
    astfel de programe,
  44. dar prin învățare automată acum e posibil.
  45. Mașina aceasta a mers peste 1 milion de km
    fără accidente, pe șosele obișnuite.
  46. Acum știm: calculatoarele pot învăța,
  47. ba chiar pot învăța să facă lucruri
  48. pe care uneori nici noi
    nu știm să le facem
  49. sau poate le fac mai bine decât noi.
  50. Unul din cele mai uimitoare exemple
    de învățare automată din câte am văzut
  51. a fost într-un proiect
    al meu de la Kaggle,
  52. în care echipa lui Geoffrey Hinton
    de la Universitatea din Toronto
  53. a câștigat un concurs
    de descoperire automată a drogurilor.
  54. Extraordinar a fost nu că au surclasat
  55. toți algoritmii dezvoltați de Merck
    sau de comunitatea academică,
  56. ci faptul că nimeni din echipă nu avea
    pregătire în chimie sau biologie
  57. și au reușit în două săptămâni.
  58. Cum au reușit?
  59. Au folosit un algoritm numit
    învățare profundă.
  60. Succesul lor a fost atât de important
  61. încât a apărut pe prima pagină
    a New York Times după câteva săptămâni.
  62. Iată-l pe Geoffrey Hinton aici în stânga.
  63. Învățarea profundă e un algoritm
    inspirat din funcționarea creierului
  64. și astfel, teoretic, e un algoritm
    fără limitări în ceea ce poate face.
  65. Cu cât îi dai mai multe date
    și timp de calcul, cu atât devine mai bun.
  66. New York Times a prezentat în articol
    încă un rezultat al învățării profunde,

  67. pe care vi-l arăt acum.
  68. Demonstrează că computerele
    pot asculta și înțelege.
  69. (Video) Richard Rashid:
    Ultimul pas pe care vreau să-l pot face
  70. e să vorbesc cu voi în chineză.
  71. Ideea de bază e că am stocat informații
    de la mulți vorbitori de chineză
  72. și am realizat un sistem de sinteză vocală
  73. care convertește textul chinezesc
    în chineza vorbită.
  74. Apoi am folosit o probă
    de circa o oră cu vocea mea
  75. pentru a modula sistemul standard
    încât să sune ca vocea mea.
  76. Repet, rezultatul nu e perfect.
  77. Există multe erori.
  78. (În chineză)
  79. (Aplauze)
  80. Mai sunt multe de făcut aici.
  81. (În chineză)

  82. (Aplauze)
  83. Jeremy Howard: Asta a fost o conferință
    de învățare automată din China.

  84. La conferințele științifice
    rareori se aud aplauze spontane.
  85. Dar la conferințele TEDx
    faceți cum doriți.
  86. Tot ce ați văzut se bazează
    pe învățarea profundă.
  87. (Aplauze)
    Mulțumesc.
  88. Transcrierea în engleză
    era cu învățare profundă.
  89. La fel și traducerea în chineză
    și textul din dreapta sus.

  90. Sinteza vocii – tot învățare profundă.
  91. Învățarea profundă e extraordinară.
  92. E un singur algoritm,
    care pare să poată face orice.
  93. Am aflat că înainte cu un an
    învățase și să vadă.
  94. Într-o competiție obscură din Germania
    de recunoaștere a indicatoarelor rutiere,
  95. a învățat să recunoască
    indicatoare rutiere precum acesta.
  96. A recunoscut indicatoarele
    mai bine decât orice alt algoritm
  97. și conform clasamentului chiar mai bine
    decât oamenii, de vreo două ori mai bine.
  98. Deci până în 2011 a apărut primul
    calculator care vede mai bine ca oamenii.
  99. De atunci s-au întâmplat multe.
  100. În 2012 Google a anunțat că a pus
    un algoritm să se uite pe YouTube
  101. și să ronțăie datele cu 16000
    de calculatoare timp de o lună,
  102. învățând singur despre concepte
    ca oamenii și pisicile
  103. doar privind videoclipuri.
  104. Tot cam așa învață și omul.
  105. Oamenii nu învață
    din explicații despre ce văd,
  106. ci din propria experiență cu lucrurile.
  107. În 2012, Geoffrey Hinton, cel de adineauri
  108. a câștigat celebra competiție ImageNet,
  109. încercând să-și dea seama ce reprezintă
    1,5 milioane de imagini.
  110. În 2014 eroarea de recunoaștere
    a imaginilor a scăzut la 6%.
  111. Din nou mai bine ca oamenii.

  112. Mașinile se descurcă extraordinar de bine,

  113. iar acum sunt folosite în industrie.
  114. De exemplu, Google a anunțat anul trecut
  115. că a cartografiat toate locurile
    din Franța în două ore.
  116. Au făcut asta încărcând
    imagini ale străzilor
  117. într-un algoritm de învățare profundă
    care citește numărul străzii.
  118. Imaginați-vă cât ar fi durat altădată:
  119. zeci de oameni, mulți ani.
  120. Asta se întâmplă și în China.
  121. Baidu este ca un fel de Google, cred.
  122. Aici în stânga sus vedeți o poză
    încărcată de mine în acest sistem,
  123. iar jos vedeți că sistemul a
    înțeles ce reprezintă poza
  124. și a găsit imagini similare.
  125. Acestea au un fundal asemănător,
  126. direcții similare ale fețelor,
  127. unele chiar cu limba afară.
  128. Nu e ca și cum ai vedea
    textul unei pagini de internet.
  129. Am încărcat doar o imagine.
  130. Avem acum calculatoare
    care înțeleg ce văd
  131. și astfel pot căuta în baze de date
  132. cu sute de milioane de imagini
    în timp real.
  133. Ce înseamnă faptul că văd?

  134. Și nu numai că văd.
  135. Învățarea profundă a ajuns mai departe.
  136. Propoziții complexe și nuanțate ca aceasta
  137. sunt inteligibile prin algoritmi
    de învățare profundă.
  138. Aici vedeți cum un sistem de la Stanford
    arată prin bulina roșie de sus
  139. că a înțeles conotația negativă
    a acestei propoziții.
  140. Învățarea profundă are acum
    performanțe aproape umane
  141. în a înțelege despre ce e propoziția
    și ce comunică ea.
  142. Învățarea profundă se folosește
    la a citi în chineză
  143. aproape de nivelul de vorbitor nativ.
  144. Algoritmul a fost dezvoltat în Elveția
  145. de oameni care nu vorbesc
    și nu înțeleg deloc chineză.
  146. Învățarea profundă e cea mai bună
    soluție din lume pentru așa ceva,
  147. chiar și față de
    înțelegerea umană naturală.
  148. Iată un sistem pus la punct
    de compania mea,

  149. care combină toate acestea.
  150. Aceste imagini nu sunt însoțite de text
  151. și pe măsură ce tastez propoziții aici
  152. înțelege în timp real imaginile,
    își dă seama despre ce e vorba
  153. și găsește imagini similare cu
    cele din textul scris de mine.
  154. După cum vedeți, înțelege
    atât propozițiile cât și imaginile.
  155. Știu că ați văzut ceva similar pe Google:
  156. – tastați ceva și vă arată imagini –,
  157. dar acolo de fapt caută
    pagini de internet după text.
  158. E cu totul altceva
    decât a înțelege imaginile.
  159. Calculatoarele au învățat să facă asta
    abia acum câteva luni.
  160. Așadar calculatoarele nu doar văd,
    ci pot și citi.

  161. Și desigur am demonstrat
    că înțeleg ce aud.
  162. Atunci nu vă va mira
    dacă vă spun că pot să și scrie.
  163. Iată un text pe care l-am generat ieri
    cu un algoritm de învățare profundă.
  164. Iată și un text generat
    de un algoritm de la Stanford.
  165. Fiecare propoziție a fost generată
  166. de un algoritm de învățare profundă
    pentru a descrie imaginile.
  167. Algoritmul nu mai văzuse un bărbat
    în cămașă neagră cântând la chitară.
  168. Mai văzuse un bărbat,
    culoarea neagră, o chitară,
  169. dar a generat singur
    o descriere nouă a acestei imagini.
  170. Încă n-am atins performanța umană,
    dar ne apropiem.
  171. La testare oamenii preferă
    descrierile generate de calculator
  172. cam o dată din patru.
  173. Sistemul are abia două săptămâni,
  174. deci probabil într-un an algoritmul
    va depăși performanța umană
  175. la cum avansează lucrurile.
  176. Deci calculatoarele pot și să scrie.
  177. Toate astea la un loc creează
    niște șanse fantastice.

  178. De exemplu, în medicină, o echipă
    din Boston a anunțat că a descoperit
  179. zeci de caracteristici relevante clinic
  180. ale tumorilor care ajută doctorii
    să prezică apariția cancerului.
  181. Similar, la Stanford
  182. un grup a anunțat că cercetând
    la microscop țesuturile
  183. au realizat un sistem cu învățare automată
    care reușește mai bine ca patologii umani
  184. să prevadă proporția de supraviețuire
    a pacienților cu cancer.
  185. În ambele cazuri previziunile
    au fost mai exacte
  186. și au ajutat și la progresul științific.
  187. În cazul radiologiei au apărut
    indicatori clinici înțeleși de om.
  188. În cazul patologiei
  189. sistemul computerizat a descoperit
    că celulele din jurul cancerului
  190. sunt la fel de importante
    ca cele canceroase
  191. în stabilirea diagnosticului.
  192. Asta infirmă ce spun cursurile
    de patologie de multe decenii încoace.
  193. În ambele cazuri,
    sistemele au fost realizate
  194. de experți în medicină împreună cu
    experți în învățare automată,
  195. dar anul trecut am depășit și acest prag.
  196. Iată un exemplu de identificare
    a zonelor canceroase
  197. a țesutului uman la microscop.
  198. Sistemul prezentat aici poate identifica
    acele zone mai exact
  199. sau cam la fel de exact ca patologii umani
  200. dar a fost realizat prin învățare profundă
    fără competențe medicale
  201. de oameni care nu aveau
    pregătire în domeniu.
  202. La fel, iată segmentarea unui neuron.
  203. Acum putem segmenta neuroni
    la fel de precis ca oamenii,
  204. dar sistemul a fost realizat prin învățare
    profundă, fără cunoștințe de medicină.
  205. Atunci eu, deși nu am
    pregătire în medicină,
  206. se pare să sunt calificat
    să pornesc o firmă de medicină.
  207. Ceea ce am și făcut.
  208. Mi-a fost puțin frică să fac asta,
  209. dar teoria pare să sugereze ca poți
  210. să faci ceva foarte util în medicină
    folosind doar metode de analiză a datelor.
  211. Din fericire reacțiile au fost fantastice,
    atât din partea presei,
  212. dar și comunitatea medicală
    ne-a sprijinit foarte mult.
  213. Ideea e că putem să luăm
    partea mijlocie a procesului medical
  214. și s-o transformăm în analiză de date,
    pe cât posibil,
  215. lăsând apoi doctorii să-și facă meseria.
  216. Să vă dau un exemplu:
    acum ne trebuie 15 minute
  217. pentru a stabili o analiză nouă
    pentru diagnosticul medical.
  218. O să vă arăt acum, dar l-am redus
    la trei minute prin eliminarea unor părți.
  219. În loc de crearea unei analize
    pentru diagnosticul medical,
  220. o să vă arăt analiza imaginilor de mașini,

  221. ca să înțelegem toți.
  222. Începem cu circa 1,5 milioane
    de imagini de mașini

  223. și vreau să creez ceva care le clasifică
    după unghiul din care au fost pozate.
  224. Imaginile nu sunt deloc marcate,
    trebuie să pornesc de la zero.
  225. Algoritmul nostru de învățare profundă
    găsește automat structurile din imagini.
  226. Partea bună e că acum oamenii
    și calculatoarele pot colabora.
  227. Aici vedeți cum omul
  228. îi arată calculatorului zonele de interes
  229. pe care să se bazeze calculatorul
    pentru a îmbunătăți algoritmul.
  230. Sistemele de învățare profundă operează
    într-un spațiu cu 16 000 dimensiuni
  231. și vedeți cum se rotește calculatorul
    prin acest spațiu
  232. pentru a găsi noi zone de structură.
  233. Când reușește,
  234. omul care îl conduce
    poate indica zonele interesante.
  235. Aici calculatorul a găsit anumite zone,
    de exemplu, cu unghiuri.
  236. Pe măsură ce continuăm,
    îi dăm calculatorului mai multe date
  237. despre ce fel de structuri căutăm.
  238. Într-o analiză medicală aici ar putea fi
    un patolog care identifică zone patogene
  239. sau un radiolog care indică
    nodulii cu probleme posibile.
  240. Uneori algoritmului îi poate fi greu.
  241. Iată un caz în care s-a încurcat:
    a amestecat fața și spatele mașinilor.
  242. Aici trebuie să fim mai atenți,
  243. să separăm manual fața și spatele
  244. și apoi să-i spunem
    calculatorului că acesta e
  245. un tip de grup care ne interesează.
  246. Continuăm o vreme,
    sărim peste câte ceva

  247. și apoi antrenăm algoritmul
    de învățare automată
  248. pe baza celor câteva sute de lucruri
  249. și sperăm că a avansat.
  250. Vedeți, acum începe să estompeze
    anumite imagini,
  251. arătând că începe să înțeleagă singur
    să recunoască o parte din ele.
  252. Putem folosi acest concept
    de imagini similare și astfel vedeți
  253. cum calculatorul poate găsi
    doar mașinile pozate din față.
  254. Acum omul poate spune calculatorului:
  255. „Da, ai făcut o treabă bună.”
  256. Sigur, uneori chiar și acum
    separarea grupurilor e dificilă.

  257. Aici chiar după ce am lăsat o vreme
    calculatorul să încerce rotațiile,
  258. vedem că pozele făcute din stânga
    și cele din dreapta sunt amestecate.
  259. Putem da calculatorului sugestii:
  260. caută o proiecție care separă
    cât mai bine părțile stângă și dreaptă
  261. folosind algoritmul de învățare profundă.
  262. Apoi uite, sugestia a dus la succes.
  263. A reușit să găsească un mod
    de a analiza obiectele încât să le separe.
  264. Ați prins ideea:

  265. e o situație în care omul
    nu e înlocuit de calculator,
  266. ci lucrează împreună cu el.
  267. Am înlocuit munca unei echipe
    de 5–6 oameni timp de vreo șapte ani,
  268. cu ceva care îi ia 15 minute
    unui om care lucrează singur.
  269. Procesul necesită 4–5 iterații.

  270. Am ajuns la 62% de clasificare corectă
    a 1,5 milioane de imagini.
  271. În acest stadiu putem începe
    să prelucrăm rapid secțiuni mari
  272. și să verificăm să nu rămână greșeli,
  273. iar dacă sunt greșeli
    îi spunem calculatorului.
  274. Folosind acest proces
    la fiecare din diferitele grupuri
  275. am ajuns la o proporție de succes de 80%
    în a clasifica cele 1,5 milioane de poze.
  276. Acum mai rămâne doar să găsim puținele
    imagini care n-au fost clasificate corect
  277. și să încercăm să înțelegem de ce.
  278. Procedând astfel în 15 minute ajungem
    la proporții de clasificare de 97%.
  279. Această tehnică ne-ar putea ajuta
    să rezolvăm o problemă majoră,

  280. și anume lipsa de competență
    medicală din lume.
  281. Forumul Mondial Economic spune
  282. că ne trebuie de 10–20 de ori mai mulți
    medici în țările în curs de dezvoltare
  283. și că ar dura cam 300 de ani
  284. pentru a forma oameni și a acoperi lipsa.
  285. Ce-ar fi dacă le-am crește eficiența
    folosind tehnicile de învățare profundă?
  286. Mă bucură această șansă,
    dar mă și îngrijorează problemele.

  287. Problema e că toate zonele
    albastre de pe harta aceasta
  288. reprezintă locuri unde în servicii
    lucrează 80% dintre angajați.
  289. Ce sunt serviciile?
  290. Acestea sunt serviciile.
  291. Exact asta au învățat recent
    calculatoarele să facă.
  292. Deci 80% din munca din lumea dezvoltată
    acum știe și calculatorul s-o facă.
  293. Ce înseamnă asta?
  294. Lasă, o să apară alte locuri de muncă,
  295. de exemplu în cercetarea datelor.
  296. De fapt nu prea.
  297. Cercetarea datelor nu cere mult timp.
  298. Acești patru algoritmi au fost
    construiți de un singur om.
  299. Poate vă gândiți că s-a mai întâmplat
  300. și am văzut deja rezultatele: când apare
    ceva nou apar și alte locuri de muncă.
  301. Dar care vor fi acestea?
  302. E greu de estimat,
  303. pentru că performanța umană crește încet,
  304. dar știm că sistemul de învățare profundă
    crește exponențial în capacitate.
  305. Ne aflăm aici.
  306. Acum vedem ce se întâmplă
  307. și ne gândim: calculatoarele
    sunt încă proaste, nu?
  308. Dar în cinci ani calculatoarele
    vor ieși din acest grafic.
  309. Așa că trebuie să ne gândim
    de pe acum la această capacitate.
  310. Am mai văzut asta odată, desigur:
    la Revoluția Industrială
  311. motoarele au produs un salt de capacitate.
  312. Dar după un timp situația s-a stabilizat.
  313. Au existat perturbări sociale,
  314. dar după ce inginerii au învățat
    să folosească noua putere peste tot
  315. lucrurile s-au stabilizat bine.
  316. Revoluția Învățării Automate
    va diferi mult de Revoluția Industrială
  317. pentru că lucrurile
    nu se vor stabiliza niciodată.
  318. Cu cât calculatorul va fi mai bun
    la activități intelectuale,
  319. cu atât vor construi calculatoare mai bune
    la activități intelectuale.
  320. Atunci va avea loc o schimbare nouă
    pe care omenirea n-o cunoaște,
  321. încât ce știam că e posibil
    nu mai e valabil.
  322. Deja simțim efectul.

  323. În vreme ce productivitatea capitalului
    a crescut în ultimii 25 de ani,
  324. productivitatea muncii a rămas constantă,
    ba chiar a scăzut un pic.
  325. Aș vrea să înceapă discuția aceasta.
  326. Adesea când vorbesc despre asta
  327. lumea respinge ideea.
  328. Păi calculatoarele nu gândesc cu adevărat,
    nu au emoții, nu înțeleg poezia,
  329. nu prea înțelegem cum funcționează.
  330. Și ce dacă?
  331. Computerele pot face azi lucruri
  332. pentru care oamenii muncesc
    mult timp și sunt plătiți.
  333. E momentul să începem să ne gândim
  334. cum ne vom adapta
    structurile sociale și economice
  335. în fața acestei noi realități.
  336. Mulțumesc.
  337. (Applauze)