1
00:00:00,880 --> 00:00:06,623
Altădată, dacă voiai ca un computer
să facă ceva nou, trebuia să-l programezi.

2
00:00:06,623 --> 00:00:09,858
Pentru cei care nu aveți experiența asta,

3
00:00:09,858 --> 00:00:13,257
programarea presupune să stabilești
în cele mai mici detalii

4
00:00:13,257 --> 00:00:16,859
fiecare pas pe care
i-l ceri calculatorului

5
00:00:16,859 --> 00:00:19,088
pentru a obține ce dorești.

6
00:00:19,548 --> 00:00:24,881
Dacă vrei să faci ceva ce n-ai putea face
tu însuți, atunci îți va fi foarte greu.

7
00:00:24,881 --> 00:00:28,308
Foarte greu i-a fost și unui anumit
Arthur Samuel.

8
00:00:28,308 --> 00:00:34,258
În 1956 dorea să programeze
un calculator care să-l învingă la dame.

9
00:00:34,258 --> 00:00:38,310
Cum faci să programezi calculatorul
în cele mai mici detalii

10
00:00:38,310 --> 00:00:40,530
încât să joace dame mai bine decât tine?

11
00:00:40,530 --> 00:00:42,124
I-a venit o idee:

12
00:00:42,124 --> 00:00:46,064
a pus calculatorul să joace
cu el însuși de mii de ori

13
00:00:46,064 --> 00:00:48,561
ca să învețe să joace dame.

14
00:00:49,031 --> 00:00:50,204
Ideea a mers.

15
00:00:50,204 --> 00:00:54,891
În 1962 calculatorul acesta l-a învins pe
campionul statului Connecticut.

16
00:00:55,431 --> 00:00:58,374
Arthur Samuel a fost părintele 
învățării automate.

17
00:00:58,374 --> 00:01:03,049
Eu îi sunt recunoscător pentru că și eu
mă ocup cu învățarea automată.

18
00:01:03,049 --> 00:01:04,475
Am fost președinte la Kaggle,

19
00:01:04,475 --> 00:01:08,333
o comunitate cu peste 200 000
de practicanți ai învățării automate.

20
00:01:08,333 --> 00:01:13,940
Kaggle organizează competiții pentru
rezolvarea problemelor încă nerezolvate.

21
00:01:13,940 --> 00:01:16,960
Și a avut sute de reușite.

22
00:01:17,530 --> 00:01:19,942
Din poziția mea avantajoasă am aflat

23
00:01:19,942 --> 00:01:23,885
ce putea face învățarea automată
în trecut, ce poate face azi

24
00:01:23,885 --> 00:01:26,354
și ce ar putea face în viitor.

25
00:01:26,354 --> 00:01:30,876
Probabil primul mare succes
al învățării automate a fost Google.

26
00:01:30,876 --> 00:01:34,097
Google a demonstrat
că poți găsi informații

27
00:01:34,097 --> 00:01:38,733
folosind un algoritm computerizat
bazat pe învățarea automată.

28
00:01:38,733 --> 00:01:42,316
De atunci s-au înregistrat numeroase
succese comerciale în domeniu.

29
00:01:42,316 --> 00:01:45,606
Companii ca Amazon și Netflix
folosesc învățarea automată

30
00:01:45,606 --> 00:01:47,973
pentru a vă sugera
ce ați vrea să cumpărați,

31
00:01:47,973 --> 00:01:49,897
ce filme ați vrea să vedeți.

32
00:01:49,897 --> 00:01:51,701
Uneori aproape că te sperie:

33
00:01:51,701 --> 00:01:56,305
de exemplu LinkedIn și Facebook
îți spun cine ți-ar putea fi prieten

34
00:01:56,305 --> 00:01:58,232
și habar n-ai cum au procedat.

35
00:01:58,232 --> 00:02:01,199
Se folosește puterea învățării automate.

36
00:02:01,199 --> 00:02:06,847
Sunt algoritmi care învață din date,
fără să fie programați manual.

37
00:02:07,529 --> 00:02:10,164
Tot așa a avut succes și IBM

38
00:02:10,164 --> 00:02:13,819
cu Watson, care a învins
cei doi campioni mondiali la „Jeopardy”,

39
00:02:13,819 --> 00:02:17,034
răspunzând la întrebări
incredibil de subtile și complexe ca:

40
00:02:17,034 --> 00:02:19,766
[Anticul „Leu din Nimrud” a dispărut
din muzeul național al acestui oraș în 2003
(împreună cu multe altele).]

41
00:02:19,766 --> 00:02:23,468
Tot astfel azi avem primele mașini
care se conduc singure.

42
00:02:23,468 --> 00:02:28,795
A face diferența între un copac
și un pieton, de exemplu, e important.

43
00:02:28,795 --> 00:02:31,460
Nu știm să scriem de mână
astfel de programe,

44
00:02:31,460 --> 00:02:34,056
dar prin învățare automată acum e posibil.

45
00:02:34,066 --> 00:02:39,390
Mașina aceasta a mers peste 1 milion de km
fără accidente, pe șosele obișnuite.

46
00:02:40,660 --> 00:02:44,318
Acum știm: calculatoarele pot învăța,

47
00:02:44,318 --> 00:02:46,233
ba chiar pot învăța să facă lucruri

48
00:02:46,233 --> 00:02:49,058
pe care uneori nici noi
nu știm să le facem

49
00:02:49,058 --> 00:02:51,980
sau poate le fac mai bine decât noi.

50
00:02:51,980 --> 00:02:55,981
Unul din cele mai uimitoare exemple
de învățare automată din câte am văzut

51
00:02:55,981 --> 00:02:58,523
a fost într-un proiect
al meu de la Kaggle,

52
00:02:58,523 --> 00:03:03,507
în care echipa lui Geoffrey Hinton
de la Universitatea din Toronto

53
00:03:03,507 --> 00:03:06,410
a câștigat un concurs
de descoperire automată a drogurilor.

54
00:03:06,410 --> 00:03:08,991
Extraordinar a fost nu că au surclasat

55
00:03:08,991 --> 00:03:13,000
toți algoritmii dezvoltați de Merck
sau de comunitatea academică,

56
00:03:13,000 --> 00:03:18,161
ci faptul că nimeni din echipă nu avea
pregătire în chimie sau biologie

57
00:03:18,161 --> 00:03:20,472
și au reușit în două săptămâni.

58
00:03:20,472 --> 00:03:22,421
Cum au reușit?

59
00:03:22,421 --> 00:03:25,462
Au folosit un algoritm numit 
învățare profundă.

60
00:03:25,462 --> 00:03:27,487
Succesul lor a fost atât de important

61
00:03:27,487 --> 00:03:31,518
încât a apărut pe prima pagină
a New York Times după câteva săptămâni.

62
00:03:31,518 --> 00:03:34,080
Iată-l pe Geoffrey Hinton aici în stânga.

63
00:03:34,080 --> 00:03:38,491
Învățarea profundă e un algoritm
inspirat din funcționarea creierului

64
00:03:38,491 --> 00:03:43,894
și astfel, teoretic, e un algoritm
fără limitări în ceea ce poate face.

65
00:03:43,894 --> 00:03:48,615
Cu cât îi dai mai multe date
și timp de calcul, cu atât devine mai bun.

66
00:03:48,615 --> 00:03:52,929
New York Times a prezentat în articol
încă un rezultat al învățării profunde,

67
00:03:52,929 --> 00:03:54,751
pe care vi-l arăt acum.

68
00:03:56,071 --> 00:03:59,806
Demonstrează că computerele
pot asculta și înțelege.

69
00:04:01,746 --> 00:04:06,651
(Video) Richard Rashid:
Ultimul pas pe care vreau să-l pot face

70
00:04:06,651 --> 00:04:10,236
e să vorbesc cu voi în chineză.

71
00:04:11,818 --> 00:04:18,688
Ideea de bază e că am stocat informații
de la mulți vorbitori de chineză

72
00:04:18,688 --> 00:04:21,429
și am realizat un sistem de sinteză vocală

73
00:04:21,429 --> 00:04:26,170
care convertește textul chinezesc
în chineza vorbită.

74
00:04:26,990 --> 00:04:30,334
Apoi am folosit o probă
de circa o oră cu vocea mea

75
00:04:30,334 --> 00:04:36,154
pentru a modula sistemul standard
încât să sune ca vocea mea.

76
00:04:36,782 --> 00:04:39,756
Repet, rezultatul nu e perfect.

77
00:04:39,756 --> 00:04:41,806
Există multe erori.

78
00:04:41,806 --> 00:04:44,592
(În chineză)

79
00:04:44,592 --> 00:04:49,447
(Aplauze)

80
00:04:49,447 --> 00:04:52,355
Mai sunt multe de făcut aici.

81
00:04:53,595 --> 00:04:56,904
(În chineză)

82
00:04:56,904 --> 00:05:00,774
(Aplauze)

83
00:05:01,464 --> 00:05:04,831
Jeremy Howard: Asta a fost o conferință
de învățare automată din China.

84
00:05:04,831 --> 00:05:09,227
La conferințele științifice
rareori se aud aplauze spontane.

85
00:05:09,227 --> 00:05:12,267
Dar la conferințele TEDx
faceți cum doriți.

86
00:05:12,757 --> 00:05:15,479
Tot ce ați văzut se bazează
pe învățarea profundă.

87
00:05:15,479 --> 00:05:16,801
(Aplauze)
Mulțumesc.

88
00:05:16,801 --> 00:05:19,238
Transcrierea în engleză
era cu învățare profundă.

89
00:05:19,238 --> 00:05:22,342
La fel și traducerea în chineză
și textul din dreapta sus.

90
00:05:22,342 --> 00:05:26,011
Sinteza vocii – tot învățare profundă.

91
00:05:26,561 --> 00:05:29,472
Învățarea profundă e extraordinară.

92
00:05:29,472 --> 00:05:32,338
E un singur algoritm,
care pare să poată face orice.

93
00:05:32,338 --> 00:05:35,765
Am aflat că înainte cu un an
învățase și să vadă.

94
00:05:35,765 --> 00:05:39,678
Într-o competiție obscură din Germania
de recunoaștere a indicatoarelor rutiere,

95
00:05:39,678 --> 00:05:43,870
a învățat să recunoască
indicatoare rutiere precum acesta.

96
00:05:43,870 --> 00:05:47,399
A recunoscut indicatoarele
mai bine decât orice alt algoritm

97
00:05:47,399 --> 00:05:51,887
și conform clasamentului chiar mai bine
decât oamenii, de vreo două ori mai bine.

98
00:05:51,887 --> 00:05:57,261
Deci până în 2011 a apărut primul
calculator care vede mai bine ca oamenii.

99
00:05:57,741 --> 00:05:59,490
De atunci s-au întâmplat multe.

100
00:05:59,490 --> 00:06:04,377
În 2012 Google a anunțat că a pus
un algoritm să se uite pe YouTube

101
00:06:04,377 --> 00:06:07,767
și să ronțăie datele cu 16000
de calculatoare timp de o lună,

102
00:06:07,767 --> 00:06:12,389
învățând singur despre concepte 
ca oamenii și pisicile

103
00:06:12,389 --> 00:06:14,019
doar privind videoclipuri.

104
00:06:14,029 --> 00:06:16,380
Tot cam așa învață și omul.

105
00:06:16,380 --> 00:06:19,089
Oamenii nu învață
din explicații despre ce văd,

106
00:06:19,089 --> 00:06:22,059
ci din propria experiență cu lucrurile.

107
00:06:22,559 --> 00:06:26,248
În 2012, Geoffrey Hinton, cel de adineauri

108
00:06:26,248 --> 00:06:29,026
a câștigat celebra competiție ImageNet,

109
00:06:29,026 --> 00:06:34,279
încercând să-și dea seama ce reprezintă
1,5 milioane de imagini.

110
00:06:34,279 --> 00:06:39,148
În 2014 eroarea de recunoaștere
a imaginilor a scăzut la 6%.

111
00:06:39,148 --> 00:06:41,266
Din nou mai bine ca oamenii.

112
00:06:41,786 --> 00:06:45,038
Mașinile se descurcă extraordinar de bine,

113
00:06:45,038 --> 00:06:47,233
iar acum sunt folosite în industrie.

114
00:06:47,233 --> 00:06:50,430
De exemplu, Google a anunțat anul trecut

115
00:06:50,430 --> 00:06:55,019
că a cartografiat toate locurile
din Franța în două ore.

116
00:06:55,019 --> 00:06:58,509
Au făcut asta încărcând 
imagini ale străzilor

117
00:06:58,509 --> 00:07:02,924
într-un algoritm de învățare profundă
care citește numărul străzii.

118
00:07:02,924 --> 00:07:05,085
Imaginați-vă cât ar fi durat altădată:

119
00:07:05,085 --> 00:07:08,291
zeci de oameni, mulți ani.

120
00:07:08,801 --> 00:07:10,344
Asta se întâmplă și în China.

121
00:07:10,344 --> 00:07:14,508
Baidu este ca un fel de Google, cred.

122
00:07:15,078 --> 00:07:20,767
Aici în stânga sus vedeți o poză
încărcată de mine în acest sistem,

123
00:07:20,767 --> 00:07:24,449
iar jos vedeți că sistemul a 
înțeles ce reprezintă poza

124
00:07:24,449 --> 00:07:26,537
și a găsit imagini similare.

125
00:07:26,537 --> 00:07:29,215
Acestea au un fundal asemănător,

126
00:07:29,215 --> 00:07:31,135
direcții similare ale fețelor,

127
00:07:31,135 --> 00:07:32,967
unele chiar cu limba afară.

128
00:07:32,967 --> 00:07:35,618
Nu e ca și cum ai vedea
textul unei pagini de internet.

129
00:07:35,618 --> 00:07:37,402
Am încărcat doar o imagine.

130
00:07:37,402 --> 00:07:40,936
Avem acum calculatoare 
care înțeleg ce văd

131
00:07:40,936 --> 00:07:42,936
și astfel pot căuta în baze de date

132
00:07:42,936 --> 00:07:45,743
cu sute de milioane de imagini
în timp real.

133
00:07:46,143 --> 00:07:49,092
Ce înseamnă faptul că văd?

134
00:07:49,542 --> 00:07:51,300
Și nu numai că văd.

135
00:07:51,300 --> 00:07:54,134
Învățarea profundă a ajuns mai departe.

136
00:07:54,134 --> 00:07:56,747
Propoziții complexe și nuanțate ca aceasta

137
00:07:56,747 --> 00:07:59,575
sunt inteligibile prin algoritmi
de învățare profundă.

138
00:07:59,575 --> 00:08:03,924
Aici vedeți cum un sistem de la Stanford
arată prin bulina roșie de sus

139
00:08:03,924 --> 00:08:07,633
că a înțeles conotația negativă
a acestei propoziții.

140
00:08:07,633 --> 00:08:10,491
Învățarea profundă are acum
performanțe aproape umane

141
00:08:10,491 --> 00:08:15,487
în a înțelege despre ce e propoziția
și ce comunică ea.

142
00:08:16,577 --> 00:08:19,165
Învățarea profundă se folosește
la a citi în chineză

143
00:08:19,165 --> 00:08:22,181
aproape de nivelul de vorbitor nativ.

144
00:08:22,181 --> 00:08:24,282
Algoritmul a fost dezvoltat în Elveția

145
00:08:24,282 --> 00:08:27,331
de oameni care nu vorbesc
și nu înțeleg deloc chineză.

146
00:08:27,791 --> 00:08:32,588
Învățarea profundă e cea mai bună
soluție din lume pentru așa ceva,

147
00:08:32,588 --> 00:08:35,678
chiar și față de
înțelegerea umană naturală.

148
00:08:37,198 --> 00:08:39,869
Iată un sistem pus la punct
de compania mea,

149
00:08:39,869 --> 00:08:41,841
care combină toate acestea.

150
00:08:41,841 --> 00:08:44,400
Aceste imagini nu sunt însoțite de text

151
00:08:44,400 --> 00:08:46,919
și pe măsură ce tastez propoziții aici

152
00:08:46,919 --> 00:08:51,172
înțelege în timp real imaginile,
își dă seama despre ce e vorba

153
00:08:51,172 --> 00:08:54,352
și găsește imagini similare cu 
cele din textul scris de mine.

154
00:08:54,352 --> 00:08:59,161
După cum vedeți, înțelege
atât propozițiile cât și imaginile.

155
00:08:59,601 --> 00:09:01,890
Știu că ați văzut ceva similar pe Google:

156
00:09:01,890 --> 00:09:04,791
– tastați ceva și vă arată imagini –,

157
00:09:04,791 --> 00:09:08,333
dar acolo de fapt caută
pagini de internet după text.

158
00:09:08,333 --> 00:09:10,821
E cu totul altceva
decât a înțelege imaginile.

159
00:09:10,821 --> 00:09:15,442
Calculatoarele au învățat să facă asta
abia acum câteva luni.

160
00:09:17,647 --> 00:09:21,359
Așadar calculatoarele nu doar văd,
ci pot și citi.

161
00:09:21,359 --> 00:09:24,462
Și desigur am demonstrat
că înțeleg ce aud.

162
00:09:24,892 --> 00:09:28,446
Atunci nu vă va mira
dacă vă spun că pot să și scrie.

163
00:09:28,446 --> 00:09:32,870
Iată un text pe care l-am generat ieri
cu un algoritm de învățare profundă.

164
00:09:34,020 --> 00:09:37,279
Iată și un text generat
de un algoritm de la Stanford.

165
00:09:37,279 --> 00:09:39,311
Fiecare propoziție a fost generată

166
00:09:39,311 --> 00:09:43,111
de un algoritm de învățare profundă
pentru a descrie imaginile.

167
00:09:43,111 --> 00:09:47,730
Algoritmul nu mai văzuse un bărbat
în cămașă neagră cântând la chitară.

168
00:09:47,730 --> 00:09:51,535
Mai văzuse un bărbat,
culoarea neagră, o chitară,

169
00:09:51,535 --> 00:09:55,885
dar a generat singur
o descriere nouă a acestei imagini.

170
00:09:56,334 --> 00:09:59,231
Încă n-am atins performanța umană,
dar ne apropiem.

171
00:09:59,231 --> 00:10:03,185
La testare oamenii preferă
descrierile generate de calculator

172
00:10:03,185 --> 00:10:04,801
cam o dată din patru.

173
00:10:04,801 --> 00:10:07,052
Sistemul are abia două săptămâni,

174
00:10:07,052 --> 00:10:11,454
deci probabil într-un an algoritmul
va depăși performanța umană

175
00:10:11,454 --> 00:10:14,048
la cum avansează lucrurile.

176
00:10:14,048 --> 00:10:16,440
Deci calculatoarele pot și să scrie.

177
00:10:16,440 --> 00:10:19,705
Toate astea la un loc creează
niște șanse fantastice.

178
00:10:19,705 --> 00:10:24,244
De exemplu, în medicină, o echipă
din Boston a anunțat că a descoperit

179
00:10:24,244 --> 00:10:26,846
zeci de caracteristici relevante clinic

180
00:10:26,846 --> 00:10:31,459
ale tumorilor care ajută doctorii
să prezică apariția cancerului.

181
00:10:32,499 --> 00:10:34,470
Similar, la Stanford

182
00:10:34,470 --> 00:10:38,362
un grup a anunțat că cercetând
la microscop țesuturile

183
00:10:38,362 --> 00:10:43,219
au realizat un sistem cu învățare automată
care reușește mai bine ca patologii umani

184
00:10:43,219 --> 00:10:47,016
să prevadă proporția de supraviețuire
a pacienților cu cancer.

185
00:10:47,466 --> 00:10:50,761
În ambele cazuri previziunile
au fost mai exacte

186
00:10:50,761 --> 00:10:53,246
și au ajutat și la progresul științific.

187
00:10:53,246 --> 00:10:58,088
În cazul radiologiei au apărut
indicatori clinici înțeleși de om.

188
00:10:58,088 --> 00:10:59,668
În cazul patologiei

189
00:10:59,668 --> 00:11:04,420
sistemul computerizat a descoperit
că celulele din jurul cancerului

190
00:11:04,420 --> 00:11:07,771
sunt la fel de importante
ca cele canceroase

191
00:11:07,771 --> 00:11:09,533
în stabilirea diagnosticului.

192
00:11:09,533 --> 00:11:14,604
Asta infirmă ce spun cursurile
de patologie de multe decenii încoace.

193
00:11:15,464 --> 00:11:17,905
În ambele cazuri,
sistemele au fost realizate

194
00:11:17,905 --> 00:11:21,534
de experți în medicină împreună cu
experți în învățare automată,

195
00:11:21,534 --> 00:11:24,284
dar anul trecut am depășit și acest prag.

196
00:11:24,284 --> 00:11:28,257
Iată un exemplu de identificare
a zonelor canceroase

197
00:11:28,257 --> 00:11:30,112
a țesutului uman la microscop.

198
00:11:30,932 --> 00:11:34,704
Sistemul prezentat aici poate identifica
acele zone mai exact

199
00:11:34,704 --> 00:11:37,620
sau cam la fel de exact ca patologii umani

200
00:11:37,620 --> 00:11:41,325
dar a fost realizat prin învățare profundă
fără competențe medicale

201
00:11:41,325 --> 00:11:43,813
de oameni care nu aveau
pregătire în domeniu.

202
00:11:44,733 --> 00:11:47,650
La fel, iată segmentarea unui neuron.

203
00:11:47,650 --> 00:11:50,781
Acum putem segmenta neuroni
la fel de precis ca oamenii,

204
00:11:50,781 --> 00:11:55,818
dar sistemul a fost realizat prin învățare
profundă, fără cunoștințe de medicină.

205
00:11:57,148 --> 00:12:00,151
Atunci eu, deși nu am
pregătire în medicină,

206
00:12:00,151 --> 00:12:03,961
se pare să sunt calificat
să pornesc o firmă de medicină.

207
00:12:03,961 --> 00:12:05,580
Ceea ce am și făcut.

208
00:12:06,390 --> 00:12:08,022
Mi-a fost puțin frică să fac asta,

209
00:12:08,022 --> 00:12:10,722
dar teoria pare să sugereze ca poți

210
00:12:10,722 --> 00:12:16,128
să faci ceva foarte util în medicină
folosind doar metode de analiză a datelor.

211
00:12:16,138 --> 00:12:19,762
Din fericire reacțiile au fost fantastice,
atât din partea presei,

212
00:12:19,762 --> 00:12:23,191
dar și comunitatea medicală
ne-a sprijinit foarte mult.

213
00:12:23,191 --> 00:12:27,359
Ideea e că putem să luăm
partea mijlocie a procesului medical

214
00:12:27,359 --> 00:12:30,361
și s-o transformăm în analiză de date,
pe cât posibil,

215
00:12:30,361 --> 00:12:33,425
lăsând apoi doctorii să-și facă meseria.

216
00:12:33,425 --> 00:12:37,369
Să vă dau un exemplu:
acum ne trebuie 15 minute

217
00:12:37,369 --> 00:12:40,436
pentru a stabili o analiză nouă
pentru diagnosticul medical.

218
00:12:40,436 --> 00:12:45,327
O să vă arăt acum, dar l-am redus
la trei minute prin eliminarea unor părți.

219
00:12:45,327 --> 00:12:48,768
În loc de crearea unei analize
pentru diagnosticul medical,

220
00:12:48,768 --> 00:12:52,149
o să vă arăt analiza imaginilor de mașini,

221
00:12:52,149 --> 00:12:54,385
ca să înțelegem toți.

222
00:12:54,385 --> 00:12:57,528
Începem cu circa 1,5 milioane
de imagini de mașini

223
00:12:57,528 --> 00:13:02,816
și vreau să creez ceva care le clasifică
după unghiul din care au fost pozate.

224
00:13:02,816 --> 00:13:06,588
Imaginile nu sunt deloc marcate, 
trebuie să pornesc de la zero.

225
00:13:07,078 --> 00:13:12,228
Algoritmul nostru de învățare profundă
găsește automat structurile din imagini.

226
00:13:12,228 --> 00:13:15,851
Partea bună e că acum oamenii
și calculatoarele pot colabora.

227
00:13:15,851 --> 00:13:17,951
Aici vedeți cum omul

228
00:13:17,961 --> 00:13:20,907
îi arată calculatorului zonele de interes

229
00:13:20,907 --> 00:13:25,499
pe care să se bazeze calculatorul
pentru a îmbunătăți algoritmul.

230
00:13:25,959 --> 00:13:29,671
Sistemele de învățare profundă operează
într-un spațiu cu 16 000 dimensiuni

231
00:13:29,671 --> 00:13:32,962
și vedeți cum se rotește calculatorul
prin acest spațiu

232
00:13:32,962 --> 00:13:35,226
pentru a găsi noi zone de structură.

233
00:13:35,226 --> 00:13:37,018
Când reușește,

234
00:13:37,018 --> 00:13:40,930
omul care îl conduce
poate indica zonele interesante.

235
00:13:40,930 --> 00:13:46,076
Aici calculatorul a găsit anumite zone,
de exemplu, cu unghiuri.

236
00:13:46,076 --> 00:13:49,704
Pe măsură ce continuăm,
îi dăm calculatorului mai multe date

237
00:13:49,704 --> 00:13:52,186
despre ce fel de structuri căutăm.

238
00:13:52,186 --> 00:13:57,722
Într-o analiză medicală aici ar putea fi
un patolog care identifică zone patogene

239
00:13:57,722 --> 00:14:02,505
sau un radiolog care indică
nodulii cu probleme posibile.

240
00:14:03,025 --> 00:14:05,105
Uneori algoritmului îi poate fi greu.

241
00:14:05,105 --> 00:14:09,367
Iată un caz în care s-a încurcat:
a amestecat fața și spatele mașinilor.

242
00:14:09,367 --> 00:14:11,435
Aici trebuie să fim mai atenți,

243
00:14:11,435 --> 00:14:14,803
să separăm manual fața și spatele

244
00:14:14,803 --> 00:14:18,030
și apoi să-i spunem
calculatorului că acesta e

245
00:14:18,030 --> 00:14:21,376
un tip de grup care ne interesează.

246
00:14:21,816 --> 00:14:24,200
Continuăm o vreme, 
sărim peste câte ceva

247
00:14:24,200 --> 00:14:26,515
și apoi antrenăm algoritmul
de învățare automată

248
00:14:26,515 --> 00:14:28,678
pe baza celor câteva sute de lucruri

249
00:14:28,678 --> 00:14:30,216
și sperăm că a avansat.

250
00:14:30,216 --> 00:14:32,688
Vedeți, acum începe să estompeze 
anumite imagini,

251
00:14:32,688 --> 00:14:37,792
arătând că începe să înțeleagă singur
să recunoască o parte din ele.

252
00:14:38,332 --> 00:14:43,251
Putem folosi acest concept
de imagini similare și astfel vedeți

253
00:14:43,251 --> 00:14:47,512
cum calculatorul poate găsi
doar mașinile pozate din față.

254
00:14:47,512 --> 00:14:50,267
Acum omul poate spune calculatorului:

255
00:14:50,267 --> 00:14:53,041
„Da, ai făcut o treabă bună.”

256
00:14:54,031 --> 00:14:59,629
Sigur, uneori chiar și acum
separarea grupurilor e dificilă.

257
00:14:59,629 --> 00:15:04,002
Aici chiar după ce am lăsat o vreme
calculatorul să încerce rotațiile,

258
00:15:04,002 --> 00:15:08,412
vedem că pozele făcute din stânga
și cele din dreapta sunt amestecate.

259
00:15:08,412 --> 00:15:10,615
Putem da calculatorului sugestii:

260
00:15:10,615 --> 00:15:15,877
caută o proiecție care separă
cât mai bine părțile stângă și dreaptă

261
00:15:15,877 --> 00:15:18,111
folosind algoritmul de învățare profundă.

262
00:15:18,111 --> 00:15:21,021
Apoi uite, sugestia a dus la succes.

263
00:15:21,021 --> 00:15:25,619
A reușit să găsească un mod
de a analiza obiectele încât să le separe.

264
00:15:26,999 --> 00:15:29,926
Ați prins ideea:

265
00:15:29,926 --> 00:15:37,346
e o situație în care omul
nu e înlocuit de calculator,

266
00:15:37,346 --> 00:15:39,738
ci lucrează împreună cu el.

267
00:15:39,738 --> 00:15:45,243
Am înlocuit munca unei echipe
de 5–6 oameni timp de vreo șapte ani,

268
00:15:45,243 --> 00:15:49,768
cu ceva care îi ia 15 minute
unui om care lucrează singur.

269
00:15:51,577 --> 00:15:54,096
Procesul necesită 4–5 iterații.

270
00:15:54,096 --> 00:15:58,748
Am ajuns la 62% de clasificare corectă
a 1,5 milioane de imagini.

271
00:15:58,748 --> 00:16:03,124
În acest stadiu putem începe
să prelucrăm rapid secțiuni mari

272
00:16:03,124 --> 00:16:05,401
și să verificăm să nu rămână greșeli,

273
00:16:05,401 --> 00:16:09,488
iar dacă sunt greșeli
îi spunem calculatorului.

274
00:16:09,488 --> 00:16:12,443
Folosind acest proces
la fiecare din diferitele grupuri

275
00:16:12,443 --> 00:16:17,881
am ajuns la o proporție de succes de 80%
în a clasifica cele 1,5 milioane de poze.

276
00:16:18,321 --> 00:16:23,278
Acum mai rămâne doar să găsim puținele
imagini care n-au fost clasificate corect

277
00:16:23,278 --> 00:16:25,892
și să încercăm să înțelegem de ce.

278
00:16:26,382 --> 00:16:32,078
Procedând astfel în 15 minute ajungem
la proporții de clasificare de 97%.

279
00:16:32,954 --> 00:16:36,433
Această tehnică ne-ar putea ajuta
să rezolvăm o problemă majoră,

280
00:16:36,433 --> 00:16:39,247
și anume lipsa de competență 
medicală din lume.

281
00:16:39,247 --> 00:16:41,440
Forumul Mondial Economic spune

282
00:16:41,440 --> 00:16:45,484
că ne trebuie de 10–20 de ori mai mulți
medici în țările în curs de dezvoltare

283
00:16:45,484 --> 00:16:47,799
și că ar dura cam 300 de ani

284
00:16:47,799 --> 00:16:51,008
pentru a forma oameni și a acoperi lipsa.

285
00:16:51,008 --> 00:16:56,270
Ce-ar fi dacă le-am crește eficiența
folosind tehnicile de învățare profundă?

286
00:16:56,840 --> 00:17:01,123
Mă bucură această șansă,
dar mă și îngrijorează problemele.

287
00:17:01,123 --> 00:17:04,399
Problema e că toate zonele
albastre de pe harta aceasta

288
00:17:04,399 --> 00:17:08,173
reprezintă locuri unde în servicii
lucrează 80% dintre angajați.

289
00:17:08,173 --> 00:17:09,957
Ce sunt serviciile?

290
00:17:09,957 --> 00:17:11,471
Acestea sunt serviciile.

291
00:17:12,021 --> 00:17:15,863
Exact asta au învățat recent
calculatoarele să facă.

292
00:17:16,783 --> 00:17:21,573
Deci 80% din munca din lumea dezvoltată
acum știe și calculatorul s-o facă.

293
00:17:22,306 --> 00:17:23,403
Ce înseamnă asta?

294
00:17:23,403 --> 00:17:25,770
Lasă, o să apară alte locuri de muncă,

295
00:17:25,770 --> 00:17:28,548
de exemplu în cercetarea datelor.

296
00:17:28,548 --> 00:17:29,510
De fapt nu prea.

297
00:17:29,510 --> 00:17:32,048
Cercetarea datelor nu cere mult timp.

298
00:17:32,048 --> 00:17:35,876
Acești patru algoritmi au fost
construiți de un singur om.

299
00:17:35,876 --> 00:17:38,878
Poate vă gândiți că s-a mai întâmplat

300
00:17:38,878 --> 00:17:44,074
și am văzut deja rezultatele: când apare
ceva nou apar și alte locuri de muncă.

301
00:17:44,074 --> 00:17:46,024
Dar care vor fi acestea?

302
00:17:46,494 --> 00:17:48,366
E greu de estimat,

303
00:17:48,366 --> 00:17:51,223
pentru că performanța umană crește încet,

304
00:17:51,223 --> 00:17:57,058
dar știm că sistemul de învățare profundă
crește exponențial în capacitate.

305
00:17:57,058 --> 00:17:58,415
Ne aflăm aici.

306
00:17:58,415 --> 00:18:00,304
Acum vedem ce se întâmplă

307
00:18:00,304 --> 00:18:03,179
și ne gândim: calculatoarele
sunt încă proaste, nu?

308
00:18:03,179 --> 00:18:06,769
Dar în cinci ani calculatoarele
vor ieși din acest grafic.

309
00:18:06,769 --> 00:18:10,526
Așa că trebuie să ne gândim
de pe acum la această capacitate.

310
00:18:10,526 --> 00:18:13,877
Am mai văzut asta odată, desigur:
la Revoluția Industrială

311
00:18:13,877 --> 00:18:16,707
motoarele au produs un salt de capacitate.

312
00:18:17,987 --> 00:18:20,826
Dar după un timp situația s-a stabilizat.

313
00:18:20,826 --> 00:18:22,410
Au existat perturbări sociale,

314
00:18:22,410 --> 00:18:26,043
dar după ce inginerii au învățat
să folosească noua putere peste tot

315
00:18:26,043 --> 00:18:28,612
lucrurile s-au stabilizat bine.

316
00:18:28,612 --> 00:18:32,342
Revoluția Învățării Automate
va diferi mult de Revoluția Industrială

317
00:18:32,342 --> 00:18:35,562
pentru că lucrurile
nu se vor stabiliza niciodată.

318
00:18:35,562 --> 00:18:38,710
Cu cât calculatorul va fi mai bun
la activități intelectuale,

319
00:18:38,710 --> 00:18:43,248
cu atât vor construi calculatoare mai bune
la activități intelectuale.

320
00:18:43,248 --> 00:18:47,284
Atunci va avea loc o schimbare nouă
pe care omenirea n-o cunoaște,

321
00:18:47,284 --> 00:18:50,640
încât ce știam că e posibil
nu mai e valabil.

322
00:18:51,150 --> 00:18:52,628
Deja simțim efectul.

323
00:18:52,628 --> 00:18:56,649
În vreme ce productivitatea capitalului
a crescut în ultimii 25 de ani,

324
00:18:56,649 --> 00:19:00,416
productivitatea muncii a rămas constantă,
ba chiar a scăzut un pic.

325
00:19:02,286 --> 00:19:04,346
Aș vrea să înceapă discuția aceasta.

326
00:19:04,346 --> 00:19:07,069
Adesea când vorbesc despre asta

327
00:19:07,069 --> 00:19:08,587
lumea respinge ideea.

328
00:19:08,587 --> 00:19:13,308
Păi calculatoarele nu gândesc cu adevărat,
nu au emoții, nu înțeleg poezia,

329
00:19:13,308 --> 00:19:15,888
nu prea înțelegem cum funcționează.

330
00:19:15,888 --> 00:19:17,157
Și ce dacă?

331
00:19:17,157 --> 00:19:19,178
Computerele pot face azi lucruri

332
00:19:19,178 --> 00:19:21,975
pentru care oamenii muncesc
mult timp și sunt plătiți.

333
00:19:21,975 --> 00:19:23,985
E momentul să începem să ne gândim

334
00:19:23,985 --> 00:19:28,408
cum ne vom adapta
structurile sociale și economice

335
00:19:28,408 --> 00:19:30,320
în fața acestei noi realități.

336
00:19:30,320 --> 00:19:31,410
Mulțumesc.

337
00:19:31,410 --> 00:19:32,440
(Applauze)