WEBVTT

00:00:00.650 --> 00:00:03.363
Valaha, ha azt akartuk, hogy 
a számítógép

00:00:03.363 --> 00:00:06.447
csináljon meg valamit, előtte 
be kellett rá programoznunk.

00:00:06.447 --> 00:00:09.858
Azoknak, akik sohasem programoztak:
a programozás

00:00:09.858 --> 00:00:14.020
annyit tesz, hogy célunk érdekében 
aprólékosan, lépésenként

00:00:14.020 --> 00:00:16.727
részletesen közölni kell a géppel,

00:00:16.727 --> 00:00:19.089
mikor mit csináljon.

00:00:19.089 --> 00:00:22.585
De ha olyat akarunk tenni, 
amiről mi sem tudjuk, miként kell,

00:00:22.585 --> 00:00:25.238
az ám az igazi kunszt!

NOTE Paragraph

00:00:25.238 --> 00:00:28.131
Ilyen feladattal találkozott 
Arthur Samuel.

00:00:28.131 --> 00:00:31.658
1956-ban szerette volna,

00:00:31.658 --> 00:00:34.548
ha a számítógép legyőzi dámajátékban.

00:00:34.548 --> 00:00:36.588
Hogy lehet megírni egy programot

00:00:36.588 --> 00:00:40.394
minden apró részletében, 
hogy a számítógép győzzön?

00:00:40.394 --> 00:00:42.116
Támadt egy ötlete:

00:00:42.116 --> 00:00:45.840
A gépet önmaga ellen játszatta 
több ezerszer,

00:00:45.840 --> 00:00:49.004
hogy a gép tanulja, hogyan kell játszani.

00:00:49.004 --> 00:00:51.544
A dolog sikerült, és 1962-re

00:00:51.544 --> 00:00:55.561
a számítógép legyőzte 
Connecticut állam bajnokát.

NOTE Paragraph

00:00:55.561 --> 00:00:58.534
Úgyhogy Samuelt a gépi 
tanulás atyjának nevezhetjük.

00:00:58.534 --> 00:01:00.251
Le vagyok kötelezve neki,

00:01:00.251 --> 00:01:03.014
mert gépi tanulással foglalkozom.

00:01:03.014 --> 00:01:04.759
A Kaggle elnöke voltam, a közösségé,


00:01:04.759 --> 00:01:07.867
ahol 200.000-nél többen foglalkoznak 
gépi tanulással.

00:01:07.867 --> 00:01:09.925
A Kaggle versenyeket 
szervez nekik,

00:01:09.925 --> 00:01:13.633
hogy oldjanak meg eddig 
megoldatlan problémákat,

00:01:13.633 --> 00:01:17.470
s ezek több száz alkalommal 
bizonyultak sikeresnek.

00:01:17.470 --> 00:01:19.940
Ebből a pozícióból
rá tudtam jönni sok mindenre:

00:01:19.940 --> 00:01:23.890
mire volt képes a gépi tanulás 
a múltban, mire a jelenben


00:01:23.890 --> 00:01:26.252
és mit fog tudni a jövőben.

00:01:26.252 --> 00:01:30.675
Valószínűleg az első üzleti siker a 
gépi tanulásban a Google volt.

00:01:30.675 --> 00:01:33.784
A Google bizonyította, hogy lehet 
gépi algoritmus alapján

00:01:33.784 --> 00:01:35.536
adatokhoz jutni, és

00:01:35.536 --> 00:01:38.437
ez az algoritmus 
gépi tanuláson alapul.

00:01:38.437 --> 00:01:41.573
Azóta sok, gépi tanuláson alapuló 
üzleti sikertörténetet ismerünk.

00:01:41.593 --> 00:01:44.850
Olyan cégek, mint az Amazon 
és a Netflix a gépi tanulás módszerével

00:01:44.850 --> 00:01:47.876
ajánlják termékeiket megvételre

00:01:47.876 --> 00:01:49.896
illetve filmjeiket megnézésre.

00:01:49.896 --> 00:01:51.703
Néha ez, mondhatni, elég ijesztő.

00:01:51.703 --> 00:01:53.657
Mások, mint a LinkedIn és a Facebook

00:01:53.657 --> 00:01:56.251
néha megmondják, kik lehetnének 
a barátaink,

00:01:56.251 --> 00:01:58.228
és fogalmunk sincs, hogy csinálják.

00:01:58.228 --> 00:02:01.195
A gépi tanulásban rejlő
lehetőségeket használják.

00:02:01.195 --> 00:02:04.152
Ezek az algoritmusok sokkal inkább 
az adatokból tanulnak,

00:02:04.152 --> 00:02:07.399
semmint a kézzel írt programokból.

NOTE Paragraph

00:02:07.399 --> 00:02:10.807
Így lett sikeres az IBM is: Watson 
nevű gépe legyőzte

00:02:10.807 --> 00:02:13.739
a "Jeopardy" kvízműsor 
két világbajnokát,

00:02:13.739 --> 00:02:16.294
mert válaszolt körmönfont
és bonyolult kérdésekre; pl.

00:02:16.294 --> 00:02:19.899
[Ennek a városnak a múzeumából tűnt el 
az ókori Nimród oroszlánja 2003-ban]

00:02:19.909 --> 00:02:23.034
Így jelentek meg az első, 
vezető nélküli autók.

00:02:23.034 --> 00:02:25.856
Elég fontos, hogy 
meg tudjuk mondani, mi a különbség,

00:02:25.856 --> 00:02:28.308
mondjuk, egy fa és egy gyalogos között.

00:02:28.308 --> 00:02:31.075
Nem tudjuk, hogyan kell manuálisan 
megírni a programokat,

00:02:31.075 --> 00:02:34.072
de gépi tanulással erre 
most megvan a lehetőség.

00:02:34.072 --> 00:02:36.870
Tény, hogy ez a kocsi már
több millió kilométert tett meg

00:02:36.870 --> 00:02:40.186
baleset nélkül átlagos utakon.

NOTE Paragraph

00:02:40.196 --> 00:02:44.110
Tudjuk tehát, hogy a számítógépek 
tudnak tanulni, és képesek megtanulni,

00:02:44.110 --> 00:02:46.010
hogyan végezzenek el feladatokat,

00:02:46.010 --> 00:02:48.848
amelyeknél néha mi magunk 
tanácstalanok vagyunk,

00:02:48.848 --> 00:02:51.733
vagy talán ügyesebben végzik el nálunk.

00:02:51.733 --> 00:02:55.618
A gépi tanulás egyik legpompásabb 
példáját

00:02:55.618 --> 00:02:58.320
egy általam irányított Kaggle-
projektnél tapasztaltam,

00:02:58.320 --> 00:03:01.061
ahol a Torontói Egyetem csoportja,

00:03:01.061 --> 00:03:03.463
amelyet Geoffrey Hinton vezetett, 
megnyert

00:03:03.463 --> 00:03:06.140
egy automatizált 
gyógyszer-kifejlesztési versenyt.

00:03:06.140 --> 00:03:09.477
Nemcsak az volt rendhagyó, 
hogy legyőzték a Merck

00:03:09.477 --> 00:03:13.000
és más nemzetközi tudóscsoportok
algoritmusait,

00:03:13.000 --> 00:03:17.001
hanem hogy egyikük sem volt járatos 
a kémiában, a biológiában

00:03:17.001 --> 00:03:20.230
vagy az élettudományokban, s 
mindezt két hét alatt!

00:03:20.230 --> 00:03:21.611
Hogy sikerült nekik?

00:03:22.421 --> 00:03:25.342
Rendhagyó algoritmust 
alkalmaztak, az ú.n. mély tanulást.

00:03:25.342 --> 00:03:28.291
Annyira fontos eredmény volt ez, 
hogy a The New York Times

00:03:28.291 --> 00:03:31.412
címoldalon tudósított róla pár hét múlva.

00:03:31.412 --> 00:03:34.147
Balra látható Geoffrey Hinton.

00:03:34.147 --> 00:03:37.858
A mély tanulás olyan algoritmus, 
amelyet az emberi agy működése ihletett.

00:03:37.858 --> 00:03:40.300
Az algoritmusnak nincs 
elméleti korlátja


00:03:40.300 --> 00:03:43.881
abból a szempontból, hogy 
mi mindenre lehet képes.

00:03:43.881 --> 00:03:46.174
Minél több adatot és gépidőt 
adunk neki,

00:03:46.174 --> 00:03:48.276
annál jobbak lesznek az eredmények.

NOTE Paragraph

00:03:48.276 --> 00:03:50.615
A The New York Times írt cikkében 
a mély tanulás

00:03:50.615 --> 00:03:52.857
egy másik rendkívüli eredményéről is,

00:03:52.857 --> 00:03:54.739
amelyről rögtön szólni fogok.

00:03:55.569 --> 00:04:00.510
Ez azt mutatja, hogy a számítógépek 
képesek hangot érzékelni és értelmezni.


NOTE Paragraph

00:04:00.510 --> 00:04:03.221
(Video) Richard Rashid:
Az utolsó lépés, s ezt szeretném,

00:04:03.221 --> 00:04:06.246
hogy hozzá tudjam tenni a folyamathoz:

00:04:06.246 --> 00:04:10.961
kínaiul beszélni önökhöz.

00:04:10.961 --> 00:04:13.596
Ennek kulcsa, hogy képesek voltunk

00:04:13.596 --> 00:04:18.598
nagy mennyiségű információt 
átvenni sok kínai beszédjéből,

00:04:18.598 --> 00:04:21.128
létrehozni egy "szövegből beszédet"
rendszert, amely

00:04:21.128 --> 00:04:25.801
a kínai szöveget átalakítja 
kínai beszéddé.

00:04:25.801 --> 00:04:29.929
Azután az én hangmintámból felvettünk 
egy órányit,

00:04:29.929 --> 00:04:31.820
s ezzel moduláltuk a szokásos

00:04:31.820 --> 00:04:36.364
"szövegből beszédet" rendszert, 
amely aztán az én hangomon szólalt meg.

00:04:36.364 --> 00:04:38.904
Az eredmény nem tökéletes.

00:04:38.904 --> 00:04:41.552
Tény, hogy elég sok a hiba.

00:04:41.552 --> 00:04:44.036
(kínaiul)

00:04:44.036 --> 00:04:48.073
(taps)

00:04:49.446 --> 00:04:53.022
Elég sok feladat van még ezen a területen.

00:04:53.022 --> 00:04:56.667
(kínaiul)

00:04:56.667 --> 00:05:00.960
(taps)

NOTE Paragraph

00:05:01.345 --> 00:05:04.744
Howard: Ez egy gépi tanulási
konferencián történt, Kínában.

00:05:04.744 --> 00:05:07.114
Valóban ritka, hogy egy 
tudományos tanácskozáson

00:05:07.114 --> 00:05:09.011
spontán tapsot hall az ember,

00:05:09.011 --> 00:05:12.027
bár néha TEDx konferenciákon igen.

00:05:12.027 --> 00:05:15.482
Amit itt láttak, mind a mély tanulással 
kapcsolatos.

00:05:15.482 --> 00:05:17.007
(taps) Köszönöm.

00:05:17.007 --> 00:05:19.289
A fonetikus átírás angolra 
mély tanulás volt.

00:05:19.289 --> 00:05:22.701
A kínaira fordítás és a szöveg 
a jobb fölső sarokban szintén,

00:05:22.701 --> 00:05:26.008
és a hangképzés úgyszintén 
mély tanulás volt.

NOTE Paragraph

00:05:26.008 --> 00:05:29.242
Úgy hogy a mély tanulás különleges dolog.

00:05:29.242 --> 00:05:32.341
Egyszerű algoritmus, de úgy látszik, 
majdnem mindenre alkalmas,

00:05:32.341 --> 00:05:35.452
erre tavaly jöttem rá. 
Látni is megtanult már.

00:05:35.452 --> 00:05:37.628
Egy kevéssé ismert német versenyen,

00:05:37.628 --> 00:05:40.225
amely a közlekedési jelzések
felismerésére irányul,

00:05:40.225 --> 00:05:43.618
a mély tanulás megtanulta fölismerni 
a közlekedési jelzéseket.

00:05:43.618 --> 00:05:45.712
Nemcsak jobban ismeri föl 
őket,

00:05:45.712 --> 00:05:47.470
mint bármely más algoritmus,

00:05:47.470 --> 00:05:50.189
az eredményjelző kimutatta, 
hogy az embernél is jobban,

00:05:50.189 --> 00:05:52.041
kb. kétszer jobban mint az ember.

00:05:52.041 --> 00:05:54.037
2011-re megvolt az első példány az

00:05:54.037 --> 00:05:57.442
embernél is jobban látó 
számítógépből.

00:05:57.442 --> 00:05:59.491
Azóta sok minden történt.

00:05:59.491 --> 00:06:02.685
2012-ben a Google közölte, 
hogy van egy mély tanuló algoritmusuk,

00:06:02.685 --> 00:06:04.420
amely figyeli a YouTube videókat, és

00:06:04.420 --> 00:06:07.857
egy hónap alatt átrágta magát 
16.000 gép adatain,

00:06:07.857 --> 00:06:11.878
és a gép önállóan megtanult olyan 
fogalmakat mint "ember", vagy

00:06:11.878 --> 00:06:14.027
"macska", csupán csak a videókat figyelve.

00:06:14.027 --> 00:06:16.109
Az emberek nagyon hasonlóan tanulnak.

00:06:16.109 --> 00:06:19.119
Az emberek nem úgy tanulnak, 
hogy megmondják nekik, mit látnak,

00:06:19.119 --> 00:06:22.450
hanem maguknak tanítják meg,
mik ezek a dolgok.

00:06:22.450 --> 00:06:25.819
2012-ben az említett Geoffrey Hinton

00:06:25.819 --> 00:06:28.677
megnyert egy nagyon népszerű 
ImageNet versenyt, ahol

00:06:28.677 --> 00:06:32.818
másfél millió képről kellett

00:06:32.818 --> 00:06:34.256
eldönteni, melyik mit ábrázol.

00:06:34.256 --> 00:06:37.789
2014-re elértük a képfelismerésben

00:06:37.789 --> 00:06:39.242
a 6%-os hibaszintet.

00:06:39.242 --> 00:06:41.268
Ez megint az emberekénél jobb eredmény.

NOTE Paragraph

00:06:41.268 --> 00:06:45.037
Tehát a gépek ebben rendkívül
jó munkát végeznek, és

00:06:45.037 --> 00:06:47.306
az eredményeket ma 
az iparban is hasznosítják.

00:06:47.306 --> 00:06:50.348
Például a Google tavaly bejelentette,

00:06:50.348 --> 00:06:54.933
hogy két óra alatt feltérképezte 
egész Franciaországot,

00:06:54.933 --> 00:06:58.380
mindezt úgy, hogy betáplálták 
az utcai látképeket egy

00:06:58.380 --> 00:07:02.699
mélyen tanuló algoritmusba, 
az fölismerte és beolvasta

00:07:02.699 --> 00:07:04.919
a házszámokat.
Korábban meddig tartott volna!

00:07:04.919 --> 00:07:08.274
Tucatnyi ember, több év.

00:07:08.274 --> 00:07:10.185
Ez történik most Kínában is.

00:07:10.185 --> 00:07:14.221
A Baidu olyasmi, mint egy kínai Google,

00:07:14.221 --> 00:07:16.504
és a bal fölső sarokban látható 
egy kép, amelyet

00:07:16.504 --> 00:07:20.478
feltöltöttem a Baidu mély tanuló 
rendszerébe,

00:07:20.478 --> 00:07:24.247
alatta pedig látják, hogy a rendszer 
megértette, mi ez a kép,

00:07:24.247 --> 00:07:26.483
és talált hasonló képeket.

00:07:26.483 --> 00:07:29.219
A hasonló képnek egyébként 
hasonló a háttere,

00:07:29.219 --> 00:07:30.877
az állatok pofája egyfelé fordul,

00:07:30.877 --> 00:07:32.665
némelyik még a nyelvét is kiölti.

00:07:32.665 --> 00:07:35.045
Ez nem ugyanaz, 
mint egy szöveg a weboldalon.

00:07:35.045 --> 00:07:37.107
Mindössze egy képet töltöttem föl.

00:07:37.107 --> 00:07:41.128
Tehát a mai számítógépeink 
tényleg értik, amit látnak,

00:07:41.128 --> 00:07:42.752
és százmilliónyi képet tartalmazó 


00:07:42.752 --> 00:07:46.306
adatbázist nézhetnek át valós időben.

NOTE Paragraph

00:07:46.306 --> 00:07:49.536
De mit jelent az, hogy 
a számítógépek látnak?

00:07:49.536 --> 00:07:51.553
Nos, nemcsak, hogy látnak.

00:07:51.553 --> 00:07:53.792
Valójában a mély tanulás 
ennél többet ért el.

00:07:53.792 --> 00:07:56.570
Az összetett, finoman árnyalt 
mondatok mint ez,

00:07:56.570 --> 00:07:59.154
mély tanuló algoritmusokkal 
ma már érthetők.

00:07:59.154 --> 00:08:00.697
A felül látható piros pöttyel

00:08:00.697 --> 00:08:03.465
ez a stanfordi rendszer jelzi,

00:08:03.465 --> 00:08:07.384
hogy ez a mondat 
negatív érzelmet fejez ki.

00:08:07.384 --> 00:08:11.120
A mély tanulás ma már tényleg 
megközelíti az emberi teljesítményt abban,

00:08:11.120 --> 00:08:15.923
miről szól a mondat, és 
mit állít ezekről a dolgokról.

00:08:15.923 --> 00:08:18.651
A mély tanulás révén olvasunk kínaiul,

00:08:18.651 --> 00:08:21.807
kb. egy született kínai szintjén.

00:08:21.807 --> 00:08:24.365
Ez az algoritmus svájci, 
s akik kifejlesztették,

00:08:24.365 --> 00:08:27.331
nem beszélnek, és nem értenek kínaiul.

00:08:27.331 --> 00:08:29.382
A mély tanulás alkalmazása

00:08:29.382 --> 00:08:31.601
erre talán a világ legjobb rendszere,

00:08:31.601 --> 00:08:36.718
akár összevetve a természetes 
emberi megértéssel.

NOTE Paragraph

00:08:36.718 --> 00:08:39.682
Ezt a rendszert raktuk össze 
a cégemnél, mely

00:08:39.682 --> 00:08:41.728
megmutatja, hogyan kell ezeket összerakni.

00:08:41.728 --> 00:08:44.189
Ezekhez a képekhez nem társul szöveg,

00:08:44.189 --> 00:08:46.541
és ahogy mondatokat írok be ide,

00:08:46.541 --> 00:08:49.510
ez valós időben megérti ezeket a képeket, és

00:08:49.510 --> 00:08:51.189
kitalálja, miről szólnak, és

00:08:51.189 --> 00:08:54.352
talál a beírt szöveghez hasonló képeket.

00:08:54.352 --> 00:08:57.108
Ez azt jelenti, hogy valójában 
érti a mondataimat,

00:08:57.108 --> 00:08:59.332
és valójában érti a képeket.

00:08:59.332 --> 00:09:01.891
Tudom, hogy hasonlót 
már láttak a Google-on,

00:09:01.891 --> 00:09:04.666
ahol beírják a szavakat, 
és megjelennek a képek,

00:09:04.666 --> 00:09:08.090
de az úgy működik, hogy a gép 
a weboldalon szöveget keres.

00:09:08.090 --> 00:09:11.091
Az teljesen más, mint 
képeket fölismerni.

00:09:11.091 --> 00:09:13.843
Ilyesmit számítógépek csak 
az utóbbi hónapokban

00:09:13.843 --> 00:09:17.091
voltak képesek első ízben megcsinálni.

NOTE Paragraph

00:09:17.091 --> 00:09:21.182
A számítógépek nemcsak 
látnak, hanem olvasnak is,

00:09:21.182 --> 00:09:24.947
megmutattuk:
értik is, amit hallanak.

00:09:24.947 --> 00:09:28.389
Talán nem meglepő, ha elmondom, 
hogy írni is tudnak.

00:09:28.389 --> 00:09:33.172
Itt egy szöveg, amelyet tegnap egy 
mély tanuló algoritmussal írattam.

00:09:33.172 --> 00:09:36.686
Itt egy szöveg, 
melyet a stanfordi algoritmus írt.

00:09:36.686 --> 00:09:38.860
Minden mondatot mély tanuló algoritmus

00:09:38.860 --> 00:09:43.109
állított elő a képek leírása céljából.

00:09:43.109 --> 00:09:47.581
Az algoritmus korábban soha nem látott 
fekete inges, gitározó embert.

00:09:47.581 --> 00:09:49.801
Látott korábban embert, 
látott fekete színt,

00:09:49.801 --> 00:09:51.400
látott korábban gitárt,

00:09:51.400 --> 00:09:55.694
de önállóan állította elő
a kép új leírását.

00:09:55.694 --> 00:09:59.196
Ez még nem üti meg az 
emberi teljesítmény szintjét, de közelíti.

00:09:59.196 --> 00:10:02.904
A tesztekben az esetek negyedében
jobban tetszik az embernek

00:10:02.904 --> 00:10:04.791
a számítógép-generálta képaláírás.

00:10:04.791 --> 00:10:06.855
Nos, ez a rendszer csupán kéthetes,

00:10:06.855 --> 00:10:08.701
tehát valószínűleg egy éven belül

00:10:08.701 --> 00:10:11.502
a számítógépes algoritmus

00:10:11.502 --> 00:10:13.364
felülmúlja az emberi teljesítményt.

00:10:13.364 --> 00:10:16.413
Tehát a számítógép írni is tud.

NOTE Paragraph

00:10:16.413 --> 00:10:19.888
Ha mindent összerakunk, 
ez izgalmas lehetőségekhez vezet.

00:10:19.888 --> 00:10:21.380
Például a gyógyításban,

00:10:21.380 --> 00:10:23.905
egy bostoni csoport bejelentette, 
hogy felfedeztek

00:10:23.905 --> 00:10:26.854
több tucat klinikailag fontos 
daganat-jellemzőt,

00:10:26.854 --> 00:10:31.120
amelyek segítenek az orvosoknak 
a rák előrejelzésében.

00:10:32.220 --> 00:10:34.516
Hasonlóképpen, Stanfordban

00:10:34.516 --> 00:10:38.179
bejelentették, hogy kifejlesztettek 
egy gépi tanuló rendszert,

00:10:38.179 --> 00:10:40.560
amely a szöveteket nagyításban vizsgálva

00:10:40.560 --> 00:10:43.142
a rákosok túlélési esélyeinek 
előrejelzésében

00:10:43.142 --> 00:10:47.519
tényleg jobban teljesít, 
mint a patológusok.

00:10:47.519 --> 00:10:50.764
Mindkét esetben az előrejelzések 
nemcsak pontosabbak voltak,

00:10:50.764 --> 00:10:53.266
hanem új tudományos eredményt hoztak.

00:10:53.276 --> 00:10:54.781
A radiológia esetében

00:10:54.781 --> 00:10:57.876
ezek új klinikai mutatók, amelyeket 
az ember képes értelmezni.

00:10:57.876 --> 00:10:59.668
A patológiai esetben

00:10:59.668 --> 00:11:04.168
a számítógépes rendszer végeredményben
felfedezte, hogy

00:11:04.168 --> 00:11:06.948
a rák körüli sejtek a diagnózis 
fölállításában

00:11:06.948 --> 00:11:09.260
ugyanolyan fontosak, mint maguk
a rákos sejtek.


00:11:09.260 --> 00:11:14.621
A patológusoknak évtizedeken át
pont az ellenkezőjét tanították.

00:11:14.621 --> 00:11:17.913
Mindkét esetben ezek olyan 
rendszerek, melyeket

00:11:17.913 --> 00:11:21.534
az orvos és a gépi tanulás 
szakértők együtt

00:11:21.534 --> 00:11:24.275
fejlesztettek ki. Tavaly óta 
ezt is túlhaladtuk.

00:11:24.275 --> 00:11:27.824
Itt egy példa arra, ahogyan 
mikroszkóp alatt azonosítják

00:11:27.824 --> 00:11:30.354
az emberi szövet rákos területét.

00:11:30.354 --> 00:11:34.967
A bemutatott rendszer pontosabban vagy kb.
ugyanolyan pontossággal tudja azonosítani

00:11:34.967 --> 00:11:37.742
azokat a területeket, mint egy patológus.

00:11:37.742 --> 00:11:41.134
Mély tanulással alakították ki 
a rendszert, orvosi szakértelem nélkül,

00:11:41.134 --> 00:11:43.660
olyanok, akiknek nincs semmi hátterük
a témában.

00:11:44.460 --> 00:11:47.285
Azután itt van az idegsejtek 
szelvényezése. Már majdnem

00:11:47.285 --> 00:11:50.953
olyan precízen tudjuk szelvényezni 
az idegsejteket, mint az emberek,

00:11:50.953 --> 00:11:53.670
és a rendszert mély tanulással 
azok alakították ki,

00:11:53.670 --> 00:11:56.921
akiknek nem volt előzetes 
orvosi tapasztalatuk.

NOTE Paragraph

00:11:56.921 --> 00:12:00.148
Úgy éreztem, hogy 
orvosi háttér nélkül is

00:12:00.148 --> 00:12:03.875
eléggé képzett vagyok, hogy 
orvosi céget alapítsak.

00:12:03.875 --> 00:12:05.411
Meg is tettem.

00:12:05.411 --> 00:12:07.761
Kissé féltem tőle, 
de az elmélet azt sugallta,

00:12:07.761 --> 00:12:10.650
hogy hasznára válhatnánk a gyógyításnak


00:12:10.650 --> 00:12:16.142
csupán ilyen adatelemző módszerek 
alkalmazásával.

00:12:16.142 --> 00:12:18.622
Hálás vagyok a fantasztikus fogadtatásért,

00:12:18.622 --> 00:12:21.418
nemcsak a média, hanem 
az orvosi közösség részéről is,


00:12:21.418 --> 00:12:23.322
akik nagyon támogattak.

00:12:23.322 --> 00:12:27.471
Az elmélet szerint a gyógyítás 
folyamatában a középső részt lecseréljük

00:12:27.471 --> 00:12:30.364
adatelemzésre lehetőség szerint, és
azt hagyjuk az orvosokra,

00:12:30.364 --> 00:12:33.429
amihez legjobban értenek.

00:12:33.429 --> 00:12:36.591
Mondok rá példát. Ma 15 perc

00:12:36.591 --> 00:12:39.975
egy új diagnosztikai teszt kidolgozása.

00:12:39.975 --> 00:12:41.929
Megmutatom ezt önöknek valós 
időben, de én három percbe

00:12:41.929 --> 00:12:45.416
sűrítettem be, mert elhagytam 
egyes elemeit.

00:12:45.416 --> 00:12:48.477
Ahelyett, hogy megmutatnám, hogy 
készül egy diagnosztikai teszt,

00:12:48.477 --> 00:12:51.846
lássuk inkább autót ábrázoló képek 
diagnosztikai tesztjét,

00:12:51.846 --> 00:12:54.068
mert azt mindenki érteni fogja.

NOTE Paragraph

00:12:54.068 --> 00:12:57.269
Kb. másfél millió, autót 
ábrázoló képpel kezdünk,

00:12:57.269 --> 00:13:00.475
és szeretnék létrehozni valamit, 
ami aszerint rendezi őket,

00:13:00.475 --> 00:13:02.698
hogy milyen szögből készült a felvétel.

00:13:02.698 --> 00:13:06.586
A képek címkézetlenek, ezért 
az alapoktól kell kezdenem.

00:13:06.586 --> 00:13:08.451
Mély tanuló algoritmusunkkal

00:13:08.451 --> 00:13:12.158
azonosítani lehet 
az egyes részekhez tartozó területeket.

00:13:12.158 --> 00:13:15.778
Az ember és a gép pompásan 
együtt tud működni.

00:13:15.778 --> 00:13:17.956
Az ember, ahogy itt látható,

00:13:17.956 --> 00:13:20.631
megmondja a gépnek, mely
területek érdeklik,

00:13:20.631 --> 00:13:25.281
melyeken szeretné, hogy próbáljon 
javítani a gép az algoritmusa szerint.

00:13:25.281 --> 00:13:29.577
Ezek a mély tanuló rendszerek egy 
16.000-dimenziós térben vannak,

00:13:29.577 --> 00:13:33.009
látják, ahogy a gép ezt pörgeti 
azon a téren keresztül,

00:13:33.009 --> 00:13:34.761
és próbál új területeket találni.

00:13:34.761 --> 00:13:37.162
Amint eredményt ér el, 
az őt irányító ember

00:13:37.162 --> 00:13:40.786
megjelölheti az érdekes területeket.

00:13:40.786 --> 00:13:43.208
A gépnek sikerült területeket találnia,

00:13:43.208 --> 00:13:45.770
például sarkokat.

00:13:45.770 --> 00:13:47.376
Ahogy végigvisszük a folyamatot,

00:13:47.376 --> 00:13:49.716
fokozatosan egyre többet közlünk 
a géppel arról,

00:13:49.716 --> 00:13:51.784
miféle struktúrát keresünk.

00:13:51.784 --> 00:13:53.916
Képzeljenek el egy diagnosztikai tesztben

00:13:53.916 --> 00:13:57.266
egy patológust, amint meghatározza
a patologikus részeket,

00:13:57.266 --> 00:14:02.292
vagy egy radiológust, 
amint kimutatja a gócokat.

00:14:02.292 --> 00:14:04.851
Néha nehéz az algoritmus számára.

00:14:04.851 --> 00:14:06.815
Most egy kissé összezavarodott.

00:14:06.815 --> 00:14:09.365
Összekeveri a kocsik elejét a hátuljával.

00:14:09.365 --> 00:14:11.437
Egy kicsit jobban kell vigyáznunk, és

00:14:11.437 --> 00:14:14.669
nekünk kell előbb különválogatnunk 
a kocsik elejét és a hátulját,

00:14:14.669 --> 00:14:18.505
azután megmondjuk a gépnek,

00:14:18.505 --> 00:14:21.523
hogy ez a csoport érdekes 
nekünk.


NOTE Paragraph

00:14:21.523 --> 00:14:24.200
Ez eltart egy ideig, ugrunk egyet,

00:14:24.200 --> 00:14:26.446
és okítjuk a párszáz dologra támaszkodó

00:14:26.446 --> 00:14:28.420
gépi tanuló algoritmust,

00:14:28.420 --> 00:14:30.445
és reméljük, hogy erősen följavul.

00:14:30.445 --> 00:14:33.518
Látják, kezd elhalványulni egy néhány kép,

00:14:33.518 --> 00:14:38.226
tehát már felismeri, ezek hogyan értendők.

00:14:38.226 --> 00:14:41.128
Majd alkalmazhatjuk ezt az elvet
hasonló képekre,

00:14:41.128 --> 00:14:43.222
és a hasonló képeknél, látják,

00:14:43.222 --> 00:14:47.241
már képes a kocsiknak az elejét
hibátlanul megtalálni.

00:14:47.241 --> 00:14:50.189
Itt az ember mondhatja a gépnek:

00:14:50.189 --> 00:14:53.202
OK, jó munkát végeztél.

NOTE Paragraph

00:14:53.652 --> 00:14:55.837
Persze, néha még itt is

00:14:55.837 --> 00:14:59.511
bonyolult szétválasztani a csoportokat,

00:14:59.511 --> 00:15:03.395
esetünkben, bár hagytuk a 
gépet egy ideig pörögni,

00:15:03.399 --> 00:15:06.744
mégis találunk összekeveredve

00:15:06.744 --> 00:15:08.222
jobb és bal oldalas képeket.

00:15:08.222 --> 00:15:10.362
Adhatunk további útbaigazításokat 
a gépnek,

00:15:10.362 --> 00:15:13.338
mondhatjuk, hogy próbálkozz, és találj 
olyan szempontot, ami

00:15:13.338 --> 00:15:15.945
minél jobban szétválogatja 
a jobb és bal oldalakat

00:15:15.945 --> 00:15:18.067
mély tanuló algoritmussal.

00:15:18.067 --> 00:15:21.009
S lám, a tanácsunk --
OK, sikeres volt.

00:15:21.009 --> 00:15:23.891
Sikerült olyan szempontok szerint 
vizsgálni a tárgyakat,

00:15:23.891 --> 00:15:26.271
amelyek alkalmasak szétválogatásukra.

NOTE Paragraph

00:15:26.271 --> 00:15:28.709
S eszünkbe jut egy gondolat.

00:15:28.709 --> 00:15:36.906
Esetünkben a gép 
nem helyettesíti az embert,

00:15:36.906 --> 00:15:39.546
hanem együtt munkálkodnak.

00:15:39.546 --> 00:15:43.096
Ami egy 5-6 fős csoportnak

00:15:43.096 --> 00:15:45.098
kb. hét évébe tellett volna korábban,

00:15:45.098 --> 00:15:47.703
azt ezzel az eszközzel 
15 perc alatt

00:15:47.703 --> 00:15:50.208
egyetlen személy elvégezi egyedül.

NOTE Paragraph

00:15:50.208 --> 00:15:54.158
Ez a folyamat 4-5 közelítő lépésből áll.

00:15:54.158 --> 00:15:56.017
Látják, hogy a gép a másfél millió kép

00:15:56.017 --> 00:15:58.976
62%-át helyesen osztályozta.

00:15:58.976 --> 00:16:01.448
Most kezdhetjük gyorsan

00:16:01.448 --> 00:16:02.745
nagy vonalakban

00:16:02.745 --> 00:16:05.664
átnézni, nincs-e hiba valahol.

00:16:05.664 --> 00:16:09.616
Ahol hiba van, közölhetjük a géppel.

00:16:09.616 --> 00:16:12.661
Minden elkülönített csoportra alkalmazva
valami ilyen eljárást

00:16:12.661 --> 00:16:15.148
most a 80%-os helyességi aránynál tartunk

00:16:15.148 --> 00:16:17.563
a másfél millió kép osztályozásakor.

00:16:17.563 --> 00:16:19.641
Most még találunk egynéhány

00:16:19.641 --> 00:16:23.220
eltévedt képet,

00:16:23.220 --> 00:16:26.108
és megpróbáljuk megérteni, 
mi ennek az oka.

00:16:26.108 --> 00:16:27.851
Ugyanazzal a módszerrel 


00:16:27.851 --> 00:16:31.972
15 perc alatt 97%-os helyességi arányt 
érünk el.

NOTE Paragraph

00:16:31.972 --> 00:16:36.572
Az ilyen technika lehetővé tenné, hogy 
kezelni tudjunk egy jelentős problémát,

00:16:36.578 --> 00:16:39.614
azt, hogy hiány van orvosi szakértelemből
a világban.

00:16:39.614 --> 00:16:43.103
A Világgazdasági Fórumon elhangzott,

00:16:43.103 --> 00:16:45.727
hogy a fejlődő országokban 
10-20-szoros az orvoshiány,

00:16:45.727 --> 00:16:47.840
és mintegy 300 évbe telne,

00:16:47.840 --> 00:16:50.404
hogy a gond megoldására elég 
orvost képezzenek ki.

00:16:50.404 --> 00:16:53.619
Képzeljék csak el, milyen jó lenne, 
ha a mély tanulás módszerével

00:16:53.619 --> 00:16:56.458
növelhetnénk az orvosok hatékonyságát?

NOTE Paragraph

00:16:56.458 --> 00:16:58.690
Egészen fölvillanyoznak a lehetőségek.

00:16:58.690 --> 00:17:01.279
Engem is aggaszt ez a gond.

00:17:01.279 --> 00:17:04.053
Az a probléma, hogy 
a kékkel jelölt területek ott vannak,

00:17:04.053 --> 00:17:07.182
ahol a szolgáltatások aránya
80% fölötti a foglalkoztatottságban.

00:17:07.182 --> 00:17:09.159
Mik is kellenek a szolgáltatásokhoz?


00:17:09.159 --> 00:17:12.223
[Írás-olvasás, Beszéd-figyelem],
[Szemlélet, Tudás összegzése]

00:17:12.223 --> 00:17:15.627
Pont e dolgokkal épp most tanult meg 
a gép bánni.

00:17:15.627 --> 00:17:19.431
Tehát a fejlett világ dolgozóinak 
80%-a olyan munkát végez,

00:17:19.431 --> 00:17:21.963
amire épp most vált képessé a számítógép.

00:17:21.963 --> 00:17:22.913
Mit jelent ez?

00:17:22.913 --> 00:17:25.986
Minden rendben lesz. 
A régiek helyett új állások keletkeznek.

00:17:25.986 --> 00:17:28.693
Például több állás lesz az 
adattudósok számára.

00:17:28.693 --> 00:17:29.510
Nem igazán.

00:17:29.510 --> 00:17:32.628
Nem tart soká a számukra
kifejleszteni ezeket a dolgokat.

00:17:32.628 --> 00:17:35.880
Például, e négy algoritmust 
ugyanaz a fickó hozta létre.

00:17:35.880 --> 00:17:38.318
Ha azt hiszik: ó, régen is megtörtént,

00:17:38.318 --> 00:17:42.126
láttunk már ilyet, hogy új dolgok jönnek,

00:17:42.126 --> 00:17:44.378
és a régieket új állások váltják föl,

00:17:44.378 --> 00:17:46.494
no de milyenek lesznek az új állások?

00:17:46.494 --> 00:17:48.365
Nagyon nehezen tudjuk megítélni,

00:17:48.365 --> 00:17:51.104
mert az emberi teljesítmény 
fokozatosan nő,

00:17:51.104 --> 00:17:53.666
de most itt van a mély tanulás rendszere,

00:17:53.666 --> 00:17:56.893
tudjuk róla, hogy a teljesítménye 
rohamosan nő.

00:17:56.893 --> 00:17:57.948
Itt tartunk.

00:17:57.948 --> 00:18:00.559
Mostanában a dolgok láttán
sokan azt mondják:

00:18:00.559 --> 00:18:03.235
"Ó, a számítógépek még mindig elég 
ostobák." Igaz?

00:18:03.235 --> 00:18:06.664
De öt éven belül a helyzet megváltozik.

00:18:06.664 --> 00:18:10.529
Már most el kell kezdenünk 
gondolkozni a gépek képességeiről.

NOTE Paragraph

00:18:10.529 --> 00:18:12.579
Ilyet már tapasztaltunk,

00:18:12.579 --> 00:18:13.966
az ipari forradalom idején,

00:18:13.966 --> 00:18:16.817
ahogy a gépek megjelenésével
lépést kellett váltani.

00:18:17.667 --> 00:18:20.805
De egy idő után a dolgok elsimultak,

00:18:20.805 --> 00:18:22.507
Megzavarta a társadalmat,

00:18:22.507 --> 00:18:25.946
de amikor energiatermelésre 
már mindenütt gépeket használtak,

00:18:25.946 --> 00:18:28.300
a dolgok lecsillapodtak.

00:18:28.300 --> 00:18:29.773
A "gépi tanulás forradalma"

00:18:29.773 --> 00:18:32.682
egészen más lesz, mint az
ipari forradalom,

00:18:32.682 --> 00:18:35.472
mert a "gépi tanulás forradalma" 
soha nem csillapodik le.

00:18:35.472 --> 00:18:38.614
Minél többet tudnak a számítógépek,

00:18:38.614 --> 00:18:42.862
annál jobb képességű 
számítógépeket tudnak megépíteni,

00:18:42.862 --> 00:18:44.770
ez olyan váltás lesz, amit a világ eddig

00:18:44.770 --> 00:18:47.578
még soha nem tapasztalt, ezért 
korábbi fogalmaik arról,

00:18:47.578 --> 00:18:50.554
hogy mi a lehetséges,
teljesen megváltoznak.

NOTE Paragraph

00:18:50.974 --> 00:18:52.754
Mindez már hatással van ránk.

00:18:52.754 --> 00:18:56.384
Az utóbbi 25 évben a tőke 
termelékenysége nőtt,

00:18:56.400 --> 00:19:00.588
a munka termelékenysége maradt, 
sőt, valamit csökkent is.

NOTE Paragraph

00:19:01.408 --> 00:19:04.149
Szeretném, ha már elkezdenénk
ezt az eszmecserét.

00:19:04.149 --> 00:19:07.176
Amikor a jelen helyzetről 
beszélgetek emberekkel,

00:19:07.176 --> 00:19:08.666
gyakran teljesen elutasítók.

00:19:08.666 --> 00:19:10.339
Jó, a számítógépek valójában 
nem tudnak gondolkodni,

00:19:10.339 --> 00:19:13.367
nem fejeznek ki érzelmeket, 
nem értik a költészetet,

00:19:13.367 --> 00:19:15.888
mi igazából nem értjük, 
hogyan működnek.

00:19:15.888 --> 00:19:17.374
Na és?

00:19:17.374 --> 00:19:19.178
A számítógépek már most 
meg tudnak tenni dolgokat,

00:19:19.178 --> 00:19:21.897
amelyek az emberek munkaidejének 
nagy részét kitöltik.

00:19:21.897 --> 00:19:23.628
Ideje elkezdeni a gondolkodást:

00:19:23.628 --> 00:19:28.015
hogyan igazítsuk át a társadalom 
és a gazdaság szerkezetét

00:19:28.015 --> 00:19:29.855
az új realitások fényében.

00:19:29.855 --> 00:19:31.388
Köszönöm

00:19:31.388 --> 00:19:32.190
(taps)