WEBVTT 00:00:00.650 --> 00:00:03.363 Valaha, ha azt akartuk, hogy a számítógép 00:00:03.363 --> 00:00:06.447 csináljon meg valamit, előtte be kellett rá programoznunk. 00:00:06.447 --> 00:00:09.858 Azoknak, akik sohasem programoztak: a programozás 00:00:09.858 --> 00:00:14.020 annyit tesz, hogy célunk érdekében aprólékosan, lépésenként 00:00:14.020 --> 00:00:16.727 részletesen közölni kell a géppel, 00:00:16.727 --> 00:00:19.089 mikor mit csináljon. 00:00:19.089 --> 00:00:22.585 De ha olyat akarunk tenni, amiről mi sem tudjuk, miként kell, 00:00:22.585 --> 00:00:25.238 az ám az igazi kunszt! NOTE Paragraph 00:00:25.238 --> 00:00:28.131 Ilyen feladattal találkozott Arthur Samuel. 00:00:28.131 --> 00:00:31.658 1956-ban szerette volna, 00:00:31.658 --> 00:00:34.548 ha a számítógép legyőzi dámajátékban. 00:00:34.548 --> 00:00:36.588 Hogy lehet megírni egy programot 00:00:36.588 --> 00:00:40.394 minden apró részletében, hogy a számítógép győzzön? 00:00:40.394 --> 00:00:42.116 Támadt egy ötlete: 00:00:42.116 --> 00:00:45.840 A gépet önmaga ellen játszatta több ezerszer, 00:00:45.840 --> 00:00:49.004 hogy a gép tanulja, hogyan kell játszani. 00:00:49.004 --> 00:00:51.544 A dolog sikerült, és 1962-re 00:00:51.544 --> 00:00:55.561 a számítógép legyőzte Connecticut állam bajnokát. NOTE Paragraph 00:00:55.561 --> 00:00:58.534 Úgyhogy Samuelt a gépi tanulás atyjának nevezhetjük. 00:00:58.534 --> 00:01:00.251 Le vagyok kötelezve neki, 00:01:00.251 --> 00:01:03.014 mert gépi tanulással foglalkozom. 00:01:03.014 --> 00:01:04.759 A Kaggle elnöke voltam, a közösségé, 00:01:04.759 --> 00:01:07.867 ahol 200.000-nél többen foglalkoznak gépi tanulással. 00:01:07.867 --> 00:01:09.925 A Kaggle versenyeket szervez nekik, 00:01:09.925 --> 00:01:13.633 hogy oldjanak meg eddig megoldatlan problémákat, 00:01:13.633 --> 00:01:17.470 s ezek több száz alkalommal bizonyultak sikeresnek. 00:01:17.470 --> 00:01:19.940 Ebből a pozícióból rá tudtam jönni sok mindenre: 00:01:19.940 --> 00:01:23.890 mire volt képes a gépi tanulás a múltban, mire a jelenben 00:01:23.890 --> 00:01:26.252 és mit fog tudni a jövőben. 00:01:26.252 --> 00:01:30.675 Valószínűleg az első üzleti siker a gépi tanulásban a Google volt. 00:01:30.675 --> 00:01:33.784 A Google bizonyította, hogy lehet gépi algoritmus alapján 00:01:33.784 --> 00:01:35.536 adatokhoz jutni, és 00:01:35.536 --> 00:01:38.437 ez az algoritmus gépi tanuláson alapul. 00:01:38.437 --> 00:01:41.573 Azóta sok, gépi tanuláson alapuló üzleti sikertörténetet ismerünk. 00:01:41.593 --> 00:01:44.850 Olyan cégek, mint az Amazon és a Netflix a gépi tanulás módszerével 00:01:44.850 --> 00:01:47.876 ajánlják termékeiket megvételre 00:01:47.876 --> 00:01:49.896 illetve filmjeiket megnézésre. 00:01:49.896 --> 00:01:51.703 Néha ez, mondhatni, elég ijesztő. 00:01:51.703 --> 00:01:53.657 Mások, mint a LinkedIn és a Facebook 00:01:53.657 --> 00:01:56.251 néha megmondják, kik lehetnének a barátaink, 00:01:56.251 --> 00:01:58.228 és fogalmunk sincs, hogy csinálják. 00:01:58.228 --> 00:02:01.195 A gépi tanulásban rejlő lehetőségeket használják. 00:02:01.195 --> 00:02:04.152 Ezek az algoritmusok sokkal inkább az adatokból tanulnak, 00:02:04.152 --> 00:02:07.399 semmint a kézzel írt programokból. NOTE Paragraph 00:02:07.399 --> 00:02:10.807 Így lett sikeres az IBM is: Watson nevű gépe legyőzte 00:02:10.807 --> 00:02:13.739 a "Jeopardy" kvízműsor két világbajnokát, 00:02:13.739 --> 00:02:16.294 mert válaszolt körmönfont és bonyolult kérdésekre; pl. 00:02:16.294 --> 00:02:19.899 [Ennek a városnak a múzeumából tűnt el az ókori Nimród oroszlánja 2003-ban] 00:02:19.909 --> 00:02:23.034 Így jelentek meg az első, vezető nélküli autók. 00:02:23.034 --> 00:02:25.856 Elég fontos, hogy meg tudjuk mondani, mi a különbség, 00:02:25.856 --> 00:02:28.308 mondjuk, egy fa és egy gyalogos között. 00:02:28.308 --> 00:02:31.075 Nem tudjuk, hogyan kell manuálisan megírni a programokat, 00:02:31.075 --> 00:02:34.072 de gépi tanulással erre most megvan a lehetőség. 00:02:34.072 --> 00:02:36.870 Tény, hogy ez a kocsi már több millió kilométert tett meg 00:02:36.870 --> 00:02:40.186 baleset nélkül átlagos utakon. NOTE Paragraph 00:02:40.196 --> 00:02:44.110 Tudjuk tehát, hogy a számítógépek tudnak tanulni, és képesek megtanulni, 00:02:44.110 --> 00:02:46.010 hogyan végezzenek el feladatokat, 00:02:46.010 --> 00:02:48.848 amelyeknél néha mi magunk tanácstalanok vagyunk, 00:02:48.848 --> 00:02:51.733 vagy talán ügyesebben végzik el nálunk. 00:02:51.733 --> 00:02:55.618 A gépi tanulás egyik legpompásabb példáját 00:02:55.618 --> 00:02:58.320 egy általam irányított Kaggle- projektnél tapasztaltam, 00:02:58.320 --> 00:03:01.061 ahol a Torontói Egyetem csoportja, 00:03:01.061 --> 00:03:03.463 amelyet Geoffrey Hinton vezetett, megnyert 00:03:03.463 --> 00:03:06.140 egy automatizált gyógyszer-kifejlesztési versenyt. 00:03:06.140 --> 00:03:09.477 Nemcsak az volt rendhagyó, hogy legyőzték a Merck 00:03:09.477 --> 00:03:13.000 és más nemzetközi tudóscsoportok algoritmusait, 00:03:13.000 --> 00:03:17.001 hanem hogy egyikük sem volt járatos a kémiában, a biológiában 00:03:17.001 --> 00:03:20.230 vagy az élettudományokban, s mindezt két hét alatt! 00:03:20.230 --> 00:03:21.611 Hogy sikerült nekik? 00:03:22.421 --> 00:03:25.342 Rendhagyó algoritmust alkalmaztak, az ú.n. mély tanulást. 00:03:25.342 --> 00:03:28.291 Annyira fontos eredmény volt ez, hogy a The New York Times 00:03:28.291 --> 00:03:31.412 címoldalon tudósított róla pár hét múlva. 00:03:31.412 --> 00:03:34.147 Balra látható Geoffrey Hinton. 00:03:34.147 --> 00:03:37.858 A mély tanulás olyan algoritmus, amelyet az emberi agy működése ihletett. 00:03:37.858 --> 00:03:40.300 Az algoritmusnak nincs elméleti korlátja 00:03:40.300 --> 00:03:43.881 abból a szempontból, hogy mi mindenre lehet képes. 00:03:43.881 --> 00:03:46.174 Minél több adatot és gépidőt adunk neki, 00:03:46.174 --> 00:03:48.276 annál jobbak lesznek az eredmények. NOTE Paragraph 00:03:48.276 --> 00:03:50.615 A The New York Times írt cikkében a mély tanulás 00:03:50.615 --> 00:03:52.857 egy másik rendkívüli eredményéről is, 00:03:52.857 --> 00:03:54.739 amelyről rögtön szólni fogok. 00:03:55.569 --> 00:04:00.510 Ez azt mutatja, hogy a számítógépek képesek hangot érzékelni és értelmezni. NOTE Paragraph 00:04:00.510 --> 00:04:03.221 (Video) Richard Rashid: Az utolsó lépés, s ezt szeretném, 00:04:03.221 --> 00:04:06.246 hogy hozzá tudjam tenni a folyamathoz: 00:04:06.246 --> 00:04:10.961 kínaiul beszélni önökhöz. 00:04:10.961 --> 00:04:13.596 Ennek kulcsa, hogy képesek voltunk 00:04:13.596 --> 00:04:18.598 nagy mennyiségű információt átvenni sok kínai beszédjéből, 00:04:18.598 --> 00:04:21.128 létrehozni egy "szövegből beszédet" rendszert, amely 00:04:21.128 --> 00:04:25.801 a kínai szöveget átalakítja kínai beszéddé. 00:04:25.801 --> 00:04:29.929 Azután az én hangmintámból felvettünk egy órányit, 00:04:29.929 --> 00:04:31.820 s ezzel moduláltuk a szokásos 00:04:31.820 --> 00:04:36.364 "szövegből beszédet" rendszert, amely aztán az én hangomon szólalt meg. 00:04:36.364 --> 00:04:38.904 Az eredmény nem tökéletes. 00:04:38.904 --> 00:04:41.552 Tény, hogy elég sok a hiba. 00:04:41.552 --> 00:04:44.036 (kínaiul) 00:04:44.036 --> 00:04:48.073 (taps) 00:04:49.446 --> 00:04:53.022 Elég sok feladat van még ezen a területen. 00:04:53.022 --> 00:04:56.667 (kínaiul) 00:04:56.667 --> 00:05:00.960 (taps) NOTE Paragraph 00:05:01.345 --> 00:05:04.744 Howard: Ez egy gépi tanulási konferencián történt, Kínában. 00:05:04.744 --> 00:05:07.114 Valóban ritka, hogy egy tudományos tanácskozáson 00:05:07.114 --> 00:05:09.011 spontán tapsot hall az ember, 00:05:09.011 --> 00:05:12.027 bár néha TEDx konferenciákon igen. 00:05:12.027 --> 00:05:15.482 Amit itt láttak, mind a mély tanulással kapcsolatos. 00:05:15.482 --> 00:05:17.007 (taps) Köszönöm. 00:05:17.007 --> 00:05:19.289 A fonetikus átírás angolra mély tanulás volt. 00:05:19.289 --> 00:05:22.701 A kínaira fordítás és a szöveg a jobb fölső sarokban szintén, 00:05:22.701 --> 00:05:26.008 és a hangképzés úgyszintén mély tanulás volt. NOTE Paragraph 00:05:26.008 --> 00:05:29.242 Úgy hogy a mély tanulás különleges dolog. 00:05:29.242 --> 00:05:32.341 Egyszerű algoritmus, de úgy látszik, majdnem mindenre alkalmas, 00:05:32.341 --> 00:05:35.452 erre tavaly jöttem rá. Látni is megtanult már. 00:05:35.452 --> 00:05:37.628 Egy kevéssé ismert német versenyen, 00:05:37.628 --> 00:05:40.225 amely a közlekedési jelzések felismerésére irányul, 00:05:40.225 --> 00:05:43.618 a mély tanulás megtanulta fölismerni a közlekedési jelzéseket. 00:05:43.618 --> 00:05:45.712 Nemcsak jobban ismeri föl őket, 00:05:45.712 --> 00:05:47.470 mint bármely más algoritmus, 00:05:47.470 --> 00:05:50.189 az eredményjelző kimutatta, hogy az embernél is jobban, 00:05:50.189 --> 00:05:52.041 kb. kétszer jobban mint az ember. 00:05:52.041 --> 00:05:54.037 2011-re megvolt az első példány az 00:05:54.037 --> 00:05:57.442 embernél is jobban látó számítógépből. 00:05:57.442 --> 00:05:59.491 Azóta sok minden történt. 00:05:59.491 --> 00:06:02.685 2012-ben a Google közölte, hogy van egy mély tanuló algoritmusuk, 00:06:02.685 --> 00:06:04.420 amely figyeli a YouTube videókat, és 00:06:04.420 --> 00:06:07.857 egy hónap alatt átrágta magát 16.000 gép adatain, 00:06:07.857 --> 00:06:11.878 és a gép önállóan megtanult olyan fogalmakat mint "ember", vagy 00:06:11.878 --> 00:06:14.027 "macska", csupán csak a videókat figyelve. 00:06:14.027 --> 00:06:16.109 Az emberek nagyon hasonlóan tanulnak. 00:06:16.109 --> 00:06:19.119 Az emberek nem úgy tanulnak, hogy megmondják nekik, mit látnak, 00:06:19.119 --> 00:06:22.450 hanem maguknak tanítják meg, mik ezek a dolgok. 00:06:22.450 --> 00:06:25.819 2012-ben az említett Geoffrey Hinton 00:06:25.819 --> 00:06:28.677 megnyert egy nagyon népszerű ImageNet versenyt, ahol 00:06:28.677 --> 00:06:32.818 másfél millió képről kellett 00:06:32.818 --> 00:06:34.256 eldönteni, melyik mit ábrázol. 00:06:34.256 --> 00:06:37.789 2014-re elértük a képfelismerésben 00:06:37.789 --> 00:06:39.242 a 6%-os hibaszintet. 00:06:39.242 --> 00:06:41.268 Ez megint az emberekénél jobb eredmény. NOTE Paragraph 00:06:41.268 --> 00:06:45.037 Tehát a gépek ebben rendkívül jó munkát végeznek, és 00:06:45.037 --> 00:06:47.306 az eredményeket ma az iparban is hasznosítják. 00:06:47.306 --> 00:06:50.348 Például a Google tavaly bejelentette, 00:06:50.348 --> 00:06:54.933 hogy két óra alatt feltérképezte egész Franciaországot, 00:06:54.933 --> 00:06:58.380 mindezt úgy, hogy betáplálták az utcai látképeket egy 00:06:58.380 --> 00:07:02.699 mélyen tanuló algoritmusba, az fölismerte és beolvasta 00:07:02.699 --> 00:07:04.919 a házszámokat. Korábban meddig tartott volna! 00:07:04.919 --> 00:07:08.274 Tucatnyi ember, több év. 00:07:08.274 --> 00:07:10.185 Ez történik most Kínában is. 00:07:10.185 --> 00:07:14.221 A Baidu olyasmi, mint egy kínai Google, 00:07:14.221 --> 00:07:16.504 és a bal fölső sarokban látható egy kép, amelyet 00:07:16.504 --> 00:07:20.478 feltöltöttem a Baidu mély tanuló rendszerébe, 00:07:20.478 --> 00:07:24.247 alatta pedig látják, hogy a rendszer megértette, mi ez a kép, 00:07:24.247 --> 00:07:26.483 és talált hasonló képeket. 00:07:26.483 --> 00:07:29.219 A hasonló képnek egyébként hasonló a háttere, 00:07:29.219 --> 00:07:30.877 az állatok pofája egyfelé fordul, 00:07:30.877 --> 00:07:32.665 némelyik még a nyelvét is kiölti. 00:07:32.665 --> 00:07:35.045 Ez nem ugyanaz, mint egy szöveg a weboldalon. 00:07:35.045 --> 00:07:37.107 Mindössze egy képet töltöttem föl. 00:07:37.107 --> 00:07:41.128 Tehát a mai számítógépeink tényleg értik, amit látnak, 00:07:41.128 --> 00:07:42.752 és százmilliónyi képet tartalmazó 00:07:42.752 --> 00:07:46.306 adatbázist nézhetnek át valós időben. NOTE Paragraph 00:07:46.306 --> 00:07:49.536 De mit jelent az, hogy a számítógépek látnak? 00:07:49.536 --> 00:07:51.553 Nos, nemcsak, hogy látnak. 00:07:51.553 --> 00:07:53.792 Valójában a mély tanulás ennél többet ért el. 00:07:53.792 --> 00:07:56.570 Az összetett, finoman árnyalt mondatok mint ez, 00:07:56.570 --> 00:07:59.154 mély tanuló algoritmusokkal ma már érthetők. 00:07:59.154 --> 00:08:00.697 A felül látható piros pöttyel 00:08:00.697 --> 00:08:03.465 ez a stanfordi rendszer jelzi, 00:08:03.465 --> 00:08:07.384 hogy ez a mondat negatív érzelmet fejez ki. 00:08:07.384 --> 00:08:11.120 A mély tanulás ma már tényleg megközelíti az emberi teljesítményt abban, 00:08:11.120 --> 00:08:15.923 miről szól a mondat, és mit állít ezekről a dolgokról. 00:08:15.923 --> 00:08:18.651 A mély tanulás révén olvasunk kínaiul, 00:08:18.651 --> 00:08:21.807 kb. egy született kínai szintjén. 00:08:21.807 --> 00:08:24.365 Ez az algoritmus svájci, s akik kifejlesztették, 00:08:24.365 --> 00:08:27.331 nem beszélnek, és nem értenek kínaiul. 00:08:27.331 --> 00:08:29.382 A mély tanulás alkalmazása 00:08:29.382 --> 00:08:31.601 erre talán a világ legjobb rendszere, 00:08:31.601 --> 00:08:36.718 akár összevetve a természetes emberi megértéssel. NOTE Paragraph 00:08:36.718 --> 00:08:39.682 Ezt a rendszert raktuk össze a cégemnél, mely 00:08:39.682 --> 00:08:41.728 megmutatja, hogyan kell ezeket összerakni. 00:08:41.728 --> 00:08:44.189 Ezekhez a képekhez nem társul szöveg, 00:08:44.189 --> 00:08:46.541 és ahogy mondatokat írok be ide, 00:08:46.541 --> 00:08:49.510 ez valós időben megérti ezeket a képeket, és 00:08:49.510 --> 00:08:51.189 kitalálja, miről szólnak, és 00:08:51.189 --> 00:08:54.352 talál a beírt szöveghez hasonló képeket. 00:08:54.352 --> 00:08:57.108 Ez azt jelenti, hogy valójában érti a mondataimat, 00:08:57.108 --> 00:08:59.332 és valójában érti a képeket. 00:08:59.332 --> 00:09:01.891 Tudom, hogy hasonlót már láttak a Google-on, 00:09:01.891 --> 00:09:04.666 ahol beírják a szavakat, és megjelennek a képek, 00:09:04.666 --> 00:09:08.090 de az úgy működik, hogy a gép a weboldalon szöveget keres. 00:09:08.090 --> 00:09:11.091 Az teljesen más, mint képeket fölismerni. 00:09:11.091 --> 00:09:13.843 Ilyesmit számítógépek csak az utóbbi hónapokban 00:09:13.843 --> 00:09:17.091 voltak képesek első ízben megcsinálni. NOTE Paragraph 00:09:17.091 --> 00:09:21.182 A számítógépek nemcsak látnak, hanem olvasnak is, 00:09:21.182 --> 00:09:24.947 megmutattuk: értik is, amit hallanak. 00:09:24.947 --> 00:09:28.389 Talán nem meglepő, ha elmondom, hogy írni is tudnak. 00:09:28.389 --> 00:09:33.172 Itt egy szöveg, amelyet tegnap egy mély tanuló algoritmussal írattam. 00:09:33.172 --> 00:09:36.686 Itt egy szöveg, melyet a stanfordi algoritmus írt. 00:09:36.686 --> 00:09:38.860 Minden mondatot mély tanuló algoritmus 00:09:38.860 --> 00:09:43.109 állított elő a képek leírása céljából. 00:09:43.109 --> 00:09:47.581 Az algoritmus korábban soha nem látott fekete inges, gitározó embert. 00:09:47.581 --> 00:09:49.801 Látott korábban embert, látott fekete színt, 00:09:49.801 --> 00:09:51.400 látott korábban gitárt, 00:09:51.400 --> 00:09:55.694 de önállóan állította elő a kép új leírását. 00:09:55.694 --> 00:09:59.196 Ez még nem üti meg az emberi teljesítmény szintjét, de közelíti. 00:09:59.196 --> 00:10:02.904 A tesztekben az esetek negyedében jobban tetszik az embernek 00:10:02.904 --> 00:10:04.791 a számítógép-generálta képaláírás. 00:10:04.791 --> 00:10:06.855 Nos, ez a rendszer csupán kéthetes, 00:10:06.855 --> 00:10:08.701 tehát valószínűleg egy éven belül 00:10:08.701 --> 00:10:11.502 a számítógépes algoritmus 00:10:11.502 --> 00:10:13.364 felülmúlja az emberi teljesítményt. 00:10:13.364 --> 00:10:16.413 Tehát a számítógép írni is tud. NOTE Paragraph 00:10:16.413 --> 00:10:19.888 Ha mindent összerakunk, ez izgalmas lehetőségekhez vezet. 00:10:19.888 --> 00:10:21.380 Például a gyógyításban, 00:10:21.380 --> 00:10:23.905 egy bostoni csoport bejelentette, hogy felfedeztek 00:10:23.905 --> 00:10:26.854 több tucat klinikailag fontos daganat-jellemzőt, 00:10:26.854 --> 00:10:31.120 amelyek segítenek az orvosoknak a rák előrejelzésében. 00:10:32.220 --> 00:10:34.516 Hasonlóképpen, Stanfordban 00:10:34.516 --> 00:10:38.179 bejelentették, hogy kifejlesztettek egy gépi tanuló rendszert, 00:10:38.179 --> 00:10:40.560 amely a szöveteket nagyításban vizsgálva 00:10:40.560 --> 00:10:43.142 a rákosok túlélési esélyeinek előrejelzésében 00:10:43.142 --> 00:10:47.519 tényleg jobban teljesít, mint a patológusok. 00:10:47.519 --> 00:10:50.764 Mindkét esetben az előrejelzések nemcsak pontosabbak voltak, 00:10:50.764 --> 00:10:53.266 hanem új tudományos eredményt hoztak. 00:10:53.276 --> 00:10:54.781 A radiológia esetében 00:10:54.781 --> 00:10:57.876 ezek új klinikai mutatók, amelyeket az ember képes értelmezni. 00:10:57.876 --> 00:10:59.668 A patológiai esetben 00:10:59.668 --> 00:11:04.168 a számítógépes rendszer végeredményben felfedezte, hogy 00:11:04.168 --> 00:11:06.948 a rák körüli sejtek a diagnózis fölállításában 00:11:06.948 --> 00:11:09.260 ugyanolyan fontosak, mint maguk a rákos sejtek. 00:11:09.260 --> 00:11:14.621 A patológusoknak évtizedeken át pont az ellenkezőjét tanították. 00:11:14.621 --> 00:11:17.913 Mindkét esetben ezek olyan rendszerek, melyeket 00:11:17.913 --> 00:11:21.534 az orvos és a gépi tanulás szakértők együtt 00:11:21.534 --> 00:11:24.275 fejlesztettek ki. Tavaly óta ezt is túlhaladtuk. 00:11:24.275 --> 00:11:27.824 Itt egy példa arra, ahogyan mikroszkóp alatt azonosítják 00:11:27.824 --> 00:11:30.354 az emberi szövet rákos területét. 00:11:30.354 --> 00:11:34.967 A bemutatott rendszer pontosabban vagy kb. ugyanolyan pontossággal tudja azonosítani 00:11:34.967 --> 00:11:37.742 azokat a területeket, mint egy patológus. 00:11:37.742 --> 00:11:41.134 Mély tanulással alakították ki a rendszert, orvosi szakértelem nélkül, 00:11:41.134 --> 00:11:43.660 olyanok, akiknek nincs semmi hátterük a témában. 00:11:44.460 --> 00:11:47.285 Azután itt van az idegsejtek szelvényezése. Már majdnem 00:11:47.285 --> 00:11:50.953 olyan precízen tudjuk szelvényezni az idegsejteket, mint az emberek, 00:11:50.953 --> 00:11:53.670 és a rendszert mély tanulással azok alakították ki, 00:11:53.670 --> 00:11:56.921 akiknek nem volt előzetes orvosi tapasztalatuk. NOTE Paragraph 00:11:56.921 --> 00:12:00.148 Úgy éreztem, hogy orvosi háttér nélkül is 00:12:00.148 --> 00:12:03.875 eléggé képzett vagyok, hogy orvosi céget alapítsak. 00:12:03.875 --> 00:12:05.411 Meg is tettem. 00:12:05.411 --> 00:12:07.761 Kissé féltem tőle, de az elmélet azt sugallta, 00:12:07.761 --> 00:12:10.650 hogy hasznára válhatnánk a gyógyításnak 00:12:10.650 --> 00:12:16.142 csupán ilyen adatelemző módszerek alkalmazásával. 00:12:16.142 --> 00:12:18.622 Hálás vagyok a fantasztikus fogadtatásért, 00:12:18.622 --> 00:12:21.418 nemcsak a média, hanem az orvosi közösség részéről is, 00:12:21.418 --> 00:12:23.322 akik nagyon támogattak. 00:12:23.322 --> 00:12:27.471 Az elmélet szerint a gyógyítás folyamatában a középső részt lecseréljük 00:12:27.471 --> 00:12:30.364 adatelemzésre lehetőség szerint, és azt hagyjuk az orvosokra, 00:12:30.364 --> 00:12:33.429 amihez legjobban értenek. 00:12:33.429 --> 00:12:36.591 Mondok rá példát. Ma 15 perc 00:12:36.591 --> 00:12:39.975 egy új diagnosztikai teszt kidolgozása. 00:12:39.975 --> 00:12:41.929 Megmutatom ezt önöknek valós időben, de én három percbe 00:12:41.929 --> 00:12:45.416 sűrítettem be, mert elhagytam egyes elemeit. 00:12:45.416 --> 00:12:48.477 Ahelyett, hogy megmutatnám, hogy készül egy diagnosztikai teszt, 00:12:48.477 --> 00:12:51.846 lássuk inkább autót ábrázoló képek diagnosztikai tesztjét, 00:12:51.846 --> 00:12:54.068 mert azt mindenki érteni fogja. NOTE Paragraph 00:12:54.068 --> 00:12:57.269 Kb. másfél millió, autót ábrázoló képpel kezdünk, 00:12:57.269 --> 00:13:00.475 és szeretnék létrehozni valamit, ami aszerint rendezi őket, 00:13:00.475 --> 00:13:02.698 hogy milyen szögből készült a felvétel. 00:13:02.698 --> 00:13:06.586 A képek címkézetlenek, ezért az alapoktól kell kezdenem. 00:13:06.586 --> 00:13:08.451 Mély tanuló algoritmusunkkal 00:13:08.451 --> 00:13:12.158 azonosítani lehet az egyes részekhez tartozó területeket. 00:13:12.158 --> 00:13:15.778 Az ember és a gép pompásan együtt tud működni. 00:13:15.778 --> 00:13:17.956 Az ember, ahogy itt látható, 00:13:17.956 --> 00:13:20.631 megmondja a gépnek, mely területek érdeklik, 00:13:20.631 --> 00:13:25.281 melyeken szeretné, hogy próbáljon javítani a gép az algoritmusa szerint. 00:13:25.281 --> 00:13:29.577 Ezek a mély tanuló rendszerek egy 16.000-dimenziós térben vannak, 00:13:29.577 --> 00:13:33.009 látják, ahogy a gép ezt pörgeti azon a téren keresztül, 00:13:33.009 --> 00:13:34.761 és próbál új területeket találni. 00:13:34.761 --> 00:13:37.162 Amint eredményt ér el, az őt irányító ember 00:13:37.162 --> 00:13:40.786 megjelölheti az érdekes területeket. 00:13:40.786 --> 00:13:43.208 A gépnek sikerült területeket találnia, 00:13:43.208 --> 00:13:45.770 például sarkokat. 00:13:45.770 --> 00:13:47.376 Ahogy végigvisszük a folyamatot, 00:13:47.376 --> 00:13:49.716 fokozatosan egyre többet közlünk a géppel arról, 00:13:49.716 --> 00:13:51.784 miféle struktúrát keresünk. 00:13:51.784 --> 00:13:53.916 Képzeljenek el egy diagnosztikai tesztben 00:13:53.916 --> 00:13:57.266 egy patológust, amint meghatározza a patologikus részeket, 00:13:57.266 --> 00:14:02.292 vagy egy radiológust, amint kimutatja a gócokat. 00:14:02.292 --> 00:14:04.851 Néha nehéz az algoritmus számára. 00:14:04.851 --> 00:14:06.815 Most egy kissé összezavarodott. 00:14:06.815 --> 00:14:09.365 Összekeveri a kocsik elejét a hátuljával. 00:14:09.365 --> 00:14:11.437 Egy kicsit jobban kell vigyáznunk, és 00:14:11.437 --> 00:14:14.669 nekünk kell előbb különválogatnunk a kocsik elejét és a hátulját, 00:14:14.669 --> 00:14:18.505 azután megmondjuk a gépnek, 00:14:18.505 --> 00:14:21.523 hogy ez a csoport érdekes nekünk. NOTE Paragraph 00:14:21.523 --> 00:14:24.200 Ez eltart egy ideig, ugrunk egyet, 00:14:24.200 --> 00:14:26.446 és okítjuk a párszáz dologra támaszkodó 00:14:26.446 --> 00:14:28.420 gépi tanuló algoritmust, 00:14:28.420 --> 00:14:30.445 és reméljük, hogy erősen följavul. 00:14:30.445 --> 00:14:33.518 Látják, kezd elhalványulni egy néhány kép, 00:14:33.518 --> 00:14:38.226 tehát már felismeri, ezek hogyan értendők. 00:14:38.226 --> 00:14:41.128 Majd alkalmazhatjuk ezt az elvet hasonló képekre, 00:14:41.128 --> 00:14:43.222 és a hasonló képeknél, látják, 00:14:43.222 --> 00:14:47.241 már képes a kocsiknak az elejét hibátlanul megtalálni. 00:14:47.241 --> 00:14:50.189 Itt az ember mondhatja a gépnek: 00:14:50.189 --> 00:14:53.202 OK, jó munkát végeztél. NOTE Paragraph 00:14:53.652 --> 00:14:55.837 Persze, néha még itt is 00:14:55.837 --> 00:14:59.511 bonyolult szétválasztani a csoportokat, 00:14:59.511 --> 00:15:03.395 esetünkben, bár hagytuk a gépet egy ideig pörögni, 00:15:03.399 --> 00:15:06.744 mégis találunk összekeveredve 00:15:06.744 --> 00:15:08.222 jobb és bal oldalas képeket. 00:15:08.222 --> 00:15:10.362 Adhatunk további útbaigazításokat a gépnek, 00:15:10.362 --> 00:15:13.338 mondhatjuk, hogy próbálkozz, és találj olyan szempontot, ami 00:15:13.338 --> 00:15:15.945 minél jobban szétválogatja a jobb és bal oldalakat 00:15:15.945 --> 00:15:18.067 mély tanuló algoritmussal. 00:15:18.067 --> 00:15:21.009 S lám, a tanácsunk -- OK, sikeres volt. 00:15:21.009 --> 00:15:23.891 Sikerült olyan szempontok szerint vizsgálni a tárgyakat, 00:15:23.891 --> 00:15:26.271 amelyek alkalmasak szétválogatásukra. NOTE Paragraph 00:15:26.271 --> 00:15:28.709 S eszünkbe jut egy gondolat. 00:15:28.709 --> 00:15:36.906 Esetünkben a gép nem helyettesíti az embert, 00:15:36.906 --> 00:15:39.546 hanem együtt munkálkodnak. 00:15:39.546 --> 00:15:43.096 Ami egy 5-6 fős csoportnak 00:15:43.096 --> 00:15:45.098 kb. hét évébe tellett volna korábban, 00:15:45.098 --> 00:15:47.703 azt ezzel az eszközzel 15 perc alatt 00:15:47.703 --> 00:15:50.208 egyetlen személy elvégezi egyedül. NOTE Paragraph 00:15:50.208 --> 00:15:54.158 Ez a folyamat 4-5 közelítő lépésből áll. 00:15:54.158 --> 00:15:56.017 Látják, hogy a gép a másfél millió kép 00:15:56.017 --> 00:15:58.976 62%-át helyesen osztályozta. 00:15:58.976 --> 00:16:01.448 Most kezdhetjük gyorsan 00:16:01.448 --> 00:16:02.745 nagy vonalakban 00:16:02.745 --> 00:16:05.664 átnézni, nincs-e hiba valahol. 00:16:05.664 --> 00:16:09.616 Ahol hiba van, közölhetjük a géppel. 00:16:09.616 --> 00:16:12.661 Minden elkülönített csoportra alkalmazva valami ilyen eljárást 00:16:12.661 --> 00:16:15.148 most a 80%-os helyességi aránynál tartunk 00:16:15.148 --> 00:16:17.563 a másfél millió kép osztályozásakor. 00:16:17.563 --> 00:16:19.641 Most még találunk egynéhány 00:16:19.641 --> 00:16:23.220 eltévedt képet, 00:16:23.220 --> 00:16:26.108 és megpróbáljuk megérteni, mi ennek az oka. 00:16:26.108 --> 00:16:27.851 Ugyanazzal a módszerrel 00:16:27.851 --> 00:16:31.972 15 perc alatt 97%-os helyességi arányt érünk el. NOTE Paragraph 00:16:31.972 --> 00:16:36.572 Az ilyen technika lehetővé tenné, hogy kezelni tudjunk egy jelentős problémát, 00:16:36.578 --> 00:16:39.614 azt, hogy hiány van orvosi szakértelemből a világban. 00:16:39.614 --> 00:16:43.103 A Világgazdasági Fórumon elhangzott, 00:16:43.103 --> 00:16:45.727 hogy a fejlődő országokban 10-20-szoros az orvoshiány, 00:16:45.727 --> 00:16:47.840 és mintegy 300 évbe telne, 00:16:47.840 --> 00:16:50.404 hogy a gond megoldására elég orvost képezzenek ki. 00:16:50.404 --> 00:16:53.619 Képzeljék csak el, milyen jó lenne, ha a mély tanulás módszerével 00:16:53.619 --> 00:16:56.458 növelhetnénk az orvosok hatékonyságát? NOTE Paragraph 00:16:56.458 --> 00:16:58.690 Egészen fölvillanyoznak a lehetőségek. 00:16:58.690 --> 00:17:01.279 Engem is aggaszt ez a gond. 00:17:01.279 --> 00:17:04.053 Az a probléma, hogy a kékkel jelölt területek ott vannak, 00:17:04.053 --> 00:17:07.182 ahol a szolgáltatások aránya 80% fölötti a foglalkoztatottságban. 00:17:07.182 --> 00:17:09.159 Mik is kellenek a szolgáltatásokhoz? 00:17:09.159 --> 00:17:12.223 [Írás-olvasás, Beszéd-figyelem], [Szemlélet, Tudás összegzése] 00:17:12.223 --> 00:17:15.627 Pont e dolgokkal épp most tanult meg a gép bánni. 00:17:15.627 --> 00:17:19.431 Tehát a fejlett világ dolgozóinak 80%-a olyan munkát végez, 00:17:19.431 --> 00:17:21.963 amire épp most vált képessé a számítógép. 00:17:21.963 --> 00:17:22.913 Mit jelent ez? 00:17:22.913 --> 00:17:25.986 Minden rendben lesz. A régiek helyett új állások keletkeznek. 00:17:25.986 --> 00:17:28.693 Például több állás lesz az adattudósok számára. 00:17:28.693 --> 00:17:29.510 Nem igazán. 00:17:29.510 --> 00:17:32.628 Nem tart soká a számukra kifejleszteni ezeket a dolgokat. 00:17:32.628 --> 00:17:35.880 Például, e négy algoritmust ugyanaz a fickó hozta létre. 00:17:35.880 --> 00:17:38.318 Ha azt hiszik: ó, régen is megtörtént, 00:17:38.318 --> 00:17:42.126 láttunk már ilyet, hogy új dolgok jönnek, 00:17:42.126 --> 00:17:44.378 és a régieket új állások váltják föl, 00:17:44.378 --> 00:17:46.494 no de milyenek lesznek az új állások? 00:17:46.494 --> 00:17:48.365 Nagyon nehezen tudjuk megítélni, 00:17:48.365 --> 00:17:51.104 mert az emberi teljesítmény fokozatosan nő, 00:17:51.104 --> 00:17:53.666 de most itt van a mély tanulás rendszere, 00:17:53.666 --> 00:17:56.893 tudjuk róla, hogy a teljesítménye rohamosan nő. 00:17:56.893 --> 00:17:57.948 Itt tartunk. 00:17:57.948 --> 00:18:00.559 Mostanában a dolgok láttán sokan azt mondják: 00:18:00.559 --> 00:18:03.235 "Ó, a számítógépek még mindig elég ostobák." Igaz? 00:18:03.235 --> 00:18:06.664 De öt éven belül a helyzet megváltozik. 00:18:06.664 --> 00:18:10.529 Már most el kell kezdenünk gondolkozni a gépek képességeiről. NOTE Paragraph 00:18:10.529 --> 00:18:12.579 Ilyet már tapasztaltunk, 00:18:12.579 --> 00:18:13.966 az ipari forradalom idején, 00:18:13.966 --> 00:18:16.817 ahogy a gépek megjelenésével lépést kellett váltani. 00:18:17.667 --> 00:18:20.805 De egy idő után a dolgok elsimultak, 00:18:20.805 --> 00:18:22.507 Megzavarta a társadalmat, 00:18:22.507 --> 00:18:25.946 de amikor energiatermelésre már mindenütt gépeket használtak, 00:18:25.946 --> 00:18:28.300 a dolgok lecsillapodtak. 00:18:28.300 --> 00:18:29.773 A "gépi tanulás forradalma" 00:18:29.773 --> 00:18:32.682 egészen más lesz, mint az ipari forradalom, 00:18:32.682 --> 00:18:35.472 mert a "gépi tanulás forradalma" soha nem csillapodik le. 00:18:35.472 --> 00:18:38.614 Minél többet tudnak a számítógépek, 00:18:38.614 --> 00:18:42.862 annál jobb képességű számítógépeket tudnak megépíteni, 00:18:42.862 --> 00:18:44.770 ez olyan váltás lesz, amit a világ eddig 00:18:44.770 --> 00:18:47.578 még soha nem tapasztalt, ezért korábbi fogalmaik arról, 00:18:47.578 --> 00:18:50.554 hogy mi a lehetséges, teljesen megváltoznak. NOTE Paragraph 00:18:50.974 --> 00:18:52.754 Mindez már hatással van ránk. 00:18:52.754 --> 00:18:56.384 Az utóbbi 25 évben a tőke termelékenysége nőtt, 00:18:56.400 --> 00:19:00.588 a munka termelékenysége maradt, sőt, valamit csökkent is. NOTE Paragraph 00:19:01.408 --> 00:19:04.149 Szeretném, ha már elkezdenénk ezt az eszmecserét. 00:19:04.149 --> 00:19:07.176 Amikor a jelen helyzetről beszélgetek emberekkel, 00:19:07.176 --> 00:19:08.666 gyakran teljesen elutasítók. 00:19:08.666 --> 00:19:10.339 Jó, a számítógépek valójában nem tudnak gondolkodni, 00:19:10.339 --> 00:19:13.367 nem fejeznek ki érzelmeket, nem értik a költészetet, 00:19:13.367 --> 00:19:15.888 mi igazából nem értjük, hogyan működnek. 00:19:15.888 --> 00:19:17.374 Na és? 00:19:17.374 --> 00:19:19.178 A számítógépek már most meg tudnak tenni dolgokat, 00:19:19.178 --> 00:19:21.897 amelyek az emberek munkaidejének nagy részét kitöltik. 00:19:21.897 --> 00:19:23.628 Ideje elkezdeni a gondolkodást: 00:19:23.628 --> 00:19:28.015 hogyan igazítsuk át a társadalom és a gazdaság szerkezetét 00:19:28.015 --> 00:19:29.855 az új realitások fényében. 00:19:29.855 --> 00:19:31.388 Köszönöm 00:19:31.388 --> 00:19:32.190 (taps)