1 00:00:01,280 --> 00:00:05,136 Napjaink számítógépes algoritmusai hihetetlen feladatokat végeznek el 2 00:00:05,160 --> 00:00:09,896 kiemelkedő pontossággal, óriási léptékben, szinte emberi intelligenciával. 3 00:00:09,920 --> 00:00:13,350 Ezt a számítógépes intelligenciát gyakran MI-nek, 4 00:00:13,380 --> 00:00:15,736 vagyis mesterséges intelligenciának nevezik. 5 00:00:15,760 --> 00:00:19,960 Várhatóan hihetetlen hatása lesz jövőbeli életünkre. 6 00:00:20,880 --> 00:00:24,816 Jelenleg azonban még kemény kihívásokkal nézünk szembe 7 00:00:24,840 --> 00:00:28,336 számos halálos betegség, például fertőző kórok és rák 8 00:00:28,360 --> 00:00:30,720 felismerésében és diagnosztizálásában. 9 00:00:32,000 --> 00:00:34,296 Évente betegek ezrei halnak meg 10 00:00:34,320 --> 00:00:37,120 májrákban és szájrákban. 11 00:00:37,880 --> 00:00:40,576 Akkor tudunk legjobban segíteni azoknak, 12 00:00:40,600 --> 00:00:44,920 akik ezektől szenvednek, ha időben felismerjük és diagnosztizáljuk a kórt. 13 00:00:45,880 --> 00:00:50,040 De hogyan ismerjük fel ezeket napjainkban, és hogyan segíthet ebben az MI? 14 00:00:51,920 --> 00:00:55,576 Azoknál a betegeknél, akiknél sajnos felmerül a kór gyanúja, 15 00:00:55,600 --> 00:00:58,256 egy szakorvos mindenekelőtt 16 00:00:58,280 --> 00:01:00,896 nagyon drága orvosi képalkotó eljárást rendel el, 17 00:01:00,920 --> 00:01:05,016 például fluoreszcens képalkotó eljárást, CT-, MRI-vizsgálatokat. 18 00:01:05,040 --> 00:01:07,336 A képek ismeretében 19 00:01:07,360 --> 00:01:11,880 egy másik szakorvos felállítja a diagnózist, és beszél a beteggel. 20 00:01:12,520 --> 00:01:15,976 Mint látják, ez hatalmas erőforrásigényű folyamat, 21 00:01:16,000 --> 00:01:20,416 mely kétféle szakorvost és drága orvosi képalkotó eljárásokat igényel, 22 00:01:20,440 --> 00:01:23,536 ami a fejlődő világban nagyon nehezen biztosítható. 23 00:01:23,560 --> 00:01:26,920 Valójában ez a helyzet számos iparilag fejlett országban is. 24 00:01:27,760 --> 00:01:30,640 Megoldható-e ez a probléma mesterséges intelligenciával? 25 00:01:31,840 --> 00:01:35,380 A mai hagyományos MI-rendszerekkel 26 00:01:35,380 --> 00:01:37,406 a probléma megoldásához mindenekelőtt 27 00:01:37,406 --> 00:01:38,616 tízezres – ismétlem: 28 00:01:38,640 --> 00:01:42,656 tízezres nagyságrendű ilyen drága 29 00:01:42,680 --> 00:01:44,126 orvosi képre lenne szükségem. 30 00:01:44,176 --> 00:01:46,976 Ezután szakorvoshoz fordulnék, 31 00:01:47,000 --> 00:01:49,496 aki kielemezné nekem ezeket a képeket. 32 00:01:49,520 --> 00:01:51,616 Majd ezzel a két információval 33 00:01:51,640 --> 00:01:55,296 betaníthatok egy szokványos mély neurális hálót vagy mélytanulási hálót 34 00:01:55,320 --> 00:01:57,456 a beteg diagnózisának felállításához. 35 00:01:57,480 --> 00:01:59,110 Az első megközelítéshez hasonlóan, 36 00:01:59,130 --> 00:02:01,863 a hagyományos MI-megközelítések is 37 00:02:01,863 --> 00:02:03,596 ugyanazzal a problémával küszködnek. 38 00:02:03,596 --> 00:02:07,440 Hatalmas adatmennyiség, szakorvosok és orvosi képalkotó technológiák. 39 00:02:08,320 --> 00:02:12,616 Kitalálhatunk-e méretezhetőbb, 40 00:02:12,640 --> 00:02:15,730 hatékonyabb és értékesebb MI-architektúrákat 41 00:02:15,760 --> 00:02:19,016 ezeknek az előttünk álló, nagyon fontos problémák megoldására? 42 00:02:19,040 --> 00:02:22,336 Csapatom jelenleg épp ezen fáradozik az MIT Media Labnál. 43 00:02:22,360 --> 00:02:26,140 Feltaláltunk több rendhagyó MI-architektúrát, 44 00:02:26,180 --> 00:02:29,416 hogy az orvosi képalkotásban és klinikai kísérletekben előttünk álló 45 00:02:29,440 --> 00:02:32,280 legfontosabb kihívások egy részére válaszolni tudjunk. 46 00:02:32,480 --> 00:02:35,536 Az előbb bemutatott példa megoldására két célt ki tűztünk ki. 47 00:02:35,560 --> 00:02:38,536 Első célkitűzésünk az volt, hogy csökkentsük 48 00:02:38,560 --> 00:02:41,816 az MI-algoritmusok betanításához szükséges képek számát. 49 00:02:41,840 --> 00:02:43,936 Második célunk – még többet akartunk - 50 00:02:43,960 --> 00:02:46,680 csökkenteni a betegek átvizsgálásához szükséges, 51 00:02:46,680 --> 00:02:48,936 drága orvosi képalkotó technológiák használatát. 52 00:02:48,960 --> 00:02:50,160 Hogyan oldottuk ezt meg? 53 00:02:50,920 --> 00:02:52,136 Első célkitűzésünkhöz 54 00:02:52,160 --> 00:02:54,216 egyetlen orvosi képet fogtunk, 55 00:02:54,240 --> 00:02:57,256 nem pedig tízezernyi nagyon drága képet, 56 00:02:57,280 --> 00:02:59,336 mint a hagyományos MI esetében. 57 00:02:59,360 --> 00:03:03,136 Csapatom és én nagyon frappáns módot találtunk ki arra, hogy ebből a képből 58 00:03:03,160 --> 00:03:05,896 milliárdnyi információs csomagot vonjunk ki. 59 00:03:05,920 --> 00:03:09,616 Az információs csomagok tartalma: színek, képpontok, geometria, 60 00:03:09,640 --> 00:03:12,176 és a betegség leképezése az orvosi képre. 61 00:03:12,200 --> 00:03:16,536 Bizonyos értelemben több milliárd betanító adatponttá konvertáljuk ezt az egy képet, 62 00:03:16,560 --> 00:03:19,510 jelentősen csökkentve a betanításhoz szükséges adatmennyiséget. 63 00:03:19,510 --> 00:03:22,186 Második célkitűzésünkhöz, a betegek szűréséhez használt 64 00:03:22,186 --> 00:03:25,346 drága orvosi képalkotó technológiák alkalmazásának csökkentéséhez 65 00:03:25,346 --> 00:03:28,096 közönséges fényképet készítettünk nappali fényben, 66 00:03:28,120 --> 00:03:32,456 tükörreflexes fényképezőgéppel vagy mobiltelefonnal. 67 00:03:32,480 --> 00:03:35,366 Aztán emlékeznek arra a több milliárdnyi információcsomagra? 68 00:03:35,366 --> 00:03:38,496 Azokat ráfektettük az orvosi képről erre a képre, 69 00:03:38,520 --> 00:03:41,040 és úgynevezett összetett képet alkottunk belőlük. 70 00:03:41,480 --> 00:03:44,776 Nagy meglepetésünkre ötven ilyen összetett kép 71 00:03:44,800 --> 00:03:46,736 elég volt ahhoz – mondom: csak ötven –, 72 00:03:46,736 --> 00:03:50,000 hogy igen nagy hatékonysággal betanítsuk ezeket az algoritmusokat. 73 00:03:50,340 --> 00:03:52,016 Megközelítésünk összefoglalva: 74 00:03:52,040 --> 00:03:55,216 tízezer nagyon drága orvosi kép felhasználása helyett 75 00:03:55,240 --> 00:03:58,256 szokatlan módon taníthatjuk be az MI-algoritmusokat, 76 00:03:58,280 --> 00:04:01,940 mindössze 50 darab nagy felbontású, tükörreflexes géppel 77 00:04:01,970 --> 00:04:04,916 vagy mobiltelefonnal készített, közönséges fotóval, 78 00:04:04,916 --> 00:04:06,616 és így állítjuk fel a diagnózist. 79 00:04:06,640 --> 00:04:07,856 Még fontosabb, 80 00:04:07,880 --> 00:04:11,226 hogy algoritmusaink a jövőben is, de már jelenleg is tudnak fogadni 81 00:04:11,226 --> 00:04:14,076 nagyon egyszerű, nappali fényben készült fotókat a betegtől, 82 00:04:14,116 --> 00:04:16,320 kiváltva a drága orvosi képalkotó eljárásokat. 83 00:04:17,120 --> 00:04:20,216 Hiszem: készen állunk arra, hogy olyan korba lépjünk, 84 00:04:20,240 --> 00:04:22,176 ahol a mesterséges intelligencia 85 00:04:22,200 --> 00:04:24,736 hihetetlen hatással lesz a jövőre. 86 00:04:24,760 --> 00:04:27,216 És szerintem, ahogy a hagyományos MI-re gondolunk, 87 00:04:27,240 --> 00:04:30,016 ami adatokban gazdag, ám alkalmazásokban szegény, 88 00:04:30,040 --> 00:04:31,576 tovább kell gondolkodnunk 89 00:04:31,600 --> 00:04:34,616 a nem szokványos MI-architektúrákról, 90 00:04:34,640 --> 00:04:36,576 amik kis adatmennyiséggel is képesek 91 00:04:36,600 --> 00:04:39,586 kezelni és megoldani az előttünk álló legfontosabb problémákat, 92 00:04:39,606 --> 00:04:41,006 különösen az egészségügyben. 93 00:04:41,006 --> 00:04:42,256 Nagyon szépen köszönöm. 94 00:04:42,256 --> 00:04:45,920 (Taps)