WEBVTT 00:00:01.280 --> 00:00:05.136 現今的電腦演算法能夠執行 很了不起的工作任務, 00:00:05.160 --> 00:00:09.896 有高度的精確性,規模可以很大, 且用的是類似人類的智慧。 00:00:09.920 --> 00:00:13.856 這種電腦的智慧通常被稱為 AI, 00:00:13.880 --> 00:00:15.736 也就是人工智慧。 00:00:15.760 --> 00:00:19.960 人工智慧已經準備好要對 我們未來的生活造成衝擊。 00:00:20.880 --> 00:00:24.816 然而我們現今仍然面臨很大的挑戰, 00:00:24.840 --> 00:00:28.336 包括偵測與診斷數種 會威脅生命的疾病, 00:00:28.360 --> 00:00:30.720 比如感染性疾病以及癌症。 00:00:32.000 --> 00:00:34.296 每年,有數千名病人 00:00:34.320 --> 00:00:37.120 因為肝癌或口腔癌而喪命。 NOTE Paragraph 00:00:37.880 --> 00:00:40.576 若要幫助這些病人的最好方法 00:00:40.600 --> 00:00:44.920 就是早期偵測並診斷出這些疾病。 00:00:45.880 --> 00:00:50.040 現今我們要如何偵測出這些疾病? 人工智慧能幫得上忙嗎? 00:00:51.920 --> 00:00:55.576 對於很不幸被懷疑可能 得了這些疾病的病人, 00:00:55.600 --> 00:00:58.256 專業的醫生首先會囑咐 00:00:58.280 --> 00:01:00.896 採用非常昂貴的醫療成像技術, 00:01:00.920 --> 00:01:05.016 例如螢光成像、 電腦斷層掃瞄、核磁共振。 00:01:05.040 --> 00:01:07.336 一旦收集到了這些影像, 00:01:07.360 --> 00:01:11.880 會有另一位專業醫生根據 這些影像做診斷,並和病人談。 00:01:12.520 --> 00:01:15.976 不難看出,這是非常耗資源的過程, 00:01:16.000 --> 00:01:20.416 需要專業的醫生 和昂貴的醫療成像技術兩者, 00:01:20.440 --> 00:01:23.536 而這在開發中國家是不實際的; 00:01:23.560 --> 00:01:26.920 事實上,在許多工業化的國家亦然。 NOTE Paragraph 00:01:27.760 --> 00:01:30.910 所以,我們能用人工智慧 來解決這個問題嗎? 00:01:31.840 --> 00:01:35.896 現今,若我要用傳統人工智慧架構 00:01:35.920 --> 00:01:37.136 來解決這個問題, 00:01:37.160 --> 00:01:38.616 我會需要一萬—— 00:01:38.640 --> 00:01:42.656 我重覆一次,大約一萬張 這種非常昂貴的醫療影像 00:01:42.680 --> 00:01:44.056 先被產生出來。 00:01:44.080 --> 00:01:46.976 產生出來後,接著去找專業醫生, 00:01:47.000 --> 00:01:49.496 來為我分析這些影像。 00:01:49.520 --> 00:01:51.616 用這兩種資訊, 00:01:51.640 --> 00:01:55.296 我就能訓練標準的 深度類神經網路或深度學習網路 00:01:55.320 --> 00:01:57.456 來提供對病人的診斷。 00:01:57.480 --> 00:01:59.216 和第一個方法很類似, 00:01:59.240 --> 00:02:01.383 傳統人工智慧方法 00:02:01.407 --> 00:02:02.856 也會遇到同樣的問題。 00:02:02.880 --> 00:02:07.440 大量的資料、專業醫生, 以及專業醫療成像技術。 NOTE Paragraph 00:02:08.320 --> 00:02:12.616 我們是否能發明 更有擴展性、更有效, 00:02:12.640 --> 00:02:15.936 且更有價值的人工智慧架構, 00:02:15.960 --> 00:02:19.016 來解決我們現今所面臨的 這些非常重要的問題? 00:02:19.040 --> 00:02:22.336 這就是我的團隊在麻省理工學院 媒體實驗室在做的事。 00:02:22.360 --> 00:02:26.216 我們已經發明了多種 非正統的人工智慧架構 00:02:26.240 --> 00:02:29.416 來解決我們現今在醫療成像 及臨床實驗方面 00:02:29.440 --> 00:02:31.640 所面臨的一些最重要的挑戰。 NOTE Paragraph 00:02:32.480 --> 00:02:35.536 在今天我和各位分享的 例子中,我們有兩個目標。 00:02:35.560 --> 00:02:38.536 我們的第一個目標是要減少 00:02:38.560 --> 00:02:41.816 訓練人工智慧演算法 所需要的影像數量。 00:02:41.840 --> 00:02:43.936 我們的第二個目標—— 我們的野心更大, 00:02:43.960 --> 00:02:47.696 我們想要減少使用昂貴醫療成像技術 00:02:47.720 --> 00:02:48.936 來篩選病人。 00:02:48.960 --> 00:02:50.160 我們要怎麼做? NOTE Paragraph 00:02:50.920 --> 00:02:52.136 針對第一個目標, 00:02:52.160 --> 00:02:54.216 不像傳統人工智慧一開始 00:02:54.240 --> 00:02:57.256 要用到數萬張非常 昂貴的醫療影像, 00:02:57.280 --> 00:02:59.336 我們反而從單一張醫療影像開始。 00:02:59.360 --> 00:03:03.136 從這張影像,我和我的團隊 想出了一個非常聰明的方法 00:03:03.160 --> 00:03:05.896 來取出數十億個資訊封包。 00:03:05.920 --> 00:03:09.616 這些資訊封包包括用 顏色、像素、幾何學, 00:03:09.640 --> 00:03:12.176 在醫療影像上呈現疾病。 00:03:12.200 --> 00:03:16.536 在某種意義上,我們是把一張影像 轉變為數十億個訓練資料點, 00:03:16.560 --> 00:03:20.096 大大減少了訓練所需要的資料量。 NOTE Paragraph 00:03:20.120 --> 00:03:21.336 至於第二個目標, 00:03:21.360 --> 00:03:25.216 也就是減少使用昂貴的 醫療成像技術來篩選病人, 00:03:25.240 --> 00:03:29.316 我們一開始使用的是 一張病人的標準白光照片, 00:03:29.336 --> 00:03:32.456 可以用數位單眼相機或手機來拍攝。 00:03:32.480 --> 00:03:34.936 接著,還記得 那數十億個資訊封包嗎? 00:03:34.960 --> 00:03:38.496 我們將那些來自醫療影像的 封包疊到這張影像上, 00:03:38.520 --> 00:03:41.040 創造出我們所謂的合成影像。 00:03:41.480 --> 00:03:44.776 很讓我們驚訝的是, 我們只需要五十張—— 00:03:44.800 --> 00:03:46.356 我重覆一次,只要五十張—— 00:03:46.380 --> 00:03:50.000 這種合成影像,就能把我們的 演算法訓練到很高效能的程度。 NOTE Paragraph 00:03:50.680 --> 00:03:52.016 總結一下我們的方法, 00:03:52.040 --> 00:03:55.216 我們不需要使用一萬張 非常昂貴的醫療影像, 00:03:55.240 --> 00:03:58.476 我們現在可以用非正統的方法 來訓練人工智慧演算法, 00:03:58.496 --> 00:04:02.536 只要用五十張高解析度的 一般標準照片, 00:04:02.560 --> 00:04:05.056 用數位單眼相機或手機來拍攝即可, 00:04:05.080 --> 00:04:06.616 這樣就能提供出診斷結果。 00:04:06.640 --> 00:04:07.856 更重要的是, 00:04:07.880 --> 00:04:11.016 在未來,甚至在現在, 我們的演算法能接受 00:04:11.040 --> 00:04:13.856 病人非常簡單的白光照片, 00:04:13.880 --> 00:04:16.320 取代昂貴的醫療成像技術。 NOTE Paragraph 00:04:17.120 --> 00:04:20.216 我相信我們已經準備好 要進入一個新時代, 00:04:20.240 --> 00:04:22.176 在這個時代,人工智慧 00:04:22.200 --> 00:04:24.736 將會對我們的未來有很大的衝擊。 00:04:24.760 --> 00:04:27.216 想想傳統人工智慧, 00:04:27.240 --> 00:04:30.016 它在資料上很豐富, 但在應用上很有限, 00:04:30.040 --> 00:04:31.576 我們應該要持續思考 00:04:31.600 --> 00:04:34.616 有沒有其他非正統的 人工智慧架構, 00:04:34.640 --> 00:04:36.576 能夠接受更少量的資料, 00:04:36.600 --> 00:04:39.350 並解決一些現今我們 面臨最重要的問題, 00:04:39.380 --> 00:04:41.016 特別是健康照護問題。 NOTE Paragraph 00:04:41.036 --> 00:04:42.316 非常謝謝。 NOTE Paragraph 00:04:42.336 --> 00:04:45.920 (掌聲)