1 00:00:00,880 --> 00:00:04,893 過去如果想用電腦來作點新東西, 2 00:00:04,893 --> 00:00:06,447 你需要設計程式。 3 00:00:06,447 --> 00:00:09,858 而現在, 你們可能沒做過程式設計這件事, 4 00:00:09,858 --> 00:00:13,360 它需要規劃相當詳細的細節 5 00:00:13,360 --> 00:00:16,727 那些你想讓電腦執行的每一個步驟 6 00:00:16,727 --> 00:00:19,089 以達到你的目的。 7 00:00:19,089 --> 00:00:22,585 如果你沒有概念要怎麼做的話 8 00:00:22,585 --> 00:00:24,648 那會是個很大的挑戰。 9 00:00:24,648 --> 00:00:28,131 亞瑟·撒姆爾也曾面對這種挑戰。 10 00:00:28,131 --> 00:00:32,208 他在 1956 年便想到用這台電腦 11 00:00:32,208 --> 00:00:34,548 能夠在西洋跳棋棋賽打敗他。 12 00:00:34,548 --> 00:00:36,588 要如何設計這樣的程式? 13 00:00:36,588 --> 00:00:40,394 把細節通通寫出來, 如何讓電腦比你還會下棋? 14 00:00:40,394 --> 00:00:42,116 於是他想出了一個點子: 15 00:00:42,116 --> 00:00:45,840 他讓電腦與電腦本身對弈數千次 16 00:00:45,840 --> 00:00:48,364 以學習如何玩西洋棋。 17 00:00:48,364 --> 00:00:51,544 然而,在 1962 年做到了, 18 00:00:51,544 --> 00:00:55,561 電腦打敗了康乃狄克州的冠軍。 19 00:00:55,561 --> 00:00:58,534 於是亞瑟·撒姆爾 成為了機器學習之父, 20 00:00:58,534 --> 00:01:00,251 我尊敬他, 21 00:01:00,251 --> 00:01:03,014 因為我也是個機器學習實踐者, 22 00:01:03,014 --> 00:01:04,479 我曾是 Kaggle 的會長, 23 00:01:04,479 --> 00:01:07,867 Kaggle 是個超過 20 萬人的 機器學習實踐者的社群。 24 00:01:07,867 --> 00:01:09,925 Kaggle 設立了一些比賽 25 00:01:09,925 --> 00:01:13,633 讓他們參與解決 過去無法解決的問題, 26 00:01:13,633 --> 00:01:17,470 而有上百的成功個案。 27 00:01:17,470 --> 00:01:19,940 從這有利的環境中, 我發現 28 00:01:19,940 --> 00:01:23,890 很多機器學習在 過去和現在可以做到的事情, 29 00:01:23,890 --> 00:01:26,252 還有未來可以做到的事。 30 00:01:26,252 --> 00:01:30,675 第一個機器學習的 商業成功案例是谷歌。 31 00:01:30,675 --> 00:01:33,784 谷歌展示找尋資料的方法 32 00:01:33,784 --> 00:01:35,536 是使用計算機演算法, 33 00:01:35,536 --> 00:01:38,437 而這演算法是以機器學習為基礎。 34 00:01:38,437 --> 00:01:42,323 自此,機器學習 有很多的商業成功例子, 35 00:01:42,323 --> 00:01:44,160 譬如亞馬遜和奈飛公司 36 00:01:44,160 --> 00:01:47,876 用機器學習會向你推薦 你可能想買的商品, 37 00:01:47,876 --> 00:01:49,896 你可能想看的影片。 38 00:01:49,896 --> 00:01:51,703 有時,你可能會很訝異。 39 00:01:51,703 --> 00:01:53,657 像領英和臉書等公司 40 00:01:53,657 --> 00:01:56,251 有些時候會告訴你 誰會是你的朋友 41 00:01:56,251 --> 00:01:58,228 而你根本不知道他們是如何做到的, 42 00:01:58,228 --> 00:02:01,195 因為他們用了 機器學習這強大的功能。 43 00:02:01,195 --> 00:02:04,152 演算法從資料去學習這類事情 44 00:02:04,152 --> 00:02:07,399 不需要動手去編寫程式。 45 00:02:07,399 --> 00:02:09,877 這也是 IBM 過去能成功的原因 46 00:02:09,877 --> 00:02:13,739 讓超級電腦「華生」在「危機遊戲」中 打敗兩屆世界冠軍。 47 00:02:13,739 --> 00:02:16,964 回答一些細碎和複雜的問題,像是 48 00:02:16,964 --> 00:02:19,799 「2003年,古獅像在這城市的 國家博物館消失了(連同其他物品)」 49 00:02:19,799 --> 00:02:23,034 這也是我們現在能看到第一部 自行駕駛汽車的原因。 50 00:02:23,034 --> 00:02:25,856 如果你能說出不同點,像是 51 00:02:25,856 --> 00:02:28,488 一棵樹和一條行人道, 那顯得非常重要。 52 00:02:28,488 --> 00:02:31,075 我們不知道如何設計這樣的程式, 53 00:02:31,075 --> 00:02:34,072 不過通過機器,這就成為可能。 54 00:02:34,072 --> 00:02:36,680 事實上, 這部汽車已經行駛一百萬英哩 55 00:02:36,680 --> 00:02:40,186 在正常路面沒有發生事故。 56 00:02:40,196 --> 00:02:44,110 我們現在都知道電腦能夠學習, 57 00:02:44,110 --> 00:02:46,010 學習做一些 58 00:02:46,010 --> 00:02:48,848 有時我們自己也不知道怎麼做的事, 59 00:02:48,848 --> 00:02:51,733 還可能比我們做得更好。 60 00:02:51,733 --> 00:02:55,928 其中一個機器學習的經典例子 61 00:02:55,928 --> 00:02:58,320 是我在 Kaggle 所做的一個專案 62 00:02:58,320 --> 00:03:01,911 由傑佛里·辛頓帶領的團隊 63 00:03:01,911 --> 00:03:03,463 他是多倫多大學的教授 64 00:03:03,463 --> 00:03:06,140 他們贏了新藥研發的比賽。 65 00:03:06,140 --> 00:03:08,987 他們出色地方 不只打敗了 66 00:03:08,987 --> 00:03:13,000 默克藥廠或國際學術社群 所研發的演算法, 67 00:03:13,000 --> 00:03:18,061 他們的團隊沒有化學 生物或生命科學的背景, 68 00:03:18,061 --> 00:03:20,230 而且只花了兩個星期就完成。 69 00:03:20,230 --> 00:03:21,611 他們怎麼做到的? 70 00:03:22,421 --> 00:03:25,342 他們用了一個很出色的演算法 叫做「深度學習」。 71 00:03:25,342 --> 00:03:28,291 這是重要且成功的事情 72 00:03:28,291 --> 00:03:31,412 在數星期後 被刊登在紐約時報頭版。 73 00:03:31,412 --> 00:03:34,147 左手邊那位是傑佛里·辛頓。 74 00:03:34,147 --> 00:03:38,488 深度學習是一種 受到人類大腦啟發的演算法, 75 00:03:38,488 --> 00:03:40,300 它是一種演算法 76 00:03:40,300 --> 00:03:44,141 做法不受理論限制的演算法。 77 00:03:44,141 --> 00:03:46,964 你給它越多的資料和 運算時間, 78 00:03:46,964 --> 00:03:48,276 會得到更好的結果。 79 00:03:48,276 --> 00:03:50,615 紐約時報的文章裡 80 00:03:50,615 --> 00:03:52,857 也介紹到深度學習的非凡成就 81 00:03:52,857 --> 00:03:55,569 我現在要展示給你們看。 82 00:03:55,569 --> 00:04:00,510 它顯示電腦能聽懂和理解資料的能力。 83 00:04:00,510 --> 00:04:03,221 (影片)理察·拉希德: 現在,最後一步是 84 00:04:03,221 --> 00:04:06,246 我能夠理解這個程序 85 00:04:06,246 --> 00:04:10,961 我能夠跟你說中文。 86 00:04:10,961 --> 00:04:13,596 現在關鍵的是, 87 00:04:13,596 --> 00:04:18,598 我們從很多講中文的人士中 收集大量的資訊 88 00:04:18,598 --> 00:04:21,128 然後產生文字轉化語言的系統 89 00:04:21,128 --> 00:04:25,801 將中文文字轉化成中文語言, 90 00:04:25,801 --> 00:04:29,929 然後錄一個小時我自己的聲音 91 00:04:29,929 --> 00:04:31,820 我們使用它去調變 92 00:04:31,820 --> 00:04:36,364 使標準文字轉化語音系統的聲音 聽起來像我的聲音。 93 00:04:36,364 --> 00:04:38,904 再一次,雖然結果沒有很完美, 94 00:04:38,904 --> 00:04:41,552 裡面還有一些錯誤。 95 00:04:41,552 --> 00:04:44,036 (中文) 96 00:04:44,036 --> 00:04:47,403 (掌聲) 97 00:04:49,446 --> 00:04:53,022 在這個領域還有很多工作要做。 98 00:04:53,022 --> 00:04:56,667 (中文) 99 00:04:56,667 --> 00:05:00,100 (掌聲) 100 00:05:01,345 --> 00:05:04,744 傑里米·霍華德:那是在中國舉行的 機器學習研討會。 101 00:05:04,744 --> 00:05:07,114 那不常有,事實上, 在學術會議上 102 00:05:07,114 --> 00:05:09,011 聽到熱烈的掌聲, 103 00:05:09,011 --> 00:05:12,687 雖然有些時候 TEDx 講座不拘泥形式。 104 00:05:12,687 --> 00:05:15,482 你所看到的都是出於深度學習 105 00:05:15,482 --> 00:05:17,007 (掌聲)謝謝。 106 00:05:17,007 --> 00:05:19,289 英文文字翻譯由深度學習完成的。 107 00:05:19,289 --> 00:05:22,701 翻譯成中文和右上角的文稿 也是出於深度學習, 108 00:05:22,701 --> 00:05:26,008 連創建聲音也都是深度學習。 109 00:05:26,008 --> 00:05:29,242 深度學習是如此的神奇。 110 00:05:29,242 --> 00:05:32,341 它是個單一的演算法 似乎可以完成任何事情, 111 00:05:32,341 --> 00:05:35,452 我一年前還發現它可以學會看 112 00:05:35,452 --> 00:05:37,628 這個德國遊戲的比賽 113 00:05:37,628 --> 00:05:40,225 叫德國交通標誌確認基準, 114 00:05:40,225 --> 00:05:43,618 深度學習能認出這個交通標誌。 115 00:05:43,618 --> 00:05:45,712 它不只確認交通標誌的能力 116 00:05:45,712 --> 00:05:47,470 比其他的演算法好, 117 00:05:47,470 --> 00:05:50,189 在排行榜上更顯示它做得比人類好, 118 00:05:50,189 --> 00:05:52,041 正確性是人類的兩倍。 119 00:05:52,041 --> 00:05:54,037 2011 以前,我們有了第一個例子 120 00:05:54,037 --> 00:05:57,442 視力高於人類的電腦。 121 00:05:57,442 --> 00:05:59,491 從那時開始,許多電腦也可以做到。 122 00:05:59,491 --> 00:06:03,005 2012 年谷歌宣佈 使用深度學習演算法 123 00:06:03,005 --> 00:06:04,420 來監看 Youtube 影片 124 00:06:04,420 --> 00:06:07,857 收集一個月 1,600 台電電腦的資料, 125 00:06:07,857 --> 00:06:12,218 電腦獨立識別 人或貓的概念 126 00:06:12,218 --> 00:06:14,027 僅透過觀看影片。 127 00:06:14,027 --> 00:06:16,379 這樣更像人類的學習方式。 128 00:06:16,379 --> 00:06:19,119 人類並非通過別人的指示來學習, 129 00:06:19,119 --> 00:06:22,450 而是從自己搞懂事情來學習。 130 00:06:22,450 --> 00:06:25,819 在 2012 年傑佛里·辛頓 我們之前看到的人, 131 00:06:25,819 --> 00:06:28,677 贏了很有名的映像網路比賽, 132 00:06:28,677 --> 00:06:32,818 嘗試從 150 萬的圖像中找出 133 00:06:32,818 --> 00:06:34,256 想要的圖像。 134 00:06:34,256 --> 00:06:37,789 2014 年, 我們現在 圖像辨識的錯誤率 135 00:06:37,789 --> 00:06:39,242 降到 6% 以下。 136 00:06:39,242 --> 00:06:41,268 這再次證明它比人類優秀。 137 00:06:41,268 --> 00:06:45,037 可見機器 真可以做到如此非凡的成就, 138 00:06:45,037 --> 00:06:47,306 它現在已經用在產業上了。 139 00:06:47,306 --> 00:06:50,348 比如說,谷歌去年宣佈 140 00:06:50,348 --> 00:06:54,933 他們可以在兩小時内把 法國每一個位置繪成地圖, 141 00:06:54,933 --> 00:06:58,380 他們用的方式是 把街景圖像 142 00:06:58,380 --> 00:07:02,699 輸入深度學習演算法 來辨認和讀取街道號碼。 143 00:07:02,699 --> 00:07:04,919 想想我們以前需要花多少時間? 144 00:07:04,919 --> 00:07:08,274 至少好幾十人加上好幾年呢。 145 00:07:08,274 --> 00:07:10,185 同樣的情況也發生在中國。 146 00:07:10,185 --> 00:07:14,221 我想「百度」類似中國的谷歌, 147 00:07:14,221 --> 00:07:16,504 在左上角你會看見 148 00:07:16,504 --> 00:07:20,478 一張我上傳到 百度深度學習系統的圖片, 149 00:07:20,478 --> 00:07:24,247 下方你可以看到 系統可以理解這張圖片 150 00:07:24,247 --> 00:07:26,483 而且能找到相似的圖像。 151 00:07:26,483 --> 00:07:29,219 類似的圖像 也就是有相似的背景, 152 00:07:29,219 --> 00:07:30,877 相似面孔的角度, 153 00:07:30,877 --> 00:07:32,665 有的圖像甚至有伸出舌頭。 154 00:07:32,665 --> 00:07:35,695 這個網頁的文字看不大清楚, 155 00:07:35,695 --> 00:07:37,107 因為我上傳的都是圖像。 156 00:07:37,107 --> 00:07:41,128 這顯示了電腦能明白他們所看到的 157 00:07:41,128 --> 00:07:42,752 電腦能夠搜尋資料庫 158 00:07:42,752 --> 00:07:46,306 以即時的方式從億萬張圖片中搜尋。 159 00:07:46,306 --> 00:07:49,536 現在的電腦能夠去看 是表示什麼意思呢? 160 00:07:49,536 --> 00:07:51,553 其實電腦不只能看見。 161 00:07:51,553 --> 00:07:53,622 事實上深度學習可以做得更多。 162 00:07:53,622 --> 00:07:56,570 像這個樣複雜,僅有小小差別的句子 163 00:07:56,570 --> 00:07:59,394 現在的深度學習演算法能夠理解。 164 00:07:59,394 --> 00:08:00,697 你可以看到, 165 00:08:00,697 --> 00:08:03,465 這以史丹福為基礎的系統 顯示上面的紅點 166 00:08:03,465 --> 00:08:07,384 指這句子是在表達負面的情緒。 167 00:08:07,384 --> 00:08:10,790 深度學習現在已經接近人類的行為 168 00:08:10,802 --> 00:08:15,923 能理解句子是要表達什麼。 169 00:08:15,923 --> 00:08:18,651 同時,深度學習也能用以閱讀中文, 170 00:08:18,651 --> 00:08:21,807 程度相當於以中文為母語的水平。 171 00:08:21,807 --> 00:08:23,975 這演算法發展於瑞士 172 00:08:23,975 --> 00:08:27,331 沒有一個會說中文的團隊。 173 00:08:27,331 --> 00:08:29,382 像我說的,深度學習 174 00:08:29,382 --> 00:08:31,601 是一個最好的系統 對完成這任務來說, 175 00:08:31,601 --> 00:08:36,718 甚至比人類還要好。 176 00:08:36,718 --> 00:08:39,682 這個系統是我公司建立的 177 00:08:39,682 --> 00:08:41,728 要把這些東西都集中在一起。 178 00:08:41,728 --> 00:08:44,189 這是一些沒有文字描述的圖片, 179 00:08:44,189 --> 00:08:46,541 我在這裡輸入句子, 180 00:08:46,541 --> 00:08:49,510 它在同步理解這些照片 181 00:08:49,510 --> 00:08:51,189 找出它們是有關什麼的照片 182 00:08:51,189 --> 00:08:54,352 也找出跟我句子相關類似的圖片。 183 00:08:54,352 --> 00:08:57,108 所以你看, 它真的能理解我的句子。 184 00:08:57,108 --> 00:08:59,332 也完全的理解這些圖片。 185 00:08:59,332 --> 00:09:01,891 你在谷歌上也看過類似的, 186 00:09:01,891 --> 00:09:04,666 你可以輸入文字 而它會顯示圖片, 187 00:09:04,666 --> 00:09:08,090 但事實上,它在尋索網頁上的文字。 188 00:09:08,090 --> 00:09:11,091 這跟理解圖片有很大的不同。 189 00:09:11,091 --> 00:09:13,843 理解圖片只有電腦可以做 190 00:09:13,843 --> 00:09:17,091 電腦在過去幾個月才會做的事。 191 00:09:17,091 --> 00:09:21,182 電腦不單能看見 也能閱讀, 192 00:09:21,182 --> 00:09:24,947 而且我們顯示了電腦能理解所聽到的。 193 00:09:24,947 --> 00:09:28,389 或許不意外地, 我要告訴你們電腦也能書寫。 194 00:09:28,389 --> 00:09:33,172 這是我昨天用深度學習演算法 所產生的文字。 195 00:09:33,172 --> 00:09:37,096 這裡有一些非史丹佛演算法 所產生的文字。 196 00:09:37,096 --> 00:09:38,860 這些句子的產生 197 00:09:38,860 --> 00:09:43,109 是透過深度學習演算法 對圖片進行描述。 198 00:09:43,109 --> 00:09:47,581 這演算法是電腦從來沒有看見過 一個穿黑襯衫的男子彈吉他。 199 00:09:47,581 --> 00:09:49,801 電腦見過男人, 看過黑色, 200 00:09:49,801 --> 00:09:51,400 見過吉他, 201 00:09:51,400 --> 00:09:55,694 它自己便對圖片做出描述。 202 00:09:55,694 --> 00:09:59,196 雖然還沒有超越人類, 不過很接近了。 203 00:09:59,196 --> 00:10:03,264 依據統計,人們較喜歡 電腦的圖片說明 204 00:10:03,264 --> 00:10:04,791 有四分之一的人會做這樣的選擇。 205 00:10:04,791 --> 00:10:06,855 這系統在兩個星期前開發完成, 206 00:10:06,855 --> 00:10:08,701 估計在明年, 207 00:10:08,701 --> 00:10:11,502 電腦演算法將會超越人類 208 00:10:11,502 --> 00:10:13,364 如果依照這樣的速度發展下的話。 209 00:10:13,364 --> 00:10:16,413 到時候電腦也會書寫了。 210 00:10:16,413 --> 00:10:19,888 我們把這些都放在一起, 讓它來引導到一個令人振奮的時機。 211 00:10:19,888 --> 00:10:21,380 像在藥物方面, 212 00:10:21,380 --> 00:10:23,905 一個波士頓的團隊 宣佈他們發現了 213 00:10:23,905 --> 00:10:26,854 數十種腫瘤的臨床特徵 214 00:10:26,854 --> 00:10:31,120 幫助醫生預測癌症。 215 00:10:32,220 --> 00:10:34,516 同樣的,在史丹佛, 216 00:10:34,516 --> 00:10:38,179 一個組織宣佈 在放大鏡下觀察組織, 217 00:10:38,179 --> 00:10:40,560 他們開發 一個以機器學習為基礎的系統 218 00:10:40,560 --> 00:10:43,142 比人類病理學家更有效地 219 00:10:43,142 --> 00:10:47,519 預測癌症病患的生存率。 220 00:10:47,519 --> 00:10:50,764 這些例子, 不但能更準確地預測, 221 00:10:50,764 --> 00:10:53,266 而且也能帶來更多科技上的洞見。 222 00:10:53,276 --> 00:10:54,781 在放射學的個案中, 223 00:10:54,781 --> 00:10:57,876 他們是人類所能理解的新臨床指標。 224 00:10:57,876 --> 00:10:59,668 在這病理學個案, 225 00:10:59,668 --> 00:11:04,168 電腦系統發現癌症周圍的細胞 226 00:11:04,168 --> 00:11:07,508 在診斷的時候 227 00:11:07,508 --> 00:11:09,260 是跟癌細胞一樣重要。 228 00:11:09,260 --> 00:11:14,621 這跟病理學家 10 年來的說法相反。 229 00:11:14,621 --> 00:11:17,913 在這兩個個案, 系統的開發人員 230 00:11:17,913 --> 00:11:21,534 是由醫學專家 和機器學習專家所組成, 231 00:11:21,534 --> 00:11:24,275 但自去年開始, 我們也超越了這些。 232 00:11:24,275 --> 00:11:27,824 這是確認癌症範圍的例子 233 00:11:27,824 --> 00:11:30,354 是在顯微鏡下的人類組織。 234 00:11:30,354 --> 00:11:34,967 系統顯示可以更準確地確認範圍, 235 00:11:34,967 --> 00:11:37,742 如病理學家般準確, 236 00:11:37,742 --> 00:11:41,134 不過沒有藥物專家 來建構整套深度學習系統 237 00:11:41,134 --> 00:11:43,660 系統是由一些 沒有專業背景的人完成。 238 00:11:44,730 --> 00:11:47,285 同樣地,從是細胞分裂。 239 00:11:47,285 --> 00:11:50,953 我們的系統可以像人類般 精確地分裂神經細胞, 240 00:11:50,953 --> 00:11:53,670 不過開發這套深度學習系統 241 00:11:53,670 --> 00:11:56,921 沒有一個人來自醫學背景。 242 00:11:56,921 --> 00:12:00,148 就是我和一些沒有醫學背景的人, 243 00:12:00,148 --> 00:12:03,875 看來我頗有資格開一家醫藥公司。 244 00:12:03,875 --> 00:12:06,021 我確實這麼做了。 245 00:12:06,021 --> 00:12:07,761 我是以戒慎恐懼的心情開始做, 246 00:12:07,761 --> 00:12:10,650 不過理論顯示 這是可行的 247 00:12:10,650 --> 00:12:16,142 用這些資料分析技術來 製作有效的藥物。 248 00:12:16,142 --> 00:12:18,622 感恩的是 回應也挺不錯, 249 00:12:18,622 --> 00:12:20,978 這回應不只是來自媒體, 而且還有醫藥社群, 250 00:12:20,978 --> 00:12:23,322 他們都很支持。 251 00:12:23,322 --> 00:12:27,471 理論上我們能在醫務過程中 252 00:12:27,471 --> 00:12:30,364 盡量轉換成資料分析, 253 00:12:30,364 --> 00:12:33,429 讓醫生去做他們擅長的。 254 00:12:33,429 --> 00:12:35,031 我舉一個例子。 255 00:12:35,031 --> 00:12:39,975 我們現在花 15 分鐘 來創造一項新的醫學診斷測試 256 00:12:39,975 --> 00:12:41,929 我會讓你同步看到過程, 257 00:12:41,929 --> 00:12:45,416 不過我已刪除部分資料 壓縮成三分鐘。 258 00:12:45,416 --> 00:12:48,477 我不會向你們展示 創造出來的醫學診斷測試, 259 00:12:48,477 --> 00:12:51,846 我要向你們展示 一項汽車圖片的診斷測試, 260 00:12:51,846 --> 00:12:54,068 因為這個我們都能理解。 261 00:12:54,068 --> 00:12:57,269 我們從 150 萬張 的汽車圖片開始, 262 00:12:57,269 --> 00:13:00,475 我希望創造一些東西 把圖片分類 263 00:13:00,475 --> 00:13:02,698 而且依圖片拍攝的角度來分類。 264 00:13:02,698 --> 00:13:06,586 這些圖片完全沒有標題, 我必需從零開始。 265 00:13:06,586 --> 00:13:08,451 深度學習演算法, 266 00:13:08,451 --> 00:13:12,158 它能自動確認 這些圖片的結構。 267 00:13:12,158 --> 00:13:15,778 美好的是 人和電腦可以合作 268 00:13:15,778 --> 00:13:17,956 看看這裡,這個人, 269 00:13:17,956 --> 00:13:20,631 正在告訴電腦 關於感興趣的範圍 270 00:13:20,631 --> 00:13:25,281 而電腦會嘗試用它 來改善電腦的演算法。 271 00:13:25,281 --> 00:13:29,577 這些深度學習系統 有 16,000 個立體空間, 272 00:13:29,577 --> 00:13:33,009 你可以看見電腦 讓他們在這空間旋轉, 273 00:13:33,009 --> 00:13:35,001 嘗試找出新的區域結構。 274 00:13:35,001 --> 00:13:36,782 當它成功時, 275 00:13:36,782 --> 00:13:40,786 在開車的人能夠 指出有興趣的地方。 276 00:13:40,786 --> 00:13:43,208 這裡,電腦成功的找到了那地區, 277 00:13:43,208 --> 00:13:45,770 再舉例,角度, 278 00:13:45,770 --> 00:13:47,376 通過這個過程, 279 00:13:47,376 --> 00:13:49,716 我們漸漸地告訴電腦更多 280 00:13:49,716 --> 00:13:52,144 關於我們在找的結構類型。 281 00:13:52,144 --> 00:13:53,916 你可以想像一個診斷測試 282 00:13:53,916 --> 00:13:57,266 像是一個病理學家辨認 病症的範圍, 283 00:13:57,266 --> 00:14:02,292 或是放射治療師界定 潛在的腫瘤。 284 00:14:02,292 --> 00:14:04,851 有些時候對演算法來說 是有些困難。 285 00:14:04,851 --> 00:14:06,815 在我們這個例子,它會出現混亂。 286 00:14:06,815 --> 00:14:09,365 汽車的正面和背面 都混淆不清了。 287 00:14:09,365 --> 00:14:11,437 我們需要更小心, 288 00:14:11,437 --> 00:14:14,669 手動選出正面 跟背面有相反效果的文字, 289 00:14:14,669 --> 00:14:20,175 然後告知電腦 這是一種 290 00:14:20,175 --> 00:14:21,523 我們有興趣的一類。 291 00:14:21,523 --> 00:14:24,200 這要花了一些時間來做, 所以我們跳過, 292 00:14:24,200 --> 00:14:26,446 然後我們訓練 機器學習演算法 293 00:14:26,446 --> 00:14:28,420 以好幾百張圖片去訓練它, 294 00:14:28,420 --> 00:14:30,445 我們希望它會做得更好。 295 00:14:30,445 --> 00:14:33,518 你可以看見,它開始 刪除一些圖片, 296 00:14:33,518 --> 00:14:38,226 顯示它已經知道 可以自己理解這些圖片。 297 00:14:38,226 --> 00:14:41,128 我們運用相似圖片的概念, 298 00:14:41,128 --> 00:14:43,222 用類似的圖片,你可以看到, 299 00:14:43,222 --> 00:14:47,241 電腦現在可以 完全找到正面的汽車。 300 00:14:47,241 --> 00:14:50,189 這時, 人類可以告訴電腦, 301 00:14:50,189 --> 00:14:52,482 對,你做的很好。 302 00:14:53,652 --> 00:14:55,837 當然,有些時候,即使在這個階段 303 00:14:55,837 --> 00:14:59,511 分組仍然是困難的。 304 00:14:59,511 --> 00:15:03,395 在這情況,儘管我們讓 電腦嘗試旋轉圖片一陣子, 305 00:15:03,399 --> 00:15:06,744 我們還是發現左邊 和右邊的圖片 306 00:15:06,744 --> 00:15:08,222 是混淆在一起的。 307 00:15:08,222 --> 00:15:10,362 於是我們再次 給電腦一些提示, 308 00:15:10,362 --> 00:15:13,338 像是嘗試去發現一個計畫可以 309 00:15:13,338 --> 00:15:15,945 儘量區分出左邊和右邊的圖片 310 00:15:15,945 --> 00:15:18,067 是透過使用深度學習演算法。 311 00:15:18,067 --> 00:15:21,009 給予提示後, 好,它已經完成了。 312 00:15:21,009 --> 00:15:23,891 它找到一個方法 想像這些目標 313 00:15:23,891 --> 00:15:26,271 來分別這些分類。 314 00:15:26,271 --> 00:15:28,709 你現在知道了。 315 00:15:28,709 --> 00:15:36,906 這並不是電腦取代人類, 316 00:15:36,906 --> 00:15:39,546 而是兩者一起合作。 317 00:15:39,546 --> 00:15:43,096 我們在做的事情是 在過去需要 318 00:15:43,096 --> 00:15:45,098 5 或 6 個人 花 7 年時間完成的事情 319 00:15:45,098 --> 00:15:47,703 現在只需一個人 320 00:15:47,703 --> 00:15:50,208 15 分鐘來完成。 321 00:15:50,208 --> 00:15:54,158 這個過程需要重覆 4 或 5 次。 322 00:15:54,158 --> 00:15:56,017 你現在可以看到 323 00:15:56,017 --> 00:15:58,976 我們在 150 萬的圖片中 有 62% 是正確分類。 324 00:15:58,976 --> 00:16:01,448 現在,可見我們可以迅速地 325 00:16:01,448 --> 00:16:02,745 掌握整個大部分資料, 326 00:16:02,745 --> 00:16:05,664 再檢查以確定沒有錯誤。 327 00:16:05,664 --> 00:16:09,616 有錯誤,我們可以 讓電腦知道錯誤的地方。 328 00:16:09,616 --> 00:16:12,661 每一個不同的分類 我們都使用這種程序來做, 329 00:16:12,661 --> 00:16:15,148 我們現在 在分辨 150 萬張的圖片時 330 00:16:15,148 --> 00:16:17,563 有超過 80% 的成功率, 331 00:16:17,563 --> 00:16:19,641 現在,在這個案例 332 00:16:19,641 --> 00:16:23,220 找到少數幾個不正確的分類, 333 00:16:23,220 --> 00:16:26,108 讓電腦了解原因。 334 00:16:26,108 --> 00:16:27,851 用這種方法, 335 00:16:27,851 --> 00:16:31,972 15 分鐘就有 97% 的分辨率。 336 00:16:31,972 --> 00:16:36,572 這種技術可以幫助 解決一個重要的問題, 337 00:16:36,578 --> 00:16:39,614 醫療專家不足的問題。 338 00:16:39,614 --> 00:16:43,103 世界經濟論壇表示 339 00:16:43,103 --> 00:16:45,727 在發展中國家,內科醫生 有 10 倍到 20 倍的短缺。 340 00:16:45,727 --> 00:16:47,840 這要三百年的時間 341 00:16:47,840 --> 00:16:50,734 才能訓練足夠的人 來處理這個問題。 342 00:16:50,734 --> 00:16:53,619 想像一下, 我們是否可以幫助提高效率 343 00:16:53,619 --> 00:16:56,458 是使用深度學習這個方法來提升? 344 00:16:56,458 --> 00:16:58,690 我對這個機會感到很興奮。 345 00:16:58,690 --> 00:17:01,279 我也關注這些問題。 346 00:17:01,279 --> 00:17:04,403 問題是在這地圖上每個藍色的地方 347 00:17:04,403 --> 00:17:08,172 那裡都有 80% 的服務人員。 348 00:17:08,172 --> 00:17:09,959 什麼是服務? 349 00:17:09,959 --> 00:17:11,473 這些就是服務。 350 00:17:11,473 --> 00:17:15,627 電腦剛學會如何去做是確實的事。 351 00:17:15,627 --> 00:17:19,431 發展中國家 80% 的僱員工作 352 00:17:19,431 --> 00:17:21,963 電腦已開始學習如何做。 353 00:17:21,963 --> 00:17:23,403 這意味什麼? 354 00:17:23,403 --> 00:17:25,986 那可好。 他們將會被其他的職業取代。 355 00:17:25,986 --> 00:17:28,693 舉例:需要更多科學家來工作。 356 00:17:28,693 --> 00:17:29,510 不過,這不完全正確。 357 00:17:29,510 --> 00:17:32,628 數據科學家 不需要花很久的時間去做這些事情。 358 00:17:32,628 --> 00:17:35,880 例如,這四個演算法是同一個人設計的。 359 00:17:35,880 --> 00:17:38,318 若你認為這些 以前都發生過, 360 00:17:38,318 --> 00:17:42,126 過去我們看過 新事物出現的結果 361 00:17:42,126 --> 00:17:44,378 他們被新的職務所取替, 362 00:17:44,378 --> 00:17:46,494 那些新的職業會是什麼呢? 363 00:17:46,494 --> 00:17:48,365 我們很難去判斷, 364 00:17:48,365 --> 00:17:51,104 因為人類的能力 以這個速度逐漸成長, 365 00:17:51,104 --> 00:17:53,666 我們現在有了深度學習系統, 366 00:17:53,666 --> 00:17:56,893 我們知道 以指數的方式增長。 367 00:17:56,893 --> 00:17:58,498 我們在這裡。 368 00:17:58,498 --> 00:18:00,559 最近,我們看周圍的事物 369 00:18:00,559 --> 00:18:03,235 會說:電腦還是很笨,不是嗎? 370 00:18:03,235 --> 00:18:06,664 但是在五年內, 電腦將會超越這張圖表。 371 00:18:06,664 --> 00:18:10,529 我們需要開始思考這個能力。 372 00:18:10,529 --> 00:18:12,579 當然,我們曾經看過這個。 373 00:18:12,579 --> 00:18:13,966 在工業革命時期, 374 00:18:13,966 --> 00:18:16,817 發動機讓生產力往前跨一大步。 375 00:18:17,667 --> 00:18:20,805 雖然,一段時間之後, 事情轉為平靜。 376 00:18:20,805 --> 00:18:22,507 那時社會混亂, 377 00:18:22,507 --> 00:18:25,946 發動機被普遍使用 產生動力, 378 00:18:25,946 --> 00:18:28,300 事情就能真正得到解決。 379 00:18:28,300 --> 00:18:29,773 機器學習革命 380 00:18:29,773 --> 00:18:32,682 與工業革命大不相同, 381 00:18:32,682 --> 00:18:35,632 因為機器學習革命, 永遠不會停下來。 382 00:18:35,632 --> 00:18:38,614 電腦更具智力活動, 383 00:18:38,614 --> 00:18:42,862 他們能製造更好的電腦 去運作更好的智能活動, 384 00:18:42,862 --> 00:18:44,770 這是一種改變 385 00:18:44,770 --> 00:18:47,248 從未經歷過的改變, 386 00:18:47,248 --> 00:18:50,554 你之前的理解的可能性是不同的。 387 00:18:50,974 --> 00:18:52,754 這已經影響我們。 388 00:18:52,754 --> 00:18:56,384 過去 25 年, 資本生產力一直在增長, 389 00:18:56,400 --> 00:19:00,588 勞動生產力已經放緩, 事實上已有一點點下降。 390 00:19:01,408 --> 00:19:04,149 我想我們開始討論這個議題。 391 00:19:04,149 --> 00:19:07,176 我知道當我告訴別人這種情況時, 392 00:19:07,176 --> 00:19:08,666 人們可以不以為然。 393 00:19:08,666 --> 00:19:10,339 電腦不會思考, 394 00:19:10,339 --> 00:19:13,367 它們沒有感情, 也不了解詩, 395 00:19:13,367 --> 00:19:15,888 我們不真正理解它們怎麼運作。 396 00:19:15,888 --> 00:19:17,374 可是,哪又如何? 397 00:19:17,374 --> 00:19:19,178 電腦現在可以作 398 00:19:19,178 --> 00:19:21,897 人們花大部分時間 得到報酬所做的事情, 399 00:19:21,897 --> 00:19:23,628 所以我們該是思考的時候 400 00:19:23,628 --> 00:19:28,015 我們如何調整我們的社會和經濟結構 401 00:19:28,015 --> 00:19:29,855 請關注這些新的改變。 402 00:19:29,855 --> 00:19:31,388 謝謝 403 00:19:31,388 --> 00:19:32,190 (掌聲)