WEBVTT 00:00:00.880 --> 00:00:04.893 過去如果想用電腦來作點新東西, 00:00:04.893 --> 00:00:06.447 你需要設計程式。 00:00:06.447 --> 00:00:09.858 而現在, 你們可能沒做過程式設計這件事, 00:00:09.858 --> 00:00:13.360 它需要規劃相當詳細的細節 00:00:13.360 --> 00:00:16.727 那些你想讓電腦執行的每一個步驟 00:00:16.727 --> 00:00:19.089 以達到你的目的。 00:00:19.089 --> 00:00:22.585 如果你沒有概念要怎麼做的話 00:00:22.585 --> 00:00:24.648 那會是個很大的挑戰。 NOTE Paragraph 00:00:24.648 --> 00:00:28.131 亞瑟·撒姆爾也曾面對這種挑戰。 00:00:28.131 --> 00:00:32.208 他在 1956 年便想到用這台電腦 00:00:32.208 --> 00:00:34.548 能夠在西洋跳棋棋賽打敗他。 00:00:34.548 --> 00:00:36.588 要如何設計這樣的程式? 00:00:36.588 --> 00:00:40.394 把細節通通寫出來, 如何讓電腦比你還會下棋? 00:00:40.394 --> 00:00:42.116 於是他想出了一個點子: 00:00:42.116 --> 00:00:45.840 他讓電腦與電腦本身對弈數千次 00:00:45.840 --> 00:00:48.364 以學習如何玩西洋棋。 00:00:48.364 --> 00:00:51.544 然而,在 1962 年做到了, 00:00:51.544 --> 00:00:55.561 電腦打敗了康乃狄克州的冠軍。 NOTE Paragraph 00:00:55.561 --> 00:00:58.534 於是亞瑟·撒姆爾 成為了機器學習之父, 00:00:58.534 --> 00:01:00.251 我尊敬他, 00:01:00.251 --> 00:01:03.014 因為我也是個機器學習實踐者, 00:01:03.014 --> 00:01:04.479 我曾是 Kaggle 的會長, 00:01:04.479 --> 00:01:07.867 Kaggle 是個超過 20 萬人的 機器學習實踐者的社群。 00:01:07.867 --> 00:01:09.925 Kaggle 設立了一些比賽 00:01:09.925 --> 00:01:13.633 讓他們參與解決 過去無法解決的問題, 00:01:13.633 --> 00:01:17.470 而有上百的成功個案。 00:01:17.470 --> 00:01:19.940 從這有利的環境中, 我發現 00:01:19.940 --> 00:01:23.890 很多機器學習在 過去和現在可以做到的事情, 00:01:23.890 --> 00:01:26.252 還有未來可以做到的事。 00:01:26.252 --> 00:01:30.675 第一個機器學習的 商業成功案例是谷歌。 00:01:30.675 --> 00:01:33.784 谷歌展示找尋資料的方法 00:01:33.784 --> 00:01:35.536 是使用計算機演算法, 00:01:35.536 --> 00:01:38.437 而這演算法是以機器學習為基礎。 00:01:38.437 --> 00:01:42.323 自此,機器學習 有很多的商業成功例子, 00:01:42.323 --> 00:01:44.160 譬如亞馬遜和奈飛公司 00:01:44.160 --> 00:01:47.876 用機器學習會向你推薦 你可能想買的商品, 00:01:47.876 --> 00:01:49.896 你可能想看的影片。 00:01:49.896 --> 00:01:51.703 有時,你可能會很訝異。 00:01:51.703 --> 00:01:53.657 像領英和臉書等公司 00:01:53.657 --> 00:01:56.251 有些時候會告訴你 誰會是你的朋友 00:01:56.251 --> 00:01:58.228 而你根本不知道他們是如何做到的, 00:01:58.228 --> 00:02:01.195 因為他們用了 機器學習這強大的功能。 00:02:01.195 --> 00:02:04.152 演算法從資料去學習這類事情 00:02:04.152 --> 00:02:07.399 不需要動手去編寫程式。 NOTE Paragraph 00:02:07.399 --> 00:02:09.877 這也是 IBM 過去能成功的原因 00:02:09.877 --> 00:02:13.739 讓超級電腦「華生」在「危機遊戲」中 打敗兩屆世界冠軍。 00:02:13.739 --> 00:02:16.964 回答一些細碎和複雜的問題,像是 00:02:16.964 --> 00:02:19.799 「2003年,古獅像在這城市的 國家博物館消失了(連同其他物品)」 00:02:19.799 --> 00:02:23.034 這也是我們現在能看到第一部 自行駕駛汽車的原因。 00:02:23.034 --> 00:02:25.856 如果你能說出不同點,像是 00:02:25.856 --> 00:02:28.488 一棵樹和一條行人道, 那顯得非常重要。 00:02:28.488 --> 00:02:31.075 我們不知道如何設計這樣的程式, 00:02:31.075 --> 00:02:34.072 不過通過機器,這就成為可能。 00:02:34.072 --> 00:02:36.680 事實上, 這部汽車已經行駛一百萬英哩 00:02:36.680 --> 00:02:40.186 在正常路面沒有發生事故。 NOTE Paragraph 00:02:40.196 --> 00:02:44.110 我們現在都知道電腦能夠學習, 00:02:44.110 --> 00:02:46.010 學習做一些 00:02:46.010 --> 00:02:48.848 有時我們自己也不知道怎麼做的事, 00:02:48.848 --> 00:02:51.733 還可能比我們做得更好。 00:02:51.733 --> 00:02:55.928 其中一個機器學習的經典例子 00:02:55.928 --> 00:02:58.320 是我在 Kaggle 所做的一個專案 00:02:58.320 --> 00:03:01.911 由傑佛里·辛頓帶領的團隊 00:03:01.911 --> 00:03:03.463 他是多倫多大學的教授 00:03:03.463 --> 00:03:06.140 他們贏了新藥研發的比賽。 00:03:06.140 --> 00:03:08.987 他們出色地方 不只打敗了 00:03:08.987 --> 00:03:13.000 默克藥廠或國際學術社群 所研發的演算法, 00:03:13.000 --> 00:03:18.061 他們的團隊沒有化學 生物或生命科學的背景, 00:03:18.061 --> 00:03:20.230 而且只花了兩個星期就完成。 00:03:20.230 --> 00:03:21.611 他們怎麼做到的? 00:03:22.421 --> 00:03:25.342 他們用了一個很出色的演算法 叫做「深度學習」。 00:03:25.342 --> 00:03:28.291 這是重要且成功的事情 00:03:28.291 --> 00:03:31.412 在數星期後 被刊登在紐約時報頭版。 00:03:31.412 --> 00:03:34.147 左手邊那位是傑佛里·辛頓。 00:03:34.147 --> 00:03:38.488 深度學習是一種 受到人類大腦啟發的演算法, 00:03:38.488 --> 00:03:40.300 它是一種演算法 00:03:40.300 --> 00:03:44.141 做法不受理論限制的演算法。 00:03:44.141 --> 00:03:46.964 你給它越多的資料和 運算時間, 00:03:46.964 --> 00:03:48.276 會得到更好的結果。 NOTE Paragraph 00:03:48.276 --> 00:03:50.615 紐約時報的文章裡 00:03:50.615 --> 00:03:52.857 也介紹到深度學習的非凡成就 00:03:52.857 --> 00:03:55.569 我現在要展示給你們看。 00:03:55.569 --> 00:04:00.510 它顯示電腦能聽懂和理解資料的能力。 NOTE Paragraph 00:04:00.510 --> 00:04:03.221 (影片)理察·拉希德: 現在,最後一步是 00:04:03.221 --> 00:04:06.246 我能夠理解這個程序 00:04:06.246 --> 00:04:10.961 我能夠跟你說中文。 00:04:10.961 --> 00:04:13.596 現在關鍵的是, 00:04:13.596 --> 00:04:18.598 我們從很多講中文的人士中 收集大量的資訊 00:04:18.598 --> 00:04:21.128 然後產生文字轉化語言的系統 00:04:21.128 --> 00:04:25.801 將中文文字轉化成中文語言, 00:04:25.801 --> 00:04:29.929 然後錄一個小時我自己的聲音 00:04:29.929 --> 00:04:31.820 我們使用它去調變 00:04:31.820 --> 00:04:36.364 使標準文字轉化語音系統的聲音 聽起來像我的聲音。 00:04:36.364 --> 00:04:38.904 再一次,雖然結果沒有很完美, 00:04:38.904 --> 00:04:41.552 裡面還有一些錯誤。 00:04:41.552 --> 00:04:44.036 (中文) 00:04:44.036 --> 00:04:47.403 (掌聲) 00:04:49.446 --> 00:04:53.022 在這個領域還有很多工作要做。 00:04:53.022 --> 00:04:56.667 (中文) 00:04:56.667 --> 00:05:00.100 (掌聲) NOTE Paragraph 00:05:01.345 --> 00:05:04.744 傑里米·霍華德:那是在中國舉行的 機器學習研討會。 00:05:04.744 --> 00:05:07.114 那不常有,事實上, 在學術會議上 00:05:07.114 --> 00:05:09.011 聽到熱烈的掌聲, 00:05:09.011 --> 00:05:12.687 雖然有些時候 TEDx 講座不拘泥形式。 00:05:12.687 --> 00:05:15.482 你所看到的都是出於深度學習 00:05:15.482 --> 00:05:17.007 (掌聲)謝謝。 00:05:17.007 --> 00:05:19.289 英文文字翻譯由深度學習完成的。 00:05:19.289 --> 00:05:22.701 翻譯成中文和右上角的文稿 也是出於深度學習, 00:05:22.701 --> 00:05:26.008 連創建聲音也都是深度學習。 NOTE Paragraph 00:05:26.008 --> 00:05:29.242 深度學習是如此的神奇。 00:05:29.242 --> 00:05:32.341 它是個單一的演算法 似乎可以完成任何事情, 00:05:32.341 --> 00:05:35.452 我一年前還發現它可以學會看 00:05:35.452 --> 00:05:37.628 這個德國遊戲的比賽 00:05:37.628 --> 00:05:40.225 叫德國交通標誌確認基準, 00:05:40.225 --> 00:05:43.618 深度學習能認出這個交通標誌。 00:05:43.618 --> 00:05:45.712 它不只確認交通標誌的能力 00:05:45.712 --> 00:05:47.470 比其他的演算法好, 00:05:47.470 --> 00:05:50.189 在排行榜上更顯示它做得比人類好, 00:05:50.189 --> 00:05:52.041 正確性是人類的兩倍。 00:05:52.041 --> 00:05:54.037 2011 以前,我們有了第一個例子 00:05:54.037 --> 00:05:57.442 視力高於人類的電腦。 00:05:57.442 --> 00:05:59.491 從那時開始,許多電腦也可以做到。 00:05:59.491 --> 00:06:03.005 2012 年谷歌宣佈 使用深度學習演算法 00:06:03.005 --> 00:06:04.420 來監看 Youtube 影片 00:06:04.420 --> 00:06:07.857 收集一個月 1,600 台電電腦的資料, 00:06:07.857 --> 00:06:12.218 電腦獨立識別 人或貓的概念 00:06:12.218 --> 00:06:14.027 僅透過觀看影片。 00:06:14.027 --> 00:06:16.379 這樣更像人類的學習方式。 00:06:16.379 --> 00:06:19.119 人類並非通過別人的指示來學習, 00:06:19.119 --> 00:06:22.450 而是從自己搞懂事情來學習。 00:06:22.450 --> 00:06:25.819 在 2012 年傑佛里·辛頓 我們之前看到的人, 00:06:25.819 --> 00:06:28.677 贏了很有名的映像網路比賽, 00:06:28.677 --> 00:06:32.818 嘗試從 150 萬的圖像中找出 00:06:32.818 --> 00:06:34.256 想要的圖像。 00:06:34.256 --> 00:06:37.789 2014 年, 我們現在 圖像辨識的錯誤率 00:06:37.789 --> 00:06:39.242 降到 6% 以下。 00:06:39.242 --> 00:06:41.268 這再次證明它比人類優秀。 NOTE Paragraph 00:06:41.268 --> 00:06:45.037 可見機器 真可以做到如此非凡的成就, 00:06:45.037 --> 00:06:47.306 它現在已經用在產業上了。 00:06:47.306 --> 00:06:50.348 比如說,谷歌去年宣佈 00:06:50.348 --> 00:06:54.933 他們可以在兩小時内把 法國每一個位置繪成地圖, 00:06:54.933 --> 00:06:58.380 他們用的方式是 把街景圖像 00:06:58.380 --> 00:07:02.699 輸入深度學習演算法 來辨認和讀取街道號碼。 00:07:02.699 --> 00:07:04.919 想想我們以前需要花多少時間? 00:07:04.919 --> 00:07:08.274 至少好幾十人加上好幾年呢。 00:07:08.274 --> 00:07:10.185 同樣的情況也發生在中國。 00:07:10.185 --> 00:07:14.221 我想「百度」類似中國的谷歌, 00:07:14.221 --> 00:07:16.504 在左上角你會看見 00:07:16.504 --> 00:07:20.478 一張我上傳到 百度深度學習系統的圖片, 00:07:20.478 --> 00:07:24.247 下方你可以看到 系統可以理解這張圖片 00:07:24.247 --> 00:07:26.483 而且能找到相似的圖像。 00:07:26.483 --> 00:07:29.219 類似的圖像 也就是有相似的背景, 00:07:29.219 --> 00:07:30.877 相似面孔的角度, 00:07:30.877 --> 00:07:32.665 有的圖像甚至有伸出舌頭。 00:07:32.665 --> 00:07:35.695 這個網頁的文字看不大清楚, 00:07:35.695 --> 00:07:37.107 因為我上傳的都是圖像。 00:07:37.107 --> 00:07:41.128 這顯示了電腦能明白他們所看到的 00:07:41.128 --> 00:07:42.752 電腦能夠搜尋資料庫 00:07:42.752 --> 00:07:46.306 以即時的方式從億萬張圖片中搜尋。 NOTE Paragraph 00:07:46.306 --> 00:07:49.536 現在的電腦能夠去看 是表示什麼意思呢? 00:07:49.536 --> 00:07:51.553 其實電腦不只能看見。 00:07:51.553 --> 00:07:53.622 事實上深度學習可以做得更多。 00:07:53.622 --> 00:07:56.570 像這個樣複雜,僅有小小差別的句子 00:07:56.570 --> 00:07:59.394 現在的深度學習演算法能夠理解。 00:07:59.394 --> 00:08:00.697 你可以看到, 00:08:00.697 --> 00:08:03.465 這以史丹福為基礎的系統 顯示上面的紅點 00:08:03.465 --> 00:08:07.384 指這句子是在表達負面的情緒。 00:08:07.384 --> 00:08:10.790 深度學習現在已經接近人類的行為 00:08:10.802 --> 00:08:15.923 能理解句子是要表達什麼。 00:08:15.923 --> 00:08:18.651 同時,深度學習也能用以閱讀中文, 00:08:18.651 --> 00:08:21.807 程度相當於以中文為母語的水平。 00:08:21.807 --> 00:08:23.975 這演算法發展於瑞士 00:08:23.975 --> 00:08:27.331 沒有一個會說中文的團隊。 00:08:27.331 --> 00:08:29.382 像我說的,深度學習 00:08:29.382 --> 00:08:31.601 是一個最好的系統 對完成這任務來說, 00:08:31.601 --> 00:08:36.718 甚至比人類還要好。 NOTE Paragraph 00:08:36.718 --> 00:08:39.682 這個系統是我公司建立的 00:08:39.682 --> 00:08:41.728 要把這些東西都集中在一起。 00:08:41.728 --> 00:08:44.189 這是一些沒有文字描述的圖片, 00:08:44.189 --> 00:08:46.541 我在這裡輸入句子, 00:08:46.541 --> 00:08:49.510 它在同步理解這些照片 00:08:49.510 --> 00:08:51.189 找出它們是有關什麼的照片 00:08:51.189 --> 00:08:54.352 也找出跟我句子相關類似的圖片。 00:08:54.352 --> 00:08:57.108 所以你看, 它真的能理解我的句子。 00:08:57.108 --> 00:08:59.332 也完全的理解這些圖片。 00:08:59.332 --> 00:09:01.891 你在谷歌上也看過類似的, 00:09:01.891 --> 00:09:04.666 你可以輸入文字 而它會顯示圖片, 00:09:04.666 --> 00:09:08.090 但事實上,它在尋索網頁上的文字。 00:09:08.090 --> 00:09:11.091 這跟理解圖片有很大的不同。 00:09:11.091 --> 00:09:13.843 理解圖片只有電腦可以做 00:09:13.843 --> 00:09:17.091 電腦在過去幾個月才會做的事。 NOTE Paragraph 00:09:17.091 --> 00:09:21.182 電腦不單能看見 也能閱讀, 00:09:21.182 --> 00:09:24.947 而且我們顯示了電腦能理解所聽到的。 00:09:24.947 --> 00:09:28.389 或許不意外地, 我要告訴你們電腦也能書寫。 00:09:28.389 --> 00:09:33.172 這是我昨天用深度學習演算法 所產生的文字。 00:09:33.172 --> 00:09:37.096 這裡有一些非史丹佛演算法 所產生的文字。 00:09:37.096 --> 00:09:38.860 這些句子的產生 00:09:38.860 --> 00:09:43.109 是透過深度學習演算法 對圖片進行描述。 00:09:43.109 --> 00:09:47.581 這演算法是電腦從來沒有看見過 一個穿黑襯衫的男子彈吉他。 00:09:47.581 --> 00:09:49.801 電腦見過男人, 看過黑色, 00:09:49.801 --> 00:09:51.400 見過吉他, 00:09:51.400 --> 00:09:55.694 它自己便對圖片做出描述。 00:09:55.694 --> 00:09:59.196 雖然還沒有超越人類, 不過很接近了。 00:09:59.196 --> 00:10:03.264 依據統計,人們較喜歡 電腦的圖片說明 00:10:03.264 --> 00:10:04.791 有四分之一的人會做這樣的選擇。 00:10:04.791 --> 00:10:06.855 這系統在兩個星期前開發完成, 00:10:06.855 --> 00:10:08.701 估計在明年, 00:10:08.701 --> 00:10:11.502 電腦演算法將會超越人類 00:10:11.502 --> 00:10:13.364 如果依照這樣的速度發展下的話。 00:10:13.364 --> 00:10:16.413 到時候電腦也會書寫了。 NOTE Paragraph 00:10:16.413 --> 00:10:19.888 我們把這些都放在一起, 讓它來引導到一個令人振奮的時機。 00:10:19.888 --> 00:10:21.380 像在藥物方面, 00:10:21.380 --> 00:10:23.905 一個波士頓的團隊 宣佈他們發現了 00:10:23.905 --> 00:10:26.854 數十種腫瘤的臨床特徵 00:10:26.854 --> 00:10:31.120 幫助醫生預測癌症。 00:10:32.220 --> 00:10:34.516 同樣的,在史丹佛, 00:10:34.516 --> 00:10:38.179 一個組織宣佈 在放大鏡下觀察組織, 00:10:38.179 --> 00:10:40.560 他們開發 一個以機器學習為基礎的系統 00:10:40.560 --> 00:10:43.142 比人類病理學家更有效地 00:10:43.142 --> 00:10:47.519 預測癌症病患的生存率。 00:10:47.519 --> 00:10:50.764 這些例子, 不但能更準確地預測, 00:10:50.764 --> 00:10:53.266 而且也能帶來更多科技上的洞見。 00:10:53.276 --> 00:10:54.781 在放射學的個案中, 00:10:54.781 --> 00:10:57.876 他們是人類所能理解的新臨床指標。 00:10:57.876 --> 00:10:59.668 在這病理學個案, 00:10:59.668 --> 00:11:04.168 電腦系統發現癌症周圍的細胞 00:11:04.168 --> 00:11:07.508 在診斷的時候 00:11:07.508 --> 00:11:09.260 是跟癌細胞一樣重要。 00:11:09.260 --> 00:11:14.621 這跟病理學家 10 年來的說法相反。 00:11:14.621 --> 00:11:17.913 在這兩個個案, 系統的開發人員 00:11:17.913 --> 00:11:21.534 是由醫學專家 和機器學習專家所組成, 00:11:21.534 --> 00:11:24.275 但自去年開始, 我們也超越了這些。 00:11:24.275 --> 00:11:27.824 這是確認癌症範圍的例子 00:11:27.824 --> 00:11:30.354 是在顯微鏡下的人類組織。 00:11:30.354 --> 00:11:34.967 系統顯示可以更準確地確認範圍, 00:11:34.967 --> 00:11:37.742 如病理學家般準確, 00:11:37.742 --> 00:11:41.134 不過沒有藥物專家 來建構整套深度學習系統 00:11:41.134 --> 00:11:43.660 系統是由一些 沒有專業背景的人完成。 00:11:44.730 --> 00:11:47.285 同樣地,從是細胞分裂。 00:11:47.285 --> 00:11:50.953 我們的系統可以像人類般 精確地分裂神經細胞, 00:11:50.953 --> 00:11:53.670 不過開發這套深度學習系統 00:11:53.670 --> 00:11:56.921 沒有一個人來自醫學背景。 NOTE Paragraph 00:11:56.921 --> 00:12:00.148 就是我和一些沒有醫學背景的人, 00:12:00.148 --> 00:12:03.875 看來我頗有資格開一家醫藥公司。 00:12:03.875 --> 00:12:06.021 我確實這麼做了。 00:12:06.021 --> 00:12:07.761 我是以戒慎恐懼的心情開始做, 00:12:07.761 --> 00:12:10.650 不過理論顯示 這是可行的 00:12:10.650 --> 00:12:16.142 用這些資料分析技術來 製作有效的藥物。 00:12:16.142 --> 00:12:18.622 感恩的是 回應也挺不錯, 00:12:18.622 --> 00:12:20.978 這回應不只是來自媒體, 而且還有醫藥社群, 00:12:20.978 --> 00:12:23.322 他們都很支持。 00:12:23.322 --> 00:12:27.471 理論上我們能在醫務過程中 00:12:27.471 --> 00:12:30.364 盡量轉換成資料分析, 00:12:30.364 --> 00:12:33.429 讓醫生去做他們擅長的。 00:12:33.429 --> 00:12:35.031 我舉一個例子。 00:12:35.031 --> 00:12:39.975 我們現在花 15 分鐘 來創造一項新的醫學診斷測試 00:12:39.975 --> 00:12:41.929 我會讓你同步看到過程, 00:12:41.929 --> 00:12:45.416 不過我已刪除部分資料 壓縮成三分鐘。 00:12:45.416 --> 00:12:48.477 我不會向你們展示 創造出來的醫學診斷測試, 00:12:48.477 --> 00:12:51.846 我要向你們展示 一項汽車圖片的診斷測試, 00:12:51.846 --> 00:12:54.068 因為這個我們都能理解。 NOTE Paragraph 00:12:54.068 --> 00:12:57.269 我們從 150 萬張 的汽車圖片開始, 00:12:57.269 --> 00:13:00.475 我希望創造一些東西 把圖片分類 00:13:00.475 --> 00:13:02.698 而且依圖片拍攝的角度來分類。 00:13:02.698 --> 00:13:06.586 這些圖片完全沒有標題, 我必需從零開始。 00:13:06.586 --> 00:13:08.451 深度學習演算法, 00:13:08.451 --> 00:13:12.158 它能自動確認 這些圖片的結構。 00:13:12.158 --> 00:13:15.778 美好的是 人和電腦可以合作 00:13:15.778 --> 00:13:17.956 看看這裡,這個人, 00:13:17.956 --> 00:13:20.631 正在告訴電腦 關於感興趣的範圍 00:13:20.631 --> 00:13:25.281 而電腦會嘗試用它 來改善電腦的演算法。 00:13:25.281 --> 00:13:29.577 這些深度學習系統 有 16,000 個立體空間, 00:13:29.577 --> 00:13:33.009 你可以看見電腦 讓他們在這空間旋轉, 00:13:33.009 --> 00:13:35.001 嘗試找出新的區域結構。 00:13:35.001 --> 00:13:36.782 當它成功時, 00:13:36.782 --> 00:13:40.786 在開車的人能夠 指出有興趣的地方。 00:13:40.786 --> 00:13:43.208 這裡,電腦成功的找到了那地區, 00:13:43.208 --> 00:13:45.770 再舉例,角度, 00:13:45.770 --> 00:13:47.376 通過這個過程, 00:13:47.376 --> 00:13:49.716 我們漸漸地告訴電腦更多 00:13:49.716 --> 00:13:52.144 關於我們在找的結構類型。 00:13:52.144 --> 00:13:53.916 你可以想像一個診斷測試 00:13:53.916 --> 00:13:57.266 像是一個病理學家辨認 病症的範圍, 00:13:57.266 --> 00:14:02.292 或是放射治療師界定 潛在的腫瘤。 00:14:02.292 --> 00:14:04.851 有些時候對演算法來說 是有些困難。 00:14:04.851 --> 00:14:06.815 在我們這個例子,它會出現混亂。 00:14:06.815 --> 00:14:09.365 汽車的正面和背面 都混淆不清了。 00:14:09.365 --> 00:14:11.437 我們需要更小心, 00:14:11.437 --> 00:14:14.669 手動選出正面 跟背面有相反效果的文字, 00:14:14.669 --> 00:14:20.175 然後告知電腦 這是一種 00:14:20.175 --> 00:14:21.523 我們有興趣的一類。 NOTE Paragraph 00:14:21.523 --> 00:14:24.200 這要花了一些時間來做, 所以我們跳過, 00:14:24.200 --> 00:14:26.446 然後我們訓練 機器學習演算法 00:14:26.446 --> 00:14:28.420 以好幾百張圖片去訓練它, 00:14:28.420 --> 00:14:30.445 我們希望它會做得更好。 00:14:30.445 --> 00:14:33.518 你可以看見,它開始 刪除一些圖片, 00:14:33.518 --> 00:14:38.226 顯示它已經知道 可以自己理解這些圖片。 00:14:38.226 --> 00:14:41.128 我們運用相似圖片的概念, 00:14:41.128 --> 00:14:43.222 用類似的圖片,你可以看到, 00:14:43.222 --> 00:14:47.241 電腦現在可以 完全找到正面的汽車。 00:14:47.241 --> 00:14:50.189 這時, 人類可以告訴電腦, 00:14:50.189 --> 00:14:52.482 對,你做的很好。 NOTE Paragraph 00:14:53.652 --> 00:14:55.837 當然,有些時候,即使在這個階段 00:14:55.837 --> 00:14:59.511 分組仍然是困難的。 00:14:59.511 --> 00:15:03.395 在這情況,儘管我們讓 電腦嘗試旋轉圖片一陣子, 00:15:03.399 --> 00:15:06.744 我們還是發現左邊 和右邊的圖片 00:15:06.744 --> 00:15:08.222 是混淆在一起的。 00:15:08.222 --> 00:15:10.362 於是我們再次 給電腦一些提示, 00:15:10.362 --> 00:15:13.338 像是嘗試去發現一個計畫可以 00:15:13.338 --> 00:15:15.945 儘量區分出左邊和右邊的圖片 00:15:15.945 --> 00:15:18.067 是透過使用深度學習演算法。 00:15:18.067 --> 00:15:21.009 給予提示後, 好,它已經完成了。 00:15:21.009 --> 00:15:23.891 它找到一個方法 想像這些目標 00:15:23.891 --> 00:15:26.271 來分別這些分類。 NOTE Paragraph 00:15:26.271 --> 00:15:28.709 你現在知道了。 00:15:28.709 --> 00:15:36.906 這並不是電腦取代人類, 00:15:36.906 --> 00:15:39.546 而是兩者一起合作。 00:15:39.546 --> 00:15:43.096 我們在做的事情是 在過去需要 00:15:43.096 --> 00:15:45.098 5 或 6 個人 花 7 年時間完成的事情 00:15:45.098 --> 00:15:47.703 現在只需一個人 00:15:47.703 --> 00:15:50.208 15 分鐘來完成。 NOTE Paragraph 00:15:50.208 --> 00:15:54.158 這個過程需要重覆 4 或 5 次。 00:15:54.158 --> 00:15:56.017 你現在可以看到 00:15:56.017 --> 00:15:58.976 我們在 150 萬的圖片中 有 62% 是正確分類。 00:15:58.976 --> 00:16:01.448 現在,可見我們可以迅速地 00:16:01.448 --> 00:16:02.745 掌握整個大部分資料, 00:16:02.745 --> 00:16:05.664 再檢查以確定沒有錯誤。 00:16:05.664 --> 00:16:09.616 有錯誤,我們可以 讓電腦知道錯誤的地方。 00:16:09.616 --> 00:16:12.661 每一個不同的分類 我們都使用這種程序來做, 00:16:12.661 --> 00:16:15.148 我們現在 在分辨 150 萬張的圖片時 00:16:15.148 --> 00:16:17.563 有超過 80% 的成功率, 00:16:17.563 --> 00:16:19.641 現在,在這個案例 00:16:19.641 --> 00:16:23.220 找到少數幾個不正確的分類, 00:16:23.220 --> 00:16:26.108 讓電腦了解原因。 00:16:26.108 --> 00:16:27.851 用這種方法, 00:16:27.851 --> 00:16:31.972 15 分鐘就有 97% 的分辨率。 NOTE Paragraph 00:16:31.972 --> 00:16:36.572 這種技術可以幫助 解決一個重要的問題, 00:16:36.578 --> 00:16:39.614 醫療專家不足的問題。 00:16:39.614 --> 00:16:43.103 世界經濟論壇表示 00:16:43.103 --> 00:16:45.727 在發展中國家,內科醫生 有 10 倍到 20 倍的短缺。 00:16:45.727 --> 00:16:47.840 這要三百年的時間 00:16:47.840 --> 00:16:50.734 才能訓練足夠的人 來處理這個問題。 00:16:50.734 --> 00:16:53.619 想像一下, 我們是否可以幫助提高效率 00:16:53.619 --> 00:16:56.458 是使用深度學習這個方法來提升? NOTE Paragraph 00:16:56.458 --> 00:16:58.690 我對這個機會感到很興奮。 00:16:58.690 --> 00:17:01.279 我也關注這些問題。 00:17:01.279 --> 00:17:04.403 問題是在這地圖上每個藍色的地方 00:17:04.403 --> 00:17:08.172 那裡都有 80% 的服務人員。 00:17:08.172 --> 00:17:09.959 什麼是服務? 00:17:09.959 --> 00:17:11.473 這些就是服務。 00:17:11.473 --> 00:17:15.627 電腦剛學會如何去做是確實的事。 00:17:15.627 --> 00:17:19.431 發展中國家 80% 的僱員工作 00:17:19.431 --> 00:17:21.963 電腦已開始學習如何做。 00:17:21.963 --> 00:17:23.403 這意味什麼? 00:17:23.403 --> 00:17:25.986 那可好。 他們將會被其他的職業取代。 00:17:25.986 --> 00:17:28.693 舉例:需要更多科學家來工作。 00:17:28.693 --> 00:17:29.510 不過,這不完全正確。 00:17:29.510 --> 00:17:32.628 數據科學家 不需要花很久的時間去做這些事情。 00:17:32.628 --> 00:17:35.880 例如,這四個演算法是同一個人設計的。 00:17:35.880 --> 00:17:38.318 若你認為這些 以前都發生過, 00:17:38.318 --> 00:17:42.126 過去我們看過 新事物出現的結果 00:17:42.126 --> 00:17:44.378 他們被新的職務所取替, 00:17:44.378 --> 00:17:46.494 那些新的職業會是什麼呢? 00:17:46.494 --> 00:17:48.365 我們很難去判斷, 00:17:48.365 --> 00:17:51.104 因為人類的能力 以這個速度逐漸成長, 00:17:51.104 --> 00:17:53.666 我們現在有了深度學習系統, 00:17:53.666 --> 00:17:56.893 我們知道 以指數的方式增長。 00:17:56.893 --> 00:17:58.498 我們在這裡。 00:17:58.498 --> 00:18:00.559 最近,我們看周圍的事物 00:18:00.559 --> 00:18:03.235 會說:電腦還是很笨,不是嗎? 00:18:03.235 --> 00:18:06.664 但是在五年內, 電腦將會超越這張圖表。 00:18:06.664 --> 00:18:10.529 我們需要開始思考這個能力。 NOTE Paragraph 00:18:10.529 --> 00:18:12.579 當然,我們曾經看過這個。 00:18:12.579 --> 00:18:13.966 在工業革命時期, 00:18:13.966 --> 00:18:16.817 發動機讓生產力往前跨一大步。 00:18:17.667 --> 00:18:20.805 雖然,一段時間之後, 事情轉為平靜。 00:18:20.805 --> 00:18:22.507 那時社會混亂, 00:18:22.507 --> 00:18:25.946 發動機被普遍使用 產生動力, 00:18:25.946 --> 00:18:28.300 事情就能真正得到解決。 00:18:28.300 --> 00:18:29.773 機器學習革命 00:18:29.773 --> 00:18:32.682 與工業革命大不相同, 00:18:32.682 --> 00:18:35.632 因為機器學習革命, 永遠不會停下來。 00:18:35.632 --> 00:18:38.614 電腦更具智力活動, 00:18:38.614 --> 00:18:42.862 他們能製造更好的電腦 去運作更好的智能活動, 00:18:42.862 --> 00:18:44.770 這是一種改變 00:18:44.770 --> 00:18:47.248 從未經歷過的改變, 00:18:47.248 --> 00:18:50.554 你之前的理解的可能性是不同的。 NOTE Paragraph 00:18:50.974 --> 00:18:52.754 這已經影響我們。 00:18:52.754 --> 00:18:56.384 過去 25 年, 資本生產力一直在增長, 00:18:56.400 --> 00:19:00.588 勞動生產力已經放緩, 事實上已有一點點下降。 NOTE Paragraph 00:19:01.408 --> 00:19:04.149 我想我們開始討論這個議題。 00:19:04.149 --> 00:19:07.176 我知道當我告訴別人這種情況時, 00:19:07.176 --> 00:19:08.666 人們可以不以為然。 00:19:08.666 --> 00:19:10.339 電腦不會思考, 00:19:10.339 --> 00:19:13.367 它們沒有感情, 也不了解詩, 00:19:13.367 --> 00:19:15.888 我們不真正理解它們怎麼運作。 00:19:15.888 --> 00:19:17.374 可是,哪又如何? 00:19:17.374 --> 00:19:19.178 電腦現在可以作 00:19:19.178 --> 00:19:21.897 人們花大部分時間 得到報酬所做的事情, 00:19:21.897 --> 00:19:23.628 所以我們該是思考的時候 00:19:23.628 --> 00:19:28.015 我們如何調整我們的社會和經濟結構 00:19:28.015 --> 00:19:29.855 請關注這些新的改變。 00:19:29.855 --> 00:19:31.388 謝謝 00:19:31.388 --> 00:19:32.190 (掌聲)