WEBVTT

00:00:00.880 --> 00:00:04.893
過去如果想用電腦來作點新東西，

00:00:04.893 --> 00:00:06.447
你需要設計程式。

00:00:06.447 --> 00:00:09.858
而現在，
你們可能沒做過程式設計這件事，

00:00:09.858 --> 00:00:13.360
它需要規劃相當詳細的細節

00:00:13.360 --> 00:00:16.727
那些你想讓電腦執行的每一個步驟

00:00:16.727 --> 00:00:19.089
以達到你的目的。

00:00:19.089 --> 00:00:22.585
如果你沒有概念要怎麼做的話

00:00:22.585 --> 00:00:24.648
那會是個很大的挑戰。

NOTE Paragraph

00:00:24.648 --> 00:00:28.131
亞瑟·撒姆爾也曾面對這種挑戰。

00:00:28.131 --> 00:00:32.208
他在 1956 年便想到用這台電腦

00:00:32.208 --> 00:00:34.548
能夠在西洋跳棋棋賽打敗他。

00:00:34.548 --> 00:00:36.588
要如何設計這樣的程式？

00:00:36.588 --> 00:00:40.394
把細節通通寫出來，
如何讓電腦比你還會下棋？

00:00:40.394 --> 00:00:42.116
於是他想出了一個點子：

00:00:42.116 --> 00:00:45.840
他讓電腦與電腦本身對弈數千次

00:00:45.840 --> 00:00:48.364
以學習如何玩西洋棋。

00:00:48.364 --> 00:00:51.544
然而，在 1962 年做到了，

00:00:51.544 --> 00:00:55.561
電腦打敗了康乃狄克州的冠軍。

NOTE Paragraph

00:00:55.561 --> 00:00:58.534
於是亞瑟·撒姆爾
成為了機器學習之父，

00:00:58.534 --> 00:01:00.251
我尊敬他，

00:01:00.251 --> 00:01:03.014
因為我也是個機器學習實踐者，

00:01:03.014 --> 00:01:04.479
我曾是 Kaggle 的會長，

00:01:04.479 --> 00:01:07.867
Kaggle 是個超過 20 萬人的
機器學習實踐者的社群。

00:01:07.867 --> 00:01:09.925
Kaggle 設立了一些比賽

00:01:09.925 --> 00:01:13.633
讓他們參與解決
過去無法解決的問題，

00:01:13.633 --> 00:01:17.470
而有上百的成功個案。

00:01:17.470 --> 00:01:19.940
從這有利的環境中，
我發現

00:01:19.940 --> 00:01:23.890
很多機器學習在
過去和現在可以做到的事情，

00:01:23.890 --> 00:01:26.252
還有未來可以做到的事。

00:01:26.252 --> 00:01:30.675
第一個機器學習的
商業成功案例是谷歌。

00:01:30.675 --> 00:01:33.784
谷歌展示找尋資料的方法

00:01:33.784 --> 00:01:35.536
是使用計算機演算法，

00:01:35.536 --> 00:01:38.437
而這演算法是以機器學習為基礎。

00:01:38.437 --> 00:01:42.323
自此，機器學習
有很多的商業成功例子，

00:01:42.323 --> 00:01:44.160
譬如亞馬遜和奈飛公司

00:01:44.160 --> 00:01:47.876
用機器學習會向你推薦
你可能想買的商品，

00:01:47.876 --> 00:01:49.896
你可能想看的影片。

00:01:49.896 --> 00:01:51.703
有時，你可能會很訝異。

00:01:51.703 --> 00:01:53.657
像領英和臉書等公司

00:01:53.657 --> 00:01:56.251
有些時候會告訴你
誰會是你的朋友

00:01:56.251 --> 00:01:58.228
而你根本不知道他們是如何做到的，

00:01:58.228 --> 00:02:01.195
因為他們用了
機器學習這強大的功能。

00:02:01.195 --> 00:02:04.152
演算法從資料去學習這類事情

00:02:04.152 --> 00:02:07.399
不需要動手去編寫程式。

NOTE Paragraph

00:02:07.399 --> 00:02:09.877
這也是 IBM 過去能成功的原因

00:02:09.877 --> 00:02:13.739
讓超級電腦「華生」在「危機遊戲」中
打敗兩屆世界冠軍。

00:02:13.739 --> 00:02:16.964
回答一些細碎和複雜的問題，像是

00:02:16.964 --> 00:02:19.799
「2003年，古獅像在這城市的
國家博物館消失了（連同其他物品）」

00:02:19.799 --> 00:02:23.034
這也是我們現在能看到第一部
自行駕駛汽車的原因。

00:02:23.034 --> 00:02:25.856
如果你能說出不同點，像是

00:02:25.856 --> 00:02:28.488
一棵樹和一條行人道，
那顯得非常重要。

00:02:28.488 --> 00:02:31.075
我們不知道如何設計這樣的程式，

00:02:31.075 --> 00:02:34.072
不過通過機器，這就成為可能。

00:02:34.072 --> 00:02:36.680
事實上，
這部汽車已經行駛一百萬英哩

00:02:36.680 --> 00:02:40.186
在正常路面沒有發生事故。

NOTE Paragraph

00:02:40.196 --> 00:02:44.110
我們現在都知道電腦能夠學習，

00:02:44.110 --> 00:02:46.010
學習做一些

00:02:46.010 --> 00:02:48.848
有時我們自己也不知道怎麼做的事，

00:02:48.848 --> 00:02:51.733
還可能比我們做得更好。

00:02:51.733 --> 00:02:55.928
其中一個機器學習的經典例子

00:02:55.928 --> 00:02:58.320
是我在 Kaggle 所做的一個專案

00:02:58.320 --> 00:03:01.911
由傑佛里·辛頓帶領的團隊

00:03:01.911 --> 00:03:03.463
他是多倫多大學的教授

00:03:03.463 --> 00:03:06.140
他們贏了新藥研發的比賽。

00:03:06.140 --> 00:03:08.987
他們出色地方
不只打敗了

00:03:08.987 --> 00:03:13.000
默克藥廠或國際學術社群
所研發的演算法，

00:03:13.000 --> 00:03:18.061
他們的團隊沒有化學
生物或生命科學的背景，

00:03:18.061 --> 00:03:20.230
而且只花了兩個星期就完成。

00:03:20.230 --> 00:03:21.611
他們怎麼做到的？

00:03:22.421 --> 00:03:25.342
他們用了一個很出色的演算法
叫做「深度學習」。

00:03:25.342 --> 00:03:28.291
這是重要且成功的事情

00:03:28.291 --> 00:03:31.412
在數星期後
被刊登在紐約時報頭版。

00:03:31.412 --> 00:03:34.147
左手邊那位是傑佛里·辛頓。

00:03:34.147 --> 00:03:38.488
深度學習是一種
受到人類大腦啟發的演算法，

00:03:38.488 --> 00:03:40.300
它是一種演算法

00:03:40.300 --> 00:03:44.141
做法不受理論限制的演算法。

00:03:44.141 --> 00:03:46.964
你給它越多的資料和
運算時間，

00:03:46.964 --> 00:03:48.276
會得到更好的結果。

NOTE Paragraph

00:03:48.276 --> 00:03:50.615
紐約時報的文章裡

00:03:50.615 --> 00:03:52.857
也介紹到深度學習的非凡成就

00:03:52.857 --> 00:03:55.569
我現在要展示給你們看。

00:03:55.569 --> 00:04:00.510
它顯示電腦能聽懂和理解資料的能力。

NOTE Paragraph

00:04:00.510 --> 00:04:03.221
（影片）理察·拉希德: 
現在，最後一步是

00:04:03.221 --> 00:04:06.246
我能夠理解這個程序

00:04:06.246 --> 00:04:10.961
我能夠跟你說中文。

00:04:10.961 --> 00:04:13.596
現在關鍵的是，

00:04:13.596 --> 00:04:18.598
我們從很多講中文的人士中
收集大量的資訊

00:04:18.598 --> 00:04:21.128
然後產生文字轉化語言的系統

00:04:21.128 --> 00:04:25.801
將中文文字轉化成中文語言，

00:04:25.801 --> 00:04:29.929
然後錄一個小時我自己的聲音

00:04:29.929 --> 00:04:31.820
我們使用它去調變

00:04:31.820 --> 00:04:36.364
使標準文字轉化語音系統的聲音
聽起來像我的聲音。

00:04:36.364 --> 00:04:38.904
再一次，雖然結果沒有很完美，

00:04:38.904 --> 00:04:41.552
裡面還有一些錯誤。

00:04:41.552 --> 00:04:44.036
（中文）

00:04:44.036 --> 00:04:47.403
（掌聲）

00:04:49.446 --> 00:04:53.022
在這個領域還有很多工作要做。

00:04:53.022 --> 00:04:56.667
（中文）

00:04:56.667 --> 00:05:00.100
（掌聲）

NOTE Paragraph

00:05:01.345 --> 00:05:04.744
傑里米·霍華德：那是在中國舉行的
機器學習研討會。

00:05:04.744 --> 00:05:07.114
那不常有，事實上，
在學術會議上

00:05:07.114 --> 00:05:09.011
聽到熱烈的掌聲，

00:05:09.011 --> 00:05:12.687
雖然有些時候 
TEDx 講座不拘泥形式。

00:05:12.687 --> 00:05:15.482
你所看到的都是出於深度學習

00:05:15.482 --> 00:05:17.007
（掌聲）謝謝。

00:05:17.007 --> 00:05:19.289
英文文字翻譯由深度學習完成的。

00:05:19.289 --> 00:05:22.701
翻譯成中文和右上角的文稿
也是出於深度學習，

00:05:22.701 --> 00:05:26.008
連創建聲音也都是深度學習。

NOTE Paragraph

00:05:26.008 --> 00:05:29.242
深度學習是如此的神奇。

00:05:29.242 --> 00:05:32.341
它是個單一的演算法
似乎可以完成任何事情，

00:05:32.341 --> 00:05:35.452
我一年前還發現它可以學會看

00:05:35.452 --> 00:05:37.628
這個德國遊戲的比賽

00:05:37.628 --> 00:05:40.225
叫德國交通標誌確認基準，

00:05:40.225 --> 00:05:43.618
深度學習能認出這個交通標誌。

00:05:43.618 --> 00:05:45.712
它不只確認交通標誌的能力

00:05:45.712 --> 00:05:47.470
比其他的演算法好，

00:05:47.470 --> 00:05:50.189
在排行榜上更顯示它做得比人類好，

00:05:50.189 --> 00:05:52.041
正確性是人類的兩倍。

00:05:52.041 --> 00:05:54.037
2011 以前，我們有了第一個例子

00:05:54.037 --> 00:05:57.442
視力高於人類的電腦。

00:05:57.442 --> 00:05:59.491
從那時開始，許多電腦也可以做到。

00:05:59.491 --> 00:06:03.005
2012 年谷歌宣佈
使用深度學習演算法

00:06:03.005 --> 00:06:04.420
來監看 Youtube 影片

00:06:04.420 --> 00:06:07.857
收集一個月 1,600 台電電腦的資料，

00:06:07.857 --> 00:06:12.218
電腦獨立識別
人或貓的概念

00:06:12.218 --> 00:06:14.027
僅透過觀看影片。


00:06:14.027 --> 00:06:16.379
這樣更像人類的學習方式。

00:06:16.379 --> 00:06:19.119
人類並非通過別人的指示來學習，

00:06:19.119 --> 00:06:22.450
而是從自己搞懂事情來學習。

00:06:22.450 --> 00:06:25.819
在 2012 年傑佛里·辛頓
我們之前看到的人，

00:06:25.819 --> 00:06:28.677
贏了很有名的映像網路比賽，

00:06:28.677 --> 00:06:32.818
嘗試從 150 萬的圖像中找出

00:06:32.818 --> 00:06:34.256
想要的圖像。

00:06:34.256 --> 00:06:37.789
2014 年, 我們現在
圖像辨識的錯誤率

00:06:37.789 --> 00:06:39.242
降到 6％ 以下。

00:06:39.242 --> 00:06:41.268
這再次證明它比人類優秀。

NOTE Paragraph

00:06:41.268 --> 00:06:45.037
可見機器
真可以做到如此非凡的成就，

00:06:45.037 --> 00:06:47.306
它現在已經用在產業上了。

00:06:47.306 --> 00:06:50.348
比如說，谷歌去年宣佈

00:06:50.348 --> 00:06:54.933
他們可以在兩小時内把
法國每一個位置繪成地圖，

00:06:54.933 --> 00:06:58.380
他們用的方式是
把街景圖像

00:06:58.380 --> 00:07:02.699
輸入深度學習演算法
來辨認和讀取街道號碼。

00:07:02.699 --> 00:07:04.919
想想我們以前需要花多少時間？

00:07:04.919 --> 00:07:08.274
至少好幾十人加上好幾年呢。

00:07:08.274 --> 00:07:10.185
同樣的情況也發生在中國。

00:07:10.185 --> 00:07:14.221
我想「百度」類似中國的谷歌，

00:07:14.221 --> 00:07:16.504
在左上角你會看見

00:07:16.504 --> 00:07:20.478
一張我上傳到
百度深度學習系統的圖片，

00:07:20.478 --> 00:07:24.247
下方你可以看到
系統可以理解這張圖片

00:07:24.247 --> 00:07:26.483
而且能找到相似的圖像。

00:07:26.483 --> 00:07:29.219
類似的圖像
也就是有相似的背景，

00:07:29.219 --> 00:07:30.877
相似面孔的角度，

00:07:30.877 --> 00:07:32.665
有的圖像甚至有伸出舌頭。

00:07:32.665 --> 00:07:35.695
這個網頁的文字看不大清楚，

00:07:35.695 --> 00:07:37.107
因為我上傳的都是圖像。

00:07:37.107 --> 00:07:41.128
這顯示了電腦能明白他們所看到的

00:07:41.128 --> 00:07:42.752
電腦能夠搜尋資料庫

00:07:42.752 --> 00:07:46.306
以即時的方式從億萬張圖片中搜尋。

NOTE Paragraph

00:07:46.306 --> 00:07:49.536
現在的電腦能夠去看
是表示什麼意思呢？

00:07:49.536 --> 00:07:51.553
其實電腦不只能看見。

00:07:51.553 --> 00:07:53.622
事實上深度學習可以做得更多。

00:07:53.622 --> 00:07:56.570
像這個樣複雜，僅有小小差別的句子

00:07:56.570 --> 00:07:59.394
現在的深度學習演算法能夠理解。

00:07:59.394 --> 00:08:00.697
你可以看到，

00:08:00.697 --> 00:08:03.465
這以史丹福為基礎的系統
顯示上面的紅點

00:08:03.465 --> 00:08:07.384
指這句子是在表達負面的情緒。

00:08:07.384 --> 00:08:10.790
深度學習現在已經接近人類的行為

00:08:10.802 --> 00:08:15.923
能理解句子是要表達什麼。

00:08:15.923 --> 00:08:18.651
同時，深度學習也能用以閱讀中文，

00:08:18.651 --> 00:08:21.807
程度相當於以中文為母語的水平。

00:08:21.807 --> 00:08:23.975
這演算法發展於瑞士

00:08:23.975 --> 00:08:27.331
沒有一個會說中文的團隊。

00:08:27.331 --> 00:08:29.382
像我說的，深度學習

00:08:29.382 --> 00:08:31.601
是一個最好的系統
對完成這任務來說，

00:08:31.601 --> 00:08:36.718
甚至比人類還要好。

NOTE Paragraph

00:08:36.718 --> 00:08:39.682
這個系統是我公司建立的

00:08:39.682 --> 00:08:41.728
要把這些東西都集中在一起。

00:08:41.728 --> 00:08:44.189
這是一些沒有文字描述的圖片，

00:08:44.189 --> 00:08:46.541
我在這裡輸入句子，

00:08:46.541 --> 00:08:49.510
它在同步理解這些照片

00:08:49.510 --> 00:08:51.189
找出它們是有關什麼的照片

00:08:51.189 --> 00:08:54.352
也找出跟我句子相關類似的圖片。

00:08:54.352 --> 00:08:57.108
所以你看，
它真的能理解我的句子。

00:08:57.108 --> 00:08:59.332
也完全的理解這些圖片。

00:08:59.332 --> 00:09:01.891
你在谷歌上也看過類似的，

00:09:01.891 --> 00:09:04.666
你可以輸入文字
而它會顯示圖片，

00:09:04.666 --> 00:09:08.090
但事實上，它在尋索網頁上的文字。

00:09:08.090 --> 00:09:11.091
這跟理解圖片有很大的不同。

00:09:11.091 --> 00:09:13.843
理解圖片只有電腦可以做

00:09:13.843 --> 00:09:17.091
電腦在過去幾個月才會做的事。

NOTE Paragraph

00:09:17.091 --> 00:09:21.182
電腦不單能看見
也能閱讀，

00:09:21.182 --> 00:09:24.947
而且我們顯示了電腦能理解所聽到的。

00:09:24.947 --> 00:09:28.389
或許不意外地，
我要告訴你們電腦也能書寫。

00:09:28.389 --> 00:09:33.172
這是我昨天用深度學習演算法
所產生的文字。

00:09:33.172 --> 00:09:37.096
這裡有一些非史丹佛演算法
所產生的文字。

00:09:37.096 --> 00:09:38.860
這些句子的產生

00:09:38.860 --> 00:09:43.109
是透過深度學習演算法
對圖片進行描述。

00:09:43.109 --> 00:09:47.581
這演算法是電腦從來沒有看見過
一個穿黑襯衫的男子彈吉他。

00:09:47.581 --> 00:09:49.801
電腦見過男人，
看過黑色，

00:09:49.801 --> 00:09:51.400
見過吉他，

00:09:51.400 --> 00:09:55.694
它自己便對圖片做出描述。

00:09:55.694 --> 00:09:59.196
雖然還沒有超越人類，
不過很接近了。

00:09:59.196 --> 00:10:03.264
依據統計，人們較喜歡
電腦的圖片說明

00:10:03.264 --> 00:10:04.791
有四分之一的人會做這樣的選擇。

00:10:04.791 --> 00:10:06.855
這系統在兩個星期前開發完成，

00:10:06.855 --> 00:10:08.701
估計在明年，

00:10:08.701 --> 00:10:11.502
電腦演算法將會超越人類

00:10:11.502 --> 00:10:13.364
如果依照這樣的速度發展下的話。

00:10:13.364 --> 00:10:16.413
到時候電腦也會書寫了。

NOTE Paragraph

00:10:16.413 --> 00:10:19.888
我們把這些都放在一起，
讓它來引導到一個令人振奮的時機。

00:10:19.888 --> 00:10:21.380
像在藥物方面，

00:10:21.380 --> 00:10:23.905
一個波士頓的團隊
宣佈他們發現了

00:10:23.905 --> 00:10:26.854
數十種腫瘤的臨床特徵

00:10:26.854 --> 00:10:31.120
幫助醫生預測癌症。

00:10:32.220 --> 00:10:34.516
同樣的，在史丹佛，

00:10:34.516 --> 00:10:38.179
一個組織宣佈
在放大鏡下觀察組織，

00:10:38.179 --> 00:10:40.560
他們開發
一個以機器學習為基礎的系統

00:10:40.560 --> 00:10:43.142
比人類病理學家更有效地

00:10:43.142 --> 00:10:47.519
預測癌症病患的生存率。

00:10:47.519 --> 00:10:50.764
這些例子，
不但能更準確地預測，

00:10:50.764 --> 00:10:53.266
而且也能帶來更多科技上的洞見。

00:10:53.276 --> 00:10:54.781
在放射學的個案中，

00:10:54.781 --> 00:10:57.876
他們是人類所能理解的新臨床指標。

00:10:57.876 --> 00:10:59.668
在這病理學個案，

00:10:59.668 --> 00:11:04.168
電腦系統發現癌症周圍的細胞

00:11:04.168 --> 00:11:07.508
在診斷的時候

00:11:07.508 --> 00:11:09.260
是跟癌細胞一樣重要。

00:11:09.260 --> 00:11:14.621
這跟病理學家
10 年來的說法相反。

00:11:14.621 --> 00:11:17.913
在這兩個個案，
系統的開發人員

00:11:17.913 --> 00:11:21.534
是由醫學專家
和機器學習專家所組成，

00:11:21.534 --> 00:11:24.275
但自去年開始，
我們也超越了這些。

00:11:24.275 --> 00:11:27.824
這是確認癌症範圍的例子

00:11:27.824 --> 00:11:30.354
是在顯微鏡下的人類組織。

00:11:30.354 --> 00:11:34.967
系統顯示可以更準確地確認範圍，

00:11:34.967 --> 00:11:37.742
如病理學家般準確，

00:11:37.742 --> 00:11:41.134
不過沒有藥物專家
來建構整套深度學習系統

00:11:41.134 --> 00:11:43.660
系統是由一些
沒有專業背景的人完成。

00:11:44.730 --> 00:11:47.285
同樣地，從是細胞分裂。

00:11:47.285 --> 00:11:50.953
我們的系統可以像人類般
精確地分裂神經細胞，

00:11:50.953 --> 00:11:53.670
不過開發這套深度學習系統

00:11:53.670 --> 00:11:56.921
沒有一個人來自醫學背景。

NOTE Paragraph

00:11:56.921 --> 00:12:00.148
就是我和一些沒有醫學背景的人，

00:12:00.148 --> 00:12:03.875
看來我頗有資格開一家醫藥公司。

00:12:03.875 --> 00:12:06.021
我確實這麼做了。

00:12:06.021 --> 00:12:07.761
我是以戒慎恐懼的心情開始做，

00:12:07.761 --> 00:12:10.650
不過理論顯示
這是可行的

00:12:10.650 --> 00:12:16.142
用這些資料分析技術來
製作有效的藥物。

00:12:16.142 --> 00:12:18.622
感恩的是
回應也挺不錯，

00:12:18.622 --> 00:12:20.978
這回應不只是來自媒體，
而且還有醫藥社群，

00:12:20.978 --> 00:12:23.322
他們都很支持。

00:12:23.322 --> 00:12:27.471
理論上我們能在醫務過程中

00:12:27.471 --> 00:12:30.364
盡量轉換成資料分析，

00:12:30.364 --> 00:12:33.429
讓醫生去做他們擅長的。

00:12:33.429 --> 00:12:35.031
我舉一個例子。

00:12:35.031 --> 00:12:39.975
我們現在花 15 分鐘
來創造一項新的醫學診斷測試

00:12:39.975 --> 00:12:41.929
我會讓你同步看到過程，

00:12:41.929 --> 00:12:45.416
不過我已刪除部分資料
壓縮成三分鐘。

00:12:45.416 --> 00:12:48.477
我不會向你們展示
創造出來的醫學診斷測試，

00:12:48.477 --> 00:12:51.846
我要向你們展示
一項汽車圖片的診斷測試，

00:12:51.846 --> 00:12:54.068
因為這個我們都能理解。

NOTE Paragraph

00:12:54.068 --> 00:12:57.269
我們從 150 萬張
的汽車圖片開始，

00:12:57.269 --> 00:13:00.475
我希望創造一些東西
把圖片分類

00:13:00.475 --> 00:13:02.698
而且依圖片拍攝的角度來分類。

00:13:02.698 --> 00:13:06.586
這些圖片完全沒有標題，
我必需從零開始。

00:13:06.586 --> 00:13:08.451
深度學習演算法，

00:13:08.451 --> 00:13:12.158
它能自動確認
這些圖片的結構。

00:13:12.158 --> 00:13:15.778
美好的是
人和電腦可以合作

00:13:15.778 --> 00:13:17.956
看看這裡，這個人，

00:13:17.956 --> 00:13:20.631
正在告訴電腦
關於感興趣的範圍

00:13:20.631 --> 00:13:25.281
而電腦會嘗試用它
來改善電腦的演算法。

00:13:25.281 --> 00:13:29.577
這些深度學習系統
有 16,000 個立體空間，

00:13:29.577 --> 00:13:33.009
你可以看見電腦
讓他們在這空間旋轉，

00:13:33.009 --> 00:13:35.001
嘗試找出新的區域結構。

00:13:35.001 --> 00:13:36.782
當它成功時，

00:13:36.782 --> 00:13:40.786
在開車的人能夠
指出有興趣的地方。

00:13:40.786 --> 00:13:43.208
這裡，電腦成功的找到了那地區，

00:13:43.208 --> 00:13:45.770
再舉例，角度，

00:13:45.770 --> 00:13:47.376
通過這個過程，

00:13:47.376 --> 00:13:49.716
我們漸漸地告訴電腦更多

00:13:49.716 --> 00:13:52.144
關於我們在找的結構類型。

00:13:52.144 --> 00:13:53.916
你可以想像一個診斷測試

00:13:53.916 --> 00:13:57.266
像是一個病理學家辨認
病症的範圍，

00:13:57.266 --> 00:14:02.292
或是放射治療師界定
潛在的腫瘤。

00:14:02.292 --> 00:14:04.851
有些時候對演算法來說
是有些困難。

00:14:04.851 --> 00:14:06.815
在我們這個例子，它會出現混亂。

00:14:06.815 --> 00:14:09.365
汽車的正面和背面
都混淆不清了。

00:14:09.365 --> 00:14:11.437
我們需要更小心，

00:14:11.437 --> 00:14:14.669
手動選出正面
跟背面有相反效果的文字，

00:14:14.669 --> 00:14:20.175
然後告知電腦
這是一種

00:14:20.175 --> 00:14:21.523
我們有興趣的一類。

NOTE Paragraph

00:14:21.523 --> 00:14:24.200
這要花了一些時間來做，
所以我們跳過，

00:14:24.200 --> 00:14:26.446
然後我們訓練
機器學習演算法

00:14:26.446 --> 00:14:28.420
以好幾百張圖片去訓練它，

00:14:28.420 --> 00:14:30.445
我們希望它會做得更好。

00:14:30.445 --> 00:14:33.518
你可以看見，它開始
刪除一些圖片，

00:14:33.518 --> 00:14:38.226
顯示它已經知道
可以自己理解這些圖片。

00:14:38.226 --> 00:14:41.128
我們運用相似圖片的概念，

00:14:41.128 --> 00:14:43.222
用類似的圖片，你可以看到，

00:14:43.222 --> 00:14:47.241
電腦現在可以
完全找到正面的汽車。

00:14:47.241 --> 00:14:50.189
這時，
人類可以告訴電腦，

00:14:50.189 --> 00:14:52.482
對，你做的很好。

NOTE Paragraph

00:14:53.652 --> 00:14:55.837
當然，有些時候，即使在這個階段

00:14:55.837 --> 00:14:59.511
分組仍然是困難的。

00:14:59.511 --> 00:15:03.395
在這情況，儘管我們讓
電腦嘗試旋轉圖片一陣子，

00:15:03.399 --> 00:15:06.744
我們還是發現左邊
和右邊的圖片

00:15:06.744 --> 00:15:08.222
是混淆在一起的。

00:15:08.222 --> 00:15:10.362
於是我們再次
給電腦一些提示，

00:15:10.362 --> 00:15:13.338
像是嘗試去發現一個計畫可以

00:15:13.338 --> 00:15:15.945
儘量區分出左邊和右邊的圖片

00:15:15.945 --> 00:15:18.067
是透過使用深度學習演算法。

00:15:18.067 --> 00:15:21.009
給予提示後，
好，它已經完成了。

00:15:21.009 --> 00:15:23.891
它找到一個方法
想像這些目標

00:15:23.891 --> 00:15:26.271
來分別這些分類。

NOTE Paragraph

00:15:26.271 --> 00:15:28.709
你現在知道了。

00:15:28.709 --> 00:15:36.906
這並不是電腦取代人類，

00:15:36.906 --> 00:15:39.546
而是兩者一起合作。

00:15:39.546 --> 00:15:43.096
我們在做的事情是
在過去需要

00:15:43.096 --> 00:15:45.098
5 或 6 個人
花 7 年時間完成的事情

00:15:45.098 --> 00:15:47.703
現在只需一個人

00:15:47.703 --> 00:15:50.208
15 分鐘來完成。

NOTE Paragraph

00:15:50.208 --> 00:15:54.158
這個過程需要重覆 4 或 5 次。

00:15:54.158 --> 00:15:56.017
你現在可以看到

00:15:56.017 --> 00:15:58.976
我們在 150 萬的圖片中
有 62％ 是正確分類。

00:15:58.976 --> 00:16:01.448
現在，可見我們可以迅速地

00:16:01.448 --> 00:16:02.745
掌握整個大部分資料，

00:16:02.745 --> 00:16:05.664
再檢查以確定沒有錯誤。

00:16:05.664 --> 00:16:09.616
有錯誤，我們可以
讓電腦知道錯誤的地方。

00:16:09.616 --> 00:16:12.661
每一個不同的分類
我們都使用這種程序來做，

00:16:12.661 --> 00:16:15.148
我們現在
在分辨 150 萬張的圖片時

00:16:15.148 --> 00:16:17.563
有超過 80％ 的成功率，

00:16:17.563 --> 00:16:19.641
現在，在這個案例

00:16:19.641 --> 00:16:23.220
找到少數幾個不正確的分類，

00:16:23.220 --> 00:16:26.108
讓電腦了解原因。

00:16:26.108 --> 00:16:27.851
用這種方法，

00:16:27.851 --> 00:16:31.972
15 分鐘就有 97％ 的分辨率。

NOTE Paragraph

00:16:31.972 --> 00:16:36.572
這種技術可以幫助
解決一個重要的問題，

00:16:36.578 --> 00:16:39.614
醫療專家不足的問題。

00:16:39.614 --> 00:16:43.103
世界經濟論壇表示

00:16:43.103 --> 00:16:45.727
在發展中國家，內科醫生
有 10 倍到 20 倍的短缺。

00:16:45.727 --> 00:16:47.840
這要三百年的時間

00:16:47.840 --> 00:16:50.734
才能訓練足夠的人
來處理這個問題。

00:16:50.734 --> 00:16:53.619
想像一下，
我們是否可以幫助提高效率

00:16:53.619 --> 00:16:56.458
是使用深度學習這個方法來提升？

NOTE Paragraph

00:16:56.458 --> 00:16:58.690
我對這個機會感到很興奮。

00:16:58.690 --> 00:17:01.279
我也關注這些問題。

00:17:01.279 --> 00:17:04.403
問題是在這地圖上每個藍色的地方

00:17:04.403 --> 00:17:08.172
那裡都有 80％ 的服務人員。

00:17:08.172 --> 00:17:09.959
什麼是服務？

00:17:09.959 --> 00:17:11.473
這些就是服務。

00:17:11.473 --> 00:17:15.627
電腦剛學會如何去做是確實的事。

00:17:15.627 --> 00:17:19.431
發展中國家 80％ 的僱員工作

00:17:19.431 --> 00:17:21.963
電腦已開始學習如何做。

00:17:21.963 --> 00:17:23.403
這意味什麼？

00:17:23.403 --> 00:17:25.986
那可好。
他們將會被其他的職業取代。

00:17:25.986 --> 00:17:28.693
舉例：需要更多科學家來工作。

00:17:28.693 --> 00:17:29.510
不過，這不完全正確。

00:17:29.510 --> 00:17:32.628
數據科學家
不需要花很久的時間去做這些事情。

00:17:32.628 --> 00:17:35.880
例如，這四個演算法是同一個人設計的。

00:17:35.880 --> 00:17:38.318
若你認為這些
以前都發生過，

00:17:38.318 --> 00:17:42.126
過去我們看過
新事物出現的結果

00:17:42.126 --> 00:17:44.378
他們被新的職務所取替，

00:17:44.378 --> 00:17:46.494
那些新的職業會是什麼呢？

00:17:46.494 --> 00:17:48.365
我們很難去判斷，

00:17:48.365 --> 00:17:51.104
因為人類的能力
以這個速度逐漸成長，

00:17:51.104 --> 00:17:53.666
我們現在有了深度學習系統，

00:17:53.666 --> 00:17:56.893
我們知道
以指數的方式增長。

00:17:56.893 --> 00:17:58.498
我們在這裡。

00:17:58.498 --> 00:18:00.559
最近，我們看周圍的事物

00:18:00.559 --> 00:18:03.235
會說：電腦還是很笨，不是嗎？

00:18:03.235 --> 00:18:06.664
但是在五年內，
電腦將會超越這張圖表。

00:18:06.664 --> 00:18:10.529
我們需要開始思考這個能力。

NOTE Paragraph

00:18:10.529 --> 00:18:12.579
當然，我們曾經看過這個。

00:18:12.579 --> 00:18:13.966
在工業革命時期，

00:18:13.966 --> 00:18:16.817
發動機讓生產力往前跨一大步。

00:18:17.667 --> 00:18:20.805
雖然，一段時間之後，
事情轉為平靜。

00:18:20.805 --> 00:18:22.507
那時社會混亂，

00:18:22.507 --> 00:18:25.946
發動機被普遍使用
產生動力，


00:18:25.946 --> 00:18:28.300
事情就能真正得到解決。

00:18:28.300 --> 00:18:29.773
機器學習革命

00:18:29.773 --> 00:18:32.682
與工業革命大不相同，

00:18:32.682 --> 00:18:35.632
因為機器學習革命，
永遠不會停下來。

00:18:35.632 --> 00:18:38.614
電腦更具智力活動，

00:18:38.614 --> 00:18:42.862
他們能製造更好的電腦
去運作更好的智能活動，

00:18:42.862 --> 00:18:44.770
這是一種改變

00:18:44.770 --> 00:18:47.248
從未經歷過的改變，

00:18:47.248 --> 00:18:50.554
你之前的理解的可能性是不同的。

NOTE Paragraph

00:18:50.974 --> 00:18:52.754
這已經影響我們。

00:18:52.754 --> 00:18:56.384
過去 25 年，
資本生產力一直在增長，

00:18:56.400 --> 00:19:00.588
勞動生產力已經放緩，
事實上已有一點點下降。

NOTE Paragraph

00:19:01.408 --> 00:19:04.149
我想我們開始討論這個議題。

00:19:04.149 --> 00:19:07.176
我知道當我告訴別人這種情況時，

00:19:07.176 --> 00:19:08.666
人們可以不以為然。

00:19:08.666 --> 00:19:10.339
電腦不會思考，

00:19:10.339 --> 00:19:13.367
它們沒有感情，
也不了解詩，

00:19:13.367 --> 00:19:15.888
我們不真正理解它們怎麼運作。

00:19:15.888 --> 00:19:17.374
可是，哪又如何？

00:19:17.374 --> 00:19:19.178
電腦現在可以作

00:19:19.178 --> 00:19:21.897
人們花大部分時間
得到報酬所做的事情，

00:19:21.897 --> 00:19:23.628
所以我們該是思考的時候

00:19:23.628 --> 00:19:28.015
我們如何調整我們的社會和經濟結構

00:19:28.015 --> 00:19:29.855
請關注這些新的改變。

00:19:29.855 --> 00:19:31.388
謝謝

00:19:31.388 --> 00:19:32.190
（掌聲）