WEBVTT

00:00:00.880 --> 00:00:04.893
これまではコンピューターに
何かさせようと思ったら

00:00:04.893 --> 00:00:06.447
プログラムを書く
必要がありました

00:00:06.447 --> 00:00:09.858
プログラミングはやったことが
ないかもしれませんが

00:00:09.858 --> 00:00:13.360
やりたいことを
実現するために

00:00:13.360 --> 00:00:16.727
コンピューターが
行うべきことを

00:00:16.727 --> 00:00:19.089
事細かに指定してやる
必要があります

00:00:19.089 --> 00:00:22.585
だから実現したいことの
具体的なやり方を知らずに

00:00:22.585 --> 00:00:24.648
プログラムを書くというのは
難しい話です

NOTE Paragraph

00:00:24.648 --> 00:00:28.131
それがこの写真の人物
アーサー・サミュエルが直面した問題でした

00:00:28.131 --> 00:00:32.208
1956年のこと 彼はチェッカーで
自分に勝てるプログラムを

00:00:32.208 --> 00:00:34.548
作りたいと思いました

00:00:34.548 --> 00:00:36.588
しかしどうしたら
自分より上手く

00:00:36.588 --> 00:00:40.394
チェッカーを指す手順を
詳細に記述することができるでしょう？

00:00:40.394 --> 00:00:42.116
彼は良い方法を
思いつきました

00:00:42.116 --> 00:00:45.840
コンピュータ自身を相手に
何千回も

00:00:45.840 --> 00:00:48.364
チェッカーの対局をさせて
自分で学ばせるんです

00:00:48.364 --> 00:00:51.544
これはうまくいきました
そのプログラムは実際

00:00:51.544 --> 00:00:55.561
1962年に コネチカット州チャンピオンを
破ることができました

NOTE Paragraph

00:00:55.561 --> 00:00:58.534
だからアーサー・サミュエルは
機械学習の父とも言え

00:00:58.534 --> 00:01:00.251
私自身 彼に
多くを負っています

00:01:00.251 --> 00:01:03.014
というのも私は機械学習の応用を
生業としているからです

00:01:03.014 --> 00:01:04.479
私が代表を務めていた

00:01:04.479 --> 00:01:07.867
Keggleには20万人以上の
機械学習専門家が属しています

00:01:07.867 --> 00:01:09.925
Keggleでは

00:01:09.925 --> 00:01:13.633
かつて解かれたことのない課題を使って
競技会を開催していて

00:01:13.633 --> 00:01:17.470
何百回となく
成功を収めています

00:01:17.470 --> 00:01:19.940
そのような立場から
機械学習には かつて何ができ

00:01:19.940 --> 00:01:23.890
今何ができて
将来何ができるようになるか

00:01:23.890 --> 00:01:26.252
多くのことを
学ぶことができました

00:01:26.252 --> 00:01:30.675
機械学習が商業的に大きな成功を収めた
最初の例は Googleかもしれません

00:01:30.675 --> 00:01:33.784
Googleは
機械学習を使った

00:01:33.784 --> 00:01:35.536
アルゴリズムによって

00:01:35.536 --> 00:01:38.437
情報を見つけられることを
示しました

00:01:38.437 --> 00:01:42.323
それ以来 機械学習の商業的な成功事例が
たくさん生まれています

00:01:42.323 --> 00:01:44.160
AmazonやNetflixのような企業は

00:01:44.160 --> 00:01:47.876
機械学習を使って
ユーザーが買いたいであろう商品や

00:01:47.876 --> 00:01:49.896
見たいであろう映画を
提示していて

00:01:49.896 --> 00:01:51.703
その精度は
時に不気味なくらいです

00:01:51.703 --> 00:01:53.657
LinkedInやFacebookは

00:01:53.657 --> 00:01:56.251
知り合いかもしれない人を示唆し
なぜ分かったのか

00:01:56.251 --> 00:01:58.228
当人には
見当も付きませんが

00:01:58.228 --> 00:02:01.195
これも機械学習の力を
使っているのです

00:02:01.195 --> 00:02:04.152
手順が事細かに
プログラミングされているのではなく

00:02:04.152 --> 00:02:07.399
どうすべきかをデータから学習する
アルゴリズムが使われています

NOTE Paragraph

00:02:07.399 --> 00:02:09.877
IBMのワトソンが
ジェパディの世界チャンピオン

00:02:09.877 --> 00:02:13.739
２人を破ったのも
そのような方法によってで

00:02:13.739 --> 00:02:16.964
ご覧のような複雑な問いに
答えることができました

00:02:16.964 --> 00:02:19.799
[2003年にこの町の国立博物館から古代の
“ニムルドの獅子” が (その他多くの品とともに) 消えた]

00:02:19.799 --> 00:02:23.034
自動運転車が実現可能になったのも
機械学習のお陰です

00:02:23.034 --> 00:02:25.856
たとえば木と歩行者を
見分けるといったことが

00:02:25.856 --> 00:02:28.488
できる必要があります

00:02:28.488 --> 00:02:31.075
そのようなことの具体的な手順が
どうすれば書けるのか

00:02:31.075 --> 00:02:34.072
分かりませんが
機械学習で可能になったのです

00:02:34.072 --> 00:02:36.680
事実この車は
事故を起こすこともなく

00:02:36.680 --> 00:02:40.186
普通の公道を
何百万キロも走行しています

NOTE Paragraph

00:02:40.196 --> 00:02:44.110
コンピューターは
単に学べるだけでなく

00:02:44.110 --> 00:02:46.010
どうしたらできるのか

00:02:46.010 --> 00:02:48.848
分からないようなことも
学ぶことができ

00:02:48.848 --> 00:02:51.733
人間よりも上手くなることも
あり得るのです

00:02:51.733 --> 00:02:55.928
機械学習で最も目覚ましい
事例の１つは

00:02:55.928 --> 00:02:58.320
私がKeggleで主催した
プロジェクトで

00:02:58.320 --> 00:03:01.911
ジェフリー・ヒントン率いる

00:03:01.911 --> 00:03:03.463
トロント大のチームが

00:03:03.463 --> 00:03:06.140
薬を発見する競技に
優勝した時です

00:03:06.140 --> 00:03:08.987
これがすごいのは
医薬大手のメルク社や

00:03:08.987 --> 00:03:13.000
この分野の専門家チームの
開発したアルゴリズムを破った彼らのチームに

00:03:13.000 --> 00:03:18.061
化学や生物学やライフサイエンスを
ちゃんと学んだ経験のある人が誰もいなかったことで

00:03:18.061 --> 00:03:20.230
しかも たった２週間で
やってのけたのです

00:03:20.230 --> 00:03:21.611
どうして可能だったのか？

00:03:22.421 --> 00:03:25.342
ディープ・ラーニングと呼ばれる
アルゴリズムを使ったのです

00:03:25.342 --> 00:03:28.291
ことの重大さは 数週間後に
ニューヨークタイムズ紙の

00:03:28.291 --> 00:03:31.412
一面で取り上げられたことでも
分かると思います

00:03:31.412 --> 00:03:34.147
画面の左に出ているのが
ジェフリー・ヒントンです

00:03:34.147 --> 00:03:38.488
ディープ・ラーニングというのは
人の脳の仕組みを参考にしたアルゴリズムで

00:03:38.488 --> 00:03:40.300
何が可能かについて

00:03:40.300 --> 00:03:44.141
理論的には限界がありません

00:03:44.141 --> 00:03:46.964
より多くのデータと
処理時間を使うほど

00:03:46.964 --> 00:03:48.276
より良い結果が得られます

NOTE Paragraph

00:03:48.276 --> 00:03:50.615
ニューヨークタイムズは
その記事でもう１つ

00:03:50.615 --> 00:03:52.857
ディープ・ラーニングのすごい事例を
取り上げています

00:03:52.857 --> 00:03:55.569
それをこれからお見せしましょう

00:03:55.569 --> 00:04:00.510
コンピューターが人の話を聞いて
理解できることを示すものです

NOTE Paragraph

00:04:00.510 --> 00:04:03.221
(ビデオ) このプロセスの
最後に加えたいステップは

00:04:03.221 --> 00:04:06.246
実際に中国語で

00:04:06.246 --> 00:04:10.961
話させるということです

00:04:10.961 --> 00:04:13.596
ここで鍵になるのは

00:04:13.596 --> 00:04:18.598
中国語話者から得た
膨大な情報を使って

00:04:18.598 --> 00:04:21.128
中国語のテキストを
音声に変える

00:04:21.128 --> 00:04:25.801
音声合成システムを作り

00:04:25.801 --> 00:04:29.929
１時間ほどの
私自身の声のデータを使って

00:04:29.929 --> 00:04:31.820
そのシステムを調整し

00:04:31.820 --> 00:04:36.364
まるで私が話しているかのようにする
ということです

00:04:36.364 --> 00:04:38.904
まだ完璧なものではありません

00:04:38.904 --> 00:04:41.552
たくさんミスをします

00:04:41.552 --> 00:04:44.036
(音声合成された中国語訳)

00:04:44.036 --> 00:04:47.403
(拍手)

00:04:49.446 --> 00:04:53.022
この領域で為されるべきことは
まだたくさんあります

00:04:53.022 --> 00:04:56.667
(音声合成された中国語訳)

00:04:56.667 --> 00:05:00.100
(拍手)

NOTE Paragraph

00:05:01.345 --> 00:05:04.744
これは中国で行われた
カンファレンスでのものですが

00:05:04.744 --> 00:05:07.114
学会で拍手が
沸き起こるというのは

00:05:07.114 --> 00:05:09.011
あまりないことです

00:05:09.011 --> 00:05:12.687
もっともTEDxは
もっと自由な雰囲気がありますが

00:05:12.687 --> 00:05:15.482
ご覧いただいたものはみんな
ディープ・ラーニングで実現されました

00:05:15.482 --> 00:05:17.007
(拍手) どうも

00:05:17.007 --> 00:05:19.289
英語の文字起こしも
ディープ・ラーニングだし

00:05:19.289 --> 00:05:22.701
右上の中国語に翻訳されたテキストも
ディープ・ラーニングによるもので

00:05:22.701 --> 00:05:26.008
音声の合成にも
ディープ・ラーニングが使われています

NOTE Paragraph

00:05:26.008 --> 00:05:29.242
ディープ・ラーニングは
このようにすごいものです

00:05:29.242 --> 00:05:32.341
単一のアルゴリズムで
ほとんど何でもできるように見えます

00:05:32.341 --> 00:05:35.452
この１年前にディープ・ラーニングが
「見る」こともできると知りました

00:05:35.452 --> 00:05:40.218
ドイツ道路標識認識ベンチマーク
という奇妙な競技会で

00:05:40.225 --> 00:05:43.618
このような道路標識をディープ・ラーニングで
識別できることが示されました

00:05:43.618 --> 00:05:45.712
他のアルゴリズムよりも

00:05:45.712 --> 00:05:47.470
上手く識別できた
というだけでなく

00:05:47.470 --> 00:05:50.189
このスコアボードにある通り
２位の人間より

00:05:50.189 --> 00:05:52.041
２倍高い精度で
識別できたんです

00:05:52.041 --> 00:05:54.037
2011年には
コンピューターが人よりも

00:05:54.037 --> 00:05:57.442
良く見ることができる事例が
生まれたわけです

00:05:57.442 --> 00:05:59.491
それ以来いろんなことが
起きています

00:05:59.491 --> 00:06:03.005
2012年にGoogleが発表したんですが
ディープ・ラーニング・アルゴリズムが

00:06:03.005 --> 00:06:04.420
YouTubeビデオを見て

00:06:04.420 --> 00:06:07.857
１万６千台のコンピュータで
１ヶ月 データ処理した結果

00:06:07.857 --> 00:06:12.218
コンピューターが「人」や
「猫」といった概念を

00:06:12.218 --> 00:06:14.027
自分で学んだということです

00:06:14.027 --> 00:06:16.379
これは人が学習する方法に
近いものです

00:06:16.379 --> 00:06:19.119
人は見たものを
教えられて学ぶよりは

00:06:19.119 --> 00:06:22.450
むしろそれが何なのか
自分で学んでいくものです

00:06:22.450 --> 00:06:25.819
2012年にはまた
先ほど名前の出たジェフリー・ヒントンが

00:06:25.819 --> 00:06:28.677
有名なImageNet競技会で
優勝しましたが

00:06:28.677 --> 00:06:32.818
これは150万の画像を
何の写真か

00:06:32.818 --> 00:06:34.256
判別するというものです

00:06:34.256 --> 00:06:37.789
2014年の時点で
画像認識の誤り率は

00:06:37.789 --> 00:06:39.242
6%までになっています

00:06:39.242 --> 00:06:41.268
これも人間より高い精度です

NOTE Paragraph

00:06:41.268 --> 00:06:45.037
機械はこの面で非常に良い仕事を
するようになっており

00:06:45.037 --> 00:06:47.306
商業的にも
利用されています

00:06:47.306 --> 00:06:50.348
たとえばGoogleは
去年フランス国内のすべての番地を

00:06:50.348 --> 00:06:54.933
２時間で地図に登録したと
発表しました

00:06:54.933 --> 00:06:58.380
その方法は
ストリートビューの画像を

00:06:58.380 --> 00:07:02.699
ディープ・ラーニング・アルゴリズムに食わせて
所番地を識別させるというものです

00:07:02.699 --> 00:07:04.919
かつてなら どれほど時間を
要したか分かりません

00:07:04.919 --> 00:07:08.274
何十人掛かりで
何年もかかったでしょう

00:07:08.274 --> 00:07:10.185
こちらは中国の
Baiduによるもので

00:07:10.185 --> 00:07:14.221
中国版のGoogle
のようなサービスです

00:07:14.221 --> 00:07:16.504
左上の画像は

00:07:16.504 --> 00:07:20.478
私がBaiduのディープ・ラーニング・システムに
アップロードしたものです

00:07:20.478 --> 00:07:24.247
下に並んでいるのは
システムがその画像を理解して

00:07:24.247 --> 00:07:26.483
似た画像を集めた結果です

00:07:26.483 --> 00:07:29.219
類似画像は
似たような背景や

00:07:29.219 --> 00:07:30.877
似た顔の向きを持ち

00:07:30.877 --> 00:07:32.665
同じく舌を出してる
ものまであります

00:07:32.665 --> 00:07:35.695
ウェブページの文章によって
見つけたものではありません

00:07:35.695 --> 00:07:37.107
アップしたのは
画像だけです

00:07:37.107 --> 00:07:41.128
今やコンピュータは
見た物を理解して

00:07:41.128 --> 00:07:42.752
何億という画像の
データベースから

00:07:42.752 --> 00:07:46.306
リアルタイムで検索できるまでに
なっているのです

NOTE Paragraph

00:07:46.306 --> 00:07:49.536
コンピュータに「見る」ことができるというのは
どんな意味を持つのか？

00:07:49.536 --> 00:07:51.553
しかしできるのは
見ることだけではありません

00:07:51.553 --> 00:07:53.622
ディープ・ラーニングには
それ以上のことができます

00:07:53.622 --> 00:07:56.570
このような複雑で
ニュアンスに富んだ文章を

00:07:56.570 --> 00:07:59.394
ディープ・ラーニング・アルゴリズムは
理解できます

00:07:59.394 --> 00:08:00.697
ご覧いただいているのは

00:08:00.697 --> 00:08:03.465
スタンフォード大のシステムですが
一番上の点が赤色になっていて

00:08:03.465 --> 00:08:07.384
文が全体としてネガティブな感情を
表していることを示しています

00:08:07.384 --> 00:08:10.790
ディープ・ラーニングは今や
文章が何について何を言っているのかを

00:08:10.802 --> 00:08:15.923
人間に近い精度で
理解できるようになっているのです

00:08:15.923 --> 00:08:18.651
ディープ・ラーニングは
中国語を読むのにも使われ

00:08:18.651 --> 00:08:21.807
中国語のネイティブ話者並の
精度があります

00:08:21.807 --> 00:08:23.975
これを開発したのは
スイスのチームですが

00:08:23.975 --> 00:08:27.331
その中に中国語の分かる人は
いなかったそうです

00:08:27.331 --> 00:08:29.382
ディープ・ラーニングは
これに関して

00:08:29.382 --> 00:08:31.601
ネイティブの人間にも劣らない

00:08:31.601 --> 00:08:36.717
最も優れたシステムなのです

NOTE Paragraph

00:08:36.717 --> 00:08:39.682
これは私の会社で
構築したシステムで

00:08:39.682 --> 00:08:41.727
すべてを組み合わせたものです

00:08:41.727 --> 00:08:44.188
これらの画像には
テキストが紐付けされてはおらず

00:08:44.188 --> 00:08:46.541
ユーザーが文をタイプすると

00:08:46.541 --> 00:08:49.510
リアルタイムで画像を理解し

00:08:49.510 --> 00:08:51.189
何の画像かを判別して

00:08:51.189 --> 00:08:54.352
書き込まれた文に近い画像を
見つけます

00:08:54.352 --> 00:08:57.108
だから私の書いた文と
これらの画像を

00:08:57.108 --> 00:08:59.332
同時に理解しているわけです

00:08:59.332 --> 00:09:01.891
Googleのサイトで
似たものを見たことがあるでしょう

00:09:01.891 --> 00:09:04.666
何かタイプすると
画像が表示されますが

00:09:04.666 --> 00:09:08.090
そこで実際に行われているのは
テキストによるウェブページの検索です

00:09:08.090 --> 00:09:11.091
画像を理解するというのとは
ずいぶん違うことです

00:09:11.091 --> 00:09:13.843
このようなことが
できるようになったのは

00:09:13.843 --> 00:09:17.091
ほんのここ数ヶ月のことです

NOTE Paragraph

00:09:17.091 --> 00:09:21.182
コンピューターには「見る」だけでなく
「読む」こともでき

00:09:21.182 --> 00:09:24.947
「聞く」ことによって理解できることも
お見せしました

00:09:24.947 --> 00:09:28.389
そうすると「書く」ことだってできると言っても
驚かないかもしれません

00:09:28.389 --> 00:09:33.172
これは私が昨日 ディープ・ラーニング・
アルゴリズムで生成したテキストです

00:09:33.172 --> 00:09:37.096
こちらはスタンフォード大のアルゴリズムで
生成されたテキストです

00:09:37.096 --> 00:09:38.860
それぞれの画像を
説明する文が

00:09:38.860 --> 00:09:43.109
ディープ・ラーニング・アルゴリズムによって
生成されています

00:09:43.109 --> 00:09:47.581
アルゴリズムは「ギターを弾いている黒いシャツの男」を
前に見たことはありません

00:09:47.581 --> 00:09:49.801
「男」を見たことはあり
「黒い」ものを見たことはあり

00:09:49.801 --> 00:09:51.400
「ギター」を見たことはありますが

00:09:51.400 --> 00:09:55.694
このキャプションは画像に対して
新しく独自に作り出されたものです

00:09:55.694 --> 00:09:59.196
書くことに関してはコンピューターは
まだ人間に及びませんが 近づいています

00:09:59.196 --> 00:10:03.264
テストでは４回に１回は
コンピューターの生成した文の方が好ましい —

00:10:03.264 --> 00:10:04.791
という結果になっています

00:10:04.791 --> 00:10:06.855
このシステムはできて
まだ２週間しかたっていないので

00:10:06.855 --> 00:10:08.701
このまま行くと
たぶん来年中には

00:10:08.701 --> 00:10:11.502
コンピューターアルゴリズムの成績が

00:10:11.502 --> 00:10:13.364
人間を上回るのではと思います

00:10:13.364 --> 00:10:16.413
だからコンピューターは
書くこともできるのです

NOTE Paragraph

00:10:16.413 --> 00:10:19.888
これらをまとめたら
非常に興味深い可能性が開けます

00:10:19.888 --> 00:10:21.380
たとえば医療です

00:10:21.380 --> 00:10:23.905
あるボストンのチームは
コンピューターによって

00:10:23.905 --> 00:10:26.854
医師が がんの診断を
する上で役に立つ

00:10:26.854 --> 00:10:31.120
何十という腫瘍の特徴を発見したと
発表しました

00:10:32.220 --> 00:10:34.516
同様にスタンフォードのグループは

00:10:34.516 --> 00:10:38.179
組織の拡大画像を見て

00:10:38.179 --> 00:10:40.560
がん患者の生存率を

00:10:40.560 --> 00:10:43.142
人間の病理医よりも
正確に予想する

00:10:43.142 --> 00:10:47.519
機械学習システムを
開発しました

00:10:47.519 --> 00:10:50.764
どちらのケースも
予測が人間より正確というだけでなく

00:10:50.764 --> 00:10:53.266
新たな科学的洞察を
もたらしています

00:10:53.276 --> 00:10:54.781
放射線医学のケースでは

00:10:54.781 --> 00:10:57.876
人間に理解できる
新しい臨床的な指標です

00:10:57.876 --> 00:10:59.668
病理学のケースでは

00:10:59.668 --> 00:11:04.168
診断において
がん細胞だけでなく

00:11:04.168 --> 00:11:07.508
がんの周囲の細胞も
重要であることを

00:11:07.508 --> 00:11:09.260
発見しました

00:11:09.260 --> 00:11:14.621
これは病理医が
何十年も教わってきたのとは逆です

00:11:14.621 --> 00:11:17.913
どちらのケースでも
システムは

00:11:17.913 --> 00:11:21.534
医学の専門家と機械学習の専門家の
組み合わせによって開発されましたが

00:11:21.534 --> 00:11:24.275
去年我々はこの面をも
乗り越えました

00:11:24.275 --> 00:11:27.824
これは顕微鏡で見た
人の組織から

00:11:27.824 --> 00:11:30.354
がんの領域を
識別する例です

00:11:30.354 --> 00:11:34.967
このシステムは
人間の病理医と同じか

00:11:34.967 --> 00:11:37.742
それ以上の精度で
がん領域を識別できますが

00:11:37.742 --> 00:11:41.134
医療の知識や経験のない
チームによって

00:11:41.134 --> 00:11:43.660
ディープ・ラーニングを使って
開発されました

00:11:44.730 --> 00:11:47.285
同様に これは
ニューロンの区分けです

00:11:47.285 --> 00:11:50.953
今ではニューロンを人間と
同じ正確さで区分けできますが

00:11:50.953 --> 00:11:53.670
このシステムは医学を
学んだことのない人々が

00:11:53.670 --> 00:11:56.921
ディープ・ラーニングを使って
開発しました

NOTE Paragraph

00:11:56.921 --> 00:12:00.148
医学を学んだことのない人間が
医療の会社を始めるのも

00:12:00.148 --> 00:12:03.875
もはや変なことではないと思え

00:12:03.875 --> 00:12:06.021
実際に会社を作ることにしました

00:12:06.021 --> 00:12:07.761
そうするのは
怖くもありましたが

00:12:07.761 --> 00:12:10.650
データ分析技術だけでも
有益な医療サービスは

00:12:10.650 --> 00:12:16.142
提供可能であると
理論は示しているように見えます

00:12:16.142 --> 00:12:18.622
ありがたいことに
大変好意的な反応を受け取っており

00:12:18.622 --> 00:12:20.978
メディアばかりでなく

00:12:20.978 --> 00:12:23.322
医学界の人々も
支持してくれています

00:12:23.322 --> 00:12:27.471
私たちは医療の
中間部分を受け持って

00:12:27.471 --> 00:12:30.364
そこを可能な限り
データ分析で置き換え

00:12:30.364 --> 00:12:33.429
医師には彼らが最も適した部分をやってもらう
というのが基本方針です

00:12:33.429 --> 00:12:35.031
例をお見せしたいと思います

00:12:35.031 --> 00:12:39.975
新しい医療診断テストの生成には
現在15分ほどかかります

00:12:39.975 --> 00:12:41.929
それをリアルタイムで
ご覧に入れますが

00:12:41.929 --> 00:12:45.416
一部をはしょって
３分に縮めてやります

00:12:45.416 --> 00:12:48.477
医療診断テストを作って
お見せするよりは

00:12:48.477 --> 00:12:51.846
車の画像を診断するテストを
お見せしようと思います

00:12:51.846 --> 00:12:54.068
その方が分かりやすいので

NOTE Paragraph

00:12:54.068 --> 00:12:57.269
150万の車の画像から
始めます

00:12:57.269 --> 00:13:00.475
まず写真を
撮った角度によって

00:13:00.475 --> 00:13:02.698
分類したいと思います

00:13:02.698 --> 00:13:06.586
画像にラベルはまったく付いておらず
一から始めます

00:13:06.586 --> 00:13:08.451
ディープ・ラーニング・アルゴリズムを使って

00:13:08.451 --> 00:13:12.158
写っている構造領域を
自動的に識別することができます

00:13:12.158 --> 00:13:15.778
これの良いところは
人とコンピューターで協力して作業できるところです

00:13:15.778 --> 00:13:17.956
ご覧のように

00:13:17.956 --> 00:13:20.631
人が関心のある領域を
コンピューターに教え

00:13:20.631 --> 00:13:25.281
コンピューターがそれに基づいて
アルゴリズムを改良します

00:13:25.281 --> 00:13:29.577
このディープ・ラーニング・システムは
１万６千次元空間になっていて

00:13:29.577 --> 00:13:33.009
その空間の中で
軸を回転させて

00:13:33.009 --> 00:13:35.001
新たな構造領域を
見つけようとします

00:13:35.001 --> 00:13:36.782
それが成功したら

00:13:36.782 --> 00:13:40.786
人間が関心のある領域を
指摘します

00:13:40.786 --> 00:13:43.208
コンピューターがうまく
領域を見つけられました

00:13:43.208 --> 00:13:45.770
たとえば角度です

00:13:45.770 --> 00:13:47.376
このプロセスを経ることで

00:13:47.376 --> 00:13:49.716
どのような構造を
探しているのか

00:13:49.716 --> 00:13:52.144
徐々に伝えていきます

00:13:52.144 --> 00:13:53.916
これが病気の診断であれば

00:13:53.916 --> 00:13:57.266
病理医が病的状態にある領域を
識別するとか

00:13:57.266 --> 00:14:02.292
放射線医が問題のある可能性のある小結節を示す
といったことを想像できるでしょう

00:14:02.292 --> 00:14:04.851
時にアルゴリズムには
難しいこともあります

00:14:04.851 --> 00:14:06.815
今の場合
コンピューターが混乱して

00:14:06.815 --> 00:14:09.365
前部と後部が
ごちゃまぜになっています

00:14:09.365 --> 00:14:11.437
そのため少し注意して

00:14:11.437 --> 00:14:14.669
手で前部を後部から
選り分けてやらなければなりません

00:14:14.669 --> 00:14:20.175
そうやって
こんなグループに関心があるのだと

00:14:20.175 --> 00:14:21.523
コンピューターに
伝えるのです

NOTE Paragraph

00:14:21.523 --> 00:14:24.200
こうやって続けていき
少しはしょりますが

00:14:24.200 --> 00:14:26.446
機械学習アルゴリズムを
改善させるために

00:14:26.446 --> 00:14:28.420
数百の事例を使って

00:14:28.420 --> 00:14:30.445
訓練してやります

00:14:30.445 --> 00:14:33.518
画像の一部が
薄れていますが

00:14:33.518 --> 00:14:38.226
これはどう理解すれば良いか
既に認識されたものです

00:14:38.226 --> 00:14:41.128
それから似たイメージという概念を
使ってやることで

00:14:41.128 --> 00:14:43.222
コンピューターが
車の前部だけを

00:14:43.222 --> 00:14:47.241
見つけられるように
なりました

00:14:47.241 --> 00:14:50.189
そうなったら
人間がコンピューターに

00:14:50.189 --> 00:14:52.482
その点で上手くできていることを
教えてやります

NOTE Paragraph

00:14:53.652 --> 00:14:55.837
もちろんこの期に及んでも

00:14:55.837 --> 00:14:59.511
ある種のグループを分離するのが
難しいことがあります

00:14:59.511 --> 00:15:03.395
今の場合 コンピューターに
しばらく回転をさせても

00:15:03.399 --> 00:15:06.744
依然として
左側と右側の画像が

00:15:06.744 --> 00:15:08.222
混在しています

00:15:08.222 --> 00:15:10.362
コンピューターにもう
少しヒントをやり

00:15:10.362 --> 00:15:13.338
右側と左側を可能な限り
分離できる射影を

00:15:13.338 --> 00:15:15.945
ディープ・ラーニング・
アルゴリズムを使って

00:15:15.945 --> 00:15:18.067
見つけられるようにします

00:15:18.067 --> 00:15:21.009
そのヒントを与えることで —
上手くいきました

00:15:21.009 --> 00:15:23.891
右側と左側を
見分ける方法を

00:15:23.891 --> 00:15:26.271
どうにか見つけられました

NOTE Paragraph

00:15:26.271 --> 00:15:28.709
基本的な考え方を
分かっていただけたと思います

00:15:28.709 --> 00:15:36.906
これは人間がコンピューターに
置き換えられるという話ではなく —

00:15:36.906 --> 00:15:39.546
人とコンピューターが
協力するということです

00:15:39.546 --> 00:15:43.096
やろうとしているのは
これまでは５、６人のチームで

00:15:43.096 --> 00:15:45.098
何年もかかっていた
ようなことを

00:15:45.098 --> 00:15:47.703
１人で15分ほどで
できるようにする

00:15:47.703 --> 00:15:50.208
ということです

NOTE Paragraph

00:15:50.208 --> 00:15:54.158
このプロセスには
４、５回の反復が必要です

00:15:54.158 --> 00:15:56.017
150万の画像を
62%の精度で

00:15:56.017 --> 00:15:58.976
分類できるようになりました

00:15:58.976 --> 00:16:01.448
そうなったら

00:16:01.448 --> 00:16:02.745
大きなセクションを選んで

00:16:02.745 --> 00:16:05.664
誤りがないか
素早くチェックできます

00:16:05.664 --> 00:16:09.616
誤りがあった場合は
コンピューターに教えてやります

00:16:09.616 --> 00:16:12.661
それぞれのグループについて
そういうことを行うことで

00:16:12.661 --> 00:16:15.148
150万の画像を
80%の精度で

00:16:15.148 --> 00:16:17.563
分類できるようになりました

00:16:17.563 --> 00:16:19.641
そうしたら

00:16:19.641 --> 00:16:23.220
正しく分類されなかった
少数のケースについて

00:16:23.220 --> 00:16:26.108
その理由を考えます

00:16:26.108 --> 00:16:27.851
このアプローチを
15分やることで

00:16:27.851 --> 00:16:31.972
97%の精度で
分類できるようになりました

NOTE Paragraph

00:16:31.972 --> 00:16:36.572
このようなテクニックは
世界の重要な問題を解決してくれるでしょう

00:16:36.578 --> 00:16:39.614
世界的な医師不足です

00:16:39.614 --> 00:16:43.103
世界経済フォーラムは
発展途上国において

00:16:43.103 --> 00:16:45.727
医師が今の10倍から20倍必要で

00:16:45.727 --> 00:16:47.840
それだけの医師を育てるには

00:16:47.840 --> 00:16:50.734
300年かかると言っています

00:16:50.734 --> 00:16:53.619
ディープ・ラーニングを使って
医療の効率を上げることで

00:16:53.619 --> 00:16:56.458
対処するというのは
どうでしょう？

NOTE Paragraph

00:16:56.458 --> 00:16:58.690
このような機会に
私はワクワクしていますが

00:16:58.690 --> 00:17:01.279
同時に懸念している
こともあります

00:17:01.279 --> 00:17:04.403
地図で青になっている国は

00:17:04.403 --> 00:17:08.172
雇用の80%以上が
サービス業のところです

00:17:08.172 --> 00:17:09.959
サービスとは何か？

00:17:09.959 --> 00:17:11.473
このようなものです

00:17:11.473 --> 00:17:15.627
これらのことは コンピューターが
できるようになりつつあることでもあります

00:17:15.627 --> 00:17:19.431
先進国の雇用の80%は
コンピューターができるようになったことで

00:17:19.431 --> 00:17:21.963
成り立っているのです

00:17:21.963 --> 00:17:23.403
これは何を
意味するのでしょう？

00:17:23.403 --> 00:17:25.986
「他の仕事で置き換えられるから
問題ないよ

00:17:25.986 --> 00:17:28.693
たとえば
データサイエンティストの仕事とか」

00:17:28.693 --> 00:17:29.510
と思うかもしれませんが

00:17:29.510 --> 00:17:32.628
このようなものをデータサイエンティストが構築するのに
そう時間はかかりません

00:17:32.628 --> 00:17:35.880
たとえば今回取り上げた４つのアルゴリズムは
１人の人間によって作られたものです

00:17:35.880 --> 00:17:38.318
こういうことは
以前にも起き

00:17:38.318 --> 00:17:42.126
新しいものが現れては
古い職が新しい職で

00:17:42.126 --> 00:17:44.378
置き換えられてきた
と言うなら

00:17:44.378 --> 00:17:46.494
その新しい職は
どのようなものになるのでしょう？

00:17:46.494 --> 00:17:48.365
とても難しい問題です

00:17:48.365 --> 00:17:51.104
なぜなら人間の能力は
徐々にしか向上しませんが

00:17:51.104 --> 00:17:53.666
ディープ・ラーニング・
システムの能力は

00:17:53.666 --> 00:17:56.893
指数関数的に
向上しているからです

00:17:56.893 --> 00:17:58.498
私達がいるのは
追い抜かれる一歩手前です

00:17:58.498 --> 00:18:00.559
今は周りを見渡して

00:18:00.559 --> 00:18:03.235
「コンピューターはまだ馬鹿だ」
と思っていても

00:18:03.235 --> 00:18:06.664
５年もしたら
このグラフの天井を突き破ってしまうでしょう

00:18:06.664 --> 00:18:10.529
私たちは今この能力について
考える必要があるのです

NOTE Paragraph

00:18:10.529 --> 00:18:12.579
前にも似たことは
経験しています

00:18:12.579 --> 00:18:13.966
産業革命です

00:18:13.966 --> 00:18:16.817
エンジンの出現による
能力の急激な変化がありました

00:18:17.667 --> 00:18:20.805
しかししばらくすると
物事はまた落ち着きました

00:18:20.805 --> 00:18:22.507
社会的な変動はありましたが

00:18:22.507 --> 00:18:25.946
あらゆる場面でエンジンが
使われるようになると

00:18:25.946 --> 00:18:28.300
状況は安定したのです

00:18:28.300 --> 00:18:29.773
機械学習の革命は

00:18:29.773 --> 00:18:32.682
産業革命とは
全然違うものになるでしょう

00:18:32.682 --> 00:18:35.632
機械学習の革命は
留まることがないからです

00:18:35.632 --> 00:18:38.614
より優れたコンピューターが
知的活動を受け持ち

00:18:38.614 --> 00:18:42.862
それによって 知的活動にさらに優れた
コンピューターが作れるようになり

00:18:42.862 --> 00:18:44.770
世界がかつて
経験したことのないような

00:18:44.770 --> 00:18:47.248
変化を起こすことに
なるでしょう

00:18:47.248 --> 00:18:50.554
何が起こりうるかについての
以前の知見は 当てはまらないのです

NOTE Paragraph

00:18:50.974 --> 00:18:52.754
この影響は既に現れています

00:18:52.754 --> 00:18:56.384
過去25年で
資本生産性は増大しましたが

00:18:56.400 --> 00:19:00.588
労働生産性は平坦で
むしろ少し下がっています

NOTE Paragraph

00:19:01.408 --> 00:19:04.149
だから この議論を
今始めて欲しいのです

00:19:04.149 --> 00:19:07.176
私がこの状況を
説明しても

00:19:07.176 --> 00:19:08.666
なかなか真剣に
取り合ってもらえません

00:19:08.666 --> 00:19:10.339
「コンピューターには
本当に思考することはできない」

00:19:10.339 --> 00:19:13.367
「感情がない」
「詩を理解しない」

00:19:13.367 --> 00:19:15.888
「我々は腦の働きを本当に理解してはいない」
などなど

00:19:15.888 --> 00:19:17.374
だったら何でしょう？

00:19:17.374 --> 00:19:19.178
人間がお金をもらい
時間を費やして

00:19:19.178 --> 00:19:21.897
やっていたことが
機械にも可能になっているんです

00:19:21.897 --> 00:19:23.628
この新たな現実を踏まえて

00:19:23.628 --> 00:19:28.015
社会構造や経済構造を
どう調整したら良いか

00:19:28.015 --> 00:19:29.855
考え始めるべき時です

00:19:29.855 --> 00:19:31.388
ありがとうございました

00:19:31.388 --> 00:19:32.190
(拍手)