WEBVTT 00:00:00.880 --> 00:00:04.893 これまではコンピューターに 何かさせようと思ったら 00:00:04.893 --> 00:00:06.447 プログラムを書く 必要がありました 00:00:06.447 --> 00:00:09.858 プログラミングはやったことが ないかもしれませんが 00:00:09.858 --> 00:00:13.360 やりたいことを 実現するために 00:00:13.360 --> 00:00:16.727 コンピューターが 行うべきことを 00:00:16.727 --> 00:00:19.089 事細かに指定してやる 必要があります 00:00:19.089 --> 00:00:22.585 だから実現したいことの 具体的なやり方を知らずに 00:00:22.585 --> 00:00:24.648 プログラムを書くというのは 難しい話です NOTE Paragraph 00:00:24.648 --> 00:00:28.131 それがこの写真の人物 アーサー・サミュエルが直面した問題でした 00:00:28.131 --> 00:00:32.208 1956年のこと 彼はチェッカーで 自分に勝てるプログラムを 00:00:32.208 --> 00:00:34.548 作りたいと思いました 00:00:34.548 --> 00:00:36.588 しかしどうしたら 自分より上手く 00:00:36.588 --> 00:00:40.394 チェッカーを指す手順を 詳細に記述することができるでしょう? 00:00:40.394 --> 00:00:42.116 彼は良い方法を 思いつきました 00:00:42.116 --> 00:00:45.840 コンピュータ自身を相手に 何千回も 00:00:45.840 --> 00:00:48.364 チェッカーの対局をさせて 自分で学ばせるんです 00:00:48.364 --> 00:00:51.544 これはうまくいきました そのプログラムは実際 00:00:51.544 --> 00:00:55.561 1962年に コネチカット州チャンピオンを 破ることができました NOTE Paragraph 00:00:55.561 --> 00:00:58.534 だからアーサー・サミュエルは 機械学習の父とも言え 00:00:58.534 --> 00:01:00.251 私自身 彼に 多くを負っています 00:01:00.251 --> 00:01:03.014 というのも私は機械学習の応用を 生業としているからです 00:01:03.014 --> 00:01:04.479 私が代表を務めていた 00:01:04.479 --> 00:01:07.867 Keggleには20万人以上の 機械学習専門家が属しています 00:01:07.867 --> 00:01:09.925 Keggleでは 00:01:09.925 --> 00:01:13.633 かつて解かれたことのない課題を使って 競技会を開催していて 00:01:13.633 --> 00:01:17.470 何百回となく 成功を収めています 00:01:17.470 --> 00:01:19.940 そのような立場から 機械学習には かつて何ができ 00:01:19.940 --> 00:01:23.890 今何ができて 将来何ができるようになるか 00:01:23.890 --> 00:01:26.252 多くのことを 学ぶことができました 00:01:26.252 --> 00:01:30.675 機械学習が商業的に大きな成功を収めた 最初の例は Googleかもしれません 00:01:30.675 --> 00:01:33.784 Googleは 機械学習を使った 00:01:33.784 --> 00:01:35.536 アルゴリズムによって 00:01:35.536 --> 00:01:38.437 情報を見つけられることを 示しました 00:01:38.437 --> 00:01:42.323 それ以来 機械学習の商業的な成功事例が たくさん生まれています 00:01:42.323 --> 00:01:44.160 AmazonやNetflixのような企業は 00:01:44.160 --> 00:01:47.876 機械学習を使って ユーザーが買いたいであろう商品や 00:01:47.876 --> 00:01:49.896 見たいであろう映画を 提示していて 00:01:49.896 --> 00:01:51.703 その精度は 時に不気味なくらいです 00:01:51.703 --> 00:01:53.657 LinkedInやFacebookは 00:01:53.657 --> 00:01:56.251 知り合いかもしれない人を示唆し なぜ分かったのか 00:01:56.251 --> 00:01:58.228 当人には 見当も付きませんが 00:01:58.228 --> 00:02:01.195 これも機械学習の力を 使っているのです 00:02:01.195 --> 00:02:04.152 手順が事細かに プログラミングされているのではなく 00:02:04.152 --> 00:02:07.399 どうすべきかをデータから学習する アルゴリズムが使われています NOTE Paragraph 00:02:07.399 --> 00:02:09.877 IBMのワトソンが ジェパディの世界チャンピオン 00:02:09.877 --> 00:02:13.739 2人を破ったのも そのような方法によってで 00:02:13.739 --> 00:02:16.964 ご覧のような複雑な問いに 答えることができました 00:02:16.964 --> 00:02:19.799 [2003年にこの町の国立博物館から古代の “ニムルドの獅子” が (その他多くの品とともに) 消えた] 00:02:19.799 --> 00:02:23.034 自動運転車が実現可能になったのも 機械学習のお陰です 00:02:23.034 --> 00:02:25.856 たとえば木と歩行者を 見分けるといったことが 00:02:25.856 --> 00:02:28.488 できる必要があります 00:02:28.488 --> 00:02:31.075 そのようなことの具体的な手順が どうすれば書けるのか 00:02:31.075 --> 00:02:34.072 分かりませんが 機械学習で可能になったのです 00:02:34.072 --> 00:02:36.680 事実この車は 事故を起こすこともなく 00:02:36.680 --> 00:02:40.186 普通の公道を 何百万キロも走行しています NOTE Paragraph 00:02:40.196 --> 00:02:44.110 コンピューターは 単に学べるだけでなく 00:02:44.110 --> 00:02:46.010 どうしたらできるのか 00:02:46.010 --> 00:02:48.848 分からないようなことも 学ぶことができ 00:02:48.848 --> 00:02:51.733 人間よりも上手くなることも あり得るのです 00:02:51.733 --> 00:02:55.928 機械学習で最も目覚ましい 事例の1つは 00:02:55.928 --> 00:02:58.320 私がKeggleで主催した プロジェクトで 00:02:58.320 --> 00:03:01.911 ジェフリー・ヒントン率いる 00:03:01.911 --> 00:03:03.463 トロント大のチームが 00:03:03.463 --> 00:03:06.140 薬を発見する競技に 優勝した時です 00:03:06.140 --> 00:03:08.987 これがすごいのは 医薬大手のメルク社や 00:03:08.987 --> 00:03:13.000 この分野の専門家チームの 開発したアルゴリズムを破った彼らのチームに 00:03:13.000 --> 00:03:18.061 化学や生物学やライフサイエンスを ちゃんと学んだ経験のある人が誰もいなかったことで 00:03:18.061 --> 00:03:20.230 しかも たった2週間で やってのけたのです 00:03:20.230 --> 00:03:21.611 どうして可能だったのか? 00:03:22.421 --> 00:03:25.342 ディープ・ラーニングと呼ばれる アルゴリズムを使ったのです 00:03:25.342 --> 00:03:28.291 ことの重大さは 数週間後に ニューヨークタイムズ紙の 00:03:28.291 --> 00:03:31.412 一面で取り上げられたことでも 分かると思います 00:03:31.412 --> 00:03:34.147 画面の左に出ているのが ジェフリー・ヒントンです 00:03:34.147 --> 00:03:38.488 ディープ・ラーニングというのは 人の脳の仕組みを参考にしたアルゴリズムで 00:03:38.488 --> 00:03:40.300 何が可能かについて 00:03:40.300 --> 00:03:44.141 理論的には限界がありません 00:03:44.141 --> 00:03:46.964 より多くのデータと 処理時間を使うほど 00:03:46.964 --> 00:03:48.276 より良い結果が得られます NOTE Paragraph 00:03:48.276 --> 00:03:50.615 ニューヨークタイムズは その記事でもう1つ 00:03:50.615 --> 00:03:52.857 ディープ・ラーニングのすごい事例を 取り上げています 00:03:52.857 --> 00:03:55.569 それをこれからお見せしましょう 00:03:55.569 --> 00:04:00.510 コンピューターが人の話を聞いて 理解できることを示すものです NOTE Paragraph 00:04:00.510 --> 00:04:03.221 (ビデオ) このプロセスの 最後に加えたいステップは 00:04:03.221 --> 00:04:06.246 実際に中国語で 00:04:06.246 --> 00:04:10.961 話させるということです 00:04:10.961 --> 00:04:13.596 ここで鍵になるのは 00:04:13.596 --> 00:04:18.598 中国語話者から得た 膨大な情報を使って 00:04:18.598 --> 00:04:21.128 中国語のテキストを 音声に変える 00:04:21.128 --> 00:04:25.801 音声合成システムを作り 00:04:25.801 --> 00:04:29.929 1時間ほどの 私自身の声のデータを使って 00:04:29.929 --> 00:04:31.820 そのシステムを調整し 00:04:31.820 --> 00:04:36.364 まるで私が話しているかのようにする ということです 00:04:36.364 --> 00:04:38.904 まだ完璧なものではありません 00:04:38.904 --> 00:04:41.552 たくさんミスをします 00:04:41.552 --> 00:04:44.036 (音声合成された中国語訳) 00:04:44.036 --> 00:04:47.403 (拍手) 00:04:49.446 --> 00:04:53.022 この領域で為されるべきことは まだたくさんあります 00:04:53.022 --> 00:04:56.667 (音声合成された中国語訳) 00:04:56.667 --> 00:05:00.100 (拍手) NOTE Paragraph 00:05:01.345 --> 00:05:04.744 これは中国で行われた カンファレンスでのものですが 00:05:04.744 --> 00:05:07.114 学会で拍手が 沸き起こるというのは 00:05:07.114 --> 00:05:09.011 あまりないことです 00:05:09.011 --> 00:05:12.687 もっともTEDxは もっと自由な雰囲気がありますが 00:05:12.687 --> 00:05:15.482 ご覧いただいたものはみんな ディープ・ラーニングで実現されました 00:05:15.482 --> 00:05:17.007 (拍手) どうも 00:05:17.007 --> 00:05:19.289 英語の文字起こしも ディープ・ラーニングだし 00:05:19.289 --> 00:05:22.701 右上の中国語に翻訳されたテキストも ディープ・ラーニングによるもので 00:05:22.701 --> 00:05:26.008 音声の合成にも ディープ・ラーニングが使われています NOTE Paragraph 00:05:26.008 --> 00:05:29.242 ディープ・ラーニングは このようにすごいものです 00:05:29.242 --> 00:05:32.341 単一のアルゴリズムで ほとんど何でもできるように見えます 00:05:32.341 --> 00:05:35.452 この1年前にディープ・ラーニングが 「見る」こともできると知りました 00:05:35.452 --> 00:05:40.218 ドイツ道路標識認識ベンチマーク という奇妙な競技会で 00:05:40.225 --> 00:05:43.618 このような道路標識をディープ・ラーニングで 識別できることが示されました 00:05:43.618 --> 00:05:45.712 他のアルゴリズムよりも 00:05:45.712 --> 00:05:47.470 上手く識別できた というだけでなく 00:05:47.470 --> 00:05:50.189 このスコアボードにある通り 2位の人間より 00:05:50.189 --> 00:05:52.041 2倍高い精度で 識別できたんです 00:05:52.041 --> 00:05:54.037 2011年には コンピューターが人よりも 00:05:54.037 --> 00:05:57.442 良く見ることができる事例が 生まれたわけです 00:05:57.442 --> 00:05:59.491 それ以来いろんなことが 起きています 00:05:59.491 --> 00:06:03.005 2012年にGoogleが発表したんですが ディープ・ラーニング・アルゴリズムが 00:06:03.005 --> 00:06:04.420 YouTubeビデオを見て 00:06:04.420 --> 00:06:07.857 1万6千台のコンピュータで 1ヶ月 データ処理した結果 00:06:07.857 --> 00:06:12.218 コンピューターが「人」や 「猫」といった概念を 00:06:12.218 --> 00:06:14.027 自分で学んだということです 00:06:14.027 --> 00:06:16.379 これは人が学習する方法に 近いものです 00:06:16.379 --> 00:06:19.119 人は見たものを 教えられて学ぶよりは 00:06:19.119 --> 00:06:22.450 むしろそれが何なのか 自分で学んでいくものです 00:06:22.450 --> 00:06:25.819 2012年にはまた 先ほど名前の出たジェフリー・ヒントンが 00:06:25.819 --> 00:06:28.677 有名なImageNet競技会で 優勝しましたが 00:06:28.677 --> 00:06:32.818 これは150万の画像を 何の写真か 00:06:32.818 --> 00:06:34.256 判別するというものです 00:06:34.256 --> 00:06:37.789 2014年の時点で 画像認識の誤り率は 00:06:37.789 --> 00:06:39.242 6%までになっています 00:06:39.242 --> 00:06:41.268 これも人間より高い精度です NOTE Paragraph 00:06:41.268 --> 00:06:45.037 機械はこの面で非常に良い仕事を するようになっており 00:06:45.037 --> 00:06:47.306 商業的にも 利用されています 00:06:47.306 --> 00:06:50.348 たとえばGoogleは 去年フランス国内のすべての番地を 00:06:50.348 --> 00:06:54.933 2時間で地図に登録したと 発表しました 00:06:54.933 --> 00:06:58.380 その方法は ストリートビューの画像を 00:06:58.380 --> 00:07:02.699 ディープ・ラーニング・アルゴリズムに食わせて 所番地を識別させるというものです 00:07:02.699 --> 00:07:04.919 かつてなら どれほど時間を 要したか分かりません 00:07:04.919 --> 00:07:08.274 何十人掛かりで 何年もかかったでしょう 00:07:08.274 --> 00:07:10.185 こちらは中国の Baiduによるもので 00:07:10.185 --> 00:07:14.221 中国版のGoogle のようなサービスです 00:07:14.221 --> 00:07:16.504 左上の画像は 00:07:16.504 --> 00:07:20.478 私がBaiduのディープ・ラーニング・システムに アップロードしたものです 00:07:20.478 --> 00:07:24.247 下に並んでいるのは システムがその画像を理解して 00:07:24.247 --> 00:07:26.483 似た画像を集めた結果です 00:07:26.483 --> 00:07:29.219 類似画像は 似たような背景や 00:07:29.219 --> 00:07:30.877 似た顔の向きを持ち 00:07:30.877 --> 00:07:32.665 同じく舌を出してる ものまであります 00:07:32.665 --> 00:07:35.695 ウェブページの文章によって 見つけたものではありません 00:07:35.695 --> 00:07:37.107 アップしたのは 画像だけです 00:07:37.107 --> 00:07:41.128 今やコンピュータは 見た物を理解して 00:07:41.128 --> 00:07:42.752 何億という画像の データベースから 00:07:42.752 --> 00:07:46.306 リアルタイムで検索できるまでに なっているのです NOTE Paragraph 00:07:46.306 --> 00:07:49.536 コンピュータに「見る」ことができるというのは どんな意味を持つのか? 00:07:49.536 --> 00:07:51.553 しかしできるのは 見ることだけではありません 00:07:51.553 --> 00:07:53.622 ディープ・ラーニングには それ以上のことができます 00:07:53.622 --> 00:07:56.570 このような複雑で ニュアンスに富んだ文章を 00:07:56.570 --> 00:07:59.394 ディープ・ラーニング・アルゴリズムは 理解できます 00:07:59.394 --> 00:08:00.697 ご覧いただいているのは 00:08:00.697 --> 00:08:03.465 スタンフォード大のシステムですが 一番上の点が赤色になっていて 00:08:03.465 --> 00:08:07.384 文が全体としてネガティブな感情を 表していることを示しています 00:08:07.384 --> 00:08:10.790 ディープ・ラーニングは今や 文章が何について何を言っているのかを 00:08:10.802 --> 00:08:15.923 人間に近い精度で 理解できるようになっているのです 00:08:15.923 --> 00:08:18.651 ディープ・ラーニングは 中国語を読むのにも使われ 00:08:18.651 --> 00:08:21.807 中国語のネイティブ話者並の 精度があります 00:08:21.807 --> 00:08:23.975 これを開発したのは スイスのチームですが 00:08:23.975 --> 00:08:27.331 その中に中国語の分かる人は いなかったそうです 00:08:27.331 --> 00:08:29.382 ディープ・ラーニングは これに関して 00:08:29.382 --> 00:08:31.601 ネイティブの人間にも劣らない 00:08:31.601 --> 00:08:36.717 最も優れたシステムなのです NOTE Paragraph 00:08:36.717 --> 00:08:39.682 これは私の会社で 構築したシステムで 00:08:39.682 --> 00:08:41.727 すべてを組み合わせたものです 00:08:41.727 --> 00:08:44.188 これらの画像には テキストが紐付けされてはおらず 00:08:44.188 --> 00:08:46.541 ユーザーが文をタイプすると 00:08:46.541 --> 00:08:49.510 リアルタイムで画像を理解し 00:08:49.510 --> 00:08:51.189 何の画像かを判別して 00:08:51.189 --> 00:08:54.352 書き込まれた文に近い画像を 見つけます 00:08:54.352 --> 00:08:57.108 だから私の書いた文と これらの画像を 00:08:57.108 --> 00:08:59.332 同時に理解しているわけです 00:08:59.332 --> 00:09:01.891 Googleのサイトで 似たものを見たことがあるでしょう 00:09:01.891 --> 00:09:04.666 何かタイプすると 画像が表示されますが 00:09:04.666 --> 00:09:08.090 そこで実際に行われているのは テキストによるウェブページの検索です 00:09:08.090 --> 00:09:11.091 画像を理解するというのとは ずいぶん違うことです 00:09:11.091 --> 00:09:13.843 このようなことが できるようになったのは 00:09:13.843 --> 00:09:17.091 ほんのここ数ヶ月のことです NOTE Paragraph 00:09:17.091 --> 00:09:21.182 コンピューターには「見る」だけでなく 「読む」こともでき 00:09:21.182 --> 00:09:24.947 「聞く」ことによって理解できることも お見せしました 00:09:24.947 --> 00:09:28.389 そうすると「書く」ことだってできると言っても 驚かないかもしれません 00:09:28.389 --> 00:09:33.172 これは私が昨日 ディープ・ラーニング・ アルゴリズムで生成したテキストです 00:09:33.172 --> 00:09:37.096 こちらはスタンフォード大のアルゴリズムで 生成されたテキストです 00:09:37.096 --> 00:09:38.860 それぞれの画像を 説明する文が 00:09:38.860 --> 00:09:43.109 ディープ・ラーニング・アルゴリズムによって 生成されています 00:09:43.109 --> 00:09:47.581 アルゴリズムは「ギターを弾いている黒いシャツの男」を 前に見たことはありません 00:09:47.581 --> 00:09:49.801 「男」を見たことはあり 「黒い」ものを見たことはあり 00:09:49.801 --> 00:09:51.400 「ギター」を見たことはありますが 00:09:51.400 --> 00:09:55.694 このキャプションは画像に対して 新しく独自に作り出されたものです 00:09:55.694 --> 00:09:59.196 書くことに関してはコンピューターは まだ人間に及びませんが 近づいています 00:09:59.196 --> 00:10:03.264 テストでは4回に1回は コンピューターの生成した文の方が好ましい — 00:10:03.264 --> 00:10:04.791 という結果になっています 00:10:04.791 --> 00:10:06.855 このシステムはできて まだ2週間しかたっていないので 00:10:06.855 --> 00:10:08.701 このまま行くと たぶん来年中には 00:10:08.701 --> 00:10:11.502 コンピューターアルゴリズムの成績が 00:10:11.502 --> 00:10:13.364 人間を上回るのではと思います 00:10:13.364 --> 00:10:16.413 だからコンピューターは 書くこともできるのです NOTE Paragraph 00:10:16.413 --> 00:10:19.888 これらをまとめたら 非常に興味深い可能性が開けます 00:10:19.888 --> 00:10:21.380 たとえば医療です 00:10:21.380 --> 00:10:23.905 あるボストンのチームは コンピューターによって 00:10:23.905 --> 00:10:26.854 医師が がんの診断を する上で役に立つ 00:10:26.854 --> 00:10:31.120 何十という腫瘍の特徴を発見したと 発表しました 00:10:32.220 --> 00:10:34.516 同様にスタンフォードのグループは 00:10:34.516 --> 00:10:38.179 組織の拡大画像を見て 00:10:38.179 --> 00:10:40.560 がん患者の生存率を 00:10:40.560 --> 00:10:43.142 人間の病理医よりも 正確に予想する 00:10:43.142 --> 00:10:47.519 機械学習システムを 開発しました 00:10:47.519 --> 00:10:50.764 どちらのケースも 予測が人間より正確というだけでなく 00:10:50.764 --> 00:10:53.266 新たな科学的洞察を もたらしています 00:10:53.276 --> 00:10:54.781 放射線医学のケースでは 00:10:54.781 --> 00:10:57.876 人間に理解できる 新しい臨床的な指標です 00:10:57.876 --> 00:10:59.668 病理学のケースでは 00:10:59.668 --> 00:11:04.168 診断において がん細胞だけでなく 00:11:04.168 --> 00:11:07.508 がんの周囲の細胞も 重要であることを 00:11:07.508 --> 00:11:09.260 発見しました 00:11:09.260 --> 00:11:14.621 これは病理医が 何十年も教わってきたのとは逆です 00:11:14.621 --> 00:11:17.913 どちらのケースでも システムは 00:11:17.913 --> 00:11:21.534 医学の専門家と機械学習の専門家の 組み合わせによって開発されましたが 00:11:21.534 --> 00:11:24.275 去年我々はこの面をも 乗り越えました 00:11:24.275 --> 00:11:27.824 これは顕微鏡で見た 人の組織から 00:11:27.824 --> 00:11:30.354 がんの領域を 識別する例です 00:11:30.354 --> 00:11:34.967 このシステムは 人間の病理医と同じか 00:11:34.967 --> 00:11:37.742 それ以上の精度で がん領域を識別できますが 00:11:37.742 --> 00:11:41.134 医療の知識や経験のない チームによって 00:11:41.134 --> 00:11:43.660 ディープ・ラーニングを使って 開発されました 00:11:44.730 --> 00:11:47.285 同様に これは ニューロンの区分けです 00:11:47.285 --> 00:11:50.953 今ではニューロンを人間と 同じ正確さで区分けできますが 00:11:50.953 --> 00:11:53.670 このシステムは医学を 学んだことのない人々が 00:11:53.670 --> 00:11:56.921 ディープ・ラーニングを使って 開発しました NOTE Paragraph 00:11:56.921 --> 00:12:00.148 医学を学んだことのない人間が 医療の会社を始めるのも 00:12:00.148 --> 00:12:03.875 もはや変なことではないと思え 00:12:03.875 --> 00:12:06.021 実際に会社を作ることにしました 00:12:06.021 --> 00:12:07.761 そうするのは 怖くもありましたが 00:12:07.761 --> 00:12:10.650 データ分析技術だけでも 有益な医療サービスは 00:12:10.650 --> 00:12:16.142 提供可能であると 理論は示しているように見えます 00:12:16.142 --> 00:12:18.622 ありがたいことに 大変好意的な反応を受け取っており 00:12:18.622 --> 00:12:20.978 メディアばかりでなく 00:12:20.978 --> 00:12:23.322 医学界の人々も 支持してくれています 00:12:23.322 --> 00:12:27.471 私たちは医療の 中間部分を受け持って 00:12:27.471 --> 00:12:30.364 そこを可能な限り データ分析で置き換え 00:12:30.364 --> 00:12:33.429 医師には彼らが最も適した部分をやってもらう というのが基本方針です 00:12:33.429 --> 00:12:35.031 例をお見せしたいと思います 00:12:35.031 --> 00:12:39.975 新しい医療診断テストの生成には 現在15分ほどかかります 00:12:39.975 --> 00:12:41.929 それをリアルタイムで ご覧に入れますが 00:12:41.929 --> 00:12:45.416 一部をはしょって 3分に縮めてやります 00:12:45.416 --> 00:12:48.477 医療診断テストを作って お見せするよりは 00:12:48.477 --> 00:12:51.846 車の画像を診断するテストを お見せしようと思います 00:12:51.846 --> 00:12:54.068 その方が分かりやすいので NOTE Paragraph 00:12:54.068 --> 00:12:57.269 150万の車の画像から 始めます 00:12:57.269 --> 00:13:00.475 まず写真を 撮った角度によって 00:13:00.475 --> 00:13:02.698 分類したいと思います 00:13:02.698 --> 00:13:06.586 画像にラベルはまったく付いておらず 一から始めます 00:13:06.586 --> 00:13:08.451 ディープ・ラーニング・アルゴリズムを使って 00:13:08.451 --> 00:13:12.158 写っている構造領域を 自動的に識別することができます 00:13:12.158 --> 00:13:15.778 これの良いところは 人とコンピューターで協力して作業できるところです 00:13:15.778 --> 00:13:17.956 ご覧のように 00:13:17.956 --> 00:13:20.631 人が関心のある領域を コンピューターに教え 00:13:20.631 --> 00:13:25.281 コンピューターがそれに基づいて アルゴリズムを改良します 00:13:25.281 --> 00:13:29.577 このディープ・ラーニング・システムは 1万6千次元空間になっていて 00:13:29.577 --> 00:13:33.009 その空間の中で 軸を回転させて 00:13:33.009 --> 00:13:35.001 新たな構造領域を 見つけようとします 00:13:35.001 --> 00:13:36.782 それが成功したら 00:13:36.782 --> 00:13:40.786 人間が関心のある領域を 指摘します 00:13:40.786 --> 00:13:43.208 コンピューターがうまく 領域を見つけられました 00:13:43.208 --> 00:13:45.770 たとえば角度です 00:13:45.770 --> 00:13:47.376 このプロセスを経ることで 00:13:47.376 --> 00:13:49.716 どのような構造を 探しているのか 00:13:49.716 --> 00:13:52.144 徐々に伝えていきます 00:13:52.144 --> 00:13:53.916 これが病気の診断であれば 00:13:53.916 --> 00:13:57.266 病理医が病的状態にある領域を 識別するとか 00:13:57.266 --> 00:14:02.292 放射線医が問題のある可能性のある小結節を示す といったことを想像できるでしょう 00:14:02.292 --> 00:14:04.851 時にアルゴリズムには 難しいこともあります 00:14:04.851 --> 00:14:06.815 今の場合 コンピューターが混乱して 00:14:06.815 --> 00:14:09.365 前部と後部が ごちゃまぜになっています 00:14:09.365 --> 00:14:11.437 そのため少し注意して 00:14:11.437 --> 00:14:14.669 手で前部を後部から 選り分けてやらなければなりません 00:14:14.669 --> 00:14:20.175 そうやって こんなグループに関心があるのだと 00:14:20.175 --> 00:14:21.523 コンピューターに 伝えるのです NOTE Paragraph 00:14:21.523 --> 00:14:24.200 こうやって続けていき 少しはしょりますが 00:14:24.200 --> 00:14:26.446 機械学習アルゴリズムを 改善させるために 00:14:26.446 --> 00:14:28.420 数百の事例を使って 00:14:28.420 --> 00:14:30.445 訓練してやります 00:14:30.445 --> 00:14:33.518 画像の一部が 薄れていますが 00:14:33.518 --> 00:14:38.226 これはどう理解すれば良いか 既に認識されたものです 00:14:38.226 --> 00:14:41.128 それから似たイメージという概念を 使ってやることで 00:14:41.128 --> 00:14:43.222 コンピューターが 車の前部だけを 00:14:43.222 --> 00:14:47.241 見つけられるように なりました 00:14:47.241 --> 00:14:50.189 そうなったら 人間がコンピューターに 00:14:50.189 --> 00:14:52.482 その点で上手くできていることを 教えてやります NOTE Paragraph 00:14:53.652 --> 00:14:55.837 もちろんこの期に及んでも 00:14:55.837 --> 00:14:59.511 ある種のグループを分離するのが 難しいことがあります 00:14:59.511 --> 00:15:03.395 今の場合 コンピューターに しばらく回転をさせても 00:15:03.399 --> 00:15:06.744 依然として 左側と右側の画像が 00:15:06.744 --> 00:15:08.222 混在しています 00:15:08.222 --> 00:15:10.362 コンピューターにもう 少しヒントをやり 00:15:10.362 --> 00:15:13.338 右側と左側を可能な限り 分離できる射影を 00:15:13.338 --> 00:15:15.945 ディープ・ラーニング・ アルゴリズムを使って 00:15:15.945 --> 00:15:18.067 見つけられるようにします 00:15:18.067 --> 00:15:21.009 そのヒントを与えることで — 上手くいきました 00:15:21.009 --> 00:15:23.891 右側と左側を 見分ける方法を 00:15:23.891 --> 00:15:26.271 どうにか見つけられました NOTE Paragraph 00:15:26.271 --> 00:15:28.709 基本的な考え方を 分かっていただけたと思います 00:15:28.709 --> 00:15:36.906 これは人間がコンピューターに 置き換えられるという話ではなく — 00:15:36.906 --> 00:15:39.546 人とコンピューターが 協力するということです 00:15:39.546 --> 00:15:43.096 やろうとしているのは これまでは5、6人のチームで 00:15:43.096 --> 00:15:45.098 何年もかかっていた ようなことを 00:15:45.098 --> 00:15:47.703 1人で15分ほどで できるようにする 00:15:47.703 --> 00:15:50.208 ということです NOTE Paragraph 00:15:50.208 --> 00:15:54.158 このプロセスには 4、5回の反復が必要です 00:15:54.158 --> 00:15:56.017 150万の画像を 62%の精度で 00:15:56.017 --> 00:15:58.976 分類できるようになりました 00:15:58.976 --> 00:16:01.448 そうなったら 00:16:01.448 --> 00:16:02.745 大きなセクションを選んで 00:16:02.745 --> 00:16:05.664 誤りがないか 素早くチェックできます 00:16:05.664 --> 00:16:09.616 誤りがあった場合は コンピューターに教えてやります 00:16:09.616 --> 00:16:12.661 それぞれのグループについて そういうことを行うことで 00:16:12.661 --> 00:16:15.148 150万の画像を 80%の精度で 00:16:15.148 --> 00:16:17.563 分類できるようになりました 00:16:17.563 --> 00:16:19.641 そうしたら 00:16:19.641 --> 00:16:23.220 正しく分類されなかった 少数のケースについて 00:16:23.220 --> 00:16:26.108 その理由を考えます 00:16:26.108 --> 00:16:27.851 このアプローチを 15分やることで 00:16:27.851 --> 00:16:31.972 97%の精度で 分類できるようになりました NOTE Paragraph 00:16:31.972 --> 00:16:36.572 このようなテクニックは 世界の重要な問題を解決してくれるでしょう 00:16:36.578 --> 00:16:39.614 世界的な医師不足です 00:16:39.614 --> 00:16:43.103 世界経済フォーラムは 発展途上国において 00:16:43.103 --> 00:16:45.727 医師が今の10倍から20倍必要で 00:16:45.727 --> 00:16:47.840 それだけの医師を育てるには 00:16:47.840 --> 00:16:50.734 300年かかると言っています 00:16:50.734 --> 00:16:53.619 ディープ・ラーニングを使って 医療の効率を上げることで 00:16:53.619 --> 00:16:56.458 対処するというのは どうでしょう? NOTE Paragraph 00:16:56.458 --> 00:16:58.690 このような機会に 私はワクワクしていますが 00:16:58.690 --> 00:17:01.279 同時に懸念している こともあります 00:17:01.279 --> 00:17:04.403 地図で青になっている国は 00:17:04.403 --> 00:17:08.172 雇用の80%以上が サービス業のところです 00:17:08.172 --> 00:17:09.959 サービスとは何か? 00:17:09.959 --> 00:17:11.473 このようなものです 00:17:11.473 --> 00:17:15.627 これらのことは コンピューターが できるようになりつつあることでもあります 00:17:15.627 --> 00:17:19.431 先進国の雇用の80%は コンピューターができるようになったことで 00:17:19.431 --> 00:17:21.963 成り立っているのです 00:17:21.963 --> 00:17:23.403 これは何を 意味するのでしょう? 00:17:23.403 --> 00:17:25.986 「他の仕事で置き換えられるから 問題ないよ 00:17:25.986 --> 00:17:28.693 たとえば データサイエンティストの仕事とか」 00:17:28.693 --> 00:17:29.510 と思うかもしれませんが 00:17:29.510 --> 00:17:32.628 このようなものをデータサイエンティストが構築するのに そう時間はかかりません 00:17:32.628 --> 00:17:35.880 たとえば今回取り上げた4つのアルゴリズムは 1人の人間によって作られたものです 00:17:35.880 --> 00:17:38.318 こういうことは 以前にも起き 00:17:38.318 --> 00:17:42.126 新しいものが現れては 古い職が新しい職で 00:17:42.126 --> 00:17:44.378 置き換えられてきた と言うなら 00:17:44.378 --> 00:17:46.494 その新しい職は どのようなものになるのでしょう? 00:17:46.494 --> 00:17:48.365 とても難しい問題です 00:17:48.365 --> 00:17:51.104 なぜなら人間の能力は 徐々にしか向上しませんが 00:17:51.104 --> 00:17:53.666 ディープ・ラーニング・ システムの能力は 00:17:53.666 --> 00:17:56.893 指数関数的に 向上しているからです 00:17:56.893 --> 00:17:58.498 私達がいるのは 追い抜かれる一歩手前です 00:17:58.498 --> 00:18:00.559 今は周りを見渡して 00:18:00.559 --> 00:18:03.235 「コンピューターはまだ馬鹿だ」 と思っていても 00:18:03.235 --> 00:18:06.664 5年もしたら このグラフの天井を突き破ってしまうでしょう 00:18:06.664 --> 00:18:10.529 私たちは今この能力について 考える必要があるのです NOTE Paragraph 00:18:10.529 --> 00:18:12.579 前にも似たことは 経験しています 00:18:12.579 --> 00:18:13.966 産業革命です 00:18:13.966 --> 00:18:16.817 エンジンの出現による 能力の急激な変化がありました 00:18:17.667 --> 00:18:20.805 しかししばらくすると 物事はまた落ち着きました 00:18:20.805 --> 00:18:22.507 社会的な変動はありましたが 00:18:22.507 --> 00:18:25.946 あらゆる場面でエンジンが 使われるようになると 00:18:25.946 --> 00:18:28.300 状況は安定したのです 00:18:28.300 --> 00:18:29.773 機械学習の革命は 00:18:29.773 --> 00:18:32.682 産業革命とは 全然違うものになるでしょう 00:18:32.682 --> 00:18:35.632 機械学習の革命は 留まることがないからです 00:18:35.632 --> 00:18:38.614 より優れたコンピューターが 知的活動を受け持ち 00:18:38.614 --> 00:18:42.862 それによって 知的活動にさらに優れた コンピューターが作れるようになり 00:18:42.862 --> 00:18:44.770 世界がかつて 経験したことのないような 00:18:44.770 --> 00:18:47.248 変化を起こすことに なるでしょう 00:18:47.248 --> 00:18:50.554 何が起こりうるかについての 以前の知見は 当てはまらないのです NOTE Paragraph 00:18:50.974 --> 00:18:52.754 この影響は既に現れています 00:18:52.754 --> 00:18:56.384 過去25年で 資本生産性は増大しましたが 00:18:56.400 --> 00:19:00.588 労働生産性は平坦で むしろ少し下がっています NOTE Paragraph 00:19:01.408 --> 00:19:04.149 だから この議論を 今始めて欲しいのです 00:19:04.149 --> 00:19:07.176 私がこの状況を 説明しても 00:19:07.176 --> 00:19:08.666 なかなか真剣に 取り合ってもらえません 00:19:08.666 --> 00:19:10.339 「コンピューターには 本当に思考することはできない」 00:19:10.339 --> 00:19:13.367 「感情がない」 「詩を理解しない」 00:19:13.367 --> 00:19:15.888 「我々は腦の働きを本当に理解してはいない」 などなど 00:19:15.888 --> 00:19:17.374 だったら何でしょう? 00:19:17.374 --> 00:19:19.178 人間がお金をもらい 時間を費やして 00:19:19.178 --> 00:19:21.897 やっていたことが 機械にも可能になっているんです 00:19:21.897 --> 00:19:23.628 この新たな現実を踏まえて 00:19:23.628 --> 00:19:28.015 社会構造や経済構造を どう調整したら良いか 00:19:28.015 --> 00:19:29.855 考え始めるべき時です 00:19:29.855 --> 00:19:31.388 ありがとうございました 00:19:31.388 --> 00:19:32.190 (拍手)