[Script Info] Title: [Events] Format: Layer, Start, End, Style, Name, MarginL, MarginR, MarginV, Effect, Text Dialogue: 0,0:00:02.37,0:00:06.10,Default,,0000,0000,0000,,まずこのビデオを\Nご覧ください Dialogue: 0,0:00:06.10,0:00:10.26,Default,,0000,0000,0000,,(女の子の声) ネコがベッドに座ってる Dialogue: 0,0:00:10.26,0:00:14.30,Default,,0000,0000,0000,,男の子が象をなでてる Dialogue: 0,0:00:14.30,0:00:18.23,Default,,0000,0000,0000,,飛行機へ行く人たち Dialogue: 0,0:00:18.23,0:00:21.28,Default,,0000,0000,0000,,大きな飛行機よ Dialogue: 0,0:00:21.28,0:00:23.67,Default,,0000,0000,0000,,(講演者) これは3歳児が Dialogue: 0,0:00:23.67,0:00:27.35,Default,,0000,0000,0000,,見た写真を\N説明しているところです Dialogue: 0,0:00:27.35,0:00:30.64,Default,,0000,0000,0000,,彼女にはこの世界で学ぶことが \Nまだまだあるかもしれませんが Dialogue: 0,0:00:30.64,0:00:34.74,Default,,0000,0000,0000,,ひとつの重要な作業については\Nすでにエキスパートです Dialogue: 0,0:00:34.74,0:00:37.59,Default,,0000,0000,0000,,見たものを理解する\Nということです Dialogue: 0,0:00:38.23,0:00:42.46,Default,,0000,0000,0000,,私たちの社会は技術的に\Nかつてなく進歩しています Dialogue: 0,0:00:42.46,0:00:46.08,Default,,0000,0000,0000,,月へと人を送り込み \N人に話しかける電話を作り Dialogue: 0,0:00:46.08,0:00:51.03,Default,,0000,0000,0000,,自分の好きな曲だけがかかるように\Nラジオをカスタマイズしています Dialogue: 0,0:00:51.03,0:00:55.08,Default,,0000,0000,0000,,しかしながら最先端の\Nコンピュータでも Dialogue: 0,0:00:55.08,0:00:57.99,Default,,0000,0000,0000,,まだこの作業には\N手こずっているんです Dialogue: 0,0:00:57.99,0:01:01.45,Default,,0000,0000,0000,,私は今日コンピュータビジョンの Dialogue: 0,0:01:01.45,0:01:05.49,Default,,0000,0000,0000,,最新動向について\Nお伝えするために来ました Dialogue: 0,0:01:05.49,0:01:09.66,Default,,0000,0000,0000,,これはコンピュータサイエンスの中でも\N先端にあって Dialogue: 0,0:01:09.66,0:01:12.86,Default,,0000,0000,0000,,画期的なものになる\N可能性のある技術です Dialogue: 0,0:01:12.86,0:01:17.41,Default,,0000,0000,0000,,自分で運転する車の\Nプロトタイプが作られていますが Dialogue: 0,0:01:17.41,0:01:21.26,Default,,0000,0000,0000,,知的な視覚処理能力がなかったら Dialogue: 0,0:01:21.26,0:01:25.24,Default,,0000,0000,0000,,踏みつぶしても問題のない\N道路上の丸めた紙袋と Dialogue: 0,0:01:25.24,0:01:28.86,Default,,0000,0000,0000,,避けて通るべき同じ大きさの石とを\N見分けることもできません Dialogue: 0,0:01:29.42,0:01:32.80,Default,,0000,0000,0000,,すごいメガピクセルの\Nカメラが作られていますが Dialogue: 0,0:01:32.80,0:01:36.30,Default,,0000,0000,0000,,盲目の人に視力を与えることは\Nできていません Dialogue: 0,0:01:36.42,0:01:39.72,Default,,0000,0000,0000,,無人機を広大な土地の上に\N飛ばすことはできても Dialogue: 0,0:01:39.72,0:01:42.79,Default,,0000,0000,0000,,熱帯雨林の変化を\N追跡できるだけの Dialogue: 0,0:01:42.79,0:01:45.32,Default,,0000,0000,0000,,画像技術はまだありません Dialogue: 0,0:01:45.32,0:01:48.27,Default,,0000,0000,0000,,監視カメラが至る所に\N設置されていますが Dialogue: 0,0:01:48.27,0:01:53.34,Default,,0000,0000,0000,,プールで溺れている子がいても\N警告してはくれません Dialogue: 0,0:01:54.17,0:01:59.55,Default,,0000,0000,0000,,写真やビデオは世界において\N生活に不可欠な一部をなしています Dialogue: 0,0:01:59.55,0:02:03.85,Default,,0000,0000,0000,,どんな個人であれ チームであれ\N見切れないほどのペースで Dialogue: 0,0:02:03.85,0:02:06.63,Default,,0000,0000,0000,,映像が量産されています Dialogue: 0,0:02:06.63,0:02:10.55,Default,,0000,0000,0000,,そして私たちも ここTEDで\Nそれに貢献しています Dialogue: 0,0:02:10.55,0:02:13.72,Default,,0000,0000,0000,,しかし最も進んだ\Nソフトウェアでさえ Dialogue: 0,0:02:13.72,0:02:19.66,Default,,0000,0000,0000,,この膨大な映像を理解し管理するのに\N手こずっています Dialogue: 0,0:02:19.66,0:02:21.55,Default,,0000,0000,0000,,言ってみれば Dialogue: 0,0:02:21.55,0:02:24.96,Default,,0000,0000,0000,,私たちの社会は\N集合的に盲目であり Dialogue: 0,0:02:24.96,0:02:30.07,Default,,0000,0000,0000,,それは最も知的な機械が\Nいまだ盲目だからです Dialogue: 0,0:02:31.34,0:02:34.45,Default,,0000,0000,0000,,なぜそんなに難しいのかと\N思うかもしれません Dialogue: 0,0:02:34.45,0:02:37.00,Default,,0000,0000,0000,,カメラはこのような写真を撮って Dialogue: 0,0:02:37.00,0:02:39.22,Default,,0000,0000,0000,,光をピクセルと呼ばれる Dialogue: 0,0:02:39.22,0:02:42.79,Default,,0000,0000,0000,,数字の2次元配列へと\N変換しますが Dialogue: 0,0:02:42.79,0:02:45.04,Default,,0000,0000,0000,,これは死んだ数字の列に\N過ぎません Dialogue: 0,0:02:45.04,0:02:47.98,Default,,0000,0000,0000,,数字自体に意味はありません Dialogue: 0,0:02:47.98,0:02:52.49,Default,,0000,0000,0000,,単に音が耳に入ってくるのと\N「聴く」のとは違うように Dialogue: 0,0:02:52.49,0:02:56.53,Default,,0000,0000,0000,,「写真を撮る」のと「見る」のとは\N同じではありません Dialogue: 0,0:02:56.53,0:03:00.36,Default,,0000,0000,0000,,「見る」ということには\N理解することが含まれているのです Dialogue: 0,0:03:01.29,0:03:04.15,Default,,0000,0000,0000,,実際この仕事を\N成し遂げられるようにするために Dialogue: 0,0:03:04.15,0:03:09.44,Default,,0000,0000,0000,,母なる自然は 5億4千万年という\N長い歳月を必要としたのです Dialogue: 0,0:03:09.44,0:03:11.32,Default,,0000,0000,0000,,そしてその努力の多くは Dialogue: 0,0:03:11.32,0:03:14.26,Default,,0000,0000,0000,,目そのものではなく Dialogue: 0,0:03:14.26,0:03:19.24,Default,,0000,0000,0000,,脳の視覚処理能力を発達させるために\N費やされました Dialogue: 0,0:03:19.24,0:03:21.99,Default,,0000,0000,0000,,視覚というのは\N目から始まりますが Dialogue: 0,0:03:21.99,0:03:25.51,Default,,0000,0000,0000,,それが本当に起きているのは\N脳の中なのです Dialogue: 0,0:03:26.29,0:03:30.53,Default,,0000,0000,0000,,これまで15年間 \Nカリフォルニア工科大学の博士課程の頃から Dialogue: 0,0:03:30.53,0:03:34.46,Default,,0000,0000,0000,,スタンフォード大でコンピュータビジョン研究室を\N率いている今に到るまで Dialogue: 0,0:03:34.46,0:03:38.67,Default,,0000,0000,0000,,私は指導教官や共同研究者や\N学生達とともに Dialogue: 0,0:03:38.67,0:03:41.76,Default,,0000,0000,0000,,コンピュータに見ることを\N教えようとしてきました Dialogue: 0,0:03:42.66,0:03:45.95,Default,,0000,0000,0000,,私たちの研究領域は\Nコンピュータビジョンと機械学習で Dialogue: 0,0:03:45.95,0:03:49.83,Default,,0000,0000,0000,,これは人工知能の分野の一部です Dialogue: 0,0:03:51.00,0:03:56.49,Default,,0000,0000,0000,,最終的に私たちがしたいのは \N機械も人間のようにものを見られるようにすることです Dialogue: 0,0:03:56.49,0:04:01.88,Default,,0000,0000,0000,,物が何か言い当て 人を識別し \N3次元的な配置を推量し Dialogue: 0,0:04:01.88,0:04:07.57,Default,,0000,0000,0000,,関係や感情や行動や意図を\N理解するということです Dialogue: 0,0:04:07.57,0:04:10.57,Default,,0000,0000,0000,,私たち人間は一目見ただけで Dialogue: 0,0:04:10.57,0:04:15.88,Default,,0000,0000,0000,,人 場所 物の織りなす物語全体を\N捉えることができます Dialogue: 0,0:04:16.95,0:04:19.74,Default,,0000,0000,0000,,この目標に向けた第一歩は Dialogue: 0,0:04:19.74,0:04:25.91,Default,,0000,0000,0000,,コンピュータに視覚世界の構成要素である物を\N見られるようにすることです Dialogue: 0,0:04:25.91,0:04:27.86,Default,,0000,0000,0000,,簡単に言うと Dialogue: 0,0:04:27.86,0:04:30.70,Default,,0000,0000,0000,,ネコのような特定の物の Dialogue: 0,0:04:30.70,0:04:36.76,Default,,0000,0000,0000,,訓練用画像を\Nコンピュータに与えて Dialogue: 0,0:04:36.76,0:04:41.39,Default,,0000,0000,0000,,それらの画像から学習する\Nモデルを設計するんです Dialogue: 0,0:04:41.39,0:04:43.44,Default,,0000,0000,0000,,簡単そうに聞こえますよね? Dialogue: 0,0:04:43.44,0:04:47.49,Default,,0000,0000,0000,,ネコの画像は色と形の\N集まりに過ぎません Dialogue: 0,0:04:47.49,0:04:51.58,Default,,0000,0000,0000,,これは初期のオブジェクト・モデリングで\N私たちがやっていたことでした Dialogue: 0,0:04:51.58,0:04:55.20,Default,,0000,0000,0000,,数学的な言語を使って\Nコンピュータアルゴリズムに Dialogue: 0,0:04:55.20,0:04:58.54,Default,,0000,0000,0000,,ネコには 丸い顔と\Nぽっちゃりした体と Dialogue: 0,0:04:58.54,0:05:00.84,Default,,0000,0000,0000,,2つのとがった耳と\N長いしっぽがあると教え Dialogue: 0,0:05:00.84,0:05:02.43,Default,,0000,0000,0000,,それでうまくいきそうでした Dialogue: 0,0:05:02.86,0:05:04.97,Default,,0000,0000,0000,,でもこのネコはどうでしょう? Dialogue: 0,0:05:04.97,0:05:06.06,Default,,0000,0000,0000,,(笑) Dialogue: 0,0:05:06.06,0:05:07.69,Default,,0000,0000,0000,,体がすっかり反り返っています Dialogue: 0,0:05:07.69,0:05:12.41,Default,,0000,0000,0000,,オブジェクトモデルに新しい形と視点を\N追加する必要があります Dialogue: 0,0:05:12.41,0:05:14.38,Default,,0000,0000,0000,,でもネコが一部隠れていたら\Nどうでしょう? Dialogue: 0,0:05:15.14,0:05:17.36,Default,,0000,0000,0000,,このおかしなネコたちはどうでしょう? Dialogue: 0,0:05:19.11,0:05:21.53,Default,,0000,0000,0000,,言いたいこと分かりますよね? Dialogue: 0,0:05:21.53,0:05:24.90,Default,,0000,0000,0000,,身近なペットのネコという\Nシンプルなものでさえ Dialogue: 0,0:05:24.90,0:05:29.06,Default,,0000,0000,0000,,オブジェクトモデルに\N無数のバリエーションを定義する必要があり Dialogue: 0,0:05:29.06,0:05:31.86,Default,,0000,0000,0000,,しかもこれは沢山あるものの\N1つに過ぎないんです Dialogue: 0,0:05:32.57,0:05:35.06,Default,,0000,0000,0000,,8年ほど前 Dialogue: 0,0:05:35.06,0:05:40.10,Default,,0000,0000,0000,,とてもシンプルながら本質的なある観察が\N私の考え方を変えました Dialogue: 0,0:05:41.42,0:05:43.82,Default,,0000,0000,0000,,子供は教えられなくても Dialogue: 0,0:05:43.82,0:05:46.71,Default,,0000,0000,0000,,成長の初期に\Nものの見方を身に付けるということです Dialogue: 0,0:05:46.71,0:05:51.37,Default,,0000,0000,0000,,子供は現実の世界における\N経験と例を通して学ぶのです Dialogue: 0,0:05:51.37,0:05:53.83,Default,,0000,0000,0000,,子供の目が\N生きたカメラで Dialogue: 0,0:05:53.83,0:05:56.66,Default,,0000,0000,0000,,200ミリ秒ごとに1枚 Dialogue: 0,0:05:56.66,0:06:00.84,Default,,0000,0000,0000,,写真を撮っていると\N考えてみましょう Dialogue: 0,0:06:00.84,0:06:03.98,Default,,0000,0000,0000,,これは目が動く\N平均時間です Dialogue: 0,0:06:03.98,0:06:07.51,Default,,0000,0000,0000,,すると子供は3歳になるまでに \N何億枚という Dialogue: 0,0:06:07.51,0:06:11.14,Default,,0000,0000,0000,,現実世界の写真を\N見ていることになります Dialogue: 0,0:06:11.14,0:06:13.64,Default,,0000,0000,0000,,膨大な量の訓練例です Dialogue: 0,0:06:14.38,0:06:20.37,Default,,0000,0000,0000,,それで気が付いたのは \Nアルゴリズムの改良ばかりに集中するのではなく Dialogue: 0,0:06:20.37,0:06:25.64,Default,,0000,0000,0000,,子供が経験を通じて\N受け取るような Dialogue: 0,0:06:25.64,0:06:28.96,Default,,0000,0000,0000,,量と質の訓練データを Dialogue: 0,0:06:28.96,0:06:32.84,Default,,0000,0000,0000,,アルゴリズムに与えてはどうか\Nということでした Dialogue: 0,0:06:32.84,0:06:34.70,Default,,0000,0000,0000,,このことに気付いた時 Dialogue: 0,0:06:34.70,0:06:37.67,Default,,0000,0000,0000,,私たちが持っているよりも\N遙かに多くの画像データを Dialogue: 0,0:06:37.67,0:06:42.13,Default,,0000,0000,0000,,集めなければならないことが\N明らかでした Dialogue: 0,0:06:42.13,0:06:44.71,Default,,0000,0000,0000,,何千倍も必要です Dialogue: 0,0:06:44.71,0:06:48.82,Default,,0000,0000,0000,,それで私はプリンストン大学の\Nカイ・リー教授と一緒に Dialogue: 0,0:06:48.82,0:06:53.57,Default,,0000,0000,0000,,2007年にImageNetプロジェクトを\N立ち上げました Dialogue: 0,0:06:53.57,0:06:57.07,Default,,0000,0000,0000,,幸い私たちは\N頭にカメラを付けて Dialogue: 0,0:06:57.07,0:06:59.17,Default,,0000,0000,0000,,何年も歩き回る必要は\Nありませんでした Dialogue: 0,0:06:59.17,0:07:02.33,Default,,0000,0000,0000,,人類がかつて作った\N最大の画像の宝庫 Dialogue: 0,0:07:02.33,0:07:05.07,Default,,0000,0000,0000,,インターネットに\N向かったのです Dialogue: 0,0:07:05.07,0:07:08.11,Default,,0000,0000,0000,,私たちは10億枚近い画像を\Nダウンロードし Dialogue: 0,0:07:08.11,0:07:13.99,Default,,0000,0000,0000,,アマゾン・メカニカル・タークのような\Nクラウドソーシング技術を使って Dialogue: 0,0:07:13.99,0:07:16.33,Default,,0000,0000,0000,,それらの画像に\Nラベル付けをしました Dialogue: 0,0:07:16.33,0:07:21.23,Default,,0000,0000,0000,,最盛期にはImageNetは\Nアマゾン・メカニカル・ターク作業者の Dialogue: 0,0:07:21.23,0:07:24.23,Default,,0000,0000,0000,,最大の雇用者の1つに\Nなっていました Dialogue: 0,0:07:24.23,0:07:28.08,Default,,0000,0000,0000,,167カ国の Dialogue: 0,0:07:28.08,0:07:32.12,Default,,0000,0000,0000,,5万人近い作業者が Dialogue: 0,0:07:32.12,0:07:36.07,Default,,0000,0000,0000,,10億枚近い画像を\N整理しラベル付けする作業に Dialogue: 0,0:07:36.07,0:07:39.64,Default,,0000,0000,0000,,携わりました Dialogue: 0,0:07:40.61,0:07:43.26,Default,,0000,0000,0000,,子供がその成長の初期に\N受け取るのに Dialogue: 0,0:07:43.26,0:07:47.16,Default,,0000,0000,0000,,匹敵する量の画像を\N用意するためには Dialogue: 0,0:07:47.16,0:07:51.34,Default,,0000,0000,0000,,それほどの労力が\N必要だったのです Dialogue: 0,0:07:52.15,0:07:56.05,Default,,0000,0000,0000,,コンピュータアルゴリズムの訓練に\Nビッグデータを使うというアイデアは Dialogue: 0,0:07:56.05,0:08:00.60,Default,,0000,0000,0000,,今からすると\N自明なものに見えるでしょうが Dialogue: 0,0:08:00.60,0:08:04.71,Default,,0000,0000,0000,,2007年当時は\Nそうではありませんでした Dialogue: 0,0:08:04.71,0:08:08.59,Default,,0000,0000,0000,,かなり長い間 こんなことをやっている人は\N私たち以外にいませんでした Dialogue: 0,0:08:08.59,0:08:13.87,Default,,0000,0000,0000,,親切な同僚が将来の職のためにもう少し有用なことを\Nした方がいいとアドバイスしてくれたくらいです Dialogue: 0,0:08:13.87,0:08:17.79,Default,,0000,0000,0000,,研究資金には\Nいつも困っていました Dialogue: 0,0:08:17.79,0:08:21.82,Default,,0000,0000,0000,,ImageNetの資金調達のために\Nクリーニング屋をまた開こうかしらと Dialogue: 0,0:08:21.82,0:08:24.48,Default,,0000,0000,0000,,学生に冗談で言ったくらいです Dialogue: 0,0:08:24.48,0:08:29.03,Default,,0000,0000,0000,,私が学生の頃 学費のために\Nやっていたことです Dialogue: 0,0:08:29.03,0:08:31.10,Default,,0000,0000,0000,,私たちは進み続け Dialogue: 0,0:08:31.10,0:08:34.81,Default,,0000,0000,0000,,2009年に\NImageNetプロジェクトは Dialogue: 0,0:08:34.81,0:08:38.86,Default,,0000,0000,0000,,日常的な英語を使って\N2万2千のカテゴリに分類した Dialogue: 0,0:08:38.86,0:08:43.66,Default,,0000,0000,0000,,1500万枚の画像の\Nデータベースを Dialogue: 0,0:08:43.66,0:08:46.98,Default,,0000,0000,0000,,完成させました Dialogue: 0,0:08:46.98,0:08:49.91,Default,,0000,0000,0000,,これは量という点でも\N質という点でも Dialogue: 0,0:08:49.91,0:08:52.88,Default,,0000,0000,0000,,かつてないスケールのものでした Dialogue: 0,0:08:52.88,0:08:55.11,Default,,0000,0000,0000,,一例を挙げると Dialogue: 0,0:08:55.11,0:08:59.15,Default,,0000,0000,0000,,ネコの画像は\N6万2千点以上あって Dialogue: 0,0:08:59.15,0:09:03.26,Default,,0000,0000,0000,,様々な見かけや\Nポーズのネコがいて Dialogue: 0,0:09:03.26,0:09:08.48,Default,,0000,0000,0000,,飼い猫から山猫まで\Nあらゆる種類を網羅しています Dialogue: 0,0:09:08.48,0:09:11.82,Default,,0000,0000,0000,,私たちはImageNetが\Nできあがったことを喜び Dialogue: 0,0:09:11.82,0:09:15.56,Default,,0000,0000,0000,,世界の研究者にも\Nその恩恵を受けて欲しいと思い Dialogue: 0,0:09:15.56,0:09:19.60,Default,,0000,0000,0000,,TEDの流儀で\Nデータセットをまるごと Dialogue: 0,0:09:19.60,0:09:23.32,Default,,0000,0000,0000,,無償で世界の研究者コミュニティに\N公開しました Dialogue: 0,0:09:23.32,0:09:28.12,Default,,0000,0000,0000,,(拍手) Dialogue: 0,0:09:29.42,0:09:33.95,Default,,0000,0000,0000,,こうしてコンピュータの脳を\N育てるためのデータができ Dialogue: 0,0:09:33.95,0:09:37.69,Default,,0000,0000,0000,,アルゴリズムに取り組む\N用意が整いました Dialogue: 0,0:09:37.69,0:09:42.87,Default,,0000,0000,0000,,それで分かったのは \NImageNetが提供する豊かな情報に適した Dialogue: 0,0:09:42.87,0:09:47.68,Default,,0000,0000,0000,,機械学習アルゴリズムがあることです Dialogue: 0,0:09:47.68,0:09:50.09,Default,,0000,0000,0000,,畳み込みニューラルネットワークと言って Dialogue: 0,0:09:50.09,0:09:55.34,Default,,0000,0000,0000,,福島邦彦 ジェフリー・ヒントン \Nヤン・ルカンといった人たちが Dialogue: 0,0:09:55.34,0:09:58.98,Default,,0000,0000,0000,,1970年代から1980年代にかけて\N開拓した領域です Dialogue: 0,0:09:58.98,0:10:04.60,Default,,0000,0000,0000,,脳が何十億という高度に結合し合った\Nニューロンからできているように Dialogue: 0,0:10:04.60,0:10:08.46,Default,,0000,0000,0000,,ニューラルネットワークの\N基本要素となっているのは Dialogue: 0,0:10:08.46,0:10:10.87,Default,,0000,0000,0000,,ニューロンのようなノードです Dialogue: 0,0:10:10.87,0:10:13.42,Default,,0000,0000,0000,,他のノードからの入力を受けて Dialogue: 0,0:10:13.42,0:10:16.14,Default,,0000,0000,0000,,他のノードへ出力を渡します Dialogue: 0,0:10:16.14,0:10:20.86,Default,,0000,0000,0000,,何十万 何百万という\Nこのようなノードが Dialogue: 0,0:10:20.86,0:10:23.75,Default,,0000,0000,0000,,これも脳と同様に Dialogue: 0,0:10:23.75,0:10:26.64,Default,,0000,0000,0000,,階層的に組織化されています Dialogue: 0,0:10:26.64,0:10:31.90,Default,,0000,0000,0000,,物を認識するモデルを訓練するために\N私たちが通常使うニューラルネットワークには Dialogue: 0,0:10:31.90,0:10:34.60,Default,,0000,0000,0000,,2千4百万のノード Dialogue: 0,0:10:34.60,0:10:37.49,Default,,0000,0000,0000,,1億4千万のパラメータ Dialogue: 0,0:10:37.49,0:10:40.46,Default,,0000,0000,0000,,150億の結合があります Dialogue: 0,0:10:40.46,0:10:43.08,Default,,0000,0000,0000,,ものすごく大きなモデルです Dialogue: 0,0:10:43.08,0:10:46.98,Default,,0000,0000,0000,,ImageNetの膨大なデータと Dialogue: 0,0:10:46.98,0:10:52.41,Default,,0000,0000,0000,,現代のCPUやGPUの性能を使って\Nこのような巨大なモデルを訓練することで Dialogue: 0,0:10:52.41,0:10:54.78,Default,,0000,0000,0000,,畳み込みニューラルネットワークは Dialogue: 0,0:10:54.78,0:10:58.22,Default,,0000,0000,0000,,誰も予想しなかったくらいに\N大きく花開きました Dialogue: 0,0:10:58.22,0:11:01.50,Default,,0000,0000,0000,,これは物の認識において\N目覚ましい結果を出す Dialogue: 0,0:11:01.50,0:11:06.06,Default,,0000,0000,0000,,大当たりのアーキテクチャとなっています Dialogue: 0,0:11:06.06,0:11:08.87,Default,,0000,0000,0000,,ここではコンピュータが Dialogue: 0,0:11:08.87,0:11:11.17,Default,,0000,0000,0000,,写真の中にネコがいることと Dialogue: 0,0:11:11.17,0:11:13.08,Default,,0000,0000,0000,,その場所を示しています Dialogue: 0,0:11:13.08,0:11:15.19,Default,,0000,0000,0000,,もちろんネコ以外のものも\N認識できます Dialogue: 0,0:11:15.19,0:11:17.63,Default,,0000,0000,0000,,こちらではコンピュータアルゴリズムが Dialogue: 0,0:11:17.63,0:11:20.90,Default,,0000,0000,0000,,写真の中に男の子とテディベアが\N写っていることを教えています Dialogue: 0,0:11:20.90,0:11:25.27,Default,,0000,0000,0000,,犬と 人物と 後方に小さな凧が\Nあることを示しています Dialogue: 0,0:11:25.27,0:11:28.40,Default,,0000,0000,0000,,とても沢山のものが\N写った写真から Dialogue: 0,0:11:28.40,0:11:33.04,Default,,0000,0000,0000,,男性 スケートボード 手すり \N街灯などを見分けています Dialogue: 0,0:11:33.04,0:11:38.34,Default,,0000,0000,0000,,写っているものが何なのか コンピュータが\Nそんなに自信を持てない場合もあります [動物] Dialogue: 0,0:11:39.50,0:11:41.77,Default,,0000,0000,0000,,コンピュータには\N当て推量をするよりは Dialogue: 0,0:11:41.77,0:11:45.65,Default,,0000,0000,0000,,確かなところを答えるよう\N教えています Dialogue: 0,0:11:45.65,0:11:48.46,Default,,0000,0000,0000,,ちょうど私たち自身がするように Dialogue: 0,0:11:48.46,0:11:53.13,Default,,0000,0000,0000,,一方で何が写っているかについて\Nコンピュータアルゴリズムが Dialogue: 0,0:11:53.13,0:11:55.38,Default,,0000,0000,0000,,驚くほど正確に\N言い当てることもあります Dialogue: 0,0:11:55.38,0:11:58.82,Default,,0000,0000,0000,,たとえば自動車の車種や\Nモデルや年式のような Dialogue: 0,0:11:58.82,0:12:04.20,Default,,0000,0000,0000,,このアルゴリズムを\Nアメリカの数百都市の Dialogue: 0,0:12:04.20,0:12:07.34,Default,,0000,0000,0000,,何百万という\NGoogleストリートビュー画像に適用した結果 Dialogue: 0,0:12:07.34,0:12:10.26,Default,,0000,0000,0000,,面白い発見がありました Dialogue: 0,0:12:10.26,0:12:13.34,Default,,0000,0000,0000,,まず 車の値段は Dialogue: 0,0:12:13.34,0:12:16.88,Default,,0000,0000,0000,,家計収入とよく相関しているという Dialogue: 0,0:12:16.88,0:12:19.22,Default,,0000,0000,0000,,予想が裏付けられました Dialogue: 0,0:12:19.22,0:12:22.74,Default,,0000,0000,0000,,でも驚いたことに \N車の値段は Dialogue: 0,0:12:22.74,0:12:26.05,Default,,0000,0000,0000,,街の犯罪率とも\Nよく相関していたんです Dialogue: 0,0:12:26.83,0:12:30.97,Default,,0000,0000,0000,,それはまた郵便番号区域ごとの\N投票傾向とも相関しています Dialogue: 0,0:12:32.06,0:12:34.27,Default,,0000,0000,0000,,それでは コンピュータは Dialogue: 0,0:12:34.27,0:12:39.42,Default,,0000,0000,0000,,既に人間の能力に追いつき \N追い越しているのでしょうか? Dialogue: 0,0:12:39.42,0:12:41.56,Default,,0000,0000,0000,,結論を急がないで Dialogue: 0,0:12:41.56,0:12:46.48,Default,,0000,0000,0000,,これまでのところ 私たちは\Nコンピュータに物の見方を教えただけです Dialogue: 0,0:12:46.48,0:12:51.12,Default,,0000,0000,0000,,小さな子供が名詞をいくつか\N言えるようになったようなものです Dialogue: 0,0:12:51.12,0:12:53.79,Default,,0000,0000,0000,,ものすごい成果ですが Dialogue: 0,0:12:53.79,0:12:56.25,Default,,0000,0000,0000,,まだ第一歩にすぎず Dialogue: 0,0:12:56.25,0:13:00.02,Default,,0000,0000,0000,,次の開発目標があります Dialogue: 0,0:13:00.02,0:13:03.48,Default,,0000,0000,0000,,子供は文章でコミュニケーションを\Nするようになります Dialogue: 0,0:13:03.48,0:13:07.70,Default,,0000,0000,0000,,だから写真を見て小さな女の子が\N単にネコと言わずに Dialogue: 0,0:13:07.70,0:13:12.90,Default,,0000,0000,0000,,ネコがベッドに座っていると\N言うのを聞いたわけです Dialogue: 0,0:13:12.90,0:13:18.50,Default,,0000,0000,0000,,コンピュータが写真を見て\N文章を作れるよう教えるために Dialogue: 0,0:13:18.50,0:13:22.45,Default,,0000,0000,0000,,このビッグデータと\N機械学習の結びつきが Dialogue: 0,0:13:22.45,0:13:24.72,Default,,0000,0000,0000,,新たなステップを\N踏む必要があります Dialogue: 0,0:13:24.72,0:13:28.88,Default,,0000,0000,0000,,コンピュータは\N写真だけでなく Dialogue: 0,0:13:28.88,0:13:31.73,Default,,0000,0000,0000,,人が発する自然言語の文章も Dialogue: 0,0:13:31.73,0:13:35.06,Default,,0000,0000,0000,,学ぶ必要があります Dialogue: 0,0:13:35.06,0:13:38.91,Default,,0000,0000,0000,,脳が視覚と言語を\N結びつけるように Dialogue: 0,0:13:38.91,0:13:44.11,Default,,0000,0000,0000,,画像の断片のような\N視覚的なものの一部と Dialogue: 0,0:13:44.11,0:13:48.07,Default,,0000,0000,0000,,文章の中の単語やフレーズを\N繋ぎ合わせるモデルを Dialogue: 0,0:13:48.07,0:13:50.22,Default,,0000,0000,0000,,私たちは開発しました Dialogue: 0,0:13:50.22,0:13:52.98,Default,,0000,0000,0000,,4ヶ月ほど前 Dialogue: 0,0:13:52.98,0:13:55.63,Default,,0000,0000,0000,,ついに私たちは\Nすべてをまとめ Dialogue: 0,0:13:55.63,0:13:58.94,Default,,0000,0000,0000,,初めて見た写真について Dialogue: 0,0:13:58.94,0:14:03.40,Default,,0000,0000,0000,,人が書いたような\N記述文を生成できる Dialogue: 0,0:14:03.40,0:14:06.91,Default,,0000,0000,0000,,最初のコンピュータ・ビジョン・\Nモデルを作り上げました Dialogue: 0,0:14:06.91,0:14:11.55,Default,,0000,0000,0000,,冒頭で小さな女の子が説明したのと\N同じ写真を見て Dialogue: 0,0:14:11.55,0:14:13.53,Default,,0000,0000,0000,,そのコンピュータが何と言ったか Dialogue: 0,0:14:13.53,0:14:17.36,Default,,0000,0000,0000,,お見せしましょう Dialogue: 0,0:14:19.05,0:14:22.86,Default,,0000,0000,0000,,「ゾウの横に立っている男」 Dialogue: 0,0:14:24.39,0:14:28.03,Default,,0000,0000,0000,,「空港の滑走路にいる大きな飛行機」 Dialogue: 0,0:14:29.06,0:14:33.27,Default,,0000,0000,0000,,私たちは今もアルゴリズムを改良しようと\N熱心に取り組んでいて Dialogue: 0,0:14:33.27,0:14:35.86,Default,,0000,0000,0000,,学ぶべきことは\Nまだまだあります Dialogue: 0,0:14:35.86,0:14:38.16,Default,,0000,0000,0000,,(拍手) Dialogue: 0,0:14:39.56,0:14:42.88,Default,,0000,0000,0000,,コンピュータは\Nまだ間違いを犯します Dialogue: 0,0:14:42.88,0:14:46.27,Default,,0000,0000,0000,,「ベッドの上の毛布の中のネコ」 Dialogue: 0,0:14:46.27,0:14:48.82,Default,,0000,0000,0000,,ネコを沢山見過ぎたせいで Dialogue: 0,0:14:48.82,0:14:51.75,Default,,0000,0000,0000,,何でもネコみたいに\N見えるのかもしれません Dialogue: 0,0:14:53.32,0:14:56.18,Default,,0000,0000,0000,,「野球バットを持つ小さな男の子」 Dialogue: 0,0:14:56.18,0:14:57.95,Default,,0000,0000,0000,,(笑) Dialogue: 0,0:14:57.95,0:15:02.53,Default,,0000,0000,0000,,歯ブラシを見たことがないと \N野球バットと混同してしまいます Dialogue: 0,0:15:03.31,0:15:06.74,Default,,0000,0000,0000,,「建物脇の道を馬に乗って行く男」 Dialogue: 0,0:15:06.74,0:15:08.77,Default,,0000,0000,0000,,(笑) Dialogue: 0,0:15:08.77,0:15:12.32,Default,,0000,0000,0000,,美術はまだコンピュータに\N教えていませんでした Dialogue: 0,0:15:13.77,0:15:16.65,Default,,0000,0000,0000,,「草原に立つシマウマ」 Dialogue: 0,0:15:16.65,0:15:20.02,Default,,0000,0000,0000,,私たちのように\N自然の美を慈しむことは Dialogue: 0,0:15:20.02,0:15:22.46,Default,,0000,0000,0000,,まだ学んでいません Dialogue: 0,0:15:22.46,0:15:25.29,Default,,0000,0000,0000,,長い道のりでした Dialogue: 0,0:15:25.29,0:15:29.52,Default,,0000,0000,0000,,0歳から3歳まで行くのは\N大変でした Dialogue: 0,0:15:29.52,0:15:35.11,Default,,0000,0000,0000,,でも本当の挑戦は3歳から13歳 \Nさらにその先へと行くことです Dialogue: 0,0:15:35.11,0:15:39.48,Default,,0000,0000,0000,,あの男の子とケーキの写真を\Nもう一度見てみましょう Dialogue: 0,0:15:39.48,0:15:43.54,Default,,0000,0000,0000,,私たちはコンピュータに\N物を識別することを教え Dialogue: 0,0:15:43.54,0:15:47.100,Default,,0000,0000,0000,,写真を簡単に説明することさえ\N教えました Dialogue: 0,0:15:47.100,0:15:51.57,Default,,0000,0000,0000,,「ケーキのあるテーブルにつく人」 Dialogue: 0,0:15:51.57,0:15:54.20,Default,,0000,0000,0000,,しかしこの写真には\N単に人とケーキというよりも Dialogue: 0,0:15:54.20,0:15:56.47,Default,,0000,0000,0000,,遙かに多くのものがあります Dialogue: 0,0:15:56.47,0:16:00.94,Default,,0000,0000,0000,,コンピュータが見なかったのは \Nこのケーキが特別なイタリアのケーキで Dialogue: 0,0:16:00.94,0:16:04.16,Default,,0000,0000,0000,,イースターの時に\N食べるものだということです Dialogue: 0,0:16:04.16,0:16:07.36,Default,,0000,0000,0000,,男の子が着ているのは\Nお気に入りのTシャツで Dialogue: 0,0:16:07.36,0:16:11.33,Default,,0000,0000,0000,,お父さんがシドニー旅行の\Nおみやげにくれたものだということ Dialogue: 0,0:16:11.33,0:16:15.14,Default,,0000,0000,0000,,私たちはみんな \Nこの男の子がどんなに喜んでいるか Dialogue: 0,0:16:15.14,0:16:18.34,Default,,0000,0000,0000,,何を思っているかが分かります Dialogue: 0,0:16:19.21,0:16:22.34,Default,,0000,0000,0000,,これは息子のレオです Dialogue: 0,0:16:22.34,0:16:24.96,Default,,0000,0000,0000,,視覚的な知性を\N追い求める探求の中で Dialogue: 0,0:16:24.96,0:16:27.35,Default,,0000,0000,0000,,私はいつもレオのことや Dialogue: 0,0:16:27.35,0:16:30.26,Default,,0000,0000,0000,,レオが住むであろう\N未来の世界のことを考えています Dialogue: 0,0:16:30.26,0:16:32.28,Default,,0000,0000,0000,,機械に見ることが\Nできるようになれば Dialogue: 0,0:16:32.28,0:16:36.99,Default,,0000,0000,0000,,医師や看護師は疲れを知らない\N別の目を手に入れて Dialogue: 0,0:16:36.99,0:16:41.08,Default,,0000,0000,0000,,患者の診断や世話に\N役立てられるでしょう Dialogue: 0,0:16:41.08,0:16:45.46,Default,,0000,0000,0000,,自動車は道路をより賢明に\N安全に走行するようになるでしょう Dialogue: 0,0:16:45.46,0:16:48.16,Default,,0000,0000,0000,,人間だけでなくロボットも Dialogue: 0,0:16:48.16,0:16:53.01,Default,,0000,0000,0000,,災害地域に取り残され負傷した人々を救出する\N手助けができるようになるでしょう Dialogue: 0,0:16:53.80,0:16:58.16,Default,,0000,0000,0000,,私たちは機械の助けを借りて \N新種の生物やより優れた素材を発見し Dialogue: 0,0:16:58.16,0:17:02.10,Default,,0000,0000,0000,,未だ見ぬフロンティアを\N探検するようになるでしょう Dialogue: 0,0:17:03.11,0:17:07.28,Default,,0000,0000,0000,,私たちは少しずつ機械に\N視覚を与えています Dialogue: 0,0:17:07.28,0:17:09.62,Default,,0000,0000,0000,,最初に私たちが\N機械に見ることを教え Dialogue: 0,0:17:09.62,0:17:13.36,Default,,0000,0000,0000,,それから機械が より良く見られるよう\N私たちを助けてくれることでしょう Dialogue: 0,0:17:13.36,0:17:17.01,Default,,0000,0000,0000,,歴史上初めて\N人間以外の目が Dialogue: 0,0:17:17.01,0:17:19.94,Default,,0000,0000,0000,,世界について考察し\N探求するようになるのです Dialogue: 0,0:17:19.94,0:17:23.40,Default,,0000,0000,0000,,私たちは機械の知性を\N利用するだけでなく Dialogue: 0,0:17:23.40,0:17:29.58,Default,,0000,0000,0000,,想像もできないような方法で\N機械と人間が協力し合うようになるでしょう Dialogue: 0,0:17:29.58,0:17:31.74,Default,,0000,0000,0000,,私が追い求めているのは Dialogue: 0,0:17:31.74,0:17:34.45,Default,,0000,0000,0000,,コンピュータに視覚的な知性を与え Dialogue: 0,0:17:34.45,0:17:39.58,Default,,0000,0000,0000,,レオや世界のために\Nより良い未来を作り出すということです Dialogue: 0,0:17:39.58,0:17:41.39,Default,,0000,0000,0000,,ありがとうございました Dialogue: 0,0:17:41.39,0:17:45.18,Default,,0000,0000,0000,,(拍手)