0:00:06.070,0:00:07.120 やあ、僕はジョン 0:00:07.510,0:00:10.140 Googleで[br]リサーチ&マシンラーニングチームを率いている 0:00:12.130,0:00:14.230 世界中の人たちが検索エンジンを使って 0:00:14.230,0:00:16.214 ささいな疑問や驚くほど 0:00:16.215,0:00:18.730 重要な疑問を調べてるのって 0:00:18.730,0:00:20.930 かなり刺激的なものだと思う 0:00:20.930,0:00:23.030 だから出来る限り最適な答えを 0:00:23.030,0:00:24.864 彼らに提示することは[br]とても大きな責任だと思っている 0:00:26.710,0:00:30.610 こんにちは、私はアクシャヤ[br]Bing検索チームで働いているわ 0:00:30.910,0:00:33.190 人工知能やマシンラーニングを 0:00:33.190,0:00:35.800 見始めるような時はたくさんあるけど、 0:00:35.830,0:00:39.010 ユーザーがどうやって使用していくのかについて[br]議論する必要があるわ 0:00:39.140,0:00:42.390 だって、一日の終わりには[br]社会に何らかの影響を与えていたいもの 0:00:43.780,0:00:45.400 単純な質問をしてみましょう 0:00:45.820,0:00:48.070 火星へ行けるまではどのくらいかかる? 0:00:49.330,0:00:50.950 これらの検索結果はどこから来たもので 0:00:51.370,0:00:54.100 なぜ他の回答よりも[br]これらが最初にリスト化されているのか? 0:00:55.700,0:00:58.150 まずはどうやって検索エンジンが[br]あなたの検索に対して 0:00:58.150,0:00:59.860 結果を出しているのかを見てみようか 0:01:00.690,0:01:03.360 検索を行う時に[br]まず始めに知らなくちゃいけないことは 0:01:03.430,0:01:06.480 実際、検索エンジンは[br]リアルタイムであなたの検索ワードを 0:01:06.480,0:01:08.010 ワールドワイドウェブ上で[br]作動させているのではないこと 0:01:08.140,0:01:10.610 それゆえ、10億以上のウェブサイトが[br]インターネット上にあって 0:01:10.610,0:01:14.140 数百以上のウェブサイトが[br]1分ごとに作られているってこと 0:01:14.140,0:01:16.210 だから、もしあなたの求めている結果を見つけるために 0:01:16.240,0:01:18.690 検索エンジンがこれら全てのサイトを[br]見て回らなくちゃならなければ 0:01:18.690,0:01:20.120 永遠に時間はかかるよね 0:01:20.500,0:01:21.940 検索結果を素早く出すために 0:01:21.970,0:01:24.940 事前に検索エンジンは定期的に[br]ウェブをスキャニングしていて 0:01:25.420,0:01:28.560 後であなたの検索に[br]役立つような情報を記録している 0:01:28.930,0:01:31.270 こうすることで、「火星へ行く」ことに[br]ついて検索をかける場合、 0:01:31.630,0:01:33.240 検索エンジンはリアルタイムで 0:01:33.240,0:01:35.728 あなたにその答えを出せるようなものを[br]既に持っているというわけ 0:01:36.250,0:01:37.540 どのように作動しているかを見てみましょう 0:01:37.900,0:01:42.010 インターネットは、それぞれが[br]ハイパーリンクで繋がっているページのウェブね 0:01:42.400,0:01:45.920 これらのウェブページを横切るスパイダーという[br]プログラムがあるんだけど、 0:01:45.920,0:01:47.380 情報を集めるために検索エンジンは、 0:01:47.380,0:01:49.040 そのスパイダーを定期的に作動させている 0:01:49.780,0:01:51.550 ハイパーリンクを見つけるたびに 0:01:52.090,0:01:55.000 全てのページを訪問するまで付いて行って、 0:01:55.030,0:01:57.240 全体のインターネット上で見つけることができるようになる 0:01:57.335,0:01:59.170 スパイダーが訪問する各ページにおいて 0:01:59.200,0:02:02.320 検索に必要かもしれない情報を記録するために 0:02:02.500,0:02:05.650 検索インデックスと呼ばれる特別なデータベースへ[br]その情報を追加する 0:02:07.166,0:02:09.530 では、先程の検索に戻って 0:02:09.590,0:02:11.990 どのように検索エンジンが結果をもってくることが 0:02:11.990,0:02:13.333 できるのかを見てみよう 0:02:13.640,0:02:16.460 「火星に行くにはどのくらいかかる?」と質問した時 0:02:16.640,0:02:18.860 検索エンジンは、検索インデックスにある[br]それらの単語一つ一つを探して 0:02:18.920,0:02:21.410 その単語が含まれているインターネット上の 0:02:21.410,0:02:24.500 全てのページのリストを素早くゲットする 0:02:24.890,0:02:26.870 だけど、これらの単語を検索するだけだと 0:02:26.870,0:02:28.760 数百万ものページが出てきてしまうので 0:02:28.760,0:02:31.110 検索エンジンは、まず始めに[br]どの結果が一番あなたに見せるのに 0:02:31.110,0:02:33.120 適しているのかを決める必要がある 0:02:33.340,0:02:36.010 この部分がトリッキーなんだけど[br]だって、検索エンジンは 0:02:36.010,0:02:38.040 あなたが何を探しているのかを[br]推測しなくちゃならないからね 0:02:38.930,0:02:41.360 それぞれの検索エンジンは[br]独自のアルゴリズムを使っていて 0:02:41.360,0:02:44.230 あなたがほしいと思っているものをベースにして[br]ページをランク付ける 0:02:44.930,0:02:47.660 検索エンジンのランキングアルゴリズムは 0:02:47.990,0:02:50.360 検索ワードがページのタイトルに[br]表示されているかをチェックして 0:02:50.900,0:02:53.820 その隣同士に全ての単語が[br]並んでいるのかどうかをチェックしたり 0:02:54.520,0:02:57.510 あるいはどのページをあなたが見たがっていて[br]どれを見たがっていないのかを 0:02:57.510,0:02:59.430 決められるような他の計算をする 0:02:59.430,0:03:01.420 数字を求めたりする 0:03:02.960,0:03:04.960 Googleは一番有名なアルゴリズムを開発したんだけど 0:03:04.960,0:03:08.530 それはどのくらい他のウェブページが[br]そのページにリンクされているかを 0:03:08.560,0:03:11.230 考慮することで[br]一番関連のある検索結果を選ぶ 0:03:11.830,0:03:14.140 アイデアとしては[br]多くのウェブサイトがそのウェブサイトを 0:03:14.140,0:03:15.660 面白いものだと思っているのであれば 0:03:15.660,0:03:17.940 それはもしかしたら[br]あなたが探しているものである可能性が高い 0:03:18.190,0:03:20.020 「ページランク」と呼ばれるこのアルゴリズムは 0:03:20.590,0:03:22.330 ウェブページをランク付けするからではなく、 0:03:22.570,0:03:25.210 その発明者、ラリー・ページに由来している 0:03:25.480,0:03:27.333 Google設立者の一人だね 0:03:27.940,0:03:30.520 大体の場合、訪問されることで[br]ウェブサイトはお金を稼ぐことができるので 0:03:30.820,0:03:32.950 スパムの発信者は[br]どうやって検索アルゴリズムを操作できるのか 0:03:32.950,0:03:35.741 定期的にその方法を探っている。そうすれば 0:03:35.742,0:03:37.931 検索結果でより高い位置に[br]リストされることが可能になるからね 0:03:38.260,0:03:40.750 検索エンジンは[br]定期的にアルゴリズムを更新することで 0:03:40.750,0:03:44.296 結果の上部に信ぴょう性のないサイトや[br]フェイクサイトが来ないようにしている 0:03:44.680,0:03:47.550 最近では[br]これらのページに信ぴょう性がないかどうかは 0:03:47.550,0:03:50.490 ウェブアドレスを見て[br]信頼できるソースであるのかどうかを決めるのは 0:03:50.490,0:03:52.990 あなた次第でもあるんだけど 0:03:53.680,0:03:55.390 検索プログラムは、アルゴリズムを改善するために[br]常に進化し続けている 0:03:55.420,0:03:58.420 そうすることで、他の競合社よりも素早く[br]より良い結果を 0:03:58.540,0:04:00.460 もたらすことができるようにね 0:04:01.000,0:04:03.100 今日の検索エンジンは、検索を絞り込むのに 0:04:03.100,0:04:06.820 明確に提示していないような情報さえも[br]使用することができる 0:04:07.150,0:04:10.120 だから例えば、「ドッグ・パーク」へ検索をかけた場合、 0:04:10.240,0:04:12.190 多くの検索エンジンでは[br]あなたの近くにある全てのドッグ・パークを 0:04:12.190,0:04:13.840 検索結果して表示するだろう 0:04:14.080,0:04:16.260 あなたが自分の位置情報を入力していなくてもね 0:04:17.800,0:04:20.530 現代の検索エンジンは、ページにある単語以上のことを 0:04:20.530,0:04:22.060 理解できるようになっているけど 0:04:22.300,0:04:24.970 それはあなたが探しているものに対して 0:04:24.970,0:04:26.750 最適な結果を表示するためなの 0:04:27.130,0:04:29.980 例えば、「速いピッチャー」の検索をかける場合 0:04:30.280,0:04:32.300 検索エンジンはあなたがアスリートを[br]探しているのだということが分かっている 0:04:32.500,0:04:34.450 だけど、もし「大きいピッチャー」という検索をかけたら 0:04:34.450,0:04:36.730 キッチン用品のオプションを表示するかもしれない 0:04:38.420,0:04:41.910 単語をより良く理解するためにも[br]マシンラーニングというものを使っている 0:04:41.910,0:04:43.985 人工知能の一種だよ 0:04:43.985,0:04:46.050 これによって検索アルゴリズムが[br]ページ内の単語や個別の文字だけじゃなく 0:04:46.090,0:04:48.400 単語の基本的な意味を理解して 0:04:48.400,0:04:51.280 検索をかけることができるようになる 0:04:53.690,0:04:55.850 インターネットは指数関数的に成長しているけど 0:04:56.210,0:04:59.810 検索エンジンをデザインするチームが[br]的確な仕事を行うことで 0:05:00.080,0:05:04.090 あなたが知りたい情報が常に一番に[br]あがってくるようにすることができるのよ