-
やあ、僕はジョン
-
Googleで
リサーチ&マシンラーニングチームを率いている
-
世界中の人たちが検索エンジンを使って
-
ささいな疑問や驚くほど
-
重要な疑問を調べてるのって
-
かなり刺激的なものだと思う
-
だから出来る限り最適な答えを
-
彼らに提示することは
とても大きな責任だと思っている
-
こんにちは、私はアクシャヤ
Bing検索チームで働いているわ
-
人工知能やマシンラーニングを
-
見始めるような時はたくさんあるけど、
-
ユーザーがどうやって使用していくのかについて
議論する必要があるわ
-
だって、一日の終わりには
社会に何らかの影響を与えていたいもの
-
単純な質問をしてみましょう
-
火星へ行けるまではどのくらいかかる?
-
これらの検索結果はどこから来たもので
-
なぜ他の回答よりも
これらが最初にリスト化されているのか?
-
まずはどうやって検索エンジンが
あなたの検索に対して
-
結果を出しているのかを見てみようか
-
検索を行う時に
まず始めに知らなくちゃいけないことは
-
実際、検索エンジンは
リアルタイムであなたの検索ワードを
-
ワールドワイドウェブ上で
作動させているのではないこと
-
それゆえ、10億以上のウェブサイトが
インターネット上にあって
-
数百以上のウェブサイトが
1分ごとに作られているってこと
-
だから、もしあなたの求めている結果を見つけるために
-
検索エンジンがこれら全てのサイトを
見て回らなくちゃならなければ
-
永遠に時間はかかるよね
-
検索結果を素早く出すために
-
事前に検索エンジンは定期的に
ウェブをスキャニングしていて
-
後であなたの検索に
役立つような情報を記録している
-
こうすることで、「火星へ行く」ことに
ついて検索をかける場合、
-
検索エンジンはリアルタイムで
-
あなたにその答えを出せるようなものを
既に持っているというわけ
-
どのように作動しているかを見てみましょう
-
インターネットは、それぞれが
ハイパーリンクで繋がっているページのウェブね
-
これらのウェブページを横切るスパイダーという
プログラムがあるんだけど、
-
情報を集めるために検索エンジンは、
-
そのスパイダーを定期的に作動させている
-
ハイパーリンクを見つけるたびに
-
全てのページを訪問するまで付いて行って、
-
全体のインターネット上で見つけることができるようになる
-
スパイダーが訪問する各ページにおいて
-
検索に必要かもしれない情報を記録するために
-
検索インデックスと呼ばれる特別なデータベースへ
その情報を追加する
-
では、先程の検索に戻って
-
どのように検索エンジンが結果をもってくることが
-
できるのかを見てみよう
-
「火星に行くにはどのくらいかかる?」と質問した時
-
検索エンジンは、検索インデックスにある
それらの単語一つ一つを探して
-
その単語が含まれているインターネット上の
-
全てのページのリストを素早くゲットする
-
だけど、これらの単語を検索するだけだと
-
数百万ものページが出てきてしまうので
-
検索エンジンは、まず始めに
どの結果が一番あなたに見せるのに
-
適しているのかを決める必要がある
-
この部分がトリッキーなんだけど
だって、検索エンジンは
-
あなたが何を探しているのかを
推測しなくちゃならないからね
-
それぞれの検索エンジンは
独自のアルゴリズムを使っていて
-
あなたがほしいと思っているものをベースにして
ページをランク付ける
-
検索エンジンのランキングアルゴリズムは
-
検索ワードがページのタイトルに
表示されているかをチェックして
-
その隣同士に全ての単語が
並んでいるのかどうかをチェックしたり
-
あるいはどのページをあなたが見たがっていて
どれを見たがっていないのかを
-
決められるような他の計算をする
-
数字を求めたりする
-
Googleは一番有名なアルゴリズムを開発したんだけど
-
それはどのくらい他のウェブページが
そのページにリンクされているかを
-
考慮することで
一番関連のある検索結果を選ぶ
-
アイデアとしては
多くのウェブサイトがそのウェブサイトを
-
面白いものだと思っているのであれば
-
それはもしかしたら
あなたが探しているものである可能性が高い
-
「ページランク」と呼ばれるこのアルゴリズムは
-
ウェブページをランク付けするからではなく、
-
その発明者、ラリー・ページに由来している
-
Google設立者の一人だね
-
大体の場合、訪問されることで
ウェブサイトはお金を稼ぐことができるので
-
スパムの発信者は
どうやって検索アルゴリズムを操作できるのか
-
定期的にその方法を探っている。そうすれば
-
検索結果でより高い位置に
リストされることが可能になるからね
-
検索エンジンは
定期的にアルゴリズムを更新することで
-
結果の上部に信ぴょう性のないサイトや
フェイクサイトが来ないようにしている
-
最近では
これらのページに信ぴょう性がないかどうかは
-
ウェブアドレスを見て
信頼できるソースであるのかどうかを決めるのは
-
あなた次第でもあるんだけど
-
検索プログラムは、アルゴリズムを改善するために
常に進化し続けている
-
そうすることで、他の競合社よりも素早く
より良い結果を
-
もたらすことができるようにね
-
今日の検索エンジンは、検索を絞り込むのに
-
明確に提示していないような情報さえも
使用することができる
-
だから例えば、「ドッグ・パーク」へ検索をかけた場合、
-
多くの検索エンジンでは
あなたの近くにある全てのドッグ・パークを
-
検索結果して表示するだろう
-
あなたが自分の位置情報を入力していなくてもね
-
現代の検索エンジンは、ページにある単語以上のことを
-
理解できるようになっているけど
-
それはあなたが探しているものに対して
-
最適な結果を表示するためなの
-
例えば、「速いピッチャー」の検索をかける場合
-
検索エンジンはあなたがアスリートを
探しているのだということが分かっている
-
だけど、もし「大きいピッチャー」という検索をかけたら
-
キッチン用品のオプションを表示するかもしれない
-
単語をより良く理解するためにも
マシンラーニングというものを使っている
-
人工知能の一種だよ
-
これによって検索アルゴリズムが
ページ内の単語や個別の文字だけじゃなく
-
単語の基本的な意味を理解して
-
検索をかけることができるようになる
-
インターネットは指数関数的に成長しているけど
-
検索エンジンをデザインするチームが
的確な仕事を行うことで
-
あなたが知りたい情報が常に一番に
あがってくるようにすることができるのよ