やあ、僕はジョン Googleでリサーチ&マシンラーニングチームを率いている 世界中の人たちが検索エンジンを使って ささいな疑問や驚くほど 重要な疑問を調べてるのって かなり刺激的なものだと思う だから出来る限り最適な答えを 彼らに提示することはとても大きな責任だと思っている こんにちは、私はアクシャヤ。Bing検索チームで働いているわ 人工知能やマシンラーニングを 見始めるような時はたくさんあるけど、 ユーザーがどうやって使用していくのかについて議論する必要があるわ だって、一日の終わりには社会に何らかの影響を与えていたいもの 単純な質問をしてみましょう 火星へ行けるまではどのくらいかかる? これらの検索結果はどこから来たもので なぜ他の回答よりもこれらが最初にリスト化されているのか? そうね、まずはどうやって検索エンジンがあなたの検索に対して 結果を出しているのかを見てみましょうか 検索を行う時に、まず始めに知らなくちゃいけないことは 実際、検索エンジンはリアルタイムであなたの検索ワードを ワールドワイドウェブ上で作動させているのではないこと それゆえに、10億以上のウェブサイトがインターネット上にあって 数百以上のウェブサイトが1分ごとに作られているってこと だから、もしあなたの求めている結果を見つけるために 検索エンジンがこれら全てのサイトを見て回らなくちゃならなければ 永遠に時間はかかるわよね 検索結果を素早く出すために 事前に検索エンジンは定期的にウェブをスキャニングしていて 後であなたの検索に役立つような情報を記録しているの こうすることで、「火星へ行く」ことについて検索をかける場合、 検索エンジンはリアルタイムであなたにその答えを出せるような ものを既に持っているというわけ どのように作動しているかを見てみましょう インターネットは、それぞれがハイパーリンクで繋がっているページのウェブね これらのウェブページを横切るスパイダーというプログラムがあるんだけど、 情報を集めるために検索エンジンは、 そのスパイダーを定期的に作動させている ハイパーリンクを見つけるたびに 全てのページを訪問するまで付いて行って、 全体のインターネット上で見つけることができるようになる スパイダーが訪問する各ページにおいて 検索に必要かもしれない情報を記録するために 検索インデックスと呼ばれる特別なデータベースへ、その情報を追加する では、先程の検索に戻って どのように検索エンジンが結果をもってくることが できるのかを見てみましょう 「火星に行くにはどのくらいかかる?」と質問した時 検索エンジンは、検索インデックスにあるそれらの単語一つ一つを探して その単語が含まれているインターネット上の 全てのページのリストを素早くゲットする だけど、これらの単語を検索するだけだと 数百万ものページが出てきてしまうので 検索エンジンは、まず始めにどの結果が一番あなたに見せるのに 適しているのかを決める必要がある この部分がトリッキーなところなんだけど。だって、検索エンジンは あなたが何を探しているのかを推測しなくちゃならないからね それぞれの検索エンジンは、独自のアルゴリズムを使っていて あなたがほしいと思っているものをベースにして、ページをランク付ける 検索エンジンのランキングアルゴリズムは 検索ワードがページのタイトルに表示されているかをチェックして、 その隣同士に全ての単語が並んでいるのかどうかをチェックしたり あるいはどのページをあなたが見たがっていて、どれを見たがっていないのかを 決められるような他の計算をする 数字を求めたりする Googleは一番有名なアルゴリズムを開発したんだけど それはどのくらい他のウェブページがそのページにリンクされているかを 考慮することで、一番関連のある検索結果を選ぶようなものね アイデアとしては、多くのウェブサイトがそのウェブサイトを 面白いものだと思っているのであれば それはもしかしたら、あなたが探しているものである可能性が高い 「ページランク」と呼ばれるこのアルゴリズムは ウェブページをランク付けするからではなく、 その発明者、ラリー・ページに由来している Google設立者の一人だね 大体の場合、訪問されることでウェブサイトはお金を稼ぐことができるので