やあ、僕はジョン Googleで リサーチ&マシンラーニングチームを率いている 世界中の人たちが検索エンジンを使って ささいな疑問や驚くほど 重要な疑問を調べてるのって かなり刺激的なものだと思う だから出来る限り最適な答えを 彼らに提示することは とても大きな責任だと思っている こんにちは、私はアクシャヤ Bing検索チームで働いているわ 人工知能やマシンラーニングを 見始めるような時はたくさんあるけど、 ユーザーがどうやって使用していくのかについて 議論する必要があるわ だって、一日の終わりには 社会に何らかの影響を与えていたいもの 単純な質問をしてみましょう 火星へ行けるまではどのくらいかかる? これらの検索結果はどこから来たもので なぜ他の回答よりも これらが最初にリスト化されているのか? まずはどうやって検索エンジンが あなたの検索に対して 結果を出しているのかを見てみようか 検索を行う時に まず始めに知らなくちゃいけないことは 実際、検索エンジンは リアルタイムであなたの検索ワードを ワールドワイドウェブ上で 作動させているのではないこと それゆえ、10億以上のウェブサイトが インターネット上にあって 数百以上のウェブサイトが 1分ごとに作られているってこと だから、もしあなたの求めている結果を見つけるために 検索エンジンがこれら全てのサイトを 見て回らなくちゃならなければ 永遠に時間はかかるよね 検索結果を素早く出すために 事前に検索エンジンは定期的に ウェブをスキャニングしていて 後であなたの検索に 役立つような情報を記録している こうすることで、「火星へ行く」ことに ついて検索をかける場合、 検索エンジンはリアルタイムで あなたにその答えを出せるようなものを 既に持っているというわけ どのように作動しているかを見てみましょう インターネットは、それぞれが ハイパーリンクで繋がっているページのウェブね これらのウェブページを横切るスパイダーという プログラムがあるんだけど、 情報を集めるために検索エンジンは、 そのスパイダーを定期的に作動させている ハイパーリンクを見つけるたびに 全てのページを訪問するまで付いて行って、 全体のインターネット上で見つけることができるようになる スパイダーが訪問する各ページにおいて 検索に必要かもしれない情報を記録するために 検索インデックスと呼ばれる特別なデータベースへ その情報を追加する では、先程の検索に戻って どのように検索エンジンが結果をもってくることが できるのかを見てみよう 「火星に行くにはどのくらいかかる?」と質問した時 検索エンジンは、検索インデックスにある それらの単語一つ一つを探して その単語が含まれているインターネット上の 全てのページのリストを素早くゲットする だけど、これらの単語を検索するだけだと 数百万ものページが出てきてしまうので 検索エンジンは、まず始めに どの結果が一番あなたに見せるのに 適しているのかを決める必要がある この部分がトリッキーなんだけど だって、検索エンジンは あなたが何を探しているのかを 推測しなくちゃならないからね それぞれの検索エンジンは 独自のアルゴリズムを使っていて あなたがほしいと思っているものをベースにして ページをランク付ける 検索エンジンのランキングアルゴリズムは 検索ワードがページのタイトルに 表示されているかをチェックして その隣同士に全ての単語が 並んでいるのかどうかをチェックしたり あるいはどのページをあなたが見たがっていて どれを見たがっていないのかを 決められるような他の計算をする 数字を求めたりする Googleは一番有名なアルゴリズムを開発したんだけど それはどのくらい他のウェブページが そのページにリンクされているかを 考慮することで 一番関連のある検索結果を選ぶ アイデアとしては 多くのウェブサイトがそのウェブサイトを 面白いものだと思っているのであれば それはもしかしたら あなたが探しているものである可能性が高い 「ページランク」と呼ばれるこのアルゴリズムは ウェブページをランク付けするからではなく、 その発明者、ラリー・ページに由来している Google設立者の一人だね 大体の場合、訪問されることで ウェブサイトはお金を稼ぐことができるので スパムの発信者は どうやって検索アルゴリズムを操作できるのか 定期的にその方法を探っている。そうすれば 検索結果でより高い位置に リストされることが可能になるからね 検索エンジンは 定期的にアルゴリズムを更新することで 結果の上部に信ぴょう性のないサイトや フェイクサイトが来ないようにしている 最近では これらのページに信ぴょう性がないかどうかは ウェブアドレスを見て 信頼できるソースであるのかどうかを決めるのは あなた次第でもあるんだけど 検索プログラムは、アルゴリズムを改善するために 常に進化し続けている そうすることで、他の競合社よりも素早く より良い結果を もたらすことができるようにね 今日の検索エンジンは、検索を絞り込むのに 明確に提示していないような情報さえも 使用することができる だから例えば、「ドッグ・パーク」へ検索をかけた場合、 多くの検索エンジンでは あなたの近くにある全てのドッグ・パークを 検索結果して表示するだろう あなたが自分の位置情報を入力していなくてもね 現代の検索エンジンは、ページにある単語以上のことを 理解できるようになっているけど それはあなたが探しているものに対して 最適な結果を表示するためなの 例えば、「速いピッチャー」の検索をかける場合 検索エンジンはあなたがアスリートを 探しているのだということが分かっている だけど、もし「大きいピッチャー」という検索をかけたら キッチン用品のオプションを表示するかもしれない 単語をより良く理解するためにも マシンラーニングというものを使っている 人工知能の一種だよ これによって検索アルゴリズムが ページ内の単語や個別の文字だけじゃなく 単語の基本的な意味を理解して 検索をかけることができるようになる インターネットは指数関数的に成長しているけど 検索エンジンをデザインするチームが 的確な仕事を行うことで あなたが知りたい情報が常に一番に あがってくるようにすることができるのよ