-
やあ、僕はジョン
-
Googleでリサーチ&マシンラーニングチームを率いている
-
世界中の人たちが検索エンジンを使って
-
ささいな疑問や驚くほど
-
重要な疑問を調べてるのって
-
かなり刺激的なものだと思う
-
だから出来る限り最適な答えを
-
彼らに提示することはとても大きな責任だと思っている
-
こんにちは、私はアクシャヤ。Bing検索チームで働いているわ
-
人工知能やマシンラーニングを
-
見始めるような時はたくさんあるけど、
-
ユーザーがどうやって使用していくのかについて議論する必要があるわ
-
だって、一日の終わりには社会に何らかの影響を与えていたいもの
-
単純な質問をしてみましょう
-
火星へ行けるまではどのくらいかかる?
-
これらの検索結果はどこから来たもので
-
なぜ他の回答よりもこれらが最初にリスト化されているのか?
-
そうね、まずはどうやって検索エンジンがあなたの検索に対して
-
結果を出しているのかを見てみましょうか
-
検索を行う時に、まず始めに知らなくちゃいけないことは
-
実際、検索エンジンはリアルタイムであなたの検索ワードを
-
ワールドワイドウェブ上で作動させているのではないこと
-
それゆえに、10億以上のウェブサイトがインターネット上にあって
-
数百以上のウェブサイトが1分ごとに作られているってこと
-
だから、もしあなたの求めている結果を見つけるために
-
検索エンジンがこれら全てのサイトを見て回らなくちゃならなければ
-
永遠に時間はかかるわよね
-
検索結果を素早く出すために
-
事前に検索エンジンは定期的にウェブをスキャニングしていて
-
後であなたの検索に役立つような情報を記録しているの
-
こうすることで、「火星へ行く」ことについて検索をかける場合、
-
検索エンジンはリアルタイムであなたにその答えを出せるような
-
ものを既に持っているというわけ
-
どのように作動しているかを見てみましょう
-
インターネットは、それぞれがハイパーリンクで繋がっているページのウェブね
-
これらのウェブページを横切るスパイダーというプログラムがあるんだけど、
-
情報を集めるために検索エンジンは、
-
そのスパイダーを定期的に作動させている
-
ハイパーリンクを見つけるたびに
-
全てのページを訪問するまで付いて行って、
-
全体のインターネット上で見つけることができるようになる
-
スパイダーが訪問する各ページにおいて
-
検索に必要かもしれない情報を記録するために
-
検索インデックスと呼ばれる特別なデータベースへ、その情報を追加する
-
では、先程の検索に戻って
-
どのように検索エンジンが結果をもってくることが
-
できるのかを見てみましょう
-
「火星に行くにはどのくらいかかる?」と質問した時
-
検索エンジンは、検索インデックスにあるそれらの単語一つ一つを探して
-
その単語が含まれているインターネット上の
-
全てのページのリストを素早くゲットする
-
だけど、これらの単語を検索するだけだと
-
数百万ものページが出てきてしまうので
-
検索エンジンは、まず始めにどの結果が一番あなたに見せるのに
-
適しているのかを決める必要がある
-
この部分がトリッキーなところなんだけど。だって、検索エンジンは
-
あなたが何を探しているのかを推測しなくちゃならないからね
-
それぞれの検索エンジンは、独自のアルゴリズムを使っていて
-
あなたがほしいと思っているものをベースにして、ページをランク付ける
-
検索エンジンのランキングアルゴリズムは
-
検索ワードがページのタイトルに表示されているかをチェックして、
-
その隣同士に全ての単語が並んでいるのかどうかをチェックしたり
-
あるいはどのページをあなたが見たがっていて、どれを見たがっていないのかを
-
決められるような他の計算をする
-
数字を求めたりする
-
Googleは一番有名なアルゴリズムを開発したんだけど
-
それはどのくらい他のウェブページがそのページにリンクされているかを
-
考慮することで、一番関連のある検索結果を選ぶようなものね
-
アイデアとしては、多くのウェブサイトがそのウェブサイトを
-
面白いものだと思っているのであれば
-
それはもしかしたら、あなたが探しているものである可能性が高い
-
「ページランク」と呼ばれるこのアルゴリズムは
-
ウェブページをランク付けするからではなく、
-
その発明者、ラリー・ページに由来している
-
Google設立者の一人だね
-
大体の場合、訪問されることでウェブサイトはお金を稼ぐことができるので
-
スパムの発信者は、どうやって検索アルゴリズムを操作できるのか
-
定期的にその方法を探っている。そうすれば
-
検索結果でより高い位置にリストされることが可能になるからね
-
検索エンジンは、定期的にアルゴリズムを更新することで
-
結果の上部に信ぴょう性のないサイトへフェイクサイトが来ないようにしている
-
最近では、これらのページに信ぴょう性がないかどうかは
-
ウェブアドレスを見て、信頼できるソースであるのかどうかを決めるのは
-
あなた次第でもあるんだけど
-
検索プログラムは、アルゴリズムを改善するために、常に進化し続けている
-
そうすることで、他の競合社よりも素早く、より良い結果を
-
もたらすことができるようにね
-
今日の検索エンジンは、検索を絞り込むのに
-
明確に提示していないような情報さえも
使用することができる
-
だから例えば、「ドッグ・パーク」へ検索をかけた場合、
-
多くの検索エンジンでは、あなたの近くにある全てのドッグ・パークを
-
検索結果して表示するだろう
-
あなたが自分の位置情報を入力していなくてもね
-
現代の検索エンジンは、ページにある単語以上のことを
-
理解できるようになっているけど
-
それはあなたが探しているものに対して
-
最適な結果を表示するためなんだ
-
例えば、「速いピッチャー」の検索をかける場合
-
検索エンジンはあなたがアスリートを探しているのだということが分かっている
-
だけど、もし「大きいピッチャー」という検索をかけたら
-
キッチン用品のオプションを表示するかもしれない
-
単語をより良く理解するためにも、マシンラーニングというものを使っている
-
人工知能の一種だよ
-
これによって検索アルゴリズムが、ページ内の単語や個別の文字だけじゃなく
-
単語の基本的な意味を理解して
-
検索をかけることができるようになる
-
インターネットは指数関数的に成長しているけど
-
検索エンジンをデザインするチームが的確な仕事を行うことで
-
あなたが知りたい情報が常に一番にあがってくるようにすることができるんだ