Bonjour, je m'appelle John.
Je suis responsable du service recherche
et machine learning chez Google.
C'est incroyable d'imaginer
que les gens du monde entier
utilisent les moteurs de recherche
pour poser des questions,
qu'elles soient banales ou importantes.
C'est aussi une énorme
responsabilité de leur donner
les meilleures réponses possibles.
Bonjour, je m'appelle Akshaya et
je travaille chez Bing.
Nous commençons à nous intéresser
à l'intelligence artificielle et
à l'apprentissage automatique,
mais nous devons nous demander
comment les utilisateurs vont l'utiliser,
parce qu'en fait, nous voulons que
ça apporte quelque chose à tout le monde
Posons une question simple.
Combien de temps faut-il pour
se rendre sur Mars ?
D'où viennent ces résultats?
et pourquoi celui-ci apparaît
avant celui-là ?
Ok, essayons de comprendre
comment le moteur de recherche
a transformé votre demande en un résultat.
La première chose à savoir, c'est que
lorsque vous faites une recherche,
le moteur ne cherche pas réellement
sur l'ensemble d'Internet en temps réel.
Tout simplement parce qu'il y a
plus d'un milliard de sites Web
sur Internet et des centaines d'autres
sont créés chaque minute.
Donc, si le moteur de recherche
devait scruter
chaque site pour trouver
ce que vous voulez,
cela prendrait une éternité.
Donc, pour accélérer votre recherche,
les moteurs de recherche scrutent
constamment le web à l'avance
pour enregistrer les informations qui
pourraient vous aider dans vos recherches.
Ainsi, lorsque vous cherchez
à savoir comment voyager sur Mars,
le moteur de recherche
a déjà ce qu'il faut
pour vous donner une réponse
en temps réel.
Voici comment cela fonctionne.
L'internet est un réseau de pages
reliées entre elles par des hyperliens.
Les moteurs de recherche exécutent
constamment un programme
appelé "araignée" qui consulte
toutes ces pages web
pour recueillir des informations
à leur sujet.
Chaque fois qu'il trouve
un lien hypertexte,
il le suit jusqu'à ce qu'il
ait visité chaque page
qu'il peut trouver sur
l'ensemble du Web.
À chaque page visitée,
le programme enregistre les informations
qui pourraient être utiles
et les ajoute à une base de données
qu'on appelle "index de recherche".
Maintenant, revenons à
notre recherche
et essayons de comprendre comment
le moteur de recherche
a trouvé les résultats.
Lorsque vous demandez "combien de temps
faut-il pour aller sur Mars",
le moteur de recherche cherche
chacun de ces mots
dans l'index de recherche et
reçoit immédiatement une liste
de toutes les pages sur Internet
contenant ces mots.
Mais ces termes
peuvent renvoyer des millions de pages,
le moteur a donc besoin
de pouvoir déterminer
quels sites correspondent le mieux
pour les afficher en premier.
C'est là que ça devient délicat,
car le moteur
a besoin de deviner ce que
que vous recherchez.
Chaque moteur de recherche
utilise son propre algorithme
pour classer les pages en fonction de
ce qu'il pense que vous voulez.
Cet algorithme va donc vérifier
si les termes de votre recherche
apparaissent dans le titre de la page,
si tous ces mots apparaissent
les uns à côté des autres,
ou tout type d'analyse
qui pourrait l'aider à mieux déterminer
les pages que vous voulez voir
et celles qui ne vous intéressent pas.
Google a inventé l'algorithme
le plus efficace pour choisir
les résultats les plus pertinents
en prenant en compte
combien d'autres pages Web
sont liées à une page donnée.
L'idée est simple: si de nombreux
sites Web pensent
qu'une page Web est intéressante,
alors c'est probablement celle
que vous recherchez.
Cet algorithme est appelé "page rank",
non pas parce qu'il "classe les pages web",
il porte simplement le nom de
son inventeur, Larry Page,
l'un des fondateurs de Google.
Parce qu'un site Web fait souvent
de l'argent lorsque vous le visitez,
les spammeurs essayant de trouver
un moyen
de tromper l'algorithme de recherche
afin que leurs pages
soient mieux classées dans les résultats.
Les moteurs de recherche mettent
régulièrement à jour leurs algorithmes
pour les empêcher d'atteindre le haut
de la liste.
Ensuite, c'est à vous de rester
vigilant lorsque vous tomber
pour ces pages qui ne sont pas
dignes de confiance
en contrôlant l'adresse Internet,
en vérifiant si la source est fiable.
Les programmes de recherche
sont en constante évolution
pour améliorer les algorithmes
afin qu'ils donnent de meilleurs résultats,
des résultats plus rapides
que leurs concurrents.
Les moteurs d'aujourd'hui utilisent
même des informations
que vous n'avez pas explicitement fournies
pour affiner vos recherches.
Par exemple, si vous cherchez
un parc pour chien
de nombreux moteurs de recherche
vous indiqueront
tous les parcs canins des environs,
même si vous n'avez pas
tapez votre localisation.
Les moteurs de recherche modernes
comprennent également mieux
les mots qui apparaissent sur les pages,
ils savent ce qu'ils signifient réellement
afin de trouver les pages
qui correspondent à votre recherche.
Par exemple, si vous recherchez
"fast pitcher",
il saura que vous êtes à la recherche
d'un joueur de baseball.
Mais si vous cherchez "large pitcher",
il vous proposera des articles de cuisine.
Pour mieux comprendre les mots,
nous utilisons l'apprentissage automatique,
une sorte d'intelligence artificielle.
Grâce à elle, les algorithmes ne cherchent
plus seulement des lettres
ou des mots sur les pages,
ils comprennent le sens des mots.
Internet connaît une croissance exponentielle,
mais si les équipes qui conçoivent les
moteurs de recherche font bien notre travail,
les informations que vous cherchez
seront toujours plus accessibles.