-
Bonjour, je m'appelle John.
-
Je suis responsable du service recherche
et machine learning chez Google.
-
C'est incroyable d'imaginer
-
que les gens du monde entier
-
utilisent les moteurs de recherche
pour poser des questions,
-
qu'elles soient banales ou importantes.
-
C'est aussi une énorme
responsabilité de leur donner
-
les meilleures réponses possibles.
-
Bonjour, je m'appelle Akshaya et
je travaille chez Bing.
-
Nous commençons à nous intéresser
-
à l'intelligence artificielle et
à l'apprentissage automatique,
-
mais nous devons nous demander
comment les utilisateurs vont l'utiliser,
-
parce qu'en fait, nous voulons que
ça apporte quelque chose à tout le monde
-
Posons une question simple.
-
Combien de temps faut-il pour
se rendre sur Mars ?
-
D'où viennent ces résultats?
-
et pourquoi celui-ci apparaît
avant celui-là ?
-
Ok, essayons de comprendre
comment le moteur de recherche
-
a transformé votre demande en un résultat.
-
La première chose à savoir, c'est que
lorsque vous faites une recherche,
-
le moteur ne cherche pas réellement
-
sur l'ensemble d'Internet en temps réel.
-
Tout simplement parce qu'il y a
plus d'un milliard de sites Web
-
sur Internet et des centaines d'autres
sont créés chaque minute.
-
Donc, si le moteur de recherche
devait scruter
-
chaque site pour trouver
ce que vous voulez,
-
cela prendrait une éternité.
-
Donc, pour accélérer votre recherche,
-
les moteurs de recherche scrutent
constamment le web à l'avance
-
pour enregistrer les informations qui
pourraient vous aider dans vos recherches.
-
Ainsi, lorsque vous cherchez
à savoir comment voyager sur Mars,
-
le moteur de recherche
a déjà ce qu'il faut
-
pour vous donner une réponse
en temps réel.
-
Voici comment cela fonctionne.
-
L'internet est un réseau de pages
reliées entre elles par des hyperliens.
-
Les moteurs de recherche exécutent
constamment un programme
-
appelé "araignée" qui consulte
toutes ces pages web
-
pour recueillir des informations
à leur sujet.
-
Chaque fois qu'il trouve
un lien hypertexte,
-
il le suit jusqu'à ce qu'il
ait visité chaque page
-
qu'il peut trouver sur
l'ensemble du Web.
-
À chaque page visitée,
-
le programme enregistre les informations
qui pourraient être utiles
-
et les ajoute à une base de données
qu'on appelle "index de recherche".
-
Maintenant, revenons à
notre recherche
-
et essayons de comprendre comment
le moteur de recherche
-
a trouvé les résultats.
-
Lorsque vous demandez "combien de temps
faut-il pour aller sur Mars",
-
le moteur de recherche cherche
chacun de ces mots
-
dans l'index de recherche et
reçoit immédiatement une liste
-
de toutes les pages sur Internet
contenant ces mots.
-
Mais ces termes
-
peuvent renvoyer des millions de pages,
-
le moteur a donc besoin
de pouvoir déterminer
-
quels sites correspondent le mieux
pour les afficher en premier.
-
C'est là que ça devient délicat,
car le moteur
-
a besoin de deviner ce que
que vous recherchez.
-
Chaque moteur de recherche
utilise son propre algorithme
-
pour classer les pages en fonction de
ce qu'il pense que vous voulez.
-
Cet algorithme va donc vérifier
-
si les termes de votre recherche
apparaissent dans le titre de la page,
-
si tous ces mots apparaissent
les uns à côté des autres,
-
ou tout type d'analyse
-
qui pourrait l'aider à mieux déterminer
-
les pages que vous voulez voir
et celles qui ne vous intéressent pas.
-
Google a inventé l'algorithme
le plus efficace pour choisir
-
les résultats les plus pertinents
en prenant en compte
-
combien d'autres pages Web
sont liées à une page donnée.
-
L'idée est simple: si de nombreux
sites Web pensent
-
qu'une page Web est intéressante,
-
alors c'est probablement celle
que vous recherchez.
-
Cet algorithme est appelé "page rank",
-
non pas parce qu'il "classe les pages web",
-
il porte simplement le nom de
son inventeur, Larry Page,
-
l'un des fondateurs de Google.
-
Parce qu'un site Web fait souvent
de l'argent lorsque vous le visitez,
-
les spammeurs essayant de trouver
un moyen
-
de tromper l'algorithme de recherche
afin que leurs pages
-
soient mieux classées dans les résultats.
-
Les moteurs de recherche mettent
régulièrement à jour leurs algorithmes
-
pour les empêcher d'atteindre le haut
de la liste.
-
Ensuite, c'est à vous de rester
vigilant lorsque vous tomber
-
pour ces pages qui ne sont pas
dignes de confiance
-
en contrôlant l'adresse Internet,
en vérifiant si la source est fiable.
-
Les programmes de recherche
sont en constante évolution
-
pour améliorer les algorithmes
afin qu'ils donnent de meilleurs résultats,
-
des résultats plus rapides
que leurs concurrents.
-
Les moteurs d'aujourd'hui utilisent
même des informations
-
que vous n'avez pas explicitement fournies
pour affiner vos recherches.
-
Par exemple, si vous cherchez
un parc pour chien
-
de nombreux moteurs de recherche
vous indiqueront
-
tous les parcs canins des environs,
-
même si vous n'avez pas
tapez votre localisation.
-
Les moteurs de recherche modernes
comprennent également mieux
-
les mots qui apparaissent sur les pages,
-
ils savent ce qu'ils signifient réellement
afin de trouver les pages
-
qui correspondent à votre recherche.
-
Par exemple, si vous recherchez
"fast pitcher",
-
il saura que vous êtes à la recherche
d'un joueur de baseball.
-
Mais si vous cherchez "large pitcher",
-
il vous proposera des articles de cuisine.
-
Pour mieux comprendre les mots,
nous utilisons l'apprentissage automatique,
-
une sorte d'intelligence artificielle.
-
Grâce à elle, les algorithmes ne cherchent
-
plus seulement des lettres
ou des mots sur les pages,
-
ils comprennent le sens des mots.
-
Internet connaît une croissance exponentielle,
-
mais si les équipes qui conçoivent les
moteurs de recherche font bien notre travail,
-
les informations que vous cherchez
seront toujours plus accessibles.