0:00:06.070,0:00:07.120 Bonjour, je m'appelle John. 0:00:07.510,0:00:10.140 Je suis responsable du service recherche[br]et machine learning chez Google. 0:00:12.130,0:00:14.230 C'est incroyable d'imaginer 0:00:14.230,0:00:16.214 que les gens du monde entier 0:00:16.215,0:00:19.160 utilisent les moteurs de recherche[br]pour poser des questions, 0:00:19.160,0:00:20.930 qu'elles soient banales ou importantes. 0:00:20.930,0:00:23.450 C'est aussi une énorme[br]responsabilité de leur donner 0:00:23.450,0:00:24.864 les meilleures réponses possibles. 0:00:26.710,0:00:30.610 Bonjour, je m'appelle Akshaya et[br]je travaille chez Bing. 0:00:30.910,0:00:33.190 Nous commençons à nous intéresser 0:00:33.190,0:00:35.800 à l'intelligence artificielle et[br]à l'apprentissage automatique, 0:00:35.830,0:00:39.010 mais nous devons nous demander[br]comment les utilisateurs vont l'utiliser, 0:00:39.140,0:00:42.390 parce qu'en fait, nous voulons que[br]ça apporte quelque chose à tout le monde 0:00:43.780,0:00:45.400 Posons une question simple. 0:00:45.820,0:00:48.070 Combien de temps faut-il pour[br]se rendre sur Mars ? 0:00:49.330,0:00:50.950 D'où viennent ces résultats? 0:00:51.370,0:00:54.100 et pourquoi celui-ci apparaît[br]avant celui-là ? 0:00:55.700,0:00:58.150 Ok, essayons de comprendre[br]comment le moteur de recherche 0:00:58.150,0:00:59.860 a transformé votre demande en un résultat. 0:01:00.690,0:01:03.360 La première chose à savoir, c'est que[br]lorsque vous faites une recherche, 0:01:03.430,0:01:06.480 le moteur ne cherche pas réellement 0:01:06.480,0:01:08.010 sure l'ensemble d'Internet en temps réel. 0:01:08.140,0:01:10.610 Tout simplement parce qu'il y a[br]plus d'un milliard de sites Web 0:01:10.610,0:01:14.140 sur Internet et des centaines d'autres[br]sont créés chaque minute. 0:01:14.140,0:01:16.210 Donc, si le moteur de recherche[br]devait scruter 0:01:16.240,0:01:18.690 chaque site pour trouver[br]ce que vous voulez, 0:01:18.690,0:01:20.120 cela prendrait une éternité. 0:01:20.500,0:01:21.940 Donc, pour accélérer votre recherche, 0:01:21.970,0:01:24.940 les moteurs de recherche scrutent[br]constamment le web à l'avance 0:01:25.420,0:01:28.560 pour enregistrer les informations qui[br]pourraient vous aider dans vos recherches. 0:01:28.930,0:01:31.270 Ainsi, lorsque vous cherchez[br]à savoir comment voyager sur Mars, 0:01:31.630,0:01:33.700 le moteur de recherche[br]a déjà ce qu'il faut 0:01:33.700,0:01:35.728 pour vous donner une réponse[br]en temps réel. 0:01:36.250,0:01:37.540 Voici comment cela fonctionne. 0:01:37.900,0:01:42.010 L'internet est un réseau de pages[br]reliées entre elles par des hyperliens. 0:01:42.400,0:01:44.680 Les moteurs de recherche exécutent[br]constamment un programme 0:01:44.680,0:01:47.380 appelé "araignée" qui consulte[br]toutes ces pages web 0:01:47.380,0:01:49.040 pour recueillir des informations[br]à leur sujet. 0:01:49.780,0:01:51.550 Chaque fois qu'il trouve[br]un lien hypertexte, 0:01:52.090,0:01:55.000 il le suit jusqu'à ce qu'il[br]ait visité chaque page 0:01:55.030,0:01:57.240 qu'il peut trouver sur[br]l'ensemble du Web. 0:01:57.335,0:01:59.170 À chaque page visitée, 0:01:59.200,0:02:02.320 le programme enregistre les informations[br]qui pourraient être utiles 0:02:02.500,0:02:05.650 et les ajoute à une base de données[br]qu'on appelle "index de recherche". 0:02:07.166,0:02:09.530 Maintenant, revenons à[br]notre recherche 0:02:09.590,0:02:11.990 et essayons de comprendre comment[br]le moteur de recherche 0:02:11.990,0:02:13.333 a trouvé les résultats. 0:02:13.640,0:02:16.460 Lorsque vous demandez "combien de temps[br]faut-il pour aller sur Mars", 0:02:16.640,0:02:18.860 le moteur de recherche cherche[br]chacun de ces mots 0:02:18.920,0:02:21.410 dans l'index de recherche et[br]reçoit immédiatement une liste 0:02:21.410,0:02:24.500 de toutes les pages sur Internet[br]contenant ces mots. 0:02:24.890,0:02:26.870 Mais ces termes 0:02:26.870,0:02:28.760 peuvent renvoyer des millions de pages, 0:02:28.760,0:02:31.110 donc le moteur a donc besoin[br]de pouvoir déterminer 0:02:31.110,0:02:33.120 quels sites correspondent le mieux[br]pour les afficher en premier. 0:02:33.340,0:02:36.010 C'est là que ça devient délicat,[br]car le moteur 0:02:36.010,0:02:38.040 a besoin de deviner ce que[br]que vous recherchez. 0:02:38.930,0:02:41.360 Chaque moteur de recherche[br]utilise son propre algorithme 0:02:41.360,0:02:44.230 pour classer les pages en fonction de[br]ce qu'il pense que vous voulez. 0:02:44.930,0:02:47.660 Cet algorithme va donc vérifier 0:02:47.990,0:02:50.360 si les termes de votre recherche[br]apparaissent dans le titre de la page, 0:02:50.900,0:02:53.820 si tous ces mots apparaissent[br]les uns à côté des autres, 0:02:54.520,0:02:57.020 ou tout type d'analyse 0:02:57.020,0:02:58.610 qui pourrait l'aider à mieux déterminer 0:02:58.670,0:03:01.420 les pages que vous voulez voir[br]et celles qui ne vous intéressent pas. 0:03:02.960,0:03:04.960 Google a inventé l'algorithme[br]le plus efficace pour choisir 0:03:04.960,0:03:08.530 les résultats les plus pertinents[br]en prenant en compte 0:03:08.560,0:03:11.230 combien d'autres pages Web[br]sont liées à une page donnée. 0:03:11.830,0:03:14.140 L'idée est simple: si de nombreux[br]sites Web pensent 0:03:14.140,0:03:15.660 qu'une page Web est intéressante, 0:03:15.660,0:03:17.940 alors c'est probablement celle [br]que vous recherchez. 0:03:18.190,0:03:20.020 Cet algorithme est appelé "page rank", 0:03:20.590,0:03:22.330 non pas parce qu'il "classe les pages web", 0:03:22.570,0:03:25.210 il porte simplement le nom de[br]son inventeur, Larry Page, 0:03:25.480,0:03:27.333 l'un des fondateurs de Google. 0:03:27.940,0:03:30.520 Parce qu'un site Web fait souvent[br]de l'argent lorsque vous le visitez, 0:03:30.820,0:03:32.950 les spammeurs essayant de trouver[br]un moyen 0:03:32.950,0:03:35.741 de tromper l'algorithme de recherche [br]afin que leurs pages 0:03:35.742,0:03:37.931 soient mieux classées dans les résultats. 0:03:38.260,0:03:40.750 Les moteurs de recherche mettent[br]régulièrement à jour leurs algorithmes 0:03:40.750,0:03:44.296 pour les empêcher d'atteindre le haut[br]de la liste. 0:03:44.680,0:03:47.350 Ensuite, c'est à vous de rester[br]vigilant lorsque vous tomber 0:03:47.500,0:03:49.450 pour ces pages qui ne sont pas[br]dignes de confiance 0:03:49.690,0:03:52.990 en contrôlant l'adresse Internet,[br]en vérifiant si la source est fiable. 0:03:53.680,0:03:55.390 Les programmes de recherche[br]sont en constante évolution 0:03:55.420,0:03:58.420 pour améliorer les algorithmes [br]afin qu'ils donnent de meilleurs résultats, 0:03:58.540,0:04:00.460 des résultats plus rapides[br]que leurs concurrents. 0:04:01.000,0:04:03.100 Les moteurs d'aujourd'hui utilisent[br]même des informations 0:04:03.100,0:04:06.820 que vous n'avez pas explicitement fournies[br]pour affiner vos recherches. 0:04:07.150,0:04:10.120 Par exemple, si vous cherchez[br]un parc pour chien 0:04:10.240,0:04:12.190 de nombreux moteurs de recherche[br]vous indiqueront 0:04:12.190,0:04:13.840 tous les parcs canins des environs, 0:04:14.080,0:04:16.260 même si vous n'avez pas[br]tapez votre localisation. 0:04:17.800,0:04:20.530 Les moteurs de recherche modernes[br]comprennent également mieux 0:04:20.530,0:04:22.060 les mots qui apparaissent sur les pages, 0:04:22.300,0:04:24.970 ils savent ce qu'ils signifient réellement[br]afin de trouver les pages 0:04:24.970,0:04:26.750 qui correspondent à votre recherche. 0:04:27.130,0:04:29.980 Par exemple, si vous recherchez [br]"fast pitcher", 0:04:30.280,0:04:32.300 il saura que vous êtes à la recherche[br]d'un joueur de baseball. 0:04:32.500,0:04:34.450 Mais si vous cherchez "large pitcher", 0:04:34.450,0:04:36.730 il vous proposera des articles de cuisine. 0:04:38.420,0:04:41.910 Pour mieux comprendre les mots, [br]nous utilisons l'apprentissage automatique, 0:04:41.910,0:04:43.985 une sorte d'intelligence artificielle. 0:04:43.985,0:04:46.050 Grâce à elle, les algorithmes ne cherchent 0:04:46.090,0:04:48.400 plus seulement des lettres[br]ou des mots sur les pages, 0:04:48.400,0:04:51.280 ils comprennent le sens des mots. 0:04:53.690,0:04:55.850 Internet connaît une croissance exponentielle, 0:04:56.210,0:04:59.810 mais si les équipes qui conçoivent les[br]moteurs de recherche font bien notre travail, 0:05:00.080,0:05:04.090 les informations que vous cherchez[br]seront toujours plus accessibles.