[Script Info] Title: [Events] Format: Layer, Start, End, Style, Name, MarginL, MarginR, MarginV, Effect, Text Dialogue: 0,0:00:00.00,0:00:02.02,Default,,0000,0000,0000,,[Sebastian Thrun] Donc, quel est ton point de vue sur la façon de construire un moteur de recherche, Dialogue: 0,0:00:02.02,0:00:03.08,Default,,0000,0000,0000,,tu en as déjà construit un, n'est-ce pas? Dialogue: 0,0:00:03.08,0:00:06.01,Default,,0000,0000,0000,,[Sergey Brin - Co-Fondateur, Google]Oui, je pense que la chose la plus importante Dialogue: 0,0:00:06.01,0:00:08.01,Default,,0000,0000,0000,,si tu es sur le point de construire un moteur de recherche Dialogue: 0,0:00:08.01,0:00:12.05,Default,,0000,0000,0000,,est d'avoir un très bon corpus comme base pour commencer. Dialogue: 0,0:00:12.05,0:00:19.02,Default,,0000,0000,0000,,Dans notre cas, nous avons utilisé Internet, lequel était certainement plus petit qu'il ne l'est aujourd'hui. Dialogue: 0,0:00:19.02,0:00:21.04,Default,,0000,0000,0000,,Mais il était également tout nouveau et excitant. Dialogue: 0,0:00:21.04,0:00:23.08,Default,,0000,0000,0000,,Il y avait toutes sortes de surprises. Dialogue: 0,0:00:23.08,0:00:26.10,Default,,0000,0000,0000,,[David Evans] Donc, le but des trois premières unités du cours est de construire ce corpus. Dialogue: 0,0:00:27.00,0:00:30.01,Default,,0000,0000,0000,,Et nous voulons construire ce corpus pour notre moteur de recherche Dialogue: 0,0:00:30.01,0:00:32.09,Default,,0000,0000,0000,,en analysant le web et c'est ce que fait un web crawler. Dialogue: 0,0:00:32.09,0:00:36.04,Default,,0000,0000,0000,,Un web crawler est un programme qui collecte du contenu depuis le web. Dialogue: 0,0:00:36.04,0:00:40.05,Default,,0000,0000,0000,,Si tu penses à une page web que tu affiches dans ton explorateur, tu as une page comme ceci. Dialogue: 0,0:00:40.05,0:00:43.10,Default,,0000,0000,0000,,Et nous utiliserons le site de Udacity comme exemple d'une page web. Dialogue: 0,0:00:43.10,0:00:47.10,Default,,0000,0000,0000,,Elle contient beaucoup de contenu, elle contient des images, du texte. Dialogue: 0,0:00:47.10,0:00:51.04,Default,,0000,0000,0000,,Tout cela arrive dans ton explorateur lorsque tu demandes à voir une page. Dialogue: 0,0:00:51.04,0:00:53.07,Default,,0000,0000,0000,,Elle contient une chose importante qui s'appelle "liens". Dialogue: 0,0:00:53.07,0:00:57.09,Default,,0000,0000,0000,,Un lien est quelque chose qui va vers une autre page. Dialogue: 0,0:00:57.09,0:01:00.05,Default,,0000,0000,0000,,Par exemple, nous avons un lien qui va vers les questions fréquemment posées (FAQ), Dialogue: 0,0:01:00.05,0:01:02.05,Default,,0000,0000,0000,,nous avons un lien vers la page CS 101. Dialogue: 0,0:01:02.05,0:01:04.04,Default,,0000,0000,0000,,Il y a d'autres liens sur la page. Dialogue: 0,0:01:04.04,0:01:07.05,Default,,0000,0000,0000,,Et ce lien pourrait être affiché souligné dans ton explorateur, Dialogue: 0,0:01:07.05,0:01:09.09,Default,,0000,0000,0000,,ou non, cela depend de comment ton explorateur est paramétré. Dialogue: 0,0:01:09.09,0:01:11.10,Default,,0000,0000,0000,,Mais la chose importante qu'il fait, Dialogue: 0,0:01:11.10,0:01:13.09,Default,,0000,0000,0000,,est que c'est un pointeur vers une autre page web. Dialogue: 0,0:01:13.09,0:01:16.04,Default,,0000,0000,0000,,Et ces autres pages web pourraient également contenir d'autres liens. Dialogue: 0,0:01:16.04,0:01:19.07,Default,,0000,0000,0000,,donc nous avons un autre lien sur cette page-ci. Dialogue: 0,0:01:19.07,0:01:23.05,Default,,0000,0000,0000,,Peut-être que c'est vers mon nom, et tu peux le suivre pour atteindre ma page principale. Dialogue: 0,0:01:23.05,0:01:26.09,Default,,0000,0000,0000,,Et toutes les pages que nous pouvons trouver avec notre web crawler Dialogue: 0,0:01:26.09,0:01:29.01,Default,,0000,0000,0000,,sont en fait trouvées en suivant les liens. Dialogue: 0,0:01:29.01,0:01:31.07,Default,,0000,0000,0000,,Il ne trouvera pas nécessairement toutes les pages présentes sur le web Dialogue: 0,0:01:31.07,0:01:33.06,Default,,0000,0000,0000,,Cependant, si nous commençons avec une bonne page comme base (seed page) Dialogue: 0,0:01:33.06,0:01:35.00,Default,,0000,0000,0000,,nous trouverons beaucoup d'autres pages. Dialogue: 0,0:01:35.00,0:01:37.05,Default,,0000,0000,0000,,Et ce que le web crawler va faire est de commencer avec une page, Dialogue: 0,0:01:37.05,0:01:41.06,Default,,0000,0000,0000,,trouver tous les liens sur cette page, suivre chaque lien pour trouver d'autres pages Dialogue: 0,0:01:41.06,0:01:45.01,Default,,0000,0000,0000,,et sur chacune de ces autres pages, il suivra les liens qu'elles contiennent Dialogue: 0,0:01:45.01,0:01:48.03,Default,,0000,0000,0000,,pour trouver d'autres pages et il y aura beaucoup plus de liens sur ces pages-là. Dialogue: 0,0:01:48.03,0:01:51.04,Default,,0000,0000,0000,,Finalement, nous obtiendrons une collection de beaucoup de pages du web. Dialogue: 0,0:01:51.04,0:01:54.01,Default,,0000,0000,0000,,Donc, ce que nous voulons faire est de construire un web crawler. Dialogue: 0,0:01:54.01,0:01:56.10,Default,,0000,0000,0000,,Nous voulons trouver un moyen de commencer avec une page de base, Dialogue: 0,0:01:56.10,0:01:59.06,Default,,0000,0000,0000,,extraire les liens de cette page, Dialogue: 0,0:01:59.06,0:02:01.08,Default,,0000,0000,0000,,suivre ces liens vers d'autres pages, Dialogue: 0,0:02:01.08,0:02:03.07,Default,,0000,0000,0000,,ensuite récupérer les liens présents sur ces autres pages, Dialogue: 0,0:02:03.07,0:02:05.02,Default,,0000,0000,0000,,les suivre, récupérer tout ça. Dialogue: 0,0:02:05.02,0:02:07.04,Default,,0000,0000,0000,,Cela semble énorme à faire. Dialogue: 0,0:02:07.04,0:02:09.01,Default,,0000,0000,0000,,Nous ne ferons pas tout cela dans ce premier cours. Dialogue: 0,0:02:09.01,0:02:12.07,Default,,0000,0000,0000,,Ce que nous allons faire durant cette première unité est uniquement d'extraire un lien. Dialogue: 0,0:02:12.07,0:02:14.06,Default,,0000,0000,0000,,Donc, nous allons commencer avec un [tas de] texte Dialogue: 0,0:02:14.06,0:02:17.03,Default,,0000,0000,0000,,Ce texte contiendra un lien avec une URL Dialogue: 0,0:02:17.03,0:02:19.06,Default,,0000,0000,0000,,Ce que nous voulons trouver est cette URL Dialogue: 0,0:02:19.06,0:02:21.09,Default,,0000,0000,0000,,afin de pouvoir demander la page suivante. Dialogue: 0,0:02:21.09,0:02:23.08,Default,,0000,0000,0000,,Le but de la seconde unité Dialogue: 0,0:02:23.08,0:02:25.02,Default,,0000,0000,0000,,est d'être capable de continuer. Dialogue: 0,0:02:25.02,0:02:28.05,Default,,0000,0000,0000,,S'il y a beaucoup de liens sur une page, tu veux être capable de tous les trouver. Dialogue: 0,0:02:28.05,0:02:30.01,Default,,0000,0000,0000,,Donc, ce que nous ferons durant l'unité 2 Dialogue: 0,0:02:30.01,0:02:32.07,Default,,0000,0000,0000,,est de trouver un moyen de continuer à extraire touts ces liens-là. Dialogue: 0,0:02:32.07,0:02:36.06,Default,,0000,0000,0000,,Durant l'unité 3, nous irons au-délà d'une page. Dialogue: 0,0:02:36.06,0:02:40.03,Default,,0000,0000,0000,,Donc, à la fin de l'unité 2, nous pourrons afficher tous les liens d'une page. Dialogue: 0,0:02:40.03,0:02:44.00,Default,,0000,0000,0000,,Pour l'unité 3, nous voulons récupérer tous ces liens afin de pouvoir continuer, Dialogue: 0,0:02:44.00,0:02:47.02,Default,,0000,0000,0000,,et arriver à faire en sorte que notre crawler récupère beaucoup, beaucoup de pages. Dialogue: 0,0:02:47.02,0:02:50.01,Default,,0000,0000,0000,,Donc, a la fin de l'unité 3, nous aurons construit un web crawler. Dialogue: 0,0:02:50.01,0:02:52.03,Default,,0000,0000,0000,,Nous aurons un moyen pour construire notre corpus. Dialogue: 0,0:02:52.03,0:02:57.08,Default,,0000,0000,0000,,Ensuite, durant les trois unités restantes, nous regarderons comment répondre à des requêtes. Dialogue: 0,0:02:57.08,0:03:01.03,Default,,0000,0000,0000,,Donc, durant l'unité 4, nous trouverons un moyen de fournir une bonne réponse. Dialogue: 0,0:03:01.03,0:03:08.02,Default,,0000,0000,0000,,Par exemple, si tu cherches un mot-clé, tu veux obtenir une réponse qui soit une liste de toutes les pages Dialogue: 0,0:03:08.02,0:03:10.06,Default,,0000,0000,0000,,où ce mot-clé apparait. Dialogue: 0,0:03:10.06,0:03:15.09,Default,,0000,0000,0000,,Et, durant l'unité 5, nous trouverons un moyen de le faire de manière à ce que cela puisse évoluer même avec un large corpus. Dialogue: 0,0:03:15.09,0:03:19.08,Default,,0000,0000,0000,,Et ensuite, durant l'unité 6, ce que nous voulons faire, nous ne voulons pas simplement trouver une liste, Dialogue: 0,0:03:19.08,0:03:21.07,Default,,0000,0000,0000,,nous voulons trouver la meilleure. Dialogue: 0,0:03:21.07,0:03:24.08,Default,,0000,0000,0000,,Donc, nous trouverons un moyen de classer toutes les pages où le mot-clé apparait. Dialogue: 0,0:03:24.08,0:03:27.07,Default,,0000,0000,0000,,Nous sommes un peu en avance maintenant Dialogue: 0,0:03:27.07,0:03:30.04,Default,,0000,0000,0000,,parce que, tout ce que nous allons faire durant l'unité 1, Dialogue: 0,0:03:30.04,0:03:32.06,Default,,0000,0000,0000,,c'est de trouver un moyen d'extraire un lien d'une page. Dialogue: 0,0:03:32.06,0:03:35.07,Default,,0000,0000,0000,,Et le moteur de recherche que nous allons contruire à la fin de ceci Dialogue: 0,0:03:35.07,0:03:37.03,Default,,0000,0000,0000,,sera un moteur de recherche fonctionnel. Dialogue: 0,0:03:37.03,0:03:40.06,Default,,0000,0000,0000,,Il aura les fonctionnalités principales d'un moteur de recherche comme Google. Dialogue: 0,0:03:40.06,0:03:43.01,Default,,0000,0000,0000,,Il ne sera certainement pas aussi puissant que Google, Dialogue: 0,0:03:43.01,0:03:44.03,Default,,0000,0000,0000,,nous voulons garder les choses simple. Dialogue: 0,0:03:44.03,0:03:46.06,Default,,0000,0000,0000,,Nous voulons avoir une petite partie de code à écrire. Dialogue: 0,0:03:46.06,0:03:48.01,Default,,0000,0000,0000,,Et nous devrions nous souvenir que notre but réel Dialogue: 0,0:03:48.01,0:03:50.02,Default,,0000,0000,0000,,n'est pas tellement de construire un moteur de recherche, Dialogue: 0,0:03:50.02,0:03:52.08,Default,,0000,0000,0000,,mais plutôt d'utiliser le but de contruire un moteur de recherche comme véhicule Dialogue: 0,0:03:52.08,0:03:55.02,Default,,0000,0000,0000,,pour en apprendre plus sur le domaine de l'informatique Dialogue: 0,0:03:55.02,0:03:56.08,Default,,0000,0000,0000,,ainsi que sur la programmation Dialogue: 0,0:03:56.08,0:03:58.02,Default,,0000,0000,0000,,afin que ce que nous apprenons en faisant ceci Dialogue: 0,0:03:58.02,9:59:59.99,Default,,0000,0000,0000,,nous permette de résoudre beaucoup d'autres problèmes.