German subtitles

← cs101_unit4_06_s_Finishing-the-Web-Crawler

dummy description

Get Embed Code
6 Languages

Showing Revision 2 created 08/01/2014 by Fran Ontanaya.

  1. Die Antwort lautet: wir verwenden das eben definierte "addpageto_index"-Procedure
  2. und fügen den Index hinzu.
  3. Wir fügen ebenfalls die Seite, d.h. die URL, die die Seite identifiziert,
  4. und den Inhalt hinzu.
  5. Das war´s.
  6. Jetzt haben wir unseren Web Crawler.
  7. Ausgehend von "seed" finden wir eine Reihe von Seiten.
  8. Wir folgen der "seed", indem wir allen Links auf den Seiten ausgehend von "seed" folgen,
  9. den Inhalt einer jeden Seite fügen wir einem Index hinzu,
  10. dann lösen wir diesen Index mit return aus.
  11. Wir haben bereits den Code definiert, der bei einem Index den Lookup auslöst.
  12. So finden wir für jedes Wort, das wir nachschauen, eine Liste der URL´s der Seiten, die das Wort beinhalten.