Japanese subtitles

← 11-62 Crawl Web

11-62 Crawl Web

Get Embed Code
2 Languages

Showing Revision 2 created 07/22/2014 by osawakjvta.

  1. Webをクロールするためのコードを書いていきます
  2. 目標はcrawl_webと呼ばれる関数を
    定義することです
  3. 入力としてシードページのurlを使用します
    urlはシードページを特定するものです
  4. シードページから開始してリンクをたどり
    たどり着いたすべてのurlのリストを出力します
  5. 意欲があればこれ以上の助けを借りずに
    自分1人でやってみるといいでしょう
  6. 難易度はとても高いです
  7. 小テストシリーズとしてクロールを行う方法を
    1つ1つ見ていきます
  8. 自分でできる自信があれば
  9. 私の紹介する段階的な小テストに従うのではなく
    自分でトライしてみてください
  10. それではcrawl_web関数の定義を始めます
  11. 2つの変数を挿入します
  12. クロールする必要のあるページを把握するtocrawlと
  13. すでににクロールしたページの
    リストであるcrawledです
  14. 1つ目のステップの目標は
  15. この変数をどう設定するか考えることです
  16. 1つ目の値はcrawlまたはcrawledの
    どちらになるでしょうか