Return to Video

cs101_unit4_06_s_Finishing-the-Web-Crawler

  • 0:00 - 0:04
    答案就是 应使用刚刚定义的“addpageto_index”过程
  • 0:04 - 0:06
    传入索引
  • 0:06 - 0:10
    并传入网页 即定义位置的URL
  • 0:10 - 0:12
    还要传入内容
  • 0:12 - 0:14
    以上加起来就是全部所需内容
  • 0:14 - 0:16
    这样 我们就完成了网络爬虫
  • 0:16 - 0:18
    对于种子而言 我们可以找到一系列网页
  • 0:18 - 0:23
    循着该种子 及从该种子开始 在网页上找到的所有链接
  • 0:23 - 0:27
    我们可每个网页添加内容至索引
  • 0:27 - 0:29
    并返回该索引
  • 0:29 - 0:33
    我们已经写好编码 只要有指定索引 就开始开始搜索
  • 0:33 - 0:36
    因此 对于任何需要查找的词
    我们都能找到URL链表 指向包含该词的页面
Title:
cs101_unit4_06_s_Finishing-the-Web-Crawler
Description:

dummy description

more » « less
Video Language:
English
Team:
Udacity
Project:
CS101 - Intro to Computer Science
Duration:
0:40

Chinese, Simplified subtitles

Revisions Compare revisions