Chinese, Traditional subtitles

← 01-03 Overview of the Unit

Get Embed Code
23 Languages

Showing Revision 1 created 12/04/2012 by Gundega.

  1. 這門課的前三單元,目標是建立一個網頁蜘蛛 (web crawler)
  2. 他們將為我們的搜尋引擎,從網路上收集資料
  3. 藉由建立網頁蜘蛛,也會學到計算的重要觀念
  4. 在第一單元,我們從擷取網頁上第一個連結 (link) 開始
  5. 網頁蜘蛛會為我們的搜尋引擎尋找網頁
  6. 從種子頁面 (seed page) 開始,然後跟隨著頁面上的連結 (link),找到其他的網頁
  7. 每一個連結 (link) 通往某些新網頁,這些新網頁本身也可能有 links 通往其他網頁
  8. 當我們跟隨這些 links,我們會發現更多、更多的網頁
  9. 這些網頁形成了資料庫,我們將在搜尋引擎中做運用
  10. 網頁 (web page) 實際上只是一大塊文字,從網際網路 (internet) 來到你的網頁瀏覽器
  11. 我們將在第四單元討論更多關於網頁的運作方式
  12. 但是現在,重要的是要瞭解
  13. link 實際上只是網頁中一種特殊的文字
  14. 當你點擊瀏覽器中的 link,它會引導你到新網頁
  15. 你可以繼續跟隨這些 links
  16. 在這個單元中,我們要做的事,就是寫一個程式,從網頁中擷取第一個 link
  17. 在後面的單元,我們要知道如何擷取所有的 links,並且為我們的搜尋引擎蒐集資料