Vietnamese subtitles

← 01-03 Overview of the Unit

Get Embed Code
23 Languages

Showing Revision 1 created 12/04/2012 by Gundega.

  1. Một đích của 3 phần học đầu tiên trong khóa này là xây dựng một trình thu thập thông tin web.
  2. Chúng sẽ thu thập dữ liệu từ web để sử dụng trong trình tìm kiếm của chúng ta.
  3. Và để học những ý tưởng trong ngành điện toán bằng cách thực hành chúng.
  4. Trong học phần 1, chúng ta sẽ bắt tay vào trích xuất đường link đầu tiên trong một trang web.
  5. Một trình thu thập thông tin web tìm kiếm các trang web phục vụ cho trình tìm kiếm của chúng ta.
  6. bằng cách bắt đầu từ một trang "hạt giống" và lần theo các đường dẫn trên trang ấy để tìm ra những trang khác.
  7. Mỗi một đường dẫn trong những đường dẫn ấy dẫn đến những trang web mới, mà tự những trang này sẽ dẫn đến những trang web khác nữa.
  8. Khi chúng ta lần theo những đường dẫn này, chúng ta sẽ tìm ra nhiều trang web khác nữa
  9. xây dựng nên một tập dữ liệu mà chúng ta sẽ sử dụng cho trình tìm kiếm của mình.
  10. Một trang web thực sự là một nùi văn bản đi từ Internet đến trình duyệt web của bạn.
  11. Chúng ta sẽ thảo luận nhiều hơn về cách nó vận hành như thế nào trong học phần 4.
  12. Bây giờ, việc quan trọng cần nắm là
  13. một đường dẫn thực ra chỉ là một loại văn bản đặc biệt trong một trang web.
  14. Khi bạn nhấp chuột vào một đường dẫn trong trình duyệt của bạn, nó sẽ đưa bạn đến một trang mới.
  15. Và bạn có thể tiếp tục lần theo những đường dẫn đó (...)
  16. Cái chúng ta sắp thực hiện trong học phần này là viết một chương trình để trích xuất đường dẫn đầu tiên từ trang web.
  17. Trong những học phần sau, chúng ta sẽ hình dung ra cách trích xuất tất cả các đường dẫn và xây dựng một tập hợp để sử dụng trong trình tìm kiếm của chúng ta.