< Return to Video

The Internet: How Search Works

  • 0:06 - 0:07
    Xin chào, tôi là John.
  • 0:08 - 0:10
    Tôi là trưởng nhóm tìm kiếm
    và máy học tại Google.
  • 0:12 - 0:14
    Tôi thật sự thấy phấn khích trước việc
  • 0:14 - 0:16
    mọi người từ khắp nơi trên thế giới
  • 0:16 - 0:19
    tìm đến các công cụ tìm kiếm để
    hỏi những điều vụn vặt
  • 0:19 - 0:21
    cũng như những điều thực sự lớn lao.
  • 0:21 - 0:23
    Vậy nên, trách nhiệm to lớn của
    chúng tôi là mang đến cho họ
  • 0:23 - 0:25
    câu trả lời tốt nhất.
  • 0:27 - 0:31
    Xin chào, tôi là Akshaya, và tôi làm
    trong đội ngũ tìm kiếm của Bing.
  • 0:31 - 0:33
    Có rất nhiều thời điểm khi
    chúng tôi bắt đầu nghiên cứu về
  • 0:33 - 0:36
    trí thông minh nhân tạo
    và máy học,
  • 0:36 - 0:39
    nhưng chúng tôi phải chú ý đến
    cách người dùng sẽ sử dụng
  • 0:39 - 0:42
    bởi lẽ suy cho cùng,
    chúng tôi muốn tác động đến xã hội.
  • 0:44 - 0:45
    Hãy thử hỏi một câu đơn giản thôi.
  • 0:46 - 0:48
    Mất bao lâu để bay lên Sao Hỏa?
  • 0:49 - 0:51
    Những kết quả này đến từ đâu
  • 0:51 - 0:54
    và tại sao kết quả này
    được liệt kê trước kết quả kia?
  • 0:56 - 0:58
    Giờ thì hãy đào sâu và
    xem thử công cụ tìm kiếm
  • 0:58 - 1:00
    biến yêu cầu của bạn
    thành kết quả như thế nào.
  • 1:01 - 1:03
    Điều đầu tiên bạn cần phải biết
    chính là khi bạn tìm kiếm,
  • 1:03 - 1:06
    công cụ tìm kiếm thực ra không
    truy cập vào mạng lưới toàn cầu
  • 1:06 - 1:08
    để chạy lệnh tìm kiếm của bạn
    theo thời gian thực.
  • 1:08 - 1:11
    Và lý do chính là vì có
    hơn một tỷ trang web
  • 1:11 - 1:14
    trên Internet và hàng trăm
    trang web mới tạo mỗi phút.
  • 1:14 - 1:16
    Vậy nên nếu công cụ tìm kiếm
    phải tìm hết
  • 1:16 - 1:19
    từng trang một để
    tìm ra câu trả lời cho bạn
  • 1:19 - 1:20
    thì chắc còn lâu mới xong.
  • 1:20 - 1:22
    Cho nên, để bạn tìm kiếm nhanh hơn,
  • 1:22 - 1:25
    công cụ tìm kiếm sẽ liên tục
    quét trước các trang web
  • 1:25 - 1:29
    để ghi nhận thông tin có thể
    hỗ trợ bạn tìm kiếm sau này.
  • 1:29 - 1:31
    Bằng cách đó, khi bạn tìm kiếm
    về việc bay lên Sao Hỏa,
  • 1:32 - 1:34
    công cụ tìm kiếm
    đã có cái dữ liệu cần thiết
  • 1:34 - 1:36
    để cho bạn câu trả lời
    theo thời gian thực.
  • 1:36 - 1:38
    Đây là cách nó hoạt động.
  • 1:38 - 1:42
    Internet là một mạng lưới các trang
    được kết nối với nhau bằng các siêu liên kết.
  • 1:42 - 1:45
    Công cụ tìm kiếm
    liên tục chạy một chương trình
  • 1:45 - 1:47
    mang tên Spider, truy cập hết
    những trang web này
  • 1:47 - 1:49
    để thu thập thông tin về chúng.
  • 1:50 - 1:52
    Mỗi khi nó tìm thấy một siêu liên kết,
  • 1:52 - 1:55
    nó sẽ đi theo liên kết ấy cho đến khi
    đã truy cập hết tất cả các trang
  • 1:55 - 1:57
    nó có thể tìm thấy trên toàn bộ
    Internet.
  • 1:57 - 1:59
    Với mỗi trang spider truy cập,
  • 1:59 - 2:02
    nó sẽ ghi nhận mọi thông tin
    có thể cần thiết cho việc tìm kiếm
  • 2:02 - 2:06
    bằng cách thêm thông tin đó vào
    cơ sở dữ liệu đặc biệt mang tên danh mục tìm kiếm.
  • 2:07 - 2:10
    Bây giờ chúng ta hãy quay lại
    lệnh tìm kiếm trước đó
  • 2:10 - 2:12
    và xem thử liệu chúng ta có thể
    hiểu được cách công cụ tìm kiếm
  • 2:12 - 2:13
    cho ra các kết quả.
  • 2:14 - 2:16
    Khi bạn hỏi mất bao lâu để
    bay lên Sao Hỏa,
  • 2:17 - 2:19
    công cụ tìm kiếm sẽ tìm kiếm
    từng từ một trong số đó
  • 2:19 - 2:21
    trong danh mục tìm kiếm để
    ngay lập tức lên danh sách
  • 2:21 - 2:24
    tất cả các trang trên
    Internet có chứa những từ đó.
  • 2:25 - 2:27
    Nhưng chỉ dựa vào những
    từ tìm kiếm này thôi
  • 2:27 - 2:29
    thì sẽ cho ra hàng triệu trang,
  • 2:29 - 2:31
    vậy nên, công cụ tìm kiếm cần
    có khả năng xác định
  • 2:31 - 2:33
    kết quả phù hợp nhất để đưa ra cho bạn.
  • 2:33 - 2:36
    Đây là lúc mọi chuyện trở nên khó khăn
    bởi lẽ công cụ tìm kiếm
  • 2:36 - 2:38
    có thể cần phải đoán xem
    bạn đang tìm kiếm điều gì.
  • 2:39 - 2:41
    Mỗi công cụ tìm kiếm
    sẽ dùng thuật toán riêng của mình
  • 2:41 - 2:44
    để xếp hạng các trang dựa trên
    điều nó nghĩ là bạn muốn tìm.
  • 2:45 - 2:48
    Thuật toán xếp hạng của
    công cụ tìm kiếm có thể sẽ kiểm xem
  • 2:48 - 2:50
    liệu từ khóa tìm kiếm của bạn có xuất hiện
    trên tiêu đề của trang không,
  • 2:51 - 2:54
    nó có thể sẽ kiểm tra xem liệu tất cả
    các từ có xuất hiện bên cạnh nhau không
  • 2:55 - 2:57
    hay có con số bất kỳ trong phép tính khác
  • 2:57 - 2:59
    có thể giúp xác định tốt hơn
  • 2:59 - 3:01
    trang nào là trang bạn sẽ muốn
    xem và trang nào thì không.
  • 3:03 - 3:05
    Google đã phát minh ra
    thuật toán nổi tiếng nhất
  • 3:05 - 3:09
    để chọn ra các kết quả liên quan nhất
    cho một lệnh tìm kiếm bằng cách tính đến việc
  • 3:09 - 3:11
    có bao nhiêu trang web khác
    liên kết với một trang bất kỳ.
  • 3:12 - 3:14
    Lập luận ở đây chính là nếu
    nhiều trang web cho rằng
  • 3:14 - 3:16
    trang web đó thú vị
  • 3:16 - 3:18
    thì rất có thể đó chính là trang
    bạn đang tìm kiếm.
  • 3:18 - 3:20
    Thuật toán này được gọi là
    xếp hạng Page,
  • 3:21 - 3:22
    không phải vì nó xếp hạng
    các trang web
  • 3:23 - 3:25
    mà vì nó được đặt theo tên
    của người phát minh ra nó, Larry Page,
  • 3:25 - 3:27
    một trong những
    nhà sáng lập của Google.
  • 3:28 - 3:31
    Vì trang web thường có
    doanh thu khi bạn truy cập
  • 3:31 - 3:33
    nên các trang rác đang
    không ngừng tìm cách
  • 3:33 - 3:36
    lợi dụng thuật toán tìm kiếm
    để các trang ấy
  • 3:36 - 3:38
    trở thành kết quả xuất hiện trước.
  • 3:38 - 3:41
    Các công cụ tìm kiếm thường xuyên
    cập nhật thuật toán của mình
  • 3:41 - 3:44
    để ngăn các trang giả mạo
    hoặc không đáng tin cậy đạt xếp hạng cao.
  • 3:45 - 3:47
    Hơn hết thảy, chính bạn là người
    cần để mắt đến
  • 3:48 - 3:49
    những trang thiếu tin cậy này
  • 3:50 - 3:53
    bằng cách nhìn vào địa chỉ web và
    đảm bảo đó là nguồn đáng tin cậy.
  • 3:54 - 3:55
    Các chương trình tìm kiếm luôn phát triển
  • 3:55 - 3:58
    để cải thiện các thuật toán
    nhằm cho ra các kết quả chính xác hơn,
  • 3:59 - 4:00
    nhanh hơn so với đối thủ cạnh tranh.
  • 4:01 - 4:03
    Các công cụ tìm kiếm ngày nay
    thậm chí còn dùng thông tin
  • 4:03 - 4:07
    bạn chưa biểu đạt rõ ràng
    để giúp bạn khoanh vùng tìm kiếm.
  • 4:07 - 4:10
    Ví dụ như:
    Nếu bạn tìm công viên cho chó,
  • 4:10 - 4:12
    nhiều công cụ tìm kiếm
    sẽ cho bạn kết quả
  • 4:12 - 4:14
    về tất cả các công viên cho chó lân cận
  • 4:14 - 4:16
    mặc dù bạn không hề
    gõ vào địa điểm của mình.
  • 4:18 - 4:21
    Công cụ tìm kiếm hiện đại
    không chỉ đơn thuần hiểu
  • 4:21 - 4:22
    về từ ngữ có trên trang
  • 4:22 - 4:25
    mà còn hiểu ý nghĩa thực sự của chúng
    để tìm ra kết quả
  • 4:25 - 4:27
    phù hợp nhất mà bạn đang tìm kiếm.
  • 4:27 - 4:30
    Ví dụ: Nếu bạn tìm
    "fast pitcher",
  • 4:30 - 4:32
    nó sẽ hiểu là bạn đang
    tìm kiếm một vận động viên.
  • 4:32 - 4:34
    Nhưng nếu bạn tìm "large pitcher",
  • 4:34 - 4:37
    nó sẽ tìm kiếm những lựa chọn
    cho căn bếp của bạn.
  • 4:38 - 4:42
    Để hiểu hơn về từ ngữ,
    chúng ta dùng đến cái gọi là máy học,
  • 4:42 - 4:44
    một loại trí thông minh nhân tạo.
  • 4:44 - 4:46
    Nó cho phép
    thuật toán tìm kiếm không chỉ
  • 4:46 - 4:48
    tìm kiếm các chữ cái
    hoặc từ ngữ đơn lẻ trên trang
  • 4:48 - 4:51
    mà còn hiểu được
    ý nghĩa ẩn sâu của từ ngữ.
  • 4:54 - 4:56
    Internet đang phát triển mạnh mẽ,
  • 4:56 - 5:00
    nhưng nếu đội ngũ thiết kế
    công cụ tìm kiếm làm việc hiệu quả,
  • 5:00 - 5:04
    bạn sẽ chỉ cần gõ vài phím
    để có được thông tin mình cần.
Title:
The Internet: How Search Works
Description:

more » « less
Video Language:
English
Team:
Code.org
Project:
How Internet Works
Duration:
05:13

Vietnamese subtitles

Revisions Compare revisions