0:00:06.070,0:00:07.120 Xin chào, tôi là John. 0:00:07.510,0:00:10.140 Tôi là trưởng nhóm tìm kiếm[br]và máy học tại Google. 0:00:12.130,0:00:14.230 Tôi thật sự thấy phấn khích trước việc 0:00:14.230,0:00:16.214 mọi người từ khắp nơi trên thế giới 0:00:16.215,0:00:19.160 tìm đến các công cụ tìm kiếm để[br]hỏi những điều vụn vặt 0:00:19.160,0:00:20.930 cũng như những điều thực sự lớn lao. 0:00:20.930,0:00:23.450 Vậy nên, trách nhiệm to lớn của[br]chúng tôi là mang đến cho họ 0:00:23.450,0:00:24.864 câu trả lời tốt nhất. 0:00:26.710,0:00:30.610 Xin chào, tôi là Akshaya, và tôi làm[br]trong đội ngũ tìm kiếm của Bing. 0:00:30.910,0:00:33.190 Có rất nhiều thời điểm khi[br]chúng tôi bắt đầu nghiên cứu về 0:00:33.190,0:00:35.800 trí thông minh nhân tạo[br]và máy học, 0:00:35.830,0:00:39.010 nhưng chúng tôi phải chú ý đến[br]cách người dùng sẽ sử dụng 0:00:39.140,0:00:42.390 bởi lẽ suy cho cùng,[br]chúng tôi muốn tác động đến xã hội. 0:00:43.780,0:00:45.400 Hãy thử hỏi một câu đơn giản thôi. 0:00:45.820,0:00:48.070 Mất bao lâu để bay lên Sao Hỏa? 0:00:49.330,0:00:50.950 Những kết quả này đến từ đâu 0:00:51.370,0:00:54.100 và tại sao kết quả này[br]được liệt kê trước kết quả kia? 0:00:55.700,0:00:58.150 Giờ thì hãy đào sâu và[br]xem thử công cụ tìm kiếm 0:00:58.150,0:00:59.860 biến yêu cầu của bạn[br]thành kết quả như thế nào. 0:01:00.690,0:01:03.360 Điều đầu tiên bạn cần phải biết[br]chính là khi bạn tìm kiếm, 0:01:03.430,0:01:06.480 công cụ tìm kiếm thực ra không[br]truy cập vào mạng lưới toàn cầu 0:01:06.480,0:01:08.010 để chạy lệnh tìm kiếm của bạn[br]theo thời gian thực. 0:01:08.140,0:01:10.610 Và lý do chính là vì có[br]hơn một tỷ trang web 0:01:10.610,0:01:14.140 trên Internet và hàng trăm[br]trang web mới tạo mỗi phút. 0:01:14.140,0:01:16.210 Vậy nên nếu công cụ tìm kiếm[br]phải tìm hết 0:01:16.240,0:01:18.690 từng trang một để[br]tìm ra câu trả lời cho bạn 0:01:18.690,0:01:20.120 thì chắc còn lâu mới xong. 0:01:20.500,0:01:21.940 Cho nên, để bạn tìm kiếm nhanh hơn, 0:01:21.970,0:01:24.940 công cụ tìm kiếm sẽ liên tục[br]quét trước các trang web 0:01:25.420,0:01:28.560 để ghi nhận thông tin có thể[br]hỗ trợ bạn tìm kiếm sau này. 0:01:28.930,0:01:31.270 Bằng cách đó, khi bạn tìm kiếm[br]về việc bay lên Sao Hỏa, 0:01:31.630,0:01:33.700 công cụ tìm kiếm[br]đã có cái dữ liệu cần thiết 0:01:33.700,0:01:35.728 để cho bạn câu trả lời[br]theo thời gian thực. 0:01:36.250,0:01:37.540 Đây là cách nó hoạt động. 0:01:37.900,0:01:42.010 Internet là một mạng lưới các trang[br]được kết nối với nhau bằng các siêu liên kết. 0:01:42.400,0:01:44.680 Công cụ tìm kiếm[br]liên tục chạy một chương trình 0:01:44.680,0:01:47.380 mang tên Spider, truy cập hết[br]những trang web này 0:01:47.380,0:01:49.040 để thu thập thông tin về chúng. 0:01:49.780,0:01:51.550 Mỗi khi nó tìm thấy một siêu liên kết, 0:01:52.090,0:01:55.000 nó sẽ đi theo liên kết ấy cho đến khi[br]đã truy cập hết tất cả các trang 0:01:55.030,0:01:57.240 nó có thể tìm thấy trên toàn bộ[br]Internet. 0:01:57.335,0:01:59.170 Với mỗi trang spider truy cập, 0:01:59.200,0:02:02.320 nó sẽ ghi nhận mọi thông tin[br]có thể cần thiết cho việc tìm kiếm 0:02:02.500,0:02:05.650 bằng cách thêm thông tin đó vào[br]cơ sở dữ liệu đặc biệt mang tên danh mục tìm kiếm. 0:02:07.166,0:02:09.530 Bây giờ chúng ta hãy quay lại[br]lệnh tìm kiếm trước đó 0:02:09.590,0:02:11.990 và xem thử liệu chúng ta có thể[br]hiểu được cách công cụ tìm kiếm 0:02:11.990,0:02:13.333 cho ra các kết quả. 0:02:13.640,0:02:16.460 Khi bạn hỏi mất bao lâu để[br]bay lên Sao Hỏa, 0:02:16.640,0:02:18.860 công cụ tìm kiếm sẽ tìm kiếm[br]từng từ một trong số đó 0:02:18.920,0:02:21.410 trong danh mục tìm kiếm để[br]ngay lập tức lên danh sách 0:02:21.410,0:02:24.500 tất cả các trang trên[br]Internet có chứa những từ đó. 0:02:24.890,0:02:26.870 Nhưng chỉ dựa vào những[br]từ tìm kiếm này thôi 0:02:26.870,0:02:28.760 thì sẽ cho ra hàng triệu trang, 0:02:28.760,0:02:31.110 vậy nên, công cụ tìm kiếm cần[br]có khả năng xác định 0:02:31.110,0:02:33.120 kết quả phù hợp nhất để đưa ra cho bạn. 0:02:33.340,0:02:36.010 Đây là lúc mọi chuyện trở nên khó khăn[br]bởi lẽ công cụ tìm kiếm 0:02:36.010,0:02:38.040 có thể cần phải đoán xem[br]bạn đang tìm kiếm điều gì. 0:02:38.930,0:02:41.360 Mỗi công cụ tìm kiếm[br]sẽ dùng thuật toán riêng của mình 0:02:41.360,0:02:44.230 để xếp hạng các trang dựa trên[br]điều nó nghĩ là bạn muốn tìm. 0:02:44.930,0:02:47.660 Thuật toán xếp hạng của[br]công cụ tìm kiếm có thể sẽ kiểm xem 0:02:47.990,0:02:50.360 liệu từ khóa tìm kiếm của bạn có xuất hiện[br]trên tiêu đề của trang không, 0:02:50.900,0:02:53.820 nó có thể sẽ kiểm tra xem liệu tất cả[br]các từ có xuất hiện bên cạnh nhau không 0:02:54.520,0:02:57.020 hay có con số bất kỳ trong phép tính khác 0:02:57.020,0:02:58.610 có thể giúp xác định tốt hơn 0:02:58.670,0:03:01.420 trang nào là trang bạn sẽ muốn[br]xem và trang nào thì không. 0:03:02.960,0:03:04.960 Google đã phát minh ra[br]thuật toán nổi tiếng nhất 0:03:04.960,0:03:08.530 để chọn ra các kết quả liên quan nhất[br]cho một lệnh tìm kiếm bằng cách tính đến việc 0:03:08.560,0:03:11.230 có bao nhiêu trang web khác[br]liên kết với một trang bất kỳ. 0:03:11.830,0:03:14.140 Lập luận ở đây chính là nếu[br]nhiều trang web cho rằng 0:03:14.140,0:03:15.660 trang web đó thú vị 0:03:15.660,0:03:17.940 thì rất có thể đó chính là trang[br]bạn đang tìm kiếm. 0:03:18.190,0:03:20.020 Thuật toán này được gọi là[br]xếp hạng Page, 0:03:20.590,0:03:22.330 không phải vì nó xếp hạng[br]các trang web 0:03:22.570,0:03:25.210 mà vì nó được đặt theo tên[br]của người phát minh ra nó, Larry Page, 0:03:25.480,0:03:27.333 một trong những[br]nhà sáng lập của Google. 0:03:27.940,0:03:30.520 Vì trang web thường có[br]doanh thu khi bạn truy cập 0:03:30.820,0:03:32.950 nên các trang rác đang[br]không ngừng tìm cách 0:03:32.950,0:03:35.741 lợi dụng thuật toán tìm kiếm[br]để các trang ấy 0:03:35.742,0:03:37.931 trở thành kết quả xuất hiện trước. 0:03:38.260,0:03:40.750 Các công cụ tìm kiếm thường xuyên[br]cập nhật thuật toán của mình 0:03:40.750,0:03:44.296 để ngăn các trang giả mạo[br]hoặc không đáng tin cậy đạt xếp hạng cao. 0:03:44.680,0:03:47.350 Hơn hết thảy, chính bạn là người[br]cần để mắt đến 0:03:47.500,0:03:49.450 những trang thiếu tin cậy này 0:03:49.690,0:03:52.990 bằng cách nhìn vào địa chỉ web và[br]đảm bảo đó là nguồn đáng tin cậy. 0:03:53.680,0:03:55.390 Các chương trình tìm kiếm luôn phát triển 0:03:55.420,0:03:58.420 để cải thiện các thuật toán[br]nhằm cho ra các kết quả chính xác hơn, 0:03:58.540,0:04:00.460 nhanh hơn so với đối thủ cạnh tranh. 0:04:01.000,0:04:03.100 Các công cụ tìm kiếm ngày nay[br]thậm chí còn dùng thông tin 0:04:03.100,0:04:06.820 bạn chưa biểu đạt rõ ràng[br]để giúp bạn khoanh vùng tìm kiếm. 0:04:07.150,0:04:10.120 Ví dụ như:[br]Nếu bạn tìm công viên cho chó, 0:04:10.240,0:04:12.190 nhiều công cụ tìm kiếm[br]sẽ cho bạn kết quả 0:04:12.190,0:04:13.840 về tất cả các công viên cho chó lân cận 0:04:14.080,0:04:16.260 mặc dù bạn không hề[br]gõ vào địa điểm của mình. 0:04:17.800,0:04:20.530 Công cụ tìm kiếm hiện đại[br]không chỉ đơn thuần hiểu 0:04:20.530,0:04:22.060 về từ ngữ có trên trang 0:04:22.300,0:04:24.970 mà còn hiểu ý nghĩa thực sự của chúng[br]để tìm ra kết quả 0:04:24.970,0:04:26.750 phù hợp nhất mà bạn đang tìm kiếm. 0:04:27.130,0:04:29.980 Ví dụ: Nếu bạn tìm[br]"fast pitcher", 0:04:30.280,0:04:32.300 nó sẽ hiểu là bạn đang[br]tìm kiếm một vận động viên. 0:04:32.500,0:04:34.450 Nhưng nếu bạn tìm "large pitcher", 0:04:34.450,0:04:36.730 nó sẽ tìm kiếm những lựa chọn[br]cho căn bếp của bạn. 0:04:38.420,0:04:41.910 Để hiểu hơn về từ ngữ,[br]chúng ta dùng đến cái gọi là máy học, 0:04:41.910,0:04:43.985 một loại trí thông minh nhân tạo. 0:04:43.985,0:04:46.050 Nó cho phép[br]thuật toán tìm kiếm không chỉ 0:04:46.090,0:04:48.400 tìm kiếm các chữ cái[br]hoặc từ ngữ đơn lẻ trên trang 0:04:48.400,0:04:51.280 mà còn hiểu được[br]ý nghĩa ẩn sâu của từ ngữ. 0:04:53.690,0:04:55.850 Internet đang phát triển mạnh mẽ, 0:04:56.210,0:04:59.810 nhưng nếu đội ngũ thiết kế[br]công cụ tìm kiếm làm việc hiệu quả, 0:05:00.080,0:05:04.090 bạn sẽ chỉ cần gõ vài phím[br]để có được thông tin mình cần.