WEBVTT 00:00:06.070 --> 00:00:07.120 Hai, nama saya John. 00:00:07.510 --> 00:00:10.140 Saya mengetuai pasukan carian dan pembelajaran mesin di Google. 00:00:12.130 --> 00:00:14.230 Saya rasa ia sangat memberi inspirasi 00:00:14.230 --> 00:00:16.214 bahawa manusia di seluruh dunia 00:00:16.215 --> 00:00:19.160 beralih ke enjin carian untuk bertanya soalan remeh 00:00:19.160 --> 00:00:20.930 dan soalan yang sangat penting. 00:00:20.930 --> 00:00:23.450 Jadi ia adalah tanggungjawab besar untuk memberi mereka 00:00:23.450 --> 00:00:24.864 jawapan terbaik yang kita boleh lakukan. 00:00:26.710 --> 00:00:30.610 Hai, nama saya Akshaya dan saya bekerja di pasukan carian Bing. 00:00:30.910 --> 00:00:33.190 Terdapat banyak kali di mana kita mula menerokai 00:00:33.190 --> 00:00:35.800 kecerdasan buatan dan pembelajaran mesin, 00:00:35.830 --> 00:00:39.010 tetapi kita perlu menangani bagaimana pengguna akan menggunakannya, 00:00:39.140 --> 00:00:42.390 kerana pada akhirnya, kita mahu memberi impak kepada masyarakat. 00:00:43.780 --> 00:00:45.400 Mari kita tanya soalan yang mudah. 00:00:45.820 --> 00:00:48.070 Berapa lama perjalanan ke Marikh? 00:00:49.330 --> 00:00:50.950 Dari mana asal keputusan ini 00:00:51.370 --> 00:00:54.100 dan mengapa ini disenaraikan sebelum yang lain? 00:00:55.700 --> 00:00:58.150 Baiklah, mari kita meneroka dan lihat bagaimana enjin carian 00:00:58.150 --> 00:00:59.860 mengubah permintaan anda ke hasil. 00:01:00.690 --> 00:01:03.360 Perkara pertama yang anda perlu tahu adalah apabila anda melakukan carian, 00:01:03.430 --> 00:01:06.480 mesin pencari sebenarnya tidak pergi ke Jaringan Sejagat 00:01:06.480 --> 00:01:08.010 untuk menjalankan carian anda dalam masa nyata. 00:01:08.140 --> 00:01:10.610 Ini adalah kerana terdapat lebih daripada satu bilion laman web 00:01:10.610 --> 00:01:14.140 di internet dan beratus-ratus lagi dicipta setiap minit. 00:01:14.140 --> 00:01:16.210 Jadi jika mesin pencari terpaksa meneliti 00:01:16.240 --> 00:01:18.690 setiap laman web untuk mencari hasil yang anda mahukan, 00:01:18.690 --> 00:01:20.120 ia akan mengambil masa yang amat lama. 00:01:20.500 --> 00:01:21.940 Jadi untuk membuat carian anda lebih cepat, 00:01:21.970 --> 00:01:24.940 enjin carian sentiasa mengimbas laman web terlebih dahulu 00:01:25.420 --> 00:01:28.560 untuk merakam maklumat yang mungkin membantu carian anda kemudian. 00:01:28.930 --> 00:01:31.270 Dengan cara ini, apabila anda mencari mengenai perjalanan ke Marikh, 00:01:31.630 --> 00:01:33.700 enjin carian sudah mempunyai hasil yang diperlukan 00:01:33.700 --> 00:01:35.728 untuk memberi anda jawapan dalam masa nyata. 00:01:36.250 --> 00:01:37.540 Inilah cara ia berfungsi. 00:01:37.900 --> 00:01:42.010 Internet adalah laman web yang dihubungkan antara satu sama lain dengan hiperpautan 00:01:42.400 --> 00:01:44.680 Enjin carian sentiasa menjalankan program 00:01:44.680 --> 00:01:47.380 dipanggil Spider yang menyeberang melalui laman-laman web ini 00:01:47.380 --> 00:01:49.040 untuk mengumpul maklumat mengenai mereka. 00:01:49.780 --> 00:01:51.550 Setiap kali ia menemui hiperpautan, 00:01:52.090 --> 00:01:55.000 ia mengikutinya sehingga ia telah melawat setiap halaman 00:01:55.030 --> 00:01:57.240 ia boleh didapati di seluruh Internet. 00:01:57.335 --> 00:01:59.170 Untuk setiap halaman Spider lawat, 00:01:59.200 --> 00:02:02.320 ia merekodkan sebarang maklumat yang mungkin diperlukan untuk suatu carian 00:02:02.500 --> 00:02:05.650 dengan menambahnya ke pangkalan data khas yang dipanggil indeks carian. 00:02:07.166 --> 00:02:09.530 Sekarang, mari kita kembali ke carian tadi 00:02:09.590 --> 00:02:11.990 dan lihat jika kita boleh mengetahui bagaimana enjin carian 00:02:11.990 --> 00:02:13.333 menghasilkan keputusannya. 00:02:13.640 --> 00:02:16.460 Apabila anda bertanya berapa lamakah masa perjalanan ke Marikh, 00:02:16.640 --> 00:02:18.860 enjin carian lihat pada setiap perkataan itu 00:02:18.920 --> 00:02:21.410 dengan segera dalam indeks carian untuk mendapatkan senarai 00:02:21.410 --> 00:02:24.500 semua halaman di internet yang mengandungi perkataan tersebut. 00:02:24.890 --> 00:02:26.870 Tetapi hanya mencari istilah carian ini 00:02:26.870 --> 00:02:28.760 akan mengembalikan berjuta-juta halaman, 00:02:28.760 --> 00:02:31.110 jadi enjin carian perlu boleh menentukan 00:02:31.110 --> 00:02:33.120 padanan terbaik untuk menunjukkan kepada anda terlebih dahulu. 00:02:33.340 --> 00:02:36.010 Di sinilah ia menjadi rumit kerana enjin carian 00:02:36.010 --> 00:02:38.040 mungkin perlu meneka apa yang anda sedang mencari. 00:02:38.930 --> 00:02:41.360 Setiap enjin carian menggunakan algoritma sendiri 00:02:41.360 --> 00:02:44.230 untuk menarafkan halaman berdasarkan apa yang difikirkannya anda mahukan. 00:02:44.930 --> 00:02:47.660 Algoritma kedudukan enjin carian mungkin menyemak 00:02:47.990 --> 00:02:50.360 jika istilah carian anda ditunjukkan dalam tajuk halaman, 00:02:50.900 --> 00:02:53.820 ia mungkin menyemak sama ada semua perkataan muncul di sebelahan satu sama lain, 00:02:54.520 --> 00:02:57.020 atau apa-apa bilangan pengiraan lain 00:02:57.020 --> 00:02:58.610 yang membantu ia menentukan dengan lebih baik 00:02:58.670 --> 00:03:01.420 halaman yang anda mahu lihat dan halaman yang anda tidak ingin lihat. 00:03:02.960 --> 00:03:04.960 Google mencipta algoritma yang paling terkenal 00:03:04.960 --> 00:03:08.530 kerana memilih hasil yang paling relevan untuk suatu carian dengan mengambil kira 00:03:08.560 --> 00:03:11.230 berapa banyak laman web lain yang dihubungkan ke halaman tertentu. 00:03:11.830 --> 00:03:14.140 Ideanya ialah jika banyak laman web berpendapat 00:03:14.140 --> 00:03:15.660 bahawa laman web tersebut menarik, 00:03:15.660 --> 00:03:17.940 maka ia mungkin suatu yang anda cari. 00:03:18.190 --> 00:03:20.020 Algoritma ini dipanggil kedudukan halaman, 00:03:20.590 --> 00:03:22.330 bukan kerana ia menilai kedudukan suatu laman web, 00:03:22.570 --> 00:03:25.210 tetapi kerana ia dinamakan sempena penciptanya, Larry Page, 00:03:25.480 --> 00:03:27.333 yang merupakan salah seorang pengasas Google. 00:03:27.940 --> 00:03:30.520 Kerana laman web sering menguntung apabila anda melawatnya, 00:03:30.820 --> 00:03:32.950 spammer sentiasa cuba mencari jalan 00:03:32.950 --> 00:03:35.741 untuk menipu algoritma carian supaya halaman mereka 00:03:35.742 --> 00:03:37.931 dapat disenaraikan lebih tinggi dalam hasil carian. 00:03:38.260 --> 00:03:40.750 Enjin carian kerap mengemaskini algoritma mereka 00:03:40.750 --> 00:03:44.296 untuk mengelak laman web palsu atau yang tidak boleh dipercayai mencapai kedudukan tinggi. 00:03:44.680 --> 00:03:47.350 Akhirnya, ia adalah tanggungjawab anda untuk berwaspada pada 00:03:47.500 --> 00:03:49.450 halaman web yang tidak boleh dipercayai 00:03:49.690 --> 00:03:52.990 dengan melihat alamat web mereka dan memastikan ia sumber yang boleh dipercayai. 00:03:53.680 --> 00:03:55.390 Program carian sentiasa berkembang 00:03:55.420 --> 00:03:58.420 untuk meningkatkan algoritma supaya mereka memberi hasil yang lebih baik, 00:03:58.540 --> 00:04:00.460 keputusan yang lebih pantas daripada pesaing mereka. 00:04:01.000 --> 00:04:03.100 Enjin carian hari ini juga menggunakan maklumat 00:04:03.100 --> 00:04:06.820 yang belum anda berikan secara jelas untuk membantu menentukan carian anda. 00:04:07.150 --> 00:04:10.120 Contohnya, jika anda membuat satu carian untuk taman anjing, 00:04:10.240 --> 00:04:12.190 banyak enjin carian akan memberikan hasil 00:04:12.190 --> 00:04:13.840 semua taman anjing yang berdekatan, 00:04:14.080 --> 00:04:16.260 walaupun anda tidak memasukkan lokasi anda. 00:04:17.800 --> 00:04:20.530 Enjin carian moden juga memahami lebih lanjut 00:04:20.530 --> 00:04:22.060 daripada sekadar perkataan pada halaman, 00:04:22.300 --> 00:04:24.970 tetapi maksud sebenar mereka supaya dapat mencari padanan 00:04:24.970 --> 00:04:26.750 terbaik untuk anda. 00:04:27.130 --> 00:04:29.980 Contohnya, jika anda mencari pitcher terpantas, 00:04:30.280 --> 00:04:32.300 ia akan tahu anda ingin mencari seorang atlet. 00:04:32.500 --> 00:04:34.450 Tetapi jika anda mencari pitcher besar, 00:04:34.450 --> 00:04:36.730 ia akan mencari pilihan untuk dapur anda. 00:04:38.420 --> 00:04:41.910 Untuk memahami perkataan dengan lebih baik, kami menggunakan pembelajaran mesin, 00:04:41.910 --> 00:04:43.985 sejenis kecerdasan buatan. 00:04:43.985 --> 00:04:46.050 Ia membolehkan algoritma carian untuk mencari 00:04:46.090 --> 00:04:48.400 bukan sekadar huruf individu atau perkataan dalam halaman, 00:04:48.400 --> 00:04:51.280 tetapi memahami asas maksud perkataan tersebut. 00:04:53.690 --> 00:04:55.850 Internet berkembang dengan cepat, 00:04:56.210 --> 00:04:59.810 jika pasukan yang merancang enjin carian melakukan tugas mereka dengan betul, 00:05:00.080 --> 00:05:04.090 maklumat yang anda cari harus sentiasa berada dalam beberapa klik kekunci sahaja.