WEBVTT 00:00:06.070 --> 00:00:07.120 Hai, saya John. 00:00:07.510 --> 00:00:10.140 Saya mengetuai pasukan mencari dan pembelajaran mesin di Google. 00:00:12.130 --> 00:00:14.230 Ia amat berinspirasi 00:00:14.230 --> 00:00:16.214 bahawa semua orang di dunia 00:00:16.215 --> 00:00:19.160 menggunakan enjin carian utnuk tanya soalan remeh 00:00:19.160 --> 00:00:20.930 dan soalan yang amat penting. 00:00:20.930 --> 00:00:23.450 Ia tanggunajwab besar untuk berikan 00:00:23.450 --> 00:00:24.864 jawapan terbaik yang boleh. 00:00:26.710 --> 00:00:30.610 Hai, saya Akshaya dan saya bekerja untuk pasukan carian Bing. 00:00:30.910 --> 00:00:33.190 Banyak kali kami mencari 00:00:33.190 --> 00:00:35.800 dalam kecerdasan buatan dan pembelajaran mesin 00:00:35.830 --> 00:00:39.010 tapi kami perlu menyelesaikan cara pengguna menggunakannya, 00:00:39.140 --> 00:00:42.390 kerana akhirnya, kami mahu memberi impak kepada masyarakat. 00:00:43.780 --> 00:00:45.400 Mari kami tanya soalan mudah. 00:00:45.820 --> 00:00:48.070 Berapa lama perjalanan ke Mars? 00:00:49.330 --> 00:00:50.950 Dari mana keputusan ini datang 00:00:51.370 --> 00:00:54.100 dan kenapa ia disenaraikan sebelum pencarian yang lain? 00:00:55.700 --> 00:00:58.150 Okey, mari kami ketahui cara enjin carian 00:00:58.150 --> 00:00:59.860 menukar permintaan kepada hasil. 00:01:00.690 --> 00:01:03.360 Perkara pertama semasa mencari, 00:01:03.430 --> 00:01:06.480 enjin carian ini tidak keluar ke World Wide Web untuk 00:01:06.480 --> 00:01:08.010 mencari dalam masa sebenar. 00:01:08.140 --> 00:01:10.610 Ia kerana ada berbilion laman web 00:01:10.610 --> 00:01:14.140 di internet dan ratusan lagi dicipta setiap minit. 00:01:14.140 --> 00:01:16.210 Jika enjiin carian perlu meneliti 00:01:16.240 --> 00:01:18.690 setiap laman untuk mencari sasaran, 00:01:18.690 --> 00:01:20.120 ia akan mengambil selamanya. 00:01:20.500 --> 00:01:21.940 Supaya carian dipercepatkan, 00:01:21.970 --> 00:01:24.940 enjin carian selalu mengimbas web secara terdahulu 00:01:25.420 --> 00:01:28.560 untuk merekod maklumat yang mungkin membantu carian kemudian. 00:01:28.930 --> 00:01:31.270 Jadi, apabila anda mencari perjalanan ke Mars, 00:01:31.630 --> 00:01:33.700 enjin carian sudah ada hasil 00:01:33.700 --> 00:01:35.728 untuk memberi jawapan masa nyata. 00:01:36.250 --> 00:01:37.540 Ini cara ia berfungsi. 00:01:37.900 --> 00:01:42.010 Internet adalah web halaman yang disambungkan oleh pautan hiper. 00:01:42.400 --> 00:01:44.680 Enjin carian sentiasa menjalankan program 00:01:44.680 --> 00:01:47.380 Spider yang merentasi halaman web 00:01:47.380 --> 00:01:49.040 untuk mengumpul maklumat. 00:01:49.780 --> 00:01:51.550 Setiap kali pautan hiper dijumpai, 00:01:52.090 --> 00:01:55.000 ia mengikutinya sehingga ia melayari setiap halaman 00:01:55.030 --> 00:01:57.240 di kseluruhan internet. 00:01:57.335 --> 00:01:59.170 Setiap halaman yang dilayari Spider, 00:01:59.200 --> 00:02:02.320 ia merekod maklumat untuk carian 00:02:02.500 --> 00:02:05.650 dengan menambahkan pangkalan data khas iaitu indeks carian. 00:02:07.166 --> 00:02:09.530 Kami kembali ke carian awal 00:02:09.590 --> 00:02:11.990 dan tentukan cara enjin carian 00:02:11.990 --> 00:02:13.333 mengeluarkan hasil. 00:02:13.640 --> 00:02:16.460 Apabila anda tanya masa perjalanan ke Mars, 00:02:16.640 --> 00:02:18.860 enjin carian mencari setiap perkataan 00:02:18.920 --> 00:02:21.410 dalam indeks carian untuk mendapat senarai 00:02:21.410 --> 00:02:24.500 semua halaman di internet yang mengandungi perkataan itu. 00:02:24.890 --> 00:02:26.870 Tapi mencari terma carian ini 00:02:26.870 --> 00:02:28.760 mungkin memberikan jutaan halaman, 00:02:28.760 --> 00:02:31.110 jadi enjin carian perlu menentukan 00:02:31.110 --> 00:02:33.120 padanan terbaik untuk dipaparkan dulu. 00:02:33.340 --> 00:02:36.010 Ini sukar kerana enjin carian 00:02:36.010 --> 00:02:38.040 mungkin perlu teka apa yang dicari. 00:02:38.930 --> 00:02:41.360 Setiap enjin carian guna algoritma sendiri 00:02:41.360 --> 00:02:44.230 untuk susun halaman mengikut apa yang ia fikir anda mahukan. 00:02:44.930 --> 00:02:47.660 Algoritma susunan enjin carian mungkin memeriksa 00:02:47.990 --> 00:02:50.360 sekiranya terma carian anda dipaparkan pada tajuk halaman, 00:02:50.900 --> 00:02:53.820 ia mungkin memeriksa jika semua perkataan muncul bersebalahan, 00:02:54.520 --> 00:02:57.020 atau kiraan lain 00:02:57.020 --> 00:02:58.610 yang membantu menentukan 00:02:58.670 --> 00:03:01.420 halaman yang anda mahu dan tidak mahu. 00:03:02.960 --> 00:03:04.960 Google mencipta algoritma paling terkenal 00:03:04.960 --> 00:03:08.530 untuk memilih keputusan paling relevan untuk carian dengan mengambil kira 00:03:08.560 --> 00:03:11.230 berapa banyak halaman web disambungkan kepada halaman. 00:03:11.830 --> 00:03:14.140 Jika banyak laman web fikir 00:03:14.140 --> 00:03:15.660 satu halaman web menarik, 00:03:15.660 --> 00:03:17.940 mungkin itulah carian anda. 00:03:18.190 --> 00:03:20.020 Algoritma ini adalah susunan halaman, 00:03:20.590 --> 00:03:22.330 bukan kerana ia susun halaman web, 00:03:22.570 --> 00:03:25.210 tapi kerana ia dinamakan sempena penciptanya, Larry Page, 00:03:25.480 --> 00:03:27.333 iaitu pengasas bersama Google. 00:03:27.940 --> 00:03:30.520 Kerana laman web biasa menjana duit apabila dilayari, 00:03:30.820 --> 00:03:32.950 tukang spam sentiasa mencari cara 00:03:32.950 --> 00:03:35.741 untuk mengacau algoritma carian supaya halaman mereka 00:03:35.742 --> 00:03:37.931 disenaraikan lebih tinggi. 00:03:38.260 --> 00:03:40.750 Enjin carian kerap mengemaskini algoritma 00:03:40.750 --> 00:03:44.296 untuk mengelakkan laman palsu atau tidak boleh dipercayai naik ke atas. 00:03:44.680 --> 00:03:47.350 Akhirnya, ia terpulang kepada anda untuk memastikan anda perhatikan 00:03:47.500 --> 00:03:49.450 halaman yang tidak boleh dipercayai 00:03:49.690 --> 00:03:52.990 dengan melihat alamat mereka dan memastikan ia sumber boleh percaya. 00:03:53.680 --> 00:03:55.390 Atur cara carian selalu berevolusi 00:03:55.420 --> 00:03:58.420 untuk mempertingkatkan algoritma untuk keputusan yang lebih baik, 00:03:58.540 --> 00:04:00.460 dan lebih cepat berbanding saingan. 00:04:01.000 --> 00:04:03.100 Enjin carian hari ini juga menggunakan maklumat 00:04:03.100 --> 00:04:06.820 yang anda belum berikan untuk mengecilkan carian. 00:04:07.150 --> 00:04:10.120 Contohnya, anda cari taman anjing, 00:04:10.240 --> 00:04:12.190 banyak enjin carian akan memberikan hasil 00:04:12.190 --> 00:04:13.840 untuk taman anjing berdekatan, 00:04:14.080 --> 00:04:16.260 walaupun anda tidak taip lokasi. 00:04:17.800 --> 00:04:20.530 Enjin carian moden memahami lebih 00:04:20.530 --> 00:04:22.060 daripada perkataan atas halaman, 00:04:22.300 --> 00:04:24.970 tapi sebenarnya ia mencari 00:04:24.970 --> 00:04:26.750 padanan terbaik untuk carian. 00:04:27.130 --> 00:04:29.980 Contohnya, anda mencari pembaling laju, 00:04:30.280 --> 00:04:32.300 ia tahu anda mencari atlet. 00:04:32.500 --> 00:04:34.450 Tapi jika anda mencari jag besar, 00:04:34.450 --> 00:04:36.730 ia memberikan pilihan untuk dapur. 00:04:38.420 --> 00:04:41.910 Untuk lebih memahami perkataan ini, kami gunakan pembelajaran mesin, 00:04:41.910 --> 00:04:43.985 sejenis kecerdasan buatan. 00:04:43.985 --> 00:04:46.050 Ia membolehkan algoritma carian untuk mencari 00:04:46.090 --> 00:04:48.400 bukan saja huruf individu atau perkataan pada halaman, 00:04:48.400 --> 00:04:51.280 tapi memahami maksud perkataan. 00:04:53.690 --> 00:04:55.850 Internet membesar secara eksponen, 00:04:56.210 --> 00:04:59.810 tapi jika pasukan yang reka enjin carian bekerja dengan betul, 00:05:00.080 --> 00:05:04.090 maklumat yang anda mahukan hanyalah beberapa ketikan kunci jauhnya.