1 00:00:06,070 --> 00:00:07,120 Hai, nama saya John. 2 00:00:07,510 --> 00:00:10,140 Saya mengetuai pasukan carian dan pembelajaran mesin di Google. 3 00:00:12,130 --> 00:00:14,230 Saya rasa ia sangat memberi inspirasi 4 00:00:14,230 --> 00:00:16,214 bahawa manusia di seluruh dunia 5 00:00:16,215 --> 00:00:19,160 beralih ke enjin carian untuk bertanya soalan remeh 6 00:00:19,160 --> 00:00:20,930 dan soalan yang sangat penting. 7 00:00:20,930 --> 00:00:23,450 Jadi ia adalah tanggungjawab besar untuk memberi mereka 8 00:00:23,450 --> 00:00:24,864 jawapan terbaik yang kita boleh lakukan. 9 00:00:26,710 --> 00:00:30,610 Hai, nama saya Akshaya dan saya bekerja di pasukan carian Bing. 10 00:00:30,910 --> 00:00:33,190 Terdapat banyak kali di mana kita mula menerokai 11 00:00:33,190 --> 00:00:35,800 kecerdasan buatan dan pembelajaran mesin, 12 00:00:35,830 --> 00:00:39,010 tetapi kita perlu menangani bagaimana pengguna akan menggunakannya, 13 00:00:39,140 --> 00:00:42,390 kerana pada akhirnya, kita mahu memberi impak kepada masyarakat. 14 00:00:43,780 --> 00:00:45,400 Mari kita tanya soalan yang mudah. 15 00:00:45,820 --> 00:00:48,070 Berapa lama perjalanan ke Marikh? 16 00:00:49,330 --> 00:00:50,950 Dari mana asal keputusan ini 17 00:00:51,370 --> 00:00:54,100 dan mengapa ini disenaraikan sebelum yang lain? 18 00:00:55,700 --> 00:00:58,150 Baiklah, mari kita meneroka dan lihat bagaimana enjin carian 19 00:00:58,150 --> 00:00:59,860 mengubah permintaan anda ke hasil. 20 00:01:00,690 --> 00:01:03,360 Perkara pertama yang anda perlu tahu adalah apabila anda melakukan carian, 21 00:01:03,430 --> 00:01:06,480 mesin pencari sebenarnya tidak pergi ke Jaringan Sejagat 22 00:01:06,480 --> 00:01:08,010 untuk menjalankan carian anda dalam masa nyata. 23 00:01:08,140 --> 00:01:10,610 Ini adalah kerana terdapat lebih daripada satu bilion laman web 24 00:01:10,610 --> 00:01:14,140 di internet dan beratus-ratus lagi dicipta setiap minit. 25 00:01:14,140 --> 00:01:16,210 Jadi jika mesin pencari terpaksa meneliti 26 00:01:16,240 --> 00:01:18,690 setiap laman web untuk mencari hasil yang anda mahukan, 27 00:01:18,690 --> 00:01:20,120 ia akan mengambil masa yang amat lama. 28 00:01:20,500 --> 00:01:21,940 Jadi untuk membuat carian anda lebih cepat, 29 00:01:21,970 --> 00:01:24,940 enjin carian sentiasa mengimbas laman web terlebih dahulu 30 00:01:25,420 --> 00:01:28,560 untuk merakam maklumat yang mungkin membantu carian anda kemudian. 31 00:01:28,930 --> 00:01:31,270 Dengan cara ini, apabila anda mencari mengenai perjalanan ke Marikh, 32 00:01:31,630 --> 00:01:33,700 enjin carian sudah mempunyai hasil yang diperlukan 33 00:01:33,700 --> 00:01:35,728 untuk memberi anda jawapan dalam masa nyata. 34 00:01:36,250 --> 00:01:37,540 Inilah cara ia berfungsi. 35 00:01:37,900 --> 00:01:42,010 Internet adalah laman web yang dihubungkan antara satu sama lain dengan hiperpautan 36 00:01:42,400 --> 00:01:44,680 Enjin carian sentiasa menjalankan program 37 00:01:44,680 --> 00:01:47,380 dipanggil Spider yang menyeberang melalui laman-laman web ini 38 00:01:47,380 --> 00:01:49,040 untuk mengumpul maklumat mengenai mereka. 39 00:01:49,780 --> 00:01:51,550 Setiap kali ia menemui hiperpautan, 40 00:01:52,090 --> 00:01:55,000 ia mengikutinya sehingga ia telah melawat setiap halaman 41 00:01:55,030 --> 00:01:57,240 ia boleh didapati di seluruh Internet. 42 00:01:57,335 --> 00:01:59,170 Untuk setiap halaman Spider lawat, 43 00:01:59,200 --> 00:02:02,320 ia merekodkan sebarang maklumat yang mungkin diperlukan untuk suatu carian 44 00:02:02,500 --> 00:02:05,650 dengan menambahnya ke pangkalan data khas yang dipanggil indeks carian. 45 00:02:07,166 --> 00:02:09,530 Sekarang, mari kita kembali ke carian tadi 46 00:02:09,590 --> 00:02:11,990 dan lihat jika kita boleh mengetahui bagaimana enjin carian 47 00:02:11,990 --> 00:02:13,333 menghasilkan keputusannya. 48 00:02:13,640 --> 00:02:16,460 Apabila anda bertanya berapa lamakah masa perjalanan ke Marikh, 49 00:02:16,640 --> 00:02:18,860 enjin carian lihat pada setiap perkataan itu 50 00:02:18,920 --> 00:02:21,410 dengan segera dalam indeks carian untuk mendapatkan senarai 51 00:02:21,410 --> 00:02:24,500 semua halaman di internet yang mengandungi perkataan tersebut. 52 00:02:24,890 --> 00:02:26,870 Tetapi hanya mencari istilah carian ini 53 00:02:26,870 --> 00:02:28,760 akan mengembalikan berjuta-juta halaman, 54 00:02:28,760 --> 00:02:31,110 jadi enjin carian perlu boleh menentukan 55 00:02:31,110 --> 00:02:33,120 padanan terbaik untuk menunjukkan kepada anda terlebih dahulu. 56 00:02:33,340 --> 00:02:36,010 Di sinilah ia menjadi rumit kerana enjin carian 57 00:02:36,010 --> 00:02:38,040 mungkin perlu meneka apa yang anda sedang mencari. 58 00:02:38,930 --> 00:02:41,360 Setiap enjin carian menggunakan algoritma sendiri 59 00:02:41,360 --> 00:02:44,230 untuk menarafkan halaman berdasarkan apa yang difikirkannya anda mahukan. 60 00:02:44,930 --> 00:02:47,660 Algoritma kedudukan enjin carian mungkin menyemak 61 00:02:47,990 --> 00:02:50,360 jika istilah carian anda ditunjukkan dalam tajuk halaman, 62 00:02:50,900 --> 00:02:53,820 ia mungkin menyemak sama ada semua perkataan muncul di sebelahan satu sama lain, 63 00:02:54,520 --> 00:02:57,020 atau apa-apa bilangan pengiraan lain 64 00:02:57,020 --> 00:02:58,610 yang membantu ia menentukan dengan lebih baik 65 00:02:58,670 --> 00:03:01,420 halaman yang anda mahu lihat dan halaman yang anda tidak ingin lihat. 66 00:03:02,960 --> 00:03:04,960 Google mencipta algoritma yang paling terkenal 67 00:03:04,960 --> 00:03:08,530 kerana memilih hasil yang paling relevan untuk suatu carian dengan mengambil kira 68 00:03:08,560 --> 00:03:11,230 berapa banyak laman web lain yang dihubungkan ke halaman tertentu. 69 00:03:11,830 --> 00:03:14,140 Ideanya ialah jika banyak laman web berpendapat 70 00:03:14,140 --> 00:03:15,660 bahawa laman web tersebut menarik, 71 00:03:15,660 --> 00:03:17,940 maka ia mungkin suatu yang anda cari. 72 00:03:18,190 --> 00:03:20,020 Algoritma ini dipanggil kedudukan halaman, 73 00:03:20,590 --> 00:03:22,330 bukan kerana ia menilai kedudukan suatu laman web, 74 00:03:22,570 --> 00:03:25,210 tetapi kerana ia dinamakan sempena penciptanya, Larry Page, 75 00:03:25,480 --> 00:03:27,333 yang merupakan salah seorang pengasas Google. 76 00:03:27,940 --> 00:03:30,520 Kerana laman web sering menguntung apabila anda melawatnya, 77 00:03:30,820 --> 00:03:32,950 spammer sentiasa cuba mencari jalan 78 00:03:32,950 --> 00:03:35,741 untuk menipu algoritma carian supaya halaman mereka 79 00:03:35,742 --> 00:03:37,931 dapat disenaraikan lebih tinggi dalam hasil carian. 80 00:03:38,260 --> 00:03:40,750 Enjin carian kerap mengemaskini algoritma mereka 81 00:03:40,750 --> 00:03:44,296 untuk mengelak laman web palsu atau yang tidak boleh dipercayai mencapai kedudukan tinggi. 82 00:03:44,680 --> 00:03:47,350 Akhirnya, ia adalah tanggungjawab anda untuk berwaspada pada 83 00:03:47,500 --> 00:03:49,450 halaman web yang tidak boleh dipercayai 84 00:03:49,690 --> 00:03:52,990 dengan melihat alamat web mereka dan memastikan ia sumber yang boleh dipercayai. 85 00:03:53,680 --> 00:03:55,390 Program carian sentiasa berkembang 86 00:03:55,420 --> 00:03:58,420 untuk meningkatkan algoritma supaya mereka memberi hasil yang lebih baik, 87 00:03:58,540 --> 00:04:00,460 keputusan yang lebih pantas daripada pesaing mereka. 88 00:04:01,000 --> 00:04:03,100 Enjin carian hari ini juga menggunakan maklumat 89 00:04:03,100 --> 00:04:06,820 yang belum anda berikan secara jelas untuk membantu menentukan carian anda. 90 00:04:07,150 --> 00:04:10,120 Contohnya, jika anda membuat satu carian untuk taman anjing, 91 00:04:10,240 --> 00:04:12,190 banyak enjin carian akan memberikan hasil 92 00:04:12,190 --> 00:04:13,840 semua taman anjing yang berdekatan, 93 00:04:14,080 --> 00:04:16,260 walaupun anda tidak memasukkan lokasi anda. 94 00:04:17,800 --> 00:04:20,530 Enjin carian moden juga memahami lebih lanjut 95 00:04:20,530 --> 00:04:22,060 daripada sekadar perkataan pada halaman, 96 00:04:22,300 --> 00:04:24,970 tetapi maksud sebenar mereka supaya dapat mencari padanan 97 00:04:24,970 --> 00:04:26,750 terbaik untuk anda. 98 00:04:27,130 --> 00:04:29,980 Contohnya, jika anda mencari pitcher terpantas, 99 00:04:30,280 --> 00:04:32,300 ia akan tahu anda ingin mencari seorang atlet. 100 00:04:32,500 --> 00:04:34,450 Tetapi jika anda mencari pitcher besar, 101 00:04:34,450 --> 00:04:36,730 ia akan mencari pilihan untuk dapur anda. 102 00:04:38,420 --> 00:04:41,910 Untuk memahami perkataan dengan lebih baik, kami menggunakan pembelajaran mesin, 103 00:04:41,910 --> 00:04:43,985 sejenis kecerdasan buatan. 104 00:04:43,985 --> 00:04:46,050 Ia membolehkan algoritma carian untuk mencari 105 00:04:46,090 --> 00:04:48,400 bukan sekadar huruf individu atau perkataan dalam halaman, 106 00:04:48,400 --> 00:04:51,280 tetapi memahami asas maksud perkataan tersebut. 107 00:04:53,690 --> 00:04:55,850 Internet berkembang dengan cepat, 108 00:04:56,210 --> 00:04:59,810 jika pasukan yang merancang enjin carian melakukan tugas mereka dengan betul, 109 00:05:00,080 --> 00:05:04,090 maklumat yang anda cari harus sentiasa berada dalam beberapa klik kekunci sahaja.