-
Hai, nama saya John.
-
Saya mengetuai pasukan carian dan
pembelajaran mesin di Google.
-
Saya rasa ia sangat memberi inspirasi
-
bahawa manusia di seluruh dunia
-
beralih ke enjin carian untuk
bertanya soalan remeh
-
dan soalan yang sangat penting.
-
Jadi ia adalah tanggungjawab besar
untuk memberi mereka
-
jawapan terbaik yang kita boleh lakukan.
-
Hai, nama saya Akshaya dan
saya bekerja di pasukan carian Bing.
-
Terdapat banyak kali di mana
kita mula menerokai
-
kecerdasan buatan
dan pembelajaran mesin,
-
tetapi kita perlu menangani bagaimana
pengguna akan menggunakannya,
-
kerana pada akhirnya, kita mahu
memberi impak kepada masyarakat.
-
Mari kita tanya soalan yang mudah.
-
Berapa lama perjalanan ke Marikh?
-
Dari mana asal keputusan ini
-
dan mengapa ini disenaraikan
sebelum yang lain?
-
Baiklah, mari kita meneroka dan
lihat bagaimana enjin carian
-
mengubah permintaan anda ke hasil.
-
Perkara pertama yang anda perlu tahu
adalah apabila anda melakukan carian,
-
mesin pencari sebenarnya tidak
pergi ke Jaringan Sejagat
-
untuk menjalankan carian anda dalam
masa nyata.
-
Ini adalah kerana terdapat lebih
daripada satu bilion laman web
-
di internet dan beratus-ratus lagi
dicipta setiap minit.
-
Jadi jika mesin pencari
terpaksa meneliti
-
setiap laman web untuk mencari
hasil yang anda mahukan,
-
ia akan mengambil masa yang amat lama.
-
Jadi untuk membuat carian anda
lebih cepat,
-
enjin carian sentiasa mengimbas
laman web terlebih dahulu
-
untuk merakam maklumat yang mungkin
membantu carian anda kemudian.
-
Dengan cara ini, apabila anda mencari
mengenai perjalanan ke Marikh,
-
enjin carian sudah mempunyai
hasil yang diperlukan
-
untuk memberi anda jawapan dalam
masa nyata.
-
Inilah cara ia berfungsi.
-
Internet adalah laman web yang dihubungkan
antara satu sama lain dengan hiperpautan
-
Enjin carian sentiasa
menjalankan program
-
dipanggil Spider yang menyeberang
melalui laman-laman web ini
-
untuk mengumpul maklumat mengenai mereka.
-
Setiap kali ia menemui hiperpautan,
-
ia mengikutinya sehingga ia
telah melawat setiap halaman
-
ia boleh didapati di seluruh
Internet.
-
Untuk setiap halaman Spider lawat,
-
ia merekodkan sebarang maklumat yang
mungkin diperlukan untuk suatu carian
-
dengan menambahnya ke pangkalan data
khas yang dipanggil indeks carian.
-
Sekarang, mari kita kembali ke
carian tadi
-
dan lihat jika kita boleh mengetahui
bagaimana enjin carian
-
menghasilkan keputusannya.
-
Apabila anda bertanya berapa lamakah
masa perjalanan ke Marikh,
-
enjin carian lihat pada
setiap perkataan itu
-
dengan segera dalam indeks carian
untuk mendapatkan senarai
-
semua halaman di internet yang
mengandungi perkataan tersebut.
-
Tetapi hanya mencari istilah carian ini
-
akan mengembalikan berjuta-juta halaman,
-
jadi enjin carian perlu boleh menentukan
-
padanan terbaik untuk menunjukkan
kepada anda terlebih dahulu.
-
Di sinilah ia menjadi rumit
kerana enjin carian
-
mungkin perlu meneka apa yang
anda sedang mencari.
-
Setiap enjin carian
menggunakan algoritma sendiri
-
untuk menarafkan halaman berdasarkan
apa yang difikirkannya anda mahukan.
-
Algoritma kedudukan enjin carian
mungkin menyemak
-
jika istilah carian anda ditunjukkan
dalam tajuk halaman,
-
ia mungkin menyemak sama ada semua perkataan
muncul di sebelahan satu sama lain,
-
atau apa-apa bilangan pengiraan lain
-
yang membantu ia menentukan dengan
lebih baik
-
halaman yang anda mahu lihat dan
halaman yang anda tidak ingin lihat.
-
Google mencipta algoritma yang
paling terkenal
-
kerana memilih hasil yang paling relevan
untuk suatu carian dengan mengambil kira
-
berapa banyak laman web lain yang
dihubungkan ke halaman tertentu.
-
Ideanya ialah jika
banyak laman web berpendapat
-
bahawa laman web tersebut menarik,
-
maka ia mungkin suatu
yang anda cari.
-
Algoritma ini dipanggil kedudukan halaman,
-
bukan kerana ia menilai kedudukan
suatu laman web,
-
tetapi kerana ia dinamakan sempena
penciptanya, Larry Page,
-
yang merupakan salah seorang
pengasas Google.
-
Kerana laman web sering menguntung
apabila anda melawatnya,
-
spammer sentiasa
cuba mencari jalan
-
untuk menipu algoritma carian
supaya halaman mereka
-
dapat disenaraikan lebih tinggi
dalam hasil carian.
-
Enjin carian kerap
mengemaskini algoritma mereka
-
untuk mengelak laman web palsu atau yang tidak
boleh dipercayai mencapai kedudukan tinggi.
-
Akhirnya, ia adalah tanggungjawab
anda untuk berwaspada pada
-
halaman web yang tidak boleh dipercayai
-
dengan melihat alamat web mereka dan
memastikan ia sumber yang boleh dipercayai.
-
Program carian sentiasa berkembang
-
untuk meningkatkan algoritma supaya
mereka memberi hasil yang lebih baik,
-
keputusan yang lebih pantas daripada
pesaing mereka.
-
Enjin carian hari ini
juga menggunakan maklumat
-
yang belum anda berikan secara jelas
untuk membantu menentukan carian anda.
-
Contohnya, jika anda membuat satu
carian untuk taman anjing,
-
banyak enjin carian
akan memberikan hasil
-
semua taman anjing yang berdekatan,
-
walaupun anda tidak
memasukkan lokasi anda.
-
Enjin carian moden
juga memahami lebih lanjut
-
daripada sekadar perkataan pada halaman,
-
tetapi maksud sebenar mereka
supaya dapat mencari padanan
-
terbaik untuk anda.
-
Contohnya, jika anda mencari
pitcher terpantas,
-
ia akan tahu anda ingin
mencari seorang atlet.
-
Tetapi jika anda mencari pitcher besar,
-
ia akan mencari pilihan
untuk dapur anda.
-
Untuk memahami perkataan dengan lebih baik,
kami menggunakan pembelajaran mesin,
-
sejenis kecerdasan buatan.
-
Ia membolehkan algoritma carian
untuk mencari
-
bukan sekadar huruf individu
atau perkataan dalam halaman,
-
tetapi memahami asas maksud
perkataan tersebut.
-
Internet berkembang dengan cepat,
-
jika pasukan yang merancang enjin carian
melakukan tugas mereka dengan betul,
-
maklumat yang anda cari harus sentiasa
berada dalam beberapa klik kekunci sahaja.