Hai, nama saya John.
Saya mengetuai pasukan carian dan
pembelajaran mesin di Google.
Saya rasa ia sangat memberi inspirasi
bahawa manusia di seluruh dunia
beralih ke enjin carian untuk
bertanya soalan remeh
dan soalan yang sangat penting.
Jadi ia adalah tanggungjawab besar
untuk memberi mereka
jawapan terbaik yang kita boleh lakukan.
Hai, nama saya Akshaya dan
saya bekerja di pasukan carian Bing.
Terdapat banyak kali di mana
kita mula menerokai
kecerdasan buatan
dan pembelajaran mesin,
tetapi kita perlu menangani bagaimana
pengguna akan menggunakannya,
kerana pada akhirnya, kita mahu
memberi impak kepada masyarakat.
Mari kita tanya soalan yang mudah.
Berapa lama perjalanan ke Marikh?
Dari mana asal keputusan ini
dan mengapa ini disenaraikan
sebelum yang lain?
Baiklah, mari kita meneroka dan
lihat bagaimana enjin carian
mengubah permintaan anda ke hasil.
Perkara pertama yang anda perlu tahu
adalah apabila anda melakukan carian,
mesin pencari sebenarnya tidak
pergi ke Jaringan Sejagat
untuk menjalankan carian anda dalam
masa nyata.
Ini adalah kerana terdapat lebih
daripada satu bilion laman web
di internet dan beratus-ratus lagi
dicipta setiap minit.
Jadi jika mesin pencari
terpaksa meneliti
setiap laman web untuk mencari
hasil yang anda mahukan,
ia akan mengambil masa yang amat lama.
Jadi untuk membuat carian anda
lebih cepat,
enjin carian sentiasa mengimbas
laman web terlebih dahulu
untuk merakam maklumat yang mungkin
membantu carian anda kemudian.
Dengan cara ini, apabila anda mencari
mengenai perjalanan ke Marikh,
enjin carian sudah mempunyai
hasil yang diperlukan
untuk memberi anda jawapan dalam
masa nyata.
Inilah cara ia berfungsi.
Internet adalah laman web yang dihubungkan
antara satu sama lain dengan hiperpautan
Enjin carian sentiasa
menjalankan program
dipanggil Spider yang menyeberang
melalui laman-laman web ini
untuk mengumpul maklumat mengenai mereka.
Setiap kali ia menemui hiperpautan,
ia mengikutinya sehingga ia
telah melawat setiap halaman
ia boleh didapati di seluruh
Internet.
Untuk setiap halaman Spider lawat,
ia merekodkan sebarang maklumat yang
mungkin diperlukan untuk suatu carian
dengan menambahnya ke pangkalan data
khas yang dipanggil indeks carian.
Sekarang, mari kita kembali ke
carian tadi
dan lihat jika kita boleh mengetahui
bagaimana enjin carian
menghasilkan keputusannya.
Apabila anda bertanya berapa lamakah
masa perjalanan ke Marikh,
enjin carian lihat pada
setiap perkataan itu
dengan segera dalam indeks carian
untuk mendapatkan senarai
semua halaman di internet yang
mengandungi perkataan tersebut.
Tetapi hanya mencari istilah carian ini
akan mengembalikan berjuta-juta halaman,
jadi enjin carian perlu boleh menentukan
padanan terbaik untuk menunjukkan
kepada anda terlebih dahulu.
Di sinilah ia menjadi rumit
kerana enjin carian
mungkin perlu meneka apa yang
anda sedang mencari.
Setiap enjin carian
menggunakan algoritma sendiri
untuk menarafkan halaman berdasarkan
apa yang difikirkannya anda mahukan.
Algoritma kedudukan enjin carian
mungkin menyemak
jika istilah carian anda ditunjukkan
dalam tajuk halaman,
ia mungkin menyemak sama ada semua perkataan
muncul di sebelahan satu sama lain,
atau apa-apa bilangan pengiraan lain
yang membantu ia menentukan dengan
lebih baik
halaman yang anda mahu lihat dan
halaman yang anda tidak ingin lihat.
Google mencipta algoritma yang
paling terkenal
kerana memilih hasil yang paling relevan
untuk suatu carian dengan mengambil kira
berapa banyak laman web lain yang
dihubungkan ke halaman tertentu.
Ideanya ialah jika
banyak laman web berpendapat
bahawa laman web tersebut menarik,
maka ia mungkin suatu
yang anda cari.
Algoritma ini dipanggil kedudukan halaman,
bukan kerana ia menilai kedudukan
suatu laman web,
tetapi kerana ia dinamakan sempena
penciptanya, Larry Page,
yang merupakan salah seorang
pengasas Google.
Kerana laman web sering menguntung
apabila anda melawatnya,
spammer sentiasa
cuba mencari jalan
untuk menipu algoritma carian
supaya halaman mereka
dapat disenaraikan lebih tinggi
dalam hasil carian.
Enjin carian kerap
mengemaskini algoritma mereka
untuk mengelak laman web palsu atau yang tidak
boleh dipercayai mencapai kedudukan tinggi.
Akhirnya, ia adalah tanggungjawab
anda untuk berwaspada pada
halaman web yang tidak boleh dipercayai
dengan melihat alamat web mereka dan
memastikan ia sumber yang boleh dipercayai.
Program carian sentiasa berkembang
untuk meningkatkan algoritma supaya
mereka memberi hasil yang lebih baik,
keputusan yang lebih pantas daripada
pesaing mereka.
Enjin carian hari ini
juga menggunakan maklumat
yang belum anda berikan secara jelas
untuk membantu menentukan carian anda.
Contohnya, jika anda membuat satu
carian untuk taman anjing,
banyak enjin carian
akan memberikan hasil
semua taman anjing yang berdekatan,
walaupun anda tidak
memasukkan lokasi anda.
Enjin carian moden
juga memahami lebih lanjut
daripada sekadar perkataan pada halaman,
tetapi maksud sebenar mereka
supaya dapat mencari padanan
terbaik untuk anda.
Contohnya, jika anda mencari
pitcher terpantas,
ia akan tahu anda ingin
mencari seorang atlet.
Tetapi jika anda mencari pitcher besar,
ia akan mencari pilihan
untuk dapur anda.
Untuk memahami perkataan dengan lebih baik,
kami menggunakan pembelajaran mesin,
sejenis kecerdasan buatan.
Ia membolehkan algoritma carian
untuk mencari
bukan sekadar huruf individu
atau perkataan dalam halaman,
tetapi memahami asas maksud
perkataan tersebut.
Internet berkembang dengan cepat,
jika pasukan yang merancang enjin carian
melakukan tugas mereka dengan betul,
maklumat yang anda cari harus sentiasa
berada dalam beberapa klik kekunci sahaja.