Hai, saya John.
Saya mengetuai pasukan mencari
dan pembelajaran mesin di Google.
Ia amat berinspirasi
bahawa semua orang di dunia
menggunakan enjin carian
utnuk tanya soalan remeh
dan soalan yang amat penting.
Ia tanggunajwab besar untuk berikan
jawapan terbaik yang boleh.
Hai, saya Akshaya dan saya
bekerja untuk pasukan carian Bing.
Banyak kali kami mencari
dalam kecerdasan buatan
dan pembelajaran mesin
tapi kami perlu menyelesaikan
cara pengguna menggunakannya,
kerana akhirnya, kami mahu
memberi impak kepada masyarakat.
Mari kami tanya soalan mudah.
Berapa lama perjalanan ke Mars?
Dari mana keputusan ini datang
dan kenapa ia disenaraikan
sebelum pencarian yang lain?
Okey, mari kami ketahui cara
enjin carian
menukar permintaan kepada hasil.
Perkara pertama semasa mencari,
enjin carian ini tidak keluar ke
World Wide Web untuk
mencari dalam masa sebenar.
Ia kerana ada berbilion laman web
di internet dan ratusan lagi
dicipta setiap minit.
Jika enjiin carian perlu meneliti
setiap laman untuk mencari sasaran,
ia akan mengambil selamanya.
Supaya carian dipercepatkan,
enjin carian selalu mengimbas
web secara terdahulu
untuk merekod maklumat yang
mungkin membantu carian kemudian.
Jadi, apabila anda mencari
perjalanan ke Mars,
enjin carian sudah ada hasil
untuk memberi jawapan masa nyata.
Ini cara ia berfungsi.
Internet adalah web halaman
yang disambungkan oleh pautan hiper.
Enjin carian sentiasa menjalankan program
Spider yang merentasi halaman web
untuk mengumpul maklumat.
Setiap kali pautan hiper dijumpai,
ia mengikutinya sehingga ia
melayari setiap halaman
di kseluruhan internet.
Setiap halaman yang dilayari Spider,
ia merekod maklumat untuk carian
dengan menambahkan pangkalan data
khas iaitu indeks carian.
Kami kembali ke carian awal
dan tentukan cara enjin carian
mengeluarkan hasil.
Apabila anda tanya masa
perjalanan ke Mars,
enjin carian mencari setiap perkataan
dalam indeks carian untuk mendapat senarai
semua halaman di internet
yang mengandungi perkataan itu.
Tapi mencari terma carian ini
mungkin memberikan jutaan halaman,
jadi enjin carian perlu menentukan
padanan terbaik untuk dipaparkan dulu.
Ini sukar kerana enjin carian
mungkin perlu teka apa yang dicari.
Setiap enjin carian guna algoritma sendiri
untuk susun halaman mengikut
apa yang ia fikir anda mahukan.
Algoritma susunan enjin carian
mungkin memeriksa
sekiranya terma carian anda
dipaparkan pada tajuk halaman,
ia mungkin memeriksa jika
semua perkataan muncul bersebalahan,
atau kiraan lain
yang membantu menentukan
halaman yang anda mahu dan tidak mahu.
Google mencipta algoritma paling terkenal
untuk memilih keputusan paling relevan
untuk carian dengan mengambil kira
berapa banyak halaman web
disambungkan kepada halaman.
Jika banyak laman web fikir
satu halaman web menarik,
mungkin itulah carian anda.
Algoritma ini adalah susunan halaman,
bukan kerana ia susun halaman web,
tapi kerana ia dinamakan sempena
penciptanya, Larry Page,
iaitu pengasas bersama Google.
Kerana laman web biasa
menjana duit apabila dilayari,
tukang spam sentiasa mencari cara
untuk mengacau algoritma carian
supaya halaman mereka
disenaraikan lebih tinggi.
Enjin carian kerap mengemaskini algoritma
untuk mengelakkan laman palsu atau
tidak boleh dipercayai naik ke atas.
Akhirnya, ia terpulang kepada anda
untuk memastikan anda perhatikan
halaman yang tidak boleh dipercayai
dengan melihat alamat mereka
dan memastikan ia sumber boleh percaya.
Atur cara carian selalu berevolusi
untuk mempertingkatkan algoritma
untuk keputusan yang lebih baik,
dan lebih cepat berbanding saingan.
Enjin carian hari ini
juga menggunakan maklumat
yang anda belum berikan
untuk mengecilkan carian.
Contohnya, anda cari taman anjing,
banyak enjin carian
akan memberikan hasil
untuk taman anjing berdekatan,
walaupun anda tidak taip lokasi.
Enjin carian moden memahami lebih
daripada perkataan atas halaman,
tapi sebenarnya ia mencari
padanan terbaik untuk carian.
Contohnya, anda mencari pembaling laju,
ia tahu anda mencari atlet.
Tapi jika anda mencari jag besar,
ia memberikan pilihan untuk dapur.
Untuk lebih memahami perkataan ini,
kami gunakan pembelajaran mesin,
sejenis kecerdasan buatan.
Ia membolehkan algoritma carian
untuk mencari
bukan saja huruf individu atau
perkataan pada halaman,
tapi memahami maksud perkataan.
Internet membesar secara eksponen,
tapi jika pasukan yang reka
enjin carian bekerja dengan betul,
maklumat yang anda mahukan
hanyalah beberapa ketikan kunci jauhnya.