Magandang araw, ako si John.
PInangungunahan ko ang mga team ng search at machine
learning sa Google.
Sa tingin ko kamangha-manghang nakakahikayat
na ang mga tao sa buong mundo
ay bumabaling sa mga search engine upang
magtanong ng mga walang kuwentang bagay
at mga hindi kapani-paniwalang mahalagang tanong.
Kaya ito'y malaking
responsibilidad na bigyan sila
ng mga pinakamagaling na sagot na magagawa natin.
Magandang araw, ako si Akshaya at
nagtatrabaho ako sa Bing search team.
May napakaraming pagkakataon kung saan
magsisimula kami sa pagtingin
sa artificial intelligence
at machine learning,
pero kailangan naming tingnan kung paano
gagamitin ng mga gumagamit ito,
dahil sa katapusan ng araw,
gusto nating gumawa ng epekto sa lipunan.
Magtanong tayo ng simpleng tanong.
Gaano katagal aabutin ang biyahe sa Mars?
Saan nanggaling ang mga resultang ito
at bakit nakalista ito
bago ng iba?
Okey, sisid tayo at
tingnan kung paano ginawa
ng search engine ang hiling mo bilang resulta.
Ang unang bagay na kailangan mong
malaman ay kapag ginawa mo ang paghahanap,
ang search engine ay hindi tunay na
tumutungo sa World Wide Web
upang paandarin ang paghahanap mo sa totoong oras.
At iyan ay dahil may
mahigit isang bilyong website
sa internet at daan-daan pa ay
ginagawa sa bawat minuto.
Kaya kailangang maghanap
ang search engine sa
bawat isang site upang
hanapin ang gusto mo,
aabutin lang ito magpakailanman.
Kaya upang gawing mas mabilis ang paghahanap,
ang mga search engine ay panay na
ini-scan ang web nang maaga
upang irekord ang impormasyon na maaaring
makatulong sa iyong paghahanap sa kinalaunan.
Sa paraang iyan, kapag naghanap ka
tungkol sa biyahe sa Mars,
ang search engine
ay mayroon na ng kung ano ang kailangan nito
upang bigyan ka ng sagot sa totoong oras.
Narito kung paano ito gumagana.
Ang internet ay isang web ng mga page na
konektado sa isa't isa sa pamamagitan ng mga hyperlink.
Ang mga search engine ay
panay na nagpapatakbo ng isang program
na tinatawag na Spider (Gagamba) na tumatawid
sa mga web page na ito
upang kolektahin ang impormasyon tungkol sa kanila.
Sa bawat pagkakataon na nakahahanap ito ng hyperlink,
sinusundan nito ito hanggang nabisita
nito ang bawat page
na mahahanap nito sa buong
internet.
Sa bawat page na binibisita ng spider,
inirerekord nito ang anumang impormasyon
na maaaring kailangan nito sa paghahanap
sa pamamagitan ng pagdaragdag dito sa isang espesyal
na database na tinatawag na search index.
Ngayon, balik tayo sa
paghahanap na nauna
at tingnan kung malalaman natin
kung paano ginawa
ng search engine ang mga resulta.
Kapag tinanong kung gaano katagal
aabutin ang biyahe sa Mars,
tinitingnan ng search engine
ang bawat isa sa mga katagang iyon
sa search index upang
kaagad na kumuha ng isang listahan
ng lahat ng mga page sa
internet na naglalaman ng mga katagang iyon.
Pero sa pagtingin lang sa mga search item na ito
ay maaaring umani ng milyon-milyong page
na kailangan ng search engine
upang malaman
ang mga magaling na resulta upang ipakita muna sa iyo.
Dito nagiging mahirap
dahil maaaring mangailangan
ang search engine na hulaan kung ano
ang hinahanap mo.
Bawat search engine ay
gumagamit ng sarili nitong algoritmo
upang i-rank ang mga page base sa
kung ano ang iniisip nito na gusto mo.
Ang algoritmo sa pag-rank
ng search engine ay magtse-check
kung ang search term mo ay lumalabas
sa page title,
maaari nitong i-check kung ang lahat ng
mga kataga ay lumalabas na magkakasunod sa isa't isa,
o anumang numero ng ibang mga kalkulasyon
na tumutulong dito na mas mahusay na malaman
kung aling mga page ang gugustuhin mong
makita at alin ang hindi.
Inimbento ng Google ang pinaka
sikat na algoritmo
sa pagpili ng mga pinaka naaayong resulta
ng paghahanap sa pamamagitan ng pagsasaalang-alang
kung ilang ibang Web page
ay naka-link sa ibinigay na page.
Ang ideya ay kung
maraming website ay nag-iisip
na ang isang web page ay interesante,
kung gayon malamang ito
ang hinahanap mo.
Ang algoritmong ito ay tinatawag na page rank,
hindi dahil inira-rank nito ang mga web page,
pero dahil ipinangalan ito
sa imbentor nito, si Larry Page,
na isa sa mga pundador ng Google.
Dahil ang isang website ay madalas gumagawa ng
pera kapag binibisita mo ito,
panay na sinusubukan
ng mga spammer na maghanap ng mga paraan
upang manipulahin ang algoritmo ng paghahanap
para ang kanilang mga page
ay nakalistang mas mataas sa mga resulta.
Regular na ina-update ng
mga search engine ang kanilang mga algoritmo
upang iwasan ang mga peke o hindi mapagkakatiwalaang
site na umabot sa tuktok.
Sa kahulihulihan, nasa sa iyo
na magmatyag
sa mga page na ito na hindi mapagkakatiwalaan
sa pamamagitan ng pagtingin sa web address at
paniniguro na maaasahang batis ito.
Palaging nagbabago ang mga search program
upang mapabuti ang mga algoritmo
na bumabalik na may mga mas mahusay na resulta,
mas mabilis na resulta kaysa kanilang kakumpetensiya.
Ang mga search engine sa ngayon ay
gumagamit pa rin ng impormasyon
na hindi mo hayagang ibinibigay
upang tulungan ka na pakitirin ang paghahanap mo.
Kaya, halimbawa,
kung naghanap ka ng mga parke ng aso,
maraming search engine
ay magbibigay sa iyo ng mga resulta
para sa lahat ng mga parke ng aso na malapit,
bagaman hindi mo
nai-type ang lokasyon mo.
Nauunawaan din ng mga modernong
search engine na higit
kaysa sa mga kataga lang sa isang page,
pero ano ang tunay na kahulugan nila
para malaman ang pinakamagaling
na tumutugma sa kung ano ang hinahanap mo.
Halimbawa, kung naghahanap ka
ng mabilis na pitcher,
malalaman nito na
naghahanap ka ng isang atleta.
Pero kung naghahanap ka ng malaking pitcher,
hahanapan ka nito ng mga opsiyon
para sa kusina mo.
Upang mas mahusay na maunawaan ang mga kataga,
gumagamit kami ng ilang bagay na tinatawag na machine learning,
isang uri ng artificial intelligence.
Ginagawa nito ang mga algoritmo
ng paghahanap na hanapin
hindi lang ang mga indibidwal na titik
o kataga sa page,
pero para maunawaan ang nakatagong
kahulugan ng mga kataga.
Lumalagong exponential ang internet,
pero kung ang mga team na nagdidisenyo
ng mga search engine ay ginagawa nang tama ang ating mga trabaho,
ang impormasyon na gusto mo ay dapat
palaging aabot ng ilang keystroke lang.