-
Magandang araw, ako si John.
-
PInangungunahan ko ang mga team ng search at machine
learning sa Google.
-
Sa tingin ko kamangha-manghang nakakahikayat
-
na ang mga tao sa buong mundo
-
ay bumabaling sa mga search engine upang
magtanong ng mga walang kuwentang bagay
-
at mga hindi kapani-paniwalang mahalagang tanong.
-
Kaya ito'y malaking
responsibilidad na bigyan sila
-
ng mga pinakamagaling na sagot na magagawa natin.
-
Magandang araw, ako si Akshaya at
nagtatrabaho ako sa Bing search team.
-
May napakaraming pagkakataon kung saan
magsisimula kami sa pagtingin
-
sa artificial intelligence
at machine learning,
-
pero kailangan naming tingnan kung paano
gagamitin ng mga gumagamit ito,
-
dahil sa katapusan ng araw,
gusto nating gumawa ng epekto sa lipunan.
-
Magtanong tayo ng simpleng tanong.
-
Gaano katagal aabutin ang biyahe sa Mars?
-
Saan nanggaling ang mga resultang ito
-
at bakit nakalista ito
bago ng iba?
-
Okey, sisid tayo at
tingnan kung paano ginawa
-
ng search engine ang hiling mo bilang resulta.
-
Ang unang bagay na kailangan mong
malaman ay kapag ginawa mo ang paghahanap,
-
ang search engine ay hindi tunay na
tumutungo sa World Wide Web
-
upang paandarin ang paghahanap mo sa totoong oras.
-
At iyan ay dahil may
mahigit isang bilyong website
-
sa internet at daan-daan pa ay
ginagawa sa bawat minuto.
-
Kaya kailangang maghanap
ang search engine sa
-
bawat isang site upang
hanapin ang gusto mo,
-
aabutin lang ito magpakailanman.
-
Kaya upang gawing mas mabilis ang paghahanap,
-
ang mga search engine ay panay na
ini-scan ang web nang maaga
-
upang irekord ang impormasyon na maaaring
makatulong sa iyong paghahanap sa kinalaunan.
-
Sa paraang iyan, kapag naghanap ka
tungkol sa biyahe sa Mars,
-
ang search engine
ay mayroon na ng kung ano ang kailangan nito
-
upang bigyan ka ng sagot sa totoong oras.
-
Narito kung paano ito gumagana.
-
Ang internet ay isang web ng mga page na
konektado sa isa't isa sa pamamagitan ng mga hyperlink.
-
Ang mga search engine ay
panay na nagpapatakbo ng isang program
-
na tinatawag na Spider (Gagamba) na tumatawid
sa mga web page na ito
-
upang kolektahin ang impormasyon tungkol sa kanila.
-
Sa bawat pagkakataon na nakahahanap ito ng hyperlink,
-
sinusundan nito ito hanggang nabisita
nito ang bawat page
-
na mahahanap nito sa buong
internet.
-
Sa bawat page na binibisita ng spider,
-
inirerekord nito ang anumang impormasyon
na maaaring kailangan nito sa paghahanap
-
sa pamamagitan ng pagdaragdag dito sa isang espesyal
na database na tinatawag na search index.
-
Ngayon, balik tayo sa
paghahanap na nauna
-
at tingnan kung malalaman natin
kung paano ginawa
-
ng search engine ang mga resulta.
-
Kapag tinanong kung gaano katagal
aabutin ang biyahe sa Mars,
-
tinitingnan ng search engine
ang bawat isa sa mga katagang iyon
-
sa search index upang
kaagad na kumuha ng isang listahan
-
ng lahat ng mga page sa
internet na naglalaman ng mga katagang iyon.
-
Pero sa pagtingin lang sa mga search item na ito
-
ay maaaring umani ng milyon-milyong page
-
na kailangan ng search engine
upang malaman
-
ang mga magaling na resulta upang ipakita muna sa iyo.
-
Dito nagiging mahirap
dahil maaaring mangailangan
-
ang search engine na hulaan kung ano
ang hinahanap mo.
-
Bawat search engine ay
gumagamit ng sarili nitong algoritmo
-
upang i-rank ang mga page base sa
kung ano ang iniisip nito na gusto mo.
-
Ang algoritmo sa pag-rank
ng search engine ay magtse-check
-
kung ang search term mo ay lumalabas
sa page title,
-
maaari nitong i-check kung ang lahat ng
mga kataga ay lumalabas na magkakasunod sa isa't isa,
-
o anumang numero ng ibang mga kalkulasyon
-
na tumutulong dito na mas mahusay na malaman
-
kung aling mga page ang gugustuhin mong
makita at alin ang hindi.
-
Inimbento ng Google ang pinaka
sikat na algoritmo
-
sa pagpili ng mga pinaka naaayong resulta
ng paghahanap sa pamamagitan ng pagsasaalang-alang
-
kung ilang ibang Web page
ay naka-link sa ibinigay na page.
-
Ang ideya ay kung
maraming website ay nag-iisip
-
na ang isang web page ay interesante,
-
kung gayon malamang ito
ang hinahanap mo.
-
Ang algoritmong ito ay tinatawag na page rank,
-
hindi dahil inira-rank nito ang mga web page,
-
pero dahil ipinangalan ito
sa imbentor nito, si Larry Page,
-
na isa sa mga pundador ng Google.
-
Dahil ang isang website ay madalas gumagawa ng
pera kapag binibisita mo ito,
-
panay na sinusubukan
ng mga spammer na maghanap ng mga paraan
-
upang manipulahin ang algoritmo ng paghahanap
para ang kanilang mga page
-
ay nakalistang mas mataas sa mga resulta.
-
Regular na ina-update ng
mga search engine ang kanilang mga algoritmo
-
upang iwasan ang mga peke o hindi mapagkakatiwalaang
site na umabot sa tuktok.
-
Sa kahulihulihan, nasa sa iyo
na magmatyag
-
sa mga page na ito na hindi mapagkakatiwalaan
-
sa pamamagitan ng pagtingin sa web address at
paniniguro na maaasahang batis ito.
-
Palaging nagbabago ang mga search program
-
upang mapabuti ang mga algoritmo
na bumabalik na may mga mas mahusay na resulta,
-
mas mabilis na resulta kaysa kanilang kakumpetensiya.
-
Ang mga search engine sa ngayon ay
gumagamit pa rin ng impormasyon
-
na hindi mo hayagang ibinibigay
upang tulungan ka na pakitirin ang paghahanap mo.
-
Kaya, halimbawa,
kung naghanap ka ng mga parke ng aso,
-
maraming search engine
ay magbibigay sa iyo ng mga resulta
-
para sa lahat ng mga parke ng aso na malapit,
-
bagaman hindi mo
nai-type ang lokasyon mo.
-
Nauunawaan din ng mga modernong
search engine na higit
-
kaysa sa mga kataga lang sa isang page,
-
pero ano ang tunay na kahulugan nila
para malaman ang pinakamagaling
-
na tumutugma sa kung ano ang hinahanap mo.
-
Halimbawa, kung naghahanap ka
ng mabilis na pitcher,
-
malalaman nito na
naghahanap ka ng isang atleta.
-
Pero kung naghahanap ka ng malaking pitcher,
-
hahanapan ka nito ng mga opsiyon
para sa kusina mo.
-
Upang mas mahusay na maunawaan ang mga kataga,
gumagamit kami ng ilang bagay na tinatawag na machine learning,
-
isang uri ng artificial intelligence.
-
Ginagawa nito ang mga algoritmo
ng paghahanap na hanapin
-
hindi lang ang mga indibidwal na titik
o kataga sa page,
-
pero para maunawaan ang nakatagong
kahulugan ng mga kataga.
-
Lumalagong exponential ang internet,
-
pero kung ang mga team na nagdidisenyo
ng mga search engine ay ginagawa nang tama ang ating mga trabaho,
-
ang impormasyon na gusto mo ay dapat
palaging aabot ng ilang keystroke lang.