Magandang araw, ako si John. PInangungunahan ko ang mga team ng search at machine learning sa Google. Sa tingin ko kamangha-manghang nakakahikayat na ang mga tao sa buong mundo ay bumabaling sa mga search engine upang magtanong ng mga walang kuwentang bagay at mga hindi kapani-paniwalang mahalagang tanong. Kaya ito'y malaking responsibilidad na bigyan sila ng mga pinakamagaling na sagot na magagawa natin. Magandang araw, ako si Akshaya at nagtatrabaho ako sa Bing search team. May napakaraming pagkakataon kung saan magsisimula kami sa pagtingin sa artificial intelligence at machine learning, pero kailangan naming tingnan kung paano gagamitin ng mga gumagamit ito, dahil sa katapusan ng araw, gusto nating gumawa ng epekto sa lipunan. Magtanong tayo ng simpleng tanong. Gaano katagal aabutin ang biyahe sa Mars? Saan nanggaling ang mga resultang ito at bakit nakalista ito bago ng iba? Okey, sisid tayo at tingnan kung paano ginawa ng search engine ang hiling mo bilang resulta. Ang unang bagay na kailangan mong malaman ay kapag ginawa mo ang paghahanap, ang search engine ay hindi tunay na tumutungo sa World Wide Web upang paandarin ang paghahanap mo sa totoong oras. At iyan ay dahil may mahigit isang bilyong website sa internet at daan-daan pa ay ginagawa sa bawat minuto. Kaya kailangang maghanap ang search engine sa bawat isang site upang hanapin ang gusto mo, aabutin lang ito magpakailanman. Kaya upang gawing mas mabilis ang paghahanap, ang mga search engine ay panay na ini-scan ang web nang maaga upang irekord ang impormasyon na maaaring makatulong sa iyong paghahanap sa kinalaunan. Sa paraang iyan, kapag naghanap ka tungkol sa biyahe sa Mars, ang search engine ay mayroon na ng kung ano ang kailangan nito upang bigyan ka ng sagot sa totoong oras. Narito kung paano ito gumagana. Ang internet ay isang web ng mga page na konektado sa isa't isa sa pamamagitan ng mga hyperlink. Ang mga search engine ay panay na nagpapatakbo ng isang program na tinatawag na Spider (Gagamba) na tumatawid sa mga web page na ito upang kolektahin ang impormasyon tungkol sa kanila. Sa bawat pagkakataon na nakahahanap ito ng hyperlink, sinusundan nito ito hanggang nabisita nito ang bawat page na mahahanap nito sa buong internet. Sa bawat page na binibisita ng spider, inirerekord nito ang anumang impormasyon na maaaring kailangan nito sa paghahanap sa pamamagitan ng pagdaragdag dito sa isang espesyal na database na tinatawag na search index. Ngayon, balik tayo sa paghahanap na nauna at tingnan kung malalaman natin kung paano ginawa ng search engine ang mga resulta. Kapag tinanong kung gaano katagal aabutin ang biyahe sa Mars, tinitingnan ng search engine ang bawat isa sa mga katagang iyon sa search index upang kaagad na kumuha ng isang listahan ng lahat ng mga page sa internet na naglalaman ng mga katagang iyon. Pero sa pagtingin lang sa mga search item na ito ay maaaring umani ng milyon-milyong page na kailangan ng search engine upang malaman ang mga magaling na resulta upang ipakita muna sa iyo. Dito nagiging mahirap dahil maaaring mangailangan ang search engine na hulaan kung ano ang hinahanap mo. Bawat search engine ay gumagamit ng sarili nitong algoritmo upang i-rank ang mga page base sa kung ano ang iniisip nito na gusto mo. Ang algoritmo sa pag-rank ng search engine ay magtse-check kung ang search term mo ay lumalabas sa page title, maaari nitong i-check kung ang lahat ng mga kataga ay lumalabas na magkakasunod sa isa't isa, o anumang numero ng ibang mga kalkulasyon na tumutulong dito na mas mahusay na malaman kung aling mga page ang gugustuhin mong makita at alin ang hindi. Inimbento ng Google ang pinaka sikat na algoritmo sa pagpili ng mga pinaka naaayong resulta ng paghahanap sa pamamagitan ng pagsasaalang-alang kung ilang ibang Web page ay naka-link sa ibinigay na page. Ang ideya ay kung maraming website ay nag-iisip na ang isang web page ay interesante, kung gayon malamang ito ang hinahanap mo. Ang algoritmong ito ay tinatawag na page rank, hindi dahil inira-rank nito ang mga web page, pero dahil ipinangalan ito sa imbentor nito, si Larry Page, na isa sa mga pundador ng Google. Dahil ang isang website ay madalas gumagawa ng pera kapag binibisita mo ito, panay na sinusubukan ng mga spammer na maghanap ng mga paraan upang manipulahin ang algoritmo ng paghahanap para ang kanilang mga page ay nakalistang mas mataas sa mga resulta. Regular na ina-update ng mga search engine ang kanilang mga algoritmo upang iwasan ang mga peke o hindi mapagkakatiwalaang site na umabot sa tuktok. Sa kahulihulihan, nasa sa iyo na magmatyag sa mga page na ito na hindi mapagkakatiwalaan sa pamamagitan ng pagtingin sa web address at paniniguro na maaasahang batis ito. Palaging nagbabago ang mga search program upang mapabuti ang mga algoritmo na bumabalik na may mga mas mahusay na resulta, mas mabilis na resulta kaysa kanilang kakumpetensiya. Ang mga search engine sa ngayon ay gumagamit pa rin ng impormasyon na hindi mo hayagang ibinibigay upang tulungan ka na pakitirin ang paghahanap mo. Kaya, halimbawa, kung naghanap ka ng mga parke ng aso, maraming search engine ay magbibigay sa iyo ng mga resulta para sa lahat ng mga parke ng aso na malapit, bagaman hindi mo nai-type ang lokasyon mo. Nauunawaan din ng mga modernong search engine na higit kaysa sa mga kataga lang sa isang page, pero ano ang tunay na kahulugan nila para malaman ang pinakamagaling na tumutugma sa kung ano ang hinahanap mo. Halimbawa, kung naghahanap ka ng mabilis na pitcher, malalaman nito na naghahanap ka ng isang atleta. Pero kung naghahanap ka ng malaking pitcher, hahanapan ka nito ng mga opsiyon para sa kusina mo. Upang mas mahusay na maunawaan ang mga kataga, gumagamit kami ng ilang bagay na tinatawag na machine learning, isang uri ng artificial intelligence. Ginagawa nito ang mga algoritmo ng paghahanap na hanapin hindi lang ang mga indibidwal na titik o kataga sa page, pero para maunawaan ang nakatagong kahulugan ng mga kataga. Lumalagong exponential ang internet, pero kung ang mga team na nagdidisenyo ng mga search engine ay ginagawa nang tama ang ating mga trabaho, ang impormasyon na gusto mo ay dapat palaging aabot ng ilang keystroke lang.