0:00:06.070,0:00:07.120 Magandang araw, ako si John. 0:00:07.510,0:00:10.140 PInangungunahan ko ang mga team ng search at machine[br]learning sa Google. 0:00:12.130,0:00:14.230 Sa tingin ko kamangha-manghang nakakahikayat 0:00:14.230,0:00:16.214 na ang mga tao sa buong mundo 0:00:16.215,0:00:19.160 ay bumabaling sa mga search engine upang[br]magtanong ng mga walang kuwentang bagay 0:00:19.160,0:00:20.930 at mga hindi kapani-paniwalang mahalagang tanong. 0:00:20.930,0:00:23.450 Kaya ito'y malaking[br]responsibilidad na bigyan sila 0:00:23.450,0:00:24.864 ng mga pinakamagaling na sagot na magagawa natin. 0:00:26.710,0:00:30.610 Magandang araw, ako si Akshaya at[br]nagtatrabaho ako sa Bing search team. 0:00:30.910,0:00:33.190 May napakaraming pagkakataon kung saan[br]magsisimula kami sa pagtingin 0:00:33.190,0:00:35.800 sa artificial intelligence[br]at machine learning, 0:00:35.830,0:00:39.010 pero kailangan naming tingnan kung paano[br]gagamitin ng mga gumagamit ito, 0:00:39.140,0:00:42.390 dahil sa katapusan ng araw,[br]gusto nating gumawa ng epekto sa lipunan. 0:00:43.780,0:00:45.400 Magtanong tayo ng simpleng tanong. 0:00:45.820,0:00:48.070 Gaano katagal aabutin ang biyahe sa Mars? 0:00:49.330,0:00:50.950 Saan nanggaling ang mga resultang ito 0:00:51.370,0:00:54.100 at bakit nakalista ito[br]bago ng iba? 0:00:55.700,0:00:58.150 Okey, sisid tayo at [br]tingnan kung paano ginawa 0:00:58.150,0:00:59.860 ng search engine ang hiling mo bilang resulta. 0:01:00.690,0:01:03.360 Ang unang bagay na kailangan mong[br]malaman ay kapag ginawa mo ang paghahanap, 0:01:03.430,0:01:06.480 ang search engine ay hindi tunay na [br]tumutungo sa World Wide Web 0:01:06.480,0:01:08.010 upang paandarin ang paghahanap mo sa totoong oras. 0:01:08.140,0:01:10.610 At iyan ay dahil may[br]mahigit isang bilyong website 0:01:10.610,0:01:14.140 sa internet at daan-daan pa ay [br]ginagawa sa bawat minuto. 0:01:14.140,0:01:16.210 Kaya kailangang maghanap[br]ang search engine sa 0:01:16.240,0:01:18.690 bawat isang site upang[br]hanapin ang gusto mo, 0:01:18.690,0:01:20.120 aabutin lang ito magpakailanman. 0:01:20.500,0:01:21.940 Kaya upang gawing mas mabilis ang paghahanap, 0:01:21.970,0:01:24.940 ang mga search engine ay panay na[br]ini-scan ang web nang maaga 0:01:25.420,0:01:28.560 upang irekord ang impormasyon na maaaring[br]makatulong sa iyong paghahanap sa kinalaunan. 0:01:28.930,0:01:31.270 Sa paraang iyan, kapag naghanap ka[br]tungkol sa biyahe sa Mars, 0:01:31.630,0:01:33.700 ang search engine[br]ay mayroon na ng kung ano ang kailangan nito 0:01:33.700,0:01:35.728 upang bigyan ka ng sagot sa totoong oras. 0:01:36.250,0:01:37.540 Narito kung paano ito gumagana. 0:01:37.900,0:01:42.010 Ang internet ay isang web ng mga page na[br]konektado sa isa't isa sa pamamagitan ng mga hyperlink. 0:01:42.400,0:01:44.680 Ang mga search engine ay[br]panay na nagpapatakbo ng isang program 0:01:44.680,0:01:47.380 na tinatawag na Spider (Gagamba) na tumatawid[br]sa mga web page na ito 0:01:47.380,0:01:49.040 upang kolektahin ang impormasyon tungkol sa kanila. 0:01:49.780,0:01:51.550 Sa bawat pagkakataon na nakahahanap ito ng hyperlink, 0:01:52.090,0:01:55.000 sinusundan nito ito hanggang nabisita[br]nito ang bawat page 0:01:55.030,0:01:57.240 na mahahanap nito sa buong[br]internet. 0:01:57.335,0:01:59.170 Sa bawat page na binibisita ng spider, 0:01:59.200,0:02:02.320 inirerekord nito ang anumang impormasyon[br]na maaaring kailangan nito sa paghahanap 0:02:02.500,0:02:05.650 sa pamamagitan ng pagdaragdag dito sa isang espesyal[br]na database na tinatawag na search index. 0:02:07.166,0:02:09.530 Ngayon, balik tayo sa[br]paghahanap na nauna 0:02:09.590,0:02:11.990 at tingnan kung malalaman natin[br]kung paano ginawa 0:02:11.990,0:02:13.333 ng search engine ang mga resulta. 0:02:13.640,0:02:16.460 Kapag tinanong kung gaano katagal[br]aabutin ang biyahe sa Mars, 0:02:16.640,0:02:18.860 tinitingnan ng search engine[br]ang bawat isa sa mga katagang iyon 0:02:18.920,0:02:21.410 sa search index upang[br]kaagad na kumuha ng isang listahan 0:02:21.410,0:02:24.500 ng lahat ng mga page sa[br]internet na naglalaman ng mga katagang iyon. 0:02:24.890,0:02:26.870 Pero sa pagtingin lang sa mga search item na ito 0:02:26.870,0:02:28.760 ay maaaring umani ng milyon-milyong page 0:02:28.760,0:02:31.110 na kailangan ng search engine[br]upang malaman 0:02:31.110,0:02:33.120 ang mga magaling na resulta upang ipakita muna sa iyo. 0:02:33.340,0:02:36.010 Dito nagiging mahirap[br]dahil maaaring mangailangan 0:02:36.010,0:02:38.040 ang search engine na hulaan kung ano[br]ang hinahanap mo. 0:02:38.930,0:02:41.360 Bawat search engine ay[br]gumagamit ng sarili nitong algoritmo 0:02:41.360,0:02:44.230 upang i-rank ang mga page base sa[br]kung ano ang iniisip nito na gusto mo. 0:02:44.930,0:02:47.660 Ang algoritmo sa pag-rank[br]ng search engine ay magtse-check 0:02:47.990,0:02:50.360 kung ang search term mo ay lumalabas[br]sa page title, 0:02:50.900,0:02:53.820 maaari nitong i-check kung ang lahat ng [br]mga kataga ay lumalabas na magkakasunod sa isa't isa, 0:02:54.520,0:02:57.020 o anumang numero ng ibang mga kalkulasyon 0:02:57.020,0:02:58.610 na tumutulong dito na mas mahusay na malaman 0:02:58.670,0:03:01.420 kung aling mga page ang gugustuhin mong[br]makita at alin ang hindi. 0:03:02.960,0:03:04.960 Inimbento ng Google ang pinaka[br]sikat na algoritmo 0:03:04.960,0:03:08.530 sa pagpili ng mga pinaka naaayong resulta [br]ng paghahanap sa pamamagitan ng pagsasaalang-alang 0:03:08.560,0:03:11.230 kung ilang ibang Web page[br]ay naka-link sa ibinigay na page. 0:03:11.830,0:03:14.140 Ang ideya ay kung[br]maraming website ay nag-iisip 0:03:14.140,0:03:15.660 na ang isang web page ay interesante, 0:03:15.660,0:03:17.940 kung gayon malamang ito[br]ang hinahanap mo. 0:03:18.190,0:03:20.020 Ang algoritmong ito ay tinatawag na page rank, 0:03:20.590,0:03:22.330 hindi dahil inira-rank nito ang mga web page, 0:03:22.570,0:03:25.210 pero dahil ipinangalan ito[br]sa imbentor nito, si Larry Page, 0:03:25.480,0:03:27.333 na isa sa mga pundador ng Google. 0:03:27.940,0:03:30.520 Dahil ang isang website ay madalas gumagawa ng[br]pera kapag binibisita mo ito, 0:03:30.820,0:03:32.950 panay na sinusubukan [br]ng mga spammer na maghanap ng mga paraan 0:03:32.950,0:03:35.741 upang manipulahin ang algoritmo ng paghahanap[br]para ang kanilang mga page 0:03:35.742,0:03:37.931 ay nakalistang mas mataas sa mga resulta. 0:03:38.260,0:03:40.750 Regular na ina-update ng[br]mga search engine ang kanilang mga algoritmo 0:03:40.750,0:03:44.296 upang iwasan ang mga peke o hindi mapagkakatiwalaang[br]site na umabot sa tuktok. 0:03:44.680,0:03:47.350 Sa kahulihulihan, nasa sa iyo[br]na magmatyag 0:03:47.500,0:03:49.450 sa mga page na ito na hindi mapagkakatiwalaan 0:03:49.690,0:03:52.990 sa pamamagitan ng pagtingin sa web address at[br]paniniguro na maaasahang batis ito. 0:03:53.680,0:03:55.390 Palaging nagbabago ang mga search program 0:03:55.420,0:03:58.420 upang mapabuti ang mga algoritmo[br]na bumabalik na may mga mas mahusay na resulta, 0:03:58.540,0:04:00.460 mas mabilis na resulta kaysa kanilang kakumpetensiya. 0:04:01.000,0:04:03.100 Ang mga search engine sa ngayon ay[br]gumagamit pa rin ng impormasyon 0:04:03.100,0:04:06.820 na hindi mo hayagang ibinibigay[br]upang tulungan ka na pakitirin ang paghahanap mo. 0:04:07.150,0:04:10.120 Kaya, halimbawa,[br]kung naghanap ka ng mga parke ng aso, 0:04:10.240,0:04:12.190 maraming search engine[br]ay magbibigay sa iyo ng mga resulta 0:04:12.190,0:04:13.840 para sa lahat ng mga parke ng aso na malapit, 0:04:14.080,0:04:16.260 bagaman hindi mo[br]nai-type ang lokasyon mo. 0:04:17.800,0:04:20.530 Nauunawaan din ng mga modernong[br]search engine na higit 0:04:20.530,0:04:22.060 kaysa sa mga kataga lang sa isang page, 0:04:22.300,0:04:24.970 pero ano ang tunay na kahulugan nila[br]para malaman ang pinakamagaling 0:04:24.970,0:04:26.750 na tumutugma sa kung ano ang hinahanap mo. 0:04:27.130,0:04:29.980 Halimbawa, kung naghahanap ka[br]ng mabilis na pitcher, 0:04:30.280,0:04:32.300 malalaman nito na[br]naghahanap ka ng isang atleta. 0:04:32.500,0:04:34.450 Pero kung naghahanap ka ng malaking pitcher, 0:04:34.450,0:04:36.730 hahanapan ka nito ng mga opsiyon[br]para sa kusina mo. 0:04:38.420,0:04:41.910 Upang mas mahusay na maunawaan ang mga kataga,[br]gumagamit kami ng ilang bagay na tinatawag na machine learning, 0:04:41.910,0:04:43.985 isang uri ng artificial intelligence. 0:04:43.985,0:04:46.050 Ginagawa nito ang mga algoritmo[br]ng paghahanap na hanapin 0:04:46.090,0:04:48.400 hindi lang ang mga indibidwal na titik[br]o kataga sa page, 0:04:48.400,0:04:51.280 pero para maunawaan ang nakatagong[br]kahulugan ng mga kataga. 0:04:53.690,0:04:55.850 Lumalagong exponential ang internet, 0:04:56.210,0:04:59.810 pero kung ang mga team na nagdidisenyo[br]ng mga search engine ay ginagawa nang tama ang ating mga trabaho, 0:05:00.080,0:05:04.090 ang impormasyon na gusto mo ay dapat[br]palaging aabot ng ilang keystroke lang.