0:00:06.070,0:00:07.120 Ahoj. Jmenuji se John. 0:00:07.510,0:00:10.140 Vedu týmy pro vyhledávání[br]a strojové učení u Google. 0:00:12.130,0:00:14.230 Myslím, že je úžasně inspirující, 0:00:14.230,0:00:16.214 že lidé z celého světa 0:00:16.215,0:00:19.160 se obracejí na vyhledávací nástroje,[br]aby se jich ptali na obyčejné otázky 0:00:19.160,0:00:20.930 i na neuvěřitelně důležité otázky. 0:00:20.930,0:00:23.450 Takže dávat jim nejlepší[br]odpovědi, jaké dovedeme dát, 0:00:23.450,0:00:24.864 je obrovská zodpovědnost. 0:00:26.710,0:00:30.610 Ahoj. Jmenuji se Akshaya a pracuji[br]v týmu pro vyhledávání u Bing. 0:00:30.910,0:00:33.190 Častokrát se stává, že se[br]začínáme zabývat 0:00:33.190,0:00:35.800 umělou inteligencí a[br]strojovým učením, 0:00:35.830,0:00:39.010 avšak musíme řešit také to, jak[br]to budou využívat uživatelé, 0:00:39.140,0:00:42.390 protože konec konců,[br]chceme ovlivnit společnost. 0:00:43.780,0:00:45.400 Položme jednoduchou otázku. 0:00:45.820,0:00:48.070 Jak dlouho trvá cesta na Mars? 0:00:49.330,0:00:50.950 Odkud pocházejí tyto výsledky 0:00:51.370,0:00:54.100 a proč byl tento uveden[br]před tímto? 0:00:55.700,0:00:58.150 Dobře, podívejme se,[br]jak vyhledávač 0:00:58.150,0:00:59.860 přeměnil Váš požadavek na výsledek. 0:01:00.690,0:01:03.360 První věc, kterou musíte znát,[br]je, že když provedete vyhledávání, 0:01:03.430,0:01:06.480 vyhledávač ve skutečnosti[br]nenavštíví World Wide Web 0:01:06.480,0:01:08.010 a neuskuteční celé hledání v reálném čase. 0:01:08.140,0:01:10.610 Tak je tomu proto, že na[br]internetu existuje více než 0:01:10.610,0:01:14.140 miliarda webů a každou[br]minutu vznikají stovky dalších. 0:01:14.140,0:01:16.210 Takže kdyby vyhledávač[br]musel projít 0:01:16.240,0:01:18.690 všechny weby, aby našel[br]ten jeden, který chcete, 0:01:18.690,0:01:20.120 trvalo by to prostě do nekonečna. 0:01:20.500,0:01:21.940 Takže aby bylo Vaše vyhledávání rychlejší, 0:01:21.970,0:01:24.940 vyhledávače neustále prohlížejí[br]celý web předem, 0:01:25.420,0:01:28.560 aby zaznamenaly informace, které mohou[br]později pomoci při Vašem vyhledávání. 0:01:28.930,0:01:31.270 Takže když potom hledáte[br]něco o cestě na Mars, 0:01:31.630,0:01:33.700 vyhledávač už bude mít,[br]co potřebuje k tomu 0:01:33.700,0:01:35.728 aby Vám odpověděl v reálném čase. 0:01:36.250,0:01:37.540 Funguje to takto: 0:01:37.900,0:01:42.010 Internet je síť stránek navzájem[br]propojených hypertextovými odkazy. 0:01:42.400,0:01:44.680 Vyhledávače mají neustále[br]spuštěn program 0:01:44.680,0:01:47.380 zvaný Pavouk, který[br]těmito weby prochází, 0:01:47.380,0:01:49.040 aby o nich shromáždil informace. 0:01:49.780,0:01:51.550 Pokaždé, když najde hypertextový odkaz, 0:01:52.090,0:01:55.000 následuje jej, dokud[br]nenavštíví všechny stránky 0:01:55.030,0:01:57.240 které se mu podaří najít[br]na celém internetu. 0:01:57.335,0:01:59.170 Pro každou stránku, kterou pavouk navštíví 0:01:59.200,0:02:02.320 zaznamená veškeré informace, které[br]by mohl potřebovat při vyhledávání tak, že 0:02:02.500,0:02:05.650 je přidá do zvláštní databáze[br]zvané vyhledávací index. 0:02:07.166,0:02:09.530 Teď přejděme k tomu[br]vyhledávanému pojmu z minula 0:02:09.590,0:02:11.990 a zkusme, zda se nám[br]podaří zjistit, jak vyhledávač 0:02:11.990,0:02:13.333 přišel s těmito výsledky. 0:02:13.640,0:02:16.460 Když se zeptáte, jak[br]dlouho trvá cesta na Mars, 0:02:16.640,0:02:18.860 vyhledávač se podívá[br]na každé z těchto slov 0:02:18.920,0:02:21.410 ve vyhledávacím indexu a[br]okamžitě pořídí seznam 0:02:21.410,0:02:24.500 všech stránek na internetu,[br]které tato slova obsahují. 0:02:24.890,0:02:26.870 Avšak poohlížet se pouze po[br]těchto vyhledávaných pojmech 0:02:26.870,0:02:28.760 by přineslo miliony stránek, 0:02:28.760,0:02:31.110 takže vyhledávací stroj[br]bude potřebovat umět určit 0:02:31.110,0:02:33.120 nejlepší shody, aby Vám[br]je zobrazil jako první. 0:02:33.340,0:02:36.010 Právě tehdy to začíná být[br]náročné, protože vyhledávač 0:02:36.010,0:02:38.040 se bude možná muset pokusit[br]uhodnout, co hledáte. 0:02:38.930,0:02:41.360 Každý vyhledávač používá[br]svůj vlastní algoritmus 0:02:41.360,0:02:44.230 k uspořádání stránek podle toho,[br]co si myslí, že si přejete. 0:02:44.930,0:02:47.660 Seřazovací algoritmus vyhledávače[br]by mohl kontrolovat, 0:02:47.990,0:02:50.360 zda se Váš vyhledávaný pojem[br]zobrazuje v titulu stránky, 0:02:50.900,0:02:53.820 mohl by kontrolovat, zda se všechna[br]slova vyskytují poblíž sebe navzájem, 0:02:54.520,0:02:57.020 nebo některý jiný výpočet, který 0:02:57.020,0:02:58.610 by mu pomohl lépe určit, 0:02:58.670,0:03:01.420 které stránky chcete a které[br]nechcete vidět. 0:03:02.960,0:03:04.960 Google vynalezl nejslavnější[br]algoritmus 0:03:04.960,0:03:08.530 pro výběr co nejpodstatnějších výsledků[br]pro dané vyhledávání uvážením toho, 0:03:08.560,0:03:11.230 kolik jiných webů odkazovalo[br]na danou stránku. 0:03:11.830,0:03:14.140 Myšlenkou je, že jestliže[br]si mnoho webů myslí, 0:03:14.140,0:03:15.660 že nějaký web je zajímavý, 0:03:15.660,0:03:17.940 pak je to pravděpodobně[br]ten, který hledáte. 0:03:18.190,0:03:20.020 Tento algoritmus se nazývá „page rank“ 0:03:20.590,0:03:22.330 ne snad proto, že by nějak řadil webové stránky, 0:03:22.570,0:03:25.210 ale proto, že je pojmenován po svém[br]vynálezci, jímž je Larry Page, 0:03:25.480,0:03:27.333 jeden ze zakladatelů společnosti Google. 0:03:27.940,0:03:30.520 Protože na Vašich návštěvách webové stránky[br]web častokrát vydělává nějaké peníze, 0:03:30.820,0:03:32.950 spammeři se neustále[br]snaží najít si způsob, 0:03:32.950,0:03:35.741 jak si s algoritmem vyhledávače[br]zahrávat tak, aby jejich 0:03:35.742,0:03:37.931 stránky bývaly na výsledcích[br]umísťovány výše. 0:03:38.260,0:03:40.750 Některé vyhledávače své[br]algoritmy pravidelně aktualizují, 0:03:40.750,0:03:44.296 aby se falešné nebo nedůvěryhodné[br]weby nedostávaly na vrchol. 0:03:44.680,0:03:47.350 Nakonec však bude záležet na Vás,[br]abyste si dali pozor na 0:03:47.500,0:03:49.450 nedůvěryhodné stránky tím, 0:03:49.690,0:03:52.990 že se podíváte na webovou adresu a[br]ověříte si, zda jde o důvěryhodný zdroj. 0:03:53.680,0:03:55.390 Vyhledávací programy se stále vyvíjejí 0:03:55.420,0:03:58.420 a zlepšují své algoritmy,[br]aby přinášely lepší výsledky, 0:03:58.540,0:04:00.460 rychlejší výsledky, než[br]jejich konkurence. 0:04:01.000,0:04:03.100 Dnešní vyhledávače dokonce[br]ke zúžení Vašeho 0:04:03.100,0:04:06.820 vyhledávání používají informace,[br]které jste výslovně nezadali, 0:04:07.150,0:04:10.120 Takže jestliže například[br]vyhledáváte o parcích pro psy, 0:04:10.240,0:04:12.190 mnoho vyhledávačů Vám[br]zároveň podá výsledky 0:04:12.190,0:04:13.840 o všech parcích pro psy v okolí, 0:04:14.080,0:04:16.260 i když jste nezadali[br]svou polohu. 0:04:17.800,0:04:20.530 Moderní vyhledávače[br]také chápou více 0:04:20.530,0:04:22.060 než jen slova na stránce, 0:04:22.300,0:04:24.970 protože chápou i co znamenají,[br]aby našly to nejlepší, 0:04:24.970,0:04:26.750 co odpovídá tomu, co hledáte. 0:04:27.130,0:04:29.980 Jestliže například hledáte[br]„fast pitcher“ (rychlého jamkaře), 0:04:30.280,0:04:32.300 bude to vědět,[br]že hledáte sportovce. 0:04:32.500,0:04:34.450 Jestliže však budete hledat[br]„large pitcher“ (velký hrnec), 0:04:34.450,0:04:36.730 najde Vám to možnosti[br]nákupu věcí do kuchyně. 0:04:38.420,0:04:41.910 Aby byla slova lépe pochopena,[br]používáme něco, čemu se říká strojové učení, 0:04:41.910,0:04:43.985 a je to určitý typ umělé inteligence. 0:04:43.985,0:04:46.050 Umožňuje to vyhledávacímu[br]algoritmu vyhledávat 0:04:46.090,0:04:48.400 nejen jednotlivá písmena[br]nebo slova na stránce, 0:04:48.400,0:04:51.280 ale také pochopit význam[br]oněch slov. 0:04:53.690,0:04:55.850 Internet se exponenciálně rozrůstá, 0:04:56.210,0:04:59.810 ale jestliže týmy, které navrhují vyhledávače,[br]budou dělat naši práci dobře, 0:05:00.080,0:05:04.090 pak informace, které chcete, budou[br]vždy jen několik úhozů do kláves od Vás.