WEBVTT 00:00:06.070 --> 00:00:06.595 Ahoj. Jmenuji se John. 00:00:06.595 --> 00:00:06.726 Vedu týmy pro vyhledávání a strojové učení u Google. 00:00:06.726 --> 00:00:06.758 Myslím, že je úžasně inspirující, 00:00:06.758 --> 00:00:06.774 že lidé z celého světa 00:00:06.774 --> 00:00:06.782 se obracejí na vyhledávací nástroje, aby se jich ptali na obyčejné otázky 00:00:06.782 --> 00:00:06.786 i na neuvěřitelně důležité otázky. 00:00:06.786 --> 00:00:06.788 Takže dávat jim nejlepší odpovědi, jaké 00:00:06.788 --> 00:00:06.788 dovedeme, je obrovská zodpovědnost. 00:00:06.788 --> 00:00:06.789 Ahoj. Jmenuji se Akshaya a pracuji v týmu pro vyhledávání u Bing. 00:00:06.789 --> 00:00:06.790 Častokrát se stává, že se začínáme zabývat 00:00:06.790 --> 00:00:06.790 umělou inteligencí a strojovým učením, 00:00:06.790 --> 00:00:06.790 avšak musíme řešit také to, jak to budou využívat uživatelé, 00:00:06.790 --> 00:00:06.790 protože konec konců, chceme ovlivnit společnost. 00:00:06.790 --> 00:00:06.790 Položme si jednoduchou otázku. 00:00:06.790 --> 00:00:06.790 Jak dlouho trvá cesta na Mars? 00:00:06.790 --> 00:00:06.790 Odkud pocházejí tyto výsledky 00:00:06.790 --> 00:00:06.790 a proč byl tento uveden před tímto? 00:00:06.790 --> 00:00:06.790 Dobře, podívejme se, jak vyhledávač 00:00:06.790 --> 00:00:06.790 přeměnil Váš požadavek na výsledek. 00:00:06.790 --> 00:00:06.790 První věc, kterou musíte znát, je, že když provedete vyhledávání, 00:00:06.790 --> 00:00:06.790 vyhledávač ve skutečnosti nenavštíví World Wide Web 00:00:06.790 --> 00:00:06.790 a neuskuteční celé hledání v reálném čase. 00:00:06.790 --> 00:00:06.790 Tak je tomu proto, že na internetu existuje více než 00:00:06.790 --> 00:00:06.790 miliarda webů a každou minutu vznikají stovky dalších. 00:00:06.790 --> 00:00:06.790 Takže kdyby vyhledávač musel projít 00:00:06.790 --> 00:00:06.790 všechny weby, aby našel ten jeden, který chcete, 00:00:06.790 --> 00:00:06.790 trvalo by to prostě do nekonečna. 00:00:06.790 --> 00:00:06.790 Takže aby bylo Vaše vyhledávání rychlejší, 00:00:06.790 --> 00:00:06.790 vyhledávače neustále prohlížejí celý web předem, 00:00:06.790 --> 00:00:06.790 aby zaznamenaly informace, které mohou později pomoci při Vašem vyhledávání. 00:00:06.790 --> 00:00:06.790 Takže když potom hledáte něco o cestě na Mars, 00:00:06.790 --> 00:00:06.790 vyhledávač už bude mít, co potřebuje k tomu 00:00:06.790 --> 00:00:06.790 aby Vám odpověděl v reálném čase. 00:00:06.790 --> 00:00:06.790 Funguje to takto: 00:00:06.790 --> 00:00:06.790 Internet je síť stránek navzájem propojených hypertextovými odkazy. 00:00:06.790 --> 00:00:06.790 Vyhledávače mají neustále spuštěn program 00:00:06.790 --> 00:00:06.790 zvaný Pavouk, který těmito weby prochází, 00:00:06.790 --> 00:00:06.790 aby o nich shromáždil informace. 00:00:06.790 --> 00:00:06.790 Pokaždé, když najde hypertextový odkaz, 00:00:06.790 --> 00:00:06.790 následuje jej, dokud nenavštíví všechny stránky 00:00:06.790 --> 00:00:06.790 které se mu podaří najít na celém internetu. 00:00:06.790 --> 00:00:06.790 Pro každou stránku, kterou pavouk navštíví 00:00:06.790 --> 00:00:06.790 zaznamená veškeré informace, které by mohl potřebovat při vyhledávání tak, že 00:00:06.790 --> 00:00:06.790 je přidá do zvláštní databáze zvané vyhledávací index. 00:00:06.790 --> 00:00:06.790 Teď přejděme k tomu vyhledávanému pojmu z minula 00:00:06.790 --> 00:00:06.790 a zkusme, zda se nám podaří zjistit, jak vyhledávač 00:00:06.790 --> 00:00:06.790 přišel s těmito výsledky. 00:00:06.790 --> 00:00:06.790 Když se zeptáte, jak dlouho trvá cesta na Mars, 00:00:06.790 --> 00:00:06.790 vyhledávač se podívá na každé z těchto slov 00:00:06.790 --> 00:00:06.790 ve vyhledávacím indexu a okamžitě pořídí seznam 00:00:06.790 --> 00:00:06.790 všech stránek na internetu, které tato slova obsahují. 00:00:06.790 --> 00:00:06.790 Avšak poohlížet se pouze po těchto vyhledávaných pojmech 00:00:06.790 --> 00:00:06.790 by přineslo miliony stránek, 00:00:06.790 --> 00:00:06.790 takže vyhledávací stroj bude potřebovat umět určit 00:00:06.790 --> 00:00:06.790 nejlepší shody, aby Vám je zobrazil jako první. 00:00:06.790 --> 00:00:06.790 Právě tehdy to začíná být náročné, protože vyhledávač 00:00:06.790 --> 00:00:06.790 se bude možná muset pokusit uhodnout, co hledáte. 00:00:06.790 --> 00:00:06.790 Každý vyhledávač používá svůj vlastní algoritmus 00:00:06.790 --> 00:00:06.790 k uspořádání stránek podle toho, co si myslí, že si přejete. 00:00:06.790 --> 00:00:06.790 Seřazovací algoritmus vyhledávače by mohl kontrolovat, 00:00:06.790 --> 00:00:06.790 zda se Váš vyhledávaný pojem zobrazuje v titulu stránky, 00:00:06.790 --> 00:00:06.790 mohl by kontrolovat, zda se všechna slova vyskytují poblíž sebe navzájem, 00:00:06.790 --> 00:00:06.790 nebo některý jiný výpočet, který 00:00:06.790 --> 00:00:06.790 by mu pomohl lépe určit, 00:00:06.790 --> 00:00:06.790 které stránky chcete a které nechcete vidět. 00:00:06.790 --> 00:00:06.790 Google vynalezl nejslavnější algoritmus 00:00:06.790 --> 00:00:06.790 pro výběr co nejpodstatnějších výsledků pro dané vyhledávání uvážením toho, 00:00:06.790 --> 00:00:06.790 kolik jiných webů odkazovalo na danou stránku. 00:00:06.790 --> 00:00:06.790 Myšlenkou je, že jestliže si mnoho webů myslí, 00:00:06.790 --> 00:00:06.790 že nějaký web je zajímavý, 00:00:06.790 --> 00:00:06.790 pak je to pravděpodobně ten, který hledáte. 00:00:06.790 --> 00:00:06.790 Tento algoritmus se nazývá „page rank“ 00:00:06.790 --> 00:00:06.790 ne snad proto, že by nějak řadil webové stránky, 00:00:06.790 --> 00:00:06.790 ale proto, že je pojmenován po svém vynálezci, jímž je Larry Page, 00:00:06.790 --> 00:00:06.790 jeden ze zakladatelů společnosti Google. 00:00:06.790 --> 00:00:06.790 Protože na Vašich návštěvách webové stránky web častokrát vydělá nějaké peníze, 00:00:06.790 --> 00:00:06.790 spammeři se neustále snaží najít si způsob, 00:00:06.790 --> 00:00:06.790 jak si s algoritmem vyhledávače zahrávat tak, aby jejich 00:00:06.790 --> 00:00:06.790 stránky bývaly na výsledcích umísťovány výše. 00:00:06.790 --> 00:00:06.790 Některé vyhledávače své algoritmy pravidelně aktualizují, 00:00:06.790 --> 00:00:06.790 aby se falešné nebo nedůvěryhodné weby nedostávaly na vrchol. 00:00:06.790 --> 00:00:06.790 Nakonec však bude záležet na Vás, abyste si dali pozor na 00:00:06.790 --> 00:00:06.790 nedůvěryhodné stránky tím, 00:00:06.790 --> 00:00:06.790 že se podíváte na webovou adresu a ověříte si, zda jde o důvěryhodný zdroj. 00:00:06.790 --> 00:00:06.790 Vyhledávací programy se stále vyvíjejí 00:00:06.790 --> 00:00:06.790 a zlepšují své algoritmy, aby přinášely lepší výsledky, 00:00:06.790 --> 00:00:06.790 rychlejší výsledky, než jejich konkurence. 00:00:06.790 --> 00:00:06.790 Dnešní vyhledávače dokonce ke zúžení Vašeho 00:00:06.790 --> 00:00:06.790 vyhledávání používají informace, které jste výslovně nezadali, 00:00:06.790 --> 00:00:06.790 Takže jestliže například vyhledáváte o parcích pro psy, 00:00:06.790 --> 00:00:06.790 mnoho vyhledávačů Vám zároveň podá výsledky 00:00:06.790 --> 00:00:06.790 o všech parcích pro psy v okolí, 00:00:06.790 --> 00:00:06.790 i když jste nezadali svou polohu. 00:00:06.790 --> 00:00:06.790 Moderní vyhledávače také chápou více 00:00:06.790 --> 00:00:06.790 než jen slova na stránce, 00:00:06.790 --> 00:00:06.790 protože chápou i co znamenají, aby našly to nejlepší, 00:00:06.790 --> 00:00:06.790 co odpovídá tomu, co hledáte. 00:00:06.790 --> 00:00:06.790 Jestliže například hledáte „fast pitcher“ (rychlého jamkaře), 00:00:06.790 --> 00:00:06.790 bude to vědět, že hledáte sportovce. 00:00:06.790 --> 00:00:06.790 Jestliže však budete hledat „large pitcher“ (velký hrnec), 00:00:06.790 --> 00:00:06.790 najde Vám to možnosti nákupu věcí do kuchyně. 00:00:06.790 --> 00:00:06.790 Aby byla slova lépe pochopena, používáme něco, čemu se říká strojové učení, 00:00:06.790 --> 00:00:06.790 a je to určitý typ umělé inteligence. 00:00:06.790 --> 00:00:06.790 Umožňuje to vyhledávacímu algoritmu vyhledávat 00:00:06.790 --> 00:00:06.790 nejen jednotlivá písmena nebo slova na stránce, 00:00:06.790 --> 00:00:06.790 ale také pochopit význam oněch slov. 00:00:06.790 --> 00:00:06.790 Internet se exponenciálně rozrůstá, 00:00:06.790 --> 00:00:06.790 ale jestliže týmy, které navrhují vyhledávače, budou dělat naši práci dobře, 00:00:06.790 --> 00:00:06.790 pak informace, které chcete, budou vždy jen několik úhozů do kláves od Vás. 00:00:06.790 --> 00:00:06.790 00:00:06.790 --> 00:00:06.790 00:00:06.790 --> 00:00:06.790 00:00:06.790 --> 00:00:06.790 00:00:06.790 --> 00:00:06.790 00:00:06.790 --> 00:00:06.790 00:00:06.790 --> 00:00:06.790 00:00:06.790 --> 00:00:06.790 00:00:06.790 --> 00:00:06.790 00:00:06.790 --> 00:00:06.790 00:00:06.790 --> 00:00:06.790 00:00:06.790 --> 00:00:06.790 00:00:06.790 --> 00:00:06.791 00:00:06.791 --> 00:00:06.824 00:00:06.824 --> 00:00:06.857 00:00:06.857 --> 00:00:07.120 00:00:07.510 --> 00:00:10.140 00:00:12.130 --> 00:00:14.230 00:00:14.230 --> 00:00:16.214 00:00:16.215 --> 00:00:19.160 00:00:19.160 --> 00:00:20.930 00:00:20.930 --> 00:00:23.450 00:00:23.450 --> 00:00:24.864 00:00:26.710 --> 00:00:30.610 00:00:30.910 --> 00:00:33.190 00:00:33.190 --> 00:00:35.800 00:00:35.830 --> 00:00:39.010 00:00:39.140 --> 00:00:42.390 00:00:43.780 --> 00:00:45.400 00:00:45.820 --> 00:00:48.070 00:00:49.330 --> 00:00:50.950 00:00:51.370 --> 00:00:54.100 00:00:55.700 --> 00:00:58.150 00:00:58.150 --> 00:00:59.860 00:01:00.690 --> 00:01:03.360 00:01:03.430 --> 00:01:06.480 00:01:06.480 --> 00:01:08.010 00:01:08.140 --> 00:01:10.610 00:01:10.610 --> 00:01:14.140 00:01:14.140 --> 00:01:16.210 00:01:16.240 --> 00:01:18.690 00:01:18.690 --> 00:01:20.120 00:01:20.500 --> 00:01:21.940 00:01:21.970 --> 00:01:24.940 00:01:25.420 --> 00:01:28.560 00:01:28.930 --> 00:01:31.270 00:01:31.630 --> 00:01:33.700 00:01:33.700 --> 00:01:35.728 00:01:36.250 --> 00:01:37.540 00:01:37.900 --> 00:01:42.010 00:01:42.400 --> 00:01:44.680 00:01:44.680 --> 00:01:47.380 00:01:47.380 --> 00:01:49.040 00:01:49.780 --> 00:01:51.550 00:01:52.090 --> 00:01:55.000 00:01:55.030 --> 00:01:57.240 00:01:57.335 --> 00:01:59.170 00:01:59.200 --> 00:02:02.320 00:02:02.500 --> 00:02:05.650 00:02:07.166 --> 00:02:09.530 00:02:09.590 --> 00:02:11.990 00:02:11.990 --> 00:02:13.333 00:02:13.640 --> 00:02:16.460 00:02:16.640 --> 00:02:18.860 00:02:18.920 --> 00:02:21.410 00:02:21.410 --> 00:02:24.500 00:02:24.890 --> 00:02:26.870 00:02:26.870 --> 00:02:28.760 00:02:28.760 --> 00:02:31.110 00:02:31.110 --> 00:02:33.120 00:02:33.340 --> 00:02:36.010 00:02:36.010 --> 00:02:38.040 00:02:38.930 --> 00:02:41.360 00:02:41.360 --> 00:02:44.230 00:02:44.930 --> 00:02:47.660 00:02:47.990 --> 00:02:50.360 00:02:50.900 --> 00:02:53.820 00:02:54.520 --> 00:02:57.020 00:02:57.020 --> 00:02:58.610 00:02:58.670 --> 00:03:01.420 00:03:02.960 --> 00:03:04.960 00:03:04.960 --> 00:03:08.530 00:03:08.560 --> 00:03:11.230 00:03:11.830 --> 00:03:14.140 00:03:14.140 --> 00:03:15.660 00:03:15.660 --> 00:03:17.940 00:03:18.190 --> 00:03:20.020 00:03:20.590 --> 00:03:22.330 00:03:22.570 --> 00:03:25.210 00:03:25.480 --> 00:03:27.333 00:03:27.940 --> 00:03:30.520 00:03:30.820 --> 00:03:32.950 00:03:32.950 --> 00:03:35.741 00:03:35.742 --> 00:03:37.931 00:03:38.260 --> 00:03:40.750 00:03:40.750 --> 00:03:44.296 00:03:44.680 --> 00:03:47.350 00:03:47.500 --> 00:03:49.450 00:03:49.690 --> 00:03:52.990 00:03:53.680 --> 00:03:55.390 00:03:55.420 --> 00:03:58.420 00:03:58.540 --> 00:04:00.460 00:04:01.000 --> 00:04:03.100 00:04:03.100 --> 00:04:06.820 00:04:07.150 --> 00:04:10.120 00:04:10.240 --> 00:04:12.190 00:04:12.190 --> 00:04:13.840 00:04:14.080 --> 00:04:16.260 00:04:17.800 --> 00:04:20.530 00:04:20.530 --> 00:04:22.060 00:04:22.300 --> 00:04:24.970 00:04:24.970 --> 00:04:26.750 00:04:27.130 --> 00:04:29.980 00:04:30.280 --> 00:04:32.300 00:04:32.500 --> 00:04:34.450 00:04:34.450 --> 00:04:36.730 00:04:38.420 --> 00:04:41.910 00:04:41.910 --> 00:04:43.985 00:04:43.985 --> 00:04:46.050 00:04:46.090 --> 00:04:48.400 00:04:48.400 --> 00:04:51.280 00:04:53.690 --> 00:04:55.850 00:04:56.210 --> 00:04:59.810 00:05:00.080 --> 00:05:04.090