1 00:00:06,070 --> 00:00:06,595 Ahoj. Jmenuji se John. 2 00:00:06,595 --> 00:00:06,726 Vedu týmy pro vyhledávání a strojové učení u Google. 3 00:00:06,726 --> 00:00:06,758 Myslím, že je úžasně inspirující, 4 00:00:06,758 --> 00:00:06,774 že lidé z celého světa 5 00:00:06,774 --> 00:00:06,782 se obracejí na vyhledávací nástroje, aby se jich ptali na obyčejné otázky 6 00:00:06,782 --> 00:00:06,786 i na neuvěřitelně důležité otázky. 7 00:00:06,786 --> 00:00:06,788 Takže dávat jim nejlepší odpovědi, jaké 8 00:00:06,788 --> 00:00:06,788 dovedeme, je obrovská zodpovědnost. 9 00:00:06,788 --> 00:00:06,789 Ahoj. Jmenuji se Akshaya a pracuji v týmu pro vyhledávání u Bing. 10 00:00:06,789 --> 00:00:06,790 Častokrát se stává, že se začínáme zabývat 11 00:00:06,790 --> 00:00:06,790 umělou inteligencí a strojovým učením, 12 00:00:06,790 --> 00:00:06,790 avšak musíme řešit také to, jak to budou využívat uživatelé, 13 00:00:06,790 --> 00:00:06,790 protože konec konců, chceme ovlivnit společnost. 14 00:00:06,790 --> 00:00:06,790 Položme si jednoduchou otázku. 15 00:00:06,790 --> 00:00:06,790 Jak dlouho trvá cesta na Mars? 16 00:00:06,790 --> 00:00:06,790 Odkud pocházejí tyto výsledky 17 00:00:06,790 --> 00:00:06,790 a proč byl tento uveden před tímto? 18 00:00:06,790 --> 00:00:06,790 Dobře, podívejme se, jak vyhledávač 19 00:00:06,790 --> 00:00:06,790 přeměnil Váš požadavek na výsledek. 20 00:00:06,790 --> 00:00:06,790 První věc, kterou musíte znát, je, že když provedete vyhledávání, 21 00:00:06,790 --> 00:00:06,790 vyhledávač ve skutečnosti nenavštíví World Wide Web 22 00:00:06,790 --> 00:00:06,790 a neuskuteční celé hledání v reálném čase. 23 00:00:06,790 --> 00:00:06,790 Tak je tomu proto, že na internetu existuje více než 24 00:00:06,790 --> 00:00:06,790 miliarda webů a každou minutu vznikají stovky dalších. 25 00:00:06,790 --> 00:00:06,790 Takže kdyby vyhledávač musel projít 26 00:00:06,790 --> 00:00:06,790 všechny weby, aby našel ten jeden, který chcete, 27 00:00:06,790 --> 00:00:06,790 trvalo by to prostě do nekonečna. 28 00:00:06,790 --> 00:00:06,790 Takže aby bylo Vaše vyhledávání rychlejší, 29 00:00:06,790 --> 00:00:06,790 vyhledávače neustále prohlížejí celý web předem, 30 00:00:06,790 --> 00:00:06,790 aby zaznamenaly informace, které mohou později pomoci při Vašem vyhledávání. 31 00:00:06,790 --> 00:00:06,790 Takže když potom hledáte něco o cestě na Mars, 32 00:00:06,790 --> 00:00:06,790 vyhledávač už bude mít, co potřebuje k tomu 33 00:00:06,790 --> 00:00:06,790 aby Vám odpověděl v reálném čase. 34 00:00:06,790 --> 00:00:06,790 Funguje to takto: 35 00:00:06,790 --> 00:00:06,790 Internet je síť stránek navzájem propojených hypertextovými odkazy. 36 00:00:06,790 --> 00:00:06,790 Vyhledávače mají neustále spuštěn program 37 00:00:06,790 --> 00:00:06,790 zvaný Pavouk, který těmito weby prochází, 38 00:00:06,790 --> 00:00:06,790 aby o nich shromáždil informace. 39 00:00:06,790 --> 00:00:06,790 Pokaždé, když najde hypertextový odkaz, 40 00:00:06,790 --> 00:00:06,790 následuje jej, dokud nenavštíví všechny stránky 41 00:00:06,790 --> 00:00:06,790 které se mu podaří najít na celém internetu. 42 00:00:06,790 --> 00:00:06,790 Pro každou stránku, kterou pavouk navštíví 43 00:00:06,790 --> 00:00:06,790 zaznamená veškeré informace, které by mohl potřebovat při vyhledávání tak, že 44 00:00:06,790 --> 00:00:06,790 je přidá do zvláštní databáze zvané vyhledávací index. 45 00:00:06,790 --> 00:00:06,790 Teď přejděme k tomu vyhledávanému pojmu z minula 46 00:00:06,790 --> 00:00:06,790 a zkusme, zda se nám podaří zjistit, jak vyhledávač 47 00:00:06,790 --> 00:00:06,790 přišel s těmito výsledky. 48 00:00:06,790 --> 00:00:06,790 Když se zeptáte, jak dlouho trvá cesta na Mars, 49 00:00:06,790 --> 00:00:06,790 vyhledávač se podívá na každé z těchto slov 50 00:00:06,790 --> 00:00:06,790 ve vyhledávacím indexu a okamžitě pořídí seznam 51 00:00:06,790 --> 00:00:06,790 všech stránek na internetu, které tato slova obsahují. 52 00:00:06,790 --> 00:00:06,790 Avšak poohlížet se pouze po těchto vyhledávaných pojmech 53 00:00:06,790 --> 00:00:06,790 by přineslo miliony stránek, 54 00:00:06,790 --> 00:00:06,790 takže vyhledávací stroj bude potřebovat umět určit 55 00:00:06,790 --> 00:00:06,790 nejlepší shody, aby Vám je zobrazil jako první. 56 00:00:06,790 --> 00:00:06,790 Právě tehdy to začíná být náročné, protože vyhledávač 57 00:00:06,790 --> 00:00:06,790 se bude možná muset pokusit uhodnout, co hledáte. 58 00:00:06,790 --> 00:00:06,790 Každý vyhledávač používá svůj vlastní algoritmus 59 00:00:06,790 --> 00:00:06,790 k uspořádání stránek podle toho, co si myslí, že si přejete. 60 00:00:06,790 --> 00:00:06,790 Seřazovací algoritmus vyhledávače by mohl kontrolovat, 61 00:00:06,790 --> 00:00:06,790 zda se Váš vyhledávaný pojem zobrazuje v titulu stránky, 62 00:00:06,790 --> 00:00:06,790 mohl by kontrolovat, zda se všechna slova vyskytují poblíž sebe navzájem, 63 00:00:06,790 --> 00:00:06,790 nebo některý jiný výpočet, který 64 00:00:06,790 --> 00:00:06,790 by mu pomohl lépe určit, 65 00:00:06,790 --> 00:00:06,790 které stránky chcete a které nechcete vidět. 66 00:00:06,790 --> 00:00:06,790 Google vynalezl nejslavnější algoritmus 67 00:00:06,790 --> 00:00:06,790 pro výběr co nejpodstatnějších výsledků pro dané vyhledávání uvážením toho, 68 00:00:06,790 --> 00:00:06,790 kolik jiných webů odkazovalo na danou stránku. 69 00:00:06,790 --> 00:00:06,790 Myšlenkou je, že jestliže si mnoho webů myslí, 70 00:00:06,790 --> 00:00:06,790 že nějaký web je zajímavý, 71 00:00:06,790 --> 00:00:06,790 pak je to pravděpodobně ten, který hledáte. 72 00:00:06,790 --> 00:00:06,790 Tento algoritmus se nazývá „page rank“ 73 00:00:06,790 --> 00:00:06,790 ne snad proto, že by nějak řadil webové stránky, 74 00:00:06,790 --> 00:00:06,790 ale proto, že je pojmenován po svém vynálezci, jímž je Larry Page, 75 00:00:06,790 --> 00:00:06,790 jeden ze zakladatelů společnosti Google. 76 00:00:06,790 --> 00:00:06,790 Protože na Vašich návštěvách webové stránky web častokrát vydělá nějaké peníze, 77 00:00:06,790 --> 00:00:06,790 spammeři se neustále snaží najít si způsob, 78 00:00:06,790 --> 00:00:06,790 jak si s algoritmem vyhledávače zahrávat tak, aby jejich 79 00:00:06,790 --> 00:00:06,790 stránky bývaly na výsledcích umísťovány výše. 80 00:00:06,790 --> 00:00:06,790 Některé vyhledávače své algoritmy pravidelně aktualizují, 81 00:00:06,790 --> 00:00:06,790 aby se falešné nebo nedůvěryhodné weby nedostávaly na vrchol. 82 00:00:06,790 --> 00:00:06,790 Nakonec však bude záležet na Vás, abyste si dali pozor na 83 00:00:06,790 --> 00:00:06,790 nedůvěryhodné stránky tím, 84 00:00:06,790 --> 00:00:06,790 že se podíváte na webovou adresu a ověříte si, zda jde o důvěryhodný zdroj. 85 00:00:06,790 --> 00:00:06,790 Vyhledávací programy se stále vyvíjejí 86 00:00:06,790 --> 00:00:06,790 a zlepšují své algoritmy, aby přinášely lepší výsledky, 87 00:00:06,790 --> 00:00:06,790 rychlejší výsledky, než jejich konkurence. 88 00:00:06,790 --> 00:00:06,790 Dnešní vyhledávače dokonce ke zúžení Vašeho 89 00:00:06,790 --> 00:00:06,790 vyhledávání používají informace, které jste výslovně nezadali, 90 00:00:06,790 --> 00:00:06,790 Takže jestliže například vyhledáváte o parcích pro psy, 91 00:00:06,790 --> 00:00:06,790 mnoho vyhledávačů Vám zároveň podá výsledky 92 00:00:06,790 --> 00:00:06,790 o všech parcích pro psy v okolí, 93 00:00:06,790 --> 00:00:06,790 i když jste nezadali svou polohu. 94 00:00:06,790 --> 00:00:06,790 Moderní vyhledávače také chápou více 95 00:00:06,790 --> 00:00:06,790 než jen slova na stránce, 96 00:00:06,790 --> 00:00:06,790 protože chápou i co znamenají, aby našly to nejlepší, 97 00:00:06,790 --> 00:00:06,790 co odpovídá tomu, co hledáte. 98 00:00:06,790 --> 00:00:06,790 Jestliže například hledáte „fast pitcher“ (rychlého jamkaře), 99 00:00:06,790 --> 00:00:06,790 bude to vědět, že hledáte sportovce. 100 00:00:06,790 --> 00:00:06,790 Jestliže však budete hledat „large pitcher“ (velký hrnec), 101 00:00:06,790 --> 00:00:06,790 najde Vám to možnosti nákupu věcí do kuchyně. 102 00:00:06,790 --> 00:00:06,790 Aby byla slova lépe pochopena, používáme něco, čemu se říká strojové učení, 103 00:00:06,790 --> 00:00:06,790 a je to určitý typ umělé inteligence. 104 00:00:06,790 --> 00:00:06,790 Umožňuje to vyhledávacímu algoritmu vyhledávat 105 00:00:06,790 --> 00:00:06,790 nejen jednotlivá písmena nebo slova na stránce, 106 00:00:06,790 --> 00:00:06,790 ale také pochopit význam oněch slov. 107 00:00:06,790 --> 00:00:06,790 Internet se exponenciálně rozrůstá, 108 00:00:06,790 --> 00:00:06,790 ale jestliže týmy, které navrhují vyhledávače, budou dělat naši práci dobře, 109 00:00:06,790 --> 00:00:06,790 pak informace, které chcete, budou vždy jen několik úhozů do kláves od Vás. 110 00:00:06,790 --> 00:00:06,790 111 00:00:06,790 --> 00:00:06,790 112 00:00:06,790 --> 00:00:06,790 113 00:00:06,790 --> 00:00:06,790 114 00:00:06,790 --> 00:00:06,790 115 00:00:06,790 --> 00:00:06,790 116 00:00:06,790 --> 00:00:06,790 117 00:00:06,790 --> 00:00:06,790 118 00:00:06,790 --> 00:00:06,790 119 00:00:06,790 --> 00:00:06,790 120 00:00:06,790 --> 00:00:06,790 121 00:00:06,790 --> 00:00:06,790 122 00:00:06,790 --> 00:00:06,791 123 00:00:06,791 --> 00:00:06,824 124 00:00:06,824 --> 00:00:06,857 125 00:00:06,857 --> 00:00:07,120 126 00:00:07,510 --> 00:00:10,140 127 00:00:12,130 --> 00:00:14,230 128 00:00:14,230 --> 00:00:16,214 129 00:00:16,215 --> 00:00:19,160 130 00:00:19,160 --> 00:00:20,930 131 00:00:20,930 --> 00:00:23,450 132 00:00:23,450 --> 00:00:24,864 133 00:00:26,710 --> 00:00:30,610 134 00:00:30,910 --> 00:00:33,190 135 00:00:33,190 --> 00:00:35,800 136 00:00:35,830 --> 00:00:39,010 137 00:00:39,140 --> 00:00:42,390 138 00:00:43,780 --> 00:00:45,400 139 00:00:45,820 --> 00:00:48,070 140 00:00:49,330 --> 00:00:50,950 141 00:00:51,370 --> 00:00:54,100 142 00:00:55,700 --> 00:00:58,150 143 00:00:58,150 --> 00:00:59,860 144 00:01:00,690 --> 00:01:03,360 145 00:01:03,430 --> 00:01:06,480 146 00:01:06,480 --> 00:01:08,010 147 00:01:08,140 --> 00:01:10,610 148 00:01:10,610 --> 00:01:14,140 149 00:01:14,140 --> 00:01:16,210 150 00:01:16,240 --> 00:01:18,690 151 00:01:18,690 --> 00:01:20,120 152 00:01:20,500 --> 00:01:21,940 153 00:01:21,970 --> 00:01:24,940 154 00:01:25,420 --> 00:01:28,560 155 00:01:28,930 --> 00:01:31,270 156 00:01:31,630 --> 00:01:33,700 157 00:01:33,700 --> 00:01:35,728 158 00:01:36,250 --> 00:01:37,540 159 00:01:37,900 --> 00:01:42,010 160 00:01:42,400 --> 00:01:44,680 161 00:01:44,680 --> 00:01:47,380 162 00:01:47,380 --> 00:01:49,040 163 00:01:49,780 --> 00:01:51,550 164 00:01:52,090 --> 00:01:55,000 165 00:01:55,030 --> 00:01:57,240 166 00:01:57,335 --> 00:01:59,170 167 00:01:59,200 --> 00:02:02,320 168 00:02:02,500 --> 00:02:05,650 169 00:02:07,166 --> 00:02:09,530 170 00:02:09,590 --> 00:02:11,990 171 00:02:11,990 --> 00:02:13,333 172 00:02:13,640 --> 00:02:16,460 173 00:02:16,640 --> 00:02:18,860 174 00:02:18,920 --> 00:02:21,410 175 00:02:21,410 --> 00:02:24,500 176 00:02:24,890 --> 00:02:26,870 177 00:02:26,870 --> 00:02:28,760 178 00:02:28,760 --> 00:02:31,110 179 00:02:31,110 --> 00:02:33,120 180 00:02:33,340 --> 00:02:36,010 181 00:02:36,010 --> 00:02:38,040 182 00:02:38,930 --> 00:02:41,360 183 00:02:41,360 --> 00:02:44,230 184 00:02:44,930 --> 00:02:47,660 185 00:02:47,990 --> 00:02:50,360 186 00:02:50,900 --> 00:02:53,820 187 00:02:54,520 --> 00:02:57,020 188 00:02:57,020 --> 00:02:58,610 189 00:02:58,670 --> 00:03:01,420 190 00:03:02,960 --> 00:03:04,960 191 00:03:04,960 --> 00:03:08,530 192 00:03:08,560 --> 00:03:11,230 193 00:03:11,830 --> 00:03:14,140 194 00:03:14,140 --> 00:03:15,660 195 00:03:15,660 --> 00:03:17,940 196 00:03:18,190 --> 00:03:20,020 197 00:03:20,590 --> 00:03:22,330 198 00:03:22,570 --> 00:03:25,210 199 00:03:25,480 --> 00:03:27,333 200 00:03:27,940 --> 00:03:30,520 201 00:03:30,820 --> 00:03:32,950 202 00:03:32,950 --> 00:03:35,741 203 00:03:35,742 --> 00:03:37,931 204 00:03:38,260 --> 00:03:40,750 205 00:03:40,750 --> 00:03:44,296 206 00:03:44,680 --> 00:03:47,350 207 00:03:47,500 --> 00:03:49,450 208 00:03:49,690 --> 00:03:52,990 209 00:03:53,680 --> 00:03:55,390 210 00:03:55,420 --> 00:03:58,420 211 00:03:58,540 --> 00:04:00,460 212 00:04:01,000 --> 00:04:03,100 213 00:04:03,100 --> 00:04:06,820 214 00:04:07,150 --> 00:04:10,120 215 00:04:10,240 --> 00:04:12,190 216 00:04:12,190 --> 00:04:13,840 217 00:04:14,080 --> 00:04:16,260 218 00:04:17,800 --> 00:04:20,530 219 00:04:20,530 --> 00:04:22,060 220 00:04:22,300 --> 00:04:24,970 221 00:04:24,970 --> 00:04:26,750 222 00:04:27,130 --> 00:04:29,980 223 00:04:30,280 --> 00:04:32,300 224 00:04:32,500 --> 00:04:34,450 225 00:04:34,450 --> 00:04:36,730 226 00:04:38,420 --> 00:04:41,910 227 00:04:41,910 --> 00:04:43,985 228 00:04:43,985 --> 00:04:46,050 229 00:04:46,090 --> 00:04:48,400 230 00:04:48,400 --> 00:04:51,280 231 00:04:53,690 --> 00:04:55,850 232 00:04:56,210 --> 00:04:59,810 233 00:05:00,080 --> 00:05:04,090