Ahoj. Jmenuji se John. Vedu týmy pro vyhledávání a strojové učení u Google. Myslím, že je úžasně inspirující, že lidé z celého světa se obracejí na vyhledávací nástroje, aby se jich ptali na obyčejné otázky i na neuvěřitelně důležité otázky. Takže dávat jim nejlepší odpovědi, jaké dovedeme dát, je obrovská zodpovědnost. Ahoj. Jmenuji se Akshaya a pracuji v týmu pro vyhledávání u Bing. Častokrát se stává, že se začínáme zabývat umělou inteligencí a strojovým učením, avšak musíme řešit také to, jak to budou využívat uživatelé, protože konec konců, chceme ovlivnit společnost. Položme jednoduchou otázku. Jak dlouho trvá cesta na Mars? Odkud pocházejí tyto výsledky a proč byl tento uveden před tímto? Dobře, podívejme se, jak vyhledávač přeměnil Váš požadavek na výsledek. První věc, kterou musíte znát, je, že když provedete vyhledávání, vyhledávač ve skutečnosti nenavštíví World Wide Web a neuskuteční celé hledání v reálném čase. Tak je tomu proto, že na internetu existuje více než miliarda webů a každou minutu vznikají stovky dalších. Takže kdyby vyhledávač musel projít všechny weby, aby našel ten jeden, který chcete, trvalo by to prostě do nekonečna. Takže aby bylo Vaše vyhledávání rychlejší, vyhledávače neustále prohlížejí celý web předem, aby zaznamenaly informace, které mohou později pomoci při Vašem vyhledávání. Takže když potom hledáte něco o cestě na Mars, vyhledávač už bude mít, co potřebuje k tomu aby Vám odpověděl v reálném čase. Funguje to takto: Internet je síť stránek navzájem propojených hypertextovými odkazy. Vyhledávače mají neustále spuštěn program zvaný Pavouk, který těmito weby prochází, aby o nich shromáždil informace. Pokaždé, když najde hypertextový odkaz, následuje jej, dokud nenavštíví všechny stránky které se mu podaří najít na celém internetu. Pro každou stránku, kterou pavouk navštíví zaznamená veškeré informace, které by mohl potřebovat při vyhledávání tak, že je přidá do zvláštní databáze zvané vyhledávací index. Teď přejděme k tomu vyhledávanému pojmu z minula a zkusme, zda se nám podaří zjistit, jak vyhledávač přišel s těmito výsledky. Když se zeptáte, jak dlouho trvá cesta na Mars, vyhledávač se podívá na každé z těchto slov ve vyhledávacím indexu a okamžitě pořídí seznam všech stránek na internetu, které tato slova obsahují. Avšak poohlížet se pouze po těchto vyhledávaných pojmech by přineslo miliony stránek, takže vyhledávací stroj bude potřebovat umět určit nejlepší shody, aby Vám je zobrazil jako první. Právě tehdy to začíná být náročné, protože vyhledávač se bude možná muset pokusit uhodnout, co hledáte. Každý vyhledávač používá svůj vlastní algoritmus k uspořádání stránek podle toho, co si myslí, že si přejete. Seřazovací algoritmus vyhledávače by mohl kontrolovat, zda se Váš vyhledávaný pojem zobrazuje v titulu stránky, mohl by kontrolovat, zda se všechna slova vyskytují poblíž sebe navzájem, nebo některý jiný výpočet, který by mu pomohl lépe určit, které stránky chcete a které nechcete vidět. Google vynalezl nejslavnější algoritmus pro výběr co nejpodstatnějších výsledků pro dané vyhledávání uvážením toho, kolik jiných webů odkazovalo na danou stránku. Myšlenkou je, že jestliže si mnoho webů myslí, že nějaký web je zajímavý, pak je to pravděpodobně ten, který hledáte. Tento algoritmus se nazývá „page rank“ ne snad proto, že by nějak řadil webové stránky, ale proto, že je pojmenován po svém vynálezci, jímž je Larry Page, jeden ze zakladatelů společnosti Google. Protože na Vašich návštěvách webové stránky web častokrát vydělává nějaké peníze, spammeři se neustále snaží najít si způsob, jak si s algoritmem vyhledávače zahrávat tak, aby jejich stránky bývaly na výsledcích umísťovány výše. Některé vyhledávače své algoritmy pravidelně aktualizují, aby se falešné nebo nedůvěryhodné weby nedostávaly na vrchol. Nakonec však bude záležet na Vás, abyste si dali pozor na nedůvěryhodné stránky tím, že se podíváte na webovou adresu a ověříte si, zda jde o důvěryhodný zdroj. Vyhledávací programy se stále vyvíjejí a zlepšují své algoritmy, aby přinášely lepší výsledky, rychlejší výsledky, než jejich konkurence. Dnešní vyhledávače dokonce ke zúžení Vašeho vyhledávání používají informace, které jste výslovně nezadali, Takže jestliže například vyhledáváte o parcích pro psy, mnoho vyhledávačů Vám zároveň podá výsledky o všech parcích pro psy v okolí, i když jste nezadali svou polohu. Moderní vyhledávače také chápou více než jen slova na stránce, protože chápou i co znamenají, aby našly to nejlepší, co odpovídá tomu, co hledáte. Jestliže například hledáte „fast pitcher“ (rychlého jamkaře), bude to vědět, že hledáte sportovce. Jestliže však budete hledat „large pitcher“ (velký hrnec), najde Vám to možnosti nákupu věcí do kuchyně. Aby byla slova lépe pochopena, používáme něco, čemu se říká strojové učení, a je to určitý typ umělé inteligence. Umožňuje to vyhledávacímu algoritmu vyhledávat nejen jednotlivá písmena nebo slova na stránce, ale také pochopit význam oněch slov. Internet se exponenciálně rozrůstá, ale jestliže týmy, které navrhují vyhledávače, budou dělat naši práci dobře, pak informace, které chcete, budou vždy jen několik úhozů do kláves od Vás.