-
Ahoj. Jmenuji se John.
-
Vedu týmy pro vyhledávání a strojové učení u Google.
-
Myslím, že je úžasně inspirující,
-
že lidé z celého světa
-
se obracejí na vyhledávací nástroje, aby se jich ptali na obyčejné otázky
-
i na neuvěřitelně důležité otázky.
-
Takže dávat jim nejlepší odpovědi, jaké
-
dovedeme, je obrovská zodpovědnost.
-
Ahoj. Jmenuji se Akshaya a pracuji v týmu pro vyhledávání u Bing.
-
Častokrát se stává, že se začínáme zabývat
-
umělou inteligencí a strojovým učením,
-
avšak musíme řešit také to, jak to budou využívat uživatelé,
-
protože konec konců, chceme ovlivnit společnost.
-
Položme si jednoduchou otázku.
-
Jak dlouho trvá cesta na Mars?
-
Odkud pocházejí tyto výsledky
-
a proč byl tento uveden před tímto?
-
Dobře, podívejme se, jak vyhledávač
-
přeměnil Váš požadavek na výsledek.
-
První věc, kterou musíte znát, je, že když provedete vyhledávání,
-
vyhledávač ve skutečnosti nenavštíví World Wide Web
-
a neuskuteční celé hledání v reálném čase.
-
Tak je tomu proto, že na internetu existuje více než
-
miliarda webů a každou minutu vznikají stovky dalších.
-
Takže kdyby vyhledávač musel projít
-
všechny weby, aby našel ten jeden, který chcete,
-
trvalo by to prostě do nekonečna.
-
Takže aby bylo Vaše vyhledávání rychlejší,
-
vyhledávače neustále prohlížejí celý web předem,
-
aby zaznamenaly informace, které mohou později pomoci při Vašem vyhledávání.
-
Takže když potom hledáte něco o cestě na Mars,
-
vyhledávač už bude mít, co potřebuje k tomu
-
aby Vám odpověděl v reálném čase.
-
Funguje to takto:
-
Internet je síť stránek navzájem propojených hypertextovými odkazy.
-
Vyhledávače mají neustále spuštěn program
-
zvaný Pavouk, který těmito weby prochází,
-
aby o nich shromáždil informace.
-
Pokaždé, když najde hypertextový odkaz,
-
následuje jej, dokud nenavštíví všechny stránky
-
které se mu podaří najít na celém internetu.
-
Pro každou stránku, kterou pavouk navštíví
-
zaznamená veškeré informace, které by mohl potřebovat při vyhledávání tak, že
-
je přidá do zvláštní databáze zvané vyhledávací index.
-
Teď přejděme k tomu vyhledávanému pojmu z minula
-
a zkusme, zda se nám podaří zjistit, jak vyhledávač
-
přišel s těmito výsledky.
-
Když se zeptáte, jak dlouho trvá cesta na Mars,
-
vyhledávač se podívá na každé z těchto slov
-
ve vyhledávacím indexu a okamžitě pořídí seznam
-
všech stránek na internetu, které tato slova obsahují.
-
Avšak poohlížet se pouze po těchto vyhledávaných pojmech
-
by přineslo miliony stránek,
-
takže vyhledávací stroj bude potřebovat umět určit
-
nejlepší shody, aby Vám je zobrazil jako první.
-
Právě tehdy to začíná být náročné, protože vyhledávač
-
se bude možná muset pokusit uhodnout, co hledáte.
-
Každý vyhledávač používá svůj vlastní algoritmus
-
k uspořádání stránek podle toho, co si myslí, že si přejete.
-
Seřazovací algoritmus vyhledávače by mohl kontrolovat,
-
zda se Váš vyhledávaný pojem zobrazuje v titulu stránky,
-
mohl by kontrolovat, zda se všechna slova vyskytují poblíž sebe navzájem,
-
nebo některý jiný výpočet, který
-
by mu pomohl lépe určit,
-
které stránky chcete a které nechcete vidět.
-
Google vynalezl nejslavnější algoritmus
-
pro výběr co nejpodstatnějších výsledků pro dané vyhledávání uvážením toho,
-
kolik jiných webů odkazovalo na danou stránku.
-
Myšlenkou je, že jestliže si mnoho webů myslí,
-
že nějaký web je zajímavý,
-
pak je to pravděpodobně ten, který hledáte.
-
Tento algoritmus se nazývá „page rank“
-
ne snad proto, že by nějak řadil webové stránky,
-
ale proto, že je pojmenován po svém vynálezci, jímž je Larry Page,
-
jeden ze zakladatelů společnosti Google.
-
Protože na Vašich návštěvách webové stránky web častokrát vydělá nějaké peníze,
-
spammeři se neustále snaží najít si způsob,
-
jak si s algoritmem vyhledávače zahrávat tak, aby jejich
-
stránky bývaly na výsledcích umísťovány výše.
-
Některé vyhledávače své algoritmy pravidelně aktualizují,
-
aby se falešné nebo nedůvěryhodné weby nedostávaly na vrchol.
-
Nakonec však bude záležet na Vás, abyste si dali pozor na
-
nedůvěryhodné stránky tím,
-
že se podíváte na webovou adresu a ověříte si, zda jde o důvěryhodný zdroj.
-
Vyhledávací programy se stále vyvíjejí
-
a zlepšují své algoritmy, aby přinášely lepší výsledky,
-
rychlejší výsledky, než jejich konkurence.
-
Dnešní vyhledávače dokonce ke zúžení Vašeho
-
vyhledávání používají informace, které jste výslovně nezadali,
-
Takže jestliže například vyhledáváte o parcích pro psy,
-
mnoho vyhledávačů Vám zároveň podá výsledky
-
o všech parcích pro psy v okolí,
-
i když jste nezadali svou polohu.
-
Moderní vyhledávače také chápou více
-
než jen slova na stránce,
-
protože chápou i co znamenají, aby našly to nejlepší,
-
co odpovídá tomu, co hledáte.
-
Jestliže například hledáte „fast pitcher“ (rychlého jamkaře),
-
bude to vědět, že hledáte sportovce.
-
Jestliže však budete hledat „large pitcher“ (velký hrnec),
-
najde Vám to možnosti nákupu věcí do kuchyně.
-
Aby byla slova lépe pochopena, používáme něco, čemu se říká strojové učení,
-
a je to určitý typ umělé inteligence.
-
Umožňuje to vyhledávacímu algoritmu vyhledávat
-
nejen jednotlivá písmena nebo slova na stránce,
-
ale také pochopit význam oněch slov.
-
Internet se exponenciálně rozrůstá,
-
ale jestliže týmy, které navrhují vyhledávače, budou dělat naši práci dobře,
-
pak informace, které chcete, budou vždy jen několik úhozů do kláves od Vás.
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-