-
Ahoj. Jmenuji se John.
-
Vedu týmy pro vyhledávání
a strojové učení u Google.
-
Myslím, že je úžasně inspirující,
-
že lidé z celého světa
-
se obracejí na vyhledávací nástroje,
aby se jich ptali na obyčejné otázky
-
i na neuvěřitelně důležité otázky.
-
Takže dávat jim nejlepší
odpovědi, jaké dovedeme dát,
-
je obrovská zodpovědnost.
-
Ahoj. Jmenuji se Akshaya a pracuji
v týmu pro vyhledávání u Bing.
-
Častokrát se stává, že se
začínáme zabývat
-
umělou inteligencí a
strojovým učením,
-
avšak musíme řešit také to, jak
to budou využívat uživatelé,
-
protože konec konců,
chceme ovlivnit společnost.
-
Položme jednoduchou otázku.
-
Jak dlouho trvá cesta na Mars?
-
Odkud pocházejí tyto výsledky
-
a proč byl tento uveden
před tímto?
-
Dobře, podívejme se,
jak vyhledávač
-
přeměnil Váš požadavek na výsledek.
-
První věc, kterou musíte znát,
je, že když provedete vyhledávání,
-
vyhledávač ve skutečnosti
nenavštíví World Wide Web
-
a neuskuteční celé hledání v reálném čase.
-
Tak je tomu proto, že na
internetu existuje více než
-
miliarda webů a každou
minutu vznikají stovky dalších.
-
Takže kdyby vyhledávač
musel projít
-
všechny weby, aby našel
ten jeden, který chcete,
-
trvalo by to prostě do nekonečna.
-
Takže aby bylo Vaše vyhledávání rychlejší,
-
vyhledávače neustále prohlížejí
celý web předem,
-
aby zaznamenaly informace, které mohou
později pomoci při Vašem vyhledávání.
-
Takže když potom hledáte
něco o cestě na Mars,
-
vyhledávač už bude mít,
co potřebuje k tomu
-
aby Vám odpověděl v reálném čase.
-
Funguje to takto:
-
Internet je síť stránek navzájem
propojených hypertextovými odkazy.
-
Vyhledávače mají neustále
spuštěn program
-
zvaný Pavouk, který
těmito weby prochází,
-
aby o nich shromáždil informace.
-
Pokaždé, když najde hypertextový odkaz,
-
následuje jej, dokud
nenavštíví všechny stránky
-
které se mu podaří najít
na celém internetu.
-
Pro každou stránku, kterou pavouk navštíví
-
zaznamená veškeré informace, které
by mohl potřebovat při vyhledávání tak, že
-
je přidá do zvláštní databáze
zvané vyhledávací index.
-
Teď přejděme k tomu
vyhledávanému pojmu z minula
-
a zkusme, zda se nám
podaří zjistit, jak vyhledávač
-
přišel s těmito výsledky.
-
Když se zeptáte, jak
dlouho trvá cesta na Mars,
-
vyhledávač se podívá
na každé z těchto slov
-
ve vyhledávacím indexu a
okamžitě pořídí seznam
-
všech stránek na internetu,
které tato slova obsahují.
-
Avšak poohlížet se pouze po
těchto vyhledávaných pojmech
-
by přineslo miliony stránek,
-
takže vyhledávací stroj
bude potřebovat umět určit
-
nejlepší shody, aby Vám
je zobrazil jako první.
-
Právě tehdy to začíná být
náročné, protože vyhledávač
-
se bude možná muset pokusit
uhodnout, co hledáte.
-
Každý vyhledávač používá
svůj vlastní algoritmus
-
k uspořádání stránek podle toho,
co si myslí, že si přejete.
-
Seřazovací algoritmus vyhledávače
by mohl kontrolovat,
-
zda se Váš vyhledávaný pojem
zobrazuje v titulu stránky,
-
mohl by kontrolovat, zda se všechna
slova vyskytují poblíž sebe navzájem,
-
nebo některý jiný výpočet, který
-
by mu pomohl lépe určit,
-
které stránky chcete a které
nechcete vidět.
-
Google vynalezl nejslavnější
algoritmus
-
pro výběr co nejpodstatnějších výsledků
pro dané vyhledávání uvážením toho,
-
kolik jiných webů odkazovalo
na danou stránku.
-
Myšlenkou je, že jestliže
si mnoho webů myslí,
-
že nějaký web je zajímavý,
-
pak je to pravděpodobně
ten, který hledáte.
-
Tento algoritmus se nazývá „page rank“
-
ne snad proto, že by nějak řadil webové stránky,
-
ale proto, že je pojmenován po svém
vynálezci, jímž je Larry Page,
-
jeden ze zakladatelů společnosti Google.
-
Protože na Vašich návštěvách webové stránky
web častokrát vydělává nějaké peníze,
-
spammeři se neustále
snaží najít si způsob,
-
jak si s algoritmem vyhledávače
zahrávat tak, aby jejich
-
stránky bývaly na výsledcích
umísťovány výše.
-
Některé vyhledávače své
algoritmy pravidelně aktualizují,
-
aby se falešné nebo nedůvěryhodné
weby nedostávaly na vrchol.
-
Nakonec však bude záležet na Vás,
abyste si dali pozor na
-
nedůvěryhodné stránky tím,
-
že se podíváte na webovou adresu a
ověříte si, zda jde o důvěryhodný zdroj.
-
Vyhledávací programy se stále vyvíjejí
-
a zlepšují své algoritmy,
aby přinášely lepší výsledky,
-
rychlejší výsledky, než
jejich konkurence.
-
Dnešní vyhledávače dokonce
ke zúžení Vašeho
-
vyhledávání používají informace,
které jste výslovně nezadali,
-
Takže jestliže například
vyhledáváte o parcích pro psy,
-
mnoho vyhledávačů Vám
zároveň podá výsledky
-
o všech parcích pro psy v okolí,
-
i když jste nezadali
svou polohu.
-
Moderní vyhledávače
také chápou více
-
než jen slova na stránce,
-
protože chápou i co znamenají,
aby našly to nejlepší,
-
co odpovídá tomu, co hledáte.
-
Jestliže například hledáte
„fast pitcher“ (rychlého jamkaře),
-
bude to vědět,
že hledáte sportovce.
-
Jestliže však budete hledat
„large pitcher“ (velký hrnec),
-
najde Vám to možnosti
nákupu věcí do kuchyně.
-
Aby byla slova lépe pochopena,
používáme něco, čemu se říká strojové učení,
-
a je to určitý typ umělé inteligence.
-
Umožňuje to vyhledávacímu
algoritmu vyhledávat
-
nejen jednotlivá písmena
nebo slova na stránce,
-
ale také pochopit význam
oněch slov.
-
Internet se exponenciálně rozrůstá,
-
ale jestliže týmy, které navrhují vyhledávače,
budou dělat naši práci dobře,
-
pak informace, které chcete, budou
vždy jen několik úhozů do kláves od Vás.