Ahoj. Jmenuji se John.
Vedu týmy pro vyhledávání
a strojové učení u Google.
Myslím, že je úžasně inspirující,
že lidé z celého světa
se obracejí na vyhledávací nástroje,
aby se jich ptali na obyčejné otázky
i na neuvěřitelně důležité otázky.
Takže dávat jim nejlepší
odpovědi, jaké dovedeme dát,
je obrovská zodpovědnost.
Ahoj. Jmenuji se Akshaya a pracuji
v týmu pro vyhledávání u Bing.
Častokrát se stává, že se
začínáme zabývat
umělou inteligencí a
strojovým učením,
avšak musíme řešit také to, jak
to budou využívat uživatelé,
protože konec konců,
chceme ovlivnit společnost.
Položme jednoduchou otázku.
Jak dlouho trvá cesta na Mars?
Odkud pocházejí tyto výsledky
a proč byl tento uveden
před tímto?
Dobře, podívejme se,
jak vyhledávač
přeměnil Váš požadavek na výsledek.
První věc, kterou musíte znát,
je, že když provedete vyhledávání,
vyhledávač ve skutečnosti
nenavštíví World Wide Web
a neuskuteční celé hledání v reálném čase.
Tak je tomu proto, že na
internetu existuje více než
miliarda webů a každou
minutu vznikají stovky dalších.
Takže kdyby vyhledávač
musel projít
všechny weby, aby našel
ten jeden, který chcete,
trvalo by to prostě do nekonečna.
Takže aby bylo Vaše vyhledávání rychlejší,
vyhledávače neustále prohlížejí
celý web předem,
aby zaznamenaly informace, které mohou
později pomoci při Vašem vyhledávání.
Takže když potom hledáte
něco o cestě na Mars,
vyhledávač už bude mít,
co potřebuje k tomu
aby Vám odpověděl v reálném čase.
Funguje to takto:
Internet je síť stránek navzájem
propojených hypertextovými odkazy.
Vyhledávače mají neustále
spuštěn program
zvaný Pavouk, který
těmito weby prochází,
aby o nich shromáždil informace.
Pokaždé, když najde hypertextový odkaz,
následuje jej, dokud
nenavštíví všechny stránky
které se mu podaří najít
na celém internetu.
Pro každou stránku, kterou pavouk navštíví
zaznamená veškeré informace, které
by mohl potřebovat při vyhledávání tak, že
je přidá do zvláštní databáze
zvané vyhledávací index.
Teď přejděme k tomu
vyhledávanému pojmu z minula
a zkusme, zda se nám
podaří zjistit, jak vyhledávač
přišel s těmito výsledky.
Když se zeptáte, jak
dlouho trvá cesta na Mars,
vyhledávač se podívá
na každé z těchto slov
ve vyhledávacím indexu a
okamžitě pořídí seznam
všech stránek na internetu,
které tato slova obsahují.
Avšak poohlížet se pouze po
těchto vyhledávaných pojmech
by přineslo miliony stránek,
takže vyhledávací stroj
bude potřebovat umět určit
nejlepší shody, aby Vám
je zobrazil jako první.
Právě tehdy to začíná být
náročné, protože vyhledávač
se bude možná muset pokusit
uhodnout, co hledáte.
Každý vyhledávač používá
svůj vlastní algoritmus
k uspořádání stránek podle toho,
co si myslí, že si přejete.
Seřazovací algoritmus vyhledávače
by mohl kontrolovat,
zda se Váš vyhledávaný pojem
zobrazuje v titulu stránky,
mohl by kontrolovat, zda se všechna
slova vyskytují poblíž sebe navzájem,
nebo některý jiný výpočet, který
by mu pomohl lépe určit,
které stránky chcete a které
nechcete vidět.
Google vynalezl nejslavnější
algoritmus
pro výběr co nejpodstatnějších výsledků
pro dané vyhledávání uvážením toho,
kolik jiných webů odkazovalo
na danou stránku.
Myšlenkou je, že jestliže
si mnoho webů myslí,
že nějaký web je zajímavý,
pak je to pravděpodobně
ten, který hledáte.
Tento algoritmus se nazývá „page rank“
ne snad proto, že by nějak řadil webové stránky,
ale proto, že je pojmenován po svém
vynálezci, jímž je Larry Page,
jeden ze zakladatelů společnosti Google.
Protože na Vašich návštěvách webové stránky
web častokrát vydělává nějaké peníze,
spammeři se neustále
snaží najít si způsob,
jak si s algoritmem vyhledávače
zahrávat tak, aby jejich
stránky bývaly na výsledcích
umísťovány výše.
Některé vyhledávače své
algoritmy pravidelně aktualizují,
aby se falešné nebo nedůvěryhodné
weby nedostávaly na vrchol.
Nakonec však bude záležet na Vás,
abyste si dali pozor na
nedůvěryhodné stránky tím,
že se podíváte na webovou adresu a
ověříte si, zda jde o důvěryhodný zdroj.
Vyhledávací programy se stále vyvíjejí
a zlepšují své algoritmy,
aby přinášely lepší výsledky,
rychlejší výsledky, než
jejich konkurence.
Dnešní vyhledávače dokonce
ke zúžení Vašeho
vyhledávání používají informace,
které jste výslovně nezadali,
Takže jestliže například
vyhledáváte o parcích pro psy,
mnoho vyhledávačů Vám
zároveň podá výsledky
o všech parcích pro psy v okolí,
i když jste nezadali
svou polohu.
Moderní vyhledávače
také chápou více
než jen slova na stránce,
protože chápou i co znamenají,
aby našly to nejlepší,
co odpovídá tomu, co hledáte.
Jestliže například hledáte
„fast pitcher“ (rychlého jamkaře),
bude to vědět,
že hledáte sportovce.
Jestliže však budete hledat
„large pitcher“ (velký hrnec),
najde Vám to možnosti
nákupu věcí do kuchyně.
Aby byla slova lépe pochopena,
používáme něco, čemu se říká strojové učení,
a je to určitý typ umělé inteligence.
Umožňuje to vyhledávacímu
algoritmu vyhledávat
nejen jednotlivá písmena
nebo slova na stránce,
ale také pochopit význam
oněch slov.
Internet se exponenciálně rozrůstá,
ale jestliže týmy, které navrhují vyhledávače,
budou dělat naši práci dobře,
pak informace, které chcete, budou
vždy jen několik úhozů do kláves od Vás.