Ahoj. Jmenuji se John.

Vedu týmy pro vyhledávání
a strojové učení u Google.

Myslím, že je úžasně inspirující,

že lidé z celého světa

se obracejí na vyhledávací nástroje,
aby se jich ptali na obyčejné otázky

i na neuvěřitelně důležité otázky.

Takže dávat jim nejlepší
odpovědi, jaké dovedeme dát,

je obrovská zodpovědnost.

Ahoj. Jmenuji se Akshaya a pracuji
v týmu pro vyhledávání u Bing.

Častokrát se stává, že se
začínáme zabývat

umělou inteligencí a
strojovým učením,

avšak musíme řešit také to, jak
to budou využívat uživatelé,

protože konec konců,
chceme ovlivnit společnost.

Položme jednoduchou otázku.

Jak dlouho trvá cesta na Mars?

Odkud pocházejí tyto výsledky

a proč byl tento uveden
před tímto?

Dobře, podívejme se,
jak vyhledávač

přeměnil Váš požadavek na výsledek.

První věc, kterou musíte znát,
je, že když provedete vyhledávání,

vyhledávač ve skutečnosti
nenavštíví World Wide Web

a neuskuteční celé hledání v reálném čase.

Tak je tomu proto, že na
internetu existuje více než

miliarda webů a každou
minutu vznikají stovky dalších.

Takže kdyby vyhledávač
musel projít

všechny weby, aby našel
ten jeden, který chcete,

trvalo by to prostě do nekonečna.

Takže aby bylo Vaše vyhledávání rychlejší,

vyhledávače neustále prohlížejí
celý web předem,

aby zaznamenaly informace, které mohou
později pomoci při Vašem vyhledávání.

Takže když potom hledáte
něco o cestě na Mars,

vyhledávač už bude mít,
co potřebuje k tomu

aby Vám odpověděl v reálném čase.

Funguje to takto:

Internet je síť stránek navzájem
propojených hypertextovými odkazy.

Vyhledávače mají neustále
spuštěn program

zvaný Pavouk, který
těmito weby prochází,

aby o nich shromáždil informace.

Pokaždé, když najde hypertextový odkaz,

následuje jej, dokud
nenavštíví všechny stránky

které se mu podaří najít
na celém internetu.

Pro každou stránku, kterou pavouk navštíví

zaznamená veškeré informace, které
by mohl potřebovat při vyhledávání tak, že

je přidá do zvláštní databáze
zvané vyhledávací index.

Teď přejděme k tomu
vyhledávanému pojmu z minula

a zkusme, zda se nám
podaří zjistit, jak vyhledávač

přišel s těmito výsledky.

Když se zeptáte, jak
dlouho trvá cesta na Mars,

vyhledávač se podívá
na každé z těchto slov

ve vyhledávacím indexu a
okamžitě pořídí seznam

všech stránek na internetu,
které tato slova obsahují.

Avšak poohlížet se pouze po
těchto vyhledávaných pojmech

by přineslo miliony stránek,

takže vyhledávací stroj
bude potřebovat umět určit

nejlepší shody, aby Vám
je zobrazil jako první.

Právě tehdy to začíná být
náročné, protože vyhledávač

se bude možná muset pokusit
uhodnout, co hledáte.

Každý vyhledávač používá
svůj vlastní algoritmus

k uspořádání stránek podle toho,
co si myslí, že si přejete.

Seřazovací algoritmus vyhledávače
by mohl kontrolovat,

zda se Váš vyhledávaný pojem
zobrazuje v titulu stránky,

mohl by kontrolovat, zda se všechna
slova vyskytují poblíž sebe navzájem,

nebo některý jiný výpočet, který

by mu pomohl lépe určit,

které stránky chcete a které
nechcete vidět.

Google vynalezl nejslavnější
algoritmus

pro výběr co nejpodstatnějších výsledků
pro dané vyhledávání uvážením toho,

kolik jiných webů odkazovalo
na danou stránku.

Myšlenkou je, že jestliže
si mnoho webů myslí,

že nějaký web je zajímavý,

pak je to pravděpodobně
ten, který hledáte.

Tento algoritmus se nazývá „page rank“

ne snad proto, že by nějak řadil webové stránky,

ale proto, že je pojmenován po svém
vynálezci, jímž je Larry Page,

jeden ze zakladatelů společnosti Google.

Protože na Vašich návštěvách webové stránky
web častokrát vydělává nějaké peníze,

spammeři se neustále
snaží najít si způsob,

jak si s algoritmem vyhledávače
zahrávat tak, aby jejich

stránky bývaly na výsledcích
umísťovány výše.

Některé vyhledávače své
algoritmy pravidelně aktualizují,

aby se falešné nebo nedůvěryhodné
weby nedostávaly na vrchol.

Nakonec však bude záležet na Vás,
abyste si dali pozor na

nedůvěryhodné stránky tím,

že se podíváte na webovou adresu a
ověříte si, zda jde o důvěryhodný zdroj.

Vyhledávací programy se stále vyvíjejí

a zlepšují své algoritmy,
aby přinášely lepší výsledky,

rychlejší výsledky, než
jejich konkurence.

Dnešní vyhledávače dokonce
ke zúžení Vašeho

vyhledávání používají informace,
které jste výslovně nezadali,

Takže jestliže například
vyhledáváte o parcích pro psy,

mnoho vyhledávačů Vám
zároveň podá výsledky

o všech parcích pro psy v okolí,

i když jste nezadali
svou polohu.

Moderní vyhledávače
také chápou více

než jen slova na stránce,

protože chápou i co znamenají,
aby našly to nejlepší,

co odpovídá tomu, co hledáte.

Jestliže například hledáte
„fast pitcher“ (rychlého jamkaře),

bude to vědět,
že hledáte sportovce.

Jestliže však budete hledat
„large pitcher“ (velký hrnec),

najde Vám to možnosti
nákupu věcí do kuchyně.

Aby byla slova lépe pochopena,
používáme něco, čemu se říká strojové učení,

a je to určitý typ umělé inteligence.

Umožňuje to vyhledávacímu
algoritmu vyhledávat

nejen jednotlivá písmena
nebo slova na stránce,

ale také pochopit význam
oněch slov.

Internet se exponenciálně rozrůstá,

ale jestliže týmy, které navrhují vyhledávače,
budou dělat naši práci dobře,

pak informace, které chcete, budou
vždy jen několik úhozů do kláves od Vás.