Ahoj, som John.
Vediem tímy vyhľadávania
a strojového učenia v Google.
Myslím, že je úžasne inšpirujúce,
že ľudia na celom svete
sa obracajú na vyhľadávače,
aby kládli triviálne otázky
aj neuveriteľne dôležité otázky.
Je preto obrovskou
zodpovednosťou poskytnúť im
najlepšie možné odpovede.
Ahoj, volám sa Akshaya a pracujem
v tíme Bing Search.
Mnohokrát sa zaoberáme
umelou inteligenciou
a strojovým učením,
musíme sa však zamerať na to,
ako ho používatelia používajú,
pretože chceme mať pozitívny
vplyv na našu spoločnosť.
Položme si jednoduchú otázku.
Ako dlho trvá cesta na Mars?
Odkiaľ pochádzajú tieto výsledky
a prečo jedno bolo uvedené
pred tým druhým?
Dobre, poďme do toho
a uvidíme, ako vyhľadávač
spraví z vašej požiadavky výsledok.
Prvá vec, ktorú potrebujete
vedieť pri vyhľadávaní, je,
že vyhľadávač v skutočnosti
nechodí na web, aby vykonal
vyhľadávanie v reálnom čase.
Je to preto, že na internete
existuje viac ako
miliarda webových stránok a každú
minútu pribudnú stovky ďalších.
Ak by vyhľadávač musel
prehľadávať všetky
jednotlivé stránky,
aby našiel tú, ktorú hľadáte,
trvalo by to večnosť.
Na urýchlenie vyhľadávania
vyhľadávače neustále prehľadávajú
web, aby vopred zaznamenali
informácie, ktoré by vám
pomohli pri ďalšom vyhľadávaní.
Pri vyhľadávaní informácií
o ceste na Mars má teda
vyhľadávač všetko,
čo potrebuje, aby vám
mohol poskytnúť
odpoveď v reálnom čase.
Takto nejak to funguje.
Internet je sieť stránok, ktoré sú
prepojené hypertextovými odkazmi.
Vo vyhľadávačoch je neustále
spustený program
s názvom Spider, ktorý prehľadáva
tieto webové stránky
a zhromažďuje o nich informácie.
Vždy keď nájde hypertextový odkaz,
sleduje ho, až kým nenavštívi
každú stránku,
ktorú nájde, na celom internete.
Na každej stránke,
ktorú Spider navštívi,
zaznamená všetky
informácie potrebné na vyhľadávanie tak,
že ich pridá do špeciálnej
databázy nazvanej index vyhľadávania.
Vráťme sa späť
k vyhľadávaniu vyššie
a uvidíme, či môžeme zistiť,
ako sa vyhľadávač
dopátral k výsledkom.
Keď sa spýtate, ako dlho
trvá cesta na Mars,
vyhľadávač vyhľadá
každé z týchto slov
v indexe vyhľadávania,
aby okamžite získal zoznam
všetkých stránok na internete,
ktoré tieto slová obsahujú.
Len hľadaním týchto výrazov vyhľadávania
by sa mohli vrátiť milióny stránok,
preto vyhľadávač musí
byť schopný určiť
najlepšie zhody,
ktoré sa zobrazia prvé.
Tu je to zložitejšie, pretože vyhľadávač
bude možno musieť uhádnuť, čo hľadáte.
Každý vyhľadávač používa
svoj vlastný algoritmus
na hodnotenie stránok podľa toho,
čo si myslí, že chcete.
Algoritmus hodnotenia vyhľadávača
môže skontrolovať,
či sa hľadaný výraz
zobrazuje v názve stránky,
skontroluje, či sa všetky slová
zobrazujú vedľa seba,
alebo ľubovoľný počet ďalších výpočtov,
ktoré mu pomôžu lepšie určiť,
ktoré stránky budete či nebudete
chcieť vidieť.
Google vynašiel
najslávnejší algoritmus
na výber najrelevantnejších výsledkov
vyhľadávania, pričom zohľadnil, koľko
ďalších webových stránok je
s danou stránkou prepojených.
Ide o to, že ak si veľa webových
stránok myslí,
že je webová stránka zaujímavá,
pravdepodobne ide o stránku,
ktorú hľadáte.
Tento algoritmus má názov page rank,
ale nie preto, že hodnotí weby,
ale preto, že je ho vytvoril
Larry Page,
jeden zo zakladateľov Google.
Pretože webová stránka
pri návštevách často zarába,
spammeri sa neustále
snažia nájsť spôsob,
ako vymyslieť vyhľadávací
algoritmus tak, aby ich stránky
boli vo výsledkoch uvedené vyššie.
Vyhľadávače pravidelne aktualizujú
svoje algoritmy,
aby zabránili falošným alebo
nedôveryhodným webom dostať sa na vrchol.
Nakoniec je to na vás, aby ste
si dali pozor na tieto
stránky, ktoré sú nedôveryhodné,
a pri ohľade na webovú adresu sa uistili,
že je to spoľahlivý zdroj.
Programy vyhľadávania sa stále
vyvíjajú, aby vylepšili algoritmy,
ktoré prinášajú lepšie
a rýchlejšie výsledky ako ich konkurenti
Dnešné vyhľadávače
používajú aj informácie,
ktoré ste výslovne neposkytli,
na spresnenie vyhľadávania.
Napríklad, ak by ste hľadali
parky pre psov, veľa
vyhľadávačov by vám
poskytlo výsledky
pre všetky parky pre psov v okolí,
aj keď ste nezadali svoju polohu.
Moderné vyhľadávače
rozumejú viac
ako len slovám na stránke,
ale aj tomu, čo v skutočnosti
znamenajú, aby našli tú
najlepšiu zhodu s tým, čo hľadáte.
Napríklad, ak vyhľadávate
„rýchly nadhadzovač“,
bude vedieť, že
hľadáte športovca.
Ale ak vyhľadávate veľký džbán,
nájde vám možnosti
pre vašu kuchyňu.
Aby sme lepšie porozumeli slovám,
používame niečo, čo sa nazýva strojové
učenie, druh umelej inteligencie.
Umožňuje algoritmom
vyhľadávania
vyhľadávať nielen jednotlivé
písmená či slová
na stránke, ale porozumieť
základnému významu slov.
Internet rastie exponenciálne,
ale ak tímy, ktoré navrhujú vyhľadávače,
vykonávajú naše zadania správne,
požadované informácie by mali byť
vždy dostupné len po pár kliknutiach.