-
Ahoj, volám sa John.
-
Vediem tímy vyhľadávania a strojového
učenia v Google.
-
Myslím, že je úžasne inšpirujúce,
-
že ľudia na celom svete
-
sa obracajú na vyhľadávače,
aby kládli triviálne otázky
-
a neuveriteľne dôležité otázky.
-
Je preto obrovskou zodpovednosťou
poskytnúť im
-
najlepšie možné odpovede.
-
Ahoj, volám sa Akshaya a pracujem v tíme
vyhľadávania Bing.
-
Mnohokrát sa zaoberáme
-
umelou inteligenciou
a strojovým učením,
-
musíme sa však zamerať na to,
ako ho používatelia používajú,
-
pretože na konci dňa chceme
ovplyvňovať našu spoločnosť.
-
Položme si jednoduchú otázku.
-
Ako dlho trvá cesta na Mars?
-
Odkiaľ pochádzajú tieto výsledky
-
a prečo jedno bolo uvedené
pred tým druhým?
-
Dobre, poďme do toho a uvidíme,
ako vyhľadávač
-
zmenil vašu požiadavku na výsledok.
-
Prvá vec, ktorú potrebujete vedieť
pri vyhľadávaní, je
-
že vyhľadávač v skutočnosti nechodí
na web, aby spustil
-
vyhľadávanie v reálnom čase.
-
Je to preto, že na internete existuje
viac ako
-
miliarda webových stránok a každú minútu
sa vytvorí stovky ďalších.
-
ak by vyhľadávač musel
prehľadávať všetky
-
jednotlivé stránky,
aby našiel tú, ktorú ste
-
hľadali, trvalo by to večnosť.
-
Na urýchlenie vyhľadávania
-
vyhľadávače budú neustále prehľadávať
web, aby zaznamenali
-
informácie, ktoré by vám
pomohli pri ďalšom vyhľadávaní.
-
Takto pri vyhľadávaní info o
ceste na Mars má
-
vyhľadávač všetko,
čo potrebuje, aby vám
-
mohol poskytnúť
odpoveď v reálnom čase.
-
Takto nejako to funguje.
-
Internet je sieť stránok,ktoré sú vzájomne
prepojené hypertextovými odkazmi.
-
Vo vyhľadávačoch je neustále
spustený program s
-
názvom Spider, ktorý prechádza
týmito webovými stránkami
-
a zhromažďuje o nich informácie.
-
Vždy keď nájde hypertextový odkaz,
-
sleduje ho, až kým nenavštívi
každú stránku,
-
ktorú nájde v celom internete.
-
Na každej stránke, ktorú Spider
-
navštívi, nahrá všetky informácie
potrebné pre vyhľadávanie, tak
-
že ich zahrnie do špeciálnej databázy
nazvanej index vyhľadávania.
-
Vráťme sa späť k
vyhľadávaniu vyššie
-
a uvidíme, či môžeme zistiť,
ako sa vyhľadávač
-
dopátral k výsledkom.
-
Keď sa spýtate, ako dlho
trvá cesta na Mars,
-
vyhľadávač vyhľadá
každé z týchto slov
-
v indexe vyhľadávania,
aby okamžite získal zoznam
-
všetkých stránok na internete,
ktoré tieto slová obsahujú.
-
Len hľadaním týchto výrazov vyhľadávania
-
by sa mohli vrátiť milióny stránok,
-
preto vyhľadávač musí
byť schopný určiť
-
najlepšie zhody, zobrazené ako prvé.
-
Tu je to zložitejšie, pretože vyhľadávač
-
bude možno musieť uhádnuť, čo hľadáte.
-
Každý vyhľadávač používa
svoj vlastný algoritmus
-
na hodnotenie stránok podľa toho,
čo si myslí, že chcete.
-
Algoritmus hodnotenia vyhľadávača
môže skontrolovať,
-
či sa hľadaný výraz
zobrazuje v názve stránky,
-
skontroluje, či sa všetky slová
zobrazujú vedľa seba,
-
alebo ľubovoľný počet ďalších výpočtov,
-
ktoré mu pomôžu lepšie určiť,
-
ktoré stránky budete/nebudete
chcieť vidieť.
-
Google vynašiel
najslávnejší algoritmus
-
na výber najrelevantnejších výsledkov
vyhľadávania, pričom zohľadnil, koľko
-
ďalších webových stránok je
s danou stránkou prepojených.
-
Ide o to, že ak si veľa webových
stránok myslí,
-
že je webová stránka zaujímavá,
-
pravdepodobne ide o stránku,
ktorú hľadáte.
-
Tento algoritmus sa nazýva page rank,
-
nie preto, že hodnotí weby,
-
preto, že je pomenovaný po
jeho tvorcovi, Larry Page,
-
jedným zo zakladateľov Google.
-
Pretože webová stránka pri
návštevách často zarába,
-
spammeri sa neustále
snažia nájsť spôsob,
-
ako vymyslieť vyhľadávací
algoritmus tak, aby ich stránky
-
boli vo výsledkoch uvedené vyššie.
-
Vyhľadávače pravidelne aktualizujú
svoje algoritmy,
-
aby zabránili falošným alebo
nedôveryhodným webom dostať sa na vrchol.
-
Nakoniec je to na vás, aby ste
si dali pozor na
-
tieto stránky, ktoré sú nedôveryhodné,
-
a pri ohľade na webovú adresu sa uistili,
že je to spoľahlivý zdroj.
-
Programy vyhľadávania sa stále
-
vyvíjajú, aby vylepšili algoritmy,
ktoré prinášajú lepšie
-
a rýchlejšie výsledky ako ich konkurenti
-
Dnešné vyhľadávače
používajú aj informácie,
-
ktoré ste výslovne neposkytli, aby
mohlo byť vyhľadávanie zúžené.
-
Napríklad, ak by ste hľadali
parky pre psov, veľa
-
vyhľadávačov by vám
poskytlo výsledky
-
pre všetky parky pre psov v okolí,
-
aj keď ste nezadali svoju polohu.
-
Moderné vyhľadávače
rozumejú viac
-
ako len slovám na stránke,
-
čo aj tomu, čo v skutočnosti znamenajú,
aby našli tú
-
najlepšiu zhodu s tým, čo hľadáte.
-
Napríklad, ak vyhľadávate
"rýchly nadhadzovač",
-
bude vedieť, že
hľadáte športovca.
-
Ale ak vyhľadávate veľký džbán,
-
nájde vám možnosti
pre vašu kuchyňu.
-
Aby sme lepšie porozumeli slovám,
používame niečo, čo sa nazýva strojové
-
učenie, druh umelej inteligencie.
-
Umožňuje algoritmom
vyhľadávania
-
vyhľadávať nielen jednotlivé
písmená/slová na
-
stránke, ale porozumieť
základnému významu slov.
-
Internet rastie exponenciálne,
-
ale ak tímy, ktoré navrhujú vyhľadávače,
vykonávajú naše zadania správne,
-
požadované informácie by mali byť
vždy dostupné len po pár klikoch.