-
Hei, nimeni on John.
-
Johdan hakua ja koneen
oppimistiimejä Googlella.
-
Minusta on hyvin inspiroivaa,
-
että ihmiset ympäri maailmaa
-
käyttävät hakukoneita kysyäkseen
-
erilaisia kysymyksiä.
-
Parhaan mahdollisen vastauksen
-
antaminen on suuri vastuu.
-
Olen Akshaya ja teen töitä Bingin
hakutiimissä.
-
Aloitamme tekoälyn ja koneopin
tutkimuksen useita kertoja,
-
mutta meidän on pohdittava,
miten käyttäjät aikovat käyttää niitä,
-
koska haluamme päivän päätteeksi
vaikuttaa yhteiskuntaan.
-
Kysytään yksinkertainen kysymys.
-
Kuinka kauan matka Marsiin kestää?
-
Mistä nämä vastaukset tulivat
-
ja miksi tämä on listattu ennen
muita vastauksia?
-
Okei, sukelletaan hakukoneiden
sisälle ja katsotaan miten ne
-
kääntävät hakusi tuloksiksi.
-
Ensimmäinen asia mikä sinun tulee
tietää on, että kun etsit jotain
-
hakukone ei mene joka kerta
Maailman Laajuiseen Verkkoon
-
haun työstämiseksi reaaliajassa.
-
Tämä on sen takia, koska internetissä
on olemassa yli mirjardi nettisivua
-
ja satoja uusia luodaan
joka minuutti.
-
Joten jos hakukoneen tulisi
selata jokaisen sivun läpi
-
löytääkseen haluamasi,
-
siinä kestäisi ikuisuus.
-
Tehdäkseen hakusi nopeammaksi
-
hakukoneet skannaavat internettiä
jatkuvasti
-
auttaakseen sinua tulevissa hauissasi.
-
Tällä tavoin, kun etsit tietoa
Marssista,
-
hakukonella on jo haluamasi tieto
saatavilla
-
reaaliajassa.
-
Se toimii näin.
-
Internet on sivujen verkko, jotka
liittyvät toisiinsa hyperlinkkien avulla.
-
hakukoneet suorittavat jatkuvasti ohjelmistoa
-
nimeltä Spider, mikä kulkee nettisivuilla
-
keräten tietoa.
-
Joka kerta kun Spider löytää hyperlinkin,
-
ase seuraa linkkiä kunnes se on vieraillut
-
kaikissa internetin sivustoissa.
-
Spider tallettaa mahdollisesti myöhemmin
tarvitsemaansa hakutietoa
-
jokaiselle vierailemalleen sivustolle
-
lisäämällä sen tietokantaan
nimeltä hakuhakemisto.
-
Palataan takaisin aiempaan hakuun
-
ja katsotaan, jos ymmärrämme
-
miten hakukone löysi vastauken.
-
Kun kysyt kuinka kauan matka Marsiin kestää,
-
hakukone katsoo niistä
jokaiseen hakusanaan
-
hakuhakemistossa saadakseen listan
-
kaikista sivuista, joissa kyseisiä
sanoja käytetään.
-
Mutta vain tarkastelemalla näitä
vastauksia,
-
voimme saada vastaukseksi
miljoonia sivuja,
-
joten hakukoneen tulee osata
määrittää
-
hakuusi parhaiten sopivat vastaukset ensin.
-
Tämä on hankalaa, koska hakukoneen
-
saattaa täytyä arvata mitä etsit.
-
Jokainen hakukone käyttää omia
algoritmejaan
-
sivujen järjestämiseksi tavalla,
minkä se uskoo olevan sinulle paras.
-
Hakukoneiden sijoitusalgoritmi saattaa
tarkistaa,
-
näkyykö hakutermi sivun otsikossa,
-
jos kaikki sanat löytyvät antamassasi
järjestyksessä,
-
tai muilla mielestään oikeilla tavoilla
-
mitkä auttavat sitä määrittämään
-
mitä sivuja haluat nähdä.
-
Google loi kuuluisimman algoritmin
-
oleellisimman vastauksen valitsemiseen,
-
ottamalla huomioon kuinka monta
nettisivua
-
on linkitetty jokaiselle sivulle.
-
Ajatuksena on, että jos useat
nettisivut ajattelevat sivun
-
olevan mielenkiintoinen,
-
sen täytyy olla etsimäsi sivu.
-
Tätä algoritmiä kutsutaan nimellä
"page rank" ei sen takia,
-
että se luokittelee nettisivuja,
-
vaan koska se nimettiin
keksijänsä, Larry Pagen mukaan,
-
joka on yksi Googlen perustajista.
-
Koska nettisivut tekevät usein rahaa
kun vierailet niissä,
-
roskapostittajat yrittävät jatkuvasti
löytää tavan hakualgoritmien
-
huijaamiseksi, jotta heidän sivunsa
luokiteltaisi paremmiksi.
-
Hakukoneet päivittävät algoritmejaan
usein huijaussuvujen estämiseksi.
-
Viime kädessä on sinun
vastuullasi olla valppaana
-
näiden epäluotettavien sivujen
huomaamisessa tarkastamalla
-
nettisivun osoite ja varmistamalla,
että se on luotettavasta lähteestä.
-
Hakuohjelmat kehittyvät jatkuvasti
algoritmien ja vastausten
-
parantamiseksi sekä nopeuttamiseksi
kilpailijoitaan paremmaksi.
-
Tämän päivän hakukoneet
käyttävät informaatiota,
-
jota et ole niille välttämättä edes
antanut hakusi supistamiseksi.
-
Esimerkiksi, jos hakusananasi
oli "koirapuisto",
-
monet hakukoneet antavat
sinulle tiedot kaikista sinua
-
lähimpänä olevista koirapuistoista
vaikka et kirjoittaisi olinpaikkaasi.
-
Modernit hakukoneet ymmärtävät
enemmän, kun vain nettisivulle
-
kirjoitettuja sanoja. Mutta mitä ne
tekevät parhaiden hakutulosten
-
löytämiseksi?
-
Jos hakusanasi on "kurkku"
-
hakukone tietää automaattisesti,
että etsit vihannesta.
-
Mutta jos etsit sanalla "kipeä kurkku",
se löytää sinulle jotain muuta.
-
Sanoje ymmärtämiseksi paremmin,
käytämme koneoppimista,
-
mikä on tietynlainen tekoäly.
-
Tämän avulla hakualgoritmit
eivät vain etsi yksittäisiä kirjaimia
-
tai sanoja, vaan ne ymmärtävät
sanojen taustalla olevan merkityksen.
-
Internet kasvaa räjähdysmäisesti,
mutta jos hakukoneita suunnittelevat
-
tiimit tekevät hakumme oikein,
haluamiesi tietojen tulisi aina olla
-
vain muutaman painalluksen päässä.