Hei, nimeni on John.
Johdan hakua ja koneen
oppimistiimejä Googlella.
Minusta on hyvin inspiroivaa,
että ihmiset ympäri maailmaa
käyttävät hakukoneita kysyäkseen
erilaisia kysymyksiä.
Parhaan mahdollisen vastauksen
antaminen on suuri vastuu.
Olen Akshaya ja teen töitä Bingin
hakutiimissä.
Aloitamme tekoälyn ja koneopin
tutkimuksen useita kertoja,
mutta meidän on pohdittava,
miten käyttäjät aikovat käyttää niitä,
koska haluamme päivän päätteeksi
vaikuttaa yhteiskuntaan.
Kysytään yksinkertainen kysymys.
Kuinka kauan matka Marsiin kestää?
Mistä nämä vastaukset tulivat
ja miksi tämä on listattu ennen
muita vastauksia?
Okei, sukelletaan hakukoneiden
sisälle ja katsotaan miten ne
kääntävät hakusi tuloksiksi.
Ensimmäinen asia mikä sinun tulee
tietää on, että kun etsit jotain
hakukone ei mene joka kerta
Maailman Laajuiseen Verkkoon
haun työstämiseksi reaaliajassa.
Tämä on sen takia, koska internetissä
on olemassa yli mirjardi nettisivua
ja satoja uusia luodaan
joka minuutti.
Joten jos hakukoneen tulisi
selata jokaisen sivun läpi
löytääkseen haluamasi,
siinä kestäisi ikuisuus.
Tehdäkseen hakusi nopeammaksi
hakukoneet skannaavat internettiä
jatkuvasti
auttaakseen sinua tulevissa hauissasi.
Tällä tavoin, kun etsit tietoa
Marssista,
hakukonella on jo haluamasi tieto
saatavilla
reaaliajassa.
Se toimii näin.
Internet on sivujen verkko, jotka
liittyvät toisiinsa hyperlinkkien avulla.
hakukoneet suorittavat jatkuvasti ohjelmistoa
nimeltä Spider, mikä kulkee nettisivuilla
keräten tietoa.
Joka kerta kun Spider löytää hyperlinkin,
ase seuraa linkkiä kunnes se on vieraillut
kaikissa internetin sivustoissa.
Spider tallettaa mahdollisesti myöhemmin
tarvitsemaansa hakutietoa
jokaiselle vierailemalleen sivustolle
lisäämällä sen tietokantaan
nimeltä hakuhakemisto.
Palataan takaisin aiempaan hakuun
ja katsotaan, jos ymmärrämme
miten hakukone löysi vastauken.
Kun kysyt kuinka kauan matka Marsiin kestää,
hakukone katsoo niistä
jokaiseen hakusanaan
hakuhakemistossa saadakseen listan
kaikista sivuista, joissa kyseisiä
sanoja käytetään.
Mutta vain tarkastelemalla näitä
vastauksia,
voimme saada vastaukseksi
miljoonia sivuja,
joten hakukoneen tulee osata
määrittää
hakuusi parhaiten sopivat vastaukset ensin.
Tämä on hankalaa, koska hakukoneen
saattaa täytyä arvata mitä etsit.
Jokainen hakukone käyttää omia
algoritmejaan
sivujen järjestämiseksi tavalla,
minkä se uskoo olevan sinulle paras.
Hakukoneiden sijoitusalgoritmi saattaa
tarkistaa,
näkyykö hakutermi sivun otsikossa,
jos kaikki sanat löytyvät antamassasi
järjestyksessä,
tai muilla mielestään oikeilla tavoilla
mitkä auttavat sitä määrittämään
mitä sivuja haluat nähdä.
Google loi kuuluisimman algoritmin
oleellisimman vastauksen valitsemiseen,
ottamalla huomioon kuinka monta
nettisivua
on linkitetty jokaiselle sivulle.
Ajatuksena on, että jos useat
nettisivut ajattelevat sivun
olevan mielenkiintoinen,
sen täytyy olla etsimäsi sivu.
Tätä algoritmiä kutsutaan nimellä
"page rank" ei sen takia,
että se luokittelee nettisivuja,
vaan koska se nimettiin
keksijänsä, Larry Pagen mukaan,
joka on yksi Googlen perustajista.
Koska nettisivut tekevät usein rahaa
kun vierailet niissä,
roskapostittajat yrittävät jatkuvasti
löytää tavan hakualgoritmien
huijaamiseksi, jotta heidän sivunsa
luokiteltaisi paremmiksi.
Hakukoneet päivittävät algoritmejaan
usein huijaussuvujen estämiseksi.
Viime kädessä on sinun
vastuullasi olla valppaana
näiden epäluotettavien sivujen
huomaamisessa tarkastamalla
nettisivun osoite ja varmistamalla,
että se on luotettavasta lähteestä.
Hakuohjelmat kehittyvät jatkuvasti
algoritmien ja vastausten
parantamiseksi sekä nopeuttamiseksi
kilpailijoitaan paremmaksi.
Tämän päivän hakukoneet
käyttävät informaatiota,
jota et ole niille välttämättä edes
antanut hakusi supistamiseksi.
Esimerkiksi, jos hakusananasi
oli "koirapuisto",
monet hakukoneet antavat
sinulle tiedot kaikista sinua
lähimpänä olevista koirapuistoista
vaikka et kirjoittaisi olinpaikkaasi.
Modernit hakukoneet ymmärtävät
enemmän, kun vain nettisivulle
kirjoitettuja sanoja. Mutta mitä ne
tekevät parhaiden hakutulosten
löytämiseksi?
Jos hakusanasi on "kurkku"
hakukone tietää automaattisesti,
että etsit vihannesta.
Mutta jos etsit sanalla "kipeä kurkku",
se löytää sinulle jotain muuta.
Sanoje ymmärtämiseksi paremmin,
käytämme koneoppimista,
mikä on tietynlainen tekoäly.
Tämän avulla hakualgoritmit
eivät vain etsi yksittäisiä kirjaimia
tai sanoja, vaan ne ymmärtävät
sanojen taustalla olevan merkityksen.
Internet kasvaa räjähdysmäisesti,
mutta jos hakukoneita suunnittelevat
tiimit tekevät hakumme oikein,
haluamiesi tietojen tulisi aina olla
vain muutaman painalluksen päässä.