Hei, nimeni on John. Johdan hakua ja koneen oppimistiimejä Googlella. Minusta on hyvin inspiroivaa, että ihmiset ympäri maailmaa käyttävät hakukoneita kysyäkseen erilaisia kysymyksiä. Parhaan mahdollisen vastauksen antaminen on suuri vastuu. Olen Akshaya ja teen töitä Bingin hakutiimissä. Aloitamme tekoälyn ja koneopin tutkimuksen useita kertoja, mutta meidän on pohdittava, miten käyttäjät aikovat käyttää niitä, koska haluamme päivän päätteeksi vaikuttaa yhteiskuntaan. Kysytään yksinkertainen kysymys. Kuinka kauan matka Marsiin kestää? Mistä nämä vastaukset tulivat ja miksi tämä on listattu ennen muita vastauksia? Okei, sukelletaan hakukoneiden sisälle ja katsotaan miten ne kääntävät hakusi tuloksiksi. Ensimmäinen asia mikä sinun tulee tietää on, että kun etsit jotain hakukone ei mene joka kerta Maailman Laajuiseen Verkkoon haun työstämiseksi reaaliajassa. Tämä on sen takia, koska internetissä on olemassa yli mirjardi nettisivua ja satoja uusia luodaan joka minuutti. Joten jos hakukoneen tulisi selata jokaisen sivun läpi löytääkseen haluamasi, siinä kestäisi ikuisuus. Tehdäkseen hakusi nopeammaksi hakukoneet skannaavat internettiä jatkuvasti auttaakseen sinua tulevissa hauissasi. Tällä tavoin, kun etsit tietoa Marssista, hakukonella on jo haluamasi tieto saatavilla reaaliajassa. Se toimii näin. Internet on sivujen verkko, jotka liittyvät toisiinsa hyperlinkkien avulla. hakukoneet suorittavat jatkuvasti ohjelmistoa nimeltä Spider, mikä kulkee nettisivuilla keräten tietoa. Joka kerta kun Spider löytää hyperlinkin, ase seuraa linkkiä kunnes se on vieraillut kaikissa internetin sivustoissa. Spider tallettaa mahdollisesti myöhemmin tarvitsemaansa hakutietoa jokaiselle vierailemalleen sivustolle lisäämällä sen tietokantaan nimeltä hakuhakemisto. Palataan takaisin aiempaan hakuun ja katsotaan, jos ymmärrämme miten hakukone löysi vastauken. Kun kysyt kuinka kauan matka Marsiin kestää, hakukone katsoo niistä jokaiseen hakusanaan hakuhakemistossa saadakseen listan kaikista sivuista, joissa kyseisiä sanoja käytetään. Mutta vain tarkastelemalla näitä vastauksia, voimme saada vastaukseksi miljoonia sivuja, joten hakukoneen tulee osata määrittää hakuusi parhaiten sopivat vastaukset ensin. Tämä on hankalaa, koska hakukoneen saattaa täytyä arvata mitä etsit. Jokainen hakukone käyttää omia algoritmejaan sivujen järjestämiseksi tavalla, minkä se uskoo olevan sinulle paras. Hakukoneiden sijoitusalgoritmi saattaa tarkistaa, näkyykö hakutermi sivun otsikossa, jos kaikki sanat löytyvät antamassasi järjestyksessä, tai muilla mielestään oikeilla tavoilla mitkä auttavat sitä määrittämään mitä sivuja haluat nähdä. Google loi kuuluisimman algoritmin oleellisimman vastauksen valitsemiseen, ottamalla huomioon kuinka monta nettisivua on linkitetty jokaiselle sivulle. Ajatuksena on, että jos useat nettisivut ajattelevat sivun olevan mielenkiintoinen, sen täytyy olla etsimäsi sivu. Tätä algoritmiä kutsutaan nimellä "page rank" ei sen takia, että se luokittelee nettisivuja, vaan koska se nimettiin keksijänsä, Larry Pagen mukaan, joka on yksi Googlen perustajista. Koska nettisivut tekevät usein rahaa kun vierailet niissä, roskapostittajat yrittävät jatkuvasti löytää tavan hakualgoritmien huijaamiseksi, jotta heidän sivunsa luokiteltaisi paremmiksi. Hakukoneet päivittävät algoritmejaan usein huijaussuvujen estämiseksi. Viime kädessä on sinun vastuullasi olla valppaana näiden epäluotettavien sivujen huomaamisessa tarkastamalla nettisivun osoite ja varmistamalla, että se on luotettavasta lähteestä. Hakuohjelmat kehittyvät jatkuvasti algoritmien ja vastausten parantamiseksi sekä nopeuttamiseksi kilpailijoitaan paremmaksi. Tämän päivän hakukoneet käyttävät informaatiota, jota et ole niille välttämättä edes antanut hakusi supistamiseksi. Esimerkiksi, jos hakusananasi oli "koirapuisto", monet hakukoneet antavat sinulle tiedot kaikista sinua lähimpänä olevista koirapuistoista vaikka et kirjoittaisi olinpaikkaasi. Modernit hakukoneet ymmärtävät enemmän, kun vain nettisivulle kirjoitettuja sanoja. Mutta mitä ne tekevät parhaiden hakutulosten löytämiseksi? Jos hakusanasi on "kurkku" hakukone tietää automaattisesti, että etsit vihannesta. Mutta jos etsit sanalla "kipeä kurkku", se löytää sinulle jotain muuta. Sanoje ymmärtämiseksi paremmin, käytämme koneoppimista, mikä on tietynlainen tekoäly. Tämän avulla hakualgoritmit eivät vain etsi yksittäisiä kirjaimia tai sanoja, vaan ne ymmärtävät sanojen taustalla olevan merkityksen. Internet kasvaa räjähdysmäisesti, mutta jos hakukoneita suunnittelevat tiimit tekevät hakumme oikein, haluamiesi tietojen tulisi aina olla vain muutaman painalluksen päässä.