0:00:06.070,0:00:07.510 Hei, nimeni on John. 0:00:07.510,0:00:10.520 Johdan hakua ja koneen[br]oppimistiimejä Googlella. 0:00:12.130,0:00:14.230 Minusta on hyvin inspiroivaa, 0:00:14.230,0:00:16.214 että ihmiset ympäri maailmaa 0:00:16.215,0:00:19.160 käyttävät hakukoneita kysyäkseen 0:00:19.160,0:00:20.930 erilaisia kysymyksiä. 0:00:20.930,0:00:23.450 Parhaan mahdollisen vastauksen 0:00:23.450,0:00:25.054 antaminen on suuri vastuu. 0:00:26.710,0:00:30.910 Olen Akshaya ja teen töitä Bingin[br]hakutiimissä. 0:00:30.910,0:00:36.020 Aloitamme tekoälyn ja koneopin [br]tutkimuksen useita kertoja, 0:00:36.020,0:00:39.680 mutta meidän on pohdittava,[br]miten käyttäjät aikovat käyttää niitä, 0:00:39.680,0:00:42.560 koska haluamme päivän päätteeksi [br]vaikuttaa yhteiskuntaan. 0:00:43.780,0:00:45.820 Kysytään yksinkertainen kysymys. 0:00:45.820,0:00:48.646 Kuinka kauan matka Marsiin kestää? 0:00:49.330,0:00:51.370 Mistä nämä vastaukset tulivat 0:00:51.370,0:00:54.100 ja miksi tämä on listattu ennen[br]muita vastauksia? 0:00:55.700,0:00:58.520 Okei, sukelletaan hakukoneiden[br]sisälle ja katsotaan miten ne 0:00:58.520,0:01:00.640 kääntävät hakusi tuloksiksi. 0:01:00.690,0:01:03.430 Ensimmäinen asia mikä sinun tulee[br]tietää on, että kun etsit jotain 0:01:03.430,0:01:06.480 hakukone ei mene joka kerta[br]Maailman Laajuiseen Verkkoon 0:01:06.480,0:01:08.010 haun työstämiseksi reaaliajassa. 0:01:08.140,0:01:11.360 Tämä on sen takia, koska internetissä[br]on olemassa yli mirjardi nettisivua 0:01:11.360,0:01:14.140 ja satoja uusia luodaan[br]joka minuutti. 0:01:14.140,0:01:17.240 Joten jos hakukoneen tulisi[br]selata jokaisen sivun läpi 0:01:17.240,0:01:18.690 löytääkseen haluamasi, 0:01:18.690,0:01:20.120 siinä kestäisi ikuisuus. 0:01:20.500,0:01:22.460 Tehdäkseen hakusi nopeammaksi 0:01:22.460,0:01:25.420 hakukoneet skannaavat internettiä[br]jatkuvasti 0:01:25.420,0:01:28.560 auttaakseen sinua tulevissa hauissasi. 0:01:28.930,0:01:31.630 Tällä tavoin, kun etsit tietoa[br]Marssista, 0:01:31.630,0:01:33.700 hakukonella on jo haluamasi tieto[br]saatavilla 0:01:33.700,0:01:35.728 reaaliajassa. 0:01:36.250,0:01:37.540 Se toimii näin. 0:01:37.900,0:01:42.400 Internet on sivujen verkko, jotka [br]liittyvät toisiinsa hyperlinkkien avulla. 0:01:42.400,0:01:44.680 hakukoneet suorittavat jatkuvasti ohjelmistoa 0:01:44.680,0:01:47.380 nimeltä Spider, mikä kulkee nettisivuilla 0:01:47.380,0:01:49.040 keräten tietoa. 0:01:49.780,0:01:51.550 Joka kerta kun Spider löytää hyperlinkin, 0:01:52.090,0:01:55.030 ase seuraa linkkiä kunnes se on vieraillut 0:01:55.030,0:01:57.240 kaikissa internetin sivustoissa. 0:01:57.240,0:02:00.770 Spider tallettaa mahdollisesti myöhemmin[br]tarvitsemaansa hakutietoa 0:02:00.770,0:02:02.500 jokaiselle vierailemalleen sivustolle 0:02:02.500,0:02:06.089 lisäämällä sen tietokantaan[br]nimeltä hakuhakemisto. 0:02:07.166,0:02:09.590 Palataan takaisin aiempaan hakuun 0:02:09.590,0:02:11.280 ja katsotaan, jos ymmärrämme 0:02:11.280,0:02:13.333 miten hakukone löysi vastauken. 0:02:13.640,0:02:16.640 Kun kysyt kuinka kauan matka Marsiin kestää, 0:02:16.640,0:02:18.920 hakukone katsoo niistä[br]jokaiseen hakusanaan 0:02:18.920,0:02:21.410 hakuhakemistossa saadakseen listan 0:02:21.410,0:02:24.500 kaikista sivuista, joissa kyseisiä[br]sanoja käytetään. 0:02:24.890,0:02:26.870 Mutta vain tarkastelemalla näitä[br]vastauksia, 0:02:26.870,0:02:28.760 voimme saada vastaukseksi [br]miljoonia sivuja, 0:02:28.760,0:02:31.110 joten hakukoneen tulee osata[br]määrittää 0:02:31.110,0:02:33.340 hakuusi parhaiten sopivat vastaukset ensin. 0:02:33.340,0:02:36.010 Tämä on hankalaa, koska hakukoneen 0:02:36.010,0:02:38.040 saattaa täytyä arvata mitä etsit. 0:02:38.930,0:02:41.360 Jokainen hakukone käyttää omia[br]algoritmejaan 0:02:41.360,0:02:44.930 sivujen järjestämiseksi tavalla, [br]minkä se uskoo olevan sinulle paras. 0:02:44.930,0:02:47.990 Hakukoneiden sijoitusalgoritmi saattaa [br]tarkistaa, 0:02:47.990,0:02:50.900 näkyykö hakutermi sivun otsikossa, 0:02:50.900,0:02:53.820 jos kaikki sanat löytyvät antamassasi [br]järjestyksessä, 0:02:54.290,0:02:57.020 tai muilla mielestään oikeilla tavoilla 0:02:57.020,0:02:58.930 mitkä auttavat sitä määrittämään 0:02:58.930,0:03:01.420 mitä sivuja haluat nähdä. 0:03:02.960,0:03:04.960 Google loi kuuluisimman algoritmin 0:03:04.960,0:03:07.490 oleellisimman vastauksen valitsemiseen, 0:03:07.490,0:03:10.030 ottamalla huomioon kuinka monta [br]nettisivua 0:03:10.030,0:03:11.910 on linkitetty jokaiselle sivulle. 0:03:11.910,0:03:14.880 Ajatuksena on, että jos useat [br]nettisivut ajattelevat sivun 0:03:14.880,0:03:16.250 olevan mielenkiintoinen, 0:03:16.250,0:03:18.240 sen täytyy olla etsimäsi sivu. 0:03:18.240,0:03:20.520 Tätä algoritmiä kutsutaan nimellä[br]"page rank" ei sen takia, 0:03:20.520,0:03:22.700 että se luokittelee nettisivuja, 0:03:22.700,0:03:25.403 vaan koska se nimettiin[br]keksijänsä, Larry Pagen mukaan, 0:03:25.403,0:03:27.983 joka on yksi Googlen perustajista. 0:03:27.983,0:03:30.996 Koska nettisivut tekevät usein rahaa[br]kun vierailet niissä, 0:03:30.996,0:03:34.404 roskapostittajat yrittävät jatkuvasti[br]löytää tavan hakualgoritmien 0:03:34.404,0:03:38.123 huijaamiseksi, jotta heidän sivunsa[br]luokiteltaisi paremmiksi. 0:03:38.123,0:03:44.136 Hakukoneet päivittävät algoritmejaan [br]usein huijaussuvujen estämiseksi. 0:03:44.489,0:03:47.549 Viime kädessä on sinun [br]vastuullasi olla valppaana 0:03:47.549,0:03:50.509 näiden epäluotettavien sivujen[br]huomaamisessa tarkastamalla 0:03:50.509,0:03:53.599 nettisivun osoite ja varmistamalla, [br]että se on luotettavasta lähteestä. 0:03:53.599,0:03:57.249 Hakuohjelmat kehittyvät jatkuvasti[br]algoritmien ja vastausten 0:03:57.249,0:04:00.779 parantamiseksi sekä nopeuttamiseksi[br]kilpailijoitaan paremmaksi. 0:04:00.779,0:04:03.142 Tämän päivän hakukoneet[br]käyttävät informaatiota, 0:04:03.142,0:04:07.089 jota et ole niille välttämättä edes [br]antanut hakusi supistamiseksi. 0:04:07.089,0:04:10.661 Esimerkiksi, jos hakusananasi[br]oli "koirapuisto", 0:04:10.661,0:04:13.840 monet hakukoneet antavat[br]sinulle tiedot kaikista sinua 0:04:13.840,0:04:17.370 lähimpänä olevista koirapuistoista[br]vaikka et kirjoittaisi olinpaikkaasi. 0:04:17.680,0:04:21.120 Modernit hakukoneet ymmärtävät [br]enemmän, kun vain nettisivulle 0:04:21.120,0:04:25.480 kirjoitettuja sanoja. Mutta mitä ne[br]tekevät parhaiden hakutulosten 0:04:25.480,0:04:27.010 löytämiseksi? 0:04:27.010,0:04:30.273 Jos hakusanasi on "kurkku" 0:04:30.273,0:04:33.223 hakukone tietää automaattisesti,[br]että etsit vihannesta. 0:04:33.223,0:04:37.310 Mutta jos etsit sanalla "kipeä kurkku",[br]se löytää sinulle jotain muuta. 0:04:38.520,0:04:41.475 Sanoje ymmärtämiseksi paremmin, [br]käytämme koneoppimista, 0:04:41.475,0:04:43.750 mikä on tietynlainen tekoäly. 0:04:43.750,0:04:47.260 Tämän avulla hakualgoritmit[br]eivät vain etsi yksittäisiä kirjaimia 0:04:47.260,0:04:51.750 tai sanoja, vaan ne ymmärtävät[br]sanojen taustalla olevan merkityksen. 0:04:53.750,0:04:57.520 Internet kasvaa räjähdysmäisesti, [br]mutta jos hakukoneita suunnittelevat 0:04:57.520,0:05:02.470 tiimit tekevät hakumme oikein, [br]haluamiesi tietojen tulisi aina olla 0:05:02.470,0:05:05.540 vain muutaman painalluksen päässä.