WEBVTT 00:00:06.070 --> 00:00:07.120 Hej, jag heter John. 00:00:07.510 --> 00:00:10.140 Jag leder sök- och maskininlärningseamen på Google. 00:00:12.130 --> 00:00:14.230 Jag tycker det är otroligt inspirerande 00:00:14.230 --> 00:00:16.214 att människor över hela världen 00:00:16.215 --> 00:00:19.160 vänder sig till sökmotorer för att ställa triviala frågor 00:00:19.160 --> 00:00:20.930 och mycket viktiga frågor. 00:00:20.930 --> 00:00:23.450 Så det är ett enormt ansvar att ge dem 00:00:23.450 --> 00:00:24.864 de bästa svar vi kan. 00:00:26.710 --> 00:00:30.610 Hej, jag heter Akshaya och Jag arbetar på Bings sökteam. 00:00:30.910 --> 00:00:33.190 Vi börjar ofta att titta på 00:00:33.190 --> 00:00:35.800 konstgjord intelligens och maskininlärning, 00:00:35.830 --> 00:00:39.010 men vi måste ta itu med hur användare kommer att använda sig av det 00:00:39.140 --> 00:00:42.390 eftersom vi vill påverka samhället. 00:00:43.780 --> 00:00:45.400 Vi ställer en enkel fråga. 00:00:45.820 --> 00:00:48.070 Hur långt tar det att resa till Mars? 00:00:49.330 --> 00:00:50.950 Var kom resultaten ifrån 00:00:51.370 --> 00:00:54.100 och varför visas den här före den andra? 00:00:55.700 --> 00:00:58.150 Okej, vi kollar hur sökmotorn 00:00:58.150 --> 00:00:59.860 förvandlade begäran till resultat. 00:01:00.690 --> 00:01:03.360 Det första du behöver veta när du gör en sökning 00:01:03.430 --> 00:01:06.480 är att sökmotorn faktiskt inte går ut på webben 00:01:06.480 --> 00:01:08.010 för att söka i realtid. 00:01:08.140 --> 00:01:10.610 Det beror på att det finns över en miljard webbplatser 00:01:10.610 --> 00:01:14.140 på internet och hundratals fler skapas varje minut. 00:01:14.140 --> 00:01:16.210 Så om sökmotorn var tvungen att titta igenom 00:01:16.240 --> 00:01:18.690 varje enskild webbplats för att hitta den du vill ha, 00:01:18.690 --> 00:01:20.120 skulle ta ta för evigt. 00:01:20.500 --> 00:01:21.940 För att göra det snabbare 00:01:21.970 --> 00:01:24.940 skannar sökmotorer ständigt skanna nätet i förväg 00:01:25.420 --> 00:01:28.560 för att registrera information som kan sökas efter senare. 00:01:28.930 --> 00:01:31.270 Så om du söker på resor till Mars, 00:01:31.630 --> 00:01:33.700 har sökmotorn redan allt den behöver 00:01:33.700 --> 00:01:35.728 för att svara dig i realtid. 00:01:36.250 --> 00:01:37.540 Så här fungerar det. 00:01:37.900 --> 00:01:42.010 Internet är ett nät av sidor som är anslutna till varandra med hyperlänkar. 00:01:42.400 --> 00:01:44.680 Sökmotorer kör ett program hela tiden 00:01:44.680 --> 00:01:47.380 som heter en spindel som korsar dessa webbsidor 00:01:47.380 --> 00:01:49.040 för att samla in information. 00:01:49.780 --> 00:01:51.550 Varje gång den hittar en hyperlänk, 00:01:52.090 --> 00:01:55.000 följer den länken tills den har besökt varje sida 00:01:55.030 --> 00:01:57.240 den hittar på hela internet. 00:01:57.335 --> 00:01:59.170 För varje sida spindeln besöker 00:01:59.200 --> 00:02:02.320 registrerar den all information det kan behöva till en sökning 00:02:02.500 --> 00:02:05.650 genom att lägga till den i en särskild databas som heter sökindex. 00:02:07.166 --> 00:02:09.530 Nu ska vi gå tillbaka till vår tidigare sökning 00:02:09.580 --> 00:02:11.980 och se om vi kan räkna ut hur sökmotorn 00:02:11.990 --> 00:02:13.333 hittade resultaten. 00:02:13.640 --> 00:02:16.460 När du frågar hur lång tid det tar att resa till Mars, 00:02:16.640 --> 00:02:18.860 slår sökmotorn upp vart och ett av orden 00:02:18.920 --> 00:02:21.410 i sökindexet för att omedelbart få en lista 00:02:21.410 --> 00:02:24.500 över alla sidor på internet som innehåller dessa ord. 00:02:24.890 --> 00:02:26.870 Men dessa söktermer 00:02:26.870 --> 00:02:28.760 kan returnera miljontals sidor, 00:02:28.760 --> 00:02:31.110 så sökmotorn måste kunna avgöra 00:02:31.110 --> 00:02:33.120 de bästa träffarna att visa dig först. 00:02:33.340 --> 00:02:36.010 Det är här det blir knepigt eftersom sökmotorn 00:02:36.010 --> 00:02:38.040 kan behöva gissa vad du letar efter. 00:02:38.930 --> 00:02:41.360 Varje sökmotor använder sin egen algoritm 00:02:41.360 --> 00:02:44.230 för att rangordna sidorna baserat på vad den tror du vill se. 00:02:44.930 --> 00:02:47.660 Sökmotorns rangordningsalgoritm kan kontrollera 00:02:47.990 --> 00:02:50.360 om ditt sökord ingår i sidans titel, 00:02:50.900 --> 00:02:53.820 den kan kontrollera om alla ord dyker upp efter varandra, 00:02:54.520 --> 00:02:57.020 eller ett antal andra beräkningar 00:02:57.020 --> 00:02:58.610 som hjälper den att bättre avgöra 00:02:58.670 --> 00:03:01.420 vilka sidor du vill och inte vill se. 00:03:02.960 --> 00:03:04.960 Google uppfann den mest kända algoritmen 00:03:04.960 --> 00:03:08.530 för att avgöra de mest relevanta sökresultaten genom att ta hänsyn till 00:03:08.560 --> 00:03:11.230 hur många andra webbsidor har länkar till en given sida. 00:03:11.830 --> 00:03:14.140 Tanken är att om många webbplatser tror 00:03:14.140 --> 00:03:15.660 att en webbsida är intressant, 00:03:15.660 --> 00:03:17.940 är det förmodligen den du vill se. 00:03:18.190 --> 00:03:20.020 Denna algoritm kallas för sidrankning, 00:03:20.590 --> 00:03:22.330 inte för att den rankar webbsidor, 00:03:22.570 --> 00:03:25.210 utan att den döpts efter uppfinnaren, Larry Page, 00:03:25.480 --> 00:03:27.333 som är en av grundarna av Google. 00:03:27.940 --> 00:03:30.520 Eftersom webbplater ofta tjänar pengar för varje besök, 00:03:30.820 --> 00:03:32.950 försöker spammare ständigt hitta sätt 00:03:32.950 --> 00:03:35.741 dra nytta av sökalgoritmen så att vissa sidor 00:03:35.742 --> 00:03:37.931 visas högre upp i resultaten. 00:03:38.260 --> 00:03:40.750 Sökmotorer uppdaterar regelbundet sina algoritmer 00:03:40.750 --> 00:03:44.296 för att förhindra att falska eller opålitliga webbplatser når toppen. 00:03:44.680 --> 00:03:47.350 Men det är ändå upp till dig att hålla utkik på 00:03:47.500 --> 00:03:49.450 sidor som är opålitliga 00:03:49.690 --> 00:03:52.990 genom att titta på webbadressen och se till att den är en pålitlig källa. 00:03:53.680 --> 00:03:55.390 Sökprogram utvecklas hela tiden 00:03:55.420 --> 00:03:58.420 för att förbättra algoritmerna så att de ger bättre resultat, 00:03:58.540 --> 00:04:00.460 snabbare resultat än konkurrenterna. 00:04:01.000 --> 00:04:03.100 Dagens sökmotorer använda även information 00:04:03.100 --> 00:04:06.820 som du inte uttryckligen har angett för att hjälpa dig begränsa dina resultat. 00:04:07.150 --> 00:04:10.120 Om du t.ex. söker efter hundgårdar, 00:04:10.240 --> 00:04:12.190 skulle många sökmotorer visa resultat 00:04:12.190 --> 00:04:13.840 för alla hundgårdar i närheten, 00:04:14.080 --> 00:04:16.260 även om du inte gjorde angav din plats. 00:04:17.800 --> 00:04:20.530 Moderna sökmotorer förstår också mer 00:04:20.530 --> 00:04:22.060 än bara orden på en sida, 00:04:22.300 --> 00:04:24.970 vad de egentligen betyder, för att hitta den bästa 00:04:24.970 --> 00:04:26.750 träffen för det du letar efter. 00:04:27.130 --> 00:04:29.980 Om du till exempel söker för en snabb pitcher, 00:04:30.280 --> 00:04:32.300 kommer den att förstå att du letar efter en idrottare. 00:04:32.500 --> 00:04:34.450 Men om du söker efter en stor pitcher, 00:04:34.450 --> 00:04:36.730 kommer att hitta alternativ till köket. 00:04:38.420 --> 00:04:41.910 För att förstå orden bättre, använder vi så kallad maskininlärning, 00:04:41.910 --> 00:04:43.985 en typ av konstgjord intelligens. 00:04:43.985 --> 00:04:46.050 Det gör det möjligt för algoritmer att söka, 00:04:46.090 --> 00:04:48.400 inte bara på enskilda bokstäver eller ord på sidan, 00:04:48.400 --> 00:04:51.280 utan även förstå ordens underliggande betydelse. 00:04:53.690 --> 00:04:55.850 Internet växer exponentiellt, 00:04:56.210 --> 00:04:59.810 men om teamen som utformar sökmotorerna är bra på våra jobb, 00:05:00.080 --> 00:05:04.090 kommer den information du vill ha alltid vara bara några ord från dig