1 00:00:06,070 --> 00:00:07,120 Hej, jag heter John. 2 00:00:07,510 --> 00:00:10,140 Jag leder sök- och maskininlärningseamen på Google. 3 00:00:12,130 --> 00:00:14,230 Jag tycker det är otroligt inspirerande 4 00:00:14,230 --> 00:00:16,214 att människor över hela världen 5 00:00:16,215 --> 00:00:19,160 vänder sig till sökmotorer för att ställa triviala frågor 6 00:00:19,160 --> 00:00:20,930 och mycket viktiga frågor. 7 00:00:20,930 --> 00:00:23,450 Så det är ett enormt ansvar att ge dem 8 00:00:23,450 --> 00:00:24,864 de bästa svar vi kan. 9 00:00:26,710 --> 00:00:30,610 Hej, jag heter Akshaya och Jag arbetar på Bings sökteam. 10 00:00:30,910 --> 00:00:33,190 Vi börjar ofta att titta på 11 00:00:33,190 --> 00:00:35,800 konstgjord intelligens och maskininlärning, 12 00:00:35,830 --> 00:00:39,010 men vi måste ta itu med hur användare kommer att använda sig av det 13 00:00:39,140 --> 00:00:42,390 eftersom vi vill påverka samhället. 14 00:00:43,780 --> 00:00:45,400 Vi ställer en enkel fråga. 15 00:00:45,820 --> 00:00:48,070 Hur långt tar det att resa till Mars? 16 00:00:49,330 --> 00:00:50,950 Var kom resultaten ifrån 17 00:00:51,370 --> 00:00:54,100 och varför visas den här före den andra? 18 00:00:55,700 --> 00:00:58,150 Okej, vi kollar hur sökmotorn 19 00:00:58,150 --> 00:00:59,860 förvandlade begäran till resultat. 20 00:01:00,690 --> 00:01:03,360 Det första du behöver veta när du gör en sökning 21 00:01:03,430 --> 00:01:06,480 är att sökmotorn faktiskt inte går ut på webben 22 00:01:06,480 --> 00:01:08,010 för att söka i realtid. 23 00:01:08,140 --> 00:01:10,610 Det beror på att det finns över en miljard webbplatser 24 00:01:10,610 --> 00:01:14,140 på internet och hundratals fler skapas varje minut. 25 00:01:14,140 --> 00:01:16,210 Så om sökmotorn var tvungen att titta igenom 26 00:01:16,240 --> 00:01:18,690 varje enskild webbplats för att hitta den du vill ha, 27 00:01:18,690 --> 00:01:20,120 skulle ta ta för evigt. 28 00:01:20,500 --> 00:01:21,940 För att göra det snabbare 29 00:01:21,970 --> 00:01:24,940 skannar sökmotorer ständigt skanna nätet i förväg 30 00:01:25,420 --> 00:01:28,560 för att registrera information som kan sökas efter senare. 31 00:01:28,930 --> 00:01:31,270 Så om du söker på resor till Mars, 32 00:01:31,630 --> 00:01:33,700 har sökmotorn redan allt den behöver 33 00:01:33,700 --> 00:01:35,728 för att svara dig i realtid. 34 00:01:36,250 --> 00:01:37,540 Så här fungerar det. 35 00:01:37,900 --> 00:01:42,010 Internet är ett nät av sidor som är anslutna till varandra med hyperlänkar. 36 00:01:42,400 --> 00:01:44,680 Sökmotorer kör ett program hela tiden 37 00:01:44,680 --> 00:01:47,380 som heter en spindel som korsar dessa webbsidor 38 00:01:47,380 --> 00:01:49,040 för att samla in information. 39 00:01:49,780 --> 00:01:51,550 Varje gång den hittar en hyperlänk, 40 00:01:52,090 --> 00:01:55,000 följer den länken tills den har besökt varje sida 41 00:01:55,030 --> 00:01:57,240 den hittar på hela internet. 42 00:01:57,335 --> 00:01:59,170 För varje sida spindeln besöker 43 00:01:59,200 --> 00:02:02,320 registrerar den all information det kan behöva till en sökning 44 00:02:02,500 --> 00:02:05,650 genom att lägga till den i en särskild databas som heter sökindex. 45 00:02:07,166 --> 00:02:09,530 Nu ska vi gå tillbaka till vår tidigare sökning 46 00:02:09,580 --> 00:02:11,980 och se om vi kan räkna ut hur sökmotorn 47 00:02:11,990 --> 00:02:13,333 hittade resultaten. 48 00:02:13,640 --> 00:02:16,460 När du frågar hur lång tid det tar att resa till Mars, 49 00:02:16,640 --> 00:02:18,860 slår sökmotorn upp vart och ett av orden 50 00:02:18,920 --> 00:02:21,410 i sökindexet för att omedelbart få en lista 51 00:02:21,410 --> 00:02:24,500 över alla sidor på internet som innehåller dessa ord. 52 00:02:24,890 --> 00:02:26,870 Men dessa söktermer 53 00:02:26,870 --> 00:02:28,760 kan returnera miljontals sidor, 54 00:02:28,760 --> 00:02:31,110 så sökmotorn måste kunna avgöra 55 00:02:31,110 --> 00:02:33,120 de bästa träffarna att visa dig först. 56 00:02:33,340 --> 00:02:36,010 Det är här det blir knepigt eftersom sökmotorn 57 00:02:36,010 --> 00:02:38,040 kan behöva gissa vad du letar efter. 58 00:02:38,930 --> 00:02:41,360 Varje sökmotor använder sin egen algoritm 59 00:02:41,360 --> 00:02:44,230 för att rangordna sidorna baserat på vad den tror du vill se. 60 00:02:44,930 --> 00:02:47,660 Sökmotorns rangordningsalgoritm kan kontrollera 61 00:02:47,990 --> 00:02:50,360 om ditt sökord ingår i sidans titel, 62 00:02:50,900 --> 00:02:53,820 den kan kontrollera om alla ord dyker upp efter varandra, 63 00:02:54,520 --> 00:02:57,020 eller ett antal andra beräkningar 64 00:02:57,020 --> 00:02:58,610 som hjälper den att bättre avgöra 65 00:02:58,670 --> 00:03:01,420 vilka sidor du vill och inte vill se. 66 00:03:02,960 --> 00:03:04,960 Google uppfann den mest kända algoritmen 67 00:03:04,960 --> 00:03:08,530 för att avgöra de mest relevanta sökresultaten genom att ta hänsyn till 68 00:03:08,560 --> 00:03:11,230 hur många andra webbsidor har länkar till en given sida. 69 00:03:11,830 --> 00:03:14,140 Tanken är att om många webbplatser tror 70 00:03:14,140 --> 00:03:15,660 att en webbsida är intressant, 71 00:03:15,660 --> 00:03:17,940 är det förmodligen den du vill se. 72 00:03:18,190 --> 00:03:20,020 Denna algoritm kallas för sidrankning, 73 00:03:20,590 --> 00:03:22,330 inte för att den rankar webbsidor, 74 00:03:22,570 --> 00:03:25,210 utan att den döpts efter uppfinnaren, Larry Page, 75 00:03:25,480 --> 00:03:27,333 som är en av grundarna av Google. 76 00:03:27,940 --> 00:03:30,520 Eftersom webbplater ofta tjänar pengar för varje besök, 77 00:03:30,820 --> 00:03:32,950 försöker spammare ständigt hitta sätt 78 00:03:32,950 --> 00:03:35,741 dra nytta av sökalgoritmen så att vissa sidor 79 00:03:35,742 --> 00:03:37,931 visas högre upp i resultaten. 80 00:03:38,260 --> 00:03:40,750 Sökmotorer uppdaterar regelbundet sina algoritmer 81 00:03:40,750 --> 00:03:44,296 för att förhindra att falska eller opålitliga webbplatser når toppen. 82 00:03:44,680 --> 00:03:47,350 Men det är ändå upp till dig att hålla utkik på 83 00:03:47,500 --> 00:03:49,450 sidor som är opålitliga 84 00:03:49,690 --> 00:03:52,990 genom att titta på webbadressen och se till att den är en pålitlig källa. 85 00:03:53,680 --> 00:03:55,390 Sökprogram utvecklas hela tiden 86 00:03:55,420 --> 00:03:58,420 för att förbättra algoritmerna så att de ger bättre resultat, 87 00:03:58,540 --> 00:04:00,460 snabbare resultat än konkurrenterna. 88 00:04:01,000 --> 00:04:03,100 Dagens sökmotorer använda även information 89 00:04:03,100 --> 00:04:06,820 som du inte uttryckligen har angett för att hjälpa dig begränsa dina resultat. 90 00:04:07,150 --> 00:04:10,120 Om du t.ex. söker efter hundgårdar, 91 00:04:10,240 --> 00:04:12,190 skulle många sökmotorer visa resultat 92 00:04:12,190 --> 00:04:13,840 för alla hundgårdar i närheten, 93 00:04:14,080 --> 00:04:16,260 även om du inte gjorde angav din plats. 94 00:04:17,800 --> 00:04:20,530 Moderna sökmotorer förstår också mer 95 00:04:20,530 --> 00:04:22,060 än bara orden på en sida, 96 00:04:22,300 --> 00:04:24,970 vad de egentligen betyder, för att hitta den bästa 97 00:04:24,970 --> 00:04:26,750 träffen för det du letar efter. 98 00:04:27,130 --> 00:04:29,980 Om du till exempel söker för en snabb pitcher, 99 00:04:30,280 --> 00:04:32,300 kommer den att förstå att du letar efter en idrottare. 100 00:04:32,500 --> 00:04:34,450 Men om du söker efter en stor pitcher, 101 00:04:34,450 --> 00:04:36,730 kommer att hitta alternativ till köket. 102 00:04:38,420 --> 00:04:41,910 För att förstå orden bättre, använder vi så kallad maskininlärning, 103 00:04:41,910 --> 00:04:43,985 en typ av konstgjord intelligens. 104 00:04:43,985 --> 00:04:46,050 Det gör det möjligt för algoritmer att söka, 105 00:04:46,090 --> 00:04:48,400 inte bara på enskilda bokstäver eller ord på sidan, 106 00:04:48,400 --> 00:04:51,280 utan även förstå ordens underliggande betydelse. 107 00:04:53,690 --> 00:04:55,850 Internet växer exponentiellt, 108 00:04:56,210 --> 00:04:59,810 men om teamen som utformar sökmotorerna är bra på våra jobb, 109 00:05:00,080 --> 00:05:04,090 kommer den information du vill ha alltid vara bara några ord från dig