1 00:00:06,070 --> 00:00:07,120 Hej! Mit navn er John. 2 00:00:07,510 --> 00:00:10,490 Jeg er chef for søgnings- og maskinlæringsholdene hos Google. 3 00:00:12,130 --> 00:00:14,230 Jeg synes, at det er utroligt inspirerende 4 00:00:14,230 --> 00:00:16,214 at folk fra hele verden 5 00:00:16,215 --> 00:00:19,160 bruger søgemaskiner til at spørge banale spørgsmål 6 00:00:19,160 --> 00:00:20,930 og utroligt vigtige spørgsmål. 7 00:00:20,930 --> 00:00:23,450 Så det er et stort ansvar at give dem 8 00:00:23,450 --> 00:00:24,864 de bedste svar, vi kan. 9 00:00:26,710 --> 00:00:30,610 Hej, mit navn er Akshaya og jeg arbejder på Bing-søgningsholdet. 10 00:00:30,910 --> 00:00:33,190 Der er mange gange, hvor vi begynder at se 11 00:00:33,190 --> 00:00:35,800 på kunstig intelligens og maskinlæring, 12 00:00:35,800 --> 00:00:39,390 men bliver nødt til at tage hensyn til, hvordan brugerne vil bruge dette, 13 00:00:39,390 --> 00:00:42,570 for når det kommer til stykket, ønsker vi at være samfundsnyttige. 14 00:00:43,780 --> 00:00:45,400 Lad os spørge et enkelt spørgsmål. 15 00:00:45,820 --> 00:00:48,070 Hvor lang tid tager det at rejse til Mars? 16 00:00:49,330 --> 00:00:50,950 Hvor kom disse resultater fra, 17 00:00:51,370 --> 00:00:54,100 og hvorfor blev denne vist før den anden? 18 00:00:55,700 --> 00:00:57,520 Ok, lad os tage et nærmere kig på, 19 00:00:57,520 --> 00:01:00,690 hvordan søgemaskinen omdannede din forespørgelse til et resultat. 20 00:01:00,690 --> 00:01:03,360 Det første du skal vide er, at når du laver en søgning, 21 00:01:03,430 --> 00:01:06,480 så går søgemaskinen faktisk ikke ud på webbet 22 00:01:06,480 --> 00:01:08,140 for at køre din søgning i realtid. 23 00:01:08,140 --> 00:01:10,610 Og det er fordi, der er over en milliard websider 24 00:01:10,610 --> 00:01:14,140 på internettet, og flere hundrede skabes hvert minut. 25 00:01:14,140 --> 00:01:16,210 Så hvis søgemaskinen skulle søge igennem 26 00:01:16,240 --> 00:01:18,690 hver enkelte side for at finde den, du leder efter, 27 00:01:18,690 --> 00:01:20,120 ville det tage en evighed. 28 00:01:20,200 --> 00:01:21,970 Så for at gøre din søgning hurtigere 29 00:01:21,970 --> 00:01:24,940 skanner søgemaskiner konstant webbet på forhånd 30 00:01:25,290 --> 00:01:28,700 for at registrere oplysninger, der senere kunne hjælpe med din søgning. 31 00:01:28,930 --> 00:01:31,270 På den måde, når du søger om rejser til Mars, 32 00:01:31,470 --> 00:01:33,700 har søgemaskinen allerede det, som den behøver 33 00:01:33,700 --> 00:01:35,728 for at give dig et svar i realtid. 34 00:01:36,250 --> 00:01:37,540 Sådan virker det. 35 00:01:37,900 --> 00:01:42,010 Internettet er et net af sider, der er forbundet til hinanden via hyperlinks. 36 00:01:42,400 --> 00:01:44,680 Søgemaskiner kører konstant et program 37 00:01:44,680 --> 00:01:47,380 der hedder en Spider, der går igennem disse websider 38 00:01:47,380 --> 00:01:49,230 for at indsamle oplysninger om dem. 39 00:01:49,780 --> 00:01:51,550 Hver gang den finder et hyperlink, 40 00:01:52,090 --> 00:01:55,000 følger den det, til den har besøgt hver side 41 00:01:55,030 --> 00:01:57,240 den kan finde på hele internettet. 42 00:01:57,335 --> 00:01:59,170 For hver side, spideren besøger, 43 00:01:59,200 --> 00:02:02,500 registrerer den alle oplysninger, den kunne få brug for til en søgning 44 00:02:02,500 --> 00:02:05,820 ved at føje dem til en særlig database, der hedder et søgningsindeks. 45 00:02:07,166 --> 00:02:09,530 Lad os nu vende tilbage til den tidligere søgning 46 00:02:09,590 --> 00:02:11,990 og se, om vi kan hitte ud af, hvordan søgemaskinen 47 00:02:11,990 --> 00:02:13,333 kom frem til resultaterne. 48 00:02:13,640 --> 00:02:16,460 Når du spørger om, hvor længe det tager at rejse til Mars, 49 00:02:16,640 --> 00:02:18,860 søger søgemaskinen under hver af disse ord 50 00:02:18,920 --> 00:02:21,410 i søgningsindekset for med det samme at få en liste 51 00:02:21,410 --> 00:02:24,500 over alle de sider på internettet, der indeholder de ord. 52 00:02:24,890 --> 00:02:26,870 Men en søgning på blot disse søgetermer 53 00:02:26,870 --> 00:02:28,760 kunne give millioner af sider, 54 00:02:28,760 --> 00:02:31,110 så søgemaskinen skal kunne bestemme 55 00:02:31,110 --> 00:02:33,120 de bedste match, som den viser dig først. 56 00:02:33,340 --> 00:02:35,740 Det er her, det bliver besværligt, for søgemaskinen 57 00:02:35,740 --> 00:02:38,040 kan blive nødt til at gætte, hvad du leder efter. 58 00:02:38,930 --> 00:02:41,360 Hver søgemaskine har sin egen algoritme 59 00:02:41,360 --> 00:02:44,370 til at rangere siderne på grundlag af, hvad den tror du ønsker. 60 00:02:44,930 --> 00:02:47,660 Søgemaskinens rangeringsalgoritme kan også tjekke 61 00:02:47,990 --> 00:02:50,360 om din søgeterm dukker op i sidens titel. 62 00:02:50,900 --> 00:02:53,980 Den kunne tjekke om alle ordene dukker op ved siden af hinanden, 63 00:02:54,520 --> 00:02:57,020 eller et utal af andre beregninger 64 00:02:57,020 --> 00:02:58,610 der hjælper den med at afgøre, 65 00:02:58,670 --> 00:03:01,420 hvilke sider du ønsker at se, og hvilke du ikke vil. 66 00:03:02,960 --> 00:03:04,960 Google opfandt den mest berømte algoritme 67 00:03:04,960 --> 00:03:08,530 til valg af de mest relevante søgningsresultater ved at tage højde for, 68 00:03:08,530 --> 00:03:11,350 hvor mange andre websider havde et link til en given side. 69 00:03:11,830 --> 00:03:14,140 Tanken er, at hvis mange websider synes 70 00:03:14,140 --> 00:03:15,660 at en webside er interessant, 71 00:03:15,660 --> 00:03:17,940 så er det nok den, du leder efter. 72 00:03:18,190 --> 00:03:20,020 Denne algoritme hedder Page-rangering, 73 00:03:20,520 --> 00:03:22,480 ikke fordi den rangerer sider ("pages"), 74 00:03:22,480 --> 00:03:25,310 men fordi den er navngivet efter dens opfinder, Larry Page, 75 00:03:25,480 --> 00:03:27,333 der er en af stifterne af Google. 76 00:03:27,940 --> 00:03:30,520 Da en webside ofte tjener penge, når du besøger den, 77 00:03:30,820 --> 00:03:32,950 forsøger spammere altid at finde måder, 78 00:03:32,950 --> 00:03:35,741 hvorved de kan styre søgealgoritmen, så deres sider 79 00:03:35,742 --> 00:03:37,931 står højere i resultaterne. 80 00:03:38,260 --> 00:03:40,750 Søgemaskiner opdaterer ofte deres algoritmer 81 00:03:40,750 --> 00:03:44,296 for at forhindre falske eller upålidelige websider fra at nå toppen. 82 00:03:44,680 --> 00:03:47,350 I sidste ende er det dog dig, der skal holde øje efter 83 00:03:47,500 --> 00:03:49,450 disse upålidelige sider 84 00:03:49,580 --> 00:03:52,990 ved at se på web-adresserne og sørge for, at det er en pålidelig kilde. 85 00:03:53,680 --> 00:03:55,390 Søgeprogrammer udvikler sig altid 86 00:03:55,420 --> 00:03:58,420 til at forbedre algoritmerne, så de giver bedre resultater 87 00:03:58,420 --> 00:04:00,630 og hurtigere resultater end deres konkurrenter. 88 00:04:00,960 --> 00:04:03,180 Nutidens søgemaskiner bruger sågar oplysninger, 89 00:04:03,180 --> 00:04:07,090 som du ikke udtrykkeligt har givet, for at hjælpe dig med at indsnævre din søgning. 90 00:04:07,150 --> 00:04:10,120 For eksempel, hvis du søgte efter hundeparker, 91 00:04:10,120 --> 00:04:12,190 ville mange søgemaskiner give dig resultater 92 00:04:12,190 --> 00:04:14,120 for alle de omkringliggende hundeparker. 93 00:04:14,120 --> 00:04:16,260 Selv om du ikke indtastede din beliggenhed. 94 00:04:17,800 --> 00:04:20,530 Moderne søgemaskiner forstår også mere 95 00:04:20,530 --> 00:04:22,060 end blot ordene på en side, 96 00:04:22,300 --> 00:04:24,970 men også det, de betyder, for at finde den bedste side, 97 00:04:24,970 --> 00:04:26,750 der passer til det, du leder efter. 98 00:04:27,130 --> 00:04:30,171 For eksempel, hvis du leder efter en hurtig "pitcher" (kaster), 99 00:04:30,280 --> 00:04:32,300 ved den, at du leder efter en atlet. 100 00:04:32,300 --> 00:04:34,560 Men hvis du søger efter en stor pitcher (kande), 101 00:04:34,560 --> 00:04:36,730 vil den give dig et udvalg af køkkenudstyr. 102 00:04:38,420 --> 00:04:41,910 For at forstå ordene bedre, bruger vi noget, der hedder maskinlæring, 103 00:04:41,910 --> 00:04:43,845 som er en slags kunstig intelligens. 104 00:04:43,845 --> 00:04:46,490 Den gør det muligt for søgealgoritmer ikke blot at finde 105 00:04:46,490 --> 00:04:48,510 individuelle bogstaver eller ord på siden, 106 00:04:48,510 --> 00:04:51,280 men også at forstå ordenes tilgrundliggende betydning. 107 00:04:53,690 --> 00:04:55,850 Internettet vokser eksponentielt, 108 00:04:56,210 --> 00:04:59,810 men hvis holdene, der designer søgemaskinerne, gør vores job ordentligt, 109 00:05:00,080 --> 00:05:04,090 vil den information, du søger, altid blot tage et par tastetryk at finde.