WEBVTT 00:00:06.070 --> 00:00:07.120 Hej! Mit navn er John. 00:00:07.510 --> 00:00:10.490 Jeg er chef for søgnings- og maskinlæringsholdene hos Google. 00:00:12.130 --> 00:00:14.230 Jeg synes, at det er utroligt inspirerende 00:00:14.230 --> 00:00:16.214 at folk fra hele verden 00:00:16.215 --> 00:00:19.160 bruger søgemaskiner til at spørge banale spørgsmål 00:00:19.160 --> 00:00:20.930 og utroligt vigtige spørgsmål. 00:00:20.930 --> 00:00:23.450 Så det er et stort ansvar at give dem 00:00:23.450 --> 00:00:24.864 de bedste svar, vi kan. 00:00:26.710 --> 00:00:30.610 Hej, mit navn er Akshaya og jeg arbejder på Bing-søgningsholdet. 00:00:30.910 --> 00:00:33.190 Der er mange gange, hvor vi begynder at se 00:00:33.190 --> 00:00:35.800 på kunstig intelligens og maskinlæring, 00:00:35.800 --> 00:00:39.390 men bliver nødt til at tage hensyn til, hvordan brugerne vil bruge dette, 00:00:39.390 --> 00:00:42.570 for når det kommer til stykket, ønsker vi at være samfundsnyttige. 00:00:43.780 --> 00:00:45.400 Lad os spørge et enkelt spørgsmål. 00:00:45.820 --> 00:00:48.070 Hvor lang tid tager det at rejse til Mars? 00:00:49.330 --> 00:00:50.950 Hvor kom disse resultater fra, 00:00:51.370 --> 00:00:54.100 og hvorfor blev denne vist før den anden? 00:00:55.700 --> 00:00:57.520 Ok, lad os tage et nærmere kig på, 00:00:57.520 --> 00:01:00.690 hvordan søgemaskinen omdannede din forespørgelse til et resultat. 00:01:00.690 --> 00:01:03.360 Det første du skal vide er, at når du laver en søgning, 00:01:03.430 --> 00:01:06.480 så går søgemaskinen faktisk ikke ud på webbet 00:01:06.480 --> 00:01:08.140 for at køre din søgning i realtid. 00:01:08.140 --> 00:01:10.610 Og det er fordi, der er over en milliard websider 00:01:10.610 --> 00:01:14.140 på internettet, og flere hundrede skabes hvert minut. 00:01:14.140 --> 00:01:16.210 Så hvis søgemaskinen skulle søge igennem 00:01:16.240 --> 00:01:18.690 hver enkelte side for at finde den, du leder efter, 00:01:18.690 --> 00:01:20.120 ville det tage en evighed. 00:01:20.200 --> 00:01:21.970 Så for at gøre din søgning hurtigere 00:01:21.970 --> 00:01:24.940 skanner søgemaskiner konstant webbet på forhånd 00:01:25.290 --> 00:01:28.700 for at registrere oplysninger, der senere kunne hjælpe med din søgning. 00:01:28.930 --> 00:01:31.270 På den måde, når du søger om rejser til Mars, 00:01:31.470 --> 00:01:33.700 har søgemaskinen allerede det, som den behøver 00:01:33.700 --> 00:01:35.728 for at give dig et svar i realtid. 00:01:36.250 --> 00:01:37.540 Sådan virker det. 00:01:37.900 --> 00:01:42.010 Internettet er et net af sider, der er forbundet til hinanden via hyperlinks. 00:01:42.400 --> 00:01:44.680 Søgemaskiner kører konstant et program 00:01:44.680 --> 00:01:47.380 der hedder en Spider, der går igennem disse websider 00:01:47.380 --> 00:01:49.230 for at indsamle oplysninger om dem. 00:01:49.780 --> 00:01:51.550 Hver gang den finder et hyperlink, 00:01:52.090 --> 00:01:55.000 følger den det, til den har besøgt hver side 00:01:55.030 --> 00:01:57.240 den kan finde på hele internettet. 00:01:57.335 --> 00:01:59.170 For hver side, spideren besøger, 00:01:59.200 --> 00:02:02.500 registrerer den alle oplysninger, den kunne få brug for til en søgning 00:02:02.500 --> 00:02:05.820 ved at føje dem til en særlig database, der hedder et søgningsindeks. 00:02:07.166 --> 00:02:09.530 Lad os nu vende tilbage til den tidligere søgning 00:02:09.590 --> 00:02:11.990 og se, om vi kan hitte ud af, hvordan søgemaskinen 00:02:11.990 --> 00:02:13.333 kom frem til resultaterne. 00:02:13.640 --> 00:02:16.460 Når du spørger om, hvor længe det tager at rejse til Mars, 00:02:16.640 --> 00:02:18.860 søger søgemaskinen under hver af disse ord 00:02:18.920 --> 00:02:21.410 i søgningsindekset for med det samme at få en liste 00:02:21.410 --> 00:02:24.500 over alle de sider på internettet, der indeholder de ord. 00:02:24.890 --> 00:02:26.870 Men en søgning på blot disse søgetermer 00:02:26.870 --> 00:02:28.760 kunne give millioner af sider, 00:02:28.760 --> 00:02:31.110 så søgemaskinen skal kunne bestemme 00:02:31.110 --> 00:02:33.120 de bedste match, som den viser dig først. 00:02:33.340 --> 00:02:35.740 Det er her, det bliver besværligt, for søgemaskinen 00:02:35.740 --> 00:02:38.040 kan blive nødt til at gætte, hvad du leder efter. 00:02:38.930 --> 00:02:41.360 Hver søgemaskine har sin egen algoritme 00:02:41.360 --> 00:02:44.370 til at rangere siderne på grundlag af, hvad den tror du ønsker. 00:02:44.930 --> 00:02:47.660 Søgemaskinens rangeringsalgoritme kan også tjekke 00:02:47.990 --> 00:02:50.360 om din søgeterm dukker op i sidens titel. 00:02:50.900 --> 00:02:53.980 Den kunne tjekke om alle ordene dukker op ved siden af hinanden, 00:02:54.520 --> 00:02:57.020 eller et utal af andre beregninger 00:02:57.020 --> 00:02:58.610 der hjælper den med at afgøre, 00:02:58.670 --> 00:03:01.420 hvilke sider du ønsker at se, og hvilke du ikke vil. 00:03:02.960 --> 00:03:04.960 Google opfandt den mest berømte algoritme 00:03:04.960 --> 00:03:08.530 til valg af de mest relevante søgningsresultater ved at tage højde for, 00:03:08.530 --> 00:03:11.350 hvor mange andre websider havde et link til en given side. 00:03:11.830 --> 00:03:14.140 Tanken er, at hvis mange websider synes 00:03:14.140 --> 00:03:15.660 at en webside er interessant, 00:03:15.660 --> 00:03:17.940 så er det nok den, du leder efter. 00:03:18.190 --> 00:03:20.020 Denne algoritme hedder Page-rangering, 00:03:20.520 --> 00:03:22.480 ikke fordi den rangerer sider ("pages"), 00:03:22.480 --> 00:03:25.310 men fordi den er navngivet efter dens opfinder, Larry Page, 00:03:25.480 --> 00:03:27.333 der er en af stifterne af Google. 00:03:27.940 --> 00:03:30.520 Da en webside ofte tjener penge, når du besøger den, 00:03:30.820 --> 00:03:32.950 forsøger spammere altid at finde måder, 00:03:32.950 --> 00:03:35.741 hvorved de kan styre søgealgoritmen, så deres sider 00:03:35.742 --> 00:03:37.931 står højere i resultaterne. 00:03:38.260 --> 00:03:40.750 Søgemaskiner opdaterer ofte deres algoritmer 00:03:40.750 --> 00:03:44.296 for at forhindre falske eller upålidelige websider fra at nå toppen. 00:03:44.680 --> 00:03:47.350 I sidste ende er det dog dig, der skal holde øje efter 00:03:47.500 --> 00:03:49.450 disse upålidelige sider 00:03:49.580 --> 00:03:52.990 ved at se på web-adresserne og sørge for, at det er en pålidelig kilde. 00:03:53.680 --> 00:03:55.390 Søgeprogrammer udvikler sig altid 00:03:55.420 --> 00:03:58.420 til at forbedre algoritmerne, så de giver bedre resultater 00:03:58.420 --> 00:04:00.630 og hurtigere resultater end deres konkurrenter. 00:04:00.960 --> 00:04:03.180 Nutidens søgemaskiner bruger sågar oplysninger, 00:04:03.180 --> 00:04:07.090 som du ikke udtrykkeligt har givet, for at hjælpe dig med at indsnævre din søgning. 00:04:07.150 --> 00:04:10.120 For eksempel, hvis du søgte efter hundeparker, 00:04:10.120 --> 00:04:12.190 ville mange søgemaskiner give dig resultater 00:04:12.190 --> 00:04:14.120 for alle de omkringliggende hundeparker. 00:04:14.120 --> 00:04:16.260 Selv om du ikke indtastede din beliggenhed. 00:04:17.800 --> 00:04:20.530 Moderne søgemaskiner forstår også mere 00:04:20.530 --> 00:04:22.060 end blot ordene på en side, 00:04:22.300 --> 00:04:24.970 men også det, de betyder, for at finde den bedste side, 00:04:24.970 --> 00:04:26.750 der passer til det, du leder efter. 00:04:27.130 --> 00:04:30.171 For eksempel, hvis du leder efter en hurtig "pitcher" (kaster), 00:04:30.280 --> 00:04:32.300 ved den, at du leder efter en atlet. 00:04:32.300 --> 00:04:34.560 Men hvis du søger efter en stor pitcher (kande), 00:04:34.560 --> 00:04:36.730 vil den give dig et udvalg af køkkenudstyr. 00:04:38.420 --> 00:04:41.910 For at forstå ordene bedre, bruger vi noget, der hedder maskinlæring, 00:04:41.910 --> 00:04:43.845 som er en slags kunstig intelligens. 00:04:43.845 --> 00:04:46.490 Den gør det muligt for søgealgoritmer ikke blot at finde 00:04:46.490 --> 00:04:48.510 individuelle bogstaver eller ord på siden, 00:04:48.510 --> 00:04:51.280 men også at forstå ordenes tilgrundliggende betydning. 00:04:53.690 --> 00:04:55.850 Internettet vokser eksponentielt, 00:04:56.210 --> 00:04:59.810 men hvis holdene, der designer søgemaskinerne, gør vores job ordentligt, 00:05:00.080 --> 00:05:04.090 vil den information, du søger, altid blot tage et par tastetryk at finde.