0:00:06.070,0:00:07.120 Hallo, Ik heet John. 0:00:07.510,0:00:10.140 Ik leid de zoek- en automatische leerteams[br]bij Google. 0:00:12.130,0:00:14.230 Ik vind het prachtig inspirerend 0:00:14.230,0:00:16.214 dat mensen wereldwijd 0:00:16.215,0:00:19.160 zoekmachines gebruiken om[br]banale vragen te stellen 0:00:19.160,0:00:20.930 en ongelofelijk belangrijke. 0:00:20.930,0:00:23.450 Het is dus een enorme [br]verantwoordelijkheid hen 0:00:23.450,0:00:24.864 de beste antwoorden te geven[br]die we kunnen. 0:00:26.710,0:00:30.610 Hallo, ik heet Akshaya, en ik werk voor[br]het zoekteam van Bing. 0:00:30.910,0:00:33.190 Het gebeurd vaak dat we onderzoek[br]doen naar 0:00:33.190,0:00:35.800 kunstmatige intelligentie en automatisch[br]leren, 0:00:35.830,0:00:39.010 maar we moeten kijken hoe de gebruikers[br]dit gaan gebruiken, 0:00:39.140,0:00:42.390 omdat we uiteindelijk een impact willen[br]maken op de maatschappij. 0:00:43.780,0:00:45.400 Laten we een simpele vraag stellen. 0:00:45.820,0:00:48.070 Hoe lang duurt een reis naar Mars? 0:00:49.330,0:00:50.950 Waar kwamen deze resultaten vandaan 0:00:51.370,0:00:54.100 en waarom stond dit hoger op de lijst [br]dan de andere? 0:00:55.700,0:00:58.150 Ok, laten we er dieper op in gaan en[br]kijken hoe de zoekmachine 0:00:58.150,0:00:59.860 jouw verzoek veranderde in een resultaat. 0:01:00.690,0:01:03.360 Wat je moet weten is dat als je een [br]zoekopdracht uitvoert, 0:01:03.430,0:01:06.480 de zoekmachine niet daadwerkelijk het[br]Wereldwijde web op gaat om jouw 0:01:06.480,0:01:08.010 zoekopdracht in realtime uit te voeren. 0:01:08.140,0:01:10.610 Dat is omdat er meer dan een miljard[br]websites zijn 0:01:10.610,0:01:14.140 op het internet en er elke minuut er[br]honderden bijkomen. 0:01:14.140,0:01:16.210 Dus als de zoekmachine door elke[br]website zou moeten zoeken, 0:01:16.240,0:01:18.690 om de website te vinden die jij zoekt, 0:01:18.690,0:01:20.120 dan zou dat een eeuwigheid duren. 0:01:20.500,0:01:21.940 Dus om jouw zoekopdracht sneller 0:01:21.970,0:01:24.940 uit te voeren, scannen zoekmachines het[br]web constant van te voren 0:01:25.420,0:01:28.560 om informatie vast te leggen die jouw[br]zoekopdracht later van nut kan zijn. 0:01:28.930,0:01:31.270 Op die manier heeft de zoekmachine[br]reeds wat het nodig heeft 0:01:31.630,0:01:33.700 wat betreft jouw zoekopdracht over[br]reizen naar Mars 0:01:33.700,0:01:35.728 om je een antwoord in realtime te geven. 0:01:36.250,0:01:37.540 Het werkt als volgt. 0:01:37.900,0:01:42.010 Het internet bestaat uit een web van pagina's[br]die via hyperlinks met elkaar zijn verbonden. 0:01:42.400,0:01:44.680 Zoekmachines zijn constant bezig met het[br]uitvoeren van een programma 0:01:44.680,0:01:47.380 dat een Spider heet en dat deze web-[br]pagina's doorloopt 0:01:47.380,0:01:49.040 om informatie over ze te verzamelen. 0:01:49.780,0:01:51.550 Elk keer als het een hyperlink 0:01:52.090,0:01:55.000 vindt, volgt het deze totdat het elke[br]pagina heeft bezocht dat het 0:01:55.030,0:01:57.240 kan vinden op het complete [br]internet. 0:01:57.335,0:01:59.170 Voor elke pagina die de Spider bezoekt, 0:01:59.200,0:02:02.320 legt het informatie vast die nodig kan[br]zijn voor een zoekopdracht 0:02:02.500,0:02:05.650 door het toe te voegen aan een[br]speciale database: een zoekindex. 0:02:07.166,0:02:09.530 Laten we teruggaan naar die eerdere[br]zoekopdracht 0:02:09.590,0:02:11.990 en kijken of we kunnen ontdekken hoe de[br]zoekmachine 0:02:11.990,0:02:13.333 deze resultaten tevoorschijn haalde. 0:02:13.640,0:02:16.460 Als je vraag hoe lang een reis naar[br]Mars duurt, 0:02:16.640,0:02:18.860 dan zoekt de zoekmachine naar elk van[br]die woorden in de zoekindex 0:02:18.920,0:02:21.410 om onmiddellijk een lijst[br]te krijgen 0:02:21.410,0:02:24.500 van alle pagina's op het internet[br]die deze woorden bevatten. 0:02:24.890,0:02:26.870 Maar alleen al het zoeken naar deze termen 0:02:26.870,0:02:28.760 kan miljoenen pagina's opleveren, 0:02:28.760,0:02:31.110 en dus moet de zoekmachine in staat[br]zijn om de beste 0:02:31.110,0:02:33.120 koppelingen eerst aan je te laten zien. 0:02:33.340,0:02:36.010 HIer wordt het lastig omdat de zoekmachine 0:02:36.010,0:02:38.040 misschien moet raden waar je naar [br]op zoek bent. 0:02:38.930,0:02:41.360 Elke zoekmachine gebruikt zijn eigen[br]algoritme 0:02:41.360,0:02:44.230 om de pagina's in rangvolgorde te zetten[br]op basis van wat het denkt dat jij wilt. 0:02:44.930,0:02:47.660 Het rangalgoritme van de zoekmachine[br]kan controleren 0:02:47.990,0:02:50.360 of je zoekterm in de titelpagina staat, 0:02:50.900,0:02:53.820 het kan controleren of alle worden naast[br]elkaar verschijnen, 0:02:54.520,0:02:57.020 of elk ander type berekening 0:02:57.020,0:02:58.610 die het helpen bij het beter achterhalen 0:02:58.670,0:03:01.420 welke pagina's jij wilt zien en welke niet. 0:03:02.960,0:03:04.960 Google heeft het beroemdste algoritme[br]uitgevonden 0:03:04.960,0:03:08.530 voor het kiezen van de meest relevante[br]resultaten voor een zoekopdracht door 0:03:08.560,0:03:11.230 rekening te houden met hoeveel webpagina's[br]gekoppeld zijn aan een bepaalde pagina. 0:03:11.830,0:03:14.140 Het idee is dat als veel websites denken 0:03:14.140,0:03:15.660 dat een webpagina interessant is, 0:03:15.660,0:03:17.940 het waarschijnljk de pagina is waar je[br]naar op zoek bent. 0:03:18.190,0:03:20.020 Dit algoritme wordt 'Page rank' genoemd, 0:03:20.590,0:03:22.330 niet vanwege de wijze waarop het[br]webpagina's in een ranglijst plaats, 0:03:22.570,0:03:25.210 maar omdat het genoemd is naar de [br]uitvinder ervan: Larry Page, 0:03:25.480,0:03:27.333 een van de oprichters van Google. 0:03:27.940,0:03:30.520 Aangezien een website vaak geld verdient[br]als je het bezoekt, 0:03:30.820,0:03:32.950 zijn spammers constant bezig met het [br]vinden van manieren om 0:03:32.950,0:03:35.741 het zoekalgoritme te saboteren zodat hun[br]pagina's 0:03:35.742,0:03:37.931 hoger in de lijst komen te staan. 0:03:38.260,0:03:40.750 Zoekmachines werken regelmatig hun[br]algoritmes bij 0:03:40.750,0:03:44.296 om te voorkomen dat nep of onbetrouwbare[br]websites bovenaan de lijst komen te staan. 0:03:44.680,0:03:47.350 Uiteindeljk ben jij degene die waakzaam[br]moet zijn 0:03:47.500,0:03:49.450 voor dergelijke pagina's die onbetrouwbaar[br]zijn 0:03:49.690,0:03:52.990 door naar het webadres te kijken en te [br]controleren of het een betrouwbare bron is. 0:03:53.680,0:03:55.390 Zoekprogramma's blijven zich ontwikkelen 0:03:55.420,0:03:58.420 om de algoritmes te verbeteren[br]zodat ze betere en snellere resultaten 0:03:58.540,0:04:00.460 geven dan die van de concurrent. 0:04:01.000,0:04:03.100 Moderne zoekmachines gebruiken zelfs[br]informatie 0:04:03.100,0:04:06.820 die jij niet expliciet hebt opgegeven om je[br]te helpen bij het beperken van je zoekopdracht. 0:04:07.150,0:04:10.120 Als je bijvoorbeeld een zoekopdracht gaf[br]voor hondenparken, 0:04:10.240,0:04:12.190 dan zullen veel zoekmachines je [br]resulaten geven 0:04:12.190,0:04:13.840 voor alle hondenparken in de buurt, 0:04:14.080,0:04:16.260 zelfs als je niet je locatie had[br]opgegeven. 0:04:17.800,0:04:20.530 Moderne zoekmachines begrijpen[br]meer dan alleen 0:04:20.530,0:04:22.060 maar de woorden op een pagina, 0:04:22.300,0:04:24.970 maar wat ze daadwerkelijk betekenen[br]om de beste optie te vinden 0:04:24.970,0:04:26.750 die past bij waar je naar op zoek bent. 0:04:27.130,0:04:29.980 Als je bijvoorbeeld zoekt naar [br]sneller pitcher, 0:04:30.280,0:04:32.300 dan weet het dat zoekt naar[br]een atleet. 0:04:32.500,0:04:34.450 Maar als je zoekt naar grote kruik, 0:04:34.450,0:04:36.730 leidt het tot resultaten voor je keuken. 0:04:38.420,0:04:41.910 Voor het beter begrijpen van woorden, [br]gebruiken we automatisch leren, 0:04:41.910,0:04:43.985 een soort kunstmatige intelligentie. 0:04:43.985,0:04:46.050 Het stelt zoekalgoritmes in staat[br]om niet alleen 0:04:46.090,0:04:48.400 individuele letters of woorden op[br]een pagina te zoeken, 0:04:48.400,0:04:51.280 maar ook te begrijpen wat de onderliggende[br]betekenis is van de woorden. 0:04:53.690,0:04:55.850 Het internet groeit exponentieel, 0:04:56.210,0:04:59.810 maar als de teams die zoekmachines[br]ontwerpen ons werk goed doen, 0:05:00.080,0:05:04.090 dan zal de informatie die je zoekt altijd[br]slechts enkele toetsaanslagen verderop liggen.