1 00:00:06,070 --> 00:00:07,120 Hallo, Ik heet John. 2 00:00:07,510 --> 00:00:10,140 Ik leid de zoek- en automatische leerteams bij Google. 3 00:00:12,130 --> 00:00:14,230 Ik vind het prachtig inspirerend 4 00:00:14,230 --> 00:00:16,214 dat mensen wereldwijd 5 00:00:16,215 --> 00:00:19,160 zoekmachines gebruiken om banale vragen te stellen 6 00:00:19,160 --> 00:00:20,930 en ongelofelijk belangrijke. 7 00:00:20,930 --> 00:00:23,450 Het is dus een enorme verantwoordelijkheid hen 8 00:00:23,450 --> 00:00:24,864 de beste antwoorden te geven die we kunnen. 9 00:00:26,710 --> 00:00:30,610 Hallo, ik heet Akshaya, en ik werk voor het zoekteam van Bing. 10 00:00:30,910 --> 00:00:33,190 Het gebeurd vaak dat we onderzoek doen naar 11 00:00:33,190 --> 00:00:35,800 kunstmatige intelligentie en automatisch leren, 12 00:00:35,830 --> 00:00:39,010 maar we moeten kijken hoe de gebruikers dit gaan gebruiken, 13 00:00:39,140 --> 00:00:42,390 omdat we uiteindelijk een impact willen maken op de maatschappij. 14 00:00:43,780 --> 00:00:45,400 Laten we een simpele vraag stellen. 15 00:00:45,820 --> 00:00:48,070 Hoe lang duurt een reis naar Mars? 16 00:00:49,330 --> 00:00:50,950 Waar kwamen deze resultaten vandaan 17 00:00:51,370 --> 00:00:54,100 en waarom stond dit hoger op de lijst dan de andere? 18 00:00:55,700 --> 00:00:58,150 Ok, laten we er dieper op in gaan en kijken hoe de zoekmachine 19 00:00:58,150 --> 00:00:59,860 jouw verzoek veranderde in een resultaat. 20 00:01:00,690 --> 00:01:03,360 Wat je moet weten is dat als je een zoekopdracht uitvoert, 21 00:01:03,430 --> 00:01:06,480 de zoekmachine niet daadwerkelijk het Wereldwijde web op gaat om jouw 22 00:01:06,480 --> 00:01:08,010 zoekopdracht in realtime uit te voeren. 23 00:01:08,140 --> 00:01:10,610 Dat is omdat er meer dan een miljard websites zijn 24 00:01:10,610 --> 00:01:14,140 op het internet en er elke minuut er honderden bijkomen. 25 00:01:14,140 --> 00:01:16,210 Dus als de zoekmachine door elke website zou moeten zoeken, 26 00:01:16,240 --> 00:01:18,690 om de website te vinden die jij zoekt, 27 00:01:18,690 --> 00:01:20,120 dan zou dat een eeuwigheid duren. 28 00:01:20,500 --> 00:01:21,940 Dus om jouw zoekopdracht sneller 29 00:01:21,970 --> 00:01:24,940 uit te voeren, scannen zoekmachines het web constant van te voren 30 00:01:25,420 --> 00:01:28,560 om informatie vast te leggen die jouw zoekopdracht later van nut kan zijn. 31 00:01:28,930 --> 00:01:31,270 Op die manier heeft de zoekmachine reeds wat het nodig heeft 32 00:01:31,630 --> 00:01:33,700 wat betreft jouw zoekopdracht over reizen naar Mars 33 00:01:33,700 --> 00:01:35,728 om je een antwoord in realtime te geven. 34 00:01:36,250 --> 00:01:37,540 Het werkt als volgt. 35 00:01:37,900 --> 00:01:42,010 Het internet bestaat uit een web van pagina's die via hyperlinks met elkaar zijn verbonden. 36 00:01:42,400 --> 00:01:44,680 Zoekmachines zijn constant bezig met het uitvoeren van een programma 37 00:01:44,680 --> 00:01:47,380 dat een Spider heet en dat deze web- pagina's doorloopt 38 00:01:47,380 --> 00:01:49,040 om informatie over ze te verzamelen. 39 00:01:49,780 --> 00:01:51,550 Elk keer als het een hyperlink 40 00:01:52,090 --> 00:01:55,000 vindt, volgt het deze totdat het elke pagina heeft bezocht dat het 41 00:01:55,030 --> 00:01:57,240 kan vinden op het complete internet. 42 00:01:57,335 --> 00:01:59,170 Voor elke pagina die de Spider bezoekt, 43 00:01:59,200 --> 00:02:02,320 legt het informatie vast die nodig kan zijn voor een zoekopdracht 44 00:02:02,500 --> 00:02:05,650 door het toe te voegen aan een speciale database: een zoekindex. 45 00:02:07,166 --> 00:02:09,530 Laten we teruggaan naar die eerdere zoekopdracht 46 00:02:09,590 --> 00:02:11,990 en kijken of we kunnen ontdekken hoe de zoekmachine 47 00:02:11,990 --> 00:02:13,333 deze resultaten tevoorschijn haalde. 48 00:02:13,640 --> 00:02:16,460 Als je vraag hoe lang een reis naar Mars duurt, 49 00:02:16,640 --> 00:02:18,860 dan zoekt de zoekmachine naar elk van die woorden in de zoekindex 50 00:02:18,920 --> 00:02:21,410 om onmiddellijk een lijst te krijgen 51 00:02:21,410 --> 00:02:24,500 van alle pagina's op het internet die deze woorden bevatten. 52 00:02:24,890 --> 00:02:26,870 Maar alleen al het zoeken naar deze termen 53 00:02:26,870 --> 00:02:28,760 kan miljoenen pagina's opleveren, 54 00:02:28,760 --> 00:02:31,110 en dus moet de zoekmachine in staat zijn om de beste 55 00:02:31,110 --> 00:02:33,120 koppelingen eerst aan je te laten zien. 56 00:02:33,340 --> 00:02:36,010 HIer wordt het lastig omdat de zoekmachine 57 00:02:36,010 --> 00:02:38,040 misschien moet raden waar je naar op zoek bent. 58 00:02:38,930 --> 00:02:41,360 Elke zoekmachine gebruikt zijn eigen algoritme 59 00:02:41,360 --> 00:02:44,230 om de pagina's in rangvolgorde te zetten op basis van wat het denkt dat jij wilt. 60 00:02:44,930 --> 00:02:47,660 Het rangalgoritme van de zoekmachine kan controleren 61 00:02:47,990 --> 00:02:50,360 of je zoekterm in de titelpagina staat, 62 00:02:50,900 --> 00:02:53,820 het kan controleren of alle worden naast elkaar verschijnen, 63 00:02:54,520 --> 00:02:57,020 of elk ander type berekening 64 00:02:57,020 --> 00:02:58,610 die het helpen bij het beter achterhalen 65 00:02:58,670 --> 00:03:01,420 welke pagina's jij wilt zien en welke niet. 66 00:03:02,960 --> 00:03:04,960 Google heeft het beroemdste algoritme uitgevonden 67 00:03:04,960 --> 00:03:08,530 voor het kiezen van de meest relevante resultaten voor een zoekopdracht door 68 00:03:08,560 --> 00:03:11,230 rekening te houden met hoeveel webpagina's gekoppeld zijn aan een bepaalde pagina. 69 00:03:11,830 --> 00:03:14,140 Het idee is dat als veel websites denken 70 00:03:14,140 --> 00:03:15,660 dat een webpagina interessant is, 71 00:03:15,660 --> 00:03:17,940 het waarschijnljk de pagina is waar je naar op zoek bent. 72 00:03:18,190 --> 00:03:20,020 Dit algoritme wordt 'Page rank' genoemd, 73 00:03:20,590 --> 00:03:22,330 niet vanwege de wijze waarop het webpagina's in een ranglijst plaats, 74 00:03:22,570 --> 00:03:25,210 maar omdat het genoemd is naar de uitvinder ervan: Larry Page, 75 00:03:25,480 --> 00:03:27,333 een van de oprichters van Google. 76 00:03:27,940 --> 00:03:30,520 Aangezien een website vaak geld verdient als je het bezoekt, 77 00:03:30,820 --> 00:03:32,950 zijn spammers constant bezig met het vinden van manieren om 78 00:03:32,950 --> 00:03:35,741 het zoekalgoritme te saboteren zodat hun pagina's 79 00:03:35,742 --> 00:03:37,931 hoger in de lijst komen te staan. 80 00:03:38,260 --> 00:03:40,750 Zoekmachines werken regelmatig hun algoritmes bij 81 00:03:40,750 --> 00:03:44,296 om te voorkomen dat nep of onbetrouwbare websites bovenaan de lijst komen te staan. 82 00:03:44,680 --> 00:03:47,350 Uiteindeljk ben jij degene die waakzaam moet zijn 83 00:03:47,500 --> 00:03:49,450 voor dergelijke pagina's die onbetrouwbaar zijn 84 00:03:49,690 --> 00:03:52,990 door naar het webadres te kijken en te controleren of het een betrouwbare bron is. 85 00:03:53,680 --> 00:03:55,390 Zoekprogramma's blijven zich ontwikkelen 86 00:03:55,420 --> 00:03:58,420 om de algoritmes te verbeteren zodat ze betere en snellere resultaten 87 00:03:58,540 --> 00:04:00,460 geven dan die van de concurrent. 88 00:04:01,000 --> 00:04:03,100 Moderne zoekmachines gebruiken zelfs informatie 89 00:04:03,100 --> 00:04:06,820 die jij niet expliciet hebt opgegeven om je te helpen bij het beperken van je zoekopdracht. 90 00:04:07,150 --> 00:04:10,120 Als je bijvoorbeeld een zoekopdracht gaf voor hondenparken, 91 00:04:10,240 --> 00:04:12,190 dan zullen veel zoekmachines je resulaten geven 92 00:04:12,190 --> 00:04:13,840 voor alle hondenparken in de buurt, 93 00:04:14,080 --> 00:04:16,260 zelfs als je niet je locatie had opgegeven. 94 00:04:17,800 --> 00:04:20,530 Moderne zoekmachines begrijpen meer dan alleen 95 00:04:20,530 --> 00:04:22,060 maar de woorden op een pagina, 96 00:04:22,300 --> 00:04:24,970 maar wat ze daadwerkelijk betekenen om de beste optie te vinden 97 00:04:24,970 --> 00:04:26,750 die past bij waar je naar op zoek bent. 98 00:04:27,130 --> 00:04:29,980 Als je bijvoorbeeld zoekt naar sneller pitcher, 99 00:04:30,280 --> 00:04:32,300 dan weet het dat zoekt naar een atleet. 100 00:04:32,500 --> 00:04:34,450 Maar als je zoekt naar grote kruik, 101 00:04:34,450 --> 00:04:36,730 leidt het tot resultaten voor je keuken. 102 00:04:38,420 --> 00:04:41,910 Voor het beter begrijpen van woorden, gebruiken we automatisch leren, 103 00:04:41,910 --> 00:04:43,985 een soort kunstmatige intelligentie. 104 00:04:43,985 --> 00:04:46,050 Het stelt zoekalgoritmes in staat om niet alleen 105 00:04:46,090 --> 00:04:48,400 individuele letters of woorden op een pagina te zoeken, 106 00:04:48,400 --> 00:04:51,280 maar ook te begrijpen wat de onderliggende betekenis is van de woorden. 107 00:04:53,690 --> 00:04:55,850 Het internet groeit exponentieel, 108 00:04:56,210 --> 00:04:59,810 maar als de teams die zoekmachines ontwerpen ons werk goed doen, 109 00:05:00,080 --> 00:05:04,090 dan zal de informatie die je zoekt altijd slechts enkele toetsaanslagen verderop liggen.