1 00:00:06,070 --> 00:00:07,120 Hallo, mein Name ist John. 2 00:00:07,510 --> 00:00:10,140 Ich leite die Teams Suchen und Maschinenlernen bei Google. 3 00:00:12,130 --> 00:00:14,230 Ich finde es ist sehr inspirierende, 4 00:00:14,230 --> 00:00:16,214 das Menschen auf der ganzen Wlet, 5 00:00:16,215 --> 00:00:19,160 den Suchmaschinen sehr einfache Fragen und 6 00:00:19,160 --> 00:00:20,930 sehr wichtige Fragen stellen. 7 00:00:20,930 --> 00:00:23,450 Es ist ein große Verantwortung, ihnen die 8 00:00:23,450 --> 00:00:24,864 die besten Antworten zu geben. 9 00:00:26,710 --> 00:00:30,610 Hallo, ich heiße Akshaya und ich gehöre zum Bing-Suchteam. 10 00:00:30,910 --> 00:00:33,190 Wir befassen uns oft mit 11 00:00:33,190 --> 00:00:35,800 künstlicher Intelligenz und maschinellem Lernen, 12 00:00:35,830 --> 00:00:39,010 wir müssen jedoch analysieren, wie die Benutzer dies verwenden werden, 13 00:00:39,140 --> 00:00:42,390 denn schließlich möchten wir etwas für die Gesellschaft tun. 14 00:00:43,780 --> 00:00:45,400 Stellen wir eine einfache Frage. 15 00:00:45,820 --> 00:00:48,070 Wie lange dauert die Reise zum Mars? 16 00:00:49,330 --> 00:00:50,950 Woher kommen die Ergebnisse und 17 00:00:51,370 --> 00:00:54,100 warum wurde ein Ergebnis vor dem anderen aufgeführt? 18 00:00:55,700 --> 00:00:58,150 Los gehts, sehen wir uns an, wie die Suchmaschine, 19 00:00:58,150 --> 00:00:59,860 die Ergebnisse für eure Anfragen findet. 20 00:01:00,690 --> 00:01:03,360 Wenn ihr sucht, müsst ihr wissen, dass die Suchmaschine, nicht direkt 21 00:01:03,430 --> 00:01:06,480 in das World Wide Web geht und 22 00:01:06,480 --> 00:01:08,010 eure Suche nicht in Echtzeit zu beantwortet. 23 00:01:08,140 --> 00:01:10,610 Es gibt im Internet nämlich Milliarden Websites 24 00:01:10,610 --> 00:01:14,140 und in jeder Minute werden hunderte neue Websites geschaffen. 25 00:01:14,140 --> 00:01:16,210 Würde die Suchmaschine jede einzelne Website durchsuchen, 26 00:01:16,240 --> 00:01:18,690 um das zu finden, wonach ihr sucht, 27 00:01:18,690 --> 00:01:20,120 würde das ewig dauern. 28 00:01:20,500 --> 00:01:21,940 Die Suchmaschinen scannen das Internet 29 00:01:21,970 --> 00:01:24,940 kontinuierlich im Voraus auf Informationen, die für die spätere Suche nützlich 30 00:01:25,420 --> 00:01:28,560 sein können, damit ihr schneller Suchergebnisse erhaltet. 31 00:01:28,930 --> 00:01:31,270 Wenn ihr also nach der Reise zum Mars sucht, 32 00:01:31,630 --> 00:01:33,700 hat die Suchmaschine bereits alles gefunden, 33 00:01:33,700 --> 00:01:35,728 um dir in Echzeit antworten zu können. 34 00:01:36,250 --> 00:01:37,540 Das funktioniert so. 35 00:01:37,900 --> 00:01:42,010 Das Internet ist ein Netzwerk, in dem die Webseiten per Hyperlink verbunden sind. 36 00:01:42,400 --> 00:01:44,680 Alle Suchmaschinen führen kontinuierlich ein Programm 37 00:01:44,680 --> 00:01:47,380 namens Spider aus, das kreuz und quer alle Webseiten aufsucht 38 00:01:47,380 --> 00:01:49,040 und Informationen über sie sammelt. 39 00:01:49,780 --> 00:01:51,550 Wenn es einen Hyperlink findet, 40 00:01:52,090 --> 00:01:55,000 folgte es ihm, bis es jede einzelne Seite besucht hat, die 41 00:01:55,030 --> 00:01:57,240 es im Internet findet. 42 00:01:57,335 --> 00:01:59,170 Spider erfasst auf jeder einzelnen Seite 43 00:01:59,200 --> 00:02:02,320 alle Informationen, die es für die Suche benötigt und 44 00:02:02,500 --> 00:02:05,650 fügt sie zu einer spezifischen Datenbank, die Suchindex heißt, hinzu. 45 00:02:07,166 --> 00:02:09,530 Kehren wir jetzt zu unserer Suche zurück, 46 00:02:09,590 --> 00:02:11,990 um herauszufinden, wie die Suchmaschine die Resultate 47 00:02:11,990 --> 00:02:13,333 gefunden hat. 48 00:02:13,640 --> 00:02:16,460 Wenn ihr fragt, wie lange die Reise zum Mars dauert, 49 00:02:16,640 --> 00:02:18,860 ruft die Suchmaschine mithilfe dieser Wörter 50 00:02:18,920 --> 00:02:21,410 im Suchindex sofort eine Liste aller Seiten 51 00:02:21,410 --> 00:02:24,500 im Internet ab, die diese Wörter enthalten. 52 00:02:24,890 --> 00:02:26,870 Die einfache Suche nach diesen Suchbegriffen, 53 00:02:26,870 --> 00:02:28,760 würde jedoch Millionen Seiten ergeben, 54 00:02:28,760 --> 00:02:31,110 deshalb muss die Suchmaschine bestimmen, welche eure 55 00:02:31,110 --> 00:02:33,120 Suchkriterien am besten erfüllt. 56 00:02:33,340 --> 00:02:36,010 Das ist schon schwieriger, denn die Suchmaschine 57 00:02:36,010 --> 00:02:38,040 muss vielleicht raten, wonach ihr sucht. 58 00:02:38,930 --> 00:02:41,360 Jede Suchmaschine hat einen eigenen Algorithmus. Er bewertet 59 00:02:41,360 --> 00:02:44,230 und listet die Seiten danach, was ihr seiner Meinung nach sucht. 60 00:02:44,930 --> 00:02:47,660 Der Ranking-Algorithmus der Suchmaschine überprüft, 61 00:02:47,990 --> 00:02:50,360 ob euer Suchbegriff im Titel der Webseite vorkommt, 62 00:02:50,900 --> 00:02:53,820 ob alle Wörter im Text nebeneinander angezeigt werden 63 00:02:54,520 --> 00:02:57,020 oder führt beliebig viele andere Berechnungen durch, 64 00:02:57,020 --> 00:02:58,610 um genauer zu bestimmen, 65 00:02:58,670 --> 00:03:01,420 welche Seiten ihr euch ansehen möchtet und welche nicht. 66 00:03:02,960 --> 00:03:04,960 Den berühmtesten Algorithmus hat Google erfunden. 67 00:03:04,960 --> 00:03:08,530 Er wählt die relevantesten Suchergebnisse danach aus, 68 00:03:08,560 --> 00:03:11,230 wie viele andere Webseiten mit einer Seite verknüpft sind. 69 00:03:11,830 --> 00:03:14,140 Wenn viele Websites denken, dass eine Website interessant ist, 70 00:03:14,140 --> 00:03:15,660 dann ist sie wahrscheinlich die Website, 71 00:03:15,660 --> 00:03:17,940 nach der ihr sucht. Das ist die Idee von Google. 72 00:03:18,190 --> 00:03:20,020 Dieser Algorithmus heißte Page Rank, 73 00:03:20,590 --> 00:03:22,330 nicht weil er Webseiten bewertet, 74 00:03:22,570 --> 00:03:25,210 sondern weil der Erfinder Larry Page heißt, 75 00:03:25,480 --> 00:03:27,333 er ist auch einer der Gründer von Google. 76 00:03:27,940 --> 00:03:30,520 Websites verdienen oft Geld mit euren Besuchen und deshalb 77 00:03:30,820 --> 00:03:32,950 versuchen Spammer, den Suchalgorithmus ständig 78 00:03:32,950 --> 00:03:35,741 mit neuen Methoden auszutricksen, damit ihre Seiten 79 00:03:35,742 --> 00:03:37,931 in den Ergebnissen höher gelistet werden. 80 00:03:38,260 --> 00:03:40,750 81 00:03:40,750 --> 00:03:44,296 82 00:03:44,680 --> 00:03:47,350 83 00:03:47,500 --> 00:03:49,450 84 00:03:49,690 --> 00:03:52,990 85 00:03:53,680 --> 00:03:55,390 86 00:03:55,420 --> 00:03:58,420 87 00:03:58,540 --> 00:04:00,460 88 00:04:01,000 --> 00:04:03,100 89 00:04:03,100 --> 00:04:06,820 90 00:04:07,150 --> 00:04:10,120 91 00:04:10,240 --> 00:04:12,190 92 00:04:12,190 --> 00:04:13,840 93 00:04:14,080 --> 00:04:16,260 94 00:04:17,800 --> 00:04:20,530 95 00:04:20,530 --> 00:04:22,060 96 00:04:22,300 --> 00:04:24,970 97 00:04:24,970 --> 00:04:26,750 98 00:04:27,130 --> 00:04:29,980 99 00:04:30,280 --> 00:04:32,300 100 00:04:32,500 --> 00:04:34,450 101 00:04:34,450 --> 00:04:36,730 102 00:04:38,420 --> 00:04:41,910 103 00:04:41,910 --> 00:04:43,985 104 00:04:43,985 --> 00:04:46,050 105 00:04:46,090 --> 00:04:48,400 106 00:04:48,400 --> 00:04:51,280 107 00:04:53,690 --> 00:04:55,850 108 00:04:56,210 --> 00:04:59,810 109 00:05:00,080 --> 00:05:04,090