WEBVTT 00:00:06.070 --> 00:00:07.120 Hallo, mein Name ist John. 00:00:07.510 --> 00:00:10.140 Ich leite die Teams Suchen und Maschinenlernen bei Google. 00:00:12.130 --> 00:00:14.230 Ich finde es ist sehr inspirierend, 00:00:14.230 --> 00:00:16.214 dass Menschen auf der ganzen Welt, 00:00:16.215 --> 00:00:19.160 den Suchmaschinen sehr einfache Fragen und 00:00:19.160 --> 00:00:20.930 sehr wichtige Fragen stellen. 00:00:20.930 --> 00:00:23.450 Es ist ein große Verantwortung, ihnen die 00:00:23.450 --> 00:00:24.864 besten Antworten zu geben. 00:00:26.710 --> 00:00:30.610 Hallo, ich heiße Akshaya und ich gehöre zum Bing-Suchteam. 00:00:30.910 --> 00:00:33.190 Wir befassen uns oft mit 00:00:33.190 --> 00:00:35.800 künstlicher Intelligenz und maschinellem Lernen, 00:00:35.830 --> 00:00:39.010 wir müssen jedoch analysieren, wie die Benutzer dies verwenden werden, 00:00:39.140 --> 00:00:42.390 denn schließlich möchten wir etwas für die Gesellschaft tun. 00:00:43.780 --> 00:00:45.400 Stellen wir eine einfache Frage. 00:00:45.820 --> 00:00:48.070 Wie lange dauert die Reise zum Mars? 00:00:49.330 --> 00:00:50.950 Woher kommen die Ergebnisse und 00:00:51.370 --> 00:00:54.100 warum wurde ein Ergebnis vor dem anderen aufgeführt? 00:00:55.700 --> 00:00:58.150 Los gehts, sehen wir uns an, wie die Suchmaschine 00:00:58.150 --> 00:00:59.860 die Ergebnisse für eure Anfragen findet. 00:01:00.690 --> 00:01:03.360 Zuerst müsst ihr wissen, dass die Suchmaschine nicht direkt 00:01:03.430 --> 00:01:06.480 in das World Wide Web geht, um 00:01:06.480 --> 00:01:08.010 eure Suche in Echtzeit zu beantworten. 00:01:08.140 --> 00:01:10.610 Es gibt im Internet nämlich Milliarden Websites 00:01:10.610 --> 00:01:14.140 und in jeder Minute werden hunderte neue Websites geschaffen. 00:01:14.140 --> 00:01:16.210 Würde die Suchmaschine jede einzelne Website durchsuchen, 00:01:16.240 --> 00:01:18.690 um das zu finden, wonach ihr sucht, 00:01:18.690 --> 00:01:20.120 würde das ewig dauern. 00:01:20.500 --> 00:01:21.940 Die Suchmaschinen suchen vorab im Internet 00:01:21.970 --> 00:01:24.940 nach Informationen, die für die spätere Suche nützlich 00:01:25.420 --> 00:01:28.560 sein können, damit die Suche schneller wird. 00:01:28.930 --> 00:01:31.270 Wenn ihr also nach der Reise zum Mars sucht, 00:01:31.630 --> 00:01:33.700 hat die Suchmaschine bereits alles gefunden, 00:01:33.700 --> 00:01:35.728 um euch in Echzeit antworten zu können. 00:01:36.250 --> 00:01:37.540 Das funktioniert so. 00:01:37.900 --> 00:01:42.010 Die Webseiten sind im Internet-Netzwerk per Hyperlinks verbunden. 00:01:42.400 --> 00:01:44.680 Alle Suchmaschinen haben ein Programm 00:01:44.680 --> 00:01:47.380 namens Spider, das kreuz und quer alle Webseiten aufsucht 00:01:47.380 --> 00:01:49.040 und Informationen über sie sammelt. 00:01:49.780 --> 00:01:51.550 Wenn es einen Hyperlink findet, 00:01:52.090 --> 00:01:55.000 folgt es ihm, bis es jede einzelne Seite besucht hat, die 00:01:55.030 --> 00:01:57.240 es im Internet findet. 00:01:57.335 --> 00:01:59.170 Spider erfasst auf jeder einzelnen Seite 00:01:59.200 --> 00:02:02.320 alle Informationen, die es für die Suche benötigt und 00:02:02.500 --> 00:02:05.650 fügt sie zu einer spezifischen Datenbank, die Suchindex heißt, hinzu. 00:02:07.166 --> 00:02:09.530 Kehren wir jetzt zu unserer Suche zurück, 00:02:09.590 --> 00:02:11.990 um herauszufinden, wie die Suchmaschine die Resultate 00:02:11.990 --> 00:02:13.333 gefunden hat. 00:02:13.640 --> 00:02:16.460 Wenn ihr fragt, wie lange die Reise zum Mars dauert, 00:02:16.640 --> 00:02:18.860 ruft die Suchmaschine mithilfe dieser Wörter 00:02:18.920 --> 00:02:21.410 im Suchindex sofort eine Liste aller Seiten 00:02:21.410 --> 00:02:24.500 im Internet ab, die diese Wörter enthalten. 00:02:24.890 --> 00:02:26.870 Die einfache Suche nach diesen Suchbegriffen 00:02:26.870 --> 00:02:28.760 würde jedoch Millionen Seiten ergeben, 00:02:28.760 --> 00:02:31.110 deshalb muss die Suchmaschine bestimmen, welche eure 00:02:31.110 --> 00:02:33.120 Suchkriterien am besten erfüllt. 00:02:33.340 --> 00:02:36.010 Das ist schon schwieriger, denn die Suchmaschine 00:02:36.010 --> 00:02:38.040 muss vielleicht raten, wonach ihr sucht. 00:02:38.930 --> 00:02:41.360 Jede Suchmaschine hat einen eigenen Algorithmus. Er listet 00:02:41.360 --> 00:02:44.230 die Seiten danach, was ihr seiner Meinung nach sucht. 00:02:44.930 --> 00:02:47.660 Der Ranking-Algorithmus der Suchmaschine überprüft, 00:02:47.990 --> 00:02:50.360 ob der Suchbegriff im Titel der Webseite vorkommt, 00:02:50.900 --> 00:02:53.820 ob alle Wörter im Text nebeneinander angezeigt werden 00:02:54.520 --> 00:02:57.020 oder führt beliebig viele andere Berechnungen durch, 00:02:57.020 --> 00:02:58.610 um genauer zu bestimmen, 00:02:58.670 --> 00:03:01.420 welche Seiten ihr euch ansehen möchtet und welche nicht. 00:03:02.960 --> 00:03:04.960 Google hat den bekanntestesn Algorithmus erfunden. 00:03:04.960 --> 00:03:08.530 Er wählt die relevantesten Suchergebnisse danach aus, 00:03:08.560 --> 00:03:11.230 wie viele Webseiten mit einer Seite verknüpft sind. 00:03:11.830 --> 00:03:14.140 Wenn viele Websites eine Website interessant finden, 00:03:14.140 --> 00:03:15.660 dann ist sie wahrscheinlich die Website, 00:03:15.660 --> 00:03:17.940 nach der ihr sucht. Das ist die Idee dabei. 00:03:18.190 --> 00:03:20.020 Dieser Algorithmus heißt Page Rank, 00:03:20.590 --> 00:03:22.330 nicht weil er Webseiten bewertet, 00:03:22.570 --> 00:03:25.210 sondern weil der Erfinder Larry Page heißt, 00:03:25.480 --> 00:03:27.333 er ist auch einer der Gründer von Google. 00:03:27.940 --> 00:03:30.520 Websites verdienen oft Geld mit euren Besuchen und deshalb 00:03:30.820 --> 00:03:32.950 versuchen Spammer, den Suchalgorithmus ständig 00:03:32.950 --> 00:03:35.741 mit neuen Methoden auszutricksen, damit ihre Seiten 00:03:35.742 --> 00:03:37.931 in den Ergebnissen höher gelistet werden. 00:03:38.260 --> 00:03:40.750 Suchmaschinen aktualisieren ihre Algorithmen regelmäßig, 00:03:40.750 --> 00:03:44.296 damit keine Fake-Seiten und nur vertrauenswürdige Seiten ganz oben stehen. 00:03:44.680 --> 00:03:47.350 Im Endeffekt, liegt es an euch, auf Seiten zu achten, 00:03:47.500 --> 00:03:49.450 die nicht vertrauenswürdig sind. Überprüft anhand der 00:03:49.690 --> 00:03:52.990 Webadresse, ob eure Quelle zuverlässig ist. 00:03:53.680 --> 00:03:55.390 Suchprogramme entwickeln und verbessern ihre 00:03:55.420 --> 00:03:58.420 Algorithmen, damit sie bessere Ergebnisse und 00:03:58.540 --> 00:04:00.460 schnellere Ergebnisse als ihre Wettbewerber bereitstellen können. 00:04:01.000 --> 00:04:03.100 Heute verwenden Suchmaschinen sogar Informationen, 00:04:03.100 --> 00:04:06.820 die ihr nicht explizit angegeben habt, um die Suche einzugrenzen. 00:04:07.150 --> 00:04:10.120 Wenn ihr z. B. nach einem Hundepark sucht, 00:04:10.240 --> 00:04:12.190 zeigen euch viele Suchmaschinen Ergebnisse für alle Hundeparks 00:04:12.190 --> 00:04:13.840 in eurer Nähe an, 00:04:14.080 --> 00:04:16.260 obwohl ihr euren Standort nicht eingegeben habt. 00:04:17.800 --> 00:04:20.530 Moderne Suchmaschinen verstehen mehr als 00:04:20.530 --> 00:04:22.060 die Wörter auf einer Seite. 00:04:22.300 --> 00:04:24.970 Sie verstehen, was sie im Kontext meinen, um die besten 00:04:24.970 --> 00:04:26.750 Übereinstimmungen für euch zu finden. 00:04:27.130 --> 00:04:29.980 Wenn ihr z. B. nach einem langen Tau sucht, 00:04:30.280 --> 00:04:32.300 weiß die Suchmaschine, dass ihr ein Seil sucht. 00:04:32.500 --> 00:04:34.450 Wenn ihr jedoch nach frischem Tau sucht, 00:04:34.450 --> 00:04:36.730 zeigt sie euch Wetter- und Naturseiten an. 00:04:38.420 --> 00:04:41.910 Durch Maschinenlernen verstehen wir die Wörter besser, 00:04:41.910 --> 00:04:43.985 das ist ein Form der künstlichen Intelligenz. 00:04:43.985 --> 00:04:46.050 Mit ihrer Unterstützung suchen die 00:04:46.090 --> 00:04:48.400 Suchmaschinen nicht einfach nach einzelnen Buchstaben des Wortes auf der Seite, 00:04:48.400 --> 00:04:51.280 sondern sie verstehen auch die Bedeutung der Wörter. 00:04:53.690 --> 00:04:55.850 Das Internet wächst exponentiell, 00:04:56.210 --> 00:04:59.810 wenn die Teams, die unsere Suchmaschinen entwickeln, ihr Aufgaben gut erfüllen, 00:05:00.080 --> 00:05:04.090 sind die Informationen, die ihr sucht, stets nur ein paar Tastenanschläge entfernt.