WEBVTT 00:00:17.602 --> 00:00:19.239 Hallo, ich bin Christian Rudder 00:00:19.239 --> 00:00:21.875 und ich bin Mitbegründer von OKCupid. 00:00:21.875 --> 00:00:24.502 Heute ist es eine der größten Dating-Sites in den USA. 00:00:24.502 --> 00:00:25.749 Wie fast jeder dort habe ich 00:00:25.749 --> 00:00:27.296 Mathe studiert und erwartungsgemäß 00:00:27.296 --> 00:00:28.644 sind wir für unseren analytischen Ansatz 00:00:28.644 --> 00:00:29.887 zur Liebe bekannt. 00:00:29.887 --> 00:00:31.717 Wir nennen es unseren Treffer-Algorithmus. 00:00:31.717 --> 00:00:33.428 OKCupids Treffer-Algorithmus hilft uns 00:00:33.428 --> 00:00:36.481 bei der Entscheidung, ob zwei Leute sich verabreden sollten. 00:00:36.481 --> 00:00:38.765 Darauf haben wir unser ganzes Geschäft aufgebaut. 00:00:38.765 --> 00:00:40.572 "Algorithmus" klingt hochtrabend, 00:00:40.572 --> 00:00:43.047 und Leute meinen, es sei eine große Sache, 00:00:43.047 --> 00:00:45.148 aber in Wahrheit ist es nur ein Konzept, 00:00:45.148 --> 00:00:47.817 wie man Schritt für Schritt ein Problem lösen kann. 00:00:47.817 --> 00:00:49.949 Er muss gar nicht hochtrabend sein. 00:00:49.949 --> 00:00:51.802 Ich werde jetzt erklären, 00:00:51.802 --> 00:00:53.657 wie wir auf unseren speziellen Algorithmus gekommen sind, 00:00:53.657 --> 00:00:55.660 damit ihr seht, wie das funktioniert. 00:00:55.660 --> 00:00:57.576 Warum sind Algorithmen überhaupt wichtig? 00:00:57.576 --> 00:00:59.045 Warum gibt es diese Lektion überhaupt? 00:00:59.045 --> 00:01:02.457 Vorhin habe ich einen wichtigen Satz gesagt: 00:01:02.457 --> 00:01:05.029 Mit ihnen kann man Schritt für Schritt ein Problem lösen, 00:01:05.029 --> 00:01:05.841 und bekanntermaßen 00:01:05.841 --> 00:01:08.470 sind Computer dabei einsame Spitze. 00:01:08.470 --> 00:01:09.588 Ein Computer ohne Algorithmus 00:01:09.588 --> 00:01:12.933 ist im Grunde ein teurer Briefbeschwerer. 00:01:12.933 --> 00:01:15.430 Da Computer in unserem Leben allgegenwärtig sind, 00:01:15.430 --> 00:01:17.223 sind es auch Algorithmen. 00:01:18.515 --> 00:01:20.267 Die Mathematik hinter OKCupids Treffer-Algorithmus 00:01:20.267 --> 00:01:21.811 ist überraschend einfach. 00:01:21.811 --> 00:01:22.629 Es sind nur ein paar Additionen, 00:01:22.629 --> 00:01:23.687 Multiplikationen 00:01:23.687 --> 00:01:25.340 und ein paar Quadratwurzeln. 00:01:25.340 --> 00:01:27.611 Die Herausforderung dabei war, 00:01:27.611 --> 00:01:30.235 herauszufinden, wie man etwas Geheimnisvolles – 00:01:30.235 --> 00:01:31.212 menschliche Anziehungskraft – 00:01:31.212 --> 00:01:33.810 für einen Computer in "mundgerechte " Stücke aufsplitten kann. 00:01:33.810 --> 00:01:36.360 Zunächst brauchten wir Daten, um Menschen zusammen zu bringen. 00:01:36.360 --> 00:01:38.382 Etwas, womit der Algorithmus arbeiten kann. 00:01:38.382 --> 00:01:40.412 Am schnellsten bekommt man Daten von Menschen, 00:01:40.412 --> 00:01:41.747 wenn man einfach darum bittet. 00:01:41.747 --> 00:01:44.166 Wir beschlossen, dass OKCupid Anwender einfach fragen sollte, 00:01:44.166 --> 00:01:46.834 z. B. "Willst du einmal Kinder haben?" 00:01:46.834 --> 00:01:48.754 und "Wie oft putzt du deine Zähne?", 00:01:48.754 --> 00:01:50.227 "Magst du unheimliche Filme?" 00:01:50.227 --> 00:01:53.514 und große Fragen wie "Glaubst du an Gott?" 00:01:53.514 --> 00:01:55.308 Viele dieser Fragen eignen sich gut dafür, 00:01:55.308 --> 00:01:56.381 ähnliche Menschen zusammenzuführen, 00:01:56.381 --> 00:01:59.052 das heißt, wenn Menschen die gleichen Antworten geben. 00:01:59.052 --> 00:02:01.471 Wenn z. B. alle beide unheimliche Filme mögen, 00:02:01.471 --> 00:02:02.684 passen sie vielleicht besser zusammen 00:02:02.684 --> 00:02:03.843 als zwei Menschen, 00:02:03.843 --> 00:02:05.115 von denen sie nur einer mag. 00:02:05.115 --> 00:02:06.480 Aber was ist z. B. mit Fragen wie: 00:02:06.480 --> 00:02:08.189 "Stehst du gerne im Mittelpunkt?" 00:02:08.189 --> 00:02:10.729 Wenn beide Partner dies bejahen, 00:02:10.729 --> 00:02:13.068 dann werden sie massive Probleme haben. 00:02:13.068 --> 00:02:14.447 Das haben wir schnell bemerkt, 00:02:14.447 --> 00:02:15.614 also wollten wir 00:02:15.614 --> 00:02:17.581 zu jeder Frage weitere Daten haben. 00:02:17.581 --> 00:02:20.332 Wir baten Menschen, nicht nur ihre eigene Antwort zu geben, 00:02:20.332 --> 00:02:23.038 sondern auch die Antwort, die sie sich vom anderen wünschen. 00:02:23.038 --> 00:02:24.207 Das funktionierte sehr gut, 00:02:24.207 --> 00:02:26.291 aber wir benötigten eine weitere Dimension. 00:02:26.291 --> 00:02:28.835 Manche Fragen verraten mehr über einen Menschen als andere. 00:02:28.835 --> 00:02:31.795 Eine Frage über Politik wie 00:02:31.795 --> 00:02:34.589 "Was ist schlimmer: Bücher oder Flaggen zu verbrennen?" 00:02:34.589 --> 00:02:37.207 kann mehr über jemanden verraten als sein Filmgeschmack. 00:02:37.207 --> 00:02:39.387 Es ist auch sinnlos, alles gleich zu gewichten, 00:02:39.387 --> 00:02:41.605 also haben wir noch etwas hinzugefügt. 00:02:41.605 --> 00:02:43.440 Bei jeder Frage von OKCupid 00:02:43.440 --> 00:02:44.642 kannst du angeben, 00:02:44.642 --> 00:02:46.223 welche Rolle sie in deinem Leben spielt, 00:02:46.223 --> 00:02:49.089 auf einer Skala von "unwichtig" bis "ein Muss". 00:02:49.089 --> 00:02:50.564 Bei jeder Frage 00:02:50.564 --> 00:02:52.692 erhalten wir 3 Dinge für unseren Algorithmus: 00:02:52.692 --> 00:02:54.068 Erstens, deine Antwort, 00:02:54.068 --> 00:02:56.362 zweitens, wie jemand anders – 00:02:56.362 --> 00:02:57.196 der potentielle Treffer – 00:02:57.196 --> 00:02:58.781 antworten soll; 00:02:58.781 --> 00:03:02.327 und drittens, wie wichtig dir die Frage überhaupt ist. 00:03:02.327 --> 00:03:03.702 Mit diesen Informationen 00:03:03.702 --> 00:03:07.128 kann OKCupid einschätzen, wie gut zwei Menschen zusammenpassen. 00:03:07.128 --> 00:03:09.458 Der Algorithmus rechnet und liefert ein Ergebnis. 00:03:09.458 --> 00:03:11.262 Ein praktisches Beispiel: 00:03:11.262 --> 00:03:13.712 Schauen wir uns an, wie wir für dich 00:03:13.712 --> 00:03:15.581 einen Treffer – sagen wir "B" – finden. 00:03:15.581 --> 00:03:17.479 Die Trefferquote mit B basiert auf 00:03:17.479 --> 00:03:19.424 Fragen, die ihr beide beantwortet habt. 00:03:19.424 --> 00:03:21.978 Nennen wir die Gruppe gemeinsamer Fragen "s". 00:03:21.978 --> 00:03:24.932 Als einfaches Beispiel verwenden wir ein kleines "s" 00:03:24.932 --> 00:03:26.434 bei nur 2 gleichen Fragen 00:03:26.434 --> 00:03:28.310 und suchen nach einer Trefferquote. 00:03:28.310 --> 00:03:30.144 Hier sind zwei Beispielfragen: 00:03:30.144 --> 00:03:32.349 Erstens: "Wie unordentlich bist du?" 00:03:32.349 --> 00:03:34.669 und die Antwortmöglichkeiten sind: 00:03:34.669 --> 00:03:35.618 sehr unordentlich, 00:03:35.618 --> 00:03:36.398 durchschnittlich, 00:03:36.398 --> 00:03:38.172 und sehr organisiert. 00:03:38.172 --> 00:03:39.755 Angenommen, du sagst: "Sehr organisiert", 00:03:39.755 --> 00:03:42.581 und möchtest, dass der andere "sehr organisiert" antwortet 00:03:42.581 --> 00:03:45.202 und die Frage ist dir sehr wichtig. 00:03:45.202 --> 00:03:46.498 Weil du ein Sauberkeitsfanatiker bist. 00:03:46.498 --> 00:03:47.212 Du bist sauber, 00:03:47.212 --> 00:03:48.296 der andere soll es auch sein, 00:03:48.296 --> 00:03:49.248 fertig. 00:03:49.248 --> 00:03:51.015 Sagen wir, B ist ein bisschen anders. 00:03:51.015 --> 00:03:53.539 Er antwortet selbst "sehr organisiert", 00:03:53.539 --> 00:03:55.171 aber "durchschnittlich" ist als Antwort 00:03:55.171 --> 00:03:56.740 von jemand anderem für ihn ok, 00:03:56.740 --> 00:03:58.748 und die Frage ist ihm nicht sehr wichtig. 00:03:58.748 --> 00:04:00.308 Schauen wir uns die 2. Frage 00:04:00.308 --> 00:04:01.896 aus unserem vorigen Beispiel an: 00:04:01.896 --> 00:04:03.653 "Stehst du gerne im Mittelpunkt?" 00:04:03.653 --> 00:04:05.231 Die Antworten lauten ja und nein. 00:04:05.231 --> 00:04:06.407 Du hast "nein" geantwortet, 00:04:06.407 --> 00:04:08.235 der andere soll auch "nein" sagen, 00:04:08.235 --> 00:04:10.862 und die Frage ist dir nicht sehr wichtig. 00:04:10.862 --> 00:04:12.419 B antwortet "ja", 00:04:12.419 --> 00:04:14.087 der andere soll "nein" sagen, 00:04:14.087 --> 00:04:16.332 weil er im Rampenlicht stehen will, 00:04:16.332 --> 00:04:19.334 und die Frage ist ihm einigermaßen wichtig. 00:04:19.334 --> 00:04:21.716 Rechnen wir das jetzt durch. 00:04:21.716 --> 00:04:22.855 Als ersten Schritt – 00:04:22.855 --> 00:04:24.376 weil wir dafür Computer verwenden – 00:04:24.376 --> 00:04:26.162 müssen wir Zahlenwerte 00:04:26.162 --> 00:04:29.041 mit Vorstellungen wie "einigermaßen wichtig" und "sehr wichtig" verbinden, 00:04:29.041 --> 00:04:31.335 weil Computer alles in Zahlen brauchen. 00:04:31.335 --> 00:04:33.523 Bei OKCupid haben wir uns wie folgt entschieden: 00:04:33.523 --> 00:04:35.858 0 ist "unwichtig", 00:04:35.858 --> 00:04:38.307 1 ist "ein wenig wichtig", 00:04:38.307 --> 00:04:40.302 "einigermaßen wichtig" ist 10, 00:04:40.302 --> 00:04:42.426 "sehr wichtig" ist 50, 00:04:42.426 --> 00:04:46.353 und "ein Muss" ist 250. 00:04:46.353 --> 00:04:48.852 Der Algorithmus macht dann zwei einfache Rechnungen. 00:04:48.852 --> 00:04:51.941 Die erste ist: Wie sehr bist du mit Bs Antwort zufrieden, 00:04:51.941 --> 00:04:55.568 das heißt, wie viele mögliche Punkte hat B auf deiner Skala erzielt? 00:04:55.568 --> 00:04:58.138 Du hast gesagt, dass Bs Antwort 00:04:58.138 --> 00:04:59.947 auf die erste Frage nach der Sauberkeit 00:04:59.947 --> 00:05:01.448 für dich sehr wichtig ist. 00:05:01.448 --> 00:05:04.041 Das sind 50 Punkte, und B hat richtig geantwortet. 00:05:04.041 --> 00:05:05.947 Die zweite Frage erreicht nur 1, 00:05:05.947 --> 00:05:07.558 weil du gesagt hast, es ist nicht sehr wichtig 00:05:07.558 --> 00:05:09.036 und B hat falsch geantwortet. 00:05:09.036 --> 00:05:12.392 B hat also 50 von 51 möglichen Punkten erzielt. 00:05:12.392 --> 00:05:14.023 Das bedeutet zu 98% zufriedenstellend. 00:05:14.023 --> 00:05:15.220 Das ist ganz gut. 00:05:15.220 --> 00:05:16.832 Die zweite Frage des Algorithmus betrifft 00:05:16.832 --> 00:05:18.918 Bs Zufriedenheit mit dir. 00:05:18.918 --> 00:05:20.768 B vergab 1 Punkt auf deine Antwort 00:05:20.768 --> 00:05:22.353 bezüglich der Sauberkeit 00:05:22.353 --> 00:05:24.745 und 10 auf deine zweite Antwort. 00:05:24.745 --> 00:05:27.156 Von diesen 11 Punkten – das sind 1 plus 10 – 00:05:27.156 --> 00:05:28.324 hast du 10 bekommen. 00:05:28.324 --> 00:05:30.617 Bei der 2. Frage waren beide mit der Antwort zufrieden. 00:05:30.617 --> 00:05:32.611 deine 10 Punkte von 11 00:05:32.611 --> 00:05:35.240 liefern 91% Zufriedenheit bei B. 00:05:35.240 --> 00:05:36.117 Das ist nicht übel. 00:05:36.117 --> 00:05:38.286 Im letzten Schritt nehmen wir diese beiden Prozentsätze 00:05:38.286 --> 00:05:40.454 und basteln daraus eine Zahl für euch beide. 00:05:40.454 --> 00:05:42.747 Dazu multipliziert der Algorithmus eure Punkte, 00:05:42.747 --> 00:05:44.500 zieht die n-te Wurzel daraus, 00:05:44.500 --> 00:05:46.792 n ist die Anzahl der Fragen. 00:05:46.792 --> 00:05:49.401 Denn "s" – die Anzahl der Fragen – 00:05:49.401 --> 00:05:51.507 hier ist nur 2, 00:05:51.507 --> 00:05:54.093 und unsere Trefferquote ist 00:05:54.093 --> 00:05:58.154 die Quadratwurzel aus 98% mal 91%. 00:05:58.154 --> 00:06:00.304 Das ergibt 94%. 00:06:00.304 --> 00:06:03.194 Deine Trefferquote mit B liegt bei 94%. 00:06:03.194 --> 00:06:04.561 So drückt die Mathematik aus, 00:06:04.561 --> 00:06:06.405 wie glücklich ihr miteinander 00:06:06.405 --> 00:06:07.749 auf Grundlage unserer Informationen wärt. 00:06:07.749 --> 00:06:10.131 Warum multipliziert der Algorithmus, 00:06:10.131 --> 00:06:12.284 anstatt den Durchschnitt der beiden Ergebnisse insgesamt 00:06:12.284 --> 00:06:14.530 und die Quadratwurzel auszurechnen? 00:06:14.530 --> 00:06:16.479 Diese Formel nennt man den geometrischen Mittelwert. 00:06:16.479 --> 00:06:17.881 Damit kann man sehr gut Werte miteinander kombinieren, 00:06:17.881 --> 00:06:19.076 die eine große Spannweite haben 00:06:19.076 --> 00:06:20.861 und ganz verschiedene Eigenschaften darstellen. 00:06:20.861 --> 00:06:23.164 Anders gesagt, ist es für romantische Treffer perfekt. 00:06:23.164 --> 00:06:24.248 Es gibt eine große Spannweite 00:06:24.248 --> 00:06:26.206 und Unmengen verschiedener Datenpunkte, 00:06:26.206 --> 00:06:27.156 wie z. B. über Filme, 00:06:27.156 --> 00:06:28.006 Politik, 00:06:28.006 --> 00:06:29.201 Religion, 00:06:29.201 --> 00:06:30.395 über alles. 00:06:30.395 --> 00:06:32.256 Auch intuitiv ist das sinnvoll. 00:06:32.256 --> 00:06:34.918 Zwei Menschen mit gegenseitig 50% Zufriedenheit 00:06:34.918 --> 00:06:36.052 sollten besser zusammenpassen 00:06:36.052 --> 00:06:39.180 als zwei andere mit einer Zufriedenheit von 0 und 100, 00:06:39.180 --> 00:06:40.847 weil Zuneigung beiderseitig sein muss. 00:06:40.847 --> 00:06:43.147 Nach einer kleinen Korrektur für Fehlerspielräume, 00:06:43.147 --> 00:06:45.770 falls wir nur sehr wenige Fragen haben, 00:06:45.770 --> 00:06:47.234 wie hier in diesem Beispiel, 00:06:47.234 --> 00:06:48.811 können wir loslegen. 00:06:48.811 --> 00:06:50.191 Jedesmal, wenn OKCupid zwei Menschen zusammenführt, 00:06:50.191 --> 00:06:52.234 werden alle angesprochenen Schritte durchgegangen. 00:06:52.234 --> 00:06:54.484 Zuerst werden Daten über deine Antworten gesammelt, 00:06:54.484 --> 00:06:56.619 danach deine Wünsche und Vorlieben 00:06:56.619 --> 00:06:59.740 mit anderen Menschen auf einfache, mathematische Weise verglichen. 00:06:59.740 --> 00:07:02.453 Diese Fähigkeit, Phänomene der realen Welt 00:07:02.453 --> 00:07:05.167 in etwas umzuwandeln, das ein Mikrochip verstehen kann, 00:07:05.167 --> 00:07:05.742 ist meiner Meinung nach 00:07:05.742 --> 00:07:08.565 die wichtigste Fähigkeit, die jemand heutzutage haben kann. 00:07:08.565 --> 00:07:10.919 So wie du Sätze verwendest, um jemandem eine Geschichte zu erzählen, 00:07:10.919 --> 00:07:13.665 verwendet man Algorithmen, um einem Computer eine Geschichte zu erzählen. 00:07:13.665 --> 00:07:14.921 Wenn du die Sprache erlernen kannst, 00:07:14.921 --> 00:07:16.381 kannst du der Welt deine Geschichten erzählen. 00:07:16.381 --> 00:07:18.768 Dies wird dir hoffentlich dabei helfen.