1 00:00:17,602 --> 00:00:19,239 Hallo, ich bin Christian Rudder 2 00:00:19,239 --> 00:00:21,875 und ich bin Mitbegründer von OKCupid. 3 00:00:21,875 --> 00:00:24,502 Heute ist es eine der größten Dating-Sites in den USA. 4 00:00:24,502 --> 00:00:25,749 Wie fast jeder dort habe ich 5 00:00:25,749 --> 00:00:27,296 Mathe studiert und erwartungsgemäß 6 00:00:27,296 --> 00:00:28,644 sind wir für unseren analytischen Ansatz 7 00:00:28,644 --> 00:00:29,887 zur Liebe bekannt. 8 00:00:29,887 --> 00:00:31,717 Wir nennen es unseren Treffer-Algorithmus. 9 00:00:31,717 --> 00:00:33,428 OKCupids Treffer-Algorithmus hilft uns 10 00:00:33,428 --> 00:00:36,481 bei der Entscheidung, ob zwei Leute sich verabreden sollten. 11 00:00:36,481 --> 00:00:38,765 Darauf haben wir unser ganzes Geschäft aufgebaut. 12 00:00:38,765 --> 00:00:40,572 "Algorithmus" klingt hochtrabend, 13 00:00:40,572 --> 00:00:43,047 und Leute meinen, es sei eine große Sache, 14 00:00:43,047 --> 00:00:45,148 aber in Wahrheit ist es nur ein Konzept, 15 00:00:45,148 --> 00:00:47,817 wie man Schritt für Schritt ein Problem lösen kann. 16 00:00:47,817 --> 00:00:49,949 Er muss gar nicht hochtrabend sein. 17 00:00:49,949 --> 00:00:51,802 Ich werde jetzt erklären, 18 00:00:51,802 --> 00:00:53,657 wie wir auf unseren speziellen Algorithmus gekommen sind, 19 00:00:53,657 --> 00:00:55,660 damit ihr seht, wie das funktioniert. 20 00:00:55,660 --> 00:00:57,576 Warum sind Algorithmen überhaupt wichtig? 21 00:00:57,576 --> 00:00:59,045 Warum gibt es diese Lektion überhaupt? 22 00:00:59,045 --> 00:01:02,457 Vorhin habe ich einen wichtigen Satz gesagt: 23 00:01:02,457 --> 00:01:05,029 Mit ihnen kann man Schritt für Schritt ein Problem lösen, 24 00:01:05,029 --> 00:01:05,841 und bekanntermaßen 25 00:01:05,841 --> 00:01:08,470 sind Computer dabei einsame Spitze. 26 00:01:08,470 --> 00:01:09,588 Ein Computer ohne Algorithmus 27 00:01:09,588 --> 00:01:12,933 ist im Grunde ein teurer Briefbeschwerer. 28 00:01:12,933 --> 00:01:15,430 Da Computer in unserem Leben allgegenwärtig sind, 29 00:01:15,430 --> 00:01:17,223 sind es auch Algorithmen. 30 00:01:18,515 --> 00:01:20,267 Die Mathematik hinter OKCupids Treffer-Algorithmus 31 00:01:20,267 --> 00:01:21,811 ist überraschend einfach. 32 00:01:21,811 --> 00:01:22,629 Es sind nur ein paar Additionen, 33 00:01:22,629 --> 00:01:23,687 Multiplikationen 34 00:01:23,687 --> 00:01:25,340 und ein paar Quadratwurzeln. 35 00:01:25,340 --> 00:01:27,611 Die Herausforderung dabei war, 36 00:01:27,611 --> 00:01:30,235 herauszufinden, wie man etwas Geheimnisvolles – 37 00:01:30,235 --> 00:01:31,212 menschliche Anziehungskraft – 38 00:01:31,212 --> 00:01:33,810 für einen Computer in "mundgerechte " Stücke aufsplitten kann. 39 00:01:33,810 --> 00:01:36,360 Zunächst brauchten wir Daten, um Menschen zusammen zu bringen. 40 00:01:36,360 --> 00:01:38,382 Etwas, womit der Algorithmus arbeiten kann. 41 00:01:38,382 --> 00:01:40,412 Am schnellsten bekommt man Daten von Menschen, 42 00:01:40,412 --> 00:01:41,747 wenn man einfach darum bittet. 43 00:01:41,747 --> 00:01:44,166 Wir beschlossen, dass OKCupid Anwender einfach fragen sollte, 44 00:01:44,166 --> 00:01:46,834 z. B. "Willst du einmal Kinder haben?" 45 00:01:46,834 --> 00:01:48,754 und "Wie oft putzt du deine Zähne?", 46 00:01:48,754 --> 00:01:50,227 "Magst du unheimliche Filme?" 47 00:01:50,227 --> 00:01:53,514 und große Fragen wie "Glaubst du an Gott?" 48 00:01:53,514 --> 00:01:55,308 Viele dieser Fragen eignen sich gut dafür, 49 00:01:55,308 --> 00:01:56,381 ähnliche Menschen zusammenzuführen, 50 00:01:56,381 --> 00:01:59,052 das heißt, wenn Menschen die gleichen Antworten geben. 51 00:01:59,052 --> 00:02:01,471 Wenn z. B. alle beide unheimliche Filme mögen, 52 00:02:01,471 --> 00:02:02,684 passen sie vielleicht besser zusammen 53 00:02:02,684 --> 00:02:03,843 als zwei Menschen, 54 00:02:03,843 --> 00:02:05,115 von denen sie nur einer mag. 55 00:02:05,115 --> 00:02:06,480 Aber was ist z. B. mit Fragen wie: 56 00:02:06,480 --> 00:02:08,189 "Stehst du gerne im Mittelpunkt?" 57 00:02:08,189 --> 00:02:10,729 Wenn beide Partner dies bejahen, 58 00:02:10,729 --> 00:02:13,068 dann werden sie massive Probleme haben. 59 00:02:13,068 --> 00:02:14,447 Das haben wir schnell bemerkt, 60 00:02:14,447 --> 00:02:15,614 also wollten wir 61 00:02:15,614 --> 00:02:17,581 zu jeder Frage weitere Daten haben. 62 00:02:17,581 --> 00:02:20,332 Wir baten Menschen, nicht nur ihre eigene Antwort zu geben, 63 00:02:20,332 --> 00:02:23,038 sondern auch die Antwort, die sie sich vom anderen wünschen. 64 00:02:23,038 --> 00:02:24,207 Das funktionierte sehr gut, 65 00:02:24,207 --> 00:02:26,291 aber wir benötigten eine weitere Dimension. 66 00:02:26,291 --> 00:02:28,835 Manche Fragen verraten mehr über einen Menschen als andere. 67 00:02:28,835 --> 00:02:31,795 Eine Frage über Politik wie 68 00:02:31,795 --> 00:02:34,589 "Was ist schlimmer: Bücher oder Flaggen zu verbrennen?" 69 00:02:34,589 --> 00:02:37,207 kann mehr über jemanden verraten als sein Filmgeschmack. 70 00:02:37,207 --> 00:02:39,387 Es ist auch sinnlos, alles gleich zu gewichten, 71 00:02:39,387 --> 00:02:41,605 also haben wir noch etwas hinzugefügt. 72 00:02:41,605 --> 00:02:43,440 Bei jeder Frage von OKCupid 73 00:02:43,440 --> 00:02:44,642 kannst du angeben, 74 00:02:44,642 --> 00:02:46,223 welche Rolle sie in deinem Leben spielt, 75 00:02:46,223 --> 00:02:49,089 auf einer Skala von "unwichtig" bis "ein Muss". 76 00:02:49,089 --> 00:02:50,564 Bei jeder Frage 77 00:02:50,564 --> 00:02:52,692 erhalten wir 3 Dinge für unseren Algorithmus: 78 00:02:52,692 --> 00:02:54,068 Erstens, deine Antwort, 79 00:02:54,068 --> 00:02:56,362 zweitens, wie jemand anders – 80 00:02:56,362 --> 00:02:57,196 der potentielle Treffer – 81 00:02:57,196 --> 00:02:58,781 antworten soll; 82 00:02:58,781 --> 00:03:02,327 und drittens, wie wichtig dir die Frage überhaupt ist. 83 00:03:02,327 --> 00:03:03,702 Mit diesen Informationen 84 00:03:03,702 --> 00:03:07,128 kann OKCupid einschätzen, wie gut zwei Menschen zusammenpassen. 85 00:03:07,128 --> 00:03:09,458 Der Algorithmus rechnet und liefert ein Ergebnis. 86 00:03:09,458 --> 00:03:11,262 Ein praktisches Beispiel: 87 00:03:11,262 --> 00:03:13,712 Schauen wir uns an, wie wir für dich 88 00:03:13,712 --> 00:03:15,581 einen Treffer – sagen wir "B" – finden. 89 00:03:15,581 --> 00:03:17,479 Die Trefferquote mit B basiert auf 90 00:03:17,479 --> 00:03:19,424 Fragen, die ihr beide beantwortet habt. 91 00:03:19,424 --> 00:03:21,978 Nennen wir die Gruppe gemeinsamer Fragen "s". 92 00:03:21,978 --> 00:03:24,932 Als einfaches Beispiel verwenden wir ein kleines "s" 93 00:03:24,932 --> 00:03:26,434 bei nur 2 gleichen Fragen 94 00:03:26,434 --> 00:03:28,310 und suchen nach einer Trefferquote. 95 00:03:28,310 --> 00:03:30,144 Hier sind zwei Beispielfragen: 96 00:03:30,144 --> 00:03:32,349 Erstens: "Wie unordentlich bist du?" 97 00:03:32,349 --> 00:03:34,669 und die Antwortmöglichkeiten sind: 98 00:03:34,669 --> 00:03:35,618 sehr unordentlich, 99 00:03:35,618 --> 00:03:36,398 durchschnittlich, 100 00:03:36,398 --> 00:03:38,172 und sehr organisiert. 101 00:03:38,172 --> 00:03:39,755 Angenommen, du sagst: "Sehr organisiert", 102 00:03:39,755 --> 00:03:42,581 und möchtest, dass der andere "sehr organisiert" antwortet 103 00:03:42,581 --> 00:03:45,202 und die Frage ist dir sehr wichtig. 104 00:03:45,202 --> 00:03:46,498 Weil du ein Sauberkeitsfanatiker bist. 105 00:03:46,498 --> 00:03:47,212 Du bist sauber, 106 00:03:47,212 --> 00:03:48,296 der andere soll es auch sein, 107 00:03:48,296 --> 00:03:49,248 fertig. 108 00:03:49,248 --> 00:03:51,015 Sagen wir, B ist ein bisschen anders. 109 00:03:51,015 --> 00:03:53,539 Er antwortet selbst "sehr organisiert", 110 00:03:53,539 --> 00:03:55,171 aber "durchschnittlich" ist als Antwort 111 00:03:55,171 --> 00:03:56,740 von jemand anderem für ihn ok, 112 00:03:56,740 --> 00:03:58,748 und die Frage ist ihm nicht sehr wichtig. 113 00:03:58,748 --> 00:04:00,308 Schauen wir uns die 2. Frage 114 00:04:00,308 --> 00:04:01,896 aus unserem vorigen Beispiel an: 115 00:04:01,896 --> 00:04:03,653 "Stehst du gerne im Mittelpunkt?" 116 00:04:03,653 --> 00:04:05,231 Die Antworten lauten ja und nein. 117 00:04:05,231 --> 00:04:06,407 Du hast "nein" geantwortet, 118 00:04:06,407 --> 00:04:08,235 der andere soll auch "nein" sagen, 119 00:04:08,235 --> 00:04:10,862 und die Frage ist dir nicht sehr wichtig. 120 00:04:10,862 --> 00:04:12,419 B antwortet "ja", 121 00:04:12,419 --> 00:04:14,087 der andere soll "nein" sagen, 122 00:04:14,087 --> 00:04:16,332 weil er im Rampenlicht stehen will, 123 00:04:16,332 --> 00:04:19,334 und die Frage ist ihm einigermaßen wichtig. 124 00:04:19,334 --> 00:04:21,716 Rechnen wir das jetzt durch. 125 00:04:21,716 --> 00:04:22,855 Als ersten Schritt – 126 00:04:22,855 --> 00:04:24,376 weil wir dafür Computer verwenden – 127 00:04:24,376 --> 00:04:26,162 müssen wir Zahlenwerte 128 00:04:26,162 --> 00:04:29,041 mit Vorstellungen wie "einigermaßen wichtig" und "sehr wichtig" verbinden, 129 00:04:29,041 --> 00:04:31,335 weil Computer alles in Zahlen brauchen. 130 00:04:31,335 --> 00:04:33,523 Bei OKCupid haben wir uns wie folgt entschieden: 131 00:04:33,523 --> 00:04:35,858 0 ist "unwichtig", 132 00:04:35,858 --> 00:04:38,307 1 ist "ein wenig wichtig", 133 00:04:38,307 --> 00:04:40,302 "einigermaßen wichtig" ist 10, 134 00:04:40,302 --> 00:04:42,426 "sehr wichtig" ist 50, 135 00:04:42,426 --> 00:04:46,353 und "ein Muss" ist 250. 136 00:04:46,353 --> 00:04:48,852 Der Algorithmus macht dann zwei einfache Rechnungen. 137 00:04:48,852 --> 00:04:51,941 Die erste ist: Wie sehr bist du mit Bs Antwort zufrieden, 138 00:04:51,941 --> 00:04:55,568 das heißt, wie viele mögliche Punkte hat B auf deiner Skala erzielt? 139 00:04:55,568 --> 00:04:58,138 Du hast gesagt, dass Bs Antwort 140 00:04:58,138 --> 00:04:59,947 auf die erste Frage nach der Sauberkeit 141 00:04:59,947 --> 00:05:01,448 für dich sehr wichtig ist. 142 00:05:01,448 --> 00:05:04,041 Das sind 50 Punkte, und B hat richtig geantwortet. 143 00:05:04,041 --> 00:05:05,947 Die zweite Frage erreicht nur 1, 144 00:05:05,947 --> 00:05:07,558 weil du gesagt hast, es ist nicht sehr wichtig 145 00:05:07,558 --> 00:05:09,036 und B hat falsch geantwortet. 146 00:05:09,036 --> 00:05:12,392 B hat also 50 von 51 möglichen Punkten erzielt. 147 00:05:12,392 --> 00:05:14,023 Das bedeutet zu 98% zufriedenstellend. 148 00:05:14,023 --> 00:05:15,220 Das ist ganz gut. 149 00:05:15,220 --> 00:05:16,832 Die zweite Frage des Algorithmus betrifft 150 00:05:16,832 --> 00:05:18,918 Bs Zufriedenheit mit dir. 151 00:05:18,918 --> 00:05:20,768 B vergab 1 Punkt auf deine Antwort 152 00:05:20,768 --> 00:05:22,353 bezüglich der Sauberkeit 153 00:05:22,353 --> 00:05:24,745 und 10 auf deine zweite Antwort. 154 00:05:24,745 --> 00:05:27,156 Von diesen 11 Punkten – das sind 1 plus 10 – 155 00:05:27,156 --> 00:05:28,324 hast du 10 bekommen. 156 00:05:28,324 --> 00:05:30,617 Bei der 2. Frage waren beide mit der Antwort zufrieden. 157 00:05:30,617 --> 00:05:32,611 deine 10 Punkte von 11 158 00:05:32,611 --> 00:05:35,240 liefern 91% Zufriedenheit bei B. 159 00:05:35,240 --> 00:05:36,117 Das ist nicht übel. 160 00:05:36,117 --> 00:05:38,286 Im letzten Schritt nehmen wir diese beiden Prozentsätze 161 00:05:38,286 --> 00:05:40,454 und basteln daraus eine Zahl für euch beide. 162 00:05:40,454 --> 00:05:42,747 Dazu multipliziert der Algorithmus eure Punkte, 163 00:05:42,747 --> 00:05:44,500 zieht die n-te Wurzel daraus, 164 00:05:44,500 --> 00:05:46,792 n ist die Anzahl der Fragen. 165 00:05:46,792 --> 00:05:49,401 Denn "s" – die Anzahl der Fragen – 166 00:05:49,401 --> 00:05:51,507 hier ist nur 2, 167 00:05:51,507 --> 00:05:54,093 und unsere Trefferquote ist 168 00:05:54,093 --> 00:05:58,154 die Quadratwurzel aus 98% mal 91%. 169 00:05:58,154 --> 00:06:00,304 Das ergibt 94%. 170 00:06:00,304 --> 00:06:03,194 Deine Trefferquote mit B liegt bei 94%. 171 00:06:03,194 --> 00:06:04,561 So drückt die Mathematik aus, 172 00:06:04,561 --> 00:06:06,405 wie glücklich ihr miteinander 173 00:06:06,405 --> 00:06:07,749 auf Grundlage unserer Informationen wärt. 174 00:06:07,749 --> 00:06:10,131 Warum multipliziert der Algorithmus, 175 00:06:10,131 --> 00:06:12,284 anstatt den Durchschnitt der beiden Ergebnisse insgesamt 176 00:06:12,284 --> 00:06:14,530 und die Quadratwurzel auszurechnen? 177 00:06:14,530 --> 00:06:16,479 Diese Formel nennt man den geometrischen Mittelwert. 178 00:06:16,479 --> 00:06:17,881 Damit kann man sehr gut Werte miteinander kombinieren, 179 00:06:17,881 --> 00:06:19,076 die eine große Spannweite haben 180 00:06:19,076 --> 00:06:20,861 und ganz verschiedene Eigenschaften darstellen. 181 00:06:20,861 --> 00:06:23,164 Anders gesagt, ist es für romantische Treffer perfekt. 182 00:06:23,164 --> 00:06:24,248 Es gibt eine große Spannweite 183 00:06:24,248 --> 00:06:26,206 und Unmengen verschiedener Datenpunkte, 184 00:06:26,206 --> 00:06:27,156 wie z. B. über Filme, 185 00:06:27,156 --> 00:06:28,006 Politik, 186 00:06:28,006 --> 00:06:29,201 Religion, 187 00:06:29,201 --> 00:06:30,395 über alles. 188 00:06:30,395 --> 00:06:32,256 Auch intuitiv ist das sinnvoll. 189 00:06:32,256 --> 00:06:34,918 Zwei Menschen mit gegenseitig 50% Zufriedenheit 190 00:06:34,918 --> 00:06:36,052 sollten besser zusammenpassen 191 00:06:36,052 --> 00:06:39,180 als zwei andere mit einer Zufriedenheit von 0 und 100, 192 00:06:39,180 --> 00:06:40,847 weil Zuneigung beiderseitig sein muss. 193 00:06:40,847 --> 00:06:43,147 Nach einer kleinen Korrektur für Fehlerspielräume, 194 00:06:43,147 --> 00:06:45,770 falls wir nur sehr wenige Fragen haben, 195 00:06:45,770 --> 00:06:47,234 wie hier in diesem Beispiel, 196 00:06:47,234 --> 00:06:48,811 können wir loslegen. 197 00:06:48,811 --> 00:06:50,191 Jedesmal, wenn OKCupid zwei Menschen zusammenführt, 198 00:06:50,191 --> 00:06:52,234 werden alle angesprochenen Schritte durchgegangen. 199 00:06:52,234 --> 00:06:54,484 Zuerst werden Daten über deine Antworten gesammelt, 200 00:06:54,484 --> 00:06:56,619 danach deine Wünsche und Vorlieben 201 00:06:56,619 --> 00:06:59,740 mit anderen Menschen auf einfache, mathematische Weise verglichen. 202 00:06:59,740 --> 00:07:02,453 Diese Fähigkeit, Phänomene der realen Welt 203 00:07:02,453 --> 00:07:05,167 in etwas umzuwandeln, das ein Mikrochip verstehen kann, 204 00:07:05,167 --> 00:07:05,742 ist meiner Meinung nach 205 00:07:05,742 --> 00:07:08,565 die wichtigste Fähigkeit, die jemand heutzutage haben kann. 206 00:07:08,565 --> 00:07:10,919 So wie du Sätze verwendest, um jemandem eine Geschichte zu erzählen, 207 00:07:10,919 --> 00:07:13,665 verwendet man Algorithmen, um einem Computer eine Geschichte zu erzählen. 208 00:07:13,665 --> 00:07:14,921 Wenn du die Sprache erlernen kannst, 209 00:07:14,921 --> 00:07:16,381 kannst du der Welt deine Geschichten erzählen. 210 00:07:16,381 --> 00:07:18,768 Dies wird dir hoffentlich dabei helfen.