0:00:17.602,0:00:19.239 Witam, nazywam się Christian Rudder. 0:00:19.239,0:00:21.875 Jestem jednym z założycieli OK Cupid. 0:00:21.875,0:00:24.502 To jeden z największych[br]portali randkowych w USA. 0:00:24.502,0:00:25.749 Jak niemal każdy z założycieli, 0:00:25.749,0:00:27.296 skończyłem matematykę, 0:00:27.296,0:00:28.644 dlatego nasz portal[br]stosuje metodę analityczną 0:00:28.644,0:00:29.887 wobec miłości. 0:00:29.887,0:00:31.717 Nazywamy to algorytmem dopasowania. 0:00:31.717,0:00:33.428 Ten algorytm pomaga nam stwierdzić, 0:00:33.428,0:00:36.481 czy dwoje ludzi powinno[br]umówić się na randkę. 0:00:36.481,0:00:38.765 Na tej zasadzie zbudowaliśmy cały biznes. 0:00:38.765,0:00:40.572 Algorytm to takie wyszukane słowo, 0:00:40.572,0:00:43.047 a ludzie lubią czuć,[br]że robią coś wielkiego 0:00:43.047,0:00:45.148 ale tak naprawdę,[br]algorytm to po prostu 0:00:45.148,0:00:47.817 metoda rozwiązywania problemów[br]krok po kroku. 0:00:47.817,0:00:49.949 To wcale nie jest takie niezwykłe. 0:00:49.949,0:00:51.802 W tej lekcji pokażę, 0:00:51.802,0:00:53.657 jak doszliśmy do naszego algorytmu, 0:00:53.657,0:00:55.660 żebyś rozumiał, jak to robimy. 0:00:55.660,0:00:57.576 Właściwie dlaczego te algorytmy są ważne? 0:00:57.576,0:00:59.045 Po co ta cała lekcja? 0:00:59.045,0:01:02.457 Jak wcześniej powiedziałem, 0:01:02.457,0:01:05.029 to metoda rozwiązywania problemów[br]krok po kroku 0:01:05.029,0:01:05.841 a jak wiesz, 0:01:05.841,0:01:08.470 komputery są w tym świetne. 0:01:08.470,0:01:09.588 Komputer bez algorytmu 0:01:09.588,0:01:12.933 to tylko droga kupa złomu. 0:01:12.933,0:01:15.430 A ponieważ komputery są wszechobecne 0:01:15.430,0:01:17.223 algorytmy są wszędzie. 0:01:18.515,0:01:20.267 Matematyka do algorytmu w portalu OK Cupid 0:01:20.267,0:01:21.811 jest bardzo prosta. 0:01:21.811,0:01:22.629 Trochę dodawania, 0:01:22.629,0:01:23.687 mnożenia, 0:01:23.687,0:01:25.340 i pierwiastków. 0:01:25.340,0:01:27.611 Cały trick polega na tym, 0:01:27.611,0:01:30.235 żeby umieć przerobić coś zagadkowego, 0:01:30.235,0:01:31.212 czyli lubienie innych ludzi, 0:01:31.212,0:01:33.810 na kroki, które komputer może wykonać. 0:01:33.810,0:01:36.360 Najpierw potrzebujemy od ludzi danych, 0:01:36.360,0:01:38.382 bo użyjemy ich do naszego algorytmu. 0:01:38.382,0:01:40.412 Najprościej jest zwyczajnie 0:01:40.412,0:01:41.747 zadawać ludziom pytania. 0:01:41.747,0:01:44.166 W OK Cupid znajdziesz pytania takie jak: 0:01:44.166,0:01:46.834 "Czy chcesz mieć kiedyś dzieci?" 0:01:46.834,0:01:48.754 "Jak często myjesz zęby?" 0:01:48.754,0:01:50.227 "Czy lubisz straszne filmy?" 0:01:50.227,0:01:53.514 i poważne pytania, np. "Czy wierzysz w Boga?". 0:01:53.514,0:01:55.308 Wiele pytań pozwala 0:01:55.308,0:01:56.381 dopasować ludzi, 0:01:56.381,0:01:59.052 kiedy oboje odpowiedzą[br]na dane pytanie tak samo. 0:01:59.052,0:02:01.471 Np. kiedy oboje lubią straszne filmy, 0:02:01.471,0:02:02.684 będą lepiej do siebie pasować, 0:02:02.684,0:02:03.843 niż kiedy jedno je lubi, 0:02:03.843,0:02:05.115 a drugie nie. 0:02:05.115,0:02:06.480 Ale przy pytaniu typu: 0:02:06.480,0:02:08.189 "Czy lubisz być w centrum uwagi?", 0:02:08.189,0:02:10.729 jeśli oboje w związku to lubią, 0:02:10.729,0:02:13.068 to będą mieć poważne problemy. 0:02:13.068,0:02:14.447 Przewidzieliśmy to, 0:02:14.447,0:02:15.614 więc postanowiliśmy uzyskać 0:02:15.614,0:02:17.581 nieco więcej danych przy takich pytaniach. 0:02:17.581,0:02:20.332 Zapytaliśmy ludzi nie tylko o ich odpowiedź, 0:02:20.332,0:02:23.038 ale też, jakiej odpowiedzi chcą[br]od drugiej osoby. 0:02:23.038,0:02:24.207 To był dobry pomysł, 0:02:24.207,0:02:26.291 ale brakowało jeszcze jednego wymiaru. 0:02:26.291,0:02:28.835 Niektóre pytania mówią więcej[br]o osobie, niż inne. 0:02:28.835,0:02:31.795 Np. pytanie o politykę: 0:02:31.795,0:02:34.589 "Co jest gorsze:[br]palenie książek czy palenie flag?" 0:02:34.589,0:02:37.207 może ujawnić więcej o osobie,[br]niż gust filmowy. 0:02:37.207,0:02:39.387 A ponieważ nie wszystko ma[br]takie samo znaczenie, 0:02:39.387,0:02:41.605 dodaliśmy jeszcze jeden parametr. 0:02:41.605,0:02:43.440 Przy każdym pytaniu w OK Cupid 0:02:43.440,0:02:44.642 jest wskaźnik 0:02:44.642,0:02:46.223 jak dana sprawa jest ważna dla ciebie 0:02:46.223,0:02:49.089 w skali od "nieważne" do "konieczne". 0:02:49.089,0:02:50.564 Czyli teraz dla każdego pytania 0:02:50.564,0:02:52.692 mamy 3 parametry dla naszego algorytmu: 0:02:52.692,0:02:54.068 1. twoja odpowiedź 0:02:54.068,0:02:56.362 2. czego chcesz od drugiej osoby – 0:02:56.362,0:02:57.196 potencjalnego partnera, 0:02:57.196,0:02:58.781 jak ta osoba ma odpowiedzieć 0:02:58.781,0:03:02.327 3. jak ważna dana sprawa jest dla ciebie. 0:03:02.327,0:03:03.702 Na bazie tych danych 0:03:03.702,0:03:07.128 OK Cupid wylicza,[br]czy dwoje ludzi do siebie pasuje. 0:03:07.128,0:03:09.458 Algorytm przelicza dane[br]i podaje wynik. 0:03:09.458,0:03:11.262 Na przykład, 0:03:11.262,0:03:13.712 spróbujmy dopasować ciebie[br]do drugiej osoby, 0:03:13.712,0:03:15.581 nazwijmy go "B". 0:03:15.581,0:03:17.479 Twoja zgodność z B opiera się 0:03:17.479,0:03:19.424 na odpowiedziach podanych[br]przez was oboje. 0:03:19.424,0:03:21.978 Nazwijmy sumę tych pytań "s". 0:03:21.978,0:03:24.932 Weźmy tylko kilka pytań dla naszego "s" 0:03:24.932,0:03:26.434 np. dwa pytania 0:03:26.434,0:03:28.310 i obliczmy, co wyjdzie. 0:03:28.310,0:03:30.144 Powiedzmy takie dwa pytania: 0:03:30.144,0:03:32.349 1. "Czy jesteś bałaganiarzem?" 0:03:32.349,0:03:34.669 możliwe odpowiedzi to: 0:03:34.669,0:03:35.618 tak, bardzo bałaganię, 0:03:35.618,0:03:36.398 przeciętnie 0:03:36.398,0:03:38.172 jestem bardzo zorganizowany. 0:03:38.172,0:03:39.755 Załóżmy, że twoja odpowiedź to[br]"bardzo zorganizowany", 0:03:39.755,0:03:42.581 i chcesz, żeby druga osoba[br]odpowiedziała podobnie 0:03:42.581,0:03:45.202 i ta sprawa jest dla ciebie bardzo istotna. 0:03:45.202,0:03:46.498 Po prostu nie tolerujesz bałaganu. 0:03:46.498,0:03:47.212 Ma być porządek, 0:03:47.212,0:03:48.296 i druga osoba[br]też ma utrzymywać porządek 0:03:48.296,0:03:49.248 i kropka. 0:03:49.248,0:03:51.015 Teraz powiedzmy,[br]że B jest nieco inny. 0:03:51.015,0:03:53.539 Jest bardzo zorganizowany, 0:03:53.539,0:03:55.171 ale wystarczy mu przeciętny porządek, 0:03:55.171,0:03:56.740 jako wymaganie stawiane drugiej osobie, 0:03:56.740,0:03:58.748 a cała sprawa jest dla niego[br]prawie nieistotna. 0:03:58.748,0:04:00.308 Przejdźmy do drugiego pytania. 0:04:00.308,0:04:01.896 Użyjmy pytania,[br]które pojawiło się wcześniej: 0:04:01.896,0:04:03.653 "Czy lubisz być w centrum uwagi?". 0:04:03.653,0:04:05.231 Możliwe opcje to "tak" i "nie". 0:04:05.231,0:04:06.407 Odpowiadasz "nie", 0:04:06.407,0:04:08.235 i wolisz, żeby druga osoba[br]też powiedziała "nie", 0:04:08.235,0:04:10.862 a ta sprawa nie ma dla ciebie znaczenia. 0:04:10.862,0:04:12.419 Ale B odpowiedział "tak", 0:04:12.419,0:04:14.087 chce, żeby druga osoba powiedziała "nie", 0:04:14.087,0:04:16.332 bo chce, żeby cała uwaga[br]skupiła się na nim, 0:04:16.332,0:04:19.334 i jest to dla niego trochę istotne. 0:04:19.334,0:04:21.716 Teraz spróbujmy to przekalkulować. 0:04:21.716,0:04:22.855 Na początku, 0:04:22.855,0:04:24.376 ponieważ używamy komputera, 0:04:24.376,0:04:26.162 musimy przyporządkować[br]wartości numeryczne 0:04:26.162,0:04:29.041 do odpowiedzi typu[br]"dosyć istotne" i "bardzo ważne", 0:04:29.041,0:04:31.335 bo komputer rozumie tylko liczby. 0:04:31.335,0:04:33.523 W portalu OK Cupid robimy to tak: 0:04:33.523,0:04:35.858 "nieważne" ma wartość 0, 0:04:35.858,0:04:38.307 "nieco istotne" = 1, 0:04:38.307,0:04:40.302 "dość istotne" = 10, 0:04:40.302,0:04:42.426 "bardzo istotne" = 50, 0:04:42.426,0:04:46.353 "absolutnie niezbędne" = 250. 0:04:46.353,0:04:48.852 Teraz nasz algorytm przelicza. 0:04:48.852,0:04:51.941 Najpierw sprawdza ile odpowiedzi[br]udzielonych przez B odpowiada twoim, 0:04:51.941,0:04:55.568 tzn. ile punktów uzyskał na twojej skali. 0:04:55.568,0:04:58.138 Dla ciebie odpowiedź osoby B 0:04:58.138,0:04:59.947 na pytanie o bałaganiarstwo, 0:04:59.947,0:05:01.448 była bardzo ważna. 0:05:01.448,0:05:04.041 Czyli na wartość 50 punktów,[br]jeśli B odpowie prawidłowo. 0:05:04.041,0:05:05.947 Drugie pytanie ma wartość zaledwie 1 0:05:05.947,0:05:07.558 bo powiedziałaś,[br]że jest tylko nieco istotne, 0:05:07.558,0:05:09.036 a B odpowiedział coś innego. 0:05:09.036,0:05:12.392 Czyli odpowiedzi B to 50 na 51[br]możliwych punktów. 0:05:12.392,0:05:14.023 To 98% zgodności. 0:05:14.023,0:05:15.220 Nieźle. 0:05:15.220,0:05:16.832 Drugi krok w algorytmie to to, 0:05:16.832,0:05:18.918 jak bardzo twoje odpowiedzi[br]zgadzają się z B. 0:05:18.918,0:05:20.768 B przyznał 1 punkt twojej odpowiedzi 0:05:20.768,0:05:22.353 na pytanie o bałaganiarstwo, 0:05:22.353,0:05:24.745 a 10 – twojej odpowiedzi na drugie pytanie. 0:05:24.745,0:05:27.156 1 + 10 = 11, i z tych 11. 0:05:27.156,0:05:28.324 uzyskałeś 10, 0:05:28.324,0:05:30.617 bo w drugim pytaniu[br]podałaś pożądaną odpowiedź. 0:05:30.617,0:05:32.611 Więc twoje odpowiedzi[br]to 10 punktów na 11, 0:05:32.611,0:05:35.240 co daje 91% zgodności. 0:05:35.240,0:05:36.117 Też nieźle. 0:05:36.117,0:05:38.286 Ostatni krok to porównanie[br]tych dwóch procentów 0:05:38.286,0:05:40.454 i ustalenie procentu ogólnego[br]dla was obojga. 0:05:40.454,0:05:42.747 Teraz algorytm mnoży wasze wyniki 0:05:42.747,0:05:44.500 następnie wyciąga z nich n-ty pierwiastek, 0:05:44.500,0:05:46.792 gdzie n to liczba pytań 0:05:46.792,0:05:49.401 bo s, czyli suma pytań 0:05:49.401,0:05:51.507 w naszym przykładzie wynosiła 2. 0:05:51.507,0:05:54.093 Procent zgodności równa się 0:05:54.093,0:05:58.154 pierwiastkowi kwadratowemu z 98% razy 91% 0:05:58.154,0:06:00.304 czyli 94%. 0:06:00.304,0:06:03.194 To 94% to twoja zgodność z osobą B. 0:06:03.194,0:06:04.561 To matematyczny zapis tego, 0:06:04.561,0:06:06.405 jak szczęśliwi możecie być ze sobą 0:06:06.405,0:06:07.749 na podstawie podanych odpowiedzi. 0:06:07.749,0:06:10.131 Możesz zapytać,[br]dlaczego algorytm mnoży, 0:06:10.131,0:06:12.284 a nie np. wyciąga średnią[br]z obu wyników 0:06:12.284,0:06:14.530 i po co wyciąga pierwiastek. 0:06:14.530,0:06:16.479 Ta zasada nosi nazwę[br]średniej geometrycznej, 0:06:16.479,0:06:17.881 która jest dobrym sposobem[br]porównywania wartości, 0:06:17.881,0:06:19.076 które mają szeroki zakres 0:06:19.076,0:06:20.861 i odpowiadają wielu różnym wartościom. 0:06:20.861,0:06:23.164 Innymi słowy,[br]jest idealna dla szukania partnera. 0:06:23.164,0:06:24.248 Mamy tu szeroki zakres 0:06:24.248,0:06:26.206 i ogromną liczbę parametrów 0:06:26.206,0:06:27.156 jak już wspomniałem: filmy, 0:06:27.156,0:06:28.006 polityka, 0:06:28.006,0:06:29.201 religia, 0:06:29.201,0:06:30.395 wszystko. 0:06:30.395,0:06:32.256 To ma też intuicyjny sens. 0:06:32.256,0:06:34.918 Dwoje ludzi ze zgodnością 50% 0:06:34.918,0:06:36.052 będzie bardziej do siebie pasować, 0:06:36.052,0:06:39.180 niż dwoje ze zgodnością 0 i 100, 0:06:39.180,0:06:40.847 bo uczucie musi być wzajemne. 0:06:40.847,0:06:43.147 Po drobnych poprawkach[br]i z marginesem błędu, 0:06:43.147,0:06:45.770 kiedy mamy małą liczbę pytań, 0:06:45.770,0:06:47.234 jak w naszym przykładzie, 0:06:47.234,0:06:48.811 jesteśmy gotowi na randkę. 0:06:48.811,0:06:50.191 Gdy OK Cupid swata dwoje ludzi 0:06:50.191,0:06:52.234 wykonuje kroki,[br]które właśnie widzieliśmy. 0:06:52.234,0:06:54.484 Najpierw prosi[br]o odpowiedzi na pytania, 0:06:54.484,0:06:56.619 potem matematycznie porównuje[br]twoje preferencje 0:06:56.619,0:06:59.740 z odpowiedziami innych osób. 0:06:59.740,0:07:02.453 Zdolność przekształcenia zjawisk[br]w realnym życiu 0:07:02.453,0:07:05.167 w dane,[br]które procesor może zrozumieć 0:07:05.167,0:07:05.742 jest według mnie 0:07:05.742,0:07:08.565 najważniejszą umiejętnością[br]w dzisiejszych czasach. 0:07:08.565,0:07:10.919 Ludzie mówią zdaniami,[br]żeby coś przekazać, 0:07:10.919,0:07:13.665 komputery zaś używają[br]do komunikacji algorytmów. 0:07:13.665,0:07:14.921 Kiedy uczysz się języka, 0:07:14.921,0:07:16.381 możesz coś w nim opowiedzieć. 0:07:16.381,0:07:18.768 Mam nadzieję,[br]że teraz będzie ci łatwiej.