0:00:00.880,0:00:02.735 Kiedyś było tak, 0:00:02.735,0:00:04.590 że aby komputer coś zrobił, 0:00:04.590,0:00:06.447 trzeba go było zaprogramować. 0:00:06.447,0:00:09.398 Dla tych, którzy tego nie robili: 0:00:09.398,0:00:13.470 programowanie wymaga[br]drobiazgowego zdefiniowania [br] 0:00:13.470,0:00:16.727 każdego kroku, który komputer ma wykonać, 0:00:16.727,0:00:18.614 by osiągnąć cel. 0:00:18.614,0:00:21.221 Jeżeli chcemy,[br]by komputer wykonał czynność, 0:00:21.221,0:00:23.070 której sami nie potrafimy wykonać, 0:00:23.079,0:00:24.648 stajemy przed dużym wyzwaniem. 0:00:24.648,0:00:28.131 Stanął przed nim Artur Samuel. 0:00:28.131,0:00:31.348 W 1956 roku stwierdził, że chciałby, 0:00:31.348,0:00:34.548 aby komputer wygrał z nim w warcaby. 0:00:34.548,0:00:36.018 Jak napisać program, 0:00:36.018,0:00:38.547 drobiazgowo wyrazić, [br]jak być lepszym w warcaby 0:00:38.547,0:00:40.196 niż jest się samemu? 0:00:40.196,0:00:42.116 Artur wpadł na następujący pomysł: 0:00:42.116,0:00:45.840 kazał komputerowi [br]grać z samym sobą tysiące razy 0:00:45.840,0:00:48.364 i w ten sposób nauczyć się gry. 0:00:48.364,0:00:50.314 Rzeczywiście się udało. 0:00:50.314,0:00:55.561 W 1962 roku komputer pokonał[br]mistrza stanu Connecticut. 0:00:55.561,0:00:58.534 Artur Samuel był ojcem[br]uczenia maszynowego. 0:00:58.534,0:01:00.251 Mam wobec niego duży dług, 0:01:00.251,0:01:02.404 bo sam zajmuję się[br]uczeniem maszynowym. 0:01:02.404,0:01:04.051 Byłem przewodniczącym Kaggle, 0:01:04.051,0:01:06.888 społeczności zrzeszającej [br]200 tys. specjalistów 0:01:06.888,0:01:08.367 od programowania maszynowego. 0:01:08.367,0:01:10.122 Kaggle organizuje konkursy, 0:01:10.122,0:01:11.757 podczas których członkowie próbują 0:01:11.757,0:01:13.833 rozwiązać dotąd nierozwiązane problemy. 0:01:13.833,0:01:17.470 Udało się to już setki razy. 0:01:17.470,0:01:20.120 Z tej perspektywy wiele się dowiedziałem 0:01:20.120,0:01:23.950 o dawnych i obecnych [br]możliwościach uczenia maszynowego, 0:01:23.950,0:01:26.252 i co będzie możliwe w przyszłości. 0:01:26.252,0:01:28.135 Chyba pierwszym dużym sukcesem 0:01:28.135,0:01:30.571 w komercyjnym zastosowaniu[br]uczenia maszynowego 0:01:30.571,0:01:33.944 był Google, który udowodnił,[br]że da się szukać informacji 0:01:33.944,0:01:35.856 przy pomocy algorytmu komputerowego, 0:01:35.856,0:01:37.802 opartego o uczenie maszynowe. 0:01:37.802,0:01:41.928 Odtąd było wiele udanych[br]komercyjnych zastosowań. 0:01:41.928,0:01:43.844 Firmy takie jak Amazon czy Netflix 0:01:43.844,0:01:47.110 używają uczenia maszynowego[br]do proponowania produktów 0:01:47.110,0:01:49.770 lub filmów, które nas zaciekawią. 0:01:49.776,0:01:51.986 Czasem przyprawia to o gęsią skórkę. 0:01:51.986,0:01:53.463 Firmy jak LinkedIn czy Facebook 0:01:53.463,0:01:56.077 mówią nam czasem, kogo znamy, 0:01:56.077,0:01:58.191 i nie mamy pojęcia, jak to robią. 0:01:58.191,0:02:01.178 Wykorzystują moc uczenia maszynowego. 0:02:01.195,0:02:04.302 To algorytmy, które uczą się z danych, 0:02:04.302,0:02:07.399 nie zaś przez ręczne programowanie. 0:02:07.399,0:02:11.225 To również dlatego[br]komputer Watson firmy IBM 0:02:11.225,0:02:14.059 potrafił pokonać dwóch [br]mistrzów świata w grze "Va Banque", 0:02:14.059,0:02:17.484 odpowiadając na niezwykle subtelne[br]i skomplikowane pytania takie jak to: 0:02:17.484,0:02:20.819 Antyczny "Lew z Kalchu" zginął z muzeum[br]w tym mieście w 2003 roku. 0:02:20.819,0:02:23.514 Także dlatego mamy pierwsze[br]samokierujące samochody. 0:02:23.514,0:02:26.936 Możliwość odróżnienia, powiedzmy,[br]drzewa i przechodnia, 0:02:26.936,0:02:28.488 jest dosyć istotna. 0:02:28.488,0:02:31.075 Nie wiemy, jak zaprogramować to ręcznie, 0:02:31.075,0:02:34.072 ale potrafimy to zrobić[br]przez uczenie maszynowe. 0:02:34.072,0:02:37.510 Ten samochód przejechał już[br]ponad 2 mln kilometrów 0:02:37.510,0:02:40.186 po zwykłych drogach, bez wypadków. 0:02:40.196,0:02:44.110 Czyli komputery potrafią się uczyć 0:02:44.110,0:02:46.010 i potrafią uczyć się rzeczy, 0:02:46.010,0:02:48.848 których czasem sami nie potrafimy robić, 0:02:48.848,0:02:51.733 lub potrafią je robić lepiej niż my. 0:02:51.733,0:02:55.348 Jeden z niezwykłych przykładów[br]uczenia maszynowego 0:02:55.348,0:02:58.320 zdarzył się w projekcie,[br]który prowadziłem w Kaggle. 0:02:58.320,0:03:01.911 Zespół, którym kierował Geoffrey Hinton 0:03:01.911,0:03:03.463 z Uniwersytetu w Toronto, 0:03:03.463,0:03:06.140 wygrał konkurs na automatyczne[br]odkrywanie leków. 0:03:06.140,0:03:08.987 Co niezwykłe, [br]nie tylko przebili wszystkie algorytmy 0:03:08.987,0:03:13.011 firmy Merck i międzynarodowej [br]społeczności akademickiej, 0:03:13.011,0:03:16.230 ale też nikt w zespole nie miał[br]żadnej wiedzy z chemii, biologii 0:03:16.260,0:03:17.820 czy nauki o organizmach żywych, 0:03:17.820,0:03:20.230 a zrobili to w dwa tygodnie. 0:03:20.230,0:03:22.241 Jak im się to udało? 0:03:22.241,0:03:25.342 Użyli niezwykłego algorytmu,[br]zwanego uczeniem głębokim. 0:03:25.342,0:03:28.191 To wydarzenie było tak ważne,[br]że kilka tygodni później 0:03:28.191,0:03:31.412 New York Times pisał o nim[br]na stronie głównej. 0:03:31.412,0:03:34.147 Po lewej stronie widoczny[br]jest Geoffrey Hinton. 0:03:34.147,0:03:39.278 Uczenie głębokie to algorytm zainspirowany[br]sposobem działania ludzkiego mózgu, 0:03:39.278,0:03:43.831 przez co nie ma żadnych [br]teoretycznych ograniczeń. 0:03:43.831,0:03:46.774 Im więcej dostaje danych,[br]im więcej czasu obliczeniowego, 0:03:46.774,0:03:48.456 tym staje się lepszy. 0:03:48.456,0:03:50.615 New York Times przedstawił też w artykule 0:03:50.615,0:03:53.187 inne niezwykłe osiągniecie[br]uczenia głębokiego, 0:03:53.187,0:03:55.129 które teraz zaprezentuję. 0:03:55.899,0:04:00.090 Udowadnia ono, że komputery [br]potrafią słuchać i rozumieć. 0:04:00.510,0:04:03.221 (Wideo) Richard Rashid: Ostatni krok, 0:04:03.221,0:04:06.246 który chciałbym wykonać w tym procesie, 0:04:06.246,0:04:10.961 to przemówić do was po chińsku. 0:04:10.961,0:04:13.596 Chodzi o to, że udało nam się 0:04:13.596,0:04:18.598 wziąć dużą ilość informacji[br]od osób mówiących po chińsku 0:04:18.598,0:04:21.128 i stworzyć system syntezy mowy, 0:04:21.128,0:04:25.801 który konwertuje chiński tekst na mowę. 0:04:25.801,0:04:29.929 Potem wzięliśmy godzinne[br]nagranie mojego głosu 0:04:29.929,0:04:34.220 i użyliśmy go do zmodulowania [br]standardowego systemu syntezy mowy, 0:04:34.220,0:04:35.911 żeby brzmiał jak ja. 0:04:35.911,0:04:38.904 Efekt nie jest bezbłędny. 0:04:38.904,0:04:41.552 W sumie jest nawet sporo błędów. 0:04:41.552,0:04:44.036 (Po chińsku) 0:04:44.036,0:04:46.383 (Oklaski) 0:04:49.446,0:04:53.022 Ta dziedzina wymaga jeszcze dużo pracy. 0:04:53.022,0:04:56.667 (Po chińsku) 0:04:56.667,0:04:59.090 (Oklaski) 0:05:00.735,0:05:04.744 JH: To był fragment konferencji[br]na temat uczenia maszynowego w Chinach. 0:05:04.744,0:05:08.904 Na akademickich konferencjach[br]rzadko słyszy się spontaniczny aplauz. 0:05:09.011,0:05:11.177 Na konferencjach TEDx[br]zdarza się to częściej, 0:05:11.177,0:05:12.580 więc proszę się nie krępować.[br] 0:05:12.580,0:05:16.193 Wszystko, co tu widzieliście, [br]osiągnięto przez uczenie głębokie. 0:05:16.193,0:05:17.127 (Oklaski) Dziękuję. 0:05:17.127,0:05:19.289 Transkrypcja na angielski[br]to uczenie głębokie. 0:05:19.289,0:05:22.701 Tłumaczenie na chiński i tekst[br]w prawym górnym rogu - uczenie głębokie, 0:05:22.701,0:05:26.008 synteza mowy to również uczenie głębokie. 0:05:26.008,0:05:29.242 Uczenie głębokie jest niezwykłe. 0:05:29.242,0:05:32.341 To pojedynczy algorytm, [br]który jakby umie wszystko. 0:05:32.341,0:05:35.452 Odkryłem, że rok wcześniej [br]nauczył się również widzieć. 0:05:35.452,0:05:37.548 W mało znanym konkursie w Niemczech 0:05:37.548,0:05:40.295 na rozpoznawanie znaków drogowych 0:05:40.295,0:05:42.009 uczenie głębokie nauczyło się 0:05:42.009,0:05:43.723 rozpoznawać takie znaki drogowe. 0:05:43.723,0:05:45.438 Nie tylko rozpoznawało znaki 0:05:45.438,0:05:47.168 lepiej niż inne algorytmy, 0:05:47.168,0:05:49.640 ale nawet lepiej niż ludzie, 0:05:49.640,0:05:51.499 mniej więcej dwa razy lepiej. 0:05:51.811,0:05:54.037 Czyli w 2011 r. mieliśmy pierwszy przykład 0:05:54.037,0:05:57.442 komputerów widzących lepiej niż ludzie. 0:05:57.442,0:05:59.491 Od tego czasu bardzo dużo się wydarzyło. 0:05:59.491,0:06:03.005 W 2012 r. Google ogłosił, [br]że ich algorytm uczenia głębokiego 0:06:03.005,0:06:04.420 oglądał filmy na YouTube 0:06:04.420,0:06:07.857 i przez miesiąc przetwarzał dane [br]na 16 tysiącach serwerów, 0:06:07.857,0:06:10.077 po czym samodzielnie nauczył się pojęć 0:06:10.077,0:06:11.797 takich jak ludzie czy koty, 0:06:11.797,0:06:13.767 tylko przez oglądanie filmów. 0:06:13.767,0:06:16.489 W bardzo podobny sposób uczą się ludzie. 0:06:16.489,0:06:19.329 Nie trzeba im mówić, na co patrzą, 0:06:19.329,0:06:22.590 tylko sami się uczą się,[br]czym są widziane obiekty. 0:06:22.590,0:06:25.819 W 2012 roku Geoffrey Hinton,[br]którego widzieliśmy wcześniej, 0:06:25.819,0:06:28.677 wygrał bardzo popularny konkurs ImageNet, 0:06:28.677,0:06:32.818 gdzie dla 1,5 miliona obrazków [br]trzeba określić, 0:06:32.818,0:06:34.256 co się na nich znajduje. 0:06:34.256,0:06:38.892 Do 2014 r. proporcja błędów spadła do 6%. 0:06:38.892,0:06:41.488 To znowu lepiej, niż ludzie. 0:06:41.488,0:06:45.037 Maszyny są tu niesamowicie skuteczne 0:06:45.037,0:06:47.306 i wykorzystuje się to już komercyjnie. 0:06:47.306,0:06:50.348 Na przykład Google ogłosił w zeszłym roku, 0:06:50.348,0:06:54.933 że znaleźli na mapie wszystkie adresy[br]we Francji w dwie godziny 0:06:54.933,0:06:58.380 przez dostarczenie zdjęć Street View 0:06:58.380,0:07:02.699 algorytmowi uczenia głębokiego,[br]który rozpoznał i odczytał numery domów. 0:07:02.699,0:07:05.439 Wyobraźcie sobie,[br]ile czasu zajęłoby to kiedyś: 0:07:05.439,0:07:08.274 dziesiątki ludzi, wiele lat. 0:07:08.274,0:07:10.185 To samo dzieje się w Chinach. 0:07:10.185,0:07:14.221 Baidu jest czymś w rodzaju[br]chińskiego Google. 0:07:14.221,0:07:16.504 W lewym górnym rogu [br]widać przykładowe zdjęcie, 0:07:16.504,0:07:20.478 które wczytałem do systemu [br]uczenia głębokiego Baidu, 0:07:20.478,0:07:24.247 poniżej widać, że system zrozumiał,[br]co jest na zdjęciu 0:07:24.247,0:07:26.483 i znalazł podobne zdjęcia. 0:07:26.483,0:07:29.219 Te zdjęcia mają podobne tło, 0:07:29.219,0:07:30.877 podobny kierunek pysków, 0:07:30.877,0:07:32.665 niektórym nawet wystają języki. 0:07:32.665,0:07:35.695 Ten algorytm na pewno nie patrzy[br]na tekst na stronie, 0:07:35.695,0:07:37.107 wgrałem tylko zdjęcie. 0:07:37.107,0:07:41.128 Czyli dzisiejsze komputery[br]naprawdę rozumieją, co widzą, 0:07:41.128,0:07:43.652 i na żywo umieją przeszukiwać bazy danych 0:07:43.652,0:07:46.306 setek milionów zdjęć. 0:07:46.306,0:07:48.976 Co to właściwie znaczy,[br]że komputery mogą widzieć? 0:07:48.976,0:07:51.553 Nie chodzi o samo widzenie. 0:07:51.553,0:07:54.002 Uczenie głębokie dało znacznie więcej. 0:07:54.002,0:07:56.570 Złożone i pełne niuansów zdania, jak to, 0:07:56.570,0:07:59.394 są już zrozumiałe [br]dla algorytmów uczenia głębokiego. 0:07:59.394,0:08:00.697 Jak widać tutaj, 0:08:00.697,0:08:02.645 system z Uniwersytetu Stanforda 0:08:02.645,0:08:04.906 zaznaczył czerwoną kropką na górze,[br] 0:08:04.906,0:08:07.657 że to zdanie wyraża negację. 0:08:07.657,0:08:10.790 Efektywność uczenia głębokiego [br]jest zbliżona do ludzkiej 0:08:10.802,0:08:15.923 w rozumieniu sensu zdania i analizie. 0:08:15.923,0:08:18.651 Uczenie głębokie zastosowano[br]do czytania chińskiego 0:08:18.651,0:08:21.807 na poziomie zbliżonym [br]do rodzimych użytkowników. 0:08:21.807,0:08:23.975 Ten algorytm opracował szwajcarski zespół, 0:08:23.975,0:08:27.711 którego członkowie nie znają chińskiego. 0:08:27.711,0:08:29.382 Jak wspomniałem, uczenie głębokie 0:08:29.382,0:08:31.601 jest w tym najlepsze, 0:08:31.601,0:08:34.168 nawet w porównaniu z rozumieniem 0:08:34.168,0:08:36.735 przez rodzimych użytkowników języka. 0:08:36.735,0:08:39.302 Ten system zbudowaliśmy w mojej firmie. 0:08:39.302,0:08:41.728 Pokazuje, jak można to wszystko[br]połączyć w całość. 0:08:41.728,0:08:44.189 To są zdjęcia bez żadnego opisu 0:08:44.189,0:08:46.541 i w trakcie wpisywania zdań 0:08:46.541,0:08:49.510 system na żywo rozpoznaje zdjęcia, 0:08:49.510,0:08:51.189 ustala, co na nich jest, 0:08:51.189,0:08:54.352 i znajduje zdjęcia podobne do opisu. 0:08:54.352,0:08:57.108 Rzeczywiście rozumie, o czym piszę, 0:08:57.108,0:08:59.332 i rozumie, co jest na zdjęciach. 0:08:59.332,0:09:01.711 Pewnie znacie to z Google'a, 0:09:01.711,0:09:05.286 który znajduje zdjęcia [br]według wpisywanych słów, 0:09:05.286,0:09:08.680 choć w rzeczywistości wyszukuje[br]strony internetowe w oparciu o tekst. 0:09:08.680,0:09:12.001 To co innego niż rozumienie samych zdjęć. 0:09:12.001,0:09:16.383 Komputery potrafią to robić[br]dopiero od kilku miesięcy. 0:09:17.091,0:09:21.182 Czyli komputery potrafią[br]nie tylko widzieć, ale też czytać, 0:09:21.182,0:09:24.947 i potrafią też rozumieć, co słyszą. 0:09:24.947,0:09:27.756 Pewnie was nie zaskoczy, [br]że potrafią też pisać. 0:09:27.756,0:09:31.882 Ten tekst wygenerowałem wczoraj[br]przy pomocy uczenia głębokiego. 0:09:31.882,0:09:34.346 "Miło mi być tu z wami w Brukseli!" 0:09:34.346,0:09:37.050 Tę próbkę tekstu [br]wygenerował algorytm ze Stanford. 0:09:37.050,0:09:39.989 Uczenie głębokie wygenerowało te zdania, 0:09:39.989,0:09:43.061 aby opisać każde z tych zdjęć. 0:09:43.061,0:09:45.741 Ten algorytm nigdy przedtem nie widział 0:09:45.741,0:09:48.363 mężczyzny w czarnej koszulce, [br]grającego na gitarze. 0:09:48.363,0:09:51.496 Widział mężczyznę,[br]widział czerń lub gitarę, 0:09:51.496,0:09:56.101 ale sam stworzył oryginalny opis zdjęcia. 0:09:56.101,0:10:00.056 Nadal nie dorównuje ludziom, [br]ale mało mu brakuje. 0:10:00.056,0:10:03.351 W testach ludzie preferują opisy[br]generowane przez komputer 0:10:03.351,0:10:04.995 w co czwartym przypadku. 0:10:04.995,0:10:06.831 Ten system powstał dwa tygodnie temu, 0:10:06.831,0:10:08.902 więc w tym tempie 0:10:08.902,0:10:11.594 algorytm komputerowy [br]prześcignie człowieka, 0:10:11.594,0:10:13.963 pewnie w ciągu kolejnego roku. 0:10:13.963,0:10:17.048 Czyli komputery potrafią też pisać. 0:10:17.048,0:10:19.990 Połączyliśmy to wszystko,[br]co daje ekscytujące możliwości. 0:10:19.990,0:10:21.485 Na przykład w medycynie: 0:10:21.485,0:10:23.974 zespół z Bostonu ogłosił odkrycie 0:10:23.974,0:10:28.310 dziesiątek nowych, [br]istotnych klinicznie cech nowotworów, 0:10:28.310,0:10:31.536 co pomoże lekarzom[br]w prognozowaniu postępów raka. 0:10:33.096,0:10:35.749 Grupa badaczy ze Stanford ogłosiła, 0:10:35.749,0:10:38.810 że badając tkanki w powiększeniu, 0:10:38.810,0:10:42.062 opracowali system [br]wykorzystujący uczenie maszynowe, 0:10:42.062,0:10:44.589 który lepiej niż patolodzy przewiduje 0:10:44.589,0:10:47.481 przeżywalność chorych na raka. 0:10:47.481,0:10:50.373 Prognozy były nie tylko trafniejsze, 0:10:50.373,0:10:53.266 ale dostarczyły nowej, wnikliwej wiedzy. 0:10:53.276,0:10:54.781 W przypadku radiologii 0:10:54.781,0:10:57.876 były to nowe wskaźniki kliniczne,[br]zrozumiałe dla ludzi. 0:10:57.876,0:10:59.668 W przypadku patologii 0:10:59.668,0:11:04.168 system komputerowy odkrył,[br]że komórki otaczające nowotwór 0:11:04.168,0:11:07.508 są tak samo istotne,[br]jak komórki nowotworowe 0:11:07.508,0:11:09.260 w postawieniu diagnozy. 0:11:09.260,0:11:13.961 To całkowicie przeczy[br]dotychczasowej wiedzy o patologii. 0:11:15.412,0:11:18.313 Oba te systemy[br]opracowali eksperci medyczni 0:11:18.313,0:11:21.214 we współpracy z ekspertami[br]od uczenia maszynowego. 0:11:21.214,0:11:23.655 W zeszłym roku [br]przekroczyliśmy i ten próg. 0:11:23.655,0:11:27.824 To jest przykład identyfikacji[br]zmian nowotworowych 0:11:27.824,0:11:30.354 w ludzkiej tkance badanej pod mikroskopem. 0:11:30.354,0:11:34.967 Prezentowany tu system potrafi[br]rozpoznawać te zmiany dokładniej 0:11:34.967,0:11:37.742 lub równie dokładnie, co patolog, 0:11:37.742,0:11:40.174 ale został zbudowany [br]przy użyciu uczenia głębokiego 0:11:40.174,0:11:41.640 bez żadnej wiedzy medycznej, 0:11:41.640,0:11:44.128 przez ludzi nie związanych z medycyną. 0:11:44.438,0:11:46.416 Podobnie z segmentacją neuronów. 0:11:46.416,0:11:50.234 Możemy segmentować neurony[br]równie dokładnie, jak ludzie, 0:11:50.234,0:11:52.658 przy użyciu systemu uczenia głębokiego, 0:11:52.658,0:11:55.472 opracowanego przez ludzi [br]bez wiedzy medycznej. 0:11:57.162,0:12:00.058 Zatem ja, jako osoba [br]bez żadnej wiedzy medycznej, 0:12:00.058,0:12:03.243 mam dostateczne kwalifikacje,[br]by założyć firmę medyczną, 0:12:03.243,0:12:04.790 co też zrobiłem. 0:12:06.021,0:12:07.761 Byłem tym dosyć przerażony, 0:12:07.761,0:12:10.084 ale teoria wskazywała, że w medycynie 0:12:10.084,0:12:15.477 można przydać się [br]samą techniką analizy danych. 0:12:16.142,0:12:18.622 Szczęśliwie, przyjęto nas fantastycznie, 0:12:18.622,0:12:21.578 zarówno media, jak i społeczność medyczna, 0:12:21.578,0:12:23.322 która bardzo wspierała ten projekt. 0:12:23.322,0:12:27.471 W teorii możemy przejąć [br]środkową część procesu medycznego 0:12:27.471,0:12:30.494 i zastąpić ją daleko idącą analizą danych,[br] 0:12:30.494,0:12:33.429 pozwalając lekarzom zająć się tym,[br]w czym są najlepsi. 0:12:33.429,0:12:35.031 Pokażę państwu przykład. 0:12:35.031,0:12:39.975 Generacja nowego testu diagnostycznego[br]zajmuje 15 minut. 0:12:39.975,0:12:41.929 Pokażę to teraz na żywo. 0:12:41.929,0:12:45.416 Skompresowałem to do trzech minut,[br]omijając pewne czynności. 0:12:45.416,0:12:48.477 Zamiast nowego testu diagnostycznego [br]w medycynie, 0:12:48.477,0:12:51.846 pokażę test diagnostyczny samochodów, 0:12:51.846,0:12:54.068 bo jest to coś, co wszyscy rozumiemy. 0:12:54.068,0:12:57.269 Na początek mamy 1,5 mln zdjęć samochodów. 0:12:57.269,0:13:00.475 Chcę stworzyć coś, [br]co je pogrupuje według kąta, 0:13:00.475,0:13:02.698 z jakiego zostały sfotografowane. 0:13:02.698,0:13:06.586 To zdjęcia bez opisów, [br]więc trzeba zacząć od zera. 0:13:06.586,0:13:08.451 Nasz algorytm uczenia głębokiego 0:13:08.451,0:13:12.158 potrafi automatycznie rozpoznawać[br]struktury na zdjęciach. 0:13:12.158,0:13:15.778 Człowiek i komputer mogą współpracować. 0:13:15.778,0:13:17.956 Jak tu widać, 0:13:17.956,0:13:20.631 człowiek mówi komputerowi[br]o obszarach zainteresowań, 0:13:20.631,0:13:25.281 których komputer ma użyć [br]do ulepszenia swojego algorytmu. 0:13:25.281,0:13:27.857 Ten system uczenia głębokiego[br]operuje w przestrzeni 0:13:27.857,0:13:30.433 o 16 tysiącach wymiarów. 0:13:30.433,0:13:33.009 Widać, jak komputer obraca obiekty, 0:13:33.009,0:13:35.001 próbując znaleźć nowe obszary struktur. 0:13:35.001,0:13:36.782 Kiedy mu się to uda, 0:13:36.782,0:13:40.786 operator może wskazać [br]interesujące obszary. 0:13:40.786,0:13:43.208 W tym przypadku komputer[br]znalazł pewne obszary, 0:13:43.208,0:13:45.770 na przykład kąt zdjęcia. 0:13:45.770,0:13:47.376 Z biegiem tego procesu 0:13:47.376,0:13:49.716 stopniowo mówimy komputerowi coraz więcej 0:13:49.716,0:13:51.774 na temat rodzaju szukanych struktur. 0:13:51.774,0:13:54.566 Można sobie wyobrazić,[br]że w przypadku testu diagnostycznego 0:13:54.566,0:13:57.266 patolog identyfikowałby[br]obszary patologiczne, 0:13:57.266,0:14:02.292 a radiolog wskazywałby [br]na potencjalnie uciążliwe guzki. 0:14:02.292,0:14:04.851 Czasami może być to trudne dla algorytmu. 0:14:04.851,0:14:06.815 W tym przypadku, algorytm się zgubił. 0:14:06.815,0:14:09.365 Przednie i tylne części samochodów[br]są wymieszane. 0:14:09.365,0:14:11.437 Musimy być trochę ostrożniejsi 0:14:11.437,0:14:14.669 i ręcznie zaznaczyć przednie części, 0:14:14.669,0:14:20.175 wskazując potem komputerowi, [br]że o taką grupę chodzi. 0:14:21.523,0:14:24.030 Robimy to przez jakiś czas, [br]tu coś pominiemy, 0:14:24.030,0:14:26.446 teraz uczymy algorytm uczenia maszynowego 0:14:26.446,0:14:28.420 na podstawie tych kilkuset rzeczy 0:14:28.420,0:14:30.445 mając nadzieję, że się udoskonali. 0:14:30.445,0:14:33.518 Widać, że algorytm [br]zaczął wygaszać niektóre zdjęcia, 0:14:33.518,0:14:38.226 pokazując w ten sposób,[br]że potrafi je już rozpoznawać. 0:14:38.226,0:14:41.128 Możemy użyć koncepcji podobnych zdjęć 0:14:41.128,0:14:43.852 i teraz widać, 0:14:43.852,0:14:47.241 że komputer potrafi już[br]znajdować maski samochodów. 0:14:47.241,0:14:50.189 Teraz człowiek może powiedzieć komputerowi 0:14:50.189,0:14:52.482 "Tak, świetnie się spisałeś". 0:14:53.652,0:14:55.837 Czasem, oczywiście, nawet w tym momencie 0:14:55.837,0:14:59.511 jest jeszcze trudno rozpoznawać grupy. 0:14:59.511,0:15:03.395 W tym przypadku nawet jeżeli pozwolimy[br]komputerowi obracać tym przez chwilę, 0:15:03.399,0:15:07.694 widać, że zdjęcia z prawej i lewej strony [br]są nadal wymieszane. 0:15:07.694,0:15:10.142 Można dać komputerowi kolejne wskazówki 0:15:10.142,0:15:12.698 i kazać mu znaleźć rzut, 0:15:12.698,0:15:15.945 który najwyraźniej oddziela [br]lewe i prawe boki, 0:15:15.945,0:15:18.067 przy pomocy uczenia głębokiego. 0:15:18.067,0:15:21.009 Po tej wskazówce - udało się. 0:15:21.009,0:15:23.891 Potrafi już myśleć o obiektach w sposób, 0:15:23.891,0:15:26.271 który oddziela te grupy. 0:15:26.271,0:15:28.709 Rozumiecie koncepcję. 0:15:28.709,0:15:36.906 Tutaj komputer współpracuje z człowiekiem, 0:15:36.906,0:15:39.546 zamiast go zastępować. 0:15:39.546,0:15:43.096 Udało się zastąpić proces, [br]który kiedyś wymagał zespołu 0:15:43.096,0:15:45.098 pięciu czy sześciu ludzi przez siedem lat 0:15:45.098,0:15:47.703 procesem, który zajmuje 15 minut 0:15:47.703,0:15:50.208 i wymaga jednej osoby. 0:15:50.208,0:15:54.158 Ten proces wymaga[br]czterech czy pięciu iteracji. 0:15:54.158,0:15:56.017 Widać, że teraz 62% z 1,5 miliona zdjęć 0:15:56.017,0:15:58.976 jest zaklasyfikowanych poprawnie. 0:15:58.976,0:16:02.738 Teraz można szybko wziąć większe sekcje 0:16:02.745,0:16:05.664 i sprawdzić, czy nie ma błędów. 0:16:05.664,0:16:09.616 Jeżeli są błędy, [br]można o nich powiedzieć komputerowi. 0:16:09.616,0:16:12.661 Powtarzając tę czynność dla różnych grup, 0:16:12.661,0:16:15.148 mamy już teraz 80% skuteczności 0:16:15.148,0:16:17.563 w klasyfikowaniu 1,5 miliona zdjęć. 0:16:17.563,0:16:19.641 Teraz trzeba już tylko znaleźć tych kilka, 0:16:19.641,0:16:23.220 które nie są klasyfikowane poprawnie 0:16:23.220,0:16:25.808 i zrozumieć przyczynę. 0:16:25.808,0:16:32.001 W 15 minut można osiągnąć skuteczność 97%. 0:16:32.001,0:16:36.482 Ta technika pozwoli być może [br]rozwiązać poważny problem 0:16:36.482,0:16:38.952 światowego niedoboru [br]kompetencji medycznych. 0:16:38.952,0:16:42.334 Światowe Forum Ekonomiczne szacuje [br]10- lub 20-krotny niedobór lekarzy 0:16:42.334,0:16:45.433 w krajach rozwijających się, 0:16:45.433,0:16:48.437 a wyszkolenie odpowiedniej liczby ludzi 0:16:48.437,0:16:50.570 zajęłoby około 300 lat. 0:16:50.734,0:16:53.619 A gdyby można było [br]zwiększyć ich efektywność 0:16:53.619,0:16:56.458 przy pomocy metod uczenia głębokiego? 0:16:56.458,0:16:58.790 Bardzo mnie pociągają takie możliwości. 0:16:58.790,0:17:01.279 Niepokoją mnie też problemy. 0:17:01.279,0:17:04.933 Otóż każdy niebieski obszar na tej mapie 0:17:04.933,0:17:07.882 to ponad 80% osób [br]zatrudnionych w usługach. 0:17:07.882,0:17:09.379 Co to są usługi? 0:17:09.379,0:17:12.478 Oto usługi. [Kierowcy, kucharze, [br]diagnostycy, prawnicy] 0:17:12.478,0:17:15.917 Tak się składa, [br]że właśnie to opanowały komputery. 0:17:15.917,0:17:19.221 Zatem 80% zatrudnionych[br]w krajach rozwiniętych 0:17:19.221,0:17:21.903 robi rzeczy, których właśnie [br]nauczyły się komputery. 0:17:21.903,0:17:22.923 Co to oznacza? 0:17:22.923,0:17:25.646 Nie szkodzi. Będą inne stanowiska. 0:17:25.646,0:17:28.503 Na przykład przybędzie naukowców [br]od analizy danych. 0:17:28.503,0:17:29.370 Nie do końca. 0:17:29.370,0:17:31.908 Analitykom danych nie trzeba dużo czasu 0:17:31.908,0:17:33.190 na budowę takich systemów. 0:17:33.190,0:17:36.246 Na przykład te cztery algorytmy [br]opracował jeden człowiek. 0:17:36.246,0:17:39.118 Myślicie, że to już było, 0:17:39.118,0:17:41.840 widzieliśmy już w przeszłości, 0:17:41.840,0:17:44.894 jak stare zawody ustępują nowym. 0:17:44.894,0:17:46.875 Jakie będą te nowe zawody? 0:17:46.875,0:17:49.374 Bardzo ciężko jest to oszacować, 0:17:49.374,0:17:52.176 bo ludzkie osiągnięcia rosną stopniowo, 0:17:52.176,0:17:54.373 a teraz mamy system, uczenie głębokie, 0:17:54.373,0:17:57.348 którego zdolności rosną wykładniczo. 0:17:57.348,0:17:58.939 A my jesteśmy tutaj. 0:17:58.939,0:18:00.865 Widząc dzisiejsze realia mówimy: 0:18:00.865,0:18:03.534 "Komputery są nadal dosyć głupie". 0:18:03.534,0:18:07.069 Ale za pięć lat komputery będą poza skalą. 0:18:07.069,0:18:11.079 Musimy zacząć myśleć [br]o tych możliwościach już teraz. 0:18:11.079,0:18:12.956 Oczywiście widzieliśmy to już kiedyś. 0:18:12.956,0:18:14.532 Podczas rewolucji przemysłowej 0:18:14.532,0:18:17.708 mieliśmy skokową zmianę możliwości[br]dzięki silnikom. 0:18:17.708,0:18:20.805 Tyle tylko, że po pewnym czasie[br]rezultaty uległy spłaszczeniu. 0:18:20.805,0:18:22.507 Nastąpiły zakłócenia społeczne, 0:18:22.507,0:18:26.546 ale kiedy silnik zaczęto stosować [br]do każdego rodzaju wytwarzania energii, 0:18:26.546,0:18:28.300 wszystko się ustabilizowało. 0:18:28.300,0:18:29.773 Rewolucja uczenia maszynowego 0:18:29.773,0:18:32.302 będzie bardzo różna[br]od rewolucji przemysłowej, 0:18:32.302,0:18:35.632 bo rewolucja uczenia maszynowego[br]nie ustabilizuje się nigdy. 0:18:35.632,0:18:38.714 Im lepsza będzie [br]aktywność intelektualna komputerów, 0:18:38.714,0:18:40.942 tym lepsze zbudują komputery, [br] 0:18:40.942,0:18:43.420 o jeszcze większych [br]zdolnościach intelektualnych. 0:18:43.420,0:18:47.248 Będzie to zmiana,[br]jakiej świat nigdy dotąd nie doświadczył, 0:18:47.248,0:18:50.554 więc zmieniło się nasze wcześniejsze [br]zrozumienie możliwości. 0:18:50.974,0:18:52.754 Już odczuwamy ten wpływ. 0:18:52.754,0:18:56.384 Przez ostatnie 25 lat[br]produktywność kapitału wzrastała, 0:18:56.400,0:19:00.588 wydajność pracy pozostała bez zmian,[br]a nawet trochę spadła. 0:19:01.408,0:19:04.149 Chcę więc już teraz zacząć tę dyskusję. 0:19:04.149,0:19:07.176 Zwykle gdy opowiadam o tym problemie, 0:19:07.176,0:19:08.666 napotykam lekceważenie. 0:19:08.666,0:19:11.009 Przecież komputery nie potrafią[br]naprawdę myśleć, 0:19:11.009,0:19:13.367 nie mają uczuć,[br]nie rozumieją poezji, 0:19:13.367,0:19:15.888 nie do końca wiemy, jak działają. 0:19:15.888,0:19:16.744 I co z tego? 0:19:16.744,0:19:19.178 Komputery już teraz potrafią [br]wykonywać czynności, 0:19:19.178,0:19:21.897 z których utrzymują się ludzie, 0:19:21.897,0:19:23.628 więc trzeba zacząć się zastanawiać, 0:19:23.628,0:19:28.015 jak dostosujemy [br]społeczne i gospodarcze struktury 0:19:28.015,0:19:29.855 do tej nowej rzeczywistości. 0:19:29.855,0:19:31.388 Dziękuję. 0:19:31.388,0:19:32.190 (Oklaski)