0:00:00.880,0:00:02.735
Kiedyś było tak,

0:00:02.735,0:00:04.590
że aby komputer coś zrobił,

0:00:04.590,0:00:06.447
trzeba go było zaprogramować.

0:00:06.447,0:00:09.398
Dla tych, którzy tego nie robili:

0:00:09.398,0:00:13.470
programowanie wymaga[br]drobiazgowego zdefiniowania [br]

0:00:13.470,0:00:16.727
każdego kroku, który komputer ma wykonać,

0:00:16.727,0:00:18.614
by osiągnąć cel.

0:00:18.614,0:00:21.221
Jeżeli chcemy,[br]by komputer wykonał czynność,

0:00:21.221,0:00:23.070
której sami nie potrafimy wykonać,

0:00:23.079,0:00:24.648
stajemy przed dużym wyzwaniem.

0:00:24.648,0:00:28.131
Stanął przed nim Artur Samuel.

0:00:28.131,0:00:31.348
W 1956 roku stwierdził, że chciałby,

0:00:31.348,0:00:34.548
aby komputer wygrał z nim w warcaby.

0:00:34.548,0:00:36.018
Jak napisać program,

0:00:36.018,0:00:38.547
drobiazgowo wyrazić, [br]jak być lepszym w warcaby

0:00:38.547,0:00:40.196
niż jest się samemu?

0:00:40.196,0:00:42.116
Artur wpadł na następujący pomysł:

0:00:42.116,0:00:45.840
kazał komputerowi [br]grać z samym sobą tysiące razy

0:00:45.840,0:00:48.364
i w ten sposób nauczyć się gry.

0:00:48.364,0:00:50.314
Rzeczywiście się udało.

0:00:50.314,0:00:55.561
W 1962 roku komputer pokonał[br]mistrza stanu Connecticut.

0:00:55.561,0:00:58.534
Artur Samuel był ojcem[br]uczenia maszynowego.

0:00:58.534,0:01:00.251
Mam wobec niego duży dług,

0:01:00.251,0:01:02.404
bo sam zajmuję się[br]uczeniem maszynowym.

0:01:02.404,0:01:04.051
Byłem przewodniczącym Kaggle,

0:01:04.051,0:01:06.888
społeczności zrzeszającej [br]200 tys. specjalistów

0:01:06.888,0:01:08.367
od programowania maszynowego.

0:01:08.367,0:01:10.122
Kaggle organizuje konkursy,

0:01:10.122,0:01:11.757
podczas których członkowie próbują

0:01:11.757,0:01:13.833
rozwiązać dotąd nierozwiązane problemy.

0:01:13.833,0:01:17.470
Udało się to już setki razy.

0:01:17.470,0:01:20.120
Z tej perspektywy wiele się dowiedziałem

0:01:20.120,0:01:23.950
o dawnych i obecnych [br]możliwościach uczenia maszynowego,

0:01:23.950,0:01:26.252
i co będzie możliwe w przyszłości.

0:01:26.252,0:01:28.135
Chyba pierwszym dużym sukcesem

0:01:28.135,0:01:30.571
w komercyjnym zastosowaniu[br]uczenia maszynowego

0:01:30.571,0:01:33.944
był Google, który udowodnił,[br]że da się szukać informacji

0:01:33.944,0:01:35.856
przy pomocy algorytmu komputerowego,

0:01:35.856,0:01:37.802
opartego o uczenie maszynowe.

0:01:37.802,0:01:41.928
Odtąd było wiele udanych[br]komercyjnych zastosowań.

0:01:41.928,0:01:43.844
Firmy takie jak Amazon czy Netflix

0:01:43.844,0:01:47.110
używają uczenia maszynowego[br]do proponowania produktów

0:01:47.110,0:01:49.770
lub filmów, które nas zaciekawią.

0:01:49.776,0:01:51.986
Czasem przyprawia to o gęsią skórkę.

0:01:51.986,0:01:53.463
Firmy jak LinkedIn czy Facebook

0:01:53.463,0:01:56.077
mówią nam czasem, kogo znamy,

0:01:56.077,0:01:58.191
i nie mamy pojęcia, jak to robią.

0:01:58.191,0:02:01.178
Wykorzystują moc uczenia maszynowego.

0:02:01.195,0:02:04.302
To algorytmy, które uczą się z danych,

0:02:04.302,0:02:07.399
nie zaś przez ręczne programowanie.

0:02:07.399,0:02:11.225
To również dlatego[br]komputer Watson firmy IBM

0:02:11.225,0:02:14.059
potrafił pokonać dwóch [br]mistrzów świata w grze "Va Banque",

0:02:14.059,0:02:17.484
odpowiadając na niezwykle subtelne[br]i skomplikowane pytania takie jak to:

0:02:17.484,0:02:20.819
Antyczny "Lew z Kalchu" zginął z muzeum[br]w tym mieście w 2003 roku.

0:02:20.819,0:02:23.514
Także dlatego mamy pierwsze[br]samokierujące samochody.

0:02:23.514,0:02:26.936
Możliwość odróżnienia, powiedzmy,[br]drzewa i przechodnia,

0:02:26.936,0:02:28.488
jest dosyć istotna.

0:02:28.488,0:02:31.075
Nie wiemy, jak zaprogramować to ręcznie,

0:02:31.075,0:02:34.072
ale potrafimy to zrobić[br]przez uczenie maszynowe.

0:02:34.072,0:02:37.510
Ten samochód przejechał już[br]ponad 2 mln kilometrów

0:02:37.510,0:02:40.186
po zwykłych drogach, bez wypadków.

0:02:40.196,0:02:44.110
Czyli komputery potrafią się uczyć

0:02:44.110,0:02:46.010
i potrafią uczyć się rzeczy,

0:02:46.010,0:02:48.848
których czasem sami nie potrafimy robić,

0:02:48.848,0:02:51.733
lub potrafią je robić lepiej niż my.

0:02:51.733,0:02:55.348
Jeden z niezwykłych przykładów[br]uczenia maszynowego

0:02:55.348,0:02:58.320
zdarzył się w projekcie,[br]który prowadziłem w Kaggle.

0:02:58.320,0:03:01.911
Zespół, którym kierował Geoffrey Hinton

0:03:01.911,0:03:03.463
z Uniwersytetu w Toronto,

0:03:03.463,0:03:06.140
wygrał konkurs na automatyczne[br]odkrywanie leków.

0:03:06.140,0:03:08.987
Co niezwykłe, [br]nie tylko przebili wszystkie algorytmy

0:03:08.987,0:03:13.011
firmy Merck i międzynarodowej [br]społeczności akademickiej,

0:03:13.011,0:03:16.230
ale też nikt w zespole nie miał[br]żadnej wiedzy z chemii, biologii

0:03:16.260,0:03:17.820
czy nauki o organizmach żywych,

0:03:17.820,0:03:20.230
a zrobili to w dwa tygodnie.

0:03:20.230,0:03:22.241
Jak im się to udało?

0:03:22.241,0:03:25.342
Użyli niezwykłego algorytmu,[br]zwanego uczeniem głębokim.

0:03:25.342,0:03:28.191
To wydarzenie było tak ważne,[br]że kilka tygodni później

0:03:28.191,0:03:31.412
New York Times pisał o nim[br]na stronie głównej.

0:03:31.412,0:03:34.147
Po lewej stronie widoczny[br]jest Geoffrey Hinton.

0:03:34.147,0:03:39.278
Uczenie głębokie to algorytm zainspirowany[br]sposobem działania ludzkiego mózgu,

0:03:39.278,0:03:43.831
przez co nie ma żadnych [br]teoretycznych ograniczeń.

0:03:43.831,0:03:46.774
Im więcej dostaje danych,[br]im więcej czasu obliczeniowego,

0:03:46.774,0:03:48.456
tym staje się lepszy.

0:03:48.456,0:03:50.615
New York Times przedstawił też w artykule

0:03:50.615,0:03:53.187
inne niezwykłe osiągniecie[br]uczenia głębokiego,

0:03:53.187,0:03:55.129
które teraz zaprezentuję.

0:03:55.899,0:04:00.090
Udowadnia ono, że komputery [br]potrafią słuchać i rozumieć.

0:04:00.510,0:04:03.221
(Wideo) Richard Rashid: Ostatni krok,

0:04:03.221,0:04:06.246
który chciałbym wykonać w tym procesie,

0:04:06.246,0:04:10.961
to przemówić do was po chińsku.

0:04:10.961,0:04:13.596
Chodzi o to, że udało nam się

0:04:13.596,0:04:18.598
wziąć dużą ilość informacji[br]od osób mówiących po chińsku

0:04:18.598,0:04:21.128
i stworzyć system syntezy mowy,

0:04:21.128,0:04:25.801
który konwertuje chiński tekst na mowę.

0:04:25.801,0:04:29.929
Potem wzięliśmy godzinne[br]nagranie mojego głosu

0:04:29.929,0:04:34.220
i użyliśmy go do zmodulowania [br]standardowego systemu syntezy mowy,

0:04:34.220,0:04:35.911
żeby brzmiał jak ja.

0:04:35.911,0:04:38.904
Efekt nie jest bezbłędny.

0:04:38.904,0:04:41.552
W sumie jest nawet sporo błędów.

0:04:41.552,0:04:44.036
(Po chińsku)

0:04:44.036,0:04:46.383
(Oklaski)

0:04:49.446,0:04:53.022
Ta dziedzina wymaga jeszcze dużo pracy.

0:04:53.022,0:04:56.667
(Po chińsku)

0:04:56.667,0:04:59.090
(Oklaski)

0:05:00.735,0:05:04.744
JH: To był fragment konferencji[br]na temat uczenia maszynowego w Chinach.

0:05:04.744,0:05:08.904
Na akademickich konferencjach[br]rzadko słyszy się spontaniczny aplauz.

0:05:09.011,0:05:11.177
Na konferencjach TEDx[br]zdarza się to częściej,

0:05:11.177,0:05:12.580
więc proszę się nie krępować.[br]

0:05:12.580,0:05:16.193
Wszystko, co tu widzieliście, [br]osiągnięto przez uczenie głębokie.

0:05:16.193,0:05:17.127
(Oklaski) Dziękuję.

0:05:17.127,0:05:19.289
Transkrypcja na angielski[br]to uczenie głębokie.

0:05:19.289,0:05:22.701
Tłumaczenie na chiński i tekst[br]w prawym górnym rogu - uczenie głębokie,

0:05:22.701,0:05:26.008
synteza mowy to również uczenie głębokie.

0:05:26.008,0:05:29.242
Uczenie głębokie jest niezwykłe.

0:05:29.242,0:05:32.341
To pojedynczy algorytm, [br]który jakby umie wszystko.

0:05:32.341,0:05:35.452
Odkryłem, że rok wcześniej [br]nauczył się również widzieć.

0:05:35.452,0:05:37.548
W mało znanym konkursie w Niemczech

0:05:37.548,0:05:40.295
na rozpoznawanie znaków drogowych

0:05:40.295,0:05:42.009
uczenie głębokie nauczyło się

0:05:42.009,0:05:43.723
rozpoznawać takie znaki drogowe.

0:05:43.723,0:05:45.438
Nie tylko rozpoznawało znaki

0:05:45.438,0:05:47.168
lepiej niż inne algorytmy,

0:05:47.168,0:05:49.640
ale nawet lepiej niż ludzie,

0:05:49.640,0:05:51.499
mniej więcej dwa razy lepiej.

0:05:51.811,0:05:54.037
Czyli w 2011 r. mieliśmy pierwszy przykład

0:05:54.037,0:05:57.442
komputerów widzących lepiej niż ludzie.

0:05:57.442,0:05:59.491
Od tego czasu bardzo dużo się wydarzyło.

0:05:59.491,0:06:03.005
W 2012 r. Google ogłosił, [br]że ich algorytm uczenia głębokiego

0:06:03.005,0:06:04.420
oglądał filmy na YouTube

0:06:04.420,0:06:07.857
i przez miesiąc przetwarzał dane [br]na 16 tysiącach serwerów,

0:06:07.857,0:06:10.077
po czym samodzielnie nauczył się pojęć

0:06:10.077,0:06:11.797
takich jak ludzie czy koty,

0:06:11.797,0:06:13.767
tylko przez oglądanie filmów.

0:06:13.767,0:06:16.489
W bardzo podobny sposób uczą się ludzie.

0:06:16.489,0:06:19.329
Nie trzeba im mówić, na co patrzą,

0:06:19.329,0:06:22.590
tylko sami się uczą się,[br]czym są widziane obiekty.

0:06:22.590,0:06:25.819
W 2012 roku Geoffrey Hinton,[br]którego widzieliśmy wcześniej,

0:06:25.819,0:06:28.677
wygrał bardzo popularny konkurs ImageNet,

0:06:28.677,0:06:32.818
gdzie dla 1,5 miliona obrazków [br]trzeba określić,

0:06:32.818,0:06:34.256
co się na nich znajduje.

0:06:34.256,0:06:38.892
Do 2014 r. proporcja błędów spadła do 6%.

0:06:38.892,0:06:41.488
To znowu lepiej, niż ludzie.

0:06:41.488,0:06:45.037
Maszyny są tu niesamowicie skuteczne

0:06:45.037,0:06:47.306
i wykorzystuje się to już komercyjnie.

0:06:47.306,0:06:50.348
Na przykład Google ogłosił w zeszłym roku,

0:06:50.348,0:06:54.933
że znaleźli na mapie wszystkie adresy[br]we Francji w dwie godziny

0:06:54.933,0:06:58.380
przez dostarczenie zdjęć Street View

0:06:58.380,0:07:02.699
algorytmowi uczenia głębokiego,[br]który rozpoznał i odczytał numery domów.

0:07:02.699,0:07:05.439
Wyobraźcie sobie,[br]ile czasu zajęłoby to kiedyś:

0:07:05.439,0:07:08.274
dziesiątki ludzi, wiele lat.

0:07:08.274,0:07:10.185
To samo dzieje się w Chinach.

0:07:10.185,0:07:14.221
Baidu jest czymś w rodzaju[br]chińskiego Google.

0:07:14.221,0:07:16.504
W lewym górnym rogu [br]widać przykładowe zdjęcie,

0:07:16.504,0:07:20.478
które wczytałem do systemu [br]uczenia głębokiego Baidu,

0:07:20.478,0:07:24.247
poniżej widać, że system zrozumiał,[br]co jest na zdjęciu

0:07:24.247,0:07:26.483
i znalazł podobne zdjęcia.

0:07:26.483,0:07:29.219
Te zdjęcia mają podobne tło,

0:07:29.219,0:07:30.877
podobny kierunek pysków,

0:07:30.877,0:07:32.665
niektórym nawet wystają języki.

0:07:32.665,0:07:35.695
Ten algorytm na pewno nie patrzy[br]na tekst na stronie,

0:07:35.695,0:07:37.107
wgrałem tylko zdjęcie.

0:07:37.107,0:07:41.128
Czyli dzisiejsze komputery[br]naprawdę rozumieją, co widzą,

0:07:41.128,0:07:43.652
i na żywo umieją przeszukiwać bazy danych

0:07:43.652,0:07:46.306
setek milionów zdjęć.

0:07:46.306,0:07:48.976
Co to właściwie znaczy,[br]że komputery mogą widzieć?

0:07:48.976,0:07:51.553
Nie chodzi o samo widzenie.

0:07:51.553,0:07:54.002
Uczenie głębokie dało znacznie więcej.

0:07:54.002,0:07:56.570
Złożone i pełne niuansów zdania, jak to,

0:07:56.570,0:07:59.394
są już zrozumiałe [br]dla algorytmów uczenia głębokiego.

0:07:59.394,0:08:00.697
Jak widać tutaj,

0:08:00.697,0:08:02.645
system z Uniwersytetu Stanforda

0:08:02.645,0:08:04.906
zaznaczył czerwoną kropką na górze,[br]

0:08:04.906,0:08:07.657
że to zdanie wyraża negację.

0:08:07.657,0:08:10.790
Efektywność uczenia głębokiego [br]jest zbliżona do ludzkiej

0:08:10.802,0:08:15.923
w rozumieniu sensu zdania i analizie.

0:08:15.923,0:08:18.651
Uczenie głębokie zastosowano[br]do czytania chińskiego

0:08:18.651,0:08:21.807
na poziomie zbliżonym [br]do rodzimych użytkowników.

0:08:21.807,0:08:23.975
Ten algorytm opracował szwajcarski zespół,

0:08:23.975,0:08:27.711
którego członkowie nie znają chińskiego.

0:08:27.711,0:08:29.382
Jak wspomniałem, uczenie głębokie

0:08:29.382,0:08:31.601
jest w tym najlepsze,

0:08:31.601,0:08:34.168
nawet w porównaniu z rozumieniem

0:08:34.168,0:08:36.735
przez rodzimych użytkowników języka.

0:08:36.735,0:08:39.302
Ten system zbudowaliśmy w mojej firmie.

0:08:39.302,0:08:41.728
Pokazuje, jak można to wszystko[br]połączyć w całość.

0:08:41.728,0:08:44.189
To są zdjęcia bez żadnego opisu

0:08:44.189,0:08:46.541
i w trakcie wpisywania zdań

0:08:46.541,0:08:49.510
system na żywo rozpoznaje zdjęcia,

0:08:49.510,0:08:51.189
ustala, co na nich jest,

0:08:51.189,0:08:54.352
i znajduje zdjęcia podobne do opisu.

0:08:54.352,0:08:57.108
Rzeczywiście rozumie, o czym piszę,

0:08:57.108,0:08:59.332
i rozumie, co jest na zdjęciach.

0:08:59.332,0:09:01.711
Pewnie znacie to z Google'a,

0:09:01.711,0:09:05.286
który znajduje zdjęcia [br]według wpisywanych słów,

0:09:05.286,0:09:08.680
choć w rzeczywistości wyszukuje[br]strony internetowe w oparciu o tekst.

0:09:08.680,0:09:12.001
To co innego niż rozumienie samych zdjęć.

0:09:12.001,0:09:16.383
Komputery potrafią to robić[br]dopiero od kilku miesięcy.

0:09:17.091,0:09:21.182
Czyli komputery potrafią[br]nie tylko widzieć, ale też czytać,

0:09:21.182,0:09:24.947
i potrafią też rozumieć, co słyszą.

0:09:24.947,0:09:27.756
Pewnie was nie zaskoczy, [br]że potrafią też pisać.

0:09:27.756,0:09:31.882
Ten tekst wygenerowałem wczoraj[br]przy pomocy uczenia głębokiego.

0:09:31.882,0:09:34.346
"Miło mi być tu z wami w Brukseli!"

0:09:34.346,0:09:37.050
Tę próbkę tekstu [br]wygenerował algorytm ze Stanford.

0:09:37.050,0:09:39.989
Uczenie głębokie wygenerowało te zdania,

0:09:39.989,0:09:43.061
aby opisać każde z tych zdjęć.

0:09:43.061,0:09:45.741
Ten algorytm nigdy przedtem nie widział

0:09:45.741,0:09:48.363
mężczyzny w czarnej koszulce, [br]grającego na gitarze.

0:09:48.363,0:09:51.496
Widział mężczyznę,[br]widział czerń lub gitarę,

0:09:51.496,0:09:56.101
ale sam stworzył oryginalny opis zdjęcia.

0:09:56.101,0:10:00.056
Nadal nie dorównuje ludziom, [br]ale mało mu brakuje.

0:10:00.056,0:10:03.351
W testach ludzie preferują opisy[br]generowane przez komputer

0:10:03.351,0:10:04.995
w co czwartym przypadku.

0:10:04.995,0:10:06.831
Ten system powstał dwa tygodnie temu,

0:10:06.831,0:10:08.902
więc w tym tempie

0:10:08.902,0:10:11.594
algorytm komputerowy [br]prześcignie człowieka,

0:10:11.594,0:10:13.963
pewnie w ciągu kolejnego roku.

0:10:13.963,0:10:17.048
Czyli komputery potrafią też pisać.

0:10:17.048,0:10:19.990
Połączyliśmy to wszystko,[br]co daje ekscytujące możliwości.

0:10:19.990,0:10:21.485
Na przykład w medycynie:

0:10:21.485,0:10:23.974
zespół z Bostonu ogłosił odkrycie

0:10:23.974,0:10:28.310
dziesiątek nowych, [br]istotnych klinicznie cech nowotworów,

0:10:28.310,0:10:31.536
co pomoże lekarzom[br]w prognozowaniu postępów raka.

0:10:33.096,0:10:35.749
Grupa badaczy ze Stanford ogłosiła,

0:10:35.749,0:10:38.810
że badając tkanki w powiększeniu,

0:10:38.810,0:10:42.062
opracowali system [br]wykorzystujący uczenie maszynowe,

0:10:42.062,0:10:44.589
który lepiej niż patolodzy przewiduje

0:10:44.589,0:10:47.481
przeżywalność chorych na raka.

0:10:47.481,0:10:50.373
Prognozy były nie tylko trafniejsze,

0:10:50.373,0:10:53.266
ale dostarczyły nowej, wnikliwej wiedzy.

0:10:53.276,0:10:54.781
W przypadku radiologii

0:10:54.781,0:10:57.876
były to nowe wskaźniki kliniczne,[br]zrozumiałe dla ludzi.

0:10:57.876,0:10:59.668
W przypadku patologii

0:10:59.668,0:11:04.168
system komputerowy odkrył,[br]że komórki otaczające nowotwór

0:11:04.168,0:11:07.508
są tak samo istotne,[br]jak komórki nowotworowe

0:11:07.508,0:11:09.260
w postawieniu diagnozy.

0:11:09.260,0:11:13.961
To całkowicie przeczy[br]dotychczasowej wiedzy o patologii.

0:11:15.412,0:11:18.313
Oba te systemy[br]opracowali eksperci medyczni

0:11:18.313,0:11:21.214
we współpracy z ekspertami[br]od uczenia maszynowego.

0:11:21.214,0:11:23.655
W zeszłym roku [br]przekroczyliśmy i ten próg.

0:11:23.655,0:11:27.824
To jest przykład identyfikacji[br]zmian nowotworowych

0:11:27.824,0:11:30.354
w ludzkiej tkance badanej pod mikroskopem.

0:11:30.354,0:11:34.967
Prezentowany tu system potrafi[br]rozpoznawać te zmiany dokładniej

0:11:34.967,0:11:37.742
lub równie dokładnie, co patolog,

0:11:37.742,0:11:40.174
ale został zbudowany [br]przy użyciu uczenia głębokiego

0:11:40.174,0:11:41.640
bez żadnej wiedzy medycznej,

0:11:41.640,0:11:44.128
przez ludzi nie związanych z medycyną.

0:11:44.438,0:11:46.416
Podobnie z segmentacją neuronów.

0:11:46.416,0:11:50.234
Możemy segmentować neurony[br]równie dokładnie, jak ludzie,

0:11:50.234,0:11:52.658
przy użyciu systemu uczenia głębokiego,

0:11:52.658,0:11:55.472
opracowanego przez ludzi [br]bez wiedzy medycznej.

0:11:57.162,0:12:00.058
Zatem ja, jako osoba [br]bez żadnej wiedzy medycznej,

0:12:00.058,0:12:03.243
mam dostateczne kwalifikacje,[br]by założyć firmę medyczną,

0:12:03.243,0:12:04.790
co też zrobiłem.

0:12:06.021,0:12:07.761
Byłem tym dosyć przerażony,

0:12:07.761,0:12:10.084
ale teoria wskazywała, że w medycynie

0:12:10.084,0:12:15.477
można przydać się [br]samą techniką analizy danych.

0:12:16.142,0:12:18.622
Szczęśliwie, przyjęto nas fantastycznie,

0:12:18.622,0:12:21.578
zarówno media, jak i społeczność medyczna,

0:12:21.578,0:12:23.322
która bardzo wspierała ten projekt.

0:12:23.322,0:12:27.471
W teorii możemy przejąć [br]środkową część procesu medycznego

0:12:27.471,0:12:30.494
i zastąpić ją daleko idącą analizą danych,[br]

0:12:30.494,0:12:33.429
pozwalając lekarzom zająć się tym,[br]w czym są najlepsi.

0:12:33.429,0:12:35.031
Pokażę państwu przykład.

0:12:35.031,0:12:39.975
Generacja nowego testu diagnostycznego[br]zajmuje 15 minut.

0:12:39.975,0:12:41.929
Pokażę to teraz na żywo.

0:12:41.929,0:12:45.416
Skompresowałem to do trzech minut,[br]omijając pewne czynności.

0:12:45.416,0:12:48.477
Zamiast nowego testu diagnostycznego [br]w medycynie,

0:12:48.477,0:12:51.846
pokażę test diagnostyczny samochodów,

0:12:51.846,0:12:54.068
bo jest to coś, co wszyscy rozumiemy.

0:12:54.068,0:12:57.269
Na początek mamy 1,5 mln zdjęć samochodów.

0:12:57.269,0:13:00.475
Chcę stworzyć coś, [br]co je pogrupuje według kąta,

0:13:00.475,0:13:02.698
z jakiego zostały sfotografowane.

0:13:02.698,0:13:06.586
To zdjęcia bez opisów, [br]więc trzeba zacząć od zera.

0:13:06.586,0:13:08.451
Nasz algorytm uczenia głębokiego

0:13:08.451,0:13:12.158
potrafi automatycznie rozpoznawać[br]struktury na zdjęciach.

0:13:12.158,0:13:15.778
Człowiek i komputer mogą współpracować.

0:13:15.778,0:13:17.956
Jak tu widać,

0:13:17.956,0:13:20.631
człowiek mówi komputerowi[br]o obszarach zainteresowań,

0:13:20.631,0:13:25.281
których komputer ma użyć [br]do ulepszenia swojego algorytmu.

0:13:25.281,0:13:27.857
Ten system uczenia głębokiego[br]operuje w przestrzeni

0:13:27.857,0:13:30.433
o 16 tysiącach wymiarów.

0:13:30.433,0:13:33.009
Widać, jak komputer obraca obiekty,

0:13:33.009,0:13:35.001
próbując znaleźć nowe obszary struktur.

0:13:35.001,0:13:36.782
Kiedy mu się to uda,

0:13:36.782,0:13:40.786
operator może wskazać [br]interesujące obszary.

0:13:40.786,0:13:43.208
W tym przypadku komputer[br]znalazł pewne obszary,

0:13:43.208,0:13:45.770
na przykład kąt zdjęcia.

0:13:45.770,0:13:47.376
Z biegiem tego procesu

0:13:47.376,0:13:49.716
stopniowo mówimy komputerowi coraz więcej

0:13:49.716,0:13:51.774
na temat rodzaju szukanych struktur.

0:13:51.774,0:13:54.566
Można sobie wyobrazić,[br]że w przypadku testu diagnostycznego

0:13:54.566,0:13:57.266
patolog identyfikowałby[br]obszary patologiczne,

0:13:57.266,0:14:02.292
a radiolog wskazywałby [br]na potencjalnie uciążliwe guzki.

0:14:02.292,0:14:04.851
Czasami może być to trudne dla algorytmu.

0:14:04.851,0:14:06.815
W tym przypadku, algorytm się zgubił.

0:14:06.815,0:14:09.365
Przednie i tylne części samochodów[br]są wymieszane.

0:14:09.365,0:14:11.437
Musimy być trochę ostrożniejsi

0:14:11.437,0:14:14.669
i ręcznie zaznaczyć przednie części,

0:14:14.669,0:14:20.175
wskazując potem komputerowi, [br]że o taką grupę chodzi.

0:14:21.523,0:14:24.030
Robimy to przez jakiś czas, [br]tu coś pominiemy,

0:14:24.030,0:14:26.446
teraz uczymy algorytm uczenia maszynowego

0:14:26.446,0:14:28.420
na podstawie tych kilkuset rzeczy

0:14:28.420,0:14:30.445
mając nadzieję, że się udoskonali.

0:14:30.445,0:14:33.518
Widać, że algorytm [br]zaczął wygaszać niektóre zdjęcia,

0:14:33.518,0:14:38.226
pokazując w ten sposób,[br]że potrafi je już rozpoznawać.

0:14:38.226,0:14:41.128
Możemy użyć koncepcji podobnych zdjęć

0:14:41.128,0:14:43.852
i teraz widać,

0:14:43.852,0:14:47.241
że komputer potrafi już[br]znajdować maski samochodów.

0:14:47.241,0:14:50.189
Teraz człowiek może powiedzieć komputerowi

0:14:50.189,0:14:52.482
"Tak, świetnie się spisałeś".

0:14:53.652,0:14:55.837
Czasem, oczywiście, nawet w tym momencie

0:14:55.837,0:14:59.511
jest jeszcze trudno rozpoznawać grupy.

0:14:59.511,0:15:03.395
W tym przypadku nawet jeżeli pozwolimy[br]komputerowi obracać tym przez chwilę,

0:15:03.399,0:15:07.694
widać, że zdjęcia z prawej i lewej strony [br]są nadal wymieszane.

0:15:07.694,0:15:10.142
Można dać komputerowi kolejne wskazówki

0:15:10.142,0:15:12.698
i kazać mu znaleźć rzut,

0:15:12.698,0:15:15.945
który najwyraźniej oddziela [br]lewe i prawe boki,

0:15:15.945,0:15:18.067
przy pomocy uczenia głębokiego.

0:15:18.067,0:15:21.009
Po tej wskazówce - udało się.

0:15:21.009,0:15:23.891
Potrafi już myśleć o obiektach w sposób,

0:15:23.891,0:15:26.271
który oddziela te grupy.

0:15:26.271,0:15:28.709
Rozumiecie koncepcję.

0:15:28.709,0:15:36.906
Tutaj komputer współpracuje z człowiekiem,

0:15:36.906,0:15:39.546
zamiast go zastępować.

0:15:39.546,0:15:43.096
Udało się zastąpić proces, [br]który kiedyś wymagał zespołu

0:15:43.096,0:15:45.098
pięciu czy sześciu ludzi przez siedem lat

0:15:45.098,0:15:47.703
procesem, który zajmuje 15 minut

0:15:47.703,0:15:50.208
i wymaga jednej osoby.

0:15:50.208,0:15:54.158
Ten proces wymaga[br]czterech czy pięciu iteracji.

0:15:54.158,0:15:56.017
Widać, że teraz 62% z 1,5 miliona zdjęć

0:15:56.017,0:15:58.976
jest zaklasyfikowanych poprawnie.

0:15:58.976,0:16:02.738
Teraz można szybko wziąć większe sekcje

0:16:02.745,0:16:05.664
i sprawdzić, czy nie ma błędów.

0:16:05.664,0:16:09.616
Jeżeli są błędy, [br]można o nich powiedzieć komputerowi.

0:16:09.616,0:16:12.661
Powtarzając tę czynność dla różnych grup,

0:16:12.661,0:16:15.148
mamy już teraz 80% skuteczności

0:16:15.148,0:16:17.563
w klasyfikowaniu 1,5 miliona zdjęć.

0:16:17.563,0:16:19.641
Teraz trzeba już tylko znaleźć tych kilka,

0:16:19.641,0:16:23.220
które nie są klasyfikowane poprawnie

0:16:23.220,0:16:25.808
i zrozumieć przyczynę.

0:16:25.808,0:16:32.001
W 15 minut można osiągnąć skuteczność 97%.

0:16:32.001,0:16:36.482
Ta technika pozwoli być może [br]rozwiązać poważny problem

0:16:36.482,0:16:38.952
światowego niedoboru [br]kompetencji medycznych.

0:16:38.952,0:16:42.334
Światowe Forum Ekonomiczne szacuje [br]10- lub 20-krotny niedobór lekarzy

0:16:42.334,0:16:45.433
w krajach rozwijających się,

0:16:45.433,0:16:48.437
a wyszkolenie odpowiedniej liczby ludzi

0:16:48.437,0:16:50.570
zajęłoby około 300 lat.

0:16:50.734,0:16:53.619
A gdyby można było [br]zwiększyć ich efektywność

0:16:53.619,0:16:56.458
przy pomocy metod uczenia głębokiego?

0:16:56.458,0:16:58.790
Bardzo mnie pociągają takie możliwości.

0:16:58.790,0:17:01.279
Niepokoją mnie też problemy.

0:17:01.279,0:17:04.933
Otóż każdy niebieski obszar na tej mapie

0:17:04.933,0:17:07.882
to ponad 80% osób [br]zatrudnionych w usługach.

0:17:07.882,0:17:09.379
Co to są usługi?

0:17:09.379,0:17:12.478
Oto usługi. [Kierowcy, kucharze, [br]diagnostycy, prawnicy]

0:17:12.478,0:17:15.917
Tak się składa, [br]że właśnie to opanowały komputery.

0:17:15.917,0:17:19.221
Zatem 80% zatrudnionych[br]w krajach rozwiniętych

0:17:19.221,0:17:21.903
robi rzeczy, których właśnie [br]nauczyły się komputery.

0:17:21.903,0:17:22.923
Co to oznacza?

0:17:22.923,0:17:25.646
Nie szkodzi. Będą inne stanowiska.

0:17:25.646,0:17:28.503
Na przykład przybędzie naukowców [br]od analizy danych.

0:17:28.503,0:17:29.370
Nie do końca.

0:17:29.370,0:17:31.908
Analitykom danych nie trzeba dużo czasu

0:17:31.908,0:17:33.190
na budowę takich systemów.

0:17:33.190,0:17:36.246
Na przykład te cztery algorytmy [br]opracował jeden człowiek.

0:17:36.246,0:17:39.118
Myślicie, że to już było,

0:17:39.118,0:17:41.840
widzieliśmy już w przeszłości,

0:17:41.840,0:17:44.894
jak stare zawody ustępują nowym.

0:17:44.894,0:17:46.875
Jakie będą te nowe zawody?

0:17:46.875,0:17:49.374
Bardzo ciężko jest to oszacować,

0:17:49.374,0:17:52.176
bo ludzkie osiągnięcia rosną stopniowo,

0:17:52.176,0:17:54.373
a teraz mamy system, uczenie głębokie,

0:17:54.373,0:17:57.348
którego zdolności rosną wykładniczo.

0:17:57.348,0:17:58.939
A my jesteśmy tutaj.

0:17:58.939,0:18:00.865
Widząc dzisiejsze realia mówimy:

0:18:00.865,0:18:03.534
"Komputery są nadal dosyć głupie".

0:18:03.534,0:18:07.069
Ale za pięć lat komputery będą poza skalą.

0:18:07.069,0:18:11.079
Musimy zacząć myśleć [br]o tych możliwościach już teraz.

0:18:11.079,0:18:12.956
Oczywiście widzieliśmy to już kiedyś.

0:18:12.956,0:18:14.532
Podczas rewolucji przemysłowej

0:18:14.532,0:18:17.708
mieliśmy skokową zmianę możliwości[br]dzięki silnikom.

0:18:17.708,0:18:20.805
Tyle tylko, że po pewnym czasie[br]rezultaty uległy spłaszczeniu.

0:18:20.805,0:18:22.507
Nastąpiły zakłócenia społeczne,

0:18:22.507,0:18:26.546
ale kiedy silnik zaczęto stosować [br]do każdego rodzaju wytwarzania energii,

0:18:26.546,0:18:28.300
wszystko się ustabilizowało.

0:18:28.300,0:18:29.773
Rewolucja uczenia maszynowego

0:18:29.773,0:18:32.302
będzie bardzo różna[br]od rewolucji przemysłowej,

0:18:32.302,0:18:35.632
bo rewolucja uczenia maszynowego[br]nie ustabilizuje się nigdy.

0:18:35.632,0:18:38.714
Im lepsza będzie [br]aktywność intelektualna komputerów,

0:18:38.714,0:18:40.942
tym lepsze zbudują komputery, [br]

0:18:40.942,0:18:43.420
o jeszcze większych [br]zdolnościach intelektualnych.

0:18:43.420,0:18:47.248
Będzie to zmiana,[br]jakiej świat nigdy dotąd nie doświadczył,

0:18:47.248,0:18:50.554
więc zmieniło się nasze wcześniejsze [br]zrozumienie możliwości.

0:18:50.974,0:18:52.754
Już odczuwamy ten wpływ.

0:18:52.754,0:18:56.384
Przez ostatnie 25 lat[br]produktywność kapitału wzrastała,

0:18:56.400,0:19:00.588
wydajność pracy pozostała bez zmian,[br]a nawet trochę spadła.

0:19:01.408,0:19:04.149
Chcę więc już teraz zacząć tę dyskusję.

0:19:04.149,0:19:07.176
Zwykle gdy opowiadam o tym problemie,

0:19:07.176,0:19:08.666
napotykam lekceważenie.

0:19:08.666,0:19:11.009
Przecież komputery nie potrafią[br]naprawdę myśleć,

0:19:11.009,0:19:13.367
nie mają uczuć,[br]nie rozumieją poezji,

0:19:13.367,0:19:15.888
nie do końca wiemy, jak działają.

0:19:15.888,0:19:16.744
I co z tego?

0:19:16.744,0:19:19.178
Komputery już teraz potrafią [br]wykonywać czynności,

0:19:19.178,0:19:21.897
z których utrzymują się ludzie,

0:19:21.897,0:19:23.628
więc trzeba zacząć się zastanawiać,

0:19:23.628,0:19:28.015
jak dostosujemy [br]społeczne i gospodarcze struktury

0:19:28.015,0:19:29.855
do tej nowej rzeczywistości.

0:19:29.855,0:19:31.388
Dziękuję.

0:19:31.388,0:19:32.190
(Oklaski)