Big data to lepsze dane
-
0:01 - 0:05Ulubione ciasto Amerykanów to...?
-
0:05 - 0:08Publiczność: Szarlotka.
Kenneth Cukier: Szarlotka, oczywiście. -
0:08 - 0:09Skąd to wiemy?
-
0:09 - 0:12Dzięki danym.
-
0:12 - 0:14Patrzymy na sprzedaż w supermarketach,
-
0:14 - 0:18na sprzedaż 30-centymetrowych
mrożonych ciast. -
0:18 - 0:21Szarlotka wygrywa bezapelacyjnie.
-
0:21 - 0:25Większość sprzedanych ciast
stanowi szarlotka. -
0:27 - 0:32Ale kiedy supermarkety zaczęły sprzedawać
mniejsze, 11-centymetrowe ciasta, -
0:32 - 0:36szarlotka nagle spadła
na czwarte czy piąte miejsce. -
0:36 - 0:39Dlaczego? Co się stało?
-
0:39 - 0:42Zastanówmy się.
-
0:42 - 0:46Kiedy kupuje się 30-centymetrowe ciasto,
-
0:46 - 0:48cała rodzina musi się zgodzić na smak,
-
0:48 - 0:52a szarlotka jest ich
drugim ulubionym ciastem. -
0:52 - 0:54(Śmiech)
-
0:54 - 0:57Ale gdy kupuje się pojedyncze
11-centymetrowe ciasto, -
0:57 - 1:01można wybrać to, na które się ma ochotę.
-
1:01 - 1:05Można wybrać ciasto,
które lubimy najbardziej. -
1:05 - 1:07Mamy więcej danych.
-
1:07 - 1:09Można dostrzec coś, czego nie było widać,
-
1:09 - 1:13mając do dyspozycji mniej danych.
-
1:13 - 1:16Ale większa ilość danych
-
1:16 - 1:18nie tylko pozwala dostrzec więcej
-
1:18 - 1:20na temat obserwowanych elementów.
-
1:20 - 1:23Większa ilość danych pozwala
dostrzec coś nowego. -
1:23 - 1:27Pozwala widzieć lepiej.
-
1:27 - 1:30Pozwala patrzeć w inny sposób.
-
1:30 - 1:33W tym przypadku umożliwia odkrycie,
-
1:33 - 1:36jakie jest ulubione ciasto Amerykanów.
-
1:36 - 1:39Nie szarlotka.
-
1:39 - 1:42Na pewno każdy z was
słyszał termin "big data". -
1:42 - 1:46Pewnie macie już dosyć
słuchania o tych "wielkich danych". -
1:46 - 1:49To prawda, że jest sporo
zamieszania wokół tego pojęcia, -
1:49 - 1:52a szkoda,
-
1:52 - 1:55ponieważ big data
to niesamowicie ważne narzędzie, -
1:55 - 1:59dzięki któremu społeczeństwo
może się rozwinąć. -
1:59 - 2:02W przeszłości analizowało się
małe zbiory danych, -
2:02 - 2:05próbowało się wyciągnąć ogólne wnioski.
-
2:05 - 2:07Teraz mamy więcej danych,
-
2:07 - 2:10więcej, niż mogliśmy mieć wcześniej.
-
2:10 - 2:12Okazuje się, że kiedy posiadamy
-
2:12 - 2:14sporą ilość danych, możemy osiągnąć to,
-
2:14 - 2:18czego wcześniej nie mogliśmy,
mając dostęp tylko do małej ilości danych. -
2:18 - 2:21Big data to ważna i nowa kwestia.
-
2:21 - 2:22Jakby się nad tym zastanowić,
-
2:22 - 2:25jedyny sposób,
by nasza planeta poradziła sobie -
2:25 - 2:26z globalnymi wyzwaniami,
-
2:26 - 2:30takimi jak nakarmienie ludności
i zapewnienie opieki medycznej, -
2:30 - 2:33dostępność energii i elektryczności
oraz dopilnowanie, -
2:33 - 2:36żeby ludzie nie zamienili się w skwarki
z powodu globalnego ocieplenia, -
2:36 - 2:40to efektywne wykorzystanie danych.
-
2:40 - 2:44A więc co jest takiego nowego
w big data? O co chodzi? -
2:44 - 2:46Najpierw zastanówmy się,
-
2:46 - 2:51jaką fizyczną formę
miały kiedyś informacje. -
2:52 - 2:59W 1908 roku na Krecie
archeologowie znaleźli gliniany dysk. -
3:00 - 3:04Datowali go na rok 2000 p.n.e.,
czyli liczy sobie 4000 lat. -
3:04 - 3:07Na dysku znajduje się inskrypcja,
ale nie wiemy, co oznacza. -
3:07 - 3:09Jest to niewyjaśniona zagadka,
ale chodzi o to, -
3:09 - 3:13że tak właśnie wyglądały
informacje 4000 lat temu. -
3:13 - 3:16W ten sposób społeczeństwo przechowywało
-
3:16 - 3:19i przekazywało sobie informacje.
-
3:19 - 3:23Społeczeństwo
wcale się tak bardzo nie rozwinęło. -
3:23 - 3:27Wciąż przechowujemy informacje na dyskach,
-
3:27 - 3:31choć teraz możemy przechować ich
więcej niż kiedykolwiek wcześniej. -
3:31 - 3:34Wyszukiwanie jest łatwiejsze.
Kopiowanie jest łatwiejsze. -
3:34 - 3:38Przekazywanie jest łatwiejsze.
Przetwarzanie jest łatwiejsze. -
3:38 - 3:41Możemy również
ponownie wykorzystać te informacje -
3:41 - 3:42na sposoby, o jakich nie śniliśmy,
-
3:42 - 3:46kiedy je zebraliśmy.
-
3:46 - 3:48W ten sposób dane przeszły
-
3:48 - 3:51od bycia zasobem
do bycia środkiem płynnym, -
3:51 - 3:55od czegoś stacjonarnego i statycznego
-
3:55 - 3:59do czegoś płynnego i dynamicznego.
-
3:59 - 4:03W informacji jest swoista płynność.
-
4:03 - 4:06Dysk znaleziony na Krecie,
-
4:06 - 4:10i który liczy sobie 4000 lat, jest ciężki,
-
4:10 - 4:12nie zawiera wielu informacji
-
4:12 - 4:15i nie można ich zmienić.
-
4:15 - 4:19Dla porównania wszystkie pliki,
-
4:19 - 4:21które Edward Snowden zabrał
-
4:21 - 4:24z Agencji Bezpieczeństwa Narodowego
w Stanach Zjednoczonych, -
4:24 - 4:29zmieściły się na karcie pamięci
o wielkości paznokcia -
4:29 - 4:33i mogą być przesłane z prędkością światła.
-
4:34 - 4:38Więcej danych. Więcej.
-
4:39 - 4:43Mamy tak wiele danych między innymi
dlatego, że zbieramy coraz więcej rzeczy, -
4:43 - 4:46o których zawsze zbieraliśmy informacje.
-
4:46 - 4:49Kolejnym powodem
jest też wykorzystywanie rzeczy, -
4:49 - 4:51które zawsze dostarczały informacji,
-
4:51 - 4:54ale nigdy nie zostały
przetworzone w formie danych, -
4:54 - 4:56a teraz przekształcamy je w dane.
-
4:56 - 5:00Zastanówcie się
na przykład nad lokalizacją. -
5:00 - 5:02Weźmy Marcina Lutra.
-
5:02 - 5:06Gdybyśmy w XVI wieku chcieli wiedzieć,
gdzie jest Marcin Luter, -
5:06 - 5:08musielibyśmy za nim cały czas podążać,
-
5:08 - 5:10pewnie z piórem i kałamarzem,
-
5:10 - 5:12żeby zapisywać dane.
-
5:12 - 5:14Teraz zastanówcie się,
jak to wygląda dzisiaj. -
5:14 - 5:16Wiecie, że gdzieś,
-
5:16 - 5:19zapewne w bazie danych
operatora telefonicznego, -
5:19 - 5:22znajduje się arkusz kalkulacyjny
albo wpis w bazie danych, -
5:22 - 5:26cały czas zbierający informacje o tym,
gdzie się znajdujecie. -
5:26 - 5:29Jeżeli macie telefon komórkowy
z systemem GPS, -
5:29 - 5:32a nawet jeżeli nie ma tam GPS-u,
może on zbierać informacje o was. -
5:32 - 5:37W ten sposób lokalizacja
została przekształcona w dane. -
5:37 - 5:42Teraz pomyślcie o kwestii postury,
o sposobie, w jaki teraz siedzicie, -
5:42 - 5:45w jaki ty siedzisz,
-
5:45 - 5:47w jaki ty siedzisz, ty również.
-
5:47 - 5:49Każdy jest inny i zależy to
od długości nóg -
5:49 - 5:51czy kształtu pleców.
-
5:51 - 5:54Gdybym umieścił powiedzmy 100 sensorów
-
5:54 - 5:56w każdym z waszych krzeseł,
-
5:56 - 5:59mógłbym stworzyć indeks
podporządkowany do każdej z osób. -
5:59 - 6:04Coś jak linie papilarne,
z tym że nie na palcu. -
6:04 - 6:07Co moglibyśmy z tym zrobić?
-
6:07 - 6:09Badacze w Tokio wykorzystują to
-
6:09 - 6:14przy tworzeniu urządzeń
zapobiegającym kradzieży samochodów. -
6:14 - 6:16Założenie jest takie,
że złodziej siada za kierownicą, -
6:16 - 6:19próbuje odpalić samochód,
ale system rozpoznaje, -
6:19 - 6:21że za kierownicą siedzi
nieautoryzowany kierowca, -
6:21 - 6:23więc silnik musi zgasnąć,
-
6:23 - 6:26chyba że wpisze się hasło,
-
6:26 - 6:31by zapewnić samochód,
że możemy prowadzić. Świetnie. -
6:31 - 6:33Co by się stało,
gdyby każdy samochód w Europie -
6:33 - 6:35posiadał tę technikę?
-
6:35 - 6:38Co moglibyśmy wtedy zrobić?
-
6:38 - 6:40Gdybyśmy zebrali te dane,
-
6:40 - 6:44moglibyśmy zidentyfikować wskaźniki,
-
6:44 - 6:49które przewidują, że w ciągu
kolejnych pięciu sekund -
6:49 - 6:53nastąpi wypadek samochodowy.
-
6:53 - 6:57Moglibyśmy zebrać dane
o zmęczeniu za kierownicą, -
6:57 - 6:59wtedy samochód wyczułby,
-
6:59 - 7:03że kierowca osuwa się z siedzenia
-
7:03 - 7:07i automatycznie wiedziałby,
że ma uruchomić alarm. -
7:07 - 7:09Kierownica by zawibrowała,
włączyłby się klakson. -
7:09 - 7:13Wszystko po to, żeby obudzić kierowcę
i nakazać mu większą ostrożność. -
7:13 - 7:14To właśnie możemy osiągnąć,
-
7:14 - 7:17jeżeli więcej aspektów naszego życia
przekształcimy w dane. -
7:17 - 7:21Jaka jest wartość big data?
-
7:21 - 7:23Zastanówcie się.
-
7:23 - 7:25Macie więcej informacji.
-
7:25 - 7:29Możecie osiągnąć więcej niż przedtem.
-
7:29 - 7:32Jedna z bardziej imponujących dziedzin,
w których wykorzystuje się ten pomysł, -
7:32 - 7:35jest uczenie maszynowe.
-
7:35 - 7:39Uczenie maszynowe
to dziedzina sztucznej inteligencji, -
7:39 - 7:42która z kolei jest dziedziną informatyki.
-
7:42 - 7:43Założenie jest takie,
-
7:43 - 7:46że zamiast instruować
komputer, co ma robić, -
7:46 - 7:48rozwiązujemy problem,
dając komputerowi dane, -
7:48 - 7:51z którymi musi sobie sam poradzić.
-
7:51 - 7:57Łatwo można to zrozumieć,
przyglądając początkom tego zjawiska. -
7:57 - 7:59W latach 50. informatyk
-
7:59 - 8:03pracujący w IBM, Arthur Samuel,
który lubił grać w warcaby, -
8:03 - 8:07napisał program komputerowy,
żeby mógł grać z komputerem. -
8:07 - 8:10Grał. Wygrywał.
-
8:10 - 8:12Grał. Wygrywał.
-
8:12 - 8:15Grał. Wygrywał,
-
8:15 - 8:19ponieważ komputer znał
wyłącznie dozwolone ruchy. -
8:19 - 8:21Arthur Samuel znał coś jeszcze:
-
8:21 - 8:26znał strategię.
-
8:26 - 8:30Dlatego napisał podprogram
działający w tle, który miał na celu -
8:30 - 8:32po każdym ruchu obliczyć
prawdopodobieństwo tego, -
8:32 - 8:39czy dany układ figur będzie prowadzić
do wygranej czy przegranej. -
8:40 - 8:43Grał z komputerem. Wygrywał.
-
8:43 - 8:45Grał z komputerem. Wygrywał.
-
8:45 - 8:49Grał z komputerem. Wygrywał.
-
8:49 - 8:51Wtedy Arthur Samuel zostawił komputer,
-
8:51 - 8:54żeby grał sam ze sobą.
-
8:54 - 8:57Grał sam ze sobą, zbierał więcej danych.
-
8:57 - 9:01Zbierał jeszcze więcej danych,
zwiększał dokładność przewidywań. -
9:01 - 9:03Potem Arthur Samuel wrócił do komputera,
-
9:03 - 9:06żeby z nim zagrać - i przegrał.
-
9:06 - 9:08Grał i przegrywał,
-
9:08 - 9:10grał i przegrywał.
-
9:10 - 9:13W ten sposób Arthur Samuel
stworzył maszynę, -
9:13 - 9:15która przewyższała jego umiejętności
-
9:15 - 9:18związane z zadaniem,
którego sam ją nauczył. -
9:19 - 9:25Ten sposób uczenia się maszyn
jest wdrażany wszędzie. -
9:25 - 9:28Jak myślicie, skąd się wzięły
samosterujące samochody? -
9:28 - 9:31Czy jako społeczeństwo zyskujemy jakoś,
-
9:31 - 9:34wgrywając zasady ruchu drogowego
do oprogramowania? -
9:34 - 9:36Nie. Pamięć jest tańsza. Nie.
-
9:36 - 9:40Algorytmy są szybsze. Nie.
Procesory są lepsze. Nie. -
9:40 - 9:43To wszystko ma znaczenie,
ale nie stanowi głównego powodu. -
9:43 - 9:46Chodzi o to, że zmieniliśmy
istotę problemu. -
9:46 - 9:50Początkowo chcieliśmy bezpośrednio
-
9:50 - 9:54wyjaśnić komputerowi, jak ma jeździć,
z kolei teraz stwierdzamy: -
9:54 - 9:57"Masz tu masę danych z otoczenia pojazdu.
-
9:57 - 9:59Sam rozpoznaj światło sygnalizacyjne,
-
9:59 - 10:01że światło jest czerwone, a nie zielone,
-
10:01 - 10:03że trzeba się wtedy zatrzymać,
-
10:03 - 10:06a nie jechać dalej".
-
10:06 - 10:10Uczenie maszynowe
leży u podstaw wielu rzeczy w sieci, -
10:10 - 10:12takich jak wyszukiwarki internetowe,
-
10:12 - 10:16algorytm personalizujący Amazona,
-
10:16 - 10:18tłumaczenie komputerowe,
-
10:18 - 10:22systemy rozpoznawania głosu.
-
10:22 - 10:28Badacze przyglądają się ostatnio
kwestii biopsji, -
10:28 - 10:31biopsji nowotworów.
-
10:31 - 10:33Kazali komputerowi zidentyfikować,
-
10:33 - 10:36za pomocą danych
i współczynników przeżycia, -
10:36 - 10:42czy badane komórki
są faktycznie komórkami nowotworowymi. -
10:43 - 10:47Kiedy przepuszczono dane
przez algorytm uczenia maszynowego, -
10:47 - 10:49maszyna była w stanie zidentyfikować
-
10:49 - 10:5112 wyznaczników, które wskazywały na to,
-
10:51 - 10:57że dane komórki pobrane z piersi
są nowotworowe. -
10:57 - 10:59Jest jednak problem,
-
10:59 - 11:03mianowicie medycyna znała tylko dziewięć.
-
11:03 - 11:07Na trzy pozostałe nie zwracano uwagi,
-
11:07 - 11:11ale maszyna je znalazła.
-
11:14 - 11:19Oczywiście istnieje też
ciemna strona big data. -
11:19 - 11:21Dane pomagają w życiu, jednak są problemy,
-
11:21 - 11:24których musimy być świadomi.
-
11:24 - 11:26Pierwszy z nich wiąże się z tym,
-
11:26 - 11:29że możemy być karani z powodu przewidywań.
-
11:29 - 11:33Policja może używać big data
do swoich celów, -
11:33 - 11:35tak jak w "Raporcie mniejszości".
-
11:35 - 11:38Tutaj chodzi o "predictive policing",
-
11:38 - 11:40czyli kryminologię algorytmiczną.
-
11:40 - 11:42Jeżeli zbierzemy dużo danych
-
11:42 - 11:44o tym, gdzie popełniane były zbrodnie,
-
11:44 - 11:47będziemy wiedzieli, gdzie wysyłać patrole.
-
11:47 - 11:51Ma to sens, natomiast problem
polega na tym, że nie będzie to zawężone -
11:51 - 11:53do danych na temat lokalizacji,
-
11:53 - 11:56ale także wskazywać jednostki.
-
11:56 - 12:00Dlaczego nie użyć danych
dotyczących czyichś wyników w nauce? -
12:00 - 12:02Może powinniśmy uwzględnić fakt,
-
12:02 - 12:05że ktoś jest bezrobotny
czy posiada zdolność kredytową, -
12:05 - 12:08jak zachowuje się w internecie,
czy późno kładzie się spać. -
12:08 - 12:11Opaska fitness, gdy zacznie
monitorować procesy biochemiczne, -
12:11 - 12:15będzie mogła wykazać,
że ktoś ma agresywne skłonności. -
12:15 - 12:17Powstaną algorytmy zdolne przewidzieć,
-
12:17 - 12:19co mamy zamiar zrobić
-
12:19 - 12:23i uznać osobę za winną,
zanim cokolwiek uczyni. -
12:23 - 12:25Prywatność była głównym wyzwaniem
-
12:25 - 12:28przed erą big data.
-
12:28 - 12:30W erze big data
-
12:30 - 12:34wyzwaniem będzie ochrona wolnej woli,
-
12:34 - 12:38moralnego wyboru, podejmowania decyzji,
-
12:38 - 12:41sprawczości.
-
12:43 - 12:45Istnieje kolejny problem.
-
12:45 - 12:48Big data zabiorą nam pracę.
-
12:48 - 12:52Big data i algorytmy zagrożą
-
12:52 - 12:57białym kołnierzykom,
pracownikom umysłowym w XXI wieku, -
12:57 - 12:59w ten sam sposób,
w jaki zautomatyzowanie produkcji -
12:59 - 13:02i linie produkcyjne
zagroziły niebieskim kołnierzykom, -
13:02 - 13:04czyli robotnikom, w XX wieku.
-
13:04 - 13:06Pomyślcie o laborancie,
-
13:06 - 13:09który bada przez mikroskop
materiał z biopsji, -
13:09 - 13:12żeby ocenić, czy są to
komórki nowotworowe. -
13:12 - 13:14Ta osoba kształciła się na uniwersytecie,
-
13:14 - 13:15kupuje nieruchomości,
-
13:15 - 13:17głosuje,
-
13:17 - 13:21wnosi wkład do społeczeństwa.
-
13:21 - 13:22I praca tej osoby,
-
13:22 - 13:26podobnie jak praca całego sztabu
podobnych specjalistów, -
13:26 - 13:29może ulec drastycznej zmianie,
-
13:29 - 13:31bądź też stać się całkowicie zbędna.
-
13:31 - 13:33Wyobrażamy to sobie tak,
-
13:33 - 13:36że technika z czasem
stworzy miejsca pracy, -
13:36 - 13:39po chwilowych zawirowaniach.
-
13:39 - 13:41To prawda, jeśli myślimy w kategoriach
-
13:41 - 13:43zmian w czasach rewolucji przemysłowej,
-
13:43 - 13:46gdzie nastąpiło dokładnie coś takiego.
-
13:46 - 13:48Ale o czymś zapominamy,
-
13:48 - 13:50mianowicie są pewne zawody,
-
13:50 - 13:53które znikną i już nigdy nie powrócą.
-
13:53 - 13:58Rewolucja przemysłowa
uderzyła w pozycję koni na rynku pracy. -
13:59 - 14:01Dlatego musimy być ostrożni
-
14:01 - 14:05i dostosować big data do naszych potrzeb,
-
14:05 - 14:08naszych ludzkich potrzeb.
-
14:08 - 14:10Musimy być panami tej techniki,
-
14:10 - 14:12nie jej sługami.
-
14:12 - 14:15Jesteśmy na samym początku ery big data
-
14:15 - 14:18i szczerze powiedziawszy,
nie radzimy sobie zbyt dobrze -
14:18 - 14:22z danymi, które jesteśmy w stanie zebrać.
-
14:22 - 14:25Nie jest to tylko wyzwanie
dla Agencji Bezpieczeństwa Narodowego. -
14:25 - 14:28Przedsiębiorstwa również zbierają dane
i niewłaściwie ich używają. -
14:28 - 14:32Musimy się poprawić,
a to będzie wymagało czasu. -
14:32 - 14:36Jest to podobne do wyzwania,
jakie w prehistorii stanowił ogień. -
14:36 - 14:38To narzędzie jest w stanie nas spalić,
-
14:38 - 14:42jeżeli nie będziemy ostrożni.
-
14:44 - 14:50Big data zmienią nasze życie,
pracę, nasze myślenie. -
14:50 - 14:52Pomogą nam kierować swoją karierą
-
14:52 - 14:55i prowadzić satysfakcjonujące życie,
-
14:55 - 14:58pełne nadziei, szczęścia i zdrowia.
-
14:58 - 15:02Natomiast w przeszłości
patrzyliśmy na technikę informacyjną, -
15:02 - 15:04widząc tylko literę T,
-
15:04 - 15:06technikę, sprzęt,
-
15:06 - 15:08ponieważ to było coś fizycznego.
-
15:08 - 15:11Teraz musimy zacząć patrzeć na literę I,
-
15:11 - 15:14informację, która jest mniej namacalna,
-
15:14 - 15:18ale w pewnym sensie istotniejsza.
-
15:18 - 15:21Ludzkość w końcu może
czerpać wiedzę z informacji, -
15:21 - 15:24które jest w stanie zebrać,
-
15:24 - 15:26w ramach naszej ponadczasowej misji,
-
15:26 - 15:29by zrozumieć świat i nasze w nim miejsce,
-
15:29 - 15:33dlatego big data to poważna sprawa.
-
15:34 - 15:38(Brawa)
- Title:
- Big data to lepsze dane
- Speaker:
- Kenneth Cukier
- Description:
-
Samosterujące samochody to zaledwie początek. Jaka będzie przyszłość techniki i projektowania napędzanego przez big data? Kenneth Cukier w tej porywającej naukowej prelekcji zarysowuje przyszłość uczenia maszynowego i wiedzy ludzkiej.
- Video Language:
- English
- Team:
- closed TED
- Project:
- TEDTalks
- Duration:
- 15:51
Krystian Aparta approved Polish subtitles for Big data is better data | ||
Krystian Aparta edited Polish subtitles for Big data is better data | ||
Krystian Aparta edited Polish subtitles for Big data is better data | ||
Magda Komorowska accepted Polish subtitles for Big data is better data | ||
Magda Komorowska edited Polish subtitles for Big data is better data | ||
Magda Komorowska edited Polish subtitles for Big data is better data | ||
Magda Komorowska edited Polish subtitles for Big data is better data | ||
Magda Komorowska edited Polish subtitles for Big data is better data |