Kako učimo računala da razumiju slike
-
0:04 - 0:06Dopustite da vam pokažem nešto
-
0:06 - 0:10[Video] Djevojka: Dobro, to je mačka
koja sjedi na krevetu. -
0:10 - 0:12Dječak mazi slona.
-
0:14 - 0:17Ovo su ljudi
koji idu u avion. -
0:19 - 0:20To je veliki avion.
-
0:21 - 0:24Fei-Fei Li: Ovo je
trogodišnje dijete -
0:24 - 0:27koje opisuje što vidi
na ovim slikama. -
0:27 - 0:30Iako ima još dosta toga
što mora naučiti o svijetu -
0:30 - 0:35već je ekspert
u nečemu važnom: -
0:35 - 0:37razumije što vidi.
-
0:38 - 0:42Naše društvo je tehnološki
naprednije no ikada. -
0:42 - 0:46Šaljemo ljude na mjesec,
izrađujemo telefone koji pričaju s nama -
0:46 - 0:51i prilagođene radio stanice
koje puštaju samo glazbu koju volimo. -
0:51 - 0:55Ipak, naši najnapredniji
uređaj i računala -
0:55 - 0:58imaju poteškoća s ovim zadatkom.
-
0:58 - 1:01Ovdje sam danas
kako bi vas izvijestila -
1:01 - 1:05o najnovijim dostignućima
u istraživanju računalnog vida, -
1:05 - 1:10jednoj od glavnih
i potencijalno revolucionarnih -
1:10 - 1:11tehnologija računarstva.
-
1:13 - 1:17Imamo prototipe auta
koji se sami voze, -
1:17 - 1:21ali bez pametnog vida,
ne mogu zapravo vidjeti razliku -
1:21 - 1:25između zgužvane papirnate vrećice
na putu, koju mogu pregaziti, -
1:25 - 1:29i kamena te veličine
koji treba izbjeći. -
1:29 - 1:33imamo odlične megapikselne kamere,
-
1:33 - 1:36ali nismo dali
vid slijepima. -
1:36 - 1:40Dronovi mogu letjeti vrlo daleko
-
1:40 - 1:42ali nemaju dovoljno tehnologije vida
-
1:42 - 1:45da nam pomognu pratiti
promjene u kišnim šumama -
1:45 - 1:48Sigurnosne kamere su svugdje,
-
1:48 - 1:53ali ne upozoravaju nas kada se
dijete utaplja u bazenu. -
1:54 - 2:00Slike i videi postaju
integralni dio globalnog života. -
2:00 - 2:04Stvaraju se brzinom koja je
daleko veća od od one koji bi čovjek -
2:04 - 2:07ili timovi ljudi željeli vidjeti,
-
2:07 - 2:10a vi i ja pridonosimo tome
ovdje na TED-u. -
2:11 - 2:16Ipak naš najnapredniji softver
se i dalje muči oko razumjevanja -
2:16 - 2:19i upravljanja tog ogromnog sadržaja.
-
2:20 - 2:23Drugim riječima,
zajedno kao društvo, -
2:25 - 2:26poprilično smo slijepi,
-
2:26 - 2:30jer su naši najpametniji
uređaji i dalje slijepi. -
2:32 - 2:34"Zašto je to tako teško?",
možda se pitate. -
2:34 - 2:37Kamere mogu fotografirati slike poput ove
-
2:37 - 2:41pretvarajući svjetlost u
dvodimenzionalne redove brojeva -
2:41 - 2:43poznate kao pikseli,
-
2:43 - 2:45ali to su samo beživotni brojevi.
-
2:45 - 2:47Ne nose smisao u sebi.
-
2:48 - 2:52Jednako kao što slušati
ne znači isto što i čuti, -
2:52 - 2:57fotografirati sliku nije isto
što i vidjeti, -
2:57 - 3:00a pod vidjeti
mislimo na razumijevanje. -
3:01 - 3:07Zapravo, prirodi je bilo potrebno
540 milijuna godina teškog posla -
3:07 - 3:09da to uspije,
-
3:09 - 3:11a većina tog posla
-
3:11 - 3:16otišla je u razvijanje uređaja
za obradu vida u našem mozgu, -
3:16 - 3:18ne u samim očima.
-
3:19 - 3:22Vid započinje s očima,
-
3:22 - 3:25ali zapravo se sve događa u mozgu.
-
3:26 - 3:31Već 15 godina, započevši od
mog doktorata u Caltech-u -
3:31 - 3:34i zatim vodeći Stanfordov
laboratorij za vid, -
3:34 - 3:39radila sam s mentorima,
suradnicima i studentima -
3:39 - 3:41kako bi naučili računala da vide.
-
3:43 - 3:46Naše polje se zove
računarni vid i strojno učenje. -
3:46 - 3:49Dio je većeg polja
umjetne inteligencije. -
3:51 - 3:56Naposljetku, želimo naučiti
uređaje da vide kao što mi vidimo: -
3:56 - 4:02imenovanje objekata, prepoznavanje ljudi,
razumjevanje trodimenzionalnosti objekata, -
4:02 - 4:08razumjevanje odnosa, emocija
akcija i namjera. -
4:08 - 4:14Vi i ja vidimo cijele priče
ljudi, mjesta i stvari -
4:14 - 4:16u trenutku kada ih pogledamo.
-
4:17 - 4:23Prvi korak do ovog cilja je
naučiti računala da vide objekte, -
4:23 - 4:26građevne jedinice vizualnog svijeta.
-
4:26 - 4:30U svom najjednostavnijem obliku,
zamislite ovaj proces učenja -
4:30 - 4:33kao pokazivanje računalu
raznih prizora za trening -
4:33 - 4:37određenog objekta, recimo mačaka,
-
4:37 - 4:41i dizajniranje modela koji uči
iz ovih prikaza za . -
4:41 - 4:43Koliko teško to može biti?
-
4:43 - 4:47Nakon svega, mačka je samo
skup oblika i boja, -
4:47 - 4:52i ovo je ono što smo radili
u početcima modeliranja objekta. -
4:52 - 4:55Napisali bi računalu algoritme
u matematičkom jeziku -
4:55 - 4:59da mačka ima okruglo lice,
debeljuškasto tijelo, -
4:59 - 5:01dva šiljata uha i dugačak rep,
-
5:01 - 5:02i da izgleda lijepo.
-
5:03 - 5:05ali što je s ovom mačkom?
-
5:05 - 5:06(Smijeh)
-
5:06 - 5:08Sva je izvijena.
-
5:08 - 5:12Sad morate dodati drugi oblik
i pogled modelnom objektu. -
5:12 - 5:14Što ako su mačke skrivene?
-
5:15 - 5:17Što je sa smiješnim mačkama?
-
5:19 - 5:22Sad vidite što želim reći.
-
5:22 - 5:25Čak i nešto jednostavno
poput kućnog ljubimca -
5:25 - 5:29može imati beskonačan broj
varijacija modelnog objekta, -
5:29 - 5:32i to je samo jedan objekt.
-
5:33 - 5:35Prije osam godina,
-
5:35 - 5:40vrlo jednostavno i duboko zapažanje
promjenilo mi je razmišljanje. -
5:41 - 5:44Nitko ne govori djetetu kako da vidi,
-
5:44 - 5:46posebno u ranijim godinama.
-
5:46 - 5:51Oni to uče kroz
iskustvo i primjere iz stvarnog svijeta. -
5:51 - 5:54Ako smatrate dječje oči
-
5:54 - 5:57parom bioloških kamera,
-
5:57 - 6:01one fotografiraju
svakih 200 milisekundi, -
6:01 - 6:04prosječno vrijeme koliko je potrebno
za pokret oka. -
6:04 - 6:10Do svoje treće godine, dijete bi vidjelo
stotine milijuna slika -
6:10 - 6:11stvarnog svijeta.
-
6:11 - 6:13To je puno primjera za vježbu.
-
6:14 - 6:20Umjesto fokusiranja samo na
sve bolje i bolje algoritme, -
6:20 - 6:26mislila sam dati algoritmima
nekakakve podatke za vježbu -
6:26 - 6:29koje je dijete dobijalo kroz iskustva
-
6:29 - 6:33i to kvantitativno i kvalitativno.
-
6:33 - 6:35Jednom kada znamo ovo,
-
6:35 - 6:38znali smo da moramo skupiti skup podataka
-
6:38 - 6:42koji ima puno više prikaza
no što smo mi imali ikad prije, -
6:42 - 6:44možda i tisuću puta više,
-
6:45 - 6:49i zajedno s profesorom
Kai Li na sveučilištu Princeton, -
6:49 - 6:522007. lansirali smo ImageNet projekt.
-
6:54 - 6:57Sva sreća nismo morali montirati
kamere na naše glave -
6:57 - 6:59i čekati godinama.
-
6:59 - 7:01Otišli smo na Internet,
-
7:01 - 7:05najveću riznicu slika koju je
čovječanstvo stvorilo. -
7:05 - 7:08skinuli smo skoro
milijardu slika i -
7:08 - 7:14koristili crowdsourcing tehnologiju
poput platforme Amazon Mechanical Turk -
7:14 - 7:16da označimo te prikaze.
-
7:16 - 7:21Kako je raslo, ImageNet je bio jedan od
najvećih poslodavaca -
7:21 - 7:24radnika Amazon Mechanical Turk-a:
-
7:24 - 7:28zajedno, skoro 50.000 radnika
-
7:28 - 7:32iz 167 država svijeta
-
7:32 - 7:36pomoglo nam je da očistimo,
sortiramo i označimo -
7:36 - 7:39skoro milijardu korisnih prikaza.
-
7:41 - 7:43Toliko truda je trebalo
-
7:43 - 7:47da se uhvati dio prikaza
-
7:47 - 7:51koje djetetov um uhvati
u ranim godinama razvoja. -
7:52 - 7:56Na očigled, ova ideja
korištenja mnogo podataka -
7:56 - 8:01da se istreniraju računalni algoritmi
se možda sada čini očiglednim, -
8:01 - 8:05ali 2007., nije bilo tako očigledno.
-
8:05 - 8:09Prilično dugo bili smo
poprilično sami na tom putu. -
8:09 - 8:14Neke prijateljski nastrojene kolege su
me savjetovale da radim nešto korisnije, -
8:14 - 8:18i cijelo vrijeme smo se borili
za financiranje istraživanja. -
8:18 - 8:20Jednom, sam se čak našalila sa studentima
-
8:20 - 8:24da ću ponovno otvoriti kemijsku čistionicu
kako bih mogla financirati ImageNet. -
8:24 - 8:27Naposljetku, tako sam financirala
svoj studij. -
8:29 - 8:31Nastavili smo dalje.
-
8:31 - 8:352009. ImageNet je dosegao
-
8:35 - 8:39bazu podataka od 15 milijuna prikaza
-
8:39 - 8:44preko 22.000 klasa
objekata i stvari -
8:44 - 8:47organiziranih u svakodnevne
engleske riječi. -
8:47 - 8:50I po kvantiteti i po kvaliteti
-
8:50 - 8:52ovo je dosad nedostignuta skala.
-
8:54 - 8:56Kao primjer, u slučaju mačaka,
-
8:56 - 8:59imamo više od 62.000 mačaka
-
8:59 - 9:03u svim oblicima i pozama,
-
9:03 - 9:08i različitih vrsta
domaćih i divljih mačaka. -
9:08 - 9:12Bili smo oduševljeni
što smo sastavili ImageNet, -
9:12 - 9:16i htjeli smo da cijeli znanstveni svijet
ima koristi od njega, -
9:16 - 9:20tako da smo po modi TED-a
otvorili cijeli skup podataka -
9:20 - 9:23svim istraživačkim zajednicama, besplatno.
-
9:23 - 9:29(Pljesak)
-
9:29 - 9:34Sad kad imamo podatke
da opskrbimo mozgove naših računala, -
9:34 - 9:38spremni smo vratiti se na
same algoritme. -
9:38 - 9:43Ispalo je kako je bogatstvo informacija
s ImageNet-a -
9:43 - 9:48savršeno za određene vrste
algoritama za strojno učenje -
9:48 - 9:50koji se zovu konvolucijske neuronske mreže
-
9:50 - 9:55osmišljene od strane Kunihiko Fukushime,
Geoff Hintona i Yann LeCuna -
9:55 - 9:59davnih 1970-ih i 1980-ih.
-
9:59 - 10:05Upravo kako se mozak sastoji
od milijardu vrlo povezanih neurona, -
10:05 - 10:08osnovna operacijska jedinica
neuronskih mreža -
10:08 - 10:11jest čvor sličan neuronu.
-
10:11 - 10:13Prima podatke od drugih čvorova
-
10:13 - 10:16i šalje ih drugima.
-
10:16 - 10:21Ove stotine tisuća ili
čak milijuni čvorova -
10:21 - 10:24su organizirani po
hijerarhijskim slojevima -
10:24 - 10:27sličnim onima u mozgu.
-
10:27 - 10:31U tipičnoj neuralnoj mreži koju koristimo
u učenju prepoznavanja modela, -
10:31 - 10:35ima 24 milijuna čvorova,
-
10:35 - 10:38140 milijuna parametara,
-
10:38 - 10:41i 15 milijardi veza.
-
10:41 - 10:43To je ogroman model.
-
10:43 - 10:47Upogonjen je s
mnoštvom podataka s ImageNet-a -
10:47 - 10:52te modernih CPJ-a i GPJ-a
kako bi istrenirao ove ogrome modele, -
10:52 - 10:55skupna neuronska mreža
-
10:55 - 10:58je procvala na način
koji nitko nije očekivao. -
10:58 - 11:01Postala je ključna struktura
-
11:01 - 11:05koja je dovodila do novih uzbudljivih
rezultata u prepoznavanju objekata. -
11:06 - 11:09Ovo je računalo koje nam govori
-
11:09 - 11:11da je na slici mačka
-
11:11 - 11:13i gdje je mačka.
-
11:13 - 11:15Naravno ne radi se samo o mački,
-
11:15 - 11:18ovdje nam računalni algoritam govori
-
11:18 - 11:20da slika sadrži
dječaka i medvjedića; -
11:21 - 11:24psa, osobu i malog zmaja
u pozadini; -
11:25 - 11:28ili slika vrlo zbrkanih stvari
-
11:28 - 11:32poput čovjeka, skateboarda,
ograde, lampe itd. -
11:33 - 11:38Ponekad kada računalo
nije sigurno što vidi, -
11:39 - 11:42moramo ga naučiti da bude dovoljno pametno
-
11:42 - 11:46da nam pruži siguran odgovor,
-
11:46 - 11:48kao što bismo mi odgovorili,
-
11:48 - 11:53ali u drugim slučajevima računalni
alogoritam nam besprijekorno kaže -
11:53 - 11:55što su točno ti objekti,
-
11:55 - 11:59poput materijala, modela, godine auta.
-
11:59 - 12:04Primjenili smo ovaj algoritam na milijune
Google Street View prikaza -
12:04 - 12:07u stotinama američkih gradova,
-
12:07 - 12:10i spoznali smo nešto vrlo zanimljivo:
-
12:10 - 12:14prvo, potvrdilo se staro pravilo
-
12:14 - 12:17da cijene auta dobro koreliraju
-
12:17 - 12:19s kućnim primanjima.
-
12:19 - 12:24Ali isto tako cijene auta
koreliraju također sa -
12:24 - 12:26stopom kriminala u gradovima,
-
12:27 - 12:30ili načina glasanja po poštanskom broju.
-
12:32 - 12:34Čekajte.
Je li to, to? -
12:34 - 12:38Je li nas računalo već sustigao
ili čak prestiglo u našim sposobnostima? -
12:39 - 12:41Ne tako brzo.
-
12:42 - 12:46Zasad smo samo naučili
računalo da vidi objekte. -
12:46 - 12:51To je kao da malo dijete
učite reći nekoliko imenica. -
12:51 - 12:54To je ogromno postignuće,
-
12:54 - 12:56ali je to tek prvi korak.
-
12:56 - 13:00Uskoro će drugo razvojno postignuće
biti dosegnuto, -
13:00 - 13:03i djeca počinju komunicirati u rečenicama.
-
13:03 - 13:08Stoga umjesto govorenja
kako je mačka na slici, -
13:08 - 13:12već ste čuli malu djevojčicu
koja govori da mačka leži na krevetu. -
13:13 - 13:18Kako bi naučili računalo
da vidi sliku i stvori rečenice, -
13:18 - 13:22brak između velikih podataka
i algoritama strojnog učenja -
13:22 - 13:24mora ići korak dalje.
-
13:25 - 13:29Računalo mora naučiti
učiti i iz slika -
13:29 - 13:32i iz prirodnih jezičnih rečenica
-
13:32 - 13:34stvorenih od strane ljudi.
-
13:35 - 13:39Upravo kako mozak integrira
vid i jezik, -
13:39 - 13:44razvili smo model
koji spaja vidljive dijelove -
13:44 - 13:46poput vidnih komada
-
13:46 - 13:50s riječima i frazama u rečenicama.
-
13:51 - 13:53Otprilike prije četiri mjeseca,
-
13:53 - 13:56konačno smo uspjelo sve povezati
-
13:56 - 13:59i proizveli smo jedan od prvih
modela računalnog vida -
13:59 - 14:03koji je sposoban stvoriti
rečenicu sličnu ljudskoj -
14:03 - 14:06kada vidi sliku po prvi puta.
-
14:07 - 14:12Pokazat ću vam
što računalo kaže -
14:12 - 14:14kada vidi slike
-
14:14 - 14:17koje je mala djevojčica vidjela
na početku govora. -
14:20 - 14:22(Video) Računalo: Čovjek stoji
pored slona. -
14:24 - 14:28Veliki avion sjedi na vrhu
avionske piste. -
14:29 - 14:33FFL: Naravno, i dalje se trudimo
unaprijediti naše algoritme, -
14:33 - 14:35i još puno toga mora naučiti.
-
14:35 - 14:40(Pljesak)
-
14:40 - 14:42I računalo i dalje pravi greške.
-
14:43 - 14:45(Video) Računalo: Mačka leži
na krevetu u deci. -
14:46 - 14:49FFL: Naravno, kada vidi
previše mačaka, -
14:49 - 14:51misli da bi sve moglo
izgledati kao mačka. -
14:53 - 14:56(Video) Računalo: Dječak
drži bejzbolsku palicu. -
14:56 - 14:58(Smijeh)
-
14:58 - 15:03FFL: Ili, ako nije vidio četkicu za zube,
pomiješat će je s bejzbolskom palicom. -
15:03 - 15:07(Video) Računalo: Čovjek jaše konja
niz ulicu pored zgrade. -
15:07 - 15:09(Smijeh)
-
15:09 - 15:12FFL: Nismo računalo naučili
neke osnove umjetnosti. -
15:14 - 15:17(Video) Računalo: Zebra stoji
u polju trave. -
15:17 - 15:20FFL: I nije naučio diviti se
prekrasnoj ljepoti prirode -
15:20 - 15:21kao vi i ja.
-
15:22 - 15:25Bilo je to dugo putovanje.
-
15:25 - 15:30Od rođenja do treće godine je bilo teško.
-
15:30 - 15:35Pravi izazov je doći
od treće do trinaeste godine, i dalje. -
15:35 - 15:39Podsjetit ću vas s opet s ovom
slikom dječaka i kolača. -
15:39 - 15:44Dosad smo naučili računalo
da vidi objekte -
15:44 - 15:47ili čak nam kaže jednostavnu priču
onoga što je na slici. -
15:48 - 15:51(Video) Računalo: Osoba sjedi
za stolom s kolačem. -
15:51 - 15:54FFL: Ali postoji puno više
na ovoj slici -
15:54 - 15:56nego samo osoba i kolač.
-
15:56 - 16:01Što računalo ne vidi jest
da je to poseban talijanski kolač -
16:01 - 16:04koji se jedino servira za vrijeme Uskrsa.
-
16:04 - 16:07Dječak nosi svoju omiljenu majicu
-
16:07 - 16:11koju je dobio od oca
nakon putovanja u Sidney, -
16:11 - 16:15i vi i ja možemo reći da je jako stretan
-
16:15 - 16:18i što je na njegovom umu
u ovom trenu. -
16:19 - 16:21To je moj sin Leo.
-
16:22 - 16:25Na mom pohodu na vidnu inteligenciju,
-
16:25 - 16:27razmišljam o Leu konstantno
-
16:27 - 16:30i budućnosti u kojoj će živjeti.
-
16:30 - 16:32Kada uređaji vide,
-
16:32 - 16:37doktori i sestre će imati
dodatan par neumornih očiju -
16:37 - 16:41koje im pomažu dijagnosticirati
i pobrinuti se za pacijenta. -
16:41 - 16:45Auti će voziti pametnije
i sigurnije na putu. -
16:45 - 16:48Roboti, ne samo ljudi,
-
16:48 - 16:53će pomoći u opasnim situacijama
kako bi spasili zatočene i ozljeđene. -
16:53 - 16:58Otkrit ćemo nove vrste,
bolje materijale, -
16:58 - 17:01i istražiti neviđene granice
uz pomoć uređaja. -
17:03 - 17:07Malo po malo, dajemo
vid uređajima. -
17:07 - 17:10Prvo, smo ih naučili da vide.
-
17:10 - 17:13Onda nam oni pomažu vidjeti bolje.
-
17:13 - 17:17Po prvi put, ljudsko oko
neće biti jedino -
17:17 - 17:19koje gleda i istražuje svijet.
-
17:20 - 17:23Nećemo koristiti uređaje
zbog njihove inteligencije, -
17:23 - 17:28surađivat ćemo s njima
na načine koje ne možemo zamisliti. -
17:30 - 17:32Ovo je moj pothvat:
-
17:32 - 17:34dati računalima vidnu inteligenciju
-
17:34 - 17:39i stvoriti bolje sutra
za Lea i za svijet. -
17:40 - 17:41Hvala vam.
-
17:41 - 17:45(Pljesak)
- Title:
- Kako učimo računala da razumiju slike
- Speaker:
- Fei-Fei Li
- Description:
-
Kada vrlo mala djevojčica pogleda sliku, ona može prepoznati osnovne elemente: "mačku", "knjigu", "stolicu". Sad, računala postaju dovoljno pametna da i ona to rade. Što je slijedeće? U ovom uzbudljivom govoru, ekspert za računalni vid Fei-Fei Li opisuje najnovija (uključujući bazu podataka od 15 milijuna slika koje je njen tim stvorio kako bi "naučio" računalo da prepoznaje slike) i glavna dostignuća.
- Video Language:
- English
- Team:
- closed TED
- Project:
- TEDTalks
- Duration:
- 17:58
Retired user approved Croatian subtitles for How we're teaching computers to understand pictures | ||
Mislav Ante Omazić - EFZG edited Croatian subtitles for How we're teaching computers to understand pictures | ||
Mislav Ante Omazić - EFZG edited Croatian subtitles for How we're teaching computers to understand pictures | ||
Mislav Ante Omazić - EFZG edited Croatian subtitles for How we're teaching computers to understand pictures | ||
Mislav Ante Omazić - EFZG accepted Croatian subtitles for How we're teaching computers to understand pictures | ||
Mislav Ante Omazić - EFZG edited Croatian subtitles for How we're teaching computers to understand pictures | ||
Mislav Ante Omazić - EFZG edited Croatian subtitles for How we're teaching computers to understand pictures | ||
Mislav Ante Omazić - EFZG edited Croatian subtitles for How we're teaching computers to understand pictures |