Un tempo se volevate
far fare qualcosa di nuovo ad un computer
dovevate programmarlo.
La programmazione, per quelli di voi
che non l'hanno mai provata,
richiede una spiegazione dettagliata
di ogni singolo passaggio che volete
che il computer faccia
per ottenere il vostro scopo.
Se volete fare qualcosa
che nemmeno voi sapete come si faccia,
potrebbe essere una sfida eccezionale.
Questa è la sfida affrontata
da quest'uomo, Arthur Samuel.
Nel 1956 voleva che il suo computer
fosse in grado di batterlo a dama.
Come si può scrivere un programma
che spieghi in modo dettagliato
come essere migliori di voi a dama?
Ebbe un'idea:
fece giocare il computer
contro sé stesso migliaia di volte
per imparare a giocare a dama.
E ha davvero funzionato,
infatti nel 1962
questo computer ha battuto
il campione del Connecticut.
Così Arthur Samuel è stato
il padre dell'apprendimento automatico,
ed ho un grande debito con lui,
perché sono un professionista
dell'apprendimento automatico.
Sono stato il presidente di Kaggle
una comunità di oltre 200 000
professionisti
dell'apprendimento automatico.
Kaggle crea delle competizioni
per cercare di risolvere
problemi irrisolti
e ce l'ha fatta
centinaia di volte.
Da questo punto di osservazione
sono stato in grado di scoprire
molto su quanto l'apprendimento automatico
ha potuto fare in passato,
su quel che può fare oggi,
e su cosa potrà fare in futuro.
Probabilmente il primo grande successo
dell'apprendimento automatico
in commercio è stato Google.
Google ha mostrato che
è possibile trovare informazioni
usando un algoritmo informatico,
un algoritmo basato
sull'apprendimento automatico.
Da allora ci sono stati numerosi successi
commerciali nell'apprendimento automatico.
Società quali Amazon e Netflix
usano l'apprendimento automatico
per suggerire
prodotti che potreste voler acquistare,
film che potreste voler vedere.
A volte è quasi inquietante.
Società come Linkedin e Facebook
talvolta vi diranno
chi potrebbe essere vostro amico
e non avete idea di come ci riescano
e questo perché stanno utilizzando
l'apprendimento automatico.
Sono algoritmi che hanno imparato
tutto questo dai dati
invece che dalla programmazione manuale.
La IBM è riuscita in questo modo
a far sì che Watson battesse
due campioni mondiali di "Jeopardy"
rispondendo a domande incredibilmente
acute e complesse come queste.
["L'antico leone di Nimrud" è scomparso
dal museo nazionale di questa città nel 2003
(insieme ad altro materiale)"]
Ed ecco perché siamo in grado di vedere
la prima auto che si guida da sola.
Se vogliamo essere in grado di dire
la differenza tra, diciamo,
un albero ed un pedone,
allora questo è piuttosto importante.
Non sappiamo come scrivere
questi programmi manualmente
ma con l'apprendimento automatico
adesso è possibile.
Questa auto ha guidato
per oltre un milione di chilometri,
su strada normale, senza alcun incidente.
Adesso sappiamo che i computer
possono imparare,
i computer possono imparare a fare cose
che nemmeno noi non sappiamo fare,
o che magari possono fare meglio di noi.
Uno degli esempi più impressionanti
di apprendimento automatico che ho visto
è stato durante un progetto
che ho condotto a Kaggle
dove un gruppo guidato da un tipo
chiamato Geoffrey Hinton
dell'università di Toronto
ha vinto una competizione
per la scoperta automatica di droghe.
La cosa straordinaria qui,
non è soltanto che hanno battuto
tutti gli algoritmi sviluppati da Merck
o dalla comunità accademica internazionale
ma il fatto che nessuno nella squadra
avesse mai avuto
esperienza in chimica o in biologia
o in scienze biologiche
e l'hanno fatto in due settimane.
Come ci sono riusciti?
Hanno utilizzato un algoritmo fenomenale
chiamato apprendimento approfondito.
Questo successo è stato così importante
da essere stato pubblicato in un articolo
nella prima pagina del New York Times
poche settimane dopo.
Questo qui a sinistra è Geoffrey Hinton.
Apprendimento approfondito è un algoritmo
ispirato al funzionamento
del cervello umano
che ha come risultato un algoritmo
che non ha limiti teorici
su quel che può fare.
Più dati gli si forniscono
e più tempo di calcolo gli si dà,
meglio funziona.
Il New York Times ha anche spiegato
in questo articolo
un altro straordinario
risultato dell'apprendimento approfondito
che sto per mostrarvi.
Mostra che i computer
possono ascoltare e capire.
(Video) Richard Rashid: l'ultimo passo
che voglio essere in grado
di compiere in questo processo
è di parlarvi veramente in cinese.
Il punto chiave qui
è che siamo stati in grado
di prendere una gran quantità
di informazioni
da numerosi parlanti cinesi
per produrre un sistema da testo a voce
che prende il testo cinese
e lo converte in lingua cinese
e abbiamo preso
più o meno un'ora della mia stessa voce
e l'abbiamo utilizzata per modulare
un sistema standard da testo a voce
in modo che suoni come la mia.
Il risultato non è perfetto.
In realtà ci sono un po' di errori.
(In cinese)
(Applausi)
C'è ancora molto
da fare in questo settore.
(In cinese)
(Applausi)
Jeremy Howard:
questo è accaduto alla conferenza
sull'apprendimento automatico in Cina.
Non capita davvero spesso
alle conferenze accademiche
di sentire applausi spontanei
benché ovviamente talvolta
alle conferenze TEDx
siate liberi di farlo.
Tutto quello che avete visto è accaduto
grazie all'apprendimento approfondito.
(Applausi)
Grazie.
La trascrizione in inglese
è apprendimento approfondito.
La traduzione in cinese e il testo in alto
a destra, apprendimento approfondito,
e la costruzione della voce
ancora apprendimento approfondito.
Dunque l'apprendimento approfondito
è questa cosa straordinaria.
È un singolo algoritmo che sembra
essere in grado di fare qualsiasi cosa
e ho scoperto che un anno prima
ha anche imparato a vedere.
In questa sconosciuta
competizione dalla Germania
chiamata lo Standard tedesco
per il riconoscimento dei segnali stradali
l'apprendimento approfondito ha imparato
a riconoscere segnali stradali come questo.
Non solo può
riconoscere i segnali stradali
meglio di qualunque altro algoritmo
la classifica dei leader mostra che
in realtà è stato migliore delle persone,
almeno il doppio delle persone.
Così nel 2011 abbiamo avuto
il primo esempio
di computer che può vedere
meglio delle persone.
Da allora sono successe molte cose.
Nel 2012 Google ha annunciato che
un algoritmo di apprendimento approfondito
ha guardato i video di YouTube
e ha suddiviso i dati
su 16 000 computer per un mese
e il computer ha imparato in modo
autonomo concetti quali persone e gatti
solo guardando i video.
Assomiglia molto al modo
di imparare degli uomini.
Gli uomini non apprendono
quando gli si dice cosa vedono,
ma apprendendo da soli
cosa sono queste cose.
Anche nel 2012 Geoffrey Hinton,
che abbiamo visto prima,
ha vinto la popolarissima
competizione ImageNet
cercando di capire
da un milione e mezzo di immagini
di che cosa erano la foto.
Già dal 2014 siamo a meno
del sei percento del tasso di errore
nel riconoscimento delle immagini.
Ancora una volta meglio delle persone.
Le macchine stanno davvero
facendo un lavoro straordinario qui
e verrà utilizzato nell'industria.
Per esempio,
Google lo scorso anno ha annunciato
che ha mappato ogni singola
località in Francia in due ore
e lo ha fatto
fornendo immagini di strade
ad un algoritmo
di apprendimento approfondito
per riconoscere e leggere i numeri civici.
Immaginate quanto
si sarebbe impiegato prima:
dozzine di persone, diversi anni.
Sta accadendo anche in Cina.
Baidu è una sorta
di Google cinese, immagino,
e quel che potete vedere
in alto a sinistra
è un esempio delle immagini
che ho caricato
nel sistema di apprendimento
approfondito di Baidu,
al di sotto potete vedere che il sistema
ha capito che cos'è quell'immagine
e ha trovato immagini simili.
In effetti le immagini simili
hanno sfondi simili,
simili direzioni dei volti,
alcuni persino con la lingua fuori.
Questo non sta certamente cercando
il testo in una pagina del web.
Tutto quello che ho caricato
è un'immagine.
Così adesso abbiamo computer che
comprendono davvero quello che vedono
e che possono di conseguenza
cercare nei database
di centinaia di milioni
di immagini in tempo reale.
Cosa significa
che i computer possono vedere?
Non è solo che
i computer possono vedere.
Infatti l'apprendimento approfondito
ha fatto molto più di questo.
Frasi complesse e sfumate come questa
adesso sono comprensibili
con un algoritmo
di apprendimento approfondito.
Come potete vedere qui,
questo sistema basato su Stanford
che mostra punti rossi in cima
ha capito che questa frase
sta esprimendo un sentimento negativo.
L'apprendimento approfondito
è simile al comportamento umano
nel comprendere quello di cui tratta
la frase e che cosa sta dicendo
su queste cose.
L'apprendimento approfondito
è stato utilizzato per leggere il cinese
ad un livello simile
a quello di un madrelingua.
Questo algoritmo è stato sviluppato
in Svizzera
da persone che non parlavano
o capivano il cinese.
Come ho detto, l'uso
dell'apprendimento approfondito
è praticamente il sistema migliore
del mondo per fare questo,
anche paragonato
alla conoscenza umana.
Questo è il sistema che abbiamo
messo a punto nella mia azienda,
che mostra come mettere
tutto questo materiale insieme.
Queste immagini non hanno
alcun testo allegato
e mentre sto digitando queste frasi
in tempo reale sta capendo
queste immagini
e immaginando cosa riguardano
e trovando immagini simili
al testo che sto scrivendo.
Come potete vedere, sta effettivamente
capendo le mie frasi
e sta realmente comprendendo
queste immagini.
So che avete visto
qualcosa di simile su Google
dove potete digitare cose
e lui vi mostra delle immagini,
ma in realtà quello che fa è
cercare una pagina web riferita al testo.
È molto diverso
dal capire davvero le immagini.
È una cosa che i computer
sono stati in grado di fare
per la prima volta negli ultimi mesi.
Vediamo che i computer non soltanto
possono vedere le immagini,
possono anche leggere
e ovviamente mostrare che possono
comprendere quello che sentono.
Forse non vi sorprenderà
quello che sto per dirvi,
cioè che sono in grado di scrivere.
Ecco un testo
che ho scritto ieri utilizzando
un algoritmo
di apprendimento approfondito.
Ed ecco un testo che un algoritmo
di Stanford ha creato.
Ognuna di queste frasi è stata creata
da un algoritmo
di apprendimento approfondito
per descrivere ognuna di queste immagini.
Questo algoritmo non ha mai visto
un uomo in maglietta nera
che suona la chitarra.
Ha già visto un uomo prima,
ha già visto il nero prima,
ha già visto una chitarra prima,
ma ha generato in modo autonomo questa
nuova descrizione di questa fotografia.
Non è ancora una prestazione umana,
ma ci siamo vicini.
Nei test, gli uomini preferiscono
un sottotitolo generato dal computer
una volta su quattro.
Questo sistema ha soltanto due settimane,
quindi forse entro il prossimo anno
l'algoritmo informatico sarà
oltre la prestazione umana
alla velocità con cui vanno le cose.
I computer possono anche scrivere.
Abbiamo messo tutto insieme e ci ha
portato ad opportunità emozionanti.
Per esempio in medicina
un gruppo di Boston
ha annunciato che ha scoperto
dozzine di caratteristiche dei tumori
clinicamente rilevanti
che aiutano i medici nel fare
una prognosi del cancro.
Analogamente, a Stanford
un gruppo ha annunciato
che osservando i tessuti ingranditi
hanno sviluppato un sistema basato
sull'apprendimento automatico
che è migliore dei patologi umani
nel predire le percentuali
di sopravvivenza nei malati di cancro.
In entrambi i casi non solo
le previsioni sono più accurate
ma generano una nuova
scienza intelligente.
Nel caso della radiologia
sono nuovi indicatori clinici
che gli umani possono comprendere.
Nel caso di questa patologia
il sistema informatico ha scoperto
che le cellule intorno al cancro
sono importanti quanto
le cellule tumorali stesse
per fare una diagnosi.
È il contrario di quanto è stato
insegnato ai patologi per decenni.
In ognuno dei due casi
sono sistemi sviluppati
da una combinazione
di esperti in medicina
e di esperti
in apprendimento automatico
ma a partire dallo scorso anno
siamo andati anche oltre.
Questo è un esempio
di identificazione delle aree tumorali
di un tessuto umano al microscopio.
Questo sistema può identificare
le aree con maggiore accuratezza
o con la stessa accuratezza
di un patologo umano
ma è stato costruito interamente
con l'apprendimento approfondito
senza utilizzare la competenza medica
da persone che non hanno
alcuna competenza in questo settore.
Analogamente qui c'è
la segmentazione di un neurone.
Ora siamo in grado di segmentare
i neuroni con la stessa
accuratezza degli uomini,
ma questo sistema è stato sviluppato
con l'apprendimento approfondito
da persone con nessuna
competenza in medicina.
Io stesso, da persona
senza alcuna competenza in medicina,
sono pienamente qualificato
per iniziare una nuova società medica,
cosa che ho fatto.
Ero piuttosto spaventato nel farlo
ma la teoria sembrava suggerire
che era possibile
fare medicina molto utile utilizzando
soltanto queste tecniche di analisi dati.
Fortunatamente abbiamo avuto
un fantastico riscontro
non soltanto dai media,
ma anche dalla comunità medica,
che è stata di grande supporto.
La teoria è che possiamo prendere
la parte centrale di un processo medico
e trasformarla in un analisi di dati
per quanto possibile,
lasciando i medici a fare
quel che fanno meglio.
Voglio farvi un esempio.
Ad oggi occorrono 15 minuti per produrre
un nuovo test medico diagnostico,
io ve lo mostrerò in tempo reale,
ma l'ho compresso a tre minuti
eliminando qualche parte.
Invece di farvi vedere
la creazione di un test medico diagnostico
sto per mostrarvi
un test diagnostico con immagini di auto,
perché è qualcosa
che possiamo comprendere tutti.
Quindi inizieremo con circa
un milione e mezzo di immagini di auto
e voglio creare qualcosa
che le suddivida per l'angolazione
con cui sono state scattate le fotografie.
Queste immagini non sono etichettate,
quindi dovrò cominciare da zero.
Con il nostro algoritmo
per l'apprendimento approfondito
si possono identificare automaticamente
le aree delle strutture
in queste immagini.
La cosa bella è che l'uomo
e il computer possono lavorare insieme.
L'uomo, come potete vedere qui,
sta spiegando al computer
le aree di interesse
che vuole che il computer
utilizzi per migliorare l'algoritmo.
In realtà questi sistemi
di apprendimento approfondito
sono in uno spazio di 16 000 dimensioni
così potete vedere qui il computer
che lo ruota attraverso quello spazio
cercando di trovare
nuove aree di struttura.
Quando ci riesce
l'uomo che lo sta guidando può poi
segnalare le aree interessanti.
Qui il computer ha trovato
con successo le aree
ad esempio, gli spigoli.
Durante questo processo
stiamo dicendo gradualmente
al computer sempre di più
sul tipo di strutture che stiamo cercando.
Potete immaginare in un test diagnostico
che questo potrebbe essere
un patologo che identifica
le aree malate, oppure ad esempio
un radiologo che indica
i noduli potenzialmente problematici.
Talvolta può essere
difficile per l'algoritmo.
Qui è in un qualche modo confuso.
Le immagini della parte anteriore
e posteriore delle auto sono mescolate.
In questo caso dobbiamo
essere un po' più cauti,
selezionando le parti anteriori
come opposte alle parti posteriori.
e dicendo al computer
che questo è il tipo di gruppo
a cui siamo interessati.
Lo facciamo per un po',
tralasciando qualcosa,
così addestriamo l'algoritmo
per l'apprendimento automatico
basandoci su queste coppie
di centinaia di cose
sperando che il risultato sia migliore.
Potete vedere che sta iniziando
a dissolvere alcune di queste fotografie
mostrandoci che sta già riconoscendo
come capire da solo alcune di queste.
Possiamo utilizzare questo concetto
di immagini simili,
e utilizzando immagini simili,
come potete vedere.
il computer a questo punto è in grado
di trovare la parte anteriore delle auto.
A questo punto l'uomo
può dire al computer
va bene, hai fatto
un buon lavoro.
Talvolta, ovviamente,
persino a questo punto
è ancora difficile
separare i gruppi.
In questo caso anche dopo aver lasciato
il computer a provare
a ruotarlo per un po'
troveremo ancora che le immagini
dei lati sinistri e dei lati destri
sono tutte mescolate.
Così possiamo dare ulteriori
indicazioni al computer
e dire, va bene, prova a trovare
una proiezione per separare
i lati sinistri da quelli destri
per quanto possibile
utilizzando questo algoritmo
di apprendimento approfondito.
Dandogli quel suggerimento --
ecco, c'è riuscito.
È riuscito a trovare un modo
per pensare a questi oggetti
separandoli dagli altri.
Vi state facendo un'idea.
Questo non è un caso in cui l'uomo
è rimpiazzato dal computer,
ma uno in cui lavorano insieme.
Quello che stiamo facendo qui è sostituire
qualcosa per il quale serviva una squadra
di cinque o sei persone
per circa sette anni
e sostituirlo con qualcosa
che impiega 15 minuti
e una persona che lavora da sola.
Questo processo richiede all'incirca
quattro o cinque ripetizioni.
Potete vedere che adesso abbiamo
il 62 per cento
del nostro milione e mezzo di immagini
classificato correttamente.
A questo punto possiamo iniziare
a prendere piuttosto
velocemente grandi sezioni,
controllarle per essere sicuri
che non ci siano errori.
Dove ci sono errori, possiamo
farlo sapere al computer.
Utilizzando questo tipo di processo
per ognuno dei diversi gruppi
siamo vicini ad un tasso
di successo dell'80 per cento
nel classificare un milione
e mezzo di immagini.
A questo punto è solo si tratta solo
di trovare trova la piccola parte
che non è classificata correttamente
e si cerca di capire perché.
Usando questo approccio
in 15 minuti arriviamo a un tasso
di classificazione del 97 per cento.
Questo tipo di tecnica può permetterci
di risolvere un problema più grande,
cioè che c'è una mancanza
di competenza medica nel mondo.
Il Forum Economico Mondiale
riporta che ci sono
dalle 10 alle 20 volte meno
medici del necessario
nei paesi in via di sviluppo
e serviranno circa 300 anni
per formare abbastanza persone
per risolvere il problema.
Quindi immaginate se potessimo aiutare
a migliorare la loro efficacia
utilizzando l'approccio con questo
apprendimento approfondito?
Sono davvero entusiasta
di questa opportunità.
Sono anche preoccupato per i problemi.
Il problema è che
ogni area in blu su questa mappa
indica un posto dove i servizi
sono oltre l'80 per cento del lavoro.
Cosa sono i servizi?
Questi sono i servizi.
Questi sono anche proprio quello che
i computer hanno appena imparato a fare.
Così l'80 per cento dell'occupazione mondiale
nel mondo sviluppato
è in qualcosa che i computer
hanno appena imparato a fare.
Cosa significa tutto ciò?
Che andrà tutto bene.
Saranno sostituiti da altri lavori.
Ad esempio ci sarà
più lavoro per i data scientist.
Veramente no.
Non occorrono molti data scientist
per costruire questi.
Ad esempio questi quattro algoritmi
sono stati creati dalla stessa persona.
Così se pensate:
è già accaduto prima
abbiamo visto in passato i risultati
di quando arrivano novità
e vengono sostituite da nuovi lavori,
ma come saranno questi nuovi lavori?
È molto difficile per noi prevederlo
perché la conoscenza umana
cresce ad un tasso graduale,
mentre ora che abbiamo questo
sistema di apprendimento approfondito
che sappiamo che ha una conoscenza
che cresce a livello esponenziale.
Siamo qui.
Attualmente vediamo le cose intorno a noi
e diciamo: "I computer
sono ancora piuttosto stupidi"
Giusto?
Ma fra cinque anni
saranno fuori da questo diagramma.
Così dobbiamo iniziare a pensare
a questa capacità proprio adesso.
L'abbiamo già visto, ovviamente.
Nella Rivoluzione Industriale
abbiamo visto un cambio di passo
nella capacità grazie al motore.
Il punto è tuttavia che dopo
un po' le cose si sono appiattite.
Ci sono stati disordini sociali,
ma una volta che il motore è stato usato
per generare energia in ogni situazione
le cose si sono assestate.
La Rivoluzione dell'Apprendimento
Automatico
sarà molto diversa
dalla Rivoluzione Industriale
perché la Rivoluzione dell'Apprendimento
Automatico non si assesterà.
Più i computer miglioreranno
le attività intellettuali
più si potranno costruire
computer migliori
che miglioreranno
le capacità intellettuali,
quindi questo sarà un cambiamento
che il mondo non ha davvero
mai sperimentato prima
quindi la vostra comprensione precedente
su quel che è possibile, è diverso.
Sta già avendo un impatto su di noi.
Negli ultimi 25 anni
la produttività del capitale è cresciuta,
la produttività del lavoro è rimasta
uguale, è persino calata un po'.
Quindi voglio che iniziamo
a discuterne sin da adesso.
So che spesso quando parlo alle persone
di questa situazione
le persone sono piuttosto sprezzanti.
Del resto i computer
non possono veramente pensare,
non hanno emozioni,
non comprendono la poesia,
non capiamo davvero come funzionano.
Quindi?
Già adesso i computer possono fare cose
per fare le quali le persone
vengono pagate,
quindi è tempo di iniziare a pensare
a come dovremo modificare
le nostre strutture sociali ed economiche
per diventare consapevoli
di questa nuova realtà.
Grazie.
(Applausi)