-
L'intelligenza artificiale renderà obsoleto
l'apprendimento delle lingue? Se tra dieci
-
anni avremo un dispositivo che ci permetterà di
comunicare con persone che parlano altre lingue
-
in maniera efficiente e senza ostacoli ci saranno
ancora persone che impareranno lingue? Questa è
-
una domanda che mi pongo spesso, che mi porta ad
avere crisi esistenziali perché penso: "O mio dio,
-
tra dieci anni il mio lavoro non avrà più
senso! Nessuno imparerà l'italiano!" Ora,
-
nessuno può sapere come andranno le cose, ma ne
ho discusso con mio padre nel mio ultimo episodio
-
del podcast e perché con mio padre, perché
mio padre (che è appena andato in pensione)
-
si è occupato per tutta la sua carriera di
intelligenza artificiale e nello specifico di
-
riconoscimento vocale. Avete presente quando
parlate ai vostri dispositivi, se lo fate?
-
(voce automatica) In inglese è
"subscribe to Italian podcasts". Ora
-
posso fare da interprete in una lingua straniera.
-
D: Ciao, come va?
-
A: Hi, how are you?
D: I'm fine, and you?
-
A: Sto bene, e tu?
D: Io sto bene perché non mi
-
sono ancora iscritto a Podcast Italiano.
A: I'm sick because I haven't
-
subscribed to an italian podcast yet.
D: What's an italian podcast? Do you mean 'Podcast
-
Italiano', by any chance?
-
A: Cos'è un podcast italiano?
Intendi per caso 'Podcast Italiano'?
-
D: Sì, certo, Podcast Italiano, su YouTube!
A: Yes, of course italian podcast on youtube.
-
D: Of course, but do you know there's
a podcast version of it as well?
-
A: Certo, ma lo sai che esiste
anche una versione podcast?
-
Esiste già questa tecnologia, magari
non è perfetta ma tra dieci anni? Non
-
lo so... Comunque mio padre si è occupato
di riconoscimento vocale, ovvero la parte
-
di comprensione da parte della macchina del
linguaggio umano. Abbiamo fatto due episodi,
-
il primo sulla sua carriera nel mondo
dell'intelligenza artificiale e il
-
secondo nello specifico sulle applicazioni
linguistiche dell'intelligenza artificiale
-
e delle reti neurali, che oggi vanno così
tanto di moda. Vi lascio ora un estratto dal
-
secondo episodio in cui parliamo proprio
di queste cose. Spero vi possa piacere.
-
D: Volevo parlare adesso un po’ del...
dell'intelligenza artificiale in campo
-
linguistico, quindi mi sembra che ci siano
tre usi principalmente: la traduzione,
-
il riconoscimento della voce e la sintesi della
voce, quindi far parlare una macchina, giusto?
-
R: Esatto.
D: Ecco,
-
volevo iniziare proprio dal riconoscimento
vocale di cui ti sei occupato per un sacco
-
di tempo e chiederti come funziona. Tu mi dicevi
che un tempo si mettevano proprio delle conoscenze
-
linguistiche nella macchina e poi questo
approccio è stato completamente abbandonato.
-
R: Esatto. Fino, diciamo, a tutti gli anni '90,
fino al 2000 anche i sistemi di riconoscimento
-
automatico avevano dentro delle competenze di
esperti umani. C'era, ad esempio, la conoscenza
-
fonetica della lingua, cioè quali sono i suoni
di base della lingua e come si organizzano fra di
-
loro; la conoscenza lessicale, cioè come questi
suoni vanno a formare le parole; poi c'era la
-
conoscenza sintattica, cioè come le parole formano
delle frasi corrette della lingua, e queste...
-
queste conoscenze erano introdotte da degli
esperti umani, da dei fonetici, dei linguisti
-
che inserivano nel codice (o comunque nelle
conoscenze del computer) queste informazioni.
-
D: Cioè, insomma, tutta la grammatica
di una lingua perché è la grammatica...
-
R: Sì, si parlava, appunto, di grammatica,
anche si inserivano le grammatiche di una
-
lingua dentro... dentro il computer.
D: Quindi c'era gente con un libro
-
di grammatica che traduceva le
regole in istruzioni informatiche?
-
R: Sì sì, esatto. Io stesso all'inizio mi ero
portato in ufficio la grammatica italiana.
-
D: Di Serianni?
R: Quella che avevo al liceo, non so di chi fosse,
-
ma e questo è andato avanti per molto molto
tempo, poi hanno... si è iniziato a usare anche
-
dei metodi statistici, almeno per la parte più
di basso livello del suono. Però poi ultimamente,
-
quindi direi dal 2013 in poi tutto questo è
letteralmente sparito, nel senso che sono arrivati
-
dei modelli di reti neurali chiamati end to end
models, cioè modelli che vanno dall'inizio alla
-
fine, e questi modelli nel riconoscimento vocale
partono dal segnale che esce dal microfono, dalla
-
forma d'onda e arrivano alle parole. Quindi entra
una forma d'onda, esce una sequenza di parole.
-
D: E quindi... quindi tutto ciò che sta in mezzo,
sintassi, fonetica, morfologia, lessico, tutto...
-
tutto ciò che sta in mezzo succede magicamente?
R: Succede magicamente nell'interazione fra questi
-
neuroni. Questi modelli end to end sono ancora
più complicati di come io ho descritto le reti
-
neurali. E però tutte questi... queste conoscenze
umane e conoscenze linguistiche sono sparite.
-
Oddio, magari sono presenti nella rete neurale
che però è un modello opaco, è una cosiddetta
-
black box, è una scatola nera e quindi noi
non sappiamo se la rete neurale le ha usate,
-
non le ha usate. Avrà... nel suo apprendimento
avrà riscoperto la fonetica, avrà riscoperto
-
la linguistica? Noi non lo sappiamo in realtà.
D: Quindi non c'è un modo di capire che cosa sta
-
imparando e che cosa "pensa", tra virgolette?
R: No, direi... direi proprio di no. Questo è
-
forse uno dei limiti di queste reti neurali che...
che forse è anche un limite delle reti neurali
-
biologiche, nel senso che non sono ispezionabili.
D: Quindi non... non sono molto trasparenti.
-
E quindi l'unica cosa che serve per questi modelli
-
è audio che sia trascritto, no?
R: Trascritto in parole. E occorrono
-
tantissime ore, si parla di migliaia di ore
di registrazioni trascritte e più ce n'è e
-
meglio funzionerà la cosa. Però ci vogliono anche
giorni e giorni di computazione di computer molto
-
potenti per addestrare la rete neurale, però alla
fine questa rete inizia a capire come correlare
-
questo strano input che esce dal microfono
con le parole. Nel caso del riconoscimento;
-
nel caso della traduzione correla le parole in
una lingua con le parole nell'altra, anche con
-
caratteri totalmente diversi, questo non importa.
D: Certo. E invece nel caso della sintesi,
-
cioè far parlare la macchina, quello come
funziona? La correlazione tra cos'è?
-
R: Sì, è esattamente il viceversa. Gli esempi
sono delle coppie in cui l'input è una sequenza
-
di parole e l'output è una forma d'onda.
D: Però, la... la forma d'onda è creata da zero?
-
R: Da zero.
D: Perché un tempo,
-
forse me lo dicevi tu, si usavano proprio
dei blocchi di parole, dei pezzetti di
-
parole che si ricombinavano in vari modi.
R: Esatto, questo che era nella sintesi,
-
diciamo, quella classica con conoscenze introdotte
dall'uomo in cui, appunto, l'uomo classificava
-
tanti pezzetti di registrazione che poi venivano
concatenati, la cosiddetta sintesi concatenativa.
-
D: Che ancora si sente, per
esempio, su alcuni treni...
-
R: Altroché, ma direi che...
D: Si usa ancora tanto?
-
R: Sì sì sì, nei sistemi delle ferrovie
italiane la sintesi è ancora quella degli
-
anni 90'. Nei sistemi di Google secondo
me o di Amazon sono già utilizzate però.
-
D: Quindi se abbiamo un sistema che... il primo
passaggio è riconosce la voce, quindi dal suono al
-
testo, poi la traduzione che traduce in un'altra
lingua, in un altro testo quindi, tradotto,
-
e poi abbiamo la sintesi che legge ad alta voce
la traduzione, di fatto abbiamo... abbiamo un
-
interprete, abbiamo un interprete. Quindi tu pensi
che magari i traduttori e interpreti, i traduttori
-
già adesso ma gli interpreti in futuro, saranno
a rischio, per esempio, nelle conferenze?
-
R: Purtroppo per i traduttori e interpreti
umani io penso di sì, che succederà,
-
o almeno si ridurrà di molto l'ambito... le
possibilità di... di lavoro. Nel senso che
-
prima spariranno le cose più, diciamo, più di
routine. Credo che già la traduzione dei manuali
-
tecnici o manuali di prodotto sia fatta quasi
tutta automaticamente, pur avendo ancora degli
-
errori all'interno. E poi via via anche il lavoro
di interpretariato magari... Magari esisteranno
-
per un po' di tempo le due alternative, quella
automatica più economica e meno precisa e
-
quella umana più accurata e più costosa.
D: E credo che già adesso inizi a essere
-
un problema per qualcuno, per qualche
traduttore forse perché chiaramente se
-
il traduttore deve solamente correggere
il lavoro fatto da una macchina la paga,
-
la retribuzione sarà... sarà minore.
R: Certo, e il lavoro forse anche meno bello.
-
D: Ma anche meno bello sì. Tornando al discorso
delle lingue tu pensi che sarà ancora attuale
-
imparare le lingue tra 10 o 15 anni? Questa è una
domanda che mi pongo spesso. Non so se ci sarà
-
un dispositivo che ci permetterà di comunicare
con persone che parlano lingue diverse o un
-
chip nel cervello ma anche qualcosa di meno
futuristico, diciamo. Sarà ancora attuale?
-
R: Ma io penso che almeno per molto tempo non
diventerà obsoleto, nel senso che uno impara
-
una lingua per molti motivi, però sicuramente una
cosa è poter parlare e comunicare in una lingua
-
senza alcun dispositivo, un altro conto è avere
sempre un dispositivo in mano o un dispositivo
-
che fa da mediatore. Immagino che per motivi
o di lavoro, o di turismo, o anche un po'
-
occasionale questi dispositivi saranno sicuramente
utilizzati. O magari anche in certe conferenze che
-
sono incontri occasionali di persone di divers...
tante nazionalità potrebbero essere usate. Però se
-
uno vuole, appunto, imparare una lingua anche per
entrare nella cultura di una nazione, di un Paese
-
questo rimarrà totalmente insostituibile, a meno
che, come accennavi tu, di far degli impianti di
-
reti neurali artificiali nel cervello, allora ti
impiantano l'espansione di memoria della lingua,
-
tu la compri e te la mettono, ma questo
veramente secondo me è un po' troppo oltre.
-
E questo era l'estratto, spero che vi sia
piaciuto. Se volete sentire l'intero episodio o i
-
due episodi che abbiamo fatto trovate il
link qui sotto. Ah e se non lo sapevate,
-
sì ho un podcast per chi impara la lingua italiana
ed è il motivo per cui mi chiamo podcast italiano,
-
so che è un po' strano. Ma questi episodi in
particolare credo possano interessare a tutti
-
anche se siete italiani, perché insomma mio
padre è un esperto del settore. Dunque fatemi
-
sapere che ne pensate, voi imparereste una
lingua se esistesse una tecnologia come già
-
esiste ma molto più efficiente di questa? Magari
integrata in un dispositivo nel nostro cervello,
-
oppure in un dispositivo che ne so, un pochino
più efficiente di un telefono cellulare,
-
che comunque fa un po' da ostacolo, si mette
in mezzo tra me e un'altra persona? O comunque
-
pensate che continuerete a imparare la lingua
magari per amore verso una cultura o perché vi
-
piace imparare le lingue? E che cosa pensate
farà la maggior parte delle persone? Fatemi
-
sapere che ne pensate come avete capito non
aveva un video vero per questa settimana ma
-
torniamo la prossima settimana con la nostra
programmazione abituale. Alla prossima! Ciao ciao.