♪ (Musica in aumento) ♪ (Cinguettio) (Voci, lingue diverse) (Voci si sovrappongono in sottofondo) (Risate) (Beep di computer) [Parlare con i computer] (Uomo) Nasciamo in questo mondo con l'innata capacità di imparare a interagire con altri esseri senzienti. (Bambino che vocalizza) (Uomo) Immaginate di dover interagire con altri scrivendo brevi messaggi. (Bambino che vocalizza) (Uomo) Sarebbe penosissimo. (Uomo) È in questo modo che interagiamo con i computer. È molto più facile parlare... molto più facile... (Bambino che vocalizza) se i computer potessero capire quello che diciamo. Per questo, ci vuole un ottimo riconoscimento vocale. (Narratore) Il primo sistema di riconoscimento vocale fu sviluppato dai Laboratori Bell nel 1952. Riusciva a riconoscere solo i numeri detti da una persona. Nel 1970, la Carnegie-Mellon lanciò l'Harpy System. Era in grado di riconoscere più di 1000 parole e diverse pronunce della stessa parola. (Uomo) Pomodoro - (Donna) Pomodoro (Narratore) Il riconoscimento vocale continuò negli anni '80 con l'introduzione del Hidden Markov Model, che usava un approccio più matematico per analizzare le onde sonore che hanno portato alle grandi innovazioni che abbiamo oggi. Si prendono onde sonore molto grezze come quelle di un microfono o del telefono o altro... (Donna) La spezzettiamo e cerchiamo di identificare quale fonema viene pronunciato in quel discorso. Il fonema è un un'unità primitiva di espressione delle parole. (Fonemi) Poi li rimette insieme in possibili parole come Palo Alto. Il riconoscimento vocale oggi è valido per trascrivere quello che dite... (Uomo, al telefono) Che tempo fa oggi a Topeka? (Uomo) Si può parlare di viaggi, contatti, come, "Dove trovo una pizza?" (Telefono) Ecco la lista delle pizzerie. (Uomo) "Quanto è alta la Torre Eiffel?" (Telefono) La Torre Eiffel è... (Donna) Abbiamo fatto progressi incredibili molto rapidamente. (Uomo, al telefono) Chi è il 21° presidente degli Stati Uniti? (Beep del telefono) (Telefono) Chester A. Arthur è stato il 21° (Uomo, al telefono) Ok, Google, di dov'è? (Uomo) Anni fa, per interagire con i computer bisognava essere ingegneri. Oggi, tutti possono interagire. Quel che è ancora agli inizi è la comprensione. Ci serve un un modello di comprensione molto più sofisticato che capisca il significato delle frasi. Siamo ancora molto lontani. [Comprensione del linguaggio] ♪ (Musica in sottofondo) ♪ (Donna) La nostra capacità di usare la lingua ci aiuta ad avere una cultura. È una delle cose che aiuta a trasmettere le tradizioni alle generazioni successive. Capire come il sistema del linguaggio funziona, anche se sembra facile, si rivela molto difficile, ma lo capisce anche un bambino di due anni. (Ragazza) Ce ne sono due. (Donna) Ci sono due L, sì. La lingua è estremamente complessa e sofisticata... Dalla semantica, all'ironia, agli accenti, alle espressioni del viso, alle emozioni umane, perché fa parte del nostro modo di comunicare. L'umorismo. Devo stare attento a non offendere il dinosauro? Il linguaggio ha così tante sfumature ed è il motivo per cui è così complicato. (Uomo) Il cervello umano e gli algoritmi di apprendimento sono molto più bravi nella comprensione della lingua e molto più bravi nell'afferrare i giochi di parole. Che replichiamo esattamente o meno quello che fa il cervello, capire la lingua e il discorso è ancora un problema. [Reti neurali]