0:00:00.000,0:00:02.070 Guardate queste immagini. 0:00:02.110,0:00:04.686 Ditemi quale Obama è reale. 0:00:04.710,0:00:07.571 (Video) Barack Obama: Gli aiuti[br]alle famiglie per la casa, 0:00:07.595,0:00:10.242 gli investimenti per l'alta tecnologia, 0:00:10.266,0:00:11.425 energia pulita 0:00:11.449,0:00:14.228 ed infrastrutture che creano[br]nuove opportunità di lavoro. 0:00:14.647,0:00:16.131 Supason Auwajanakorn: Qual è? 0:00:16.155,0:00:18.029 La risposta è: neanche uno. 0:00:18.053,0:00:19.167 (Risate) 0:00:19.191,0:00:20.977 Neanche uno di questi è reale. 0:00:21.001,0:00:23.591 Lasciate che vi racconti[br]come ci siamo arrivati. 0:00:23.940,0:00:25.518 L'ispirazione per questo lavoro 0:00:25.542,0:00:28.433 mi è venuta da un progetto volto[br]a preservare l'ultima chance 0:00:28.453,0:00:32.745 di approfondire l'Olocausto,[br]grazie al racconto dei sopravvissuti. 0:00:32.769,0:00:34.669 Si chiama 'New Dimensions in Testimony' 0:00:35.420,0:00:38.546 e vi permette di conversare 0:00:38.570,0:00:41.126 con l'ologramma[br]di un reale superstite dell'Olocausto. 0:00:41.403,0:00:43.759 (Video) Uomo: Com'è sopravvissuto[br]all'Olocausto? 0:00:43.783,0:00:45.841 (Video) Ologramma:[br]Come sono sopravvissuto? 0:00:45.912,0:00:47.719 Sono sopravvissuto, 0:00:48.419,0:00:49.946 io credo, 0:00:49.970,0:00:52.993 per un disegno della provvidenza. 0:00:53.573,0:00:57.027 SS: Queste risposte erano state registrate[br]in precedenza in uno studio. 0:00:57.051,0:00:59.503 Eppure l'effetto è sorprendente. 0:00:59.527,0:01:03.146 Ci si sente davvero legati alla sua storia[br]e a lui come persona. 0:01:04.011,0:01:07.312 Penso che ci sia qualcosa di speciale[br]nelle interazioni umane 0:01:07.336,0:01:10.093 che le rende più profonde 0:01:10.117,0:01:12.315 e intime 0:01:12.339,0:01:15.807 rispetto a quanto possano insegnare[br]libri, conferenze o film. 0:01:15.837,0:01:18.286 Ho visto questo filmato[br]e ho cominciato a chiedermi: 0:01:18.326,0:01:21.523 possiamo creare una rappresentazione 3D[br]come questa per chiunque? 0:01:21.563,0:01:24.705 Una rappresentazione 3D che vede,[br]parla e agisce come le persone? 0:01:25.435,0:01:27.580 Ho deciso di scoprire se lo si poteva fare 0:01:27.604,0:01:29.914 e alla fine sono arrivato[br]ad una nuova soluzione 0:01:29.938,0:01:33.458 che può creare un un modello di persona[br]usando nient'altro che questi: 0:01:33.747,0:01:35.961 foto e video esistenti di una persona. 0:01:36.101,0:01:39.318 Se si possono sfruttare[br]questo tipo di informazioni passive, 0:01:39.342,0:01:41.349 foto e video che sono in circolazione, 0:01:41.373,0:01:43.429 questo è il modo per riprodurre chiunque. 0:01:44.119,0:01:45.896 A proposito, lui è Richard Feynman, 0:01:45.920,0:01:49.333 che, oltre ad aver vinto[br]il premio Nobel per la fisica, 0:01:49.357,0:01:51.810 era anche un insegnante leggendario. 0:01:52.520,0:01:55.278 Non sarebbe grandioso[br]se potessimo riportarlo indietro 0:01:55.302,0:01:58.567 a tenere le sue lezioni[br]ed ispirare milioni di ragazzi, 0:01:58.591,0:02:01.583 non solo in lingua inglese[br]ma in tutte le altre lingue? 0:02:02.441,0:02:07.043 O se potessimo chiedere consiglio ai nonni[br]e sentire le loro parole di conforto 0:02:07.067,0:02:08.837 anche se non sono più con noi? 0:02:09.653,0:02:13.079 O forse, utilizzando questo strumento,[br]scrittori, vivi o no, 0:02:13.103,0:02:16.930 potrebbero leggere tutti i loro libri[br]ad alta voce a chiunque fosse interessato. 0:02:17.199,0:02:19.636 Le possibilità sono infinite 0:02:19.660,0:02:21.873 e, a mio parere,[br]la questione è appassionante. 0:02:22.595,0:02:24.461 Ad oggi, funziona in questo modo. 0:02:24.491,0:02:26.288 Primo, introduciamo una nuova tecnica 0:02:26.312,0:02:30.884 che può ricostruire un modello facciale 3D[br]altamente accurato da qualsiasi immagine 0:02:30.908,0:02:33.227 senza mai eseguire[br]la scansione 3D della persona. 0:02:33.890,0:02:37.412 Questa è la stessa rappresentazione[br]partendo da differenti angolazioni. 0:02:37.972,0:02:39.471 Funziona anche con i video, 0:02:39.495,0:02:42.347 eseguendo lo stesso algoritmo[br]su ogni fotogramma video 0:02:42.371,0:02:44.843 e generando una rappresentazione 3D[br]in movimento. 0:02:45.538,0:02:48.870 Questa è la stessa rappresentazione[br]da diverse angolazioni. 0:02:49.653,0:02:52.108 In effetti, tale tecnica[br]è molto complessa, 0:02:52.108,0:02:55.008 ma il fulcro è che andremo ad analizzare 0:02:55.040,0:02:58.006 preliminarmente un grande numero[br]di immagini della persona. 0:02:58.650,0:03:01.189 Per George W. Bush,[br]basta cercare foto su Google 0:03:01.379,0:03:04.642 e da quelle possiamo creare[br]un modello medio, 0:03:04.672,0:03:07.943 una rappresentazione definita, iterativa[br]per recuperare l'espressione 0:03:07.967,0:03:11.053 nei minimi dettagli,[br]come grinze e rughe d'espressione. 0:03:11.326,0:03:12.729 Ciò che affascina 0:03:12.753,0:03:16.176 è che la raccolta fotografica[br]può derivare dalle vostre tipiche foto. 0:03:16.200,0:03:18.803 Non è importante l'espressione 0:03:18.827,0:03:20.712 o dove sono state scattate le foto. 0:03:20.736,0:03:23.136 Ciò che importa è averne molte. 0:03:23.160,0:03:24.790 E qui non abbiamo ancora i colori, 0:03:24.790,0:03:27.268 quindi sviluppiamo[br]una nuova tecnica di fusione 0:03:27.292,0:03:30.128 che perfeziona il metodo a media singola 0:03:30.152,0:03:32.970 e produce strutture facciali[br]e colori nitidi. 0:03:33.779,0:03:36.550 Ciò può essere fatto per ogni espressione. 0:03:36.765,0:03:39.984 Ora abbiamo il controllo[br]del modello di una persona 0:03:40.008,0:03:43.803 che viene gestito[br]tramite una sequenza di foto statiche. 0:03:43.827,0:03:46.953 Notate come le rughe vanno e vengono[br]in base all'espressione, 0:03:47.639,0:03:50.855 Possiamo anche usare un video[br]per ottenere la rappresentazione 3D. 0:03:50.879,0:03:53.472 (Video) Daniel Craig: Giusto,[br]ma in qualche modo, 0:03:53.496,0:03:57.339 siamo riusciti ad attrarre[br]persone più interessanti. 0:03:58.021,0:03:59.663 SS: Ecco un'altra demo divertente. 0:03:59.687,0:04:02.443 Quello che vedete qui[br]sono modelli controllabili di persone 0:04:02.443,0:04:04.551 che ho costruito dalle loro foto[br]su internet. 0:04:04.555,0:04:07.329 Trasferendo il movimento[br]dal video in ingresso, 0:04:07.353,0:04:08.949 possiamo gestire tutto il gruppo. 0:04:08.949,0:04:11.701 George W. Bush: È difficile[br]far approvare questa legge, 0:04:11.725,0:04:14.028 perché ci sono troppi emendamenti, 0:04:14.052,0:04:19.283 e il percorso legislativo[br]può essere insidioso. 0:04:19.958,0:04:20.768 (Applausi) 0:04:20.798,0:04:22.332 SS: Per fare un passo indietro, 0:04:22.342,0:04:26.013 il nostro obiettivo ultimo, piuttosto,[br]è catturare le loro tipicità espressive 0:04:26.037,0:04:29.202 o il modo unico in cui ciascuna[br]di queste persone parla e sorride. 0:04:29.242,0:04:31.419 Per farlo, possiamo insegnare ai computer 0:04:31.443,0:04:33.665 a imitare il modo in cui uno parla 0:04:33.689,0:04:36.639 mostrando solo la ripresa video[br]di quella persona? 0:04:36.898,0:04:39.475 Quello che ho fatto, è stato[br]far guardare al computer 0:04:39.499,0:04:42.776 14 ore di discorsi tenuti da Barack Obama. 0:04:43.443,0:04:46.959 Questo è ciò che possiamo produrre[br]solo con il suo audio. 0:04:46.983,0:04:48.760 (Video) BO: I risultati sono chiari. 0:04:48.784,0:04:53.133 Le imprese americane hanno creato[br]14,5 milioni di nuovi posti di lavoro 0:04:53.157,0:04:55.931 per 75 mesi di fila. 0:04:55.955,0:04:58.860 SS: Qui abbiamo sintetizzato[br]solo la zona della bocca, 0:04:58.884,0:05:00.424 in questo modo. 0:05:00.514,0:05:02.590 Le sequenze lineari usano una rete neurale 0:05:02.614,0:05:05.550 per convertire un input audio[br]in questi punti della labbra. 0:05:06.547,0:05:10.772 (Video) BO: È grazie al nostro lavoro,[br]o grazie a Medicare, o Medicaid. 0:05:10.796,0:05:14.216 SS: Dopo sintetizziamo la struttura,[br]miglioriamo dettagli e dentatura, 0:05:14.240,0:05:17.314 e li uniamo alla testa e allo sfondo,[br]presi da un video sorgente. 0:05:17.338,0:05:19.413 (Video) BO: Per le donne checkup gratuiti, 0:05:19.433,0:05:22.395 e non dovranno pagare di più[br]solo per il fatto di essere donne. 0:05:22.973,0:05:26.279 I giovani potranno rimanere[br]a carico dei genitori fino a 26 anni. 0:05:27.267,0:05:30.219 SS: Penso che questi risultati[br]siano realistici ed intriganti, 0:05:30.243,0:05:33.416 ma allo stesso tempo fanno paura,[br]persino a me. 0:05:33.440,0:05:37.455 Il nostro obiettivo era un modello 3D[br]accurato, non una falsificazione. 0:05:37.956,0:05:41.067 Ciò che mi preoccupa[br]è l'abuso che potrebbe derivarne. 0:05:42.078,0:05:44.929 Le persone si occupano di questo[br]problema da molto tempo, 0:05:44.953,0:05:47.824 da quando Photoshop apparve[br]per la prima volta sul mercato. 0:05:47.862,0:05:51.663 Come ricercatore, sto anche lavorando[br]su una tecnologia di contromisura, 0:05:51.687,0:05:54.629 e faccio parte di un progetto[br]in corso alla AI Foundation, 0:05:54.653,0:05:58.050 che usa un mix di apprendimento automatico[br]e moderatori umani 0:05:58.074,0:06:00.218 per scoprire immagini e video falsi, 0:06:00.242,0:06:02.286 combattendo contro il mio stesso lavoro. 0:06:02.675,0:06:05.865 Uno dei dispositivi prossimi al lancio[br]si chiama 'Reality Defender', 0:06:05.889,0:06:09.928 un'estensione delle funzioni del browser[br]in grado di segnalare contenuti falsi 0:06:09.952,0:06:12.485 in automatico, direttamente nel browser. 0:06:12.509,0:06:16.621 (Applausi) 0:06:16.651,0:06:18.058 Nonostante questo, tuttavia, 0:06:18.078,0:06:20.078 i video falsi[br]possono arrecare molti danni, 0:06:20.102,0:06:23.396 persino prima che qualcuno[br]abbia l'opportunità di verificarli, 0:06:23.420,0:06:26.142 quindi è molto importante[br]che rendiamo tutti consapevoli 0:06:26.166,0:06:28.173 di ciò che è attualmente possibile 0:06:28.197,0:06:31.826 così da partire dal presupposto giusto[br]ed essere critici su ciò che vediamo. 0:06:32.423,0:06:37.430 Manca ancora molto prima di poter[br]creare modelli completi di una persona 0:06:37.454,0:06:40.440 e prima di poter garantire[br]la sicurezza di questa tecnologia. 0:06:40.857,0:06:42.684 Ma sono pieno[br]di entusiasmo e speranza, 0:06:42.708,0:06:46.247 perché se usato bene e attentamente, 0:06:46.271,0:06:50.580 questo strumento può far sì[br]che il nostro impatto positivo sul mondo 0:06:50.604,0:06:52.438 possa essere fortemente accresciuto 0:06:52.438,0:06:55.730 e contribuire a plasmare il futuro[br]nel modo in cui vogliamo che sia. 0:06:55.760,0:06:56.735 Grazie. 0:06:56.759,0:07:01.849 (Applausi)