0:00:03.470,0:00:06.760 Intelligenza Artificiale[br]Dati di apprendimento e distorsioni 0:00:07.090,0:00:09.560 L'efficacia dell'apprendimento automatico dipende totalmente 0:00:09.560,0:00:11.499 dalla bontà dei dati usati per l'apprendimento. 0:00:11.499,0:00:13.187 Quindi, è estremamente importante 0:00:13.187,0:00:16.547 avere dati di alta qualità e in gran quantità. 0:00:16.547,0:00:18.479 Ma se i dati sono così importanti, 0:00:18.479,0:00:21.600 bisogna chiedersi da dove provengono i dati di apprendimento? 0:00:21.600,0:00:26.260 Spesso, i computer recuperano i dati da persone come me e te, 0:00:26.260,0:00:28.320 senza sforzi particolari da parte nostra. 0:00:28.320,0:00:29.796 Un servizio di video online 0:00:29.796,0:00:31.529 può tenere traccia di ciò che guardi, 0:00:31.529,0:00:33.830 riconoscendo degli schemi nei dati, 0:00:33.830,0:00:36.780 per poterti consigliare altri video di tuo interesse. 0:00:37.420,0:00:40.253 Altre volte, ti viene espressamente chiesto un aiuto: 0:00:40.253,0:00:43.900 quando un sito web ti chiede di individuare[br]dei cartelli in alcune foto, 0:00:43.900,0:00:46.530 stai fornendo dei dati per addestrare una macchina 0:00:46.530,0:00:49.890 a capire cosa vede e forse in futuro a guidare. 0:00:51.770,0:00:54.380 I ricercatori medici possono utilizzare immagini mediche 0:00:54.380,0:00:55.679 come dati di apprendimento 0:00:55.679,0:00:57.240 per insegnare ai computer 0:00:57.240,0:00:59.900 come riconoscere e diagnosticare le malattie. 0:01:00.300,0:01:02.020 L'Apprendimento Automatico (Machine Learning) 0:01:02.020,0:01:04.252 necessita di centinaia di migliaia di immagini 0:01:04.252,0:01:07.780 e delle indicazioni di un medico che sa cosa cercare, 0:01:07.780,0:01:10.520 prima di poter identificare correttamente le malattie. 0:01:10.520,0:01:12.665 Anche con migliaia di esempi, 0:01:12.665,0:01:15.770 possono esserci dei problemi con le previsioni[br]elaborate dal computer. 0:01:15.770,0:01:19.001 Se si raccolgono solo radiografie di uomini, 0:01:19.001,0:01:21.880 le previsioni del computer funzionano solo per gli uomini. 0:01:21.880,0:01:23.695 E potrebbe non riconoscere le malattie 0:01:23.695,0:01:26.620 quando gli viene chiesto di diagnosticare[br]la radiografia di una donna. 0:01:26.620,0:01:28.720 Questa carenza nei dati di apprendimento 0:01:28.720,0:01:31.070 crea una distorsione (bias). 0:01:31.070,0:01:33.290 I dati distorti favoriscono alcune cose 0:01:33.290,0:01:35.990 e ne penalizzano o escludono altre. 0:01:35.990,0:01:38.713 A seconda di come vengono raccolti i dati di apprendimento, 0:01:38.713,0:01:42.120 di chi li raccoglie e di come vengono forniti, 0:01:42.120,0:01:44.270 c'è la possibilità che dei pregiudizi umani 0:01:44.270,0:01:45.880 siano incorporati nei dati. 0:01:45.880,0:01:48.133 Imparando da dati distorti, 0:01:48.133,0:01:50.747 il computer potrebbe fare delle previsioni distorte, 0:01:50.747,0:01:53.070 anche se chi si occupa dell'apprendimento 0:01:53.070,0:01:54.760 non ne è consapevole. 0:01:54.760,0:01:56.730 Occorre analizzare i dati di apprendimento 0:01:56.730,0:01:58.500 e porsi due domande: 0:01:58.500,0:02:01.487 Ci sono sufficienti dati per addestrare[br]accuratamente un computer? 0:02:01.487,0:02:07.460 E questi dati rappresentano tutti i possibili scenari[br]ed utenti senza parzialità o pregiudizi? 0:02:07.460,0:02:09.570 Ed è qui che tu, come essere umano, 0:02:09.570,0:02:11.160 svolgi un ruolo cruciale. 0:02:11.160,0:02:14.316 Sta a te dare alla macchina dei dati imparziali. 0:02:14.316,0:02:16.802 Ciò significa raccogliere moltissimi esempi, 0:02:16.802,0:02:19.070 da molte fonti differenti. 0:02:19.070,0:02:22.149 Ricordati: quando scegli i dati per l'Apprendimento Automatico, 0:02:22.149,0:02:24.500 stai effettivamente programmando un algoritmo, 0:02:24.500,0:02:27.100 usando i dati di apprendimento invece del codice. 0:02:27.100,0:02:30.180 I dati SONO il codice. 0:02:30.180,0:02:34.400 Migliori sono i dati forniti, meglio il computer imparerà.