0:00:00.000,0:00:03.733 0:00:03.733,0:00:07.333 0:00:07.333,0:00:11.000 L'apprentissage automatique n'est aussi bon que [br]les données d'entraînement que vous y insérez. 0:00:11.000,0:00:16.533 Donc, c'est très important d'utiliser[br]des données de haute qualité, et beaucoup de celles-ci. 0:00:16.533,0:00:21.866 Mais si les données sont si importantes, cela vaut la peine[br]de demander d'où viennent les données de formation ? 0:00:21.866,0:00:26.166 Souvent, les ordinateurs collectent les données[br]de formation de personnes comme vous et moi, 0:00:26.166,0:00:28.166 sans aucun effort de notre part. 0:00:28.166,0:00:31.433 Un service de streaming vidéo peut garder[br]une trace de ce que vous regardez, 0:00:31.433,0:00:33.800 alors il peut reconnaître des[br]modèles à partir de ces données 0:00:33.800,0:00:37.400 pour vous recommander ce que vous[br]voudriez peut-être regarder ensuite. 0:00:37.400,0:00:40.333 D'autres fois, on vous[br]demande directement d'aider, 0:00:40.333,0:00:43.766 comme lorsqu'un site Web vous demande[br]de repérer les panneaux de signalisation et les photos, 0:00:43.766,0:00:47.633 vous fournissez des données d'entraînement pour [br]aider une machine à apprendre à voir, 0:00:47.633,0:00:51.600 et peut-être même un jour, conduire. 0:00:51.600,0:00:55.266 Les chercheurs en médecine peuvent utiliser des images[br]médicales comme données d'entraînement 0:00:55.266,0:01:00.133 pour enseigner aux ordinateurs comment reconnaître [br]et diagnostiquer les maladies. 0:01:00.133,0:01:03.733 L'apprentissage automatique a besoin de [br]centaines et de milliers d'images, 0:01:03.733,0:01:06.100 et d'un guidage de la part d'un médecin, 0:01:06.100,0:01:10.333 qui sait quoi rechercher avant de pouvoir [br]identifier correctement la maladie. 0:01:10.333,0:01:12.300 Même avec des milliers d'exemples, 0:01:12.300,0:01:15.566 il peut y avoir des problèmes avec[br]les prédictions de l'ordinateur. 0:01:15.566,0:01:18.666 Si les données radiographiques ne sont collectées que sur des hommes, 0:01:18.666,0:01:21.633 alors les prédictions de l'ordinateur[br]ne peuvent fonctionner que pour les hommes. 0:01:21.633,0:01:23.500 Il peut ne pas reconnaître les maladies 0:01:23.500,0:01:26.600 lorsqu'on lui demande de diagnostiquer[br]la radiographie d'une femme. 0:01:26.600,0:01:30.966 Cet angle mort au niveau des données d'entraînement[br]crée un élément appelé biais. 0:01:30.966,0:01:36.000 Les données biaisées favorisent certaines choses,[br]et dé-priorisent ou excluent les autres. 0:01:36.000,0:01:38.333 En fonction de la manière dont les données d'entraînement sont collectées, 0:01:38.333,0:01:42.366 qui effectue la collecte et comment les données [br]sont introduites dans l'ordinateur, 0:01:42.366,0:01:45.866 il est possible que des préjugés humains soient[br]inclus dans les données. 0:01:45.866,0:01:50.266 En apprenant des données de biais, l'ordinateur [br]peut faire des prédictions biaisées, 0:01:50.266,0:01:54.533 cela peut se produire, que les personnes qui [br]forment l'ordinateur en soient conscientes ou non. 0:01:54.533,0:01:58.300 Ainsi, lorsque vous consultez des données d'entraînement,[br]posez-vous deux questions : 0:01:58.300,0:02:01.300 Ces données sont-elles suffisantes pour entraîner [br]avec précision un ordinateur ? 0:02:01.300,0:02:07.400 Et, ces données représentent-elles tous les scénarios [br]et les utilisateurs possibles sans biais ? 0:02:07.400,0:02:11.133 C'est là que vous, en tant que formateur humain, [br]pouvez jouer un rôle crucial. 0:02:11.133,0:02:14.300 C'est à vous de donner à votre machine des données impartiales. 0:02:14.300,0:02:19.000 Cela signifie collecter des tonnes d'exemples,[br]souvent à partir de nombreuses sources. 0:02:19.000,0:02:22.066 N'oubliez pas que lorsque vous choisissez des données [br]pour l'apprentissage automatique, 0:02:22.066,0:02:27.233 vous programmez en fait l'algorithme, en utilisant [br]des données d'entraînement au lieu de code. 0:02:27.233,0:02:29.733 Les données sont le code. 0:02:29.733,0:02:33.499 Plus les données que vous fournissez sont bonnes, [br]mieux l'ordinateur apprendra.