AI: Training Data & Bias
-
0:07 - 0:12L'apprentissage automatique vaut autant que les
données de formation que vous y mettez. -
0:12 - 0:16Il est donc très important d’utiliser beaucoup de
données et de très bonne qualité. -
0:17 - 0:22Puisqu’elles sont importantes, cela vaut la peine
de se demander d'où elles proviennent ? -
0:22 - 0:26Souvent, les ordinateurs collectent des données de
formation auprès de personnes comme vous et moi, -
0:26 - 0:28sans aucun effort de notre part.
-
0:28 - 0:31Un service de streaming vidéo peut garder une trace
de ce que vous regardez, puis élaborer des modèles -
0:32 - 0:36à partir de ces données pour vous faire
des suggestions futures à partir de là. -
0:37 - 0:40D'autres fois, on vous
demande directement votre aide, -
0:40 - 0:44pour repérer des panneaux de signalisation
et des photos sur un site web, -
0:44 - 0:46au quel cas vous fournissez des données
de formation pour aider une machine -
0:46 - 0:50à apprendre à voir et peut-être
même à conduire un jour. -
0:51 - 0:54Les chercheurs en médecine peuvent
utiliser des images médicales -
0:54 - 0:56comme données de
formation pour enseigner -
0:56 - 1:00aux ordinateurs comment reconnaître et diagnostiquer
des maladies. -
1:00 - 1:04L'apprentissage automatique a besoin
de centaines et de milliers d'images, -
1:04 - 1:06et de la formation d'un médecin,
-
1:06 - 1:10qui sait quoi chercher avant de pouvoir
identifier correctement la maladie. -
1:11 - 1:13Même avec des milliers d'exemples,
il peut y avoir des problèmes -
1:13 - 1:16avec les prédictions de l'ordinateur.
-
1:16 - 1:18Si les données radiographiques
ne sont collectées que chez les hommes, -
1:18 - 1:21il se peut que les prédictions
ne fonctionnent que pour eux. -
1:22 - 1:24Il se peut que des maladies ne soient pas
reconnues, comme lorsqu'on lui demande -
1:24 - 1:27de diagnostiquer la radio d'une femme.
-
1:27 - 1:31Cet angle mort dans les données de formation
crée ce que l’on appelle des données faussées. -
1:31 - 1:33Elles favorisent certains éléments,
tout en ne donnant pas -
1:33 - 1:36la priorité à d'autres,
voire en les excluant. -
1:37 - 1:41En fonction de comment les données
de formation sont collectées, -
1:41 - 1:42de qui les recueille et
comment elles sont saisies, -
1:42 - 1:45il est possible que parmi toutes les données,
certaines faussées y figurent. -
1:46 - 1:51En se basant sur ces données faussées,
l'ordinateur peut faire de fausses prédictions, -
1:51 - 1:54selon si les personnes qui forment
l’ordinateur en sont conscientes ou pas. -
1:54 - 1:58Lorsque vous regardez les données de formation,
posez-vous deux questions : -
1:59 - 2:02Ces données sont-elles suffisantes
pour former avec précision un ordinateur ? -
2:02 - 2:07Représentent-elles tous les scénarios et
utilisateurs possibles sans aucun parti pris ? -
2:07 - 2:11C'est là que vous, en tant que
formateur humain, jouez un rôle crucial. -
2:11 - 2:14C'est à vous de fournir à votre machine
des données impartiales. -
2:14 - 2:18Cela signifie collecter des tonnes d'exemples,
provenant de nombreuses sources. -
2:19 - 2:23N'oubliez pas que lorsque vous choisissez des données
pour l'apprentissage automatique, -
2:23 - 2:27vous programmez réellement l'algorithme, en utilisant
des données de formation au lieu du code. -
2:27 - 2:30Les données SONT alors le code.
-
2:30 - 2:35Plus les données que vous fournissez sont
de bonne qualité, mieux l’ordinateur apprendra.
- Title:
- AI: Training Data & Bias
- Description:
-
The most important aspect of Machine Learning is what data is used to train it. Find out how training data affects a machine's predictions and why biased data can lead to biased decisions.
Start learning at http://code.org/
Stay in touch with us!
• on Twitter https://twitter.com/codeorg
• on Facebook https://www.facebook.com/Code.org
• on Instagram https://instagram.com/codeorg
• on Tumblr https://blog.code.org
• on LinkedIn https://www.linkedin.com/company/code-org
• on Google+ https://google.com/+codeorg - Video Language:
- English
- Team:
Code.org
- Project:
- How AI Works
- Duration:
- 02:41
![]() |
EleonoreBSF edited French subtitles for AI: Training Data & Bias | |
![]() |
EleonoreBSF edited French subtitles for AI: Training Data & Bias | |
![]() |
TranslateByHumans edited French subtitles for AI: Training Data & Bias |