< Return to Video

AI: Training Data & Bias

  • 0:07 - 0:12
    L'apprentissage automatique vaut autant que les
    données de formation que vous y mettez.
  • 0:12 - 0:16
    Il est donc très important d’utiliser beaucoup de
    données et de très bonne qualité.
  • 0:17 - 0:22
    Puisqu’elles sont importantes, cela vaut la peine
    de se demander d'où elles proviennent ?
  • 0:22 - 0:26
    Souvent, les ordinateurs collectent des données de
    formation auprès de personnes comme vous et moi,
  • 0:26 - 0:28
    sans aucun effort de notre part.
  • 0:28 - 0:31
    Un service de streaming vidéo peut garder une trace
    de ce que vous regardez, puis élaborer des modèles
  • 0:32 - 0:36
    à partir de ces données pour vous faire
    des suggestions futures à partir de là.
  • 0:37 - 0:40
    D'autres fois, on vous
    demande directement votre aide,
  • 0:40 - 0:44
    pour repérer des panneaux de signalisation
    et des photos sur un site web,
  • 0:44 - 0:46
    au quel cas vous fournissez des données
    de formation pour aider une machine
  • 0:46 - 0:50
    à apprendre à voir et peut-être
    même à conduire un jour.
  • 0:51 - 0:54
    Les chercheurs en médecine peuvent
    utiliser des images médicales
  • 0:54 - 0:56
    comme données de
    formation pour enseigner
  • 0:56 - 1:00
    aux ordinateurs comment reconnaître et diagnostiquer
    des maladies.
  • 1:00 - 1:04
    L'apprentissage automatique a besoin
    de centaines et de milliers d'images,
  • 1:04 - 1:06
    et de la formation d'un médecin,
  • 1:06 - 1:10
    qui sait quoi chercher avant de pouvoir
    identifier correctement la maladie.
  • 1:11 - 1:13
    Même avec des milliers d'exemples,
    il peut y avoir des problèmes
  • 1:13 - 1:16
    avec les prédictions de l'ordinateur.
  • 1:16 - 1:18
    Si les données radiographiques
    ne sont collectées que chez les hommes,
  • 1:18 - 1:21
    il se peut que les prédictions
    ne fonctionnent que pour eux.
  • 1:22 - 1:24
    Il se peut que des maladies ne soient pas
    reconnues, comme lorsqu'on lui demande
  • 1:24 - 1:27
    de diagnostiquer la radio d'une femme.
  • 1:27 - 1:31
    Cet angle mort dans les données de formation
    crée ce que l’on appelle des données faussées.
  • 1:31 - 1:33
    Elles favorisent certains éléments,
    tout en ne donnant pas
  • 1:33 - 1:36
    la priorité à d'autres,
    voire en les excluant.
  • 1:37 - 1:41
    En fonction de comment les données
    de formation sont collectées,
  • 1:41 - 1:42
    de qui les recueille et
    comment elles sont saisies,
  • 1:42 - 1:45
    il est possible que parmi toutes les données,
    certaines faussées y figurent.
  • 1:46 - 1:51
    En se basant sur ces données faussées,
    l'ordinateur peut faire de fausses prédictions,
  • 1:51 - 1:54
    selon si les personnes qui forment
    l’ordinateur en sont conscientes ou pas.
  • 1:54 - 1:58
    Lorsque vous regardez les données de formation,
    posez-vous deux questions :
  • 1:59 - 2:02
    Ces données sont-elles suffisantes
    pour former avec précision un ordinateur ?
  • 2:02 - 2:07
    Représentent-elles tous les scénarios et
    utilisateurs possibles sans aucun parti pris ?
  • 2:07 - 2:11
    C'est là que vous, en tant que
    formateur humain, jouez un rôle crucial.
  • 2:11 - 2:14
    C'est à vous de fournir à votre machine
    des données impartiales.
  • 2:14 - 2:18
    Cela signifie collecter des tonnes d'exemples,
    provenant de nombreuses sources.
  • 2:19 - 2:23
    N'oubliez pas que lorsque vous choisissez des données
    pour l'apprentissage automatique,
  • 2:23 - 2:27
    vous programmez réellement l'algorithme, en utilisant
    des données de formation au lieu du code.
  • 2:27 - 2:30
    Les données SONT alors le code.
  • 2:30 - 2:35
    Plus les données que vous fournissez sont
    de bonne qualité, mieux l’ordinateur apprendra.
Title:
AI: Training Data & Bias
Description:

The most important aspect of Machine Learning is what data is used to train it. Find out how training data affects a machine's predictions and why biased data can lead to biased decisions.

Start learning at http://code.org/

Stay in touch with us!
• on Twitter https://twitter.com/codeorg
• on Facebook https://www.facebook.com/Code.org
• on Instagram https://instagram.com/codeorg
• on Tumblr https://blog.code.org
• on LinkedIn https://www.linkedin.com/company/code-org
• on Google+ https://google.com/+codeorg

more » « less
Video Language:
English
Team:
Code.org
Project:
How AI Works
Duration:
02:41

French subtitles

Revisions Compare revisions