< Return to Video

AI: Training Data & Bias

  • 0:00 - 0:04
  • 0:04 - 0:07
  • 0:07 - 0:11
    L'apprentissage automatique n'est aussi bon que
    les données d'entraînement que vous y insérez.
  • 0:11 - 0:17
    Donc, c'est très important d'utiliser
    des données de haute qualité, et beaucoup de celles-ci.
  • 0:17 - 0:22
    Mais si les données sont si importantes, cela vaut la peine
    de demander d'où viennent les données de formation ?
  • 0:22 - 0:26
    Souvent, les ordinateurs collectent les données
    de formation de personnes comme vous et moi,
  • 0:26 - 0:28
    sans aucun effort de notre part.
  • 0:28 - 0:31
    Un service de streaming vidéo peut garder
    une trace de ce que vous regardez,
  • 0:31 - 0:34
    alors il peut reconnaître des
    modèles à partir de ces données
  • 0:34 - 0:37
    pour vous recommander ce que vous
    voudriez peut-être regarder ensuite.
  • 0:37 - 0:40
    D'autres fois, on vous
    demande directement d'aider,
  • 0:40 - 0:44
    comme lorsqu'un site Web vous demande
    de repérer les panneaux de signalisation et les photos,
  • 0:44 - 0:48
    vous fournissez des données d'entraînement pour
    aider une machine à apprendre à voir,
  • 0:48 - 0:52
    et peut-être même un jour, conduire.
  • 0:52 - 0:55
    Les chercheurs en médecine peuvent utiliser des images
    médicales comme données d'entraînement
  • 0:55 - 1:00
    pour enseigner aux ordinateurs comment reconnaître
    et diagnostiquer les maladies.
  • 1:00 - 1:04
    L'apprentissage automatique a besoin de
    centaines et de milliers d'images,
  • 1:04 - 1:06
    et d'un guidage de la part d'un médecin,
  • 1:06 - 1:10
    qui sait quoi rechercher avant de pouvoir
    identifier correctement la maladie.
  • 1:10 - 1:12
    Même avec des milliers d'exemples,
  • 1:12 - 1:16
    il peut y avoir des problèmes avec
    les prédictions de l'ordinateur.
  • 1:16 - 1:19
    Si les données radiographiques ne sont collectées que sur des hommes,
  • 1:19 - 1:22
    alors les prédictions de l'ordinateur
    ne peuvent fonctionner que pour les hommes.
  • 1:22 - 1:24
    Il peut ne pas reconnaître les maladies
  • 1:24 - 1:27
    lorsqu'on lui demande de diagnostiquer
    la radiographie d'une femme.
  • 1:27 - 1:31
    Cet angle mort au niveau des données d'entraînement
    crée un élément appelé biais.
  • 1:31 - 1:36
    Les données biaisées favorisent certaines choses,
    et dé-priorisent ou excluent les autres.
  • 1:36 - 1:38
    En fonction de la manière dont les données d'entraînement sont collectées,
  • 1:38 - 1:42
    qui effectue la collecte et comment les données
    sont introduites dans l'ordinateur,
  • 1:42 - 1:46
    il est possible que des préjugés humains soient
    inclus dans les données.
  • 1:46 - 1:50
    En apprenant des données de biais, l'ordinateur
    peut faire des prédictions biaisées,
  • 1:50 - 1:55
    cela peut se produire, que les personnes qui
    forment l'ordinateur en soient conscientes ou non.
  • 1:55 - 1:58
    Ainsi, lorsque vous consultez des données d'entraînement,
    posez-vous deux questions :
  • 1:58 - 2:01
    Ces données sont-elles suffisantes pour entraîner
    avec précision un ordinateur ?
  • 2:01 - 2:07
    Et, ces données représentent-elles tous les scénarios
    et les utilisateurs possibles sans biais ?
  • 2:07 - 2:11
    C'est là que vous, en tant que formateur humain,
    pouvez jouer un rôle crucial.
  • 2:11 - 2:14
    C'est à vous de donner à votre machine des données impartiales.
  • 2:14 - 2:19
    Cela signifie collecter des tonnes d'exemples,
    souvent à partir de nombreuses sources.
  • 2:19 - 2:22
    N'oubliez pas que lorsque vous choisissez des données
    pour l'apprentissage automatique,
  • 2:22 - 2:27
    vous programmez en fait l'algorithme, en utilisant
    des données d'entraînement au lieu de code.
  • 2:27 - 2:30
    Les données sont le code.
  • 2:30 - 2:33
    Plus les données que vous fournissez sont bonnes,
    mieux l'ordinateur apprendra.
Title:
AI: Training Data & Bias
Description:

more » « less
Video Language:
English
Team:
Code.org
Project:
How AI Works
Duration:
02:41

French (Canada) subtitles

Revisions