< Return to Video

AI: Training Data & Bias

  • 0:05 - 0:08
    Kunstmatige intelligentie
    Trainingsgegevens en vooringenomenheid
  • 0:08 - 0:11
    Machinaal leren is maar zo goed als
    de trainingsgegevens die je erin stopt.
  • 0:11 - 0:15
    Dus is het superbelangrijk om gegevens
    van hoge kwaliteit te gebruiken,
  • 0:15 - 0:16
    en veel ervan.
  • 0:16 - 0:20
    Maar als gegevens belangrijk zijn,
    dan is het de moeite waard om te vragen
  • 0:20 - 0:22
    "Waar komen de trainingsgegevens vandaan?"
  • 0:22 - 0:26
    Vaak verzamelen computers trainings-
    gegevens van mensen zoals jij en ik,
  • 0:26 - 0:28
    zonder enige inspanning van onze kant.
  • 0:28 - 0:31
    Een video-streamingdienst kan bijhouden
    wat je bekijkt,
  • 0:31 - 0:34
    dan kan hij patronen
    herkennen in die gegevens
  • 0:34 - 0:36
    om aan te bevelen wat
    je als volgende zou willen bekijken.
  • 0:37 - 0:41
    Andere keren wordt je expliciet gevraagd
    om te helpen, zoals wanneer een website
  • 0:41 - 0:44
    je vraagt om straatnaamborden
    in foto's te spotten,
  • 0:44 - 0:47
    Je verstrekt dan trainingsgegevens om een
    machine te leren zien,
  • 0:47 - 0:50
    en misschien op een dag zelfs te rijden.
  • 0:52 - 0:56
    Medische onderzoekers kunnen medische
    beelden gebruiken als trainingsgegevens om
  • 0:56 - 0:59
    computers te leren hoe ze ziektes
    kunnen herkennen en diagnosticeren.
  • 1:00 - 1:03
    Machinaal leren heeft honderd en duizenden
    beelden nodig,
  • 1:03 - 1:07
    en trainingsaanwijzingen van een arts
    die weet waar hij naar moet
  • 1:07 - 1:10
    zoeken, voordat hij de ziekte correct
    kan identificeren.
  • 1:10 - 1:14
    Zelfs met duizenden voorbeelden kunnen er
    problemen zijn met de voorspellingen
  • 1:14 - 1:16
    van de computer.
  • 1:16 - 1:19
    Als er alleen röntgengegevens van mannen
    worden verzameld, dan kunnen de
  • 1:19 - 1:22
    voorspellingen van de computer
    alleen voor mannen werken.
  • 1:22 - 1:26
    Het kan zijn dat het geen ziektes herkent
    als het gevraagd wordt om de röntgenfoto's
  • 1:26 - 1:27
    van een vrouw te bekijken.
  • 1:27 - 1:30
    Deze blinde vlek in de trainingsgegevens
    creëert iets wat bias (vooringenomenheid)
  • 1:30 - 1:31
    wordt genoemd.
  • 1:31 - 1:36
    Vooringenomen gegevens geven de voorkeur
    aan sommige dingen, en sluiten andere uit.
  • 1:36 - 1:39
    Afhankelijk van de manier waarop de
    trainingsgegevens worden verzameld,
  • 1:39 - 1:42
    wie het verzameld en hoe
    de gegevens worden ingevoerd,
  • 1:42 - 1:45
    is er een kans dat de gegevens menselijke
    vooringenomenheid bevatten.
  • 1:46 - 1:49
    Door te leren van bevooroordeelde gegevens
    kan het zijn dat de computer
  • 1:49 - 1:51
    vooringenomen voorspellingen doen,
  • 1:51 - 1:53
    Ongeacht of de mensen die de computer
  • 1:53 - 1:55
    trainen er wel of niet van op de hoogte zijn.
  • 1:55 - 1:58
    Dus als je zelf naar de trainingsgegevens
    kijkt, stel jezelf dan twee vragen:
  • 1:58 - 2:01
    Zijn dit genoeg gegevens om een computer
    nauwkeurig te trainen?
  • 2:01 - 2:05
    En, vertegenwoordigen deze gegevens alle
    mogelijke scenario's en gebruikers
  • 2:05 - 2:07
    zonder vooringenomenheid?
  • 2:07 - 2:11
    Hier speel jij als de menselijke trainer
    een cruciale rol.
  • 2:11 - 2:14
    Het is aan jou om je machine
    onbevooroordeelde gegevens te geven.
  • 2:14 - 2:18
    Dat betekent het verzamelen van tonnen
    voorbeelden, vaak uit vele bronnen.
  • 2:19 - 2:22
    Vergeet niet, wanneer je gegevens kiest
    voor machinaal leren,
  • 2:22 - 2:26
    programmeer je eigenlijk het algoritme,
    met behulp van trainingsgegevens
  • 2:26 - 2:27
    in plaats van code.
  • 2:27 - 2:30
    De gegevens ZIJN de code.
  • 2:30 - 2:34
    Hoe beter de gegevens zijn die je invoert,
    hoe beter de computer zal leren.
Title:
AI: Training Data & Bias
Description:

The most important aspect of Machine Learning is what data is used to train it. Find out how training data affects a machine's predictions and why biased data can lead to biased decisions.

Start learning at http://code.org/

Stay in touch with us!
• on Twitter https://twitter.com/codeorg
• on Facebook https://www.facebook.com/Code.org
• on Instagram https://instagram.com/codeorg
• on Tumblr https://blog.code.org
• on LinkedIn https://www.linkedin.com/company/code-org
• on Google+ https://google.com/+codeorg

more » « less
Video Language:
English
Team:
Code.org
Project:
How AI Works
Duration:
02:41
TranslateByHumans edited Dutch subtitles for AI: Training Data & Bias
Jesse Hoobergs edited Dutch subtitles for AI: Training Data & Bias
TranslateByHumans edited Dutch subtitles for AI: Training Data & Bias

Dutch subtitles

Revisions Compare revisions