< Return to Video

AI: Training Data & Bias

  • 0:04 - 0:07
  • 0:07 - 0:11
    De kwaliteit van machine learning
    staat of valt met de trainingsdata.
  • 0:11 - 0:16
    Het is dus uitermate belangrijk
    om veel hoogwaardige data te gebruiken.
  • 0:17 - 0:21
    Maar als trainingsdata zo belangrijk is,
    moet je je afvragen waar die vandaan komt.
  • 0:22 - 0:26
    Computers verzamelen vaak
    trainingsdata van mensen zoals jij en ik,
  • 0:26 - 0:28
    zonder dat wij iets hoeven te doen.
  • 0:28 - 0:31
    Zo kan een videostreamingdienst
    bijhouden waar je naar kijkt,
  • 0:31 - 0:34
    en vervolgens patronen herkennen
    in die data
  • 0:34 - 0:36
    om jou suggesties te geven
    waar je naar kunt kijken.
  • 0:37 - 0:40
    In andere gevallen wordt er
    rechtstreeks om jouw hulp gevraagd.
  • 0:40 - 0:44
    Als een website je bijvoorbeeld vraagt
    om verkeersborden te zien op foto's,
  • 0:44 - 0:47
    geef je misschien wel trainingsdata
    om een machine te leren zien,
  • 0:48 - 0:49
    en op een dag een auto te besturen.
  • 0:52 - 0:55
    Medisch onderzoekers kunnen
    medische afbeeldingen gebruiken
  • 0:55 - 0:59
    als trainingsdata om computers te leren
    ziektes te herkennen en diagnoses te stellen.
  • 1:00 - 1:04
    Machine learning heeft honderden en
    duizenden afbeeldingen nodig,
  • 1:04 - 1:06
    met daarbij aanwijzingen van een arts
  • 1:06 - 1:10
    die weet waar je naar moet kijken,
    voordat het ziektes juist herkent.
  • 1:10 - 1:12
    Zelfs met duizenden voorbeelden
  • 1:12 - 1:15
    kunnen er problemen zijn
    met de computervoorspellingen.
  • 1:16 - 1:19
    Met röntgenfoto's van alleen mannen
  • 1:19 - 1:21
    werken de computervoorspellingen
    misschien alleen bij mannen.
  • 1:22 - 1:23
    Wellicht worden ziektes niet herkend
  • 1:24 - 1:26
    als de computer kijkt naar
    de röntgenfoto van een vrouw.
  • 1:27 - 1:30
    Deze blinde vlek in de trainingsdata
    levert een vertekening op, ofwel bias.
  • 1:31 - 1:36
    Databias bevoordeelt het ene, en geeft
    het andere minder of helemaal geen prioriteit.
  • 1:36 - 1:38
    Afhankelijk van hoe
    trainingsdata wordt verzameld,
  • 1:38 - 1:42
    door wie,
    en hoe de computer de data krijgt,
  • 1:42 - 1:45
    is er een kans dat de data
    menselijke bias bevat.
  • 1:46 - 1:50
    Als de computer leert van zulke data,
    doet hij misschien vertekende voorspellingen,
  • 1:50 - 1:53
    of de mensen
    die de computer trainen
  • 1:53 - 1:54
    het nu merken of niet.
  • 1:55 - 1:58
    Dus stel jezelf twee vragen
    bij het bekijken van trainingsdata.
  • 1:58 - 2:01
    Is dit voldoende data
    om een computer goed te trainen?
  • 2:01 - 2:07
    En is dit data zonder bias over
    alle mogelijke scenario's en gebruikers?
  • 2:07 - 2:11
    Hier kun je als menselijke trainer
    een cruciale rol spelen.
  • 2:11 - 2:14
    Jij bent degene die jouw machine
    data zonder bias moet geven.
  • 2:14 - 2:18
    Dat betekent vele voorbeelden verzamelen,
    uit heel veel bronnen.
  • 2:19 - 2:22
    Als je data kiest voor machine leren
    ben je in feite bezig
  • 2:22 - 2:27
    met het programmeren van het algoritme,
    met trainingsdata in plaats van code.
  • 2:27 - 2:29
    De data ís de code.
  • 2:30 - 2:34
    Hoe beter de data die je levert,
    hoe beter de computer leert.
Title:
AI: Training Data & Bias
Description:

more » « less
Video Language:
English
Team:
Code.org
Project:
How AI Works
Duration:
02:41
TranslateByHumans edited Dutch subtitles for AI: Training Data & Bias
Jesse Hoobergs edited Dutch subtitles for AI: Training Data & Bias
TranslateByHumans edited Dutch subtitles for AI: Training Data & Bias

Dutch subtitles

Revisions Compare revisions