< Return to Video

AI: Training Data & Bias

  • 0:07 - 0:12
    Maskininlärning blir bara så bra som de
    träningsdata du matar in.
  • 0:12 - 0:16
    Därför är det jätteviktigt att använda data av hög kvalitet, och många datauppgifter.
  • 0:17 - 0:22
    Men om data är så viktiga är det också intressant att fråga sig varifrån träningsdata kommer?
  • 0:22 - 0:26
    Datorer samlar ofta in träningsdata från människor som dig och mig,
  • 0:26 - 0:28
    utan att vi behöver göra något alls.
  • 0:28 - 0:31
    En streamingtjänst för videor kanske kontrollerar vad du tittar på för att kunna känna igen mönster
  • 0:32 - 0:36
    i datauppgifterna och rekommendera dig vad du ska titta på nästa gång.
  • 0:37 - 0:43
    Andra gånger tillfrågas du direkt om du vill hjälpa till, som när en webbplats ber dig att markera gatuskyltar och foton,
  • 0:44 - 0:49
    Du tillhandahåller träningsdata som hjälper en
    maskin att se, och kanske till och med köra bil i framtiden.
  • 0:52 - 0:56
    Forskare inom medicin kan använda
    medicinska bilder som träningsdata för att lära
  • 0:57 - 1:00
    datorer att känna igen och diagnostisera sjukdomar.
  • 1:00 - 1:06
    Maskininlärning behöver hundratals, till och med tusentals, bilder och träning av en läkare
  • 1:06 - 1:10
    som vet vad man ska leta efter, innan den kan identifiera en sjukdom korrekt.
  • 1:11 - 1:16
    Även med tillgång till tusentals exempel kan det vara problem med datorns prognoser.
  • 1:16 - 1:21
    Om röntgenuppgifter bara samlas in från män så kanske datorns prognoser bara fungerar för män.
  • 1:22 - 1:26
    Den kanske inte känner igen sjukdomar när
    den ombeds diagnostisera en röntgenbild av en kvinna.
  • 1:27 - 1:31
    Den här bristen i träningsdata
    skapar något som kallas bias (systematiska fel).
  • 1:31 - 1:36
    Bias favoriserar vissa saker och nedprioriterar eller exkluderar andra.
  • 1:37 - 1:42
    Beroende på hur träningsdata samlas in, vem som samlar in den och hur uppgifterna matas in
  • 1:42 - 1:45
    finns det någon risk att
    människors bias inkluderas i datauppgifterna.
  • 1:46 - 1:51
    Genom att lära sig från data med bias kan datorn komma att göra missvisande prognoser,
  • 1:51 - 1:54
    vare sig de som tränar datorn
    är medvetna om det eller inte.
  • 1:55 - 1:58
    När du tittar på träningsdata, ska du ställa dig två frågor:
  • 1:59 - 2:02
    Är dessa uppgifter tillräckliga för att kunna träna en dator noggrant?
  • 2:02 - 2:07
    Och representerar uppgifterna alla möjliga scenarier och användare, utan bias?
  • 2:07 - 2:11
    Det är här som du, den mänskliga läraren, spelar en avgörande roll.
  • 2:11 - 2:14
    Det är upp till dig att ge din maskin data som inte är missvisande.
  • 2:14 - 2:18
    Detta innebär att samla in mängder av exempel, från flera olika källor.
  • 2:19 - 2:23
    Kom ihåg att när du väljer och vrakar bland data för maskininlärning
  • 2:23 - 2:27
    så programmerar du i själva verket algoritmen, med träningsdata istället för kod.
  • 2:27 - 2:30
    Datauppgifterna ÄR koden.
  • 2:30 - 2:35
    Ju bättre data du tillhandahåller, desto bättre kommer datorn att lära sig.
Title:
AI: Training Data & Bias
Description:

The most important aspect of Machine Learning is what data is used to train it. Find out how training data affects a machine's predictions and why biased data can lead to biased decisions.

Start learning at http://code.org/

Stay in touch with us!
• on Twitter https://twitter.com/codeorg
• on Facebook https://www.facebook.com/Code.org
• on Instagram https://instagram.com/codeorg
• on Tumblr https://blog.code.org
• on LinkedIn https://www.linkedin.com/company/code-org
• on Google+ https://google.com/+codeorg

more » « less
Video Language:
English
Team:
Code.org
Project:
How AI Works
Duration:
02:41
TranslateByHumans edited Swedish subtitles for AI: Training Data & Bias
TranslateByHumans edited Swedish subtitles for AI: Training Data & Bias

Swedish subtitles

Revisions Compare revisions