< Return to Video

AI: Training Data & Bias

  • 0:07 - 0:12
    Maskininlärning är så bra som den
    träningsdata som du matat den med.
  • 0:12 - 0:16
    Det är därför jätteviktigt att använda högkvalitativ data, massor av data.
  • 0:17 - 0:22
    Men om data är viktigt, då är det viktigt att fråga sig
    var datan kommer ifrån?
  • 0:22 - 0:26
    Ofta är det datorer som samlar datan från folk som dig och mig
  • 0:26 - 0:28
    utan att vi lägger ner någon mödan.
  • 0:28 - 0:31
    En videostreamingstjänst kan samla data om vad du tittar på för att känna igen ett mönster
  • 0:32 - 0:36
    i datan för ge rekommendationer om vad du vill se härnäst.
  • 0:37 - 0:43
    Andra gånger blir du frågad direkt om hjälp,
    som när du blir ombedd att identifiera gatuskyltar och foton.
  • 0:44 - 0:49
    Du bidrar med träningsdata för att hjälpa
    en maskin att se, och kanske en dag köra bil.
  • 0:52 - 0:56
    Medicinska forskare kanske använder
    medicinska bilder som träningsdata för att lära
  • 0:57 - 1:00
    datorer att känna igen och diagnosera sjukdomar.
  • 1:00 - 1:06
    Maskininlärning behöver hundratusentals av bilder, samt träningsdirektiv från en läkare
  • 1:06 - 1:10
    som vet vad man ska leta efter, före datorn korrekt kan identifiera sjukdomar.
  • 1:11 - 1:16
    Det kan uppstå problem med diagnostiken, även om tusentals exempel används.
  • 1:16 - 1:21
    Om röntgenbilder bara samlas från män kan
    datorns diagnostik kanske bara användas i mäns fall.
  • 1:22 - 1:26
    Den kanske inte känner igen sjukdomar när
    man använder den för att analysera röntgenbilder av kvinnor.
  • 1:27 - 1:31
    Blindfläcken som uppstår från träningsdatan
    kallas för systematiska fel eller biases.
  • 1:31 - 1:36
    Systematiska fel i data gynnar vissa saker och exkluderar andra.
  • 1:37 - 1:42
    Allt beror på hur träningsdatan är samlats, vem som
    samlar datan och hur datan matas.
  • 1:42 - 1:45
    Det finns en risk att
    människans partiskhet finns med i datan.
  • 1:46 - 1:51
    Genom att lära sig av partisk data kan datorn komma att göra partisk diagnostik,
  • 1:51 - 1:54
    varse sig människan är medveten om
    det eller inte.
  • 1:55 - 1:58
    När du ser över träningsdata bör du fråga dig två frågor:
  • 1:59 - 2:02
    Är det tillräckligt med data för att träna datorn?
  • 2:02 - 2:07
    Och, representerar datan alla möjliga scenarion och användare utan partiskhet?
  • 2:07 - 2:11
    Det är där du, människan som tränar datorn, spelar en nyckelroll.
  • 2:11 - 2:14
    Det är upp till dig att ge din maskin opartisk data.
  • 2:14 - 2:18
    Det betyder att du måste samla massor med exempel från olika källor.
  • 2:19 - 2:23
    Kom ihåg att när du väljer och samlar data för maskininlärning,
  • 2:23 - 2:27
    så programmerar du faktiskt algoritmen med hjälp av träningsdata i stället för kod.
  • 2:27 - 2:30
    Datan ÄR koden.
  • 2:30 - 2:35
    Desto bättre data som du förser, desto bättre kommer datorn att lära sig.
Title:
AI: Training Data & Bias
Description:

more » « less
Video Language:
English
Team:
Code.org
Project:
How AI Works
Duration:
02:41
TranslateByHumans edited Swedish subtitles for AI: Training Data & Bias
TranslateByHumans edited Swedish subtitles for AI: Training Data & Bias

Swedish subtitles

Revisions Compare revisions