AI: Training Data & Bias
-
0:07 - 0:12Maskininlärning blir bara så bra som de
träningsdata du matar in. -
0:12 - 0:16Därför är det jätteviktigt att använda data av hög kvalitet, och många datauppgifter.
-
0:17 - 0:22Men om data är så viktiga är det också intressant att fråga sig varifrån träningsdata kommer?
-
0:22 - 0:26Datorer samlar ofta in träningsdata från människor som dig och mig,
-
0:26 - 0:28utan att vi behöver göra något alls.
-
0:28 - 0:31En streamingtjänst för videor kanske kontrollerar vad du tittar på för att kunna känna igen mönster
-
0:32 - 0:36i datauppgifterna och rekommendera dig vad du ska titta på nästa gång.
-
0:37 - 0:43Andra gånger tillfrågas du direkt om du vill hjälpa till, som när en webbplats ber dig att markera gatuskyltar och foton,
-
0:44 - 0:49Du tillhandahåller träningsdata som hjälper en
maskin att se, och kanske till och med köra bil i framtiden. -
0:52 - 0:56Forskare inom medicin kan använda
medicinska bilder som träningsdata för att lära -
0:57 - 1:00datorer att känna igen och diagnostisera sjukdomar.
-
1:00 - 1:06Maskininlärning behöver hundratals, till och med tusentals, bilder och träning av en läkare
-
1:06 - 1:10som vet vad man ska leta efter, innan den kan identifiera en sjukdom korrekt.
-
1:11 - 1:16Även med tillgång till tusentals exempel kan det vara problem med datorns prognoser.
-
1:16 - 1:21Om röntgenuppgifter bara samlas in från män så kanske datorns prognoser bara fungerar för män.
-
1:22 - 1:26Den kanske inte känner igen sjukdomar när
den ombeds diagnostisera en röntgenbild av en kvinna. -
1:27 - 1:31Den här bristen i träningsdata
skapar något som kallas bias (systematiska fel). -
1:31 - 1:36Bias favoriserar vissa saker och nedprioriterar eller exkluderar andra.
-
1:37 - 1:42Beroende på hur träningsdata samlas in, vem som samlar in den och hur uppgifterna matas in
-
1:42 - 1:45finns det någon risk att
människors bias inkluderas i datauppgifterna. -
1:46 - 1:51Genom att lära sig från data med bias kan datorn komma att göra missvisande prognoser,
-
1:51 - 1:54vare sig de som tränar datorn
är medvetna om det eller inte. -
1:55 - 1:58När du tittar på träningsdata, ska du ställa dig två frågor:
-
1:59 - 2:02Är dessa uppgifter tillräckliga för att kunna träna en dator noggrant?
-
2:02 - 2:07Och representerar uppgifterna alla möjliga scenarier och användare, utan bias?
-
2:07 - 2:11Det är här som du, den mänskliga läraren, spelar en avgörande roll.
-
2:11 - 2:14Det är upp till dig att ge din maskin data som inte är missvisande.
-
2:14 - 2:18Detta innebär att samla in mängder av exempel, från flera olika källor.
-
2:19 - 2:23Kom ihåg att när du väljer och vrakar bland data för maskininlärning
-
2:23 - 2:27så programmerar du i själva verket algoritmen, med träningsdata istället för kod.
-
2:27 - 2:30Datauppgifterna ÄR koden.
-
2:30 - 2:35Ju bättre data du tillhandahåller, desto bättre kommer datorn att lära sig.
- Title:
- AI: Training Data & Bias
- Description:
-
The most important aspect of Machine Learning is what data is used to train it. Find out how training data affects a machine's predictions and why biased data can lead to biased decisions.
Start learning at http://code.org/
Stay in touch with us!
• on Twitter https://twitter.com/codeorg
• on Facebook https://www.facebook.com/Code.org
• on Instagram https://instagram.com/codeorg
• on Tumblr https://blog.code.org
• on LinkedIn https://www.linkedin.com/company/code-org
• on Google+ https://google.com/+codeorg - Video Language:
- English
- Team:
Code.org
- Project:
- How AI Works
- Duration:
- 02:41
![]() |
TranslateByHumans edited Swedish subtitles for AI: Training Data & Bias | |
![]() |
TranslateByHumans edited Swedish subtitles for AI: Training Data & Bias |