AI: Training Data & Bias

Edit subtitles

0:07 - 0:12

Maskininlärning är så bra som den
träningsdata som du matat den med.
0:12 - 0:16

Det är därför jätteviktigt att använda högkvalitativ data, massor av data.
0:17 - 0:22

Men om data är viktigt, då är det viktigt att fråga sig
var datan kommer ifrån?
0:22 - 0:26

Ofta är det datorer som samlar datan från folk som dig och mig
0:26 - 0:28

utan att vi lägger ner någon mödan.
0:28 - 0:31

En videostreamingstjänst kan samla data om vad du tittar på för att känna igen ett mönster
0:32 - 0:36

i datan för ge rekommendationer om vad du vill se härnäst.
0:37 - 0:43

Andra gånger blir du frågad direkt om hjälp,
som när du blir ombedd att identifiera gatuskyltar och foton.
0:44 - 0:49

Du bidrar med träningsdata för att hjälpa
en maskin att se, och kanske en dag köra bil.
0:52 - 0:56

Medicinska forskare kanske använder
medicinska bilder som träningsdata för att lära
0:57 - 1:00

datorer att känna igen och diagnosera sjukdomar.
1:00 - 1:06

Maskininlärning behöver hundratusentals av bilder, samt träningsdirektiv från en läkare
1:06 - 1:10

som vet vad man ska leta efter, före datorn korrekt kan identifiera sjukdomar.
1:11 - 1:16

Det kan uppstå problem med diagnostiken, även om tusentals exempel används.
1:16 - 1:21

Om röntgenbilder bara samlas från män kan
datorns diagnostik kanske bara användas i mäns fall.
1:22 - 1:26

Den kanske inte känner igen sjukdomar när
man använder den för att analysera röntgenbilder av kvinnor.
1:27 - 1:31

Blindfläcken som uppstår från träningsdatan
kallas för systematiska fel eller biases.
1:31 - 1:36

Systematiska fel i data gynnar vissa saker och exkluderar andra.
1:37 - 1:42

Allt beror på hur träningsdatan är samlats, vem som
samlar datan och hur datan matas.
1:42 - 1:45

Det finns en risk att
människans partiskhet finns med i datan.
1:46 - 1:51

Genom att lära sig av partisk data kan datorn komma att göra partisk diagnostik,
1:51 - 1:54

varse sig människan är medveten om
det eller inte.
1:55 - 1:58

När du ser över träningsdata bör du fråga dig två frågor:
1:59 - 2:02

Är det tillräckligt med data för att träna datorn?
2:02 - 2:07

Och, representerar datan alla möjliga scenarion och användare utan partiskhet?
2:07 - 2:11

Det är där du, människan som tränar datorn, spelar en nyckelroll.
2:11 - 2:14

Det är upp till dig att ge din maskin opartisk data.
2:14 - 2:18

Det betyder att du måste samla massor med exempel från olika källor.
2:19 - 2:23

Kom ihåg att när du väljer och samlar data för maskininlärning,
2:23 - 2:27

så programmerar du faktiskt algoritmen med hjälp av träningsdata i stället för kod.
2:27 - 2:30

Datan ÄR koden.
2:30 - 2:35

Desto bättre data som du förser, desto bättre kommer datorn att lära sig.

Title:: AI: Training Data & Bias
Description:: more » « less
Video Language:: English
Team:: Code.org
Project:: How AI Works
Duration:: 02:41

	TranslateByHumans edited Swedish subtitles for AI: Training Data & Bias
	TranslateByHumans edited Swedish subtitles for AI: Training Data & Bias

Swedish subtitles

Revisions Compare revisions

Revision 2 Uploaded

TranslateByHumans
Revision 1 Uploaded

TranslateByHumans

	Revision Number	Author	Created
	2	TranslateByHumans
	1	TranslateByHumans

AI: Training Data & Bias

Revisions Compare revisions

Our website uses cookies

Operating cookies (Required)