[Script Info] Title: [Events] Format: Layer, Start, End, Style, Name, MarginL, MarginR, MarginV, Effect, Text Dialogue: 0,0:00:07.36,0:00:11.76,Default,,0000,0000,0000,,Maskininlärning är så bra som den \Nträningsdata som du matat den med. Dialogue: 0,0:00:11.80,0:00:15.82,Default,,0000,0000,0000,,Det är därför jätteviktigt att använda högkvalitativ data, massor av data. Dialogue: 0,0:00:16.76,0:00:21.96,Default,,0000,0000,0000,,Men om data är viktigt, då är det viktigt att fråga sig \Nvar datan kommer ifrån? Dialogue: 0,0:00:22.28,0:00:26.26,Default,,0000,0000,0000,,Ofta är det datorer som samlar datan från folk som dig och mig Dialogue: 0,0:00:26.26,0:00:27.86,Default,,0000,0000,0000,,utan att vi lägger ner någon mödan. Dialogue: 0,0:00:28.44,0:00:31.48,Default,,0000,0000,0000,,En videostreamingstjänst kan samla data om vad du tittar på för att känna igen ett mönster Dialogue: 0,0:00:31.66,0:00:36.00,Default,,0000,0000,0000,,i datan för ge rekommendationer om vad du vill se härnäst. Dialogue: 0,0:00:37.42,0:00:43.20,Default,,0000,0000,0000,,Andra gånger blir du frågad direkt om hjälp,\Nsom när du blir ombedd att identifiera gatuskyltar och foton. Dialogue: 0,0:00:43.78,0:00:49.28,Default,,0000,0000,0000,,Du bidrar med träningsdata för att hjälpa \Nen maskin att se, och kanske en dag köra bil. Dialogue: 0,0:00:52.32,0:00:56.44,Default,,0000,0000,0000,,Medicinska forskare kanske använder \Nmedicinska bilder som träningsdata för att lära Dialogue: 0,0:00:56.52,0:00:59.90,Default,,0000,0000,0000,,datorer att känna igen och diagnosera sjukdomar. Dialogue: 0,0:01:00.30,0:01:05.56,Default,,0000,0000,0000,,Maskininlärning behöver hundratusentals av bilder, samt träningsdirektiv från en läkare Dialogue: 0,0:01:05.64,0:01:09.92,Default,,0000,0000,0000,,som vet vad man ska leta efter, före datorn korrekt kan identifiera sjukdomar. Dialogue: 0,0:01:10.52,0:01:15.54,Default,,0000,0000,0000,,Det kan uppstå problem med diagnostiken, även om tusentals exempel används. Dialogue: 0,0:01:15.88,0:01:20.66,Default,,0000,0000,0000,,Om röntgenbilder bara samlas från män kan \Ndatorns diagnostik kanske bara användas i mäns fall. Dialogue: 0,0:01:21.88,0:01:26.30,Default,,0000,0000,0000,,Den kanske inte känner igen sjukdomar när \Nman använder den för att analysera röntgenbilder av kvinnor. Dialogue: 0,0:01:26.62,0:01:30.82,Default,,0000,0000,0000,,Blindfläcken som uppstår från träningsdatan \Nkallas för systematiska fel eller biases. Dialogue: 0,0:01:31.26,0:01:36.42,Default,,0000,0000,0000,,Systematiska fel i data gynnar vissa saker och exkluderar andra. Dialogue: 0,0:01:36.78,0:01:41.80,Default,,0000,0000,0000,,Allt beror på hur träningsdatan är samlats, vem som \Nsamlar datan och hur datan matas. Dialogue: 0,0:01:41.80,0:01:45.34,Default,,0000,0000,0000,,Det finns en risk att \Nmänniskans partiskhet finns med i datan. Dialogue: 0,0:01:45.88,0:01:50.70,Default,,0000,0000,0000,,Genom att lära sig av partisk data kan datorn komma att göra partisk diagnostik, Dialogue: 0,0:01:50.78,0:01:54.32,Default,,0000,0000,0000,,varse sig människan är medveten om \Ndet eller inte. Dialogue: 0,0:01:54.76,0:01:58.40,Default,,0000,0000,0000,,När du ser över träningsdata bör du fråga dig två frågor: Dialogue: 0,0:01:58.64,0:02:01.60,Default,,0000,0000,0000,,Är det tillräckligt med data för att träna datorn? Dialogue: 0,0:02:02.32,0:02:06.86,Default,,0000,0000,0000,,Och, representerar datan alla möjliga scenarion och användare utan partiskhet? Dialogue: 0,0:02:07.46,0:02:11.04,Default,,0000,0000,0000,,Det är där du, människan som tränar datorn, spelar en nyckelroll. Dialogue: 0,0:02:11.16,0:02:14.50,Default,,0000,0000,0000,,Det är upp till dig att ge din maskin opartisk data. Dialogue: 0,0:02:14.50,0:02:18.16,Default,,0000,0000,0000,,Det betyder att du måste samla massor med exempel från olika källor. Dialogue: 0,0:02:19.30,0:02:22.58,Default,,0000,0000,0000,,Kom ihåg att när du väljer och samlar data för maskininlärning, Dialogue: 0,0:02:22.58,0:02:26.66,Default,,0000,0000,0000,,så programmerar du faktiskt algoritmen med hjälp av träningsdata i stället för kod. Dialogue: 0,0:02:27.10,0:02:29.78,Default,,0000,0000,0000,,Datan ÄR koden. Dialogue: 0,0:02:30.18,0:02:34.68,Default,,0000,0000,0000,,Desto bättre data som du förser, desto bättre kommer datorn att lära sig.