AI: Training Data & Bias
-
0:07 - 0:12機器學習的表現很依賴你所輸入的訓練資料(的品質)
-
0:12 - 0:16因此,使用巨量且高品質的資料,非常非常重要!
-
0:17 - 0:22既然,資料如此重要,就十分值得問清楚:訓練資料是從哪裡來的呢?
-
0:22 - 0:26一般來說,電腦會從你和我這樣的普通人,來搜集訓練資料
-
0:26 - 0:28我們不需要做額外的事情。
-
0:28 - 0:31影片串流服務可能會持續追蹤你觀看的影片,
-
0:32 - 0:36然後就能在資料中識別出模式,
並向你推薦可能會想觀看的下一部影片 -
0:37 - 0:41其他情況下,則會直接請你提供協助
-
0:41 - 0:44例如,網站會要請你標記出街道號誌和照片
-
0:44 - 0:49你就是正在幫電腦提供訓練資料
幫助它學會看路,甚至學會駕駛車輛 -
0:52 - 0:56醫學研究人員可以使用醫學圖片作為訓練資料
-
0:56 - 0:59來教會電腦如何識別並診斷疾病
-
1:00 - 1:06機器學習需要成千上萬張圖片,以及來自於醫生的訓練指導
-
1:06 - 1:10先知道要查看什麼,才能正確地診斷疾病
-
1:11 - 1:16即便有很大量的範例,電腦的預測仍有可能出錯
-
1:16 - 1:21如果僅收集男性患者的X光圖片,
預測的結果僅可能適用於男性 -
1:22 - 1:26當需要對女性X光圖片做判讀時,
電腦可能就無法對疾病進行診斷。 -
1:27 - 1:31這種訓練資料中的盲點,就會造成所謂的偏差(bias)
-
1:31 - 1:36帶有偏差的資料,會偏向某些狀況,而降低或排除了其他狀況。
-
1:37 - 1:42像是:訓練資料的收集方式、執行的人員、以及資料的輸入方式
-
1:42 - 1:45人爲偏見難免會隱含於資料當中
-
1:46 - 1:51從帶有偏誤的資料進行學習,電腦可能會做出帶有偏誤的預測
-
1:51 - 1:54無論訓練電腦的人員,是否察覺到這一點
-
1:55 - 1:58因此,當你查看訓練資料時,問自己兩個問題:
-
1:59 - 2:02資料量是否充足到能夠正確地訓練電腦?
-
2:02 - 2:07以及,這些資料是否沒有偏誤,足以代表了所有可能發生的情況與使用者?
-
2:07 - 2:11這就是身為訓練師的你,扮演關鍵角色的地方
-
2:11 - 2:14為電腦提供沒有偏誤的資料,將取決於你的決定
-
2:14 - 2:18這表示要從許多各式各樣的來源,搜集大量的範例
-
2:19 - 2:22記得,當你替機器學習搜集與選擇訓練資料時
-
2:22 - 2:27實際上,你正在對演算法進行編寫與設計,使用的是訓練資料而不是程式碼
-
2:27 - 2:30「資料就等同於程式碼」
-
2:30 - 2:35你提供的資料品質越好,電腦的學習效果就越好
- Title:
- AI: Training Data & Bias
- Description:
-
more » « less
The most important aspect of Machine Learning is what data is used to train it. Find out how training data affects a machine's predictions and why biased data can lead to biased decisions.
Start learning at http://code.org/
Stay in touch with us!
• on Twitter https://twitter.com/codeorg
• on Facebook https://www.facebook.com/Code.org
• on Instagram https://instagram.com/codeorg
• on Tumblr https://blog.code.org
• on LinkedIn https://www.linkedin.com/company/code-org
• on Google+ https://google.com/+codeorg - Video Language:
- English
- Team:
Code.org
- Project:
- How AI Works
- Duration:
- 02:41
| 宥盈 王 edited Chinese, Traditional subtitles for AI: Training Data & Bias | ||
|
毓賢 方 edited Chinese, Traditional subtitles for AI: Training Data & Bias | |
| TranslateByHumans edited Chinese, Traditional subtitles for AI: Training Data & Bias |
