< Return to Video

AI: Training Data & Bias

  • 0:07 - 0:12
    機器學習的表現很依賴你所輸入的訓練資料(的品質)
  • 0:12 - 0:16
    因此,使用巨量且高品質的資料,非常非常重要!
  • 0:17 - 0:22
    既然,資料如此重要,就十分值得問清楚:訓練資料是從哪裡來的呢?
  • 0:22 - 0:26
    一般來說,電腦會從你和我這樣的普通人,來搜集訓練資料
  • 0:26 - 0:28
    我們不需要做額外的事情。
  • 0:28 - 0:31
    影片串流服務可能會持續追蹤你觀看的影片,
  • 0:32 - 0:36
    然後就能在資料中識別出模式,
    並向你推薦可能會想觀看的下一部影片
  • 0:37 - 0:41
    其他情況下,則會直接請你提供協助
  • 0:41 - 0:44
    例如,網站會要請你標記出街道號誌和照片
  • 0:44 - 0:49
    你就是正在幫電腦提供訓練資料
    幫助它學會看路,甚至學會駕駛車輛
  • 0:52 - 0:56
    醫學研究人員可以使用醫學圖片作為訓練資料
  • 0:56 - 0:59
    來教會電腦如何識別並診斷疾病
  • 1:00 - 1:06
    機器學習需要成千上萬張圖片,以及來自於醫生的訓練指導
  • 1:06 - 1:10
    先知道要查看什麼,才能正確地診斷疾病
  • 1:11 - 1:16
    即便有很大量的範例,電腦的預測仍有可能出錯
  • 1:16 - 1:21
    如果僅收集男性患者的X光圖片,
    預測的結果僅可能適用於男性
  • 1:22 - 1:26
    當需要對女性X光圖片做判讀時,
    電腦可能就無法對疾病進行診斷。
  • 1:27 - 1:31
    這種訓練資料中的盲點,就會造成所謂的偏差(bias)
  • 1:31 - 1:36
    帶有偏差的資料,會偏向某些狀況,而降低或排除了其他狀況。
  • 1:37 - 1:42
    像是:訓練資料的收集方式、執行的人員、以及資料的輸入方式
  • 1:42 - 1:45
    人爲偏見難免會隱含於資料當中
  • 1:46 - 1:51
    從帶有偏誤的資料進行學習,電腦可能會做出帶有偏誤的預測
  • 1:51 - 1:54
    無論訓練電腦的人員,是否察覺到這一點
  • 1:55 - 1:58
    因此,當你查看訓練資料時,問自己兩個問題:
  • 1:59 - 2:02
    資料量是否充足到能夠正確地訓練電腦?
  • 2:02 - 2:07
    以及,這些資料是否沒有偏誤,足以代表了所有可能發生的情況與使用者?
  • 2:07 - 2:11
    這就是身為訓練師的你,扮演關鍵角色的地方
  • 2:11 - 2:14
    為電腦提供沒有偏誤的資料,將取決於你的決定
  • 2:14 - 2:18
    這表示要從許多各式各樣的來源,搜集大量的範例
  • 2:19 - 2:22
    記得,當你替機器學習搜集與選擇訓練資料時
  • 2:22 - 2:27
    實際上,你正在對演算法進行編寫與設計,使用的是訓練資料而不是程式碼
  • 2:27 - 2:30
    「資料就等同於程式碼」
  • 2:30 - 2:35
    你提供的資料品質越好,電腦的學習效果就越好
Title:
AI: Training Data & Bias
Description:

The most important aspect of Machine Learning is what data is used to train it. Find out how training data affects a machine's predictions and why biased data can lead to biased decisions.

Start learning at http://code.org/

Stay in touch with us!
• on Twitter https://twitter.com/codeorg
• on Facebook https://www.facebook.com/Code.org
• on Instagram https://instagram.com/codeorg
• on Tumblr https://blog.code.org
• on LinkedIn https://www.linkedin.com/company/code-org
• on Google+ https://google.com/+codeorg

more » « less
Video Language:
English
Team:
Code.org
Project:
How AI Works
Duration:
02:41

Chinese, Traditional subtitles

Revisions Compare revisions