< Return to Video

AI: Training Data & Bias

  • 0:07 - 0:12
    机器学习很依赖于您所输入的
    训练数据
  • 0:12 - 0:16
    因此,使用大量的高质量数据非常重要
  • 0:17 - 0:22
    既然数据如此重要,就有必要询问
    训练数据的来源是哪里了?
  • 0:22 - 0:26
    通常,计算器会从像您和我这样的
    普通人那里收集训练数据
  • 0:26 - 0:28
    而无需我们做任何特别的事情。
  • 0:28 - 0:31
    视频流服务可以跟踪您所观看的内容
    然后识别出模式
  • 0:32 - 0:36
    并以此为依据向您推荐内容
  • 0:37 - 0:43
    在其他情况下
    系统会直接要求您提供帮助
    例如某个网站会要求您分享路标和照片
  • 0:44 - 0:49
    您正在为计算器提供训练数据
    帮助它们学会观察
    并有朝一日学会开车
  • 0:52 - 0:56
    医学研究人员可以使用
    医学图像作为训练数据并教会
  • 0:57 - 1:00
    计算器如何诊断疾病
  • 1:00 - 1:06
    机器学习要求提供成千上万张图像
    并需要一位有经验的医生
  • 1:06 - 1:10
    明确培训方向 才能正确地诊断疾病
  • 1:11 - 1:16
    即便有海量的示例作为参考
    计算器的预测仍可能出现问题
  • 1:16 - 1:21
    如果仅收集男性患者的X射线数据
    则计算器的预测可能仅适用于男性
  • 1:22 - 1:26
    需要对女性X射线数据作诊断时
    可能无法诊断出疾病
  • 1:27 - 1:31
    这种训练数据的盲点会
    造成偏差
  • 1:31 - 1:36
    而带偏差的数据就不能做到一视同仁
  • 1:37 - 1:42
    根据训练数据的收集方式
    收集工作人员以及数据的提供方式
  • 1:42 - 1:45
    对数据造成的
    人为偏见难以避免
  • 1:46 - 1:51
    使用带偏见的数据进行学习
    计算器可能会做出带有偏见的预测
  • 1:51 - 1:54
    甚至训练计算器的人员
    也未曾意识到这一点
  • 1:55 - 1:58
    当查看训练数据时
    询问自己两个问题:
  • 1:59 - 2:02
    这些数据是否充足以准确地训练计算器?
  • 2:02 - 2:07
    并且 这些数据是否代表所有可能发生的情况
    及所有用户而不带有偏见?
  • 2:07 - 2:11
    而您作为培训师
    在此将发挥至关重要的作用
  • 2:11 - 2:14
    为计算器提供无偏见的数据 将取决于您的决定
  • 2:14 - 2:18
    这意味着要从海量的数据来源收集大量示例
  • 2:19 - 2:23
    请谨记,当您为机器学习选择训练数据时
  • 2:23 - 2:27
    您实际上是在对算法进行编程
    区别在于,这时您使用的是训练数据而不是代码
  • 2:27 - 2:30
    训练数据的作用如同代码
  • 2:30 - 2:35
    您所提供的数据质量越高
    计算器将学习得更好
Title:
AI: Training Data & Bias
Description:

The most important aspect of Machine Learning is what data is used to train it. Find out how training data affects a machine's predictions and why biased data can lead to biased decisions.

Start learning at http://code.org/

Stay in touch with us!
• on Twitter https://twitter.com/codeorg
• on Facebook https://www.facebook.com/Code.org
• on Instagram https://instagram.com/codeorg
• on Tumblr https://blog.code.org
• on LinkedIn https://www.linkedin.com/company/code-org
• on Google+ https://google.com/+codeorg

more » « less
Video Language:
English
Team:
Code.org
Project:
How AI Works
Duration:
02:41

Chinese, Simplified subtitles

Revisions Compare revisions