AI: Training Data & Bias
-
0:07 - 0:12机器学习很依赖于您所输入的
训练数据 -
0:12 - 0:16因此,使用大量的高质量数据非常重要
-
0:17 - 0:22既然数据如此重要,就有必要询问
训练数据的来源是哪里了? -
0:22 - 0:26通常,计算器会从像您和我这样的
普通人那里收集训练数据 -
0:26 - 0:28而无需我们做任何特别的事情。
-
0:28 - 0:31视频流服务可以跟踪您所观看的内容
然后识别出模式 -
0:32 - 0:36并以此为依据向您推荐内容
-
0:37 - 0:43在其他情况下
系统会直接要求您提供帮助
例如某个网站会要求您分享路标和照片 -
0:44 - 0:49您正在为计算器提供训练数据
帮助它们学会观察
并有朝一日学会开车 -
0:52 - 0:56医学研究人员可以使用
医学图像作为训练数据并教会 -
0:57 - 1:00计算器如何诊断疾病
-
1:00 - 1:06机器学习要求提供成千上万张图像
并需要一位有经验的医生 -
1:06 - 1:10明确培训方向 才能正确地诊断疾病
-
1:11 - 1:16即便有海量的示例作为参考
计算器的预测仍可能出现问题 -
1:16 - 1:21如果仅收集男性患者的X射线数据
则计算器的预测可能仅适用于男性 -
1:22 - 1:26需要对女性X射线数据作诊断时
可能无法诊断出疾病 -
1:27 - 1:31这种训练数据的盲点会
造成偏差 -
1:31 - 1:36而带偏差的数据就不能做到一视同仁
-
1:37 - 1:42根据训练数据的收集方式
收集工作人员以及数据的提供方式 -
1:42 - 1:45对数据造成的
人为偏见难以避免 -
1:46 - 1:51使用带偏见的数据进行学习
计算器可能会做出带有偏见的预测 -
1:51 - 1:54甚至训练计算器的人员
也未曾意识到这一点 -
1:55 - 1:58当查看训练数据时
询问自己两个问题: -
1:59 - 2:02这些数据是否充足以准确地训练计算器?
-
2:02 - 2:07并且 这些数据是否代表所有可能发生的情况
及所有用户而不带有偏见? -
2:07 - 2:11而您作为培训师
在此将发挥至关重要的作用 -
2:11 - 2:14为计算器提供无偏见的数据 将取决于您的决定
-
2:14 - 2:18这意味着要从海量的数据来源收集大量示例
-
2:19 - 2:23请谨记,当您为机器学习选择训练数据时
-
2:23 - 2:27您实际上是在对算法进行编程
区别在于,这时您使用的是训练数据而不是代码 -
2:27 - 2:30训练数据的作用如同代码
-
2:30 - 2:35您所提供的数据质量越高
计算器将学习得更好
- Title:
- AI: Training Data & Bias
- Description:
-
more » « less
The most important aspect of Machine Learning is what data is used to train it. Find out how training data affects a machine's predictions and why biased data can lead to biased decisions.
Start learning at http://code.org/
Stay in touch with us!
• on Twitter https://twitter.com/codeorg
• on Facebook https://www.facebook.com/Code.org
• on Instagram https://instagram.com/codeorg
• on Tumblr https://blog.code.org
• on LinkedIn https://www.linkedin.com/company/code-org
• on Google+ https://google.com/+codeorg - Video Language:
- English
- Team:
Code.org
- Project:
- How AI Works
- Duration:
- 02:41
| TranslateByHumans edited Chinese, Simplified subtitles for AI: Training Data & Bias | ||
| TranslateByHumans edited Chinese, Simplified subtitles for AI: Training Data & Bias |