Chinese, Simplified subtitles

← Algorithms Requiring Rescaling Solution - Intro to Machine Learning

Get Embed Code
4 Languages

Showing Revision 6 created 08/16/2016 by Udacity Robot.

  1. Katie 你怎么看的?
  2. 那些是正确答案?
  3. 需要特征缩放的算法时
  4. SVM 和 K-均值聚类
  5. 在支持向量机和 K-均值聚类中
  6. 计算距离时 你其实是在利用一个维度与另一个维度进行交换
  7. 举个例子 就支持向量机而言
  8. 它有一条将距离最大化的分割线
  9. 你在这里计算距离
  10. 而这个计算就是用一个维度与另一个维度进行交换
  11. 如果我们把某一点的增大至其他点的两倍 那么它的数值也会扩大一倍
  12. K-均值聚类也是这样的
  13. 你有一个集群中心
  14. 然后计算各数据点到集群中心的距离
  15. 该距离具有相同的特征
  16. 如果你将一个变量扩大一倍 它的数值也会扩大一倍
  17. 因此 支持向量机和 K-均值聚类
  18. 都会受到特征缩放的影响
  19. Katie 解释一下决策树和线性回归
  20. 它们为什么不受影响?
  21. 决策树并不会呈现对角线 对吧?
  22. 它会呈现出一系列的水平线和垂线
  23. 所以不存在两者的交换
  24. 它只是在不同的方向上进行切割
  25. 在处理某一维度时
  26. 我们不需要考虑另一个维度的情况
  27. 所以 如果把这个方框缩小一半
  28. 也就是对该特征进行缩放
  29. 图中线条的位置会有所变化
  30. 但分割的顺序是一样的
  31. 它是按比例分割的
  32. 所以 两个变量之间不存在交换
  33. 那线性回归呢?
  34. 它的情况相似
  35. 在线性回归中
  36. 每个特征都有一个相应的系数
  37. 这个系数总是与相应的特征同时出现
  38. 特征 A 的变化不会影响到
  39. 特征 B 的系数
  40. 所以它们的分割方式相同
  41. 事实上 如果你把某一变量的变比例扩大一倍
  42. 它的特征会缩小一半
  43. 但它的输出不会有任何变化
  44. 这一点非常有趣 对于某些算法
  45. 我们可以通过缩放特征来改变结果 但另外一些算法则不会受到影响