Chinese, Simplified subtitles

← Information Gain Calculation Part 10 - Intro to Machine Learning

Get Embed Code
5 Languages

Showing Revision 4 created 08/29/2016 by Udacity Robot.

  1. 当我们根据速度限制进行分拆的时候
  2. 我们就得到了最佳纯度的分支 而这就是我们所要的结果
  3. 所以我们的信息增益就等于1
  4. 我们最初的熵值为1
  5. 我们最后得到的熵值为0
  6. 所以信息增益就等于1
  7. 这是我们所能得到的最好的信息增益
  8. 所以这就是我们应该进行分拆的地方
  9. 我简单画一下这个决策树的草图
  10. 我们看到 在这些速度限制是有效的样本中
  11. 也就是前两排数据
  12. 速度限制的答案是肯定的 则我们在这边得到所有慢速的样本
  13. 另一边 也就是没有速度限制的情况下 所得的结果都是快速的
  14. 那这个问题的计算过程就很简单了
  15. 但我们还是花费了一点时间来完成计算
  16. 但是我希望大家能对这个决策树中的信息增益
  17. 以及它为什么如此重要有更好的理解
  18. 所以说 决策树在进行训练时就是在
  19. 进行这种计算
  20. 它要考虑所有的训练样本以及可使用的所有特性
  21. 然后使用这个信息增益准则来决定对哪个变量
  22. 进行分拆以及如何进行分拆