YouTube

Got a YouTube account?

New: enable viewer-created translations and captions on your YouTube channel!

Chinese, Simplified subtitles

← SBYdqlLgbGk

SBYdqlLgbGk

Get Embed Code
4 Languages

Showing Revision 4 created 04/13/2016 by Udacity Robot.

  1. 我进行的主成分分析刚好是在
  2. 该名为 doPCA 的函数中进行的,
  3. 而且它看起来与我们之前在 scikit-learn 中
  4. 执行的操作很相似。
  5. 您采用了导入语句,
  6. 其实您在该语句中就取得了包含您需要的代码的模块。
  7. 在该案例中,您创建主成分分析,
  8. 进行调整,
  9. 然后将其作为对象返回。
  10. 我要做的是通过该方法获得我的主成分分析。
  11. 而且我可以通过访问其属性提出
  12. 一些非常有趣和重要的问题。
  13. 我们介绍一下这三条线。
  14. 我其实正是借此从 PCA 对象中获取信息。
  15. 第一个是已经介绍过的方差比,它其实是特征值的具体表现形式。
  16. 通过打印此处的该行内容,
  17. 我借此认识到第一个主成分占数据变动的 90%
  18. 或 91%,而第二个主成分的占比约为 9%
  19. 或 10%。
  20. 这些数字都来自该语句。
  21. 然后我要做的第二件事是研究第一个和
  22. 第二个主成分。
  23. 我是从 PCA 对象的成分属性中获得的这些数据,
  24. 也就是说成分就是一份列表,
  25. 一份 Python 列表,其中包含的主成分与
  26. 我通过参数要求的一样多。
  27. 因此在该案例中,我获得了两个主成分,
  28. 然后将其命名为第一个和第二个 pc。
  29. 在之前我们讨论 xy 原始特征空间中
  30. x prime 使用何种方向的小测试中,
  31. 我们使用了打包成向量的两个数字。
  32. 您可以通过这些成分访问该方向信息。
  33. 完成对主成分分析的调整后,
  34. 无论出于何种目的,我都必须要执行数据转换这种操作。
  35. 我会在小测试的启动代码中向您提供该代码。
  36. 我现在的任务是将其可视化。
  37. 第一行是红色。
  38. 我将标绘出第一个主成分,
  39. 该主成分所有点的位置
  40. 以及主成分的方向。
  41. 我通过使用第一个 PC 向量的元素访问该信息。
  42. 然后我会访问蓝绿色或青色的第二个
  43. 主成分,并将初始数据标绘成蓝色。
  44. 然后我会向您展示上色之后的效果,
  45. 然后您可以在小测试中亲自尝试一下。
  46. 您要做的第一件事是打印出特征值。
  47. 请记住,该值可以解释方差比信息。
  48. 然后第二件事是画出散点图,
  49. 该图看起来应该是这样的。
  50. 请注意,红色代表第一个主成分的方向,
  51. 希望您能精确地猜到。
  52. 当然直觉上好像位置不错。
  53. 青色预制垂直,
  54. 而蓝色是初始数据点。
  55. 我要补充的是肉眼看起来,红色和青色
  56. 并不是绝对垂直,
  57. 看起来好像不是 90 度角。
  58. 但请记住我们的轴有不同的刻度。
  59. 该轴会一直延伸到 1000 万,
  60. y 轴延伸程度不到它的一半,仅为约 400 万。
  61. 在现实中,如果我们要均衡地绘图,
  62. 那么该图的长度应该是高度的两倍。
  63. 如果我们完全按照这种方法将其可视化,那么它们就是垂直的。