YouTube

Got a YouTube account?

New: enable viewer-created translations and captions on your YouTube channel!

Chinese, Simplified subtitles

← Pandas - Intro to Data Science

Get Embed Code
5 Languages

Showing Revision 9 created 09/17/2016 by Udacity Robot.

  1. 我们对操纵数据已有所了解
  2. 现在了解如何使用 Pandas 存储并引用这些数据
  3. Pandas 中的数据经常包含在名为数据框架(data frame)的结构中
  4. 数据框架是已标记的二维数据结构
  5. 可让你根据需要选择不同类型的列
  6. 类型有字符串、整数、浮点数或布尔值
  7. 你可以将数据框架看作 Excel 电子表格
  8. 稍后我们会介绍如何创建数据框架
  9. 这里有一个数据框架示例
  10. 使用数据描述了泰坦尼克号上的乘客
  11. 以及他们在泰坦尼克号撞击冰山悲剧中的幸存情况
  12. 你要将这个数据集用于 1 号项目
  13. 注意 这里有很多不同的列
  14. 姓名、年龄、票价和是否幸存
  15. 而且这些列的数据类型各不相同
  16. 年龄全部是整数
  17. 是否幸存全是布尔值等等
  18. 另外还有一些非数字 (NaN) 条目
  19. 出现这种情况是因为我们没有指定值
  20. 这个数据框架是如何创建的呢?
  21. 首先 我会创建一个名为 d 的 Python 字典
  22. 其中的每个键都是一列的名称 而对应的值则是一个 Python 序列
  23. 在这个序列中 首先我会传递包含实际数据框架值的数组
  24. 然后传递我希望这些值到达的目标索引数组
  25. 注意 如果票价中包含非数字的值
  26. 那么我仅会提供三个实际的值 但随后会提供三个对应的索引值
  27. 字典创建好后 我会将其作为参数传递至 DataFrame 函数
  28. 创建我的实际数据框架
  29. 我将这个数据框架称为 df
  30. 你会发现 我们在此处呈现的数据框架与
  31. 我们在本节课之初在平板电脑上呈现的框架一致