Chinese, Simplified subtitles

← Parsing CSV Files - Data Wranging with MongoDB

Get Embed Code
4 Languages

Showing Revision 1 created 08/24/2016 by Udacity Robot.

  1. 我们终于可以进行数据再加工了
  2. 我们来看一下在 Python 中如何解析 CSV 文件
  3. 在这里 我们要将 CSV 数据读入我们的程序
  4. 并为文件中的每一项创建一个字典
  5. 你可能会问 我们为什么要这样做?
  6. 为什么不直接用电子表格应用打开文件?
  7. 其中一个原因是因为文件过大 可能有几十 甚至几百兆
  8. 在 Excel 等电子表格应用中打开
  9. 速度会非常慢 效率也很低 有时甚至是不可能的
  10. 你的应用所完成的软件任务就相当于这个
  11. 我们以编程方式来处理表格数据的另一个原因是
  12. 因为 我们需要处理的文件可能有很多
  13. 所以 我们根本不可能
  14. 在电子表格应用中手动处理
  15. 让我们看一下这里的代码
  16. 可以看到 我们这里有个解析文件应用
  17. 在这个练习中
  18. 我们仍然使用披头士的唱片数据
  19. 你将使用已给代码中的解析文件函数
  20. 你的任务就是利用 Python 的 split 函数
  21. 将每一行解析成字典
  22. 在每一个字典中 字段名是关键字
  23. 每一行的值是这些关键字的值
  24. 你需要将这些字典生成数组
  25. 记住 每一项都要有相应的字典
  26. 然后 你需要在解析文件函数中返回这个数组
  27. 最后一点要说明的是 不要处理整个文件
  28. 你应该只解析文件的前十行
  29. 如果你的解析对象超出数据集的前十行
  30. 你就会遇到麻烦
  31. 由于这是我们这节课的第一个练习
  32. 我来讲一下这里的测试函数
  33. 我们为你提供了测试函数
  34. 以方便你测试你运行的解析文件是否正确
  35. 这个代码会调用解析文件函数
  36. 并从解析文件中抽取结果样本
  37. 检查其是否是预期值
  38. 当你提交你的程序时
  39. 我们可能会在不同的数据集上运行一些其它测试代码