Chinese, Simplified subtitles

← Intro - Data Wrangling with MongoDB - YouTube

Get Embed Code
6 Languages

Showing Revision 4 created 08/24/2016 by Udacity Robot.

  1. 大家好 我是 Shanon Bradshaw 是 MongoDB 教育部门的经理
  2. MongoDB 就是创建开源 noSQL MongoDB 数据库的公司
  3. 在加入 MongoDB 之前
  4. 我作为一个计算机科学家在学术界和咨询界工作
  5. 我承担了很多不同的数据科学项目
  6. 涉及金融、社交媒体等领域
  7. 这门课是关于数据预处理
  8. 数据科学家们花费了大约70%的时间来做数据预处理
  9. 那么什么是数据的预处理呢?它是一个
  10. 获得、提取、清洗和存储数据的过程
  11. 只有在完成这些过程之后 一切的分析才有意义
  12. 所以如果你对华尔街做量化分析
  13. 你想建一个自动交易模型 你首先需要
  14. 确保你的模型基于可靠的数据
  15. 或者你在写一个地图应用程序 你需要
  16. 确保你的数据准确 不然你很快会发现自己陷入公关灾难
  17. 另外一个例子 如果你在为研究团队做
  18. 一个规模小一点的分析数据 你希望
  19. 保证你的团队可以基于你提供的数据做出决策
  20. 如果你在做任何分析之前 不花费时间来保证你的数据是是好的
  21. 你在之后的分析中就承担了一个浪费时间
  22. 的巨大风险 更糟的是你有可能失去
  23. 基于你数据工作的同事的信任
  24. 这就本末倒置了 所以当我们做数据分析之前
  25. 我们需要先做这所有的数据预处理部分
  26. 这门课程是关于如何
  27. 准备数据 来让我们之后的任何分析都牢固的搭建在
  28. 好的数据的基础上 在这里你将会得到
  29. 一些做小修小补的机会 我们将要锻炼你们的
  30. 黑客肌肉 或者应该说是 数据预处理技术
  31. 我们将会处理很多不同类型的数据 比如说音乐 能源 维基百科
  32. twitter 等 我们还会教给你们如何
  33. 处理你们常见的绝大多数数据格式
  34. 比如说 JSON、XML、CSV、Excel 和 HTML 等 甚至还有一些
  35. 旧系统的文本数据 在课程的后半部分 我们会
  36. 向你们展示如何在 MangoDB 中存储数据 并且使用
  37. 他们来支持分析部分 MongoDB 作为一个强有力的、可拓展的大数据处理工具
  38. 对全世界数据科学家们的重要性在不断地增长
  39. 并且 我们将会以案例学习的形式
  40. 这将让你们将学到的所有碎片组装在一起
  41. 我们很高兴你们来到这个课程 让我们开始吧