Chinese, Simplified subtitles

← "Box Plots

Get Embed Code
5 Languages

Showing Revision 2 created 08/29/2016 by Udacity Robot.

 1. 看起来女性的好友数平均比男性稍多
 2. 因为我看到这个中位数线稍高一些
 3. 这就是这条黑线的含义
 4. 它代表女性和男性好友数的中位数或者中间 50%
 5. 现在这个差异不是很大
 6. 我们来放大仔细看看
 7. 这个框是女性 这个框是男性
 8. 代表我们样本中数值的中间 50%
 9. 我认为我们应该再放大仔细看看
 10. 我们应该考虑低于 250 的所有值
 11. 现在这里没有具体的选择 我只是选择看起来合乎情理的方面
 12. 因为数据的大部分都在下面
 13. 运行此代码以后 我们可以看到大部分的用户好友数
 14. 对于男性中间 50% 以及女性中间 50% 是相似的
 15. 只是我们的女性好友数稍高一些
 16. 我们来看看实际数值 将数值与我们在箱线图中看到的进行比较
 17. 通过使用 by 命令观察这些值
 18. 按照性别划分运行好友数汇总
 19. 首先 我想包含好友数
 20. 这是要进行汇总的变量
 21. 我要按照性别进行划分 然后进行汇总
 22. 运行这个代码 得到表输出 显示出两种性别的
 23. 最小和最大值 以及核心区块
 24. 女性的第一个核心区块是 37 就在我们的图形中
 25. 第三个四分位或者 75% 标记
 26. 位于 244 一直上到这里
 27. 这意味着 75% 的女性好友数低于 244
 28. 或者换一种说法就是
 29. 25% 的女性好友数大于 244 人
 30. 对于男性同样 可以看出第一个四分位
 31. 和第三个四分位符合箱线图
 32. 现在你可以还记得 我们在以前的答案视频中使用 coord_cartesian
 33. 这样做的目的就是
 34. 表输出将符合我们的箱线图
 35. 如果我们只在 qplot 中使用 ylim 参数
 36. 将得到不同的四分位 与我们的图形不符
 37. 这是你在使用 R 时应该明白的一个微妙差别
 38. 现在轮到你回答不同的问题 平均来看
 39. 我们的样本中谁发起好友数更多?男性还是女性?
 40. 使用我们刚才介绍的方法
 41. 写出你获得答案的过程
 42. 第二个问题不会自动评分
 43. 但是重要的是你要知道
 44. 如果将你的分析向别人沟通