Chinese, Simplified subtitles

← Plotting in Python

Get Embed Code
5 Languages

Showing Revision 1 created 05/09/2014 by 秀隆 杨.

  1. 现在,我们已经知道得太多了,比如,怎样去
  2. 将信息进行可视化,以及去达到
  3. 有效可视化程度。但目前为止,我们还没有讨论过,你该如何去
  4. 真正地把你的想法画出来,(用手上的工具)把它们画出来
  5. 通过笔和纸。已经有很多用于制图的python程序包,最有名的是Matplotlib
  6. 通过笔和纸。已经有很多用于制图的python程序包,最有名的是Matplotlib
  7. 不过在本课中,我要介绍另一种python绘图的标准库,ggplot,
    Matplotlib. For this course, however, I'd like to go over
  8. 不过在本课中,我要介绍另一种python绘图的标准库,ggplot,
  9. 它沿用了R语言的ggplot2 的语法。
  10. 既然 Matplotlib 得到了广泛的应用,为什么我们却
  11. 使用这个ggplot呢,好吧,为什么用它,
  12. 我给出理由。1,它的绘制效果
  13. 比起 Matplotlib 要更美观一些。二,
  14. 它体现了一种非常有趣的概念,
  15. 叫做图形的语法,简单来说,这个概念就是指
    grammar of graphics, which basically claims that there's a
  16. 在语法中要能体现统计图的各个图形组成成分。
  17. ggplot 中的gg 实际上就是图形的语法。不仅如何,它还能很好地配合
  18. ggplot 中的gg 实际上就是图形的语法。不仅如何,它还能很好地配合
  19. pandas 的DataFrames 的使用,这个 DataFrame 之前我们有使用过了,
  20. 现在,我简要地阐述下图形语法内部的思想。图表可以表达一定信息,
  21. 现在,我简要地阐述下图形语法内部的思想。图表可以表达一定信息,
  22. 利用的是它们美学设计,比如两个坐标系。
  23. 图表里的元素都是几何图形,比如点线面。
  24. 图表里的元素都是几何图形,比如点线面。
  25. 一些图形有自己的美学属性,
  26. 比如大小,或是颜色。
  27. 对于用ggplot 照着图形语法进行绘图,你可以把它看作是向图表上添加图层。
  28. 对于用ggplot 照着图形语法进行绘图,你可以把它看作是向图表上添加图层。
  29. 绘图第一步,无疑,是先准备整个基本图表(的框)。
  30. 绘图第一步,无疑,是先准备整个基本图表(的框)。
  31. 它将作为我们使用的画布。
  32. 调用方式ggplot(data, aes(xvar, yvar))
  33. 这里的data(变量)是一个DataFrame的数据类型,xvar和yvar则是
  34. 这个dataframe里的两列。所以,我们在这里调用了ggplot, 数据的
  35. 这个dataframe里的两列。所以,我们在这里调用了ggplot, 数据的
  36. 来源就是这个data变量(dataframe类型)
  37. 要绘制(的对象)的数量则是由
  38. xvar yvar控制。比如,Aadhaar中的区域和注册用户人数,
  39. 又或是球队与运动员的数目,
  40. 这类的数据。所以,来看看我们已经做了什么,
  41. 好,已经调用了ggplot, 刚刚有说过,数据源(data变量)
  42. 使用的是pandas的dataframe数据类型,我们并不使用到data里的全部数据,
  43. 目前,我们只使用xvar 和 yvar 这两列。
  44. 假设一列是地区名,另一列是Aadhaar登记人数,这些数据都在
  45. 我们的Aadhaar 数据里面; 也可以假设为球队和总的球员人数,
  46. 这些数据则是我们的棒球集里;反正数据就是这样的。
  47. 好啦,我已经废话很多了,
  48. 现在已经得到了一张图表,把xvar映射到了x轴上,
  49. yvar映射到y轴上了,但我们还没有
  50. 确认使用哪种几何图形来表示数据。
  51. 那么,如果我们这样写,+geom_point 写到后面,
  52. 就得到一张散点图。 如果我们
  53. 再来加一句 +geom_line, 好,
  54. 每两点之间就会用直线连起来。接下来,
  55. 我们给这些点着上特别的颜色。
  56. 传参数 color="coral" 给 geom_point,
  57. 同样也把参数 color="coral" 传给 geom_line,
  58. 做完这些之后,点和线都的颜色都变coral 了,珊瑚色。
  59. 做完这些之后,点和线都的颜色都变coral 了,珊瑚色。
  60. OK,我们用ggplot来绘图的第二步就告一段落了,
  61. 主要是去为数据选择几何图形。
  62. 最后一步,则是添加标记,这样图表才有文字说明,
  63. 最后一步,则是添加标记,这样图表才有文字说明,
  64. 比如一个标题,x轴,y轴。这个和添加点线的方法很是相近,
  65. 比如一个标题,x轴,y轴。这个和添加点线的方法很是相近,
  66. +ggtitle('title'), +xlab('x-label')
  67. 会显示x-label,+ylab('y-label'),会显示y-label,
  68. 会显示x-label,+ylab('y-label'),会显示y-label,
  69. 会显示x-label,+ylab('y-label'),会显示y-label,现在再用
    an x-label. And a ylab to do the same。
  70. 用print来处理整个命令。然后,我就得到了
  71. 一个python绘制出来的图表了。如何, 你是不是想亲手一试呢?
  72. 一个python绘制出来的图表了。如何, 你是不是想亲手一试呢?