Return to Video

Plotting in Python

  • 0:00 - 0:02
    现在,我们已经知道得太多了,比如,怎样去
  • 0:02 - 0:05
    将信息进行可视化,以及去达到
  • 0:05 - 0:09
    有效可视化程度。但目前为止,我们还没有讨论过,你该如何去
  • 0:09 - 0:12
    真正地把你的想法画出来,(用手上的工具)把它们画出来
  • 0:12 - 0:15
    通过笔和纸。已经有很多用于制图的python程序包,最有名的是Matplotlib
  • 0:15 - 0:18
    通过笔和纸。已经有很多用于制图的python程序包,最有名的是Matplotlib
  • 0:18 - 0:22
    不过在本课中,我要介绍另一种python绘图的标准库,ggplot,
    Matplotlib. For this course, however, I'd like to go over
  • 0:22 - 0:26
    不过在本课中,我要介绍另一种python绘图的标准库,ggplot,
  • 0:26 - 0:29
    它沿用了R语言的ggplot2 的语法。
  • 0:29 - 0:32
    既然 Matplotlib 得到了广泛的应用,为什么我们却
  • 0:32 - 0:35
    使用这个ggplot呢,好吧,为什么用它,
  • 0:35 - 0:39
    我给出理由。1,它的绘制效果
  • 0:39 - 0:42
    比起 Matplotlib 要更美观一些。二,
  • 0:42 - 0:45
    它体现了一种非常有趣的概念,
  • 0:45 - 0:48
    叫做图形的语法,简单来说,这个概念就是指
    grammar of graphics, which basically claims that there's a
  • 0:48 - 0:52
    在语法中要能体现统计图的各个图形组成成分。
  • 0:52 - 0:54
    ggplot 中的gg 实际上就是图形的语法。不仅如何,它还能很好地配合
  • 0:54 - 0:58
    ggplot 中的gg 实际上就是图形的语法。不仅如何,它还能很好地配合
  • 0:58 - 1:00
    pandas 的DataFrames 的使用,这个 DataFrame 之前我们有使用过了,
  • 1:00 - 1:03
    现在,我简要地阐述下图形语法内部的思想。图表可以表达一定信息,
  • 1:03 - 1:06
    现在,我简要地阐述下图形语法内部的思想。图表可以表达一定信息,
  • 1:06 - 1:11
    利用的是它们美学设计,比如两个坐标系。
  • 1:11 - 1:13
    图表里的元素都是几何图形,比如点线面。
  • 1:13 - 1:16
    图表里的元素都是几何图形,比如点线面。
  • 1:17 - 1:19
    一些图形有自己的美学属性,
  • 1:19 - 1:22
    比如大小,或是颜色。
  • 1:22 - 1:25
    对于用ggplot 照着图形语法进行绘图,你可以把它看作是向图表上添加图层。
  • 1:25 - 1:28
    对于用ggplot 照着图形语法进行绘图,你可以把它看作是向图表上添加图层。
  • 1:28 - 1:31
    绘图第一步,无疑,是先准备整个基本图表(的框)。
  • 1:31 - 1:33
    绘图第一步,无疑,是先准备整个基本图表(的框)。
  • 1:33 - 1:36
    它将作为我们使用的画布。
  • 1:36 - 1:41
    调用方式ggplot(data, aes(xvar, yvar))
  • 1:43 - 1:47
    这里的data(变量)是一个DataFrame的数据类型,xvar和yvar则是
  • 1:47 - 1:50
    这个dataframe里的两列。所以,我们在这里调用了ggplot, 数据的
  • 1:50 - 1:54
    这个dataframe里的两列。所以,我们在这里调用了ggplot, 数据的
  • 1:54 - 1:56
    来源就是这个data变量(dataframe类型)
  • 1:56 - 1:58
    要绘制(的对象)的数量则是由
  • 1:58 - 2:04
    xvar yvar控制。比如,Aadhaar中的区域和注册用户人数,
  • 2:04 - 2:08
    又或是球队与运动员的数目,
  • 2:08 - 2:11
    这类的数据。所以,来看看我们已经做了什么,
  • 2:11 - 2:14
    好,已经调用了ggplot, 刚刚有说过,数据源(data变量)
  • 2:14 - 2:17
    使用的是pandas的dataframe数据类型,我们并不使用到data里的全部数据,
  • 2:17 - 2:21
    目前,我们只使用xvar 和 yvar 这两列。
  • 2:21 - 2:24
    假设一列是地区名,另一列是Aadhaar登记人数,这些数据都在
  • 2:24 - 2:27
    我们的Aadhaar 数据里面; 也可以假设为球队和总的球员人数,
  • 2:27 - 2:30
    这些数据则是我们的棒球集里;反正数据就是这样的。
  • 2:30 - 2:33
    好啦,我已经废话很多了,
  • 2:33 - 2:35
    现在已经得到了一张图表,把xvar映射到了x轴上,
  • 2:35 - 2:39
    yvar映射到y轴上了,但我们还没有
  • 2:39 - 2:41
    确认使用哪种几何图形来表示数据。
  • 2:41 - 2:45
    那么,如果我们这样写,+geom_point 写到后面,
  • 2:45 - 2:48
    就得到一张散点图。 如果我们
  • 2:48 - 2:51
    再来加一句 +geom_line, 好,
  • 2:51 - 2:55
    每两点之间就会用直线连起来。接下来,
  • 2:55 - 2:58
    我们给这些点着上特别的颜色。
  • 2:58 - 3:02
    传参数 color="coral" 给 geom_point,
  • 3:02 - 3:04
    同样也把参数 color="coral" 传给 geom_line,
  • 3:04 - 3:07
    做完这些之后,点和线都的颜色都变coral 了,珊瑚色。
  • 3:07 - 3:10
    做完这些之后,点和线都的颜色都变coral 了,珊瑚色。
  • 3:10 - 3:14
    OK,我们用ggplot来绘图的第二步就告一段落了,
  • 3:14 - 3:17
    主要是去为数据选择几何图形。
  • 3:18 - 3:20
    最后一步,则是添加标记,这样图表才有文字说明,
  • 3:20 - 3:23
    最后一步,则是添加标记,这样图表才有文字说明,
  • 3:23 - 3:28
    比如一个标题,x轴,y轴。这个和添加点线的方法很是相近,
  • 3:28 - 3:30
    比如一个标题,x轴,y轴。这个和添加点线的方法很是相近,
  • 3:30 - 3:34
    +ggtitle('title'), +xlab('x-label')
  • 3:34 - 3:39
    会显示x-label,+ylab('y-label'),会显示y-label,
  • 3:39 - 3:41
    会显示x-label,+ylab('y-label'),会显示y-label,
  • 3:41 - 3:44
    会显示x-label,+ylab('y-label'),会显示y-label,现在再用
    an x-label. And a ylab to do the same。
  • 3:44 - 3:48
    用print来处理整个命令。然后,我就得到了
  • 3:48 - 3:51
    一个python绘制出来的图表了。如何, 你是不是想亲手一试呢?
  • 3:51 - 3:54
    一个python绘制出来的图表了。如何, 你是不是想亲手一试呢?
Title:
Plotting in Python
Description:

more » « less
Video Language:
English
Team:
Udacity
Project:
ud359: Intro to Data Science
Duration:
03:55

Chinese, Simplified subtitles

Revisions