Return to Video

Pandas Vectorized Methods - Intro to Data Science

  • 0:02 - 0:06
    Pandas 还可让你以向量化的方式逐项在数据框架上进行操作
  • 0:07 - 0:09
    以向量化的方式在数据框架上进行操作是什么意思?
  • 0:10 - 0:12
    假设我们有以下数据框架
  • 0:12 - 0:15
    这个数据框架有2列 分别是 1 和 2
  • 0:17 - 0:19
    有4行 分别是 a、b、c 和 d
  • 0:21 - 0:23
    所有值均为整数
  • 0:23 - 0:24
    我们可以调用适用的数据框架
  • 0:24 - 0:27
    向我们提供参数总和任意函数
  • 0:27 - 0:28
    在本例中
  • 0:28 - 0:33
    numpy.mean 意味着在每个自成一列的向量上执行该函数
  • 0:33 - 0:36
    因此 当我们调用 df.apply numpy.mean 时
  • 0:36 - 0:39
    得到的结果是 df 中每列的平均值
  • 0:39 - 0:41
    这本身就是一个新的数据框架
  • 0:41 - 0:45
    另外还有一些操作不能通过这种方式向量化
  • 0:45 - 0:48
    例如提取 numpy 数组作为输入数据
  • 0:48 - 0:50
    然后返回其他数组或值
  • 0:51 - 0:54
    在本例中 我们还可以在特定列上调用映射
  • 0:54 - 0:56
    或对整个数据框架应用映射
  • 0:58 - 1:01
    这些方法将接受传入一个值然后返回
  • 1:01 - 1:03
    一个值的函数
  • 1:03 - 1:08
    例如 假设 df one.map lambda x
  • 1:08 - 1:09
    x 大于或等于 1
  • 1:09 - 1:13
    这会使系统浏览 1 列中的每个值
  • 1:13 - 1:17
    然后判断该值大于还是等于 1
  • 1:17 - 1:24
    如果我们调用 df.applymap lambda x 而且 x 大于或等于 1
  • 1:24 - 1:28
    那么系统会针对数据框架中的每个值调用同一个函数
  • 1:28 - 1:30
    与只在 one 列调用相反
タイトル:
Pandas Vectorized Methods - Intro to Data Science
概説:

more » « less
Video Language:
English
Team:
Udacity
プロジェクト:
ud359: Intro to Data Science
Duration:
01:32

Chinese, Simplified subtitles

改訂 Compare revisions