Return to Video

Pandas - Intro to Data Science

  • 0:01 - 0:03
    我们对操纵数据已有所了解
  • 0:03 - 0:06
    现在了解如何使用 Pandas 存储并引用这些数据
  • 0:07 - 0:12
    Pandas 中的数据经常包含在名为数据框架(data frame)的结构中
  • 0:12 - 0:16
    数据框架是已标记的二维数据结构
  • 0:16 - 0:18
    可让你根据需要选择不同类型的列
  • 0:18 - 0:25
    类型有字符串、整数、浮点数或布尔值
  • 0:26 - 0:30
    你可以将数据框架看作 Excel 电子表格
  • 0:30 - 0:32
    稍后我们会介绍如何创建数据框架
  • 0:32 - 0:35
    这里有一个数据框架示例
  • 0:35 - 0:39
    使用数据描述了泰坦尼克号上的乘客
  • 0:39 - 0:41
    以及他们在泰坦尼克号撞击冰山悲剧中的幸存情况
  • 0:43 - 0:45
    你要将这个数据集用于 1 号项目
  • 0:45 - 0:48
    注意 这里有很多不同的列
  • 0:48 - 0:51
    姓名、年龄、票价和是否幸存
  • 0:51 - 0:54
    而且这些列的数据类型各不相同
  • 0:54 - 0:55
    年龄全部是整数
  • 0:55 - 0:57
    是否幸存全是布尔值等等
  • 0:58 - 1:01
    另外还有一些非数字 (NaN) 条目
  • 1:01 - 1:03
    出现这种情况是因为我们没有指定值
  • 1:03 - 1:06
    这个数据框架是如何创建的呢?
  • 1:06 - 1:10
    首先 我会创建一个名为 d 的 Python 字典
  • 1:10 - 1:14
    其中的每个键都是一列的名称 而对应的值则是一个 Python 序列
  • 1:14 - 1:18
    在这个序列中 首先我会传递包含实际数据框架值的数组
  • 1:18 - 1:20
    然后传递我希望这些值到达的目标索引数组
  • 1:22 - 1:27
    注意 如果票价中包含非数字的值
  • 1:27 - 1:31
    那么我仅会提供三个实际的值 但随后会提供三个对应的索引值
  • 1:31 - 1:34
    字典创建好后 我会将其作为参数传递至 DataFrame 函数
  • 1:34 - 1:37
    创建我的实际数据框架
  • 1:37 - 1:38
    我将这个数据框架称为 df
  • 1:38 - 1:42
    你会发现 我们在此处呈现的数据框架与
  • 1:42 - 1:44
    我们在本节课之初在平板电脑上呈现的框架一致
タイトル:
Pandas - Intro to Data Science
概説:

more » « less
Video Language:
English
Team:
Udacity
プロジェクト:
ud359: Intro to Data Science
Duration:
01:44

Chinese, Simplified subtitles

改訂 Compare revisions