Return to Video

Heat Maps - Data Analysis with R

  • 0:00 - 0:03
    我们为该课程制作的最后一张图称为热图
  • 0:03 - 0:05
    对于我们的数据集 我们需要显示
  • 0:05 - 0:09
    基因与样本的每个组合
  • 0:09 - 0:13
    基因表达差异和基线样品
  • 0:13 - 0:17
    我们希望在用蓝色表达在组合中显示用红色表达的基因组合
  • 0:17 - 0:20
    这是创建热图的代码
  • 0:20 - 0:23
    首先 我们将运行所有代码
  • 0:23 - 0:26
    以便将我们的数据融化成长格式
  • 0:26 - 0:29
    然后我们使用几何名称运行 ggplot 代码
  • 0:29 - 0:32
    现在 最后一行将为我们提供灰度梯度
  • 0:32 - 0:34
    我们将使用从蓝色到红色的颜色
  • 0:34 - 0:36
    因此 让我们看看输出看起来像什么
  • 0:36 - 0:40
    这是我们的热图 即使有这样密集的显示
  • 0:40 - 0:43
    我们也不调查所有数据
  • 0:43 - 0:46
    只显示前 200 个基因
  • 0:46 - 0:50
    这是 6000 多个基因中的 200 个 并且由于生成该数据集
  • 0:50 - 0:53
    这种类型的基因组数据集
  • 0:53 - 0:57
    有时调用微数据越来越大和越来越复杂
  • 0:57 - 1:00
    最有趣的是 其它据集看起来也像这样
  • 1:00 - 1:03
    例如 互联网公司进行大量随机实验
  • 1:03 - 1:07
    在最简单的版本中
  • 1:07 - 1:10
    将用户随机分配给
  • 1:10 - 1:12
    类似一个新版本的网站或者一些
  • 1:12 - 1:15
    新功能或产品或控制条件来处理
  • 1:15 - 1:18
    然后 可以为大量感兴趣的指标
  • 1:18 - 1:21
    计算处理和控制之间的结果
  • 1:21 - 1:23
    在许多情况下
  • 1:23 - 1:26
    可能有数百或数千个实验和数百个指标
  • 1:26 - 1:28
    该数据在某些方面看起来与基因数据非常类似
  • 1:28 - 1:31
    这就是有用最大图的原因
  • 1:31 - 1:34
    所有数据可能并非像本课程的大部分内容那样
  • 1:34 - 1:36
    总是适用于数据集
タイトル:
Heat Maps - Data Analysis with R
Video Language:
English
Team:
Udacity
プロジェクト:
UD651: Exploratory Data Analysis
Duration:
01:37

Chinese, Simplified subtitles

改訂