Return to Video

Heat Maps

  • 0:00 - 0:03
    このコースで最後に作っていく図は
  • 0:03 - 0:05
    ヒートマップというものです
    このデータ集合では
  • 0:05 - 0:09
    それぞれの遺伝子とサンプルケースの
    組み合わせを表示していきます
  • 0:09 - 0:12
    遺伝子発現と基準のサンプルの違いです
  • 0:12 - 0:16
    遺伝子が過剰発現している組み合わせは赤
  • 0:16 - 0:19
    過少発現している組み合わせは
    青で表示します
  • 0:19 - 0:22
    これがそのヒートマップを作るコードです
  • 0:22 - 0:26
    まずデータをロングフォーマットにするため
    これをすべて実行します
  • 0:26 - 0:29
    そしてジオメトリにgeom_tileを使った
    ggplotのコードだけを実行します
  • 0:29 - 0:32
    この最後の行が目盛の勾配を作ります
  • 0:32 - 0:34
    青と赤を使います
  • 0:34 - 0:36
    出力がどうなるか見てみましょう
  • 0:36 - 0:40
    これがヒートマップです
    こんなにぎっしり詰まって表示されていても
  • 0:40 - 0:43
    すべてのデータを見ているのではありません
  • 0:43 - 0:46
    最初の200の遺伝子のみを見ています
  • 0:46 - 0:50
    6,000以上ある中の200の遺伝子です
    このデータ集合が作られて以降
  • 0:50 - 0:55
    この種類のゲノムデータ集合は
    マイクロアレイデータと呼ばれることもありますが
  • 0:55 - 0:57
    大きく複雑化していくばかりです
  • 0:57 - 1:00
    最も面白いのが他のデータ集合も
  • 1:00 - 1:03
    このように見えるところです
    例えばインターネット会社は
  • 1:03 - 1:07
    多くの無作為な実験を行っています
    最もシンプルなケースでは
  • 1:07 - 1:11
    ユーザに対し無作為に
    新しいバージョンのWebサイトや
  • 1:11 - 1:15
    何か新しい機能や製品などの
    待遇や対照条件が割り当てられます
  • 1:15 - 1:18
    そして作りたい行列の数で
  • 1:18 - 1:21
    待遇と対照条件の違いの結果が計算されます
  • 1:21 - 1:23
    多くの場合は何百何千の実験と
  • 1:23 - 1:26
    何百もの行列があるでしょう
  • 1:26 - 1:29
    このデータはゲノムデータに
    よく似ている部分があります
  • 1:29 - 1:31
    有用な金言があります データの作図では
  • 1:31 - 1:34
    このコースのデータ集合のほとんどに
    当てはまってきたことが
  • 1:34 - 1:36
    いつも当てはまるわけではありません
タイトル:
Heat Maps
Video Language:
English
Team:
Udacity
プロジェクト:
UD651: Exploratory Data Analysis
Duration:
01:37

Japanese subtitles

改訂