Return to Video

Heat Maps - Data Analysis with R

  • 0:00 - 0:03
    A última plotagem que faremos para este curso é chamada de
  • 0:03 - 0:05
    mapa de calor. Para o nosso conjunto de dados, queremos exibir
  • 0:05 - 0:09
    cada combinação de gene e caso de amostra, a diferença na expressão
  • 0:09 - 0:13
    do gene e a amostra da linha de base. Queremos mostrar combinações
  • 0:13 - 0:17
    em que um gene é muito expressado em vermelho e combinações em que
  • 0:17 - 0:20
    é pouco expressado em azul. Este é o código para fazer o
  • 0:20 - 0:23
    mapa de calor. Primeiro, vamos executar tudo isso para
  • 0:23 - 0:26
    transformar nossos dados em um formato longo. Em seguida, vamos apenas executar
  • 0:26 - 0:29
    nosso código ggplot usando o geom geom_tile. Esta
  • 0:29 - 0:32
    última linha nos dará um gradiente de escala.
  • 0:32 - 0:34
    E vamos usar as cores do azul ao vermelho.
  • 0:34 - 0:36
    Vejamos qual será a aparência da saída. Este é o
  • 0:36 - 0:40
    nosso mapa de calor. Mesmo com uma exibição tão densa, não
  • 0:40 - 0:43
    estamos vendo todos os dados. Em particular, estamos apenas
  • 0:43 - 0:46
    mostrando os primeiros 200 genes. Esses são 200 genes de mais de
  • 0:46 - 0:50
    6.000. E como esse conjunto de dados foi produzido,
  • 0:50 - 0:53
    os conjuntos de dados genômicos desse tipo, às vezes chamados de
  • 0:53 - 0:57
    microdados, só estão ficando maiores e mais complexos.
  • 0:57 - 1:00
    O mais interessante é que outros conjuntos de dados também
  • 1:00 - 1:03
    se parecem com isso. Por exemplo, empresas de Internet executam uma grande
  • 1:03 - 1:07
    quantidade de experimentos aleatórios. Nas versões mais simples, os usuários
  • 1:07 - 1:10
    são atribuídos aleatoriamente a um tratamento, como uma nova
  • 1:10 - 1:12
    versão de um site ou algum tipo de novo
  • 1:12 - 1:15
    recurso ou produto ou uma condição de controle. Dessa forma, a
  • 1:15 - 1:18
    diferença no resultado entre o tratamento e o controle pode
  • 1:18 - 1:21
    ser computada para várias métricas de interesse.
  • 1:21 - 1:23
    Em muitas situações, pode haver centenas ou
  • 1:23 - 1:26
    milhares de experimentos e centenas de métricas. Esses dados
  • 1:26 - 1:28
    são muito semelhantes aos dados genômicos de algumas
  • 1:28 - 1:31
    maneiras. Por isso que a plotagem máxima útil de
  • 1:31 - 1:34
    todos os dados nem sempre se aplica a um
  • 1:34 - 1:36
    conjunto de dados como funcionou na maior parte deste curso.
タイトル:
Heat Maps - Data Analysis with R
Video Language:
English
Team:
Udacity
プロジェクト:
UD651: Exploratory Data Analysis
Duration:
01:37

Portuguese, Brazilian subtitles

改訂 Compare revisions