Return to Video

Ordered Factors - Data Analysis with R

  • 0:00 - 0:04
    Vamos examinar essas variáveis fator mais detalhadamente. Por ora,
  • 0:04 - 0:07
    quero chamar sua atenção para a variável age.range
  • 0:07 - 0:10
    bem aqui. Observe que temos uma variável fator
  • 0:10 - 0:13
    com 7 níveis diferentes. Podemos examinar
  • 0:13 - 0:17
    os níveis de uma variável digitando os níveis de comando
  • 0:17 - 0:19
    e depois colocando a variável bem aqui. No console,
  • 0:19 - 0:22
    podemos ver os 7 níveis da variável
  • 0:22 - 0:26
    age.range. Agora, em vez de criar uma tabela da variável age.range,
  • 0:26 - 0:29
    vamos criar um gráfico que mostra quantos usuários
  • 0:29 - 0:32
    estão em cada compartimento. Ou seja, queremos descobrir
  • 0:32 - 0:34
    quantos entrevistados estão entre as idades de 18 e 24,
  • 0:34 - 0:38
    25 e 34, e assim por diante. Vou criar este gráfico
  • 0:38 - 0:42
    usando o pacote ggplot2 e a função qplot
  • 0:42 - 0:45
    que vem com ele. Mais uma vez, não se preocupe em entender esse código direito,
  • 0:45 - 0:48
    teremos uma prática com ele na próxima lição.
  • 0:48 - 0:51
    Quando executo o código, eu obtenho um gráfico bem aqui.
  • 0:51 - 0:53
    Ao ampliar o gráfico, quero que você observe
  • 0:53 - 0:56
    que as faixas etárias parecem estar em ordem. Isso está correto para todos,
  • 0:56 - 0:59
    menos para os entrevistados que têm
  • 0:59 - 1:02
    menos de 18 anos. Seria muito útil se esta barra
  • 1:02 - 1:05
    estivesse orientada aqui deste lado. Assim, poderíamos
  • 1:05 - 1:09
    fazer comparações entre as faixas com mais facilidade. É por isso
  • 1:09 - 1:13
    que queremos ter fatores ordenados. A variável age.range
  • 1:13 - 1:16
    apenas contém fatores com 7 níveis, mas esses níveis não estão organizados
  • 1:16 - 1:20
    em nenhuma ordem específica. Às vezes, você quer introduzir uma ordem
  • 1:20 - 1:23
    no seu conjunto de dados, para criar mais gráficos legíveis.
  • 1:23 - 1:26
    Então, sabendo um pouco mais sobre fatores ordenados,
  • 1:26 - 1:30
    vamos ver se você consegue responder à próxima pergunta. Se ainda não fez isso,
  • 1:30 - 1:32
    baixe os dados da pesquisa Reddit
  • 1:32 - 1:36
    e examine sua estrutura. Depois de examinar a estrutura das variáveis,
  • 1:36 - 1:39
    tente responder a esta pergunta: Qual destas variáveis
  • 1:39 - 1:42
    no conjunto de dados poderia também ser convertida em um fator ordenado?
  • 1:42 - 1:44
    Assim como H.Range.
  • 1:44 - 1:46
    >> Marque todas as variáveis aplicáveis.
Title:
Ordered Factors - Data Analysis with R
Description:

PZSPhQCVABg

more » « less
Video Language:
English
Team:
Udacity
Project:
UD651: Exploratory Data Analysis
Duration:
01:47

Portuguese, Brazilian subtitles

Revisions Compare revisions