Portuguese, Brazilian subtitles

← Box Plots - Data Analysis with R

Get Embed Code
6 Languages

Showing Revision 8 created 06/20/2016 by Udacity Robot.

  1. Vamos usar outro tipo de visualização que será útil para ver
  2. a distribuição de uma variável chamada de gráfico de caixa. Se você
  3. não estiver familiarizado com um gráfico de caixa, você pode localizar recursos nas
  4. notas do instrutor e há também um link para classe estatística [UNKNOWN]
  5. , dessa forma, você pode testar seu próprio conhecimento. Lembre-se que
  6. anteriormente dividimos a contagem de amigos por sexo em um par de
  7. histogramas que usam o envoltório de faceta. O código era assim. Em vez
  8. de usar esses histogramas, vamos gerar gráficos de caixa de contagem de
  9. amigos por sexo, dessa forma, poderemos ver rapidamente as diferenças entre
  10. as distribuições. E, particularmente, vamos ver a diferença entre
  11. a média de dois grupos. Lembre-se novamente de que a
  12. função q plot gera, automaticamente, histogramas (/g) quando a passamos para uma
  13. variável simples. Precisamos adicionar um parâmetro para informar a
  14. q plot que precisamos de um tipo diferente de gráfico. Para
  15. fazer isso, vamos usar o geom chamado gráfico de caixa. Vou
  16. usar o mesmo conjunto de dados de antes. Vou
  17. manter este e o q plot. O que é diferente no gráfico
  18. de caixa é que o eixo y será
  19. nossa contagem de amigos. O eixo x, por outro lado,
  20. trata-se de nossas variáveis de categoria para masculinos e feminino, ou
  21. sexo. Observe que usamos as variáveis contínuas. Contagem de amigos,
  22. como y; e o agrupamento ou variável de categoria, como x.
  23. Isso sempre ocorrerá para seus gráficos de caixa. Esqueci
  24. um parêntese aqui, então deixe-me apenas reformatar meu
  25. código, para que ele pareça um pouco mais claro. Aqui está.
  26. Ao executar este código, temos nossos dois gráficos
  27. de caixa. Vamos ampliar para um olhar mais atento. As caixas aqui
  28. e aqui abrangem a média de 50% dos valores ou o que chamamos de
  29. intervalo de quartis interno. E sei que essas caixas são difíceis de ver,
  30. pois temos muitas exceções nesta caixa. Cada um desses
  31. minúsculos pontos significam uma exceção em nossos dados. Também podemos ver que
  32. o eixo y está capturando todas as contagens de amigos de
  33. zero até 5.000. Não estamos
  34. omitindo nenhum dado do usuário neste gráfico. E finamente, esta linha
  35. horizontal, que você pode ter observado primeiro, é a
  36. média para os dois gráficos de caixa. E você pode estar se perguntando
  37. o que transforma uma exceção em uma exceção real. Geralmente,
  38. consideramos exceções fora, um e metade
  39. do IQR da média. Como há
  40. muitas exceções nestes gráficos, vamos ajustar nosso código para focar
  41. apenas nestas duas caixas. Vamos fazer isso no próximo
  42. exercício de programação. Veja se pode alterar nosso código para fazer ajustes.