Portuguese, Brazilian subtitles

← Scatterplot Transformation - Data Analysis with R

Get Embed Code
5 Languages

Showing Revision 9 created 06/20/2016 by Udacity Robot.

  1. Agora que entendemos melhor nossas variáveis e demanda
  2. geral de diamantes, vamos traçar os dados novamente. Desta vez,
  3. colocaremos um preço em uma escala log10, ficando
  4. assim. O gráfico ficou melhor que antes. Na escala
  5. de log, os preços parecem menos dispersos no alto
  6. de tamanho e preço do quilate, mas podemos fazer melhor. Vamos
  7. tentar usar a raiz cúbica de quilate considerando
  8. nossa especulação de que falhas sejam
  9. mais prováveis em diamantes com mais volume.
  10. O volume está em uma escala cúbica. Primeiro, precisamos
  11. que uma função transforme a variável carat. Se você quiser
  12. saber mais sobre como criar suas próprias funções em R, consulte
  13. os links nas Notas do instrutor. Isso pode parecer muito
  14. código, mas temos apenas uma parte dele aqui.
  15. É a transfunção raiz cúbica. É uma função que considera
  16. a raiz cúbica de qualquer variável de entrada e tem
  17. uma função inversa para desfazer a operação, que precisamos
  18. exibir no gráfico corretamente. Então, chegamos ao
  19. nosso comando ggplot. O que faremos é
  20. usar o argumento scale_x_continuous para transformar o eixo x
  21. com essa função de transformação da raiz cúbica. Lembre-se
  22. de que também estamos transformando o eixo y
  23. com a transformação log10 discutida anteriormente. Vamos ver
  24. como ficará esse gráfico. Analisando
  25. o gráfico, vemos que, com essas transformações
  26. que usamos para obter nossos dados
  27. nessa escala, tudo parece quase
  28. linear. Agora podemos continuar e ver
  29. sobre como modelar nossos dados usando um modelo linear.