Portuguese, Brazilian subtitles

← Plotting in Python - Intro to Data Science

Get Embed Code
5 Languages

Showing Revision 8 created 06/20/2016 by Udacity Robot.

  1. Agora sabemos bastante sobre como você pode
  2. codificar informações em sua visualização e como criar uma
  3. visualização efetiva, mas ainda não discutimos como você
  4. pode fazer gráficos como este, como se estivesse desenhando com
  5. papel e caneta. Existem vários pacotes
  6. de plotagem no Python. Um dos mais populares é o
  7. Matplotlib. Neste curso, entretanto, quero analisar a
  8. plotagem usando uma biblioteca Python chamada ggplot, que recria
  9. de modo muito próximo a sintaxe usada na biblioteca ggplot2 de R.
  10. Se Matplotlib é tão amplamente usado, por que devemos
  11. usar o ggplot? Bem, eu gostaria de usar esse pacote
  12. por alguns motivos. Primeiro, o que ele produz é
  13. um pouco mais agradável esteticamente do que o Matplotlib. Em segundo lugar, é
  14. uma implementação de um conceito muito interessante chamado
  15. gramática dos gráficos que, basicamente, afirma que há uma
  16. gramática envolvida na composição de componentes gráficos de gráficos estatísticos.
  17. O gg em ggplot, na verdade, é proveniente de
  18. gramática de gráficos. Ele também funciona bem com
  19. as estruturas de dados do Pandas que temos usado
  20. neste curso. Para resumir rapidamente as ideias por trás
  21. da gramática dos gráficos, os gráficos transmitem informações
  22. por meio de sua aparência, como a posição x ou a posição y.
  23. Os elementos em um determinado gráfico são
  24. formas geométricas, como pontos, linhas ou barras.
  25. Algumas dessas formas podem ter uma aparência
  26. própria, como tamanho
  27. ou cor. Você pode pensar na criação de gráficos no
  28. ggplot por meio da gramática de gráficos como a adição de camadas
  29. em nosso gráfico. A primeira etapa na criação
  30. de um gráfico é sempre criar a plotagem que,
  31. essencialmente, será nossa tela. Isso
  32. pode ser feito chamando ggplot(data, aes(xvar, yvar)).
  33. Aqui, data será uma estrutura de dados do Pandas e xvar e yvar serão
  34. colunas nessa estrutura de dados. Portanto, o que estamos
  35. dizendo aqui é vamos criar um ggplot. A fonte de
  36. dados será nossa estrutura de dados e
  37. as quantidades que estamos interessados em representar serão
  38. xvar e yvar. Isso pode ser um distrito e um número
  39. de inscrições no Aadhaar ou a posição e o número de jogadores,
  40. algo desse tipo. Então, o que fizemos aqui
  41. foi criar nosso ggplot. Disse que a fonte de dados que
  42. usaremos será uma estrutura de dados do Pandas
  43. e que as variáveis que analisaremos serão xvar e yvar. Isso
  44. pode ser um distrito e um número de inscrições no Aadhaar se
  45. estivermos usando nossos dados Aadhaar ou
  46. a equipe e o número total de jogadores, se estivermos usando nossos dados de beisebol,
  47. algo desse tipo. Muito bem. Dito isso, teremos um
  48. gráfico mapeando xvar no eixo x e
  49. yvar no eixo y, mas não dissemos ainda qual
  50. tipo de objeto geométrico representará
  51. esses dados. Portanto, se incluirmos mais geom_point a
  52. esta instrução, criaremos um gráfico de dispersão. Se também
  53. incluirmos mais geom_line ao gráfico, conectaremos
  54. todos esses pontos entre si com linhas. Agora, digamos
  55. que queremos que esses pontos tenham uma cor específica.
  56. Podemos usar color igual a coral em geom_point
  57. e também usar color igual a coral em geom_line.
  58. Depois de fazermos isso, os pontos e
  59. as linhas terão a cor coral. Essa é a
  60. segunda etapa da criação de um gráfico no ggplot,
  61. em que escolhemos os tipos de objetos geométricos que representarão os dados.
  62. A última etapa aqui será adicionar
  63. alguns rótulos para que nosso gráfico tenha algum contexto,
  64. como um título ou um rótulo de x ou um rótulo de y. Isso pode ser feito de forma muito parecida
  65. com a que usamos para adicionar os pontos e as linhas
  66. ao gráfico. Podemos adicionar ggtitle para dar
  67. um título ao gráfico. E um xlab, que será x-label, para fornecer
  68. um rótulo de x. E um ylab para fazer o mesmo
  69. com o eixo y. Agora, tudo o que temos de fazer
  70. é colocar Print antes de todo esse comando. E criaremos
  71. um gráfico no Python. Por que não tenta implementar
  72. essas ideias para criar um gráfico por conta própria?