Portuguese, Brazilian subtitles

← Complex Queries 2 - Intro to Data Science

Get Embed Code
4 Languages

Showing Revision 9 created 06/20/2016 by Udacity Robot.

  1. A última coisa sobre a qual quero
  2. falar rapidamente são as mesmas funções que existem em
  3. linguagens de consulta como SQL. Como group bys e
  4. funções de agregação. Então, vamos dizer que quisesse
  5. criar uma versão transformada dos meus dados. Por
  6. exemplo, qual é o número total de matrículas por
  7. distrito? . Eu poderia escrever algo como isto. SELECT
  8. district,. SUM (aadhaar_generated) FROM aadhaar_data,
  9. GROUP BY district. Vamos falar sobre isto
  10. um pouco mais. O que está acontecendo exatamente?
  11. . SUM é o que chamamos de função de agregação. Uma função de agregação pega um
  12. conjunto de valores, normalmente números, e executa
  13. uma operação matemática com eles. Usamos
  14. SUM, mas outras funções de agregação incluem COUNT,
  15. MIN, MEAN, MAX, você pegou a ideia.
  16. Operações que uma pessoa pode executar com um conjunto
  17. de números. Mas, espere. Cada linha é
  18. apenas um número. Então, como chegamos
  19. aos conjuntos de números? O que basicamente dizemos aqui
  20. é pegar distrito distinto. Depois, para
  21. todos os valores diferentes de aadhaar_generated correspondentes
  22. a cada linha para esse distrito, a soma é
  23. calculada. Vamos começar com nossa tabela de dados Aadhaar.
  24. Pegue cada distrito e somente a contagem de
  25. aadhaar_generated. Agora, para nossos resultados fazerem
  26. sentido, queremos apenas uma linha
  27. em nosso resultado para cada distrito. Então, jogamos
  28. esta cláusula GROUP BY no final, que essencialmente
  29. diz: vamos ter apenas uma linha por distrito em
  30. nossos resultados. Pode haver várias cláusulas em um
  31. GROUP BY. Podemos usar também SELECT district,
  32. subdistrict, SUM aadhaar_generated, FROM aadhaar data, GROUP
  33. BY district, subdistrict. Note que para quaisquer colunas que
  34. selecionarmos, que não agregarmos, precisamos
  35. agrupar por, neste caso, distrito e subdistrito. Também
  36. poderíamos colocar uma cláusula WHERE aqui. Então,
  37. para somar aadhaar_generated para pessoas
  38. acima de 60 em cada distrito, posso apenas adicionar a cláusula WHERE após o nome da tabela,
  39. como falamos anteriormente. Se fôssemos executar esta consulta, dado SELECT
  40. district, subdistrict, SUM aadhaar generated, FROM aadhaar_data,
  41. WHERE age > 60, GROUP BY district, subdistrict, se
  42. fôssemos executar esta consulta, teríamos
  43. uma linha para cada combinação de distrito e
  44. subdistrito. E também teríamos para cada
  45. linha, a contagem de quantos Aadhaar foram gerados para
  46. pessoas acima de 60.