YouTube

Got a YouTube account?

New: enable viewer-created translations and captions on your YouTube channel!

Portuguese, Brazilian subtitles

← Impute Using Linear Regression - Intro to Data Science

Get Embed Code
4 Languages

Showing Revision 8 created 06/20/2016 by Udacity Robot.

  1. Outro método que poderíamos usar para imputar os
  2. valores faltando em um conjunto de dados é fazer a regressão linear
  3. para estimar os valores faltando. Falaremos sobre regressão linear
  4. com mais detalhes na próxima lição. Mas a ideia
  5. geral é que criamos uma equação que
  6. prevê os valores faltando nos dados usando a informação que
  7. temos e depois usamos essa equação para preencher os
  8. valores faltando. OK. Então, quais são as desvantagens de usar
  9. esta técnica de regressão linear? Bem, um efeito colateral
  10. negativo de imputar os valores faltando desta
  11. forma é que iríamos exagerar as
  12. tendências existentes nos dados. Por exemplo, se
  13. existir uma relação entre a data de nascimento
  14. e a altura dos jogadores da MLB, todos os
  15. valores imputados amplificarão essa tendência. Além disso, este
  16. modelo produzirá valores exatos para as entradas faltando,
  17. o que sugere uma segurança maior nos valores faltando do que
  18. realmente temos. Em todo caso, vamos dizer que queremos
  19. preencher os valores faltando para peso nos
  20. dados dos jogadores de beisebol. Nós poderíamos treinar um modelo linear usando os
  21. dados existentes que temos e depois usar esse modelo para
  22. preencher os valores faltando. Vamos dizer que queremos preencher
  23. os valores faltando para peso nos dados de beisebol. Nós
  24. poderíamos treinar um modelo linear usando os dados existentes, ou seja, as
  25. entradas que têm posição, batedor
  26. canhoto ou destro, média, data de nascimento, data de falecimento, altura e
  27. peso. E depois usar esse modelo que
  28. criamos para preencher esses valores faltando.