YouTube

Got a YouTube account?

New: enable viewer-created translations and captions on your YouTube channel!

Portuguese, Brazilian subtitles

← Welchs Two-Sample t-Test - Intro to Data Science

Get Embed Code
4 Languages

Showing Revision 9 created 06/20/2016 by Udacity Robot.

  1. Vamos falar mais sobre as duas amostras de t-test, já que queremos
  2. comparar duas amostras diferentes em nosso projeto de classe. Há algumas
  3. versões diferentes de t-test que podem ser utilizadas
  4. , e elas dependem realmente de quais suposições fazemos sobre os
  5. dados. Podemos querer fazer perguntas como, as nossas
  6. amostras têm o mesmo tamanho?, e, elas tem a mesma
  7. variância? . Vamos discutir mais detalhadamente uma variante de t-test chamada Welch's
  8. t-test, já que é a mais geral. Ela não supõe
  9. tamanho de amostra igual nem variância igual. No Welch's
  10. t-test, calculamos uma t-statistic usando a equação a seguir.
  11. T igual mu1 menos mu2, dividido pela
  12. raiz quadrada de sigma1 ao quadrado sobre n1. Mais
  13. sigma 2 ao quadrado sobre n2. Em que mu I é a média da amostra para a i-ésima amostra.
  14. Sigma ao quadrado I é a variância da amostra para a
  15. i-ésima amostra. E NI é o tamanho da amostra
  16. para a i-ésima amostra. Também vamos querer estimar o número de graus
  17. de liberdade, nu, usando a equação a seguir.
  18. Nu é aproximadamente igual à: quantidade de sigma1
  19. ao quadrado, sobre n1, mais sigma2 ao quadrado sobre n2 ao quadrado, sobre sigma1
  20. à quarta potência sobre n1 ao quadrado nu1, mais sigma2 à quarta potência, sobre n2 ao quadrado nu2.
  21. Em que mu I é igual à nu I menos um, e
  22. esse é o grau de liberdade associado à estimativa da i-ésima
  23. variância. Se não estiver familiarizado com graus de liberdade, pode ser
  24. uma boa ideia reciclar seus conceitos de estatísticas
  25. com o curso de introdução a estatísticas da Audacity. Um link é
  26. fornecido nos Comentários do instrutor. Certo, uma vez que temos
  27. esses dois valores, podemos estimar o valor de P. Conceitualmente, o
  28. valor de P é a probabilidade de obter a estatística de teste, pelo menos,
  29. tão extrema quanto a que observamos,
  30. supondo que a hipótese nula fosse verdadeira. O valor
  31. de P não é a probabilidade da hipótese nula
  32. ser verdadeira considerando os dados. Repetindo, apenas como um
  33. experimento, digamos que estivéssemos testando quais jogadores
  34. de beisebol, destros ou canhotos, foram melhores rebatedores examinando
  35. a média das rebatidas. Se o valor de P
  36. fosse 0,05, isso significaria que, mesmo que não houvesse
  37. diferença entre batedores destros e canhotos, uma vez que
  38. essa é nossa hipótese nula, mesmo que fosse verdadeiro,
  39. veríamos um valor de t, igual ou maior
  40. àquele que vimos 5% do tempo.
  41. Ao executar um teste estatístico como este, geralmente definimos
  42. um valor crítico de P. Vamos chamá-lo de P crítico.
  43. Se P ficasse abaixo de P crítico, rejeitaríamos
  44. a hipótese nula. Nos dois casos da amostra, isso é equivalente a
  45. afirmar que a média de nossas duas amostras
  46. não é igual. Calcular esse valor de P para um
  47. determinado conjunto de dados pode ser um pouco tedioso.
  48. Felizmente, raramente temos que executar esse cálculo explicitamente.