< Return to Video

ANOVA 1 - Calculating SST (Total Sum of Squares)

  • 0:00 - 0:08
    En este video y en el próximo par haremos bastantes cálculos con este juego de datos que tenemos aquí.
  • 0:08 - 0:13
    Y espero que el camino a través de estos cálculos les dará una comprensión intuitiva sobre el Análisis de Varianza.
  • 0:13 - 0:19
    Lo primero que quiero hacer en este video es calcular el sumatorio total de
  • 0:19 - 0:27
    cuadrados. Lo llamaré "SST". Suma Total de Cuadrados.
    Y lo podría ver como el numerador cuando
  • 0:27 - 0:32
    calculáis la varianza. Así que escogeremos la distancia entre cada uno de estos datos
  • 0:32 - 0:36
    y la media de todos estos datos, los elevaremos al cuadrado y nos quedaremos con esa suma, no dividiremos la suma
  • 0:36 - 0:41
    por los grados de libertad, que es lo que normalmente haría si estuviera calculando la varianza de la muestra.
  • 0:41 - 0:45
    ¿Cuanto será en este caso? Bien,, lo primero que tenemos que hacer es obtener la media de
  • 0:45 - 0:50
    todos estos datos. Y de hecho la llamaré la "Gran Media".
  • 0:50 - 0:53
    Lo llamaré la "Gran Media". Y permitanme mostrarles en un segundo que se trata de lo mismo que la media
  • 0:53 - 0:59
    de las medias de cada uno de esos conjuntos de datos. Así pues, calculemos la gran media.
  • 0:59 - 1:16
    Será: 3 más 2 más 1. 3 más 2 más 1, más 5 más 3 más 4, más 5 más 6 más 7... más 5 más 6 más 7.
  • 1:16 - 1:22
    Y entonces aquí tenemos nueve datos. Tenemos nueve puntos de datos por lo que dividiremos por nueve y entonces
  • 1:22 - 1:30
    esto será igual a... 3 más 2 más 1 es 6. 6 más, solo dejenme sumar...eh... o sea que son 6. 5 más
  • 1:30 - 1:44
    3 más 4 es, es 12. Y entonces 5 más 6 más 7 es 18. Y entonces 6 más 12 es 18, más otro 18 es 36
  • 1:44 - 1:50
    dividido por nueve, será igual a 4. Permitan me mostrales que esto es lo mismo que la media de las medias.
  • 1:50 - 1:57
    Así pues, la media de este primer grupo justo aquí, Ese en verde, la media del primer grupo justo aquí
  • 1:57 - 2:04
    es 3 más 2 más 1, eso es 6, dividido por 3 datos, así sería igual a 2.
  • 2:04 - 2:13
    la media del grupo 2, la suma aquí es 12, vimos eso aquí mismo: 5 más 4 es 12, dividido
  • 2:13 - 2:22
    por 3 es 4, porque tenemos tres datos. Y entonces la media del grupo 3, 5 más 6 más 7
  • 2:22 - 2:27
    es 18 dividido por 3 es 6, Entonces, si ustedes van a tomar la media de las medias
  • 2:27 - 2:31
    la cual es en otra forma esta gran media, tienen 2 más 4 más 6
  • 2:31 - 2:36
    lo cual es 12 dividido por 3 medias y de nuevo obtendríamos 4.
  • 2:36 - 2:39
    Así que pueden ver esta como la media de todos los datos y de todos los grupos
  • 2:39 - 2:44
    o la media de medias de cada uno de esos grupos. Pero otra forma en que la hemos calculado,
  • 2:44 - 2:49
    de hecho, podemos obtener la suma total de cuadrados. <i>*</i> Entonces hagamos eso.
  • 2:49 - 2:58
    esto será igual a: 3 menos 4, el 4 es este 4 de aquí, al cuadrado; más
  • 2:58 - 3:06
    2 menos 4 al cuadrado; más 1 menos 4 al cuadrado, ahora haremos esos chicos de morado,
  • 3:06 - 3:16
    más 5 menos 4 al cuadrado; más 3 menos 4 al cuadrado; más 4 menos 4 al cuadrado
  • 3:16 - 3:21
    , más 4 menos 4 al cuadrado. Solo nos quedan tres.
  • 3:21 - 3:33
    5 más 4 al cuadrado; más 6 menos 4 al cuadrado; más 7 menos 4 al cuadrado. Ahora, ¿Qué nos da esto?
  • 3:33 - 3:38
    la primera será igual a, 3 menos 4, la diferencia es 1, lo elevan al cuadrado.
  • 3:38 - 3:42
    van a obtener,...er,..., de hecho, es un 1 negativo, lo elevan al cuadrado y consiguen 1.
  • 3:42 - 3:51
    más, consiguen un 2 negativo, al cuadrado es 4; más 3 al cuadrado. menos tres al cuadrado es 9.
  • 3:51 - 3:58
    Y entonces tenemos aquí el magenta: 5 menos 4 es 4, al cuadrado es todavía 1, 3 ,menos 4 al cuadrado es 1
  • 3:58 - 4:03
    lo elevan al cuadrado y aún obtienen 1, y 4 menos 4 es cero. Podemos -dejen me escribir un cero aquí-.
  • 4:03 - 4:07
    solo para mostrarles que de hecho lo calculamos. y entonces tenemos esos últimos tres datos.
  • 4:07 - 4:17
    5 menos 4 al cuadrado, lo que es 1. 6 menos 4 al cuadrado, lo que es 4. Esto es 2 al cuadrado. y entonces 7 menos 4 es 3
  • 4:17 - 4:25
    al cuadrado es 9. ¿A qué será igual esto? tengo 1 más 4 más 9.
  • 4:26 - 4:33
    1 más 4 más 9 aquí, lo que es 5 más 9. Esto es 14, cierto?
  • 4:33 - 4:40
    5 más... yep, 14. y también tenemos otro 14 aquí porque tenemos un 1 más 4 más 9
  • 4:40 - 4:44
    así que aquí hay también 14. Y entonces tenemos 2 aquí. Entonces esto será
  • 4:44 - 4:55
    28, 14 por 2, 14 más 14 es 28, más 2 es 30. Es igual a 30. Así, nuestra suma total de cuadrados
  • 4:55 - 5:00
    y de hecho, si queremos la varianza dividiríamos sobre los grados de libertad
  • 5:00 - 5:06
    Y son varias veces los grados de libertad. digamos, digamos que tenemos
  • 5:06 - 5:11
    sabemos que tenemos m grupos, dejen me escribir , y voy
  • 5:11 - 5:14
    a probar cosas rigurosamente, pero quiero que muestren, quiero mostrarles
  • 5:14 - 5:19
    de donde vienen algunas de esas extrañas formulas que se ven en estadística
  • 5:19 - 5:26
    sin probarlas rigurosamente, darles la idea intuitiva. Tenemos m grupos
  • 5:26 - 5:34
    y cada grupo tiene n integrantes, ¿Cuantos integrantes tenemos aquí?
  • 5:34 - 5:41
    Bueno, tendremos m veces n, o 9, ¿cierto? Tres veces tres miembros en total. Los grados de libertad, recordemos,
  • 5:41 - 5:48
    tenemos, sin importar cuántos datos, tenemos menos 1 grados de libertad. Porque si ustedes saben
  • 5:48 - 5:53
    que si ustedes conocieran la media de las medias, si conocen la media de las medias, si asumen que la conocieran
  • 5:53 - 5:59
    entonces ustedes solo, <i>*</i> solo n, er, 9 menos 1, solo 8 de esos les darían nueva información
  • 5:59 - 6:04
    porque si las conocen, podrían calcular la última, o no tendía que ser
  • 6:04 - 6:10
    la última, si ustedes tienen las otras 8 pueden calcular esta última. Si tienen 8 de esas ustedes siempre pueden calcular
  • 6:10 - 6:17
    la novena usando la media de medias. así, una forma de pensarlo es que hay solo 8 medidas independientes
  • 6:17 - 6:23
    O si quieren hablar en general, quieren hablar en general, hay
  • 6:23 - 6:30
    m por n, de modo que es el número total de muestras, menos 1 grados de libertad
  • 6:34 - 6:42
    Y si van a calcular la varianza, solo dividiríamos 30 sobre m por n menos 1
  • 6:42 - 6:47
    U otra forma de decirlo, 8 grados de libertad para este ejemplo en particular. Toman 30
  • 6:47 - 6:53
    dividido 8 y tienen la varianza para este grupo entero. El grupo de 9 [...]
  • 6:53 - 6:59
    los dejaré hasta aquí en este vídeo. en el próximo vídeo vamos a tratar de descubrir cuanto de esta varianza total
  • 6:59 - 7:08
    cuanto de esta suma de cuadrados, variación total, viene de la variación
  • 7:08 - 7:14
    entre cada uno de esos grupos vs la variación entre los grupos. Y creo que ustedes
  • 7:14 - 7:20
    van a entender de dónde está viniendo este análisis completo de varianza. miren, aquí la varianza de
  • 7:20 - 7:25
    de este grupo entero de nueve pero algunos de <i>*</i>, si esos grupos son distintos de alguna forma
  • 7:25 - 7:31
    puede venir de la variación en diferentes grupos vs la variación dentro de
  • 7:31 - 7:35
    un grupo. vamos a calcular esas dos cosas y veremos que esas van a sumar
  • 7:35 - 6000:00
    la suma total de cuadrados.
Title:
ANOVA 1 - Calculating SST (Total Sum of Squares)
Description:

more » « less
Video Language:
English
Team:
Khan Academy
Duration:
07:39

Spanish subtitles

Revisions