En este video y en el próximo par haremos bastantes cálculos con este juego de datos que tenemos aquí.
Y espero que el camino a través de estos cálculos les dará una comprensión intuitiva sobre el Análisis de Varianza.
Lo primero que quiero hacer en este video es calcular el sumatorio total de
cuadrados. Lo llamaré "SST". Suma Total de Cuadrados.
Y lo podría ver como el numerador cuando
calculáis la varianza. Así que escogeremos la distancia entre cada uno de estos datos
y la media de todos estos datos, los elevaremos al cuadrado y nos quedaremos con esa suma, no dividiremos la suma
por los grados de libertad, que es lo que normalmente haría si estuviera calculando la varianza de la muestra.
¿Cuanto será en este caso? Bien,, lo primero que tenemos que hacer es obtener la media de
todos estos datos. Y de hecho la llamaré la "Gran Media".
Lo llamaré la "Gran Media". Y permitanme mostrarles en un segundo que se trata de lo mismo que la media
de las medias de cada uno de esos conjuntos de datos. Así pues, calculemos la gran media.
Será: 3 más 2 más 1. 3 más 2 más 1, más 5 más 3 más 4, más 5 más 6 más 7... más 5 más 6 más 7.
Y entonces aquí tenemos nueve datos. Tenemos nueve puntos de datos por lo que dividiremos por nueve y entonces
esto será igual a... 3 más 2 más 1 es 6. 6 más, solo dejenme sumar...eh... o sea que son 6. 5 más
3 más 4 es, es 12. Y entonces 5 más 6 más 7 es 18. Y entonces 6 más 12 es 18, más otro 18 es 36
dividido por nueve, será igual a 4. Permitan me mostrales que esto es lo mismo que la media de las medias.
Así pues, la media de este primer grupo justo aquí, Ese en verde, la media del primer grupo justo aquí
es 3 más 2 más 1, eso es 6, dividido por 3 datos, así sería igual a 2.
la media del grupo 2, la suma aquí es 12, vimos eso aquí mismo: 5 más 4 es 12, dividido
por 3 es 4, porque tenemos tres datos. Y entonces la media del grupo 3, 5 más 6 más 7
es 18 dividido por 3 es 6, Entonces, si ustedes van a tomar la media de las medias
la cual es en otra forma esta gran media, tienen 2 más 4 más 6
lo cual es 12 dividido por 3 medias y de nuevo obtendríamos 4.
Así que pueden ver esta como la media de todos los datos y de todos los grupos
o la media de medias de cada uno de esos grupos. Pero otra forma en que la hemos calculado,
de hecho, podemos obtener la suma total de cuadrados. <i>*</i> Entonces hagamos eso.
esto será igual a: 3 menos 4, el 4 es este 4 de aquí, al cuadrado; más
2 menos 4 al cuadrado; más 1 menos 4 al cuadrado, ahora haremos esos chicos de morado,
más 5 menos 4 al cuadrado; más 3 menos 4 al cuadrado; más 4 menos 4 al cuadrado
, más 4 menos 4 al cuadrado. Solo nos quedan tres.
5 más 4 al cuadrado; más 6 menos 4 al cuadrado; más 7 menos 4 al cuadrado. Ahora, ¿Qué nos da esto?
la primera será igual a, 3 menos 4, la diferencia es 1, lo elevan al cuadrado.
van a obtener,...er,..., de hecho, es un 1 negativo, lo elevan al cuadrado y consiguen 1.
más, consiguen un 2 negativo, al cuadrado es 4; más 3 al cuadrado. menos tres al cuadrado es 9.
Y entonces tenemos aquí el magenta: 5 menos 4 es 4, al cuadrado es todavía 1, 3 ,menos 4 al cuadrado es 1
lo elevan al cuadrado y aún obtienen 1, y 4 menos 4 es cero. Podemos -dejen me escribir un cero aquí-.
solo para mostrarles que de hecho lo calculamos. y entonces tenemos esos últimos tres datos.
5 menos 4 al cuadrado, lo que es 1. 6 menos 4 al cuadrado, lo que es 4. Esto es 2 al cuadrado. y entonces 7 menos 4 es 3
al cuadrado es 9. ¿A qué será igual esto? tengo 1 más 4 más 9.
1 más 4 más 9 aquí, lo que es 5 más 9. Esto es 14, cierto?
5 más... yep, 14. y también tenemos otro 14 aquí porque tenemos un 1 más 4 más 9
así que aquí hay también 14. Y entonces tenemos 2 aquí. Entonces esto será
28, 14 por 2, 14 más 14 es 28, más 2 es 30. Es igual a 30. Así, nuestra suma total de cuadrados
y de hecho, si queremos la varianza dividiríamos sobre los grados de libertad
Y son varias veces los grados de libertad. digamos, digamos que tenemos
sabemos que tenemos m grupos, dejen me escribir , y voy
a probar cosas rigurosamente, pero quiero que muestren, quiero mostrarles
de donde vienen algunas de esas extrañas formulas que se ven en estadística
sin probarlas rigurosamente, darles la idea intuitiva. Tenemos m grupos
y cada grupo tiene n integrantes, ¿Cuantos integrantes tenemos aquí?
Bueno, tendremos m veces n, o 9, ¿cierto? Tres veces tres miembros en total. Los grados de libertad, recordemos,
tenemos, sin importar cuántos datos, tenemos menos 1 grados de libertad. Porque si ustedes saben
que si ustedes conocieran la media de las medias, si conocen la media de las medias, si asumen que la conocieran
entonces ustedes solo, <i>*</i> solo n, er, 9 menos 1, solo 8 de esos les darían nueva información
porque si las conocen, podrían calcular la última, o no tendía que ser
la última, si ustedes tienen las otras 8 pueden calcular esta última. Si tienen 8 de esas ustedes siempre pueden calcular
la novena usando la media de medias. así, una forma de pensarlo es que hay solo 8 medidas independientes
O si quieren hablar en general, quieren hablar en general, hay
m por n, de modo que es el número total de muestras, menos 1 grados de libertad
Y si van a calcular la varianza, solo dividiríamos 30 sobre m por n menos 1
U otra forma de decirlo, 8 grados de libertad para este ejemplo en particular. Toman 30
dividido 8 y tienen la varianza para este grupo entero. El grupo de 9 [...]
los dejaré hasta aquí en este vídeo. en el próximo vídeo vamos a tratar de descubrir cuanto de esta varianza total
cuanto de esta suma de cuadrados, variación total, viene de la variación
entre cada uno de esos grupos vs la variación entre los grupos. Y creo que ustedes
van a entender de dónde está viniendo este análisis completo de varianza. miren, aquí la varianza de
de este grupo entero de nueve pero algunos de <i>*</i>, si esos grupos son distintos de alguna forma
puede venir de la variación en diferentes grupos vs la variación dentro de
un grupo. vamos a calcular esas dos cosas y veremos que esas van a sumar
la suma total de cuadrados.