-
En este video y en el próximo par haremos bastantes cálculos con este juego de datos que tenemos aquí.
-
Y espero que el camino a través de estos cálculos les dará una comprensión intuitiva sobre el Análisis de Varianza.
-
Lo primero que quiero hacer en este video es calcular el sumatorio total de
-
cuadrados. Lo llamaré "SST". Suma Total de Cuadrados.
Y lo podría ver como el numerador cuando
-
calculáis la varianza. Así que escogeremos la distancia entre cada uno de estos datos
-
y la media de todos estos datos, los elevaremos al cuadrado y nos quedaremos con esa suma, no dividiremos la suma
-
por los grados de libertad, que es lo que normalmente haría si estuviera calculando la varianza de la muestra.
-
¿Cuanto será en este caso? Bien,, lo primero que tenemos que hacer es obtener la media de
-
todos estos datos. Y de hecho la llamaré la "Gran Media".
-
Lo llamaré la "Gran Media". Y permitanme mostrarles en un segundo que se trata de lo mismo que la media
-
de las medias de cada uno de esos conjuntos de datos. Así pues, calculemos la gran media.
-
Será: 3 más 2 más 1. 3 más 2 más 1, más 5 más 3 más 4, más 5 más 6 más 7... más 5 más 6 más 7.
-
Y entonces aquí tenemos nueve datos. Tenemos nueve puntos de datos por lo que dividiremos por nueve y entonces
-
esto será igual a... 3 más 2 más 1 es 6. 6 más, solo dejenme sumar...eh... o sea que son 6. 5 más
-
3 más 4 es, es 12. Y entonces 5 más 6 más 7 es 18. Y entonces 6 más 12 es 18, más otro 18 es 36
-
dividido por nueve, será igual a 4. Permitan me mostrales que esto es lo mismo que la media de las medias.
-
Así pues, la media de este primer grupo justo aquí, Ese en verde, la media del primer grupo justo aquí
-
es 3 más 2 más 1, eso es 6, dividido por 3 datos, así sería igual a 2.
-
la media del grupo 2, la suma aquí es 12, vimos eso aquí mismo: 5 más 4 es 12, dividido
-
por 3 es 4, porque tenemos tres datos. Y entonces la media del grupo 3, 5 más 6 más 7
-
es 18 dividido por 3 es 6, Entonces, si ustedes van a tomar la media de las medias
-
la cual es en otra forma esta gran media, tienen 2 más 4 más 6
-
lo cual es 12 dividido por 3 medias y de nuevo obtendríamos 4.
-
Así que pueden ver esta como la media de todos los datos y de todos los grupos
-
o la media de medias de cada uno de esos grupos. Pero otra forma en que la hemos calculado,
-
de hecho, podemos obtener la suma total de cuadrados. <i>*</i> Entonces hagamos eso.
-
esto será igual a: 3 menos 4, el 4 es este 4 de aquí, al cuadrado; más
-
2 menos 4 al cuadrado; más 1 menos 4 al cuadrado, ahora haremos esos chicos de morado,
-
más 5 menos 4 al cuadrado; más 3 menos 4 al cuadrado; más 4 menos 4 al cuadrado
-
, más 4 menos 4 al cuadrado. Solo nos quedan tres.
-
5 más 4 al cuadrado; más 6 menos 4 al cuadrado; más 7 menos 4 al cuadrado. Ahora, ¿Qué nos da esto?
-
la primera será igual a, 3 menos 4, la diferencia es 1, lo elevan al cuadrado.
-
van a obtener,...er,..., de hecho, es un 1 negativo, lo elevan al cuadrado y consiguen 1.
-
más, consiguen un 2 negativo, al cuadrado es 4; más 3 al cuadrado. menos tres al cuadrado es 9.
-
Y entonces tenemos aquí el magenta: 5 menos 4 es 4, al cuadrado es todavía 1, 3 ,menos 4 al cuadrado es 1
-
lo elevan al cuadrado y aún obtienen 1, y 4 menos 4 es cero. Podemos -dejen me escribir un cero aquí-.
-
solo para mostrarles que de hecho lo calculamos. y entonces tenemos esos últimos tres datos.
-
5 menos 4 al cuadrado, lo que es 1. 6 menos 4 al cuadrado, lo que es 4. Esto es 2 al cuadrado. y entonces 7 menos 4 es 3
-
al cuadrado es 9. ¿A qué será igual esto? tengo 1 más 4 más 9.
-
1 más 4 más 9 aquí, lo que es 5 más 9. Esto es 14, cierto?
-
5 más... yep, 14. y también tenemos otro 14 aquí porque tenemos un 1 más 4 más 9
-
así que aquí hay también 14. Y entonces tenemos 2 aquí. Entonces esto será
-
28, 14 por 2, 14 más 14 es 28, más 2 es 30. Es igual a 30. Así, nuestra suma total de cuadrados
-
y de hecho, si queremos la varianza dividiríamos sobre los grados de libertad
-
Y son varias veces los grados de libertad. digamos, digamos que tenemos
-
sabemos que tenemos m grupos, dejen me escribir , y voy
-
a probar cosas rigurosamente, pero quiero que muestren, quiero mostrarles
-
de donde vienen algunas de esas extrañas formulas que se ven en estadística
-
sin probarlas rigurosamente, darles la idea intuitiva. Tenemos m grupos
-
y cada grupo tiene n integrantes, ¿Cuantos integrantes tenemos aquí?
-
Bueno, tendremos m veces n, o 9, ¿cierto? Tres veces tres miembros en total. Los grados de libertad, recordemos,
-
tenemos, sin importar cuántos datos, tenemos menos 1 grados de libertad. Porque si ustedes saben
-
que si ustedes conocieran la media de las medias, si conocen la media de las medias, si asumen que la conocieran
-
entonces ustedes solo, <i>*</i> solo n, er, 9 menos 1, solo 8 de esos les darían nueva información
-
porque si las conocen, podrían calcular la última, o no tendía que ser
-
la última, si ustedes tienen las otras 8 pueden calcular esta última. Si tienen 8 de esas ustedes siempre pueden calcular
-
la novena usando la media de medias. así, una forma de pensarlo es que hay solo 8 medidas independientes
-
O si quieren hablar en general, quieren hablar en general, hay
-
m por n, de modo que es el número total de muestras, menos 1 grados de libertad
-
Y si van a calcular la varianza, solo dividiríamos 30 sobre m por n menos 1
-
U otra forma de decirlo, 8 grados de libertad para este ejemplo en particular. Toman 30
-
dividido 8 y tienen la varianza para este grupo entero. El grupo de 9 [...]
-
los dejaré hasta aquí en este vídeo. en el próximo vídeo vamos a tratar de descubrir cuanto de esta varianza total
-
cuanto de esta suma de cuadrados, variación total, viene de la variación
-
entre cada uno de esos grupos vs la variación entre los grupos. Y creo que ustedes
-
van a entender de dónde está viniendo este análisis completo de varianza. miren, aquí la varianza de
-
de este grupo entero de nueve pero algunos de <i>*</i>, si esos grupos son distintos de alguna forma
-
puede venir de la variación en diferentes grupos vs la variación dentro de
-
un grupo. vamos a calcular esas dos cosas y veremos que esas van a sumar
-
la suma total de cuadrados.