0:00:00.441,0:00:07.657 En este video y en el próximo par haremos bastantes cálculos con este juego de datos que tenemos aquí. 0:00:07.657,0:00:12.608 Y espero que el camino a través de estos cálculos les dará una comprensión intuitiva sobre el Análisis de Varianza. 0:00:12.608,0:00:18.941 Lo primero que quiero hacer en este video es calcular el sumatorio total de 0:00:18.941,0:00:27.455 cuadrados. Lo llamaré "SST". Suma Total de Cuadrados.[br]Y lo podría ver como el numerador cuando 0:00:27.455,0:00:31.576 calculáis la varianza. Así que escogeremos la distancia entre cada uno de estos datos 0:00:31.576,0:00:36.078 y la media de todos estos datos, los elevaremos al cuadrado y nos quedaremos con esa suma, no dividiremos la suma 0:00:36.078,0:00:40.732 por los grados de libertad, que es lo que normalmente haría si estuviera calculando la varianza de la muestra. 0:00:40.763,0:00:45.279 ¿Cuanto será en este caso? Bien,, lo primero que tenemos que hacer es obtener la media de 0:00:45.279,0:00:49.692 todos estos datos. Y de hecho la llamaré la "Gran Media". 0:00:49.692,0:00:53.359 Lo llamaré la "Gran Media". Y permitanme mostrarles en un segundo que se trata de lo mismo que la media 0:00:53.359,0:00:59.013 de las medias de cada uno de esos conjuntos de datos. Así pues, calculemos la gran media. 0:00:59.013,0:01:16.152 Será: 3 más 2 más 1. 3 más 2 más 1, más 5 más 3 más 4, más 5 más 6 más 7... más 5 más 6 más 7. 0:01:16.152,0:01:22.102 Y entonces aquí tenemos nueve datos. Tenemos nueve puntos de datos por lo que dividiremos por nueve y entonces 0:01:22.102,0:01:30.354 esto será igual a... 3 más 2 más 1 es 6. 6 más, solo dejenme sumar...eh... o sea que son 6. 5 más 0:01:30.385,0:01:43.944 3 más 4 es, es 12. Y entonces 5 más 6 más 7 es 18. Y entonces 6 más 12 es 18, más otro 18 es 36 0:01:43.944,0:01:50.241 dividido por nueve, será igual a 4. Permitan me mostrales que esto es lo mismo que la media de las medias. 0:01:50.302,0:01:57.056 Así pues, la media de este primer grupo justo aquí, Ese en verde, la media del primer grupo justo aquí 0:01:57.056,0:02:03.856 es 3 más 2 más 1, eso es 6, dividido por 3 datos, así sería igual a 2. 0:02:03.856,0:02:12.677 la media del grupo 2, la suma aquí es 12, vimos eso aquí mismo: 5 más 4 es 12, dividido 0:02:12.677,0:02:21.846 por 3 es 4, porque tenemos tres datos. Y entonces la media del grupo 3, 5 más 6 más 7 0:02:21.846,0:02:27.256 es 18 dividido por 3 es 6, Entonces, si ustedes van a tomar la media de las medias 0:02:27.256,0:02:31.015 la cual es en otra forma esta gran media, tienen 2 más 4 más 6 0:02:31.015,0:02:35.892 lo cual es 12 dividido por 3 medias y de nuevo obtendríamos 4. 0:02:35.892,0:02:38.933 Así que pueden ver esta como la media de todos los datos y de todos los grupos 0:02:38.933,0:02:43.600 o la media de medias de cada uno de esos grupos. Pero otra forma en que la hemos calculado, 0:02:43.600,0:02:48.836 de hecho, podemos obtener la suma total de cuadrados. <i>*</i> Entonces hagamos eso. 0:02:48.836,0:02:57.887 esto será igual a: 3 menos 4, el 4 es este 4 de aquí, al cuadrado; más 0:02:57.887,0:03:05.667 2 menos 4 al cuadrado; más 1 menos 4 al cuadrado, ahora haremos esos chicos de morado, 0:03:05.667,0:03:16.031 más 5 menos 4 al cuadrado; más 3 menos 4 al cuadrado; más 4 menos 4 al cuadrado 0:03:16.031,0:03:20.667 , más 4 menos 4 al cuadrado. Solo nos quedan tres. 0:03:20.667,0:03:32.887 5 más 4 al cuadrado; más 6 menos 4 al cuadrado; más 7 menos 4 al cuadrado. Ahora, ¿Qué nos da esto? 0:03:32.887,0:03:38.436 la primera será igual a, 3 menos 4, la diferencia es 1, lo elevan al cuadrado. 0:03:38.436,0:03:42.200 van a obtener,...er,..., de hecho, es un 1 negativo, lo elevan al cuadrado y consiguen 1. 0:03:42.200,0:03:51.000 más, consiguen un 2 negativo, al cuadrado es 4; más 3 al cuadrado. menos tres al cuadrado es 9. 0:03:51.000,0:03:57.698 Y entonces tenemos aquí el magenta: 5 menos 4 es 4, al cuadrado es todavía 1, 3 ,menos 4 al cuadrado es 1 0:03:57.698,0:04:03.210 lo elevan al cuadrado y aún obtienen 1, y 4 menos 4 es cero. Podemos -dejen me escribir un cero aquí-. 0:04:03.210,0:04:06.985 solo para mostrarles que de hecho lo calculamos. y entonces tenemos esos últimos tres datos. 0:04:06.985,0:04:16.667 5 menos 4 al cuadrado, lo que es 1. 6 menos 4 al cuadrado, lo que es 4. Esto es 2 al cuadrado. y entonces 7 menos 4 es 3 0:04:16.667,0:04:24.952 al cuadrado es 9. ¿A qué será igual esto? tengo 1 más 4 más 9. 0:04:25.629,0:04:33.436 1 más 4 más 9 aquí, lo que es 5 más 9. Esto es 14, cierto? 0:04:33.436,0:04:39.638 5 más... yep, 14. y también tenemos otro 14 aquí porque tenemos un 1 más 4 más 9 0:04:39.638,0:04:43.632 así que aquí hay también 14. Y entonces tenemos 2 aquí. Entonces esto será 0:04:43.632,0:04:55.056 28, 14 por 2, 14 más 14 es 28, más 2 es 30. Es igual a 30. Así, nuestra suma total de cuadrados 0:04:55.056,0:04:59.561 y de hecho, si queremos la varianza dividiríamos sobre los grados de libertad 0:04:59.561,0:05:05.551 Y son varias veces los grados de libertad. digamos, digamos que tenemos 0:05:05.551,0:05:11.031 sabemos que tenemos m grupos, dejen me escribir , y voy 0:05:11.031,0:05:14.236 a probar cosas rigurosamente, pero quiero que muestren, quiero mostrarles 0:05:14.236,0:05:18.740 de donde vienen algunas de esas extrañas formulas que se ven en estadística 0:05:18.740,0:05:25.667 sin probarlas rigurosamente, darles la idea intuitiva. Tenemos m grupos 0:05:25.667,0:05:34.344 y cada grupo tiene n integrantes, ¿Cuantos integrantes tenemos aquí? 0:05:34.344,0:05:41.498 Bueno, tendremos m veces n, o 9, ¿cierto? Tres veces tres miembros en total. Los grados de libertad, recordemos, 0:05:41.498,0:05:47.800 tenemos, sin importar cuántos datos, tenemos menos 1 grados de libertad. Porque si ustedes saben 0:05:47.800,0:05:52.800 que si ustedes conocieran la media de las medias, si conocen la media de las medias, si asumen que la conocieran 0:05:52.800,0:05:59.323 entonces ustedes solo, <i>*</i> solo n, er, 9 menos 1, solo 8 de esos les darían nueva información 0:05:59.323,0:06:04.471 porque si las conocen, podrían calcular la última, o no tendía que ser 0:06:04.471,0:06:09.824 la última, si ustedes tienen las otras 8 pueden calcular esta última. Si tienen 8 de esas ustedes siempre pueden calcular 0:06:09.824,0:06:16.600 la novena usando la media de medias. así, una forma de pensarlo es que hay solo 8 medidas independientes 0:06:16.600,0:06:22.883 O si quieren hablar en general, quieren hablar en general, hay 0:06:22.883,0:06:30.397 m por n, de modo que es el número total de muestras, menos 1 grados de libertad 0:06:33.720,0:06:41.810 Y si van a calcular la varianza, solo dividiríamos 30 sobre m por n menos 1 0:06:41.810,0:06:47.077 U otra forma de decirlo, 8 grados de libertad para este ejemplo en particular. Toman 30 0:06:47.077,0:06:53.000 dividido 8 y tienen la varianza para este grupo entero. El grupo de 9 [...] 0:06:53.000,0:06:58.533 los dejaré hasta aquí en este vídeo. en el próximo vídeo vamos a tratar de descubrir cuanto de esta varianza total 0:06:58.533,0:07:08.333 cuanto de esta suma de cuadrados, variación total, viene de la variación 0:07:08.333,0:07:14.313 entre cada uno de esos grupos vs la variación entre los grupos. Y creo que ustedes 0:07:14.313,0:07:19.667 van a entender de dónde está viniendo este análisis completo de varianza. miren, aquí la varianza de 0:07:19.667,0:07:24.800 de este grupo entero de nueve pero algunos de <i>*</i>, si esos grupos son distintos de alguna forma 0:07:24.800,0:07:31.267 puede venir de la variación en diferentes grupos vs la variación dentro de 0:07:31.267,0:07:34.564 un grupo. vamos a calcular esas dos cosas y veremos que esas van a sumar 0:07:34.579,99:59:59.999 la suma total de cuadrados.