WEBVTT 00:00:00.441 --> 00:00:07.657 En este video y en el próximo par haremos bastantes cálculos con este juego de datos que tenemos aquí. 00:00:07.657 --> 00:00:12.608 Y espero que el camino a través de estos cálculos les dará una comprensión intuitiva sobre el Análisis de Varianza. 00:00:12.608 --> 00:00:18.941 Lo primero que quiero hacer en este video es calcular el sumatorio total de 00:00:18.941 --> 00:00:27.455 cuadrados. Lo llamaré "SST". Suma Total de Cuadrados. Y lo podría ver como el numerador cuando 00:00:27.455 --> 00:00:31.576 calculáis la varianza. Así que escogeremos la distancia entre cada uno de estos datos 00:00:31.576 --> 00:00:36.078 y la media de todos estos datos, los elevaremos al cuadrado y nos quedaremos con esa suma, no dividiremos la suma 00:00:36.078 --> 00:00:40.732 por los grados de libertad, que es lo que normalmente haría si estuviera calculando la varianza de la muestra. 00:00:40.763 --> 00:00:45.279 ¿Cuanto será en este caso? Bien,, lo primero que tenemos que hacer es obtener la media de 00:00:45.279 --> 00:00:49.692 todos estos datos. Y de hecho la llamaré la "Gran Media". 00:00:49.692 --> 00:00:53.359 Lo llamaré la "Gran Media". Y permitanme mostrarles en un segundo que se trata de lo mismo que la media 00:00:53.359 --> 00:00:59.013 de las medias de cada uno de esos conjuntos de datos. Así pues, calculemos la gran media. 00:00:59.013 --> 00:01:16.152 Será: 3 más 2 más 1. 3 más 2 más 1, más 5 más 3 más 4, más 5 más 6 más 7... más 5 más 6 más 7. 00:01:16.152 --> 00:01:22.102 Y entonces aquí tenemos nueve datos. Tenemos nueve puntos de datos por lo que dividiremos por nueve y entonces 00:01:22.102 --> 00:01:30.354 esto será igual a... 3 más 2 más 1 es 6. 6 más, solo dejenme sumar...eh... o sea que son 6. 5 más 00:01:30.385 --> 00:01:43.944 3 más 4 es, es 12. Y entonces 5 más 6 más 7 es 18. Y entonces 6 más 12 es 18, más otro 18 es 36 00:01:43.944 --> 00:01:50.241 dividido por nueve, será igual a 4. Permitan me mostrales que esto es lo mismo que la media de las medias. 00:01:50.302 --> 00:01:57.056 Así pues, la media de este primer grupo justo aquí, Ese en verde, la media del primer grupo justo aquí 00:01:57.056 --> 00:02:03.856 es 3 más 2 más 1, eso es 6, dividido por 3 datos, así sería igual a 2. 00:02:03.856 --> 00:02:12.677 la media del grupo 2, la suma aquí es 12, vimos eso aquí mismo: 5 más 4 es 12, dividido 00:02:12.677 --> 00:02:21.846 por 3 es 4, porque tenemos tres datos. Y entonces la media del grupo 3, 5 más 6 más 7 00:02:21.846 --> 00:02:27.256 es 18 dividido por 3 es 6, Entonces, si ustedes van a tomar la media de las medias 00:02:27.256 --> 00:02:31.015 la cual es en otra forma esta gran media, tienen 2 más 4 más 6 00:02:31.015 --> 00:02:35.892 lo cual es 12 dividido por 3 medias y de nuevo obtendríamos 4. 00:02:35.892 --> 00:02:38.933 Así que pueden ver esta como la media de todos los datos y de todos los grupos 00:02:38.933 --> 00:02:43.600 o la media de medias de cada uno de esos grupos. Pero otra forma en que la hemos calculado, 00:02:43.600 --> 00:02:48.836 de hecho, podemos obtener la suma total de cuadrados. <i>*</i> Entonces hagamos eso. 00:02:48.836 --> 00:02:57.887 esto será igual a: 3 menos 4, el 4 es este 4 de aquí, al cuadrado; más 00:02:57.887 --> 00:03:05.667 2 menos 4 al cuadrado; más 1 menos 4 al cuadrado, ahora haremos esos chicos de morado, 00:03:05.667 --> 00:03:16.031 más 5 menos 4 al cuadrado; más 3 menos 4 al cuadrado; más 4 menos 4 al cuadrado 00:03:16.031 --> 00:03:20.667 , más 4 menos 4 al cuadrado. Solo nos quedan tres. 00:03:20.667 --> 00:03:32.887 5 más 4 al cuadrado; más 6 menos 4 al cuadrado; más 7 menos 4 al cuadrado. Ahora, ¿Qué nos da esto? 00:03:32.887 --> 00:03:38.436 la primera será igual a, 3 menos 4, la diferencia es 1, lo elevan al cuadrado. 00:03:38.436 --> 00:03:42.200 van a obtener,...er,..., de hecho, es un 1 negativo, lo elevan al cuadrado y consiguen 1. 00:03:42.200 --> 00:03:51.000 más, consiguen un 2 negativo, al cuadrado es 4; más 3 al cuadrado. menos tres al cuadrado es 9. 00:03:51.000 --> 00:03:57.698 Y entonces tenemos aquí el magenta: 5 menos 4 es 4, al cuadrado es todavía 1, 3 ,menos 4 al cuadrado es 1 00:03:57.698 --> 00:04:03.210 lo elevan al cuadrado y aún obtienen 1, y 4 menos 4 es cero. Podemos -dejen me escribir un cero aquí-. 00:04:03.210 --> 00:04:06.985 solo para mostrarles que de hecho lo calculamos. y entonces tenemos esos últimos tres datos. 00:04:06.985 --> 00:04:16.667 5 menos 4 al cuadrado, lo que es 1. 6 menos 4 al cuadrado, lo que es 4. Esto es 2 al cuadrado. y entonces 7 menos 4 es 3 00:04:16.667 --> 00:04:24.952 al cuadrado es 9. ¿A qué será igual esto? tengo 1 más 4 más 9. 00:04:25.629 --> 00:04:33.436 1 más 4 más 9 aquí, lo que es 5 más 9. Esto es 14, cierto? 00:04:33.436 --> 00:04:39.638 5 más... yep, 14. y también tenemos otro 14 aquí porque tenemos un 1 más 4 más 9 00:04:39.638 --> 00:04:43.632 así que aquí hay también 14. Y entonces tenemos 2 aquí. Entonces esto será 00:04:43.632 --> 00:04:55.056 28, 14 por 2, 14 más 14 es 28, más 2 es 30. Es igual a 30. Así, nuestra suma total de cuadrados 00:04:55.056 --> 00:04:59.561 y de hecho, si queremos la varianza dividiríamos sobre los grados de libertad 00:04:59.561 --> 00:05:05.551 Y son varias veces los grados de libertad. digamos, digamos que tenemos 00:05:05.551 --> 00:05:11.031 sabemos que tenemos m grupos, dejen me escribir , y voy 00:05:11.031 --> 00:05:14.236 a probar cosas rigurosamente, pero quiero que muestren, quiero mostrarles 00:05:14.236 --> 00:05:18.740 de donde vienen algunas de esas extrañas formulas que se ven en estadística 00:05:18.740 --> 00:05:25.667 sin probarlas rigurosamente, darles la idea intuitiva. Tenemos m grupos 00:05:25.667 --> 00:05:34.344 y cada grupo tiene n integrantes, ¿Cuantos integrantes tenemos aquí? 00:05:34.344 --> 00:05:41.498 Bueno, tendremos m veces n, o 9, ¿cierto? Tres veces tres miembros en total. Los grados de libertad, recordemos, 00:05:41.498 --> 00:05:47.800 tenemos, sin importar cuántos datos, tenemos menos 1 grados de libertad. Porque si ustedes saben 00:05:47.800 --> 00:05:52.800 que si ustedes conocieran la media de las medias, si conocen la media de las medias, si asumen que la conocieran 00:05:52.800 --> 00:05:59.323 entonces ustedes solo, <i>*</i> solo n, er, 9 menos 1, solo 8 de esos les darían nueva información 00:05:59.323 --> 00:06:04.471 porque si las conocen, podrían calcular la última, o no tendía que ser 00:06:04.471 --> 00:06:09.824 la última, si ustedes tienen las otras 8 pueden calcular esta última. Si tienen 8 de esas ustedes siempre pueden calcular 00:06:09.824 --> 00:06:16.600 la novena usando la media de medias. así, una forma de pensarlo es que hay solo 8 medidas independientes 00:06:16.600 --> 00:06:22.883 O si quieren hablar en general, quieren hablar en general, hay 00:06:22.883 --> 00:06:30.397 m por n, de modo que es el número total de muestras, menos 1 grados de libertad 00:06:33.720 --> 00:06:41.810 Y si van a calcular la varianza, solo dividiríamos 30 sobre m por n menos 1 00:06:41.810 --> 00:06:47.077 U otra forma de decirlo, 8 grados de libertad para este ejemplo en particular. Toman 30 00:06:47.077 --> 00:06:53.000 dividido 8 y tienen la varianza para este grupo entero. El grupo de 9 [...] 00:06:53.000 --> 00:06:58.533 los dejaré hasta aquí en este vídeo. en el próximo vídeo vamos a tratar de descubrir cuanto de esta varianza total 00:06:58.533 --> 00:07:08.333 cuanto de esta suma de cuadrados, variación total, viene de la variación 00:07:08.333 --> 00:07:14.313 entre cada uno de esos grupos vs la variación entre los grupos. Y creo que ustedes 00:07:14.313 --> 00:07:19.667 van a entender de dónde está viniendo este análisis completo de varianza. miren, aquí la varianza de 00:07:19.667 --> 00:07:24.800 de este grupo entero de nueve pero algunos de <i>*</i>, si esos grupos son distintos de alguna forma 00:07:24.800 --> 00:07:31.267 puede venir de la variación en diferentes grupos vs la variación dentro de 00:07:31.267 --> 00:07:34.564 un grupo. vamos a calcular esas dos cosas y veremos que esas van a sumar 00:07:34.579 --> 99:59:59.999 la suma total de cuadrados.