1 00:00:00,441 --> 00:00:07,657 En este video y en el próximo par haremos bastantes cálculos con este juego de datos que tenemos aquí. 2 00:00:07,657 --> 00:00:12,608 Y espero que el camino a través de estos cálculos les dará una comprensión intuitiva sobre el Análisis de Varianza. 3 00:00:12,608 --> 00:00:18,941 Lo primero que quiero hacer en este video es calcular el sumatorio total de 4 00:00:18,941 --> 00:00:27,455 cuadrados. Lo llamaré "SST". Suma Total de Cuadrados. Y lo podría ver como el numerador cuando 5 00:00:27,455 --> 00:00:31,576 calculáis la varianza. Así que escogeremos la distancia entre cada uno de estos datos 6 00:00:31,576 --> 00:00:36,078 y la media de todos estos datos, los elevaremos al cuadrado y nos quedaremos con esa suma, no dividiremos la suma 7 00:00:36,078 --> 00:00:40,732 por los grados de libertad, que es lo que normalmente haría si estuviera calculando la varianza de la muestra. 8 00:00:40,763 --> 00:00:45,279 ¿Cuanto será en este caso? Bien,, lo primero que tenemos que hacer es obtener la media de 9 00:00:45,279 --> 00:00:49,692 todos estos datos. Y de hecho la llamaré la "Gran Media". 10 00:00:49,692 --> 00:00:53,359 Lo llamaré la "Gran Media". Y permitanme mostrarles en un segundo que se trata de lo mismo que la media 11 00:00:53,359 --> 00:00:59,013 de las medias de cada uno de esos conjuntos de datos. Así pues, calculemos la gran media. 12 00:00:59,013 --> 00:01:16,152 Será: 3 más 2 más 1. 3 más 2 más 1, más 5 más 3 más 4, más 5 más 6 más 7... más 5 más 6 más 7. 13 00:01:16,152 --> 00:01:22,102 Y entonces aquí tenemos nueve datos. Tenemos nueve puntos de datos por lo que dividiremos por nueve y entonces 14 00:01:22,102 --> 00:01:30,354 esto será igual a... 3 más 2 más 1 es 6. 6 más, solo dejenme sumar...eh... o sea que son 6. 5 más 15 00:01:30,385 --> 00:01:43,944 3 más 4 es, es 12. Y entonces 5 más 6 más 7 es 18. Y entonces 6 más 12 es 18, más otro 18 es 36 16 00:01:43,944 --> 00:01:50,241 dividido por nueve, será igual a 4. Permitan me mostrales que esto es lo mismo que la media de las medias. 17 00:01:50,302 --> 00:01:57,056 Así pues, la media de este primer grupo justo aquí, Ese en verde, la media del primer grupo justo aquí 18 00:01:57,056 --> 00:02:03,856 es 3 más 2 más 1, eso es 6, dividido por 3 datos, así sería igual a 2. 19 00:02:03,856 --> 00:02:12,677 la media del grupo 2, la suma aquí es 12, vimos eso aquí mismo: 5 más 4 es 12, dividido 20 00:02:12,677 --> 00:02:21,846 por 3 es 4, porque tenemos tres datos. Y entonces la media del grupo 3, 5 más 6 más 7 21 00:02:21,846 --> 00:02:27,256 es 18 dividido por 3 es 6, Entonces, si ustedes van a tomar la media de las medias 22 00:02:27,256 --> 00:02:31,015 la cual es en otra forma esta gran media, tienen 2 más 4 más 6 23 00:02:31,015 --> 00:02:35,892 lo cual es 12 dividido por 3 medias y de nuevo obtendríamos 4. 24 00:02:35,892 --> 00:02:38,933 Así que pueden ver esta como la media de todos los datos y de todos los grupos 25 00:02:38,933 --> 00:02:43,600 o la media de medias de cada uno de esos grupos. Pero otra forma en que la hemos calculado, 26 00:02:43,600 --> 00:02:48,836 de hecho, podemos obtener la suma total de cuadrados. * Entonces hagamos eso. 27 00:02:48,836 --> 00:02:57,887 esto será igual a: 3 menos 4, el 4 es este 4 de aquí, al cuadrado; más 28 00:02:57,887 --> 00:03:05,667 2 menos 4 al cuadrado; más 1 menos 4 al cuadrado, ahora haremos esos chicos de morado, 29 00:03:05,667 --> 00:03:16,031 más 5 menos 4 al cuadrado; más 3 menos 4 al cuadrado; más 4 menos 4 al cuadrado 30 00:03:16,031 --> 00:03:20,667 , más 4 menos 4 al cuadrado. Solo nos quedan tres. 31 00:03:20,667 --> 00:03:32,887 5 más 4 al cuadrado; más 6 menos 4 al cuadrado; más 7 menos 4 al cuadrado. Ahora, ¿Qué nos da esto? 32 00:03:32,887 --> 00:03:38,436 la primera será igual a, 3 menos 4, la diferencia es 1, lo elevan al cuadrado. 33 00:03:38,436 --> 00:03:42,200 van a obtener,...er,..., de hecho, es un 1 negativo, lo elevan al cuadrado y consiguen 1. 34 00:03:42,200 --> 00:03:51,000 más, consiguen un 2 negativo, al cuadrado es 4; más 3 al cuadrado. menos tres al cuadrado es 9. 35 00:03:51,000 --> 00:03:57,698 Y entonces tenemos aquí el magenta: 5 menos 4 es 4, al cuadrado es todavía 1, 3 ,menos 4 al cuadrado es 1 36 00:03:57,698 --> 00:04:03,210 lo elevan al cuadrado y aún obtienen 1, y 4 menos 4 es cero. Podemos -dejen me escribir un cero aquí-. 37 00:04:03,210 --> 00:04:06,985 solo para mostrarles que de hecho lo calculamos. y entonces tenemos esos últimos tres datos. 38 00:04:06,985 --> 00:04:16,667 5 menos 4 al cuadrado, lo que es 1. 6 menos 4 al cuadrado, lo que es 4. Esto es 2 al cuadrado. y entonces 7 menos 4 es 3 39 00:04:16,667 --> 00:04:24,952 al cuadrado es 9. ¿A qué será igual esto? tengo 1 más 4 más 9. 40 00:04:25,629 --> 00:04:33,436 1 más 4 más 9 aquí, lo que es 5 más 9. Esto es 14, cierto? 41 00:04:33,436 --> 00:04:39,638 5 más... yep, 14. y también tenemos otro 14 aquí porque tenemos un 1 más 4 más 9 42 00:04:39,638 --> 00:04:43,632 así que aquí hay también 14. Y entonces tenemos 2 aquí. Entonces esto será 43 00:04:43,632 --> 00:04:55,056 28, 14 por 2, 14 más 14 es 28, más 2 es 30. Es igual a 30. Así, nuestra suma total de cuadrados 44 00:04:55,056 --> 00:04:59,561 y de hecho, si queremos la varianza dividiríamos sobre los grados de libertad 45 00:04:59,561 --> 00:05:05,551 Y son varias veces los grados de libertad. digamos, digamos que tenemos 46 00:05:05,551 --> 00:05:11,031 sabemos que tenemos m grupos, dejen me escribir , y voy 47 00:05:11,031 --> 00:05:14,236 a probar cosas rigurosamente, pero quiero que muestren, quiero mostrarles 48 00:05:14,236 --> 00:05:18,740 de donde vienen algunas de esas extrañas formulas que se ven en estadística 49 00:05:18,740 --> 00:05:25,667 sin probarlas rigurosamente, darles la idea intuitiva. Tenemos m grupos 50 00:05:25,667 --> 00:05:34,344 y cada grupo tiene n integrantes, ¿Cuantos integrantes tenemos aquí? 51 00:05:34,344 --> 00:05:41,498 Bueno, tendremos m veces n, o 9, ¿cierto? Tres veces tres miembros en total. Los grados de libertad, recordemos, 52 00:05:41,498 --> 00:05:47,800 tenemos, sin importar cuántos datos, tenemos menos 1 grados de libertad. Porque si ustedes saben 53 00:05:47,800 --> 00:05:52,800 que si ustedes conocieran la media de las medias, si conocen la media de las medias, si asumen que la conocieran 54 00:05:52,800 --> 00:05:59,323 entonces ustedes solo, * solo n, er, 9 menos 1, solo 8 de esos les darían nueva información 55 00:05:59,323 --> 00:06:04,471 porque si las conocen, podrían calcular la última, o no tendía que ser 56 00:06:04,471 --> 00:06:09,824 la última, si ustedes tienen las otras 8 pueden calcular esta última. Si tienen 8 de esas ustedes siempre pueden calcular 57 00:06:09,824 --> 00:06:16,600 la novena usando la media de medias. así, una forma de pensarlo es que hay solo 8 medidas independientes 58 00:06:16,600 --> 00:06:22,883 O si quieren hablar en general, quieren hablar en general, hay 59 00:06:22,883 --> 00:06:30,397 m por n, de modo que es el número total de muestras, menos 1 grados de libertad 60 00:06:33,720 --> 00:06:41,810 Y si van a calcular la varianza, solo dividiríamos 30 sobre m por n menos 1 61 00:06:41,810 --> 00:06:47,077 U otra forma de decirlo, 8 grados de libertad para este ejemplo en particular. Toman 30 62 00:06:47,077 --> 00:06:53,000 dividido 8 y tienen la varianza para este grupo entero. El grupo de 9 [...] 63 00:06:53,000 --> 00:06:58,533 los dejaré hasta aquí en este vídeo. en el próximo vídeo vamos a tratar de descubrir cuanto de esta varianza total 64 00:06:58,533 --> 00:07:08,333 cuanto de esta suma de cuadrados, variación total, viene de la variación 65 00:07:08,333 --> 00:07:14,313 entre cada uno de esos grupos vs la variación entre los grupos. Y creo que ustedes 66 00:07:14,313 --> 00:07:19,667 van a entender de dónde está viniendo este análisis completo de varianza. miren, aquí la varianza de 67 00:07:19,667 --> 00:07:24,800 de este grupo entero de nueve pero algunos de *, si esos grupos son distintos de alguna forma 68 00:07:24,800 --> 00:07:31,267 puede venir de la variación en diferentes grupos vs la variación dentro de 69 00:07:31,267 --> 00:07:34,564 un grupo. vamos a calcular esas dos cosas y veremos que esas van a sumar 70 00:07:34,579 --> 99:59:59,999 la suma total de cuadrados.