1
00:00:00,441 --> 00:00:07,657
En este video y en el próximo par haremos bastantes cálculos con este juego de datos que tenemos aquí.
2
00:00:07,657 --> 00:00:12,608
Y espero que el camino a través de estos cálculos les dará una comprensión intuitiva sobre el Análisis de Varianza.
3
00:00:12,608 --> 00:00:18,941
Lo primero que quiero hacer en este video es calcular el sumatorio total de
4
00:00:18,941 --> 00:00:27,455
cuadrados. Lo llamaré "SST". Suma Total de Cuadrados.
Y lo podría ver como el numerador cuando
5
00:00:27,455 --> 00:00:31,576
calculáis la varianza. Así que escogeremos la distancia entre cada uno de estos datos
6
00:00:31,576 --> 00:00:36,078
y la media de todos estos datos, los elevaremos al cuadrado y nos quedaremos con esa suma, no dividiremos la suma
7
00:00:36,078 --> 00:00:40,732
por los grados de libertad, que es lo que normalmente haría si estuviera calculando la varianza de la muestra.
8
00:00:40,763 --> 00:00:45,279
¿Cuanto será en este caso? Bien,, lo primero que tenemos que hacer es obtener la media de
9
00:00:45,279 --> 00:00:49,692
todos estos datos. Y de hecho la llamaré la "Gran Media".
10
00:00:49,692 --> 00:00:53,359
Lo llamaré la "Gran Media". Y permitanme mostrarles en un segundo que se trata de lo mismo que la media
11
00:00:53,359 --> 00:00:59,013
de las medias de cada uno de esos conjuntos de datos. Así pues, calculemos la gran media.
12
00:00:59,013 --> 00:01:16,152
Será: 3 más 2 más 1. 3 más 2 más 1, más 5 más 3 más 4, más 5 más 6 más 7... más 5 más 6 más 7.
13
00:01:16,152 --> 00:01:22,102
Y entonces aquí tenemos nueve datos. Tenemos nueve puntos de datos por lo que dividiremos por nueve y entonces
14
00:01:22,102 --> 00:01:30,354
esto será igual a... 3 más 2 más 1 es 6. 6 más, solo dejenme sumar...eh... o sea que son 6. 5 más
15
00:01:30,385 --> 00:01:43,944
3 más 4 es, es 12. Y entonces 5 más 6 más 7 es 18. Y entonces 6 más 12 es 18, más otro 18 es 36
16
00:01:43,944 --> 00:01:50,241
dividido por nueve, será igual a 4. Permitan me mostrales que esto es lo mismo que la media de las medias.
17
00:01:50,302 --> 00:01:57,056
Así pues, la media de este primer grupo justo aquí, Ese en verde, la media del primer grupo justo aquí
18
00:01:57,056 --> 00:02:03,856
es 3 más 2 más 1, eso es 6, dividido por 3 datos, así sería igual a 2.
19
00:02:03,856 --> 00:02:12,677
la media del grupo 2, la suma aquí es 12, vimos eso aquí mismo: 5 más 4 es 12, dividido
20
00:02:12,677 --> 00:02:21,846
por 3 es 4, porque tenemos tres datos. Y entonces la media del grupo 3, 5 más 6 más 7
21
00:02:21,846 --> 00:02:27,256
es 18 dividido por 3 es 6, Entonces, si ustedes van a tomar la media de las medias
22
00:02:27,256 --> 00:02:31,015
la cual es en otra forma esta gran media, tienen 2 más 4 más 6
23
00:02:31,015 --> 00:02:35,892
lo cual es 12 dividido por 3 medias y de nuevo obtendríamos 4.
24
00:02:35,892 --> 00:02:38,933
Así que pueden ver esta como la media de todos los datos y de todos los grupos
25
00:02:38,933 --> 00:02:43,600
o la media de medias de cada uno de esos grupos. Pero otra forma en que la hemos calculado,
26
00:02:43,600 --> 00:02:48,836
de hecho, podemos obtener la suma total de cuadrados. * Entonces hagamos eso.
27
00:02:48,836 --> 00:02:57,887
esto será igual a: 3 menos 4, el 4 es este 4 de aquí, al cuadrado; más
28
00:02:57,887 --> 00:03:05,667
2 menos 4 al cuadrado; más 1 menos 4 al cuadrado, ahora haremos esos chicos de morado,
29
00:03:05,667 --> 00:03:16,031
más 5 menos 4 al cuadrado; más 3 menos 4 al cuadrado; más 4 menos 4 al cuadrado
30
00:03:16,031 --> 00:03:20,667
, más 4 menos 4 al cuadrado. Solo nos quedan tres.
31
00:03:20,667 --> 00:03:32,887
5 más 4 al cuadrado; más 6 menos 4 al cuadrado; más 7 menos 4 al cuadrado. Ahora, ¿Qué nos da esto?
32
00:03:32,887 --> 00:03:38,436
la primera será igual a, 3 menos 4, la diferencia es 1, lo elevan al cuadrado.
33
00:03:38,436 --> 00:03:42,200
van a obtener,...er,..., de hecho, es un 1 negativo, lo elevan al cuadrado y consiguen 1.
34
00:03:42,200 --> 00:03:51,000
más, consiguen un 2 negativo, al cuadrado es 4; más 3 al cuadrado. menos tres al cuadrado es 9.
35
00:03:51,000 --> 00:03:57,698
Y entonces tenemos aquí el magenta: 5 menos 4 es 4, al cuadrado es todavía 1, 3 ,menos 4 al cuadrado es 1
36
00:03:57,698 --> 00:04:03,210
lo elevan al cuadrado y aún obtienen 1, y 4 menos 4 es cero. Podemos -dejen me escribir un cero aquí-.
37
00:04:03,210 --> 00:04:06,985
solo para mostrarles que de hecho lo calculamos. y entonces tenemos esos últimos tres datos.
38
00:04:06,985 --> 00:04:16,667
5 menos 4 al cuadrado, lo que es 1. 6 menos 4 al cuadrado, lo que es 4. Esto es 2 al cuadrado. y entonces 7 menos 4 es 3
39
00:04:16,667 --> 00:04:24,952
al cuadrado es 9. ¿A qué será igual esto? tengo 1 más 4 más 9.
40
00:04:25,629 --> 00:04:33,436
1 más 4 más 9 aquí, lo que es 5 más 9. Esto es 14, cierto?
41
00:04:33,436 --> 00:04:39,638
5 más... yep, 14. y también tenemos otro 14 aquí porque tenemos un 1 más 4 más 9
42
00:04:39,638 --> 00:04:43,632
así que aquí hay también 14. Y entonces tenemos 2 aquí. Entonces esto será
43
00:04:43,632 --> 00:04:55,056
28, 14 por 2, 14 más 14 es 28, más 2 es 30. Es igual a 30. Así, nuestra suma total de cuadrados
44
00:04:55,056 --> 00:04:59,561
y de hecho, si queremos la varianza dividiríamos sobre los grados de libertad
45
00:04:59,561 --> 00:05:05,551
Y son varias veces los grados de libertad. digamos, digamos que tenemos
46
00:05:05,551 --> 00:05:11,031
sabemos que tenemos m grupos, dejen me escribir , y voy
47
00:05:11,031 --> 00:05:14,236
a probar cosas rigurosamente, pero quiero que muestren, quiero mostrarles
48
00:05:14,236 --> 00:05:18,740
de donde vienen algunas de esas extrañas formulas que se ven en estadística
49
00:05:18,740 --> 00:05:25,667
sin probarlas rigurosamente, darles la idea intuitiva. Tenemos m grupos
50
00:05:25,667 --> 00:05:34,344
y cada grupo tiene n integrantes, ¿Cuantos integrantes tenemos aquí?
51
00:05:34,344 --> 00:05:41,498
Bueno, tendremos m veces n, o 9, ¿cierto? Tres veces tres miembros en total. Los grados de libertad, recordemos,
52
00:05:41,498 --> 00:05:47,800
tenemos, sin importar cuántos datos, tenemos menos 1 grados de libertad. Porque si ustedes saben
53
00:05:47,800 --> 00:05:52,800
que si ustedes conocieran la media de las medias, si conocen la media de las medias, si asumen que la conocieran
54
00:05:52,800 --> 00:05:59,323
entonces ustedes solo, * solo n, er, 9 menos 1, solo 8 de esos les darían nueva información
55
00:05:59,323 --> 00:06:04,471
porque si las conocen, podrían calcular la última, o no tendía que ser
56
00:06:04,471 --> 00:06:09,824
la última, si ustedes tienen las otras 8 pueden calcular esta última. Si tienen 8 de esas ustedes siempre pueden calcular
57
00:06:09,824 --> 00:06:16,600
la novena usando la media de medias. así, una forma de pensarlo es que hay solo 8 medidas independientes
58
00:06:16,600 --> 00:06:22,883
O si quieren hablar en general, quieren hablar en general, hay
59
00:06:22,883 --> 00:06:30,397
m por n, de modo que es el número total de muestras, menos 1 grados de libertad
60
00:06:33,720 --> 00:06:41,810
Y si van a calcular la varianza, solo dividiríamos 30 sobre m por n menos 1
61
00:06:41,810 --> 00:06:47,077
U otra forma de decirlo, 8 grados de libertad para este ejemplo en particular. Toman 30
62
00:06:47,077 --> 00:06:53,000
dividido 8 y tienen la varianza para este grupo entero. El grupo de 9 [...]
63
00:06:53,000 --> 00:06:58,533
los dejaré hasta aquí en este vídeo. en el próximo vídeo vamos a tratar de descubrir cuanto de esta varianza total
64
00:06:58,533 --> 00:07:08,333
cuanto de esta suma de cuadrados, variación total, viene de la variación
65
00:07:08,333 --> 00:07:14,313
entre cada uno de esos grupos vs la variación entre los grupos. Y creo que ustedes
66
00:07:14,313 --> 00:07:19,667
van a entender de dónde está viniendo este análisis completo de varianza. miren, aquí la varianza de
67
00:07:19,667 --> 00:07:24,800
de este grupo entero de nueve pero algunos de *, si esos grupos son distintos de alguna forma
68
00:07:24,800 --> 00:07:31,267
puede venir de la variación en diferentes grupos vs la variación dentro de
69
00:07:31,267 --> 00:07:34,564
un grupo. vamos a calcular esas dos cosas y veremos que esas van a sumar
70
00:07:34,579 --> 99:59:59,999
la suma total de cuadrados.