1
00:00:00,107 --> 00:00:03,926
♪ [música] ♪
2
00:00:20,880 --> 00:00:22,077
[Thomas Stratmann] Hola.
3
00:00:22,077 --> 00:00:24,268
En las próximas series de videos
4
00:00:24,268 --> 00:00:26,858
les vamos a dar una herramienta
nueva muy útil
5
00:00:26,858 --> 00:00:30,414
para ponerla en su caja de herramientas
de Understanding Data
6
00:00:30,414 --> 00:00:31,981
regresión lineal.
7
00:00:32,885 --> 00:00:34,668
Imaginemos que tiene esta teoría.
8
00:00:34,668 --> 00:00:37,249
Ha visto que personas atractivas
parecen tener ventajas especiales.
9
00:00:37,249 --> 00:00:39,067
10
00:00:39,642 --> 00:00:40,878
Y se pregunta
11
00:00:40,878 --> 00:00:43,798
"¿Dónde más se podría ver este fenómeno?".
12
00:00:44,132 --> 00:00:45,637
¿Qué tal el caso de los profesores?
13
00:00:45,637 --> 00:00:48,259
¿Es posible que los profesores atractivos
obtengan ventajas especiales también?
14
00:00:48,259 --> 00:00:50,010
15
00:00:50,350 --> 00:00:53,899
¿Es posible que los estudiantes
los traten mejor
16
00:00:53,899 --> 00:00:57,209
llenándolos de evaluaciones
mejores de los estudiantes?
17
00:00:57,866 --> 00:01:00,467
Si es así, ¿el efecto de la apariencia
18
00:01:00,467 --> 00:01:03,573
en las evaluaciones
es grande o muy pequeño?
19
00:01:04,159 --> 00:01:07,519
Supongamos que un profesor nuevo
está comenzando en una universidad.
20
00:01:07,519 --> 00:01:08,759
Buenos días, amigos.
21
00:01:08,759 --> 00:01:11,810
¿Qué podemos predecir sobre su evaluación
22
00:01:11,810 --> 00:01:13,371
con solo mirar su apariencia?
23
00:01:13,940 --> 00:01:17,216
Dado que estas evaluaciones
pueden determinar los aumentos salariales
24
00:01:17,671 --> 00:01:21,709
si esta teoría fuera cierta,
veríamos a profesores recurrir
25
00:01:21,709 --> 00:01:24,519
a tácticas sorprendentes
para mejorar sus puntajes.
26
00:01:24,519 --> 00:01:25,731
27
00:01:25,731 --> 00:01:27,461
Supongamos que quería saber
28
00:01:27,461 --> 00:01:30,801
si las evaluaciones mejoran
con una mejor apariencia.
29
00:01:31,441 --> 00:01:34,450
¿Cómo haría para probar esta hipótesis?
30
00:01:34,956 --> 00:01:36,552
Podría recolectar datos.
31
00:01:36,761 --> 00:01:40,025
Primero, le pediría a los estudiantes
que califiquen en una escala del 1 al 10
32
00:01:40,025 --> 00:01:42,076
qué tan apuesto les parece un profesor
33
00:01:42,076 --> 00:01:44,807
lo que les da un puntaje
de atractivo promedio.
34
00:01:45,229 --> 00:01:48,552
Luego, puede extraer las evaluaciones
de enseñanza del profesor
35
00:01:48,552 --> 00:01:50,421
de 25 estudiantes.
36
00:01:50,421 --> 00:01:53,273
Veamos estas dos variables al mismo tiempo
37
00:01:53,273 --> 00:01:54,738
usando una dispersión.
38
00:01:54,981 --> 00:01:57,419
Pondremos el atractivo
en el eje horizontal
39
00:01:57,852 --> 00:02:00,589
y las evaluaciones del profesor
en el eje vertical.
40
00:02:01,223 --> 00:02:04,903
Por ejemplo, este punto
representa al profesor Peate
41
00:02:04,903 --> 00:02:06,423
42
00:02:06,423 --> 00:02:08,811
que recibió un puntaje de atractivo de 3
43
00:02:08,811 --> 00:02:11,866
y una evaluación de 8.425.
44
00:02:12,084 --> 00:02:14,958
Este de aquí es el profesor Helmchen
45
00:02:14,958 --> 00:02:16,797
que es muy atractivo.
46
00:02:16,797 --> 00:02:18,721
Y obtuvo un puntaje de atractivo alto
47
00:02:18,721 --> 00:02:20,872
pero una evaluación no muy buena.
48
00:02:21,101 --> 00:02:22,283
¿Pueden ver una tendencia?
49
00:02:22,283 --> 00:02:25,533
Mientras nos movemos
de izquierda a derecha
50
00:02:25,533 --> 00:02:27,963
en el eje horizontal,
de lo feo a lo atractivo
51
00:02:27,963 --> 00:02:31,186
vemos una tendencia ascendente
en los puntajes de evaluación.
52
00:02:31,870 --> 00:02:35,174
Por cierto, los datos
que revisamos en estas series
53
00:02:35,174 --> 00:02:38,923
no son inventados
54
00:02:38,923 --> 00:02:40,897
vienen de un estudio real,
realizado en la Universidad de Texas.
55
00:02:41,337 --> 00:02:46,023
Si se preguntan, "pulcritud" es una manera
elegante y académica
56
00:02:46,023 --> 00:02:47,880
de referirse a lo atractivo.
57
00:02:48,405 --> 00:02:51,474
Con las dispersiones, puede ser difícil
58
00:02:51,474 --> 00:02:55,594
distinguir la relación exacta
entre dos variables
59
00:02:55,594 --> 00:02:59,104
sobre todo, cuando los valores
fluctúan un poco
60
00:02:59,104 --> 00:03:01,318
si nos desplazamos de izquierda a derecha.
61
00:03:02,000 --> 00:03:04,908
Una manera de suprimir esta fluctuación
62
00:03:04,908 --> 00:03:08,144
es dibujando una línea recta
a través de la nube de datos
63
00:03:08,144 --> 00:03:10,775
de manera que esta línea resuma los datos
64
00:03:10,775 --> 00:03:12,613
lo más aproximado posible.
65
00:03:13,295 --> 00:03:17,181
El término técnico para esto
es "regresión lineal".
66
00:03:17,669 --> 00:03:20,888
Más adelante, hablaremos
sobre cómo se crea esta línea
67
00:03:20,888 --> 00:03:24,278
pero por ahora supongamos
que la línea encaja con los datos
68
00:03:24,278 --> 00:03:26,456
lo más aproximado posible.
69
00:03:27,087 --> 00:03:29,536
¿Qué nos puede decir esta línea?
70
00:03:30,067 --> 00:03:32,596
Primero, vemos rápidamente
71
00:03:32,596 --> 00:03:35,358
si la línea se inclina
hacia arriba o hacia abajo.
72
00:03:36,107 --> 00:03:39,827
En nuestro conjunto de datos, vemos
que la línea se inclina hacia arriba.
73
00:03:40,794 --> 00:03:43,807
Esto confirma lo que especulamos antes
74
00:03:43,807 --> 00:03:45,587
con solo observar la dispersión.
75
00:03:46,070 --> 00:03:50,237
76
00:03:50,237 --> 00:03:53,026
77
00:03:53,544 --> 00:03:55,907
78
00:03:55,907 --> 00:03:59,469
79
00:03:59,768 --> 00:04:03,939
80
00:04:04,377 --> 00:04:07,420
81
00:04:07,857 --> 00:04:10,764
82
00:04:11,158 --> 00:04:13,903
83
00:04:14,389 --> 00:04:17,304
84
00:04:17,770 --> 00:04:21,262
85
00:04:21,579 --> 00:04:25,569
86
00:04:25,569 --> 00:04:28,429
87
00:04:28,429 --> 00:04:30,229
88
00:04:30,229 --> 00:04:31,297
89
00:04:31,297 --> 00:04:34,109
90
00:04:34,683 --> 00:04:36,749
91
00:04:37,019 --> 00:04:38,749
92
00:04:39,233 --> 00:04:41,665
93
00:04:41,665 --> 00:04:43,515
94
00:04:44,844 --> 00:04:47,890
95
00:04:47,890 --> 00:04:49,770
96
00:04:49,770 --> 00:04:52,039
97
00:04:52,838 --> 00:04:55,439
98
00:04:55,439 --> 00:04:58,340
99
00:04:58,833 --> 00:05:00,430
100
00:05:00,430 --> 00:05:03,639
101
00:05:03,639 --> 00:05:06,900
102
00:05:07,344 --> 00:05:09,965
103
00:05:09,965 --> 00:05:12,456
104
00:05:12,456 --> 00:05:15,645
105
00:05:16,052 --> 00:05:18,956
106
00:05:19,228 --> 00:05:22,972
107
00:05:23,660 --> 00:05:27,668
108
00:05:28,080 --> 00:05:32,095
109
00:05:32,095 --> 00:05:34,335
110
00:05:34,335 --> 00:05:37,383
111
00:05:37,861 --> 00:05:40,388
112
00:05:40,388 --> 00:05:43,537
113
00:05:43,537 --> 00:05:45,848
114
00:05:46,346 --> 00:05:49,807
115
00:05:50,289 --> 00:05:53,620
116
00:05:53,620 --> 00:05:54,900
117
00:05:54,900 --> 00:05:58,166
118
00:05:58,922 --> 00:06:02,069
119
00:06:02,069 --> 00:06:05,781
120
00:06:06,626 --> 00:06:09,575
121
00:06:09,846 --> 00:06:14,577
122
00:06:14,577 --> 00:06:18,994
123
00:06:19,408 --> 00:06:21,758
124
00:06:21,758 --> 00:06:24,477
125
00:06:24,477 --> 00:06:26,219
126
00:06:26,219 --> 00:06:28,368
127
00:06:28,368 --> 00:06:30,737
128
00:06:31,762 --> 00:06:35,509
129
00:06:35,509 --> 00:06:39,070
130
00:06:41,169 --> 00:06:42,445
131
00:06:42,445 --> 00:06:45,247
132
00:06:45,568 --> 00:06:47,139
133
00:06:47,139 --> 00:06:48,700
134
00:06:48,700 --> 00:06:50,404
135
00:06:50,865 --> 00:06:53,976
136
00:06:54,313 --> 00:06:55,364
137
00:06:55,598 --> 00:06:58,325
138
00:06:58,325 --> 00:07:01,642
139
00:07:01,892 --> 00:07:04,406