1
00:00:00,087 --> 00:00:06,941
♪ [música] ♪
2
00:00:20,830 --> 00:00:22,027
[Thomas Stratmann] Hola.
3
00:00:22,027 --> 00:00:24,128
En las próximas series de videos
4
00:00:24,128 --> 00:00:26,808
les vamos a dar una herramienta
nueva muy útil
5
00:00:26,808 --> 00:00:30,334
para ponerla en su caja de herramientas
de Understanding Data
6
00:00:30,334 --> 00:00:31,981
regresión lineal.
7
00:00:32,685 --> 00:00:34,608
Imaginemos que tiene esta teoría.
8
00:00:34,608 --> 00:00:39,186
Ha visto que las personas atractivas
parecen tener ventajas especiales.
9
00:00:39,462 --> 00:00:40,728
Y se pregunta
10
00:00:40,728 --> 00:00:43,752
"¿Dónde más se podría ver este fenómeno?".
11
00:00:43,752 --> 00:00:45,567
¿Qué tal el caso de los profesores?
12
00:00:45,567 --> 00:00:49,930
¿Es posible que los profesores atractivos
obtengan ventajas especiales también?
13
00:00:49,930 --> 00:00:53,779
¿Es posible que los estudiantes
los traten mejor
14
00:00:53,779 --> 00:00:57,349
con evaluaciones
mejores de los estudiantes?
15
00:00:57,756 --> 00:01:00,427
Si es así, ¿el efecto de la apariencia
16
00:01:00,427 --> 00:01:03,620
en las evaluaciones
es grande o muy pequeño?
17
00:01:04,059 --> 00:01:08,199
Supongamos que un profesor nuevo
está comenzando en una universidad.
18
00:01:08,199 --> 00:01:13,485
¿Qué podemos predecir sobre su evaluación
con solo mirar su apariencia?
19
00:01:13,830 --> 00:01:17,261
Dado que estas evaluaciones
pueden determinar los aumentos salariales
20
00:01:17,261 --> 00:01:21,619
si esta teoría fuera cierta,
veríamos a profesores recurrir
21
00:01:21,619 --> 00:01:24,995
a tácticas sorprendentes
para mejorar sus puntajes.
22
00:01:25,331 --> 00:01:27,291
Supongamos que quería saber
23
00:01:27,291 --> 00:01:30,813
si las evaluaciones mejoran
con una mejor apariencia.
24
00:01:31,261 --> 00:01:34,484
¿Cómo haría para probar esta hipótesis?
25
00:01:34,856 --> 00:01:36,331
Podría recolectar datos.
26
00:01:36,331 --> 00:01:40,025
Primero, le pediría a los estudiantes
que califiquen en una escala del 1 al 10
27
00:01:40,025 --> 00:01:42,026
qué tan apuesto les parece un profesor
28
00:01:42,026 --> 00:01:44,949
lo que les da un puntaje
de atractivo promedio.
29
00:01:44,949 --> 00:01:48,552
Luego, puede extraer las evaluaciones
de enseñanza del profesor
30
00:01:48,552 --> 00:01:50,361
de 25 estudiantes.
31
00:01:50,361 --> 00:01:53,203
Veamos estas dos variables al mismo tiempo
32
00:01:53,203 --> 00:01:54,771
usando una dispersión.
33
00:01:54,771 --> 00:01:57,512
Pondremos el atractivo
en el eje horizontal
34
00:01:57,512 --> 00:02:00,725
y las evaluaciones del profesor
en el eje vertical.
35
00:02:01,093 --> 00:02:05,444
Por ejemplo, este punto
representa al profesor Peate
36
00:02:06,083 --> 00:02:08,811
que recibió un puntaje de atractivo de 3
37
00:02:08,811 --> 00:02:11,854
y una evaluación de 8.425.
38
00:02:11,854 --> 00:02:14,918
Este de aquí es el profesor Helmchen
39
00:02:14,918 --> 00:02:16,627
que es muy atractivo.
40
00:02:16,627 --> 00:02:20,721
Y obtuvo un puntaje de atractivo alto,
pero una evaluación no muy buena.
41
00:02:20,721 --> 00:02:22,183
¿Pueden ver una tendencia?
42
00:02:22,183 --> 00:02:24,483
Mientras nos movemos
de izquierda a derecha
43
00:02:24,483 --> 00:02:27,753
en el eje horizontal,
de lo feo a lo atractivo
44
00:02:27,753 --> 00:02:31,370
vemos una tendencia ascendente
en los puntajes de evaluación.
45
00:02:31,680 --> 00:02:35,134
Por cierto, los datos
que revisamos en estas series
46
00:02:35,134 --> 00:02:36,618
no son inventados
47
00:02:36,618 --> 00:02:40,914
pertenecen a un estudio real,
realizado en la Universidad de Texas.
48
00:02:41,217 --> 00:02:46,023
Si se preguntan, "pulcritud" es
una manera elegante y académica
49
00:02:46,023 --> 00:02:47,970
de referirse a lo atractivo.
50
00:02:48,295 --> 00:02:51,414
Con las dispersiones, puede ser difícil
51
00:02:51,414 --> 00:02:55,404
distinguir la relación exacta
entre dos variables
52
00:02:55,404 --> 00:02:59,014
sobre todo, cuando los valores
fluctúan un poco
53
00:02:59,014 --> 00:03:01,451
si nos desplazamos de izquierda a derecha.
54
00:03:01,910 --> 00:03:04,718
Una manera de suprimir esta fluctuación
55
00:03:04,718 --> 00:03:08,084
es dibujando una línea recta
a través de la nube de datos
56
00:03:08,084 --> 00:03:10,635
de manera que esta línea resuma los datos
57
00:03:10,635 --> 00:03:12,646
lo más aproximado posible.
58
00:03:13,145 --> 00:03:17,268
El término técnico para esto
es "regresión lineal".
59
00:03:17,639 --> 00:03:20,808
Más adelante, hablaremos
sobre cómo se crea esta línea
60
00:03:20,808 --> 00:03:24,178
pero por ahora supongamos
que la línea encaja con los datos
61
00:03:24,178 --> 00:03:26,476
lo más aproximado posible.
62
00:03:26,987 --> 00:03:29,697
¿Qué nos puede decir esta línea?
63
00:03:29,697 --> 00:03:32,356
Primero, vemos rápidamente
64
00:03:32,356 --> 00:03:35,428
si la línea se inclina
hacia arriba o hacia abajo.
65
00:03:35,907 --> 00:03:39,967
En nuestro conjunto de datos, vemos
que la línea se inclina hacia arriba.
66
00:03:40,624 --> 00:03:43,667
Esto confirma lo que especulamos antes
67
00:03:43,667 --> 00:03:45,605
con solo observar la dispersión.
68
00:03:46,000 --> 00:03:49,987
La pendiente ascendente significa
que existe una asociación positiva
69
00:03:49,987 --> 00:03:53,164
entre los puntajes
de atractivo y de evaluación.
70
00:03:53,164 --> 00:03:55,727
En otras palabras, en promedio
71
00:03:55,727 --> 00:03:59,498
los profesores más atractivos
obtienen mejores evaluaciones.
72
00:03:59,498 --> 00:04:04,017
Para otros conjuntos de datos,
podríamos ver una asociación más fuerte
73
00:04:04,017 --> 00:04:07,523
o podría haber una asociación negativa.
74
00:04:07,817 --> 00:04:10,778
O quizás no obtendría ninguna asociación.
75
00:04:10,778 --> 00:04:13,985
Y nuestras líneas
no tienen que ser rectas.
76
00:04:14,359 --> 00:04:17,319
Pueden ser una curva para encajar
los datos cuando sea necesario.
77
00:04:17,710 --> 00:04:21,379
Esta línea también nos brinda
una manera de predecir los resultados.
78
00:04:21,379 --> 00:04:25,419
Podemos tomar un puntaje de atractivo
y medir la línea
79
00:04:25,419 --> 00:04:28,429
de lo que sería el puntaje
de evaluación predicho.
80
00:04:28,429 --> 00:04:30,441
Ahora volvamos al profesor nuevo.
81
00:04:30,817 --> 00:04:34,217
Podemos medir con precisión
su puntaje de evaluación.
82
00:04:34,603 --> 00:04:36,759
Pero esperen un momento
83
00:04:36,759 --> 00:04:38,889
¿podemos confiar en esta predicción?
84
00:04:38,893 --> 00:04:41,465
¿Qué tan bien esta variable de atractivo
85
00:04:41,465 --> 00:04:43,638
predice las evaluaciones?
86
00:04:44,464 --> 00:04:47,730
La regresión lineal nos brinda
algunas medidas útiles
87
00:04:47,730 --> 00:04:49,640
para responder esas preguntas
88
00:04:49,640 --> 00:04:52,147
de las cuales hablaremos
en un próximo video.
89
00:04:52,788 --> 00:04:55,439
Además, debemos tener cuidado
de otros inconvenientes
90
00:04:55,439 --> 00:04:58,378
antes de llegar
a conclusiones definitivas.
91
00:04:58,773 --> 00:05:00,430
Imaginemos este escenario
92
00:05:00,430 --> 00:05:03,639
donde lo que está impulsando
la asociación que vemos
93
00:05:03,639 --> 00:05:07,134
es una tercera variable
que dejamos de lado.
94
00:05:07,134 --> 00:05:09,885
Por ejemplo, la dificultad del curso
95
00:05:09,885 --> 00:05:12,396
podría estar
detrás de la asociación positiva
96
00:05:12,396 --> 00:05:15,747
entre las tasas de atractivo
y los puntajes de evaluación.
97
00:05:15,752 --> 00:05:18,998
Los cursos introductorios fáciles
obtienen evaluaciones buenas
98
00:05:18,998 --> 00:05:23,063
y los cursos más difíciles y avanzados
obtienen evaluaciones malas.
99
00:05:23,520 --> 00:05:27,730
Los profesores jóvenes pueden ser
asignados a los cursos introductorios.
100
00:05:27,730 --> 00:05:31,875
Entonces, si los estudiantes piensan
que los profesores jóvenes son atractivos
101
00:05:31,875 --> 00:05:34,175
encontrarán una asociación positiva
102
00:05:34,175 --> 00:05:37,479
entre las tasas de atractivo
y los puntajes de evaluación.
103
00:05:37,481 --> 00:05:40,198
Pero la dificultad del curso
104
00:05:40,198 --> 00:05:43,537
la variable que dejamos de lado,
y no la parte del atractivo
105
00:05:43,537 --> 00:05:46,026
lo que está impulsando
los puntajes de evaluaciones.
106
00:05:46,026 --> 00:05:49,999
En ese caso, las horas en el espejo
no servirían de nada
107
00:05:49,999 --> 00:05:54,097
un caso de correlación erróneo
por causalidad.
108
00:05:54,590 --> 00:05:58,238
Hablaremos sobre esto en otro video.
109
00:05:58,682 --> 00:06:01,989
¿Y qué sucedería si hubiera
otras variables importantes
110
00:06:01,989 --> 00:06:05,501
que afecten tanto las tasas de atractivo
como los puntajes de evaluación?
111
00:06:06,266 --> 00:06:11,225
Podría agregar consideraciones
como la habilidad, la raza, el sexo
112
00:06:11,225 --> 00:06:14,497
y si el idioma inglés es
la lengua nativa del profesor
113
00:06:14,497 --> 00:06:19,058
para aislar más el efecto
del atractivo en las evaluaciones.
114
00:06:19,058 --> 00:06:21,628
Cuando tenemos una regresión múltiple
115
00:06:21,628 --> 00:06:24,177
podremos medir el impacto del atractivo
116
00:06:24,177 --> 00:06:26,219
en las evaluaciones del profesor
117
00:06:26,219 --> 00:06:30,696
mientras consideramos otras variables
que podrían confundir esta asociación.
118
00:06:31,672 --> 00:06:35,309
En el próximo episodio,
jugaremos un poco con estos datos
119
00:06:35,309 --> 00:06:39,046
para obtener un mejor entendimiento
de lo que esta línea puede decirnos.
120
00:06:40,919 --> 00:06:42,275
[Narrador] ¡Felicitaciones!
121
00:06:42,275 --> 00:06:45,228
Está un paso más cerca
de ser un ninja de los datos.
122
00:06:45,228 --> 00:06:48,540
Pero para mejorar,
necesita fortalecer sus habilidades
123
00:06:48,540 --> 00:06:50,445
con algunas preguntas de práctica.
124
00:06:50,445 --> 00:06:53,742
¿Listo para su próxima misión?
Haga clic en "Next Video".
125
00:06:54,213 --> 00:06:55,328
¿Sigue aquí?
126
00:06:55,328 --> 00:06:58,205
Pase de entender los datos
a entender su mundo
127
00:06:58,205 --> 00:07:01,592
revisando nuestros otros videos
populares de economía de MRU.
128
00:07:01,592 --> 00:07:03,513
♪ [música] ♪