WEBVTT
00:00:00.087 --> 00:00:06.941
♪ [música] ♪
00:00:20.830 --> 00:00:22.027
[Thomas Stratmann] Hola.
00:00:22.027 --> 00:00:24.128
En las próximas series de videos
00:00:24.128 --> 00:00:26.808
les vamos a dar una herramienta
nueva muy útil
00:00:26.808 --> 00:00:30.334
para ponerla en su caja de herramientas
de Understanding Data
00:00:30.334 --> 00:00:31.981
regresión lineal.
00:00:32.685 --> 00:00:34.608
Imaginemos que tiene esta teoría.
00:00:34.608 --> 00:00:39.186
Ha visto que las personas atractivas
parecen tener ventajas especiales.
00:00:39.462 --> 00:00:40.728
Y se pregunta
00:00:40.728 --> 00:00:43.752
"¿Dónde más se podría ver este fenómeno?".
00:00:43.752 --> 00:00:45.567
¿Qué tal el caso de los profesores?
00:00:45.567 --> 00:00:49.930
¿Es posible que los profesores atractivos
obtengan ventajas especiales también?
00:00:49.930 --> 00:00:53.779
¿Es posible que los estudiantes
los traten mejor
00:00:53.779 --> 00:00:57.349
con evaluaciones
mejores de los estudiantes?
00:00:57.756 --> 00:01:00.427
Si es así, ¿el efecto de la apariencia
00:01:00.427 --> 00:01:03.620
en las evaluaciones
es grande o muy pequeño?
00:01:04.059 --> 00:01:08.199
Supongamos que un profesor nuevo
está comenzando en una universidad.
00:01:08.199 --> 00:01:13.485
¿Qué podemos predecir sobre su evaluación
con solo mirar su apariencia?
00:01:13.830 --> 00:01:17.261
Dado que estas evaluaciones
pueden determinar los aumentos salariales
00:01:17.261 --> 00:01:21.619
si esta teoría fuera cierta,
veríamos a profesores recurrir
00:01:21.619 --> 00:01:24.995
a tácticas sorprendentes
para mejorar sus puntajes.
00:01:25.331 --> 00:01:27.291
Supongamos que quería saber
00:01:27.291 --> 00:01:30.813
si las evaluaciones mejoran
con una mejor apariencia.
00:01:31.261 --> 00:01:34.484
¿Cómo haría para probar esta hipótesis?
00:01:34.856 --> 00:01:36.331
Podría recolectar datos.
00:01:36.331 --> 00:01:40.025
Primero, le pediría a los estudiantes
que califiquen en una escala del 1 al 10
00:01:40.025 --> 00:01:42.026
qué tan apuesto les parece un profesor
00:01:42.026 --> 00:01:44.949
lo que les da un puntaje
de atractivo promedio.
00:01:44.949 --> 00:01:48.552
Luego, puede extraer las evaluaciones
de enseñanza del profesor
00:01:48.552 --> 00:01:50.361
de 25 estudiantes.
00:01:50.361 --> 00:01:53.203
Veamos estas dos variables al mismo tiempo
00:01:53.203 --> 00:01:54.771
usando una dispersión.
00:01:54.771 --> 00:01:57.512
Pondremos el atractivo
en el eje horizontal
00:01:57.512 --> 00:02:00.725
y las evaluaciones del profesor
en el eje vertical.
00:02:01.093 --> 00:02:05.444
Por ejemplo, este punto
representa al profesor Peate
00:02:06.083 --> 00:02:08.811
que recibió un puntaje de atractivo de 3
00:02:08.811 --> 00:02:11.854
y una evaluación de 8.425.
00:02:11.854 --> 00:02:14.918
Este de aquí es el profesor Helmchen
00:02:14.918 --> 00:02:16.627
que es muy atractivo.
00:02:16.627 --> 00:02:20.721
Y obtuvo un puntaje de atractivo alto,
pero una evaluación no muy buena.
00:02:20.721 --> 00:02:22.183
¿Pueden ver una tendencia?
00:02:22.183 --> 00:02:24.483
Mientras nos movemos
de izquierda a derecha
00:02:24.483 --> 00:02:27.753
en el eje horizontal,
de lo feo a lo atractivo
00:02:27.753 --> 00:02:31.370
vemos una tendencia ascendente
en los puntajes de evaluación.
00:02:31.680 --> 00:02:35.134
Por cierto, los datos
que revisamos en estas series
00:02:35.134 --> 00:02:36.618
no son inventados
00:02:36.618 --> 00:02:40.914
pertenecen a un estudio real,
realizado en la Universidad de Texas.
00:02:41.217 --> 00:02:46.023
Si se preguntan, "pulcritud" es
una manera elegante y académica
00:02:46.023 --> 00:02:47.970
de referirse a lo atractivo.
00:02:48.295 --> 00:02:51.414
Con las dispersiones, puede ser difícil
00:02:51.414 --> 00:02:55.404
distinguir la relación exacta
entre dos variables
00:02:55.404 --> 00:02:59.014
sobre todo, cuando los valores
fluctúan un poco
00:02:59.014 --> 00:03:01.451
si nos desplazamos de izquierda a derecha.
00:03:01.910 --> 00:03:04.718
Una manera de suprimir esta fluctuación
00:03:04.718 --> 00:03:08.084
es dibujando una línea recta
a través de la nube de datos
00:03:08.084 --> 00:03:10.635
de manera que esta línea resuma los datos
00:03:10.635 --> 00:03:12.646
lo más aproximado posible.
00:03:13.145 --> 00:03:17.268
El término técnico para esto
es "regresión lineal".
00:03:17.639 --> 00:03:20.808
Más adelante, hablaremos
sobre cómo se crea esta línea
00:03:20.808 --> 00:03:24.178
pero por ahora supongamos
que la línea encaja con los datos
00:03:24.178 --> 00:03:26.476
lo más aproximado posible.
00:03:26.987 --> 00:03:29.697
¿Qué nos puede decir esta línea?
00:03:29.697 --> 00:03:32.356
Primero, vemos rápidamente
00:03:32.356 --> 00:03:35.428
si la línea se inclina
hacia arriba o hacia abajo.
00:03:35.907 --> 00:03:39.967
En nuestro conjunto de datos, vemos
que la línea se inclina hacia arriba.
00:03:40.624 --> 00:03:43.667
Esto confirma lo que especulamos antes
00:03:43.667 --> 00:03:45.605
con solo observar la dispersión.
00:03:46.000 --> 00:03:49.987
La pendiente ascendente significa
que existe una asociación positiva
00:03:49.987 --> 00:03:53.164
entre los puntajes
de atractivo y de evaluación.
00:03:53.164 --> 00:03:55.727
En otras palabras, en promedio
00:03:55.727 --> 00:03:59.498
los profesores más atractivos
obtienen mejores evaluaciones.
00:03:59.498 --> 00:04:04.017
Para otros conjuntos de datos,
podríamos ver una asociación más fuerte
00:04:04.017 --> 00:04:07.523
o podría haber una asociación negativa.
00:04:07.817 --> 00:04:10.778
O quizás no obtendría ninguna asociación.
00:04:10.778 --> 00:04:14.059
Y nuestras líneas
no tienen que ser rectas.
NOTE Paragraph
00:04:14.059 --> 00:04:17.319
Puede ser una curva para encajar
los datos cuando sea necesario.
00:04:17.710 --> 00:04:21.379
Esta línea también nos brinda
una manera de predecir los resultados.
00:04:21.379 --> 00:04:25.419
Podemos tomar un puntaje de atractivo
y medir la línea
00:04:25.419 --> 00:04:28.429
de lo que sería el puntaje
de evaluación predicho.
00:04:28.429 --> 00:04:30.441
Ahora volvamos al profesor nuevo.
00:04:30.817 --> 00:04:34.217
Podemos medir con precisión
su puntaje de evaluación.
00:04:34.603 --> 00:04:36.759
Pero esperen un momento
00:04:36.759 --> 00:04:38.889
¿podemos confiar en esta predicción?
00:04:38.893 --> 00:04:41.465
¿Qué tan bien esta variable de atractivo
00:04:41.465 --> 00:04:43.638
predice las evaluaciones?
00:04:44.464 --> 00:04:47.730
La regresión lineal nos brinda
algunas medidas útiles
00:04:47.730 --> 00:04:49.640
para responder esas preguntas
00:04:49.640 --> 00:04:52.147
de las cuales hablaremos
en un próximo video.
00:04:52.788 --> 00:04:55.439
Además, debemos tener cuidado
de otros inconvenientes
00:04:55.439 --> 00:04:58.378
antes de llegar
a conclusiones definitivas.
00:04:58.773 --> 00:05:00.430
Imaginemos este escenario
00:05:00.430 --> 00:05:03.639
donde lo que está impulsando
la asociación que vemos
00:05:03.639 --> 00:05:07.134
es una tercera variable
que dejamos de lado.
00:05:07.134 --> 00:05:09.885
Por ejemplo, la dificultad del curso
00:05:09.885 --> 00:05:12.396
podría estar
detrás de la asociación positiva
00:05:12.396 --> 00:05:15.747
entre las tasas de atractivo
y los puntajes de evaluación.
00:05:15.752 --> 00:05:18.998
Los cursos introductorios fáciles
obtienen evaluaciones buenas
00:05:18.998 --> 00:05:23.063
y los cursos más difíciles y avanzados
obtienen evaluaciones malas.
00:05:23.520 --> 00:05:27.730
Los profesores jóvenes pueden ser
asignados a los cursos introductorios.
00:05:27.730 --> 00:05:31.875
Entonces, si los estudiantes piensan
que los profesores jóvenes son atractivos
00:05:31.875 --> 00:05:34.175
encontrarán una asociación positiva
00:05:34.175 --> 00:05:37.479
entre las tasas de atractivo
y los puntajes de evaluación.
00:05:37.481 --> 00:05:40.198
Pero la dificultad del curso
00:05:40.198 --> 00:05:43.537
la variable que dejamos de lado,
y no la parte del atractivo
00:05:43.537 --> 00:05:46.026
lo que está impulsando
los puntajes de evaluaciones.
00:05:46.026 --> 00:05:49.999
En ese caso, las horas en el espejo
no servirían de nada
00:05:49.999 --> 00:05:54.097
un caso de correlación erróneo
por causalidad.
00:05:54.590 --> 00:05:58.238
Hablaremos sobre esto en otro video.
00:05:58.682 --> 00:06:01.989
¿Y qué sucedería si hubiera
otras variables importantes
00:06:01.989 --> 00:06:05.501
que afecten tanto las tasas de atractivo
como los puntajes de evaluación?
00:06:06.266 --> 00:06:11.225
Podría agregar consideraciones
como la habilidad, la raza, el sexo
00:06:11.225 --> 00:06:14.497
y si el idioma inglés es
la lengua nativa del profesor
00:06:14.497 --> 00:06:19.058
para aislar más el efecto
del atractivo en las evaluaciones.
00:06:19.058 --> 00:06:21.628
Cuando tenemos una regresión múltiple
00:06:21.628 --> 00:06:24.177
podremos medir el impacto del atractivo
00:06:24.177 --> 00:06:26.219
en las evaluaciones del profesor
00:06:26.219 --> 00:06:30.696
mientras consideramos otras variables
que podrían confundir esta asociación.
00:06:31.672 --> 00:06:35.309
En el próximo episodio,
jugaremos un poco con estos datos
00:06:35.309 --> 00:06:39.046
para obtener un mejor entendimiento
de lo que esta línea puede decirnos.
00:06:40.919 --> 00:06:42.275
[Narrador] ¡Felicitaciones!
00:06:42.275 --> 00:06:45.228
Está un paso más cerca
de ser un ninja de los datos.
00:06:45.228 --> 00:06:48.540
Pero para mejorar,
necesita fortalecer sus habilidades
00:06:48.540 --> 00:06:50.445
con algunas preguntas de práctica.
00:06:50.445 --> 00:06:53.742
¿Listo para su próxima misión?
Haga clic en "Next Video".
00:06:54.213 --> 00:06:55.328
¿Sigue aquí?
00:06:55.328 --> 00:06:58.205
Pase de entender los datos
a entender su mundo
00:06:58.205 --> 00:07:01.592
revisando nuestros otros videos
populares de economía de MRU.
00:07:01.592 --> 00:07:03.513
♪ [música] ♪