WEBVTT
00:00:00.087 --> 00:00:06.941
♪ [música] ♪
00:00:20.830 --> 00:00:22.027
[Thomas Stratmann] Hola.
00:00:22.027 --> 00:00:24.128
En las próximas series de videos
00:00:24.128 --> 00:00:26.808
les vamos a dar una herramienta
nueva muy útil
00:00:26.808 --> 00:00:30.334
para ponerla en su caja de herramientas
de Understanding Data
00:00:30.334 --> 00:00:31.981
regresión lineal.
00:00:32.685 --> 00:00:34.608
Imaginemos que tiene esta teoría.
00:00:34.608 --> 00:00:39.186
Ha visto que las personas atractivas
parecen tener ventajas especiales.
00:00:39.462 --> 00:00:40.728
Y se pregunta
00:00:40.728 --> 00:00:43.752
"¿Dónde más se podría ver este fenómeno?".
00:00:43.752 --> 00:00:45.567
¿Qué tal el caso de los profesores?
00:00:45.567 --> 00:00:49.930
¿Es posible que los profesores atractivos
obtengan ventajas especiales también?
00:00:49.930 --> 00:00:53.779
¿Es posible que los estudiantes
los traten mejor
00:00:53.779 --> 00:00:57.349
con evaluaciones
mejores de los estudiantes?
00:00:57.756 --> 00:01:00.427
Si es así, ¿el efecto de la apariencia
00:01:00.427 --> 00:01:03.620
en las evaluaciones
es grande o muy pequeño?
00:01:04.059 --> 00:01:08.199
Supongamos que un profesor nuevo
está comenzando en una universidad.
00:01:08.199 --> 00:01:13.485
¿Qué podemos predecir sobre su evaluación
con solo mirar su apariencia?
00:01:13.830 --> 00:01:17.261
Dado que estas evaluaciones
pueden determinar los aumentos salariales
00:01:17.261 --> 00:01:21.619
si esta teoría fuera cierta,
veríamos a profesores recurrir
00:01:21.619 --> 00:01:24.995
a tácticas sorprendentes
para mejorar sus puntajes.
00:01:25.331 --> 00:01:27.291
Supongamos que quería saber
00:01:27.291 --> 00:01:30.813
si las evaluaciones mejoran
con una mejor apariencia.
00:01:31.261 --> 00:01:34.484
¿Cómo haría para probar esta hipótesis?
00:01:34.856 --> 00:01:36.331
Podría recolectar datos.
00:01:36.331 --> 00:01:40.025
Primero, le pediría a los estudiantes
que califiquen en una escala del 1 al 10
00:01:40.025 --> 00:01:42.026
qué tan apuesto les parece un profesor
00:01:42.026 --> 00:01:44.949
lo que les da un puntaje
de atractivo promedio.
00:01:44.949 --> 00:01:48.552
Luego, puede extraer las evaluaciones
de enseñanza del profesor
00:01:48.552 --> 00:01:50.361
de 25 estudiantes.
00:01:50.361 --> 00:01:53.203
Veamos estas dos variables al mismo tiempo
00:01:53.203 --> 00:01:54.771
usando una dispersión.
00:01:54.771 --> 00:01:57.512
Pondremos el atractivo
en el eje horizontal
00:01:57.512 --> 00:02:00.725
y las evaluaciones del profesor
en el eje vertical.
00:02:01.093 --> 00:02:05.444
Por ejemplo, este punto
representa al profesor Peate
00:02:06.083 --> 00:02:08.811
que recibió un puntaje de atractivo de 3
00:02:08.811 --> 00:02:11.854
y una evaluación de 8.425.
00:02:11.854 --> 00:02:14.918
Este de aquí es el profesor Helmchen
00:02:14.918 --> 00:02:16.627
que es muy atractivo.
00:02:16.627 --> 00:02:20.721
Y obtuvo un puntaje de atractivo alto,
pero una evaluación no muy buena.
00:02:20.721 --> 00:02:22.183
¿Pueden ver una tendencia?
00:02:22.183 --> 00:02:24.483
Mientras nos movemos
de izquierda a derecha
00:02:24.483 --> 00:02:27.753
en el eje horizontal,
de lo feo a lo atractivo
00:02:27.753 --> 00:02:31.370
vemos una tendencia ascendente
en los puntajes de evaluación.
00:02:31.680 --> 00:02:35.134
Por cierto, los datos
que revisamos en estas series
00:02:35.134 --> 00:02:36.618
no son inventados
00:02:36.618 --> 00:02:40.914
pertenecen a un estudio real,
realizado en la Universidad de Texas.
00:02:41.217 --> 00:02:46.023
Si se preguntan, "pulcritud" es
una manera elegante y académica
00:02:46.023 --> 00:02:47.970
de referirse a lo atractivo.
00:02:48.295 --> 00:02:51.414
Con las dispersiones, puede ser difícil
00:02:51.414 --> 00:02:55.404
distinguir la relación exacta
entre dos variables
00:02:55.404 --> 00:02:59.014
sobre todo, cuando los valores
fluctúan un poco
00:02:59.014 --> 00:03:01.451
si nos desplazamos de izquierda a derecha.
00:03:01.910 --> 00:03:04.718
Una manera de suprimir esta fluctuación
00:03:04.718 --> 00:03:08.084
es dibujando una línea recta
a través de la nube de datos
00:03:08.084 --> 00:03:10.635
de manera que esta línea resuma los datos
00:03:10.635 --> 00:03:12.646
lo más aproximado posible.
00:03:13.145 --> 00:03:17.268
El término técnico para esto
es "regresión lineal".
00:03:17.639 --> 00:03:20.808
Más adelante, hablaremos
sobre cómo se crea esta línea
00:03:20.808 --> 00:03:24.178
pero por ahora supongamos
que la línea encaja con los datos
00:03:24.178 --> 00:03:26.476
lo más aproximado posible.
00:03:26.987 --> 00:03:29.697
¿Qué nos puede decir esta línea?
00:03:29.697 --> 00:03:32.356
Primero, vemos rápidamente
00:03:32.356 --> 00:03:35.428
si la línea se inclina
hacia arriba o hacia abajo.
00:03:35.907 --> 00:03:39.967
En nuestro conjunto de datos, vemos
que la línea se inclina hacia arriba.
00:03:40.624 --> 00:03:43.667
Esto confirma lo que especulamos antes
00:03:43.667 --> 00:03:45.605
con solo observar la dispersión.
00:03:46.000 --> 00:03:49.987
La pendiente ascendente significa
que existe una asociación positiva
00:03:49.987 --> 00:03:53.164
entre los puntajes
de atractivo y de evaluación.
00:03:53.164 --> 00:03:55.727
En otras palabras, en promedio
00:03:55.727 --> 00:03:59.498
los profesores más atractivos
obtienen mejores evaluaciones.
00:03:59.498 --> 00:04:04.017
Para otros conjuntos de datos,
podríamos ver una asociación más fuerte
00:04:04.017 --> 00:04:07.523
o podría haber una asociación negativa.
00:04:07.817 --> 00:04:10.778
O quizás no obtendría ninguna asociación.
00:04:10.778 --> 00:04:13.985
Y nuestras líneas
no tienen que ser rectas.
00:04:14.359 --> 00:04:17.304
Pueden ser una curva para encajar
los datos cuando sea necesario.
00:04:17.770 --> 00:04:21.262
Esta línea también nos brinda
una manera de predecir los resultados.
00:04:21.579 --> 00:04:25.569
Podemos tomar un puntaje de atractivo
y medir la línea
00:04:25.569 --> 00:04:28.429
de lo que sería el puntaje
de evaluación predicho.
00:04:28.429 --> 00:04:30.229
Ahora volvamos al profesor nuevo.
00:04:30.229 --> 00:04:31.297
00:04:31.297 --> 00:04:34.109
Podemos medir con precisión
su puntaje de evaluación.
00:04:34.683 --> 00:04:36.749
Pero esperen un momento
00:04:37.019 --> 00:04:38.749
¿podemos confiar en esta predicción?
00:04:39.233 --> 00:04:41.665
¿Qué tan bien esta variable de atractivo
00:04:41.665 --> 00:04:43.515
predice las evaluaciones?
00:04:44.844 --> 00:04:47.890
La regresión lineal nos brinda
algunas medidas útiles
00:04:47.890 --> 00:04:49.770
para responder esas preguntas
00:04:49.770 --> 00:04:52.039
de las cuales hablaremos
en un próximo video.
00:04:52.838 --> 00:04:55.439
Además, debemos tener cuidado
de otros inconvenientes
00:04:55.439 --> 00:04:58.340
antes de llegar
a conclusiones definitivas.
00:04:58.833 --> 00:05:00.430
Imaginemos un escenario
00:05:00.430 --> 00:05:03.639
donde lo que está impulsando
la asociación que vemos
00:05:03.639 --> 00:05:06.900
es una tercera variable
que dejamos de lado.
00:05:07.344 --> 00:05:09.965
Por ejemplo, la dificultad del curso
00:05:09.965 --> 00:05:12.456
podría estar
detrás de la asociación positiva
00:05:12.456 --> 00:05:15.645
entre las tasas de atractivo
y los puntajes de evaluación.
00:05:16.052 --> 00:05:18.956
Los cursos introductorios fáciles
obtienen evaluaciones buenas
00:05:19.228 --> 00:05:22.972
y los cursos más difíciles y avanzados
obtienen evaluaciones malas.
00:05:23.660 --> 00:05:27.668
Los profesores jóvenes pueden ser
asignados a los cursos introductorios.
00:05:28.080 --> 00:05:32.095
Entonces, si los estudiantes piensan
que los profesores más jóvenes...
00:05:32.095 --> 00:05:34.335
encontrarán una asociación positiva
00:05:34.335 --> 00:05:37.383
entre las tasas de atractivo
y los puntajes de evaluación.
00:05:37.861 --> 00:05:40.388
Pero la dificultad del curso
00:05:40.388 --> 00:05:43.537
la variable que dejamos de lado,
y no la parte del atractivo
00:05:43.537 --> 00:05:45.848
lo que está impulsando
los puntajes de evaluaciones.
00:05:46.346 --> 00:05:49.807
En ese caso, las horas en el espejo
no servirían de nada
00:05:50.289 --> 00:05:53.620
un caso de correlación erróneo
por causalidad.
00:05:53.620 --> 00:05:54.900
00:05:54.900 --> 00:05:58.166
Hablaremos sobre esto en otro video.
00:05:58.922 --> 00:06:02.069
¿Y qué sucedería si hubiera
otras variables importantes
00:06:02.069 --> 00:06:05.781
que afecten tanto las tasas de atractivo
como los puntajes de evaluación?
00:06:06.626 --> 00:06:09.575
Podría querer agregar consideraciones
como la habilidad, la raza, el sexo
00:06:09.846 --> 00:06:14.577
y si el idioma inglés es
la lengua nativa del profesor
00:06:14.577 --> 00:06:18.994
para aislar más el efecto
del atractivo en las evaluaciones.
00:06:19.408 --> 00:06:21.758
Cuando tenemos una regresión múltiple
00:06:21.758 --> 00:06:24.477
podremos medir el impacto del atractivo
00:06:24.477 --> 00:06:26.219
en las evaluaciones del profesor
00:06:26.219 --> 00:06:28.368
mientras consideramos otras variables
00:06:28.368 --> 00:06:30.737
que podrían confundir esta asociación.
00:06:31.762 --> 00:06:35.509
En el próximo episodio,
jugaremos un poco con estos datos
00:06:35.509 --> 00:06:39.070
para obtener un mejor entendimiento
de lo que esta línea puede decirnos.
00:06:41.169 --> 00:06:42.445
[Narrador] ¡Felicitaciones!
00:06:42.445 --> 00:06:45.247
Está un paso más cerca
de ser un ninja de los datos.
00:06:45.568 --> 00:06:47.139
Pero para mejorar,
necesita fortalecer sus habilidades
00:06:47.139 --> 00:06:48.700
00:06:48.700 --> 00:06:50.404
con algunas preguntas de práctica.
00:06:50.865 --> 00:06:53.976
¿Listo para su próxima misión?
Haga clic en "Next Video".
00:06:54.313 --> 00:06:55.364
¿Sigue aquí?
00:06:55.598 --> 00:06:58.325
Pase de entender los datos
a entender su mundo
00:06:58.325 --> 00:07:01.642
revisando nuestros otros videos
populares de economía de MRU.
00:07:01.892 --> 00:07:04.406
♪ [música] ♪