WEBVTT
00:00:00.107 --> 00:00:03.926
♪ [música] ♪
00:00:20.880 --> 00:00:22.077
[Thomas Stratmann] Hola.
00:00:22.077 --> 00:00:24.268
En las próximas series de videos
00:00:24.268 --> 00:00:26.858
les vamos a dar una herramienta
nueva muy útil
00:00:26.858 --> 00:00:30.414
para ponerla en su caja de herramientas
de Understanding Data
00:00:30.414 --> 00:00:31.981
regresión lineal.
00:00:32.885 --> 00:00:34.668
Imaginemos que tiene esta teoría.
00:00:34.668 --> 00:00:37.249
Ha visto que personas atractivas
parecen tener ventajas especiales.
00:00:37.249 --> 00:00:39.067
00:00:39.642 --> 00:00:40.878
Y se pregunta
00:00:40.878 --> 00:00:43.798
"¿Dónde más se podría ver este fenómeno?".
00:00:44.132 --> 00:00:45.637
¿Qué tal el caso de los profesores?
00:00:45.637 --> 00:00:48.259
¿Es posible que los profesores atractivos
obtengan ventajas especiales también?
00:00:48.259 --> 00:00:50.010
00:00:50.350 --> 00:00:53.899
¿Es posible que los estudiantes
los traten mejor
00:00:53.899 --> 00:00:57.209
llenándolos de evaluaciones
mejores de los estudiantes?
00:00:57.866 --> 00:01:00.467
Si es así, ¿el efecto de la apariencia
00:01:00.467 --> 00:01:03.573
en las evaluaciones
es grande o muy pequeño?
00:01:04.159 --> 00:01:07.519
Supongamos que un profesor nuevo
está comenzando en una universidad.
00:01:07.519 --> 00:01:08.759
Buenos días, amigos.
00:01:08.759 --> 00:01:11.810
¿Qué podemos predecir sobre su evaluación
00:01:11.810 --> 00:01:13.371
con solo mirar su apariencia?
00:01:13.940 --> 00:01:17.216
Dado que estas evaluaciones
pueden determinar los aumentos salariales
00:01:17.671 --> 00:01:21.709
si esta teoría fuera cierta,
veríamos a profesores recurrir
00:01:21.709 --> 00:01:24.519
a tácticas sorprendentes
para mejorar sus puntajes.
00:01:24.519 --> 00:01:25.731
00:01:25.731 --> 00:01:27.461
Supongamos que quería saber
00:01:27.461 --> 00:01:30.801
si las evaluaciones mejoran
con una mejor apariencia.
00:01:31.441 --> 00:01:34.450
¿Cómo haría para probar esta hipótesis?
00:01:34.956 --> 00:01:36.552
Podría recolectar datos.
00:01:36.761 --> 00:01:40.025
Primero, le pediría a los estudiantes
que califiquen en una escala del 1 al 10
00:01:40.025 --> 00:01:42.076
qué tan apuesto les parece un profesor
00:01:42.076 --> 00:01:44.807
lo que les da un puntaje
de atractivo promedio.
00:01:45.229 --> 00:01:48.552
Luego, puede extraer las evaluaciones
de enseñanza del profesor
00:01:48.552 --> 00:01:50.421
de 25 estudiantes.
00:01:50.421 --> 00:01:53.273
Veamos estas dos variables al mismo tiempo
00:01:53.273 --> 00:01:54.738
usando una dispersión.
00:01:54.981 --> 00:01:57.419
Pondremos el atractivo
en el eje horizontal
00:01:57.852 --> 00:02:00.589
y las evaluaciones del profesor
en el eje vertical.
00:02:01.223 --> 00:02:04.903
Por ejemplo, este punto
representa al profesor Peate
00:02:04.903 --> 00:02:06.423
00:02:06.423 --> 00:02:08.811
que recibió un puntaje de atractivo de 3
00:02:08.811 --> 00:02:11.866
y una evaluación de 8.425.
00:02:12.084 --> 00:02:14.958
Este de aquí es el profesor Helmchen
00:02:14.958 --> 00:02:16.797
que es muy atractivo.
00:02:16.797 --> 00:02:18.721
Y obtuvo un puntaje de atractivo alto
00:02:18.721 --> 00:02:20.872
pero una evaluación no muy buena.
00:02:21.101 --> 00:02:22.283
¿Pueden ver una tendencia?
00:02:22.283 --> 00:02:25.533
Mientras nos movemos
de izquierda a derecha
00:02:25.533 --> 00:02:27.963
en el eje horizontal,
de lo feo a lo atractivo
00:02:27.963 --> 00:02:31.186
vemos una tendencia ascendente
en los puntajes de evaluación.
00:02:31.870 --> 00:02:35.174
Por cierto, los datos
que revisamos en estas series
00:02:35.174 --> 00:02:38.923
no son inventados
00:02:38.923 --> 00:02:40.897
vienen de un estudio real,
realizado en la Universidad de Texas.
00:02:41.337 --> 00:02:46.023
Si se preguntan, "pulcritud" es una manera
elegante y académica
00:02:46.023 --> 00:02:47.880
de referirse a lo atractivo.
00:02:48.405 --> 00:02:51.474
Con las dispersiones, puede ser difícil
00:02:51.474 --> 00:02:55.594
distinguir la relación exacta
entre dos variables
00:02:55.594 --> 00:02:59.104
sobre todo, cuando los valores
fluctúan un poco
00:02:59.104 --> 00:03:01.318
si nos desplazamos de izquierda a derecha.
00:03:02.000 --> 00:03:04.908
Una manera de suprimir esta fluctuación
00:03:04.908 --> 00:03:08.144
es dibujando una línea recta
a través de la nube de datos
00:03:08.144 --> 00:03:10.775
de manera que esta línea resuma los datos
00:03:10.775 --> 00:03:12.613
lo más aproximado posible.
00:03:13.295 --> 00:03:17.181
El término técnico para esto
es "regresión lineal".
00:03:17.669 --> 00:03:20.888
Más adelante, hablaremos
sobre cómo se crea esta línea
00:03:20.888 --> 00:03:24.278
pero por ahora supongamos
que la línea encaja con los datos
00:03:24.278 --> 00:03:26.456
lo más aproximado posible.
00:03:27.087 --> 00:03:29.536
¿Qué nos puede decir esta línea?
00:03:30.067 --> 00:03:32.596
Primero, vemos rápidamente
00:03:32.596 --> 00:03:35.358
si la línea se inclina
hacia arriba o hacia abajo.
00:03:36.107 --> 00:03:39.827
En nuestro conjunto de datos, vemos
que la línea se inclina hacia arriba.
00:03:40.794 --> 00:03:43.807
Esto confirma lo que especulamos antes
00:03:43.807 --> 00:03:45.587
con solo observar la dispersión.
00:03:46.070 --> 00:03:50.237
La pendiente ascendente significa
que existe una asociación positiva
00:03:50.237 --> 00:03:53.026
entre los puntajes
de atractivo y de evaluación.
00:03:53.544 --> 00:03:55.907
En otras palabras, en promedio
00:03:55.907 --> 00:03:59.469
los profesores más atractivos
obtienen mejores evaluaciones.
00:03:59.768 --> 00:04:03.939
Para otros conjuntos de datos,
podríamos ver una asociación más fuerte.
00:04:04.377 --> 00:04:07.420
O podría tener una asociación negativa.
00:04:07.857 --> 00:04:10.764
O quizás no obtendría ninguna asociación.
00:04:11.158 --> 00:04:13.903
Y nuestras líneas
no tienen que ser rectas.
00:04:14.389 --> 00:04:17.304
Pueden ser una curva para encajar
los datos cuando sea necesario.
00:04:17.770 --> 00:04:21.262
Esta línea también nos brinda
una manera de predecir los resultados.
00:04:21.579 --> 00:04:25.569
Podemos tomar un puntaje de atractivo
y medir la línea
00:04:25.569 --> 00:04:28.429
de lo que sería el puntaje
de evaluación predicho.
00:04:28.429 --> 00:04:30.229
Ahora volvamos al profesor nuevo.
00:04:30.229 --> 00:04:31.297
00:04:31.297 --> 00:04:34.109
Podemos medir con precisión
su puntaje de evaluación.
00:04:34.683 --> 00:04:36.749
Pero esperen un momento
00:04:37.019 --> 00:04:38.749
¿podemos confiar en esta predicción?
00:04:39.233 --> 00:04:41.665
¿Qué tan bien esta variable de atractivo
00:04:41.665 --> 00:04:43.515
predice las evaluaciones?
00:04:44.844 --> 00:04:47.890
La regresión lineal nos brinda
algunas medidas útiles
00:04:47.890 --> 00:04:49.770
para responder esas preguntas
00:04:49.770 --> 00:04:52.039
de las cuales hablaremos
en un próximo video.
00:04:52.838 --> 00:04:55.439
Además, debemos tener cuidado
de otros inconvenientes
00:04:55.439 --> 00:04:58.340
antes de llegar
a conclusiones definitivas.
00:04:58.833 --> 00:05:00.430
Imaginemos un escenario
00:05:00.430 --> 00:05:03.639
donde lo que está impulsando
la asociación que vemos
00:05:03.639 --> 00:05:06.900
es una tercera variable
que dejamos de lado.
00:05:07.344 --> 00:05:09.965
Por ejemplo, la dificultad del curso
00:05:09.965 --> 00:05:12.456
podría estar
detrás de la asociación positiva
00:05:12.456 --> 00:05:15.645
entre las tasas de atractivo
y los puntajes de evaluación.
00:05:16.052 --> 00:05:18.956
Los cursos introductorios fáciles
obtienen evaluaciones buenas
00:05:19.228 --> 00:05:22.972
y los cursos más difíciles y avanzados
obtienen evaluaciones malas.
00:05:23.660 --> 00:05:27.668
Los profesores jóvenes pueden ser
asignados a los cursos introductorios.
00:05:28.080 --> 00:05:32.095
Entonces, si los estudiantes piensan
que los profesores más jóvenes...
00:05:32.095 --> 00:05:34.335
encontrarán una asociación positiva
00:05:34.335 --> 00:05:37.383
entre las tasas de atractivo
y los puntajes de evaluación.
00:05:37.861 --> 00:05:40.388
Pero la dificultad del curso
00:05:40.388 --> 00:05:43.537
la variable que dejamos de lado,
y no la parte del atractivo
00:05:43.537 --> 00:05:45.848
lo que está impulsando
los puntajes de evaluaciones.
00:05:46.346 --> 00:05:49.807
En ese caso, las horas en el espejo
no servirían de nada
00:05:50.289 --> 00:05:53.620
un caso de correlación erróneo
por causalidad.
00:05:53.620 --> 00:05:54.900
00:05:54.900 --> 00:05:58.166
00:05:58.922 --> 00:06:02.069
00:06:02.069 --> 00:06:05.781
00:06:06.626 --> 00:06:09.575
00:06:09.846 --> 00:06:14.577
00:06:14.577 --> 00:06:18.994
00:06:19.408 --> 00:06:21.758
00:06:21.758 --> 00:06:24.477
00:06:24.477 --> 00:06:26.219
00:06:26.219 --> 00:06:28.368
00:06:28.368 --> 00:06:30.737
00:06:31.762 --> 00:06:35.509
00:06:35.509 --> 00:06:39.070
00:06:41.169 --> 00:06:42.445
00:06:42.445 --> 00:06:45.247
00:06:45.568 --> 00:06:47.139
00:06:47.139 --> 00:06:48.700
00:06:48.700 --> 00:06:50.404
00:06:50.865 --> 00:06:53.976
00:06:54.313 --> 00:06:55.364
00:06:55.598 --> 00:06:58.325
00:06:58.325 --> 00:07:01.642
00:07:01.892 --> 00:07:04.406