WEBVTT 00:00:00.087 --> 00:00:06.941 ♪ [música] ♪ 00:00:20.830 --> 00:00:22.027 [Thomas Stratmann] Hola. 00:00:22.027 --> 00:00:24.128 En las próximas series de videos 00:00:24.128 --> 00:00:26.808 les vamos a dar una herramienta nueva muy útil 00:00:26.808 --> 00:00:30.334 para ponerla en su caja de herramientas de Understanding Data 00:00:30.334 --> 00:00:31.981 regresión lineal. 00:00:32.685 --> 00:00:34.608 Imaginemos que tiene esta teoría. 00:00:34.608 --> 00:00:39.186 Ha visto que las personas atractivas parecen tener ventajas especiales. 00:00:39.462 --> 00:00:40.728 Y se pregunta 00:00:40.728 --> 00:00:43.752 "¿Dónde más se podría ver este fenómeno?". 00:00:43.752 --> 00:00:45.567 ¿Qué tal el caso de los profesores? 00:00:45.567 --> 00:00:49.930 ¿Es posible que los profesores atractivos obtengan ventajas especiales también? 00:00:49.930 --> 00:00:53.779 ¿Es posible que los estudiantes los traten mejor 00:00:53.779 --> 00:00:57.349 con evaluaciones mejores de los estudiantes? 00:00:57.756 --> 00:01:00.427 Si es así, ¿el efecto de la apariencia 00:01:00.427 --> 00:01:03.620 en las evaluaciones es grande o muy pequeño? 00:01:04.059 --> 00:01:08.199 Supongamos que un profesor nuevo está comenzando en una universidad. 00:01:08.199 --> 00:01:13.485 ¿Qué podemos predecir sobre su evaluación con solo mirar su apariencia? 00:01:13.830 --> 00:01:17.261 Dado que estas evaluaciones pueden determinar los aumentos salariales 00:01:17.261 --> 00:01:21.619 si esta teoría fuera cierta, veríamos a profesores recurrir 00:01:21.619 --> 00:01:24.995 a tácticas sorprendentes para mejorar sus puntajes. 00:01:25.331 --> 00:01:27.291 Supongamos que quería saber 00:01:27.291 --> 00:01:30.813 si las evaluaciones mejoran con una mejor apariencia. 00:01:31.261 --> 00:01:34.484 ¿Cómo haría para probar esta hipótesis? 00:01:34.856 --> 00:01:36.331 Podría recolectar datos. 00:01:36.331 --> 00:01:40.025 Primero, le pediría a los estudiantes que califiquen en una escala del 1 al 10 00:01:40.025 --> 00:01:42.026 qué tan apuesto les parece un profesor 00:01:42.026 --> 00:01:44.949 lo que les da un puntaje de atractivo promedio. 00:01:44.949 --> 00:01:48.552 Luego, puede extraer las evaluaciones de enseñanza del profesor 00:01:48.552 --> 00:01:50.361 de 25 estudiantes. 00:01:50.361 --> 00:01:53.203 Veamos estas dos variables al mismo tiempo 00:01:53.203 --> 00:01:54.771 usando una dispersión. 00:01:54.771 --> 00:01:57.512 Pondremos el atractivo en el eje horizontal 00:01:57.512 --> 00:02:00.725 y las evaluaciones del profesor en el eje vertical. 00:02:01.093 --> 00:02:05.444 Por ejemplo, este punto representa al profesor Peate 00:02:06.083 --> 00:02:08.811 que recibió un puntaje de atractivo de 3 00:02:08.811 --> 00:02:11.854 y una evaluación de 8.425. 00:02:11.854 --> 00:02:14.918 Este de aquí es el profesor Helmchen 00:02:14.918 --> 00:02:16.627 que es muy atractivo. 00:02:16.627 --> 00:02:20.721 Y obtuvo un puntaje de atractivo alto, pero una evaluación no muy buena. 00:02:20.721 --> 00:02:22.183 ¿Pueden ver una tendencia? 00:02:22.183 --> 00:02:24.483 Mientras nos movemos de izquierda a derecha 00:02:24.483 --> 00:02:27.753 en el eje horizontal, de lo feo a lo atractivo 00:02:27.753 --> 00:02:31.370 vemos una tendencia ascendente en los puntajes de evaluación. 00:02:31.680 --> 00:02:35.134 Por cierto, los datos que revisamos en estas series 00:02:35.134 --> 00:02:36.618 no son inventados 00:02:36.618 --> 00:02:40.914 pertenecen a un estudio real, realizado en la Universidad de Texas. 00:02:41.217 --> 00:02:46.023 Si se preguntan, "pulcritud" es una manera elegante y académica 00:02:46.023 --> 00:02:47.970 de referirse a lo atractivo. 00:02:48.295 --> 00:02:51.414 Con las dispersiones, puede ser difícil 00:02:51.414 --> 00:02:55.404 distinguir la relación exacta entre dos variables 00:02:55.404 --> 00:02:59.014 sobre todo, cuando los valores fluctúan un poco 00:02:59.014 --> 00:03:01.451 si nos desplazamos de izquierda a derecha. 00:03:01.910 --> 00:03:04.718 Una manera de suprimir esta fluctuación 00:03:04.718 --> 00:03:08.084 es dibujando una línea recta a través de la nube de datos 00:03:08.084 --> 00:03:10.635 de manera que esta línea resuma los datos 00:03:10.635 --> 00:03:12.646 lo más aproximado posible. 00:03:13.145 --> 00:03:17.268 El término técnico para esto es "regresión lineal". 00:03:17.639 --> 00:03:20.808 Más adelante, hablaremos sobre cómo se crea esta línea 00:03:20.808 --> 00:03:24.178 pero por ahora supongamos que la línea encaja con los datos 00:03:24.178 --> 00:03:26.476 lo más aproximado posible. 00:03:26.987 --> 00:03:29.697 ¿Qué nos puede decir esta línea? 00:03:29.697 --> 00:03:32.356 Primero, vemos rápidamente 00:03:32.356 --> 00:03:35.428 si la línea se inclina hacia arriba o hacia abajo. 00:03:35.907 --> 00:03:39.967 En nuestro conjunto de datos, vemos que la línea se inclina hacia arriba. 00:03:40.624 --> 00:03:43.667 Esto confirma lo que especulamos antes 00:03:43.667 --> 00:03:45.605 con solo observar la dispersión. 00:03:46.000 --> 00:03:49.987 La pendiente ascendente significa que existe una asociación positiva 00:03:49.987 --> 00:03:53.164 entre los puntajes de atractivo y de evaluación. 00:03:53.164 --> 00:03:55.727 En otras palabras, en promedio 00:03:55.727 --> 00:03:59.498 los profesores más atractivos obtienen mejores evaluaciones. 00:03:59.498 --> 00:04:04.017 Para otros conjuntos de datos, podríamos ver una asociación más fuerte 00:04:04.017 --> 00:04:07.523 o podría haber una asociación negativa. 00:04:07.817 --> 00:04:10.778 O quizás no obtendría ninguna asociación. 00:04:10.778 --> 00:04:13.985 Y nuestras líneas no tienen que ser rectas. 00:04:14.359 --> 00:04:17.304 Pueden ser una curva para encajar los datos cuando sea necesario. 00:04:17.770 --> 00:04:21.262 Esta línea también nos brinda una manera de predecir los resultados. 00:04:21.579 --> 00:04:25.569 Podemos tomar un puntaje de atractivo y medir la línea 00:04:25.569 --> 00:04:28.429 de lo que sería el puntaje de evaluación predicho. 00:04:28.429 --> 00:04:30.229 Ahora volvamos al profesor nuevo. 00:04:30.229 --> 00:04:31.297 00:04:31.297 --> 00:04:34.109 Podemos medir con precisión su puntaje de evaluación. 00:04:34.683 --> 00:04:36.749 Pero esperen un momento 00:04:37.019 --> 00:04:38.749 ¿podemos confiar en esta predicción? 00:04:39.233 --> 00:04:41.665 ¿Qué tan bien esta variable de atractivo 00:04:41.665 --> 00:04:43.515 predice las evaluaciones? 00:04:44.844 --> 00:04:47.890 La regresión lineal nos brinda algunas medidas útiles 00:04:47.890 --> 00:04:49.770 para responder esas preguntas 00:04:49.770 --> 00:04:52.039 de las cuales hablaremos en un próximo video. 00:04:52.838 --> 00:04:55.439 Además, debemos tener cuidado de otros inconvenientes 00:04:55.439 --> 00:04:58.340 antes de llegar a conclusiones definitivas. 00:04:58.833 --> 00:05:00.430 Imaginemos un escenario 00:05:00.430 --> 00:05:03.639 donde lo que está impulsando la asociación que vemos 00:05:03.639 --> 00:05:06.900 es una tercera variable que dejamos de lado. 00:05:07.344 --> 00:05:09.965 Por ejemplo, la dificultad del curso 00:05:09.965 --> 00:05:12.456 podría estar detrás de la asociación positiva 00:05:12.456 --> 00:05:15.645 entre las tasas de atractivo y los puntajes de evaluación. 00:05:16.052 --> 00:05:18.956 Los cursos introductorios fáciles obtienen evaluaciones buenas 00:05:19.228 --> 00:05:22.972 y los cursos más difíciles y avanzados obtienen evaluaciones malas. 00:05:23.660 --> 00:05:27.668 Los profesores jóvenes pueden ser asignados a los cursos introductorios. 00:05:28.080 --> 00:05:32.095 Entonces, si los estudiantes piensan que los profesores más jóvenes... 00:05:32.095 --> 00:05:34.335 encontrarán una asociación positiva 00:05:34.335 --> 00:05:37.383 entre las tasas de atractivo y los puntajes de evaluación. 00:05:37.861 --> 00:05:40.388 Pero la dificultad del curso 00:05:40.388 --> 00:05:43.537 la variable que dejamos de lado, y no la parte del atractivo 00:05:43.537 --> 00:05:45.848 lo que está impulsando los puntajes de evaluaciones. 00:05:46.346 --> 00:05:49.807 En ese caso, las horas en el espejo no servirían de nada 00:05:50.289 --> 00:05:53.620 un caso de correlación erróneo por causalidad. 00:05:53.620 --> 00:05:54.900 00:05:54.900 --> 00:05:58.166 Hablaremos sobre esto en otro video. 00:05:58.922 --> 00:06:02.069 ¿Y qué sucedería si hubiera otras variables importantes 00:06:02.069 --> 00:06:05.781 que afecten tanto las tasas de atractivo como los puntajes de evaluación? 00:06:06.626 --> 00:06:09.575 Podría querer agregar consideraciones como la habilidad, la raza, el sexo 00:06:09.846 --> 00:06:14.577 y si el idioma inglés es la lengua nativa del profesor 00:06:14.577 --> 00:06:18.994 para aislar más el efecto del atractivo en las evaluaciones. 00:06:19.408 --> 00:06:21.758 Cuando tenemos una regresión múltiple 00:06:21.758 --> 00:06:24.477 podremos medir el impacto del atractivo 00:06:24.477 --> 00:06:26.219 en las evaluaciones del profesor 00:06:26.219 --> 00:06:28.368 mientras consideramos otras variables 00:06:28.368 --> 00:06:30.737 que podrían confundir esta asociación. 00:06:31.762 --> 00:06:35.509 En el próximo episodio, jugaremos un poco con estos datos 00:06:35.509 --> 00:06:39.070 para obtener un mejor entendimiento de lo que esta línea puede decirnos. 00:06:41.169 --> 00:06:42.445 [Narrador] ¡Felicitaciones! 00:06:42.445 --> 00:06:45.247 Está un paso más cerca de ser un ninja de los datos. 00:06:45.568 --> 00:06:47.139 Pero para mejorar, necesita fortalecer sus habilidades 00:06:47.139 --> 00:06:48.700 00:06:48.700 --> 00:06:50.404 con algunas preguntas de práctica. 00:06:50.865 --> 00:06:53.976 ¿Listo para su próxima misión? Haga clic en "Next Video". 00:06:54.313 --> 00:06:55.364 ¿Sigue aquí? 00:06:55.598 --> 00:06:58.325 Pase de entender los datos a entender su mundo 00:06:58.325 --> 00:07:01.642 revisando nuestros otros videos populares de economía de MRU. 00:07:01.892 --> 00:07:04.406 ♪ [música] ♪