WEBVTT 00:00:00.087 --> 00:00:06.941 ♪ [música] ♪ 00:00:20.830 --> 00:00:22.027 [Thomas Stratmann] Hola. 00:00:22.027 --> 00:00:24.128 En las próximas series de videos 00:00:24.128 --> 00:00:26.808 les vamos a dar una herramienta nueva muy útil 00:00:26.808 --> 00:00:30.334 para ponerla en su caja de herramientas de Understanding Data 00:00:30.334 --> 00:00:31.981 regresión lineal. 00:00:32.685 --> 00:00:34.608 Imaginemos que tiene esta teoría. 00:00:34.608 --> 00:00:39.186 Ha visto que las personas atractivas parecen tener ventajas especiales. 00:00:39.462 --> 00:00:40.728 Y se pregunta 00:00:40.728 --> 00:00:43.752 "¿Dónde más se podría ver este fenómeno?". 00:00:43.752 --> 00:00:45.567 ¿Qué tal el caso de los profesores? 00:00:45.567 --> 00:00:49.930 ¿Es posible que los profesores atractivos obtengan ventajas especiales también? 00:00:49.930 --> 00:00:53.779 ¿Es posible que los estudiantes los traten mejor 00:00:53.779 --> 00:00:57.349 con evaluaciones mejores de los estudiantes? 00:00:57.756 --> 00:01:00.427 Si es así, ¿el efecto de la apariencia 00:01:00.427 --> 00:01:03.620 en las evaluaciones es grande o muy pequeño? 00:01:04.059 --> 00:01:08.199 Supongamos que un profesor nuevo está comenzando en una universidad. 00:01:08.199 --> 00:01:13.485 ¿Qué podemos predecir sobre su evaluación con solo mirar su apariencia? 00:01:13.830 --> 00:01:17.261 Dado que estas evaluaciones pueden determinar los aumentos salariales 00:01:17.261 --> 00:01:21.619 si esta teoría fuera cierta, veríamos a profesores recurrir 00:01:21.619 --> 00:01:24.995 a tácticas sorprendentes para mejorar sus puntajes. 00:01:25.331 --> 00:01:27.291 Supongamos que quería saber 00:01:27.291 --> 00:01:30.813 si las evaluaciones mejoran con una mejor apariencia. 00:01:31.261 --> 00:01:34.484 ¿Cómo haría para probar esta hipótesis? 00:01:34.856 --> 00:01:36.331 Podría recolectar datos. 00:01:36.331 --> 00:01:40.025 Primero, le pediría a los estudiantes que califiquen en una escala del 1 al 10 00:01:40.025 --> 00:01:42.026 qué tan apuesto les parece un profesor 00:01:42.026 --> 00:01:44.949 lo que les da un puntaje de atractivo promedio. 00:01:44.949 --> 00:01:48.552 Luego, puede extraer las evaluaciones de enseñanza del profesor 00:01:48.552 --> 00:01:50.361 de 25 estudiantes. 00:01:50.361 --> 00:01:53.203 Veamos estas dos variables al mismo tiempo 00:01:53.203 --> 00:01:54.771 usando una dispersión. 00:01:54.771 --> 00:01:57.512 Pondremos el atractivo en el eje horizontal 00:01:57.512 --> 00:02:00.725 y las evaluaciones del profesor en el eje vertical. 00:02:01.093 --> 00:02:05.444 Por ejemplo, este punto representa al profesor Peate 00:02:06.083 --> 00:02:08.811 que recibió un puntaje de atractivo de 3 00:02:08.811 --> 00:02:11.854 y una evaluación de 8.425. 00:02:11.854 --> 00:02:14.918 Este de aquí es el profesor Helmchen 00:02:14.918 --> 00:02:16.627 que es muy atractivo. 00:02:16.627 --> 00:02:20.721 Y obtuvo un puntaje de atractivo alto, pero una evaluación no muy buena. 00:02:20.721 --> 00:02:22.183 ¿Pueden ver una tendencia? 00:02:22.183 --> 00:02:24.483 Mientras nos movemos de izquierda a derecha 00:02:24.483 --> 00:02:27.753 en el eje horizontal, de lo feo a lo atractivo 00:02:27.753 --> 00:02:31.370 vemos una tendencia ascendente en los puntajes de evaluación. 00:02:31.680 --> 00:02:35.134 Por cierto, los datos que revisamos en estas series 00:02:35.134 --> 00:02:36.618 no son inventados 00:02:36.618 --> 00:02:40.914 pertenecen a un estudio real, realizado en la Universidad de Texas. 00:02:41.217 --> 00:02:46.023 Si se preguntan, "pulcritud" es una manera elegante y académica 00:02:46.023 --> 00:02:47.970 de referirse a lo atractivo. 00:02:48.295 --> 00:02:51.414 Con las dispersiones, puede ser difícil 00:02:51.414 --> 00:02:55.404 distinguir la relación exacta entre dos variables 00:02:55.404 --> 00:02:59.014 sobre todo, cuando los valores fluctúan un poco 00:02:59.014 --> 00:03:01.451 si nos desplazamos de izquierda a derecha. 00:03:01.910 --> 00:03:04.718 Una manera de suprimir esta fluctuación 00:03:04.718 --> 00:03:08.084 es dibujando una línea recta a través de la nube de datos 00:03:08.084 --> 00:03:10.635 de manera que esta línea resuma los datos 00:03:10.635 --> 00:03:12.646 lo más aproximado posible. 00:03:13.145 --> 00:03:17.268 El término técnico para esto es "regresión lineal". 00:03:17.639 --> 00:03:20.808 Más adelante, hablaremos sobre cómo se crea esta línea 00:03:20.808 --> 00:03:24.178 pero por ahora supongamos que la línea encaja con los datos 00:03:24.178 --> 00:03:26.476 lo más aproximado posible. 00:03:26.987 --> 00:03:29.697 ¿Qué nos puede decir esta línea? 00:03:29.697 --> 00:03:32.356 Primero, vemos rápidamente 00:03:32.356 --> 00:03:35.428 si la línea se inclina hacia arriba o hacia abajo. 00:03:35.907 --> 00:03:39.967 En nuestro conjunto de datos, vemos que la línea se inclina hacia arriba. 00:03:40.624 --> 00:03:43.667 Esto confirma lo que especulamos antes 00:03:43.667 --> 00:03:45.605 con solo observar la dispersión. 00:03:46.000 --> 00:03:49.987 La pendiente ascendente significa que existe una asociación positiva 00:03:49.987 --> 00:03:53.164 entre los puntajes de atractivo y de evaluación. 00:03:53.164 --> 00:03:55.727 En otras palabras, en promedio 00:03:55.727 --> 00:03:59.498 los profesores más atractivos obtienen mejores evaluaciones. 00:03:59.498 --> 00:04:04.017 Para otros conjuntos de datos, podríamos ver una asociación más fuerte 00:04:04.017 --> 00:04:07.523 o podría haber una asociación negativa. 00:04:07.817 --> 00:04:10.778 O quizás no obtendría ninguna asociación. 00:04:10.778 --> 00:04:14.059 Y nuestras líneas no tienen que ser rectas. NOTE Paragraph 00:04:14.059 --> 00:04:17.319 Puede ser una curva para encajar los datos cuando sea necesario. 00:04:17.710 --> 00:04:21.379 Esta línea también nos brinda una manera de predecir los resultados. 00:04:21.379 --> 00:04:25.419 Podemos tomar un puntaje de atractivo y medir la línea 00:04:25.419 --> 00:04:28.429 de lo que sería el puntaje de evaluación predicho. 00:04:28.429 --> 00:04:30.441 Ahora volvamos al profesor nuevo. 00:04:30.817 --> 00:04:34.217 Podemos medir con precisión su puntaje de evaluación. 00:04:34.603 --> 00:04:36.759 Pero esperen un momento 00:04:36.759 --> 00:04:38.889 ¿podemos confiar en esta predicción? 00:04:38.893 --> 00:04:41.465 ¿Qué tan bien esta variable de atractivo 00:04:41.465 --> 00:04:43.638 predice las evaluaciones? 00:04:44.464 --> 00:04:47.730 La regresión lineal nos brinda algunas medidas útiles 00:04:47.730 --> 00:04:49.640 para responder esas preguntas 00:04:49.640 --> 00:04:52.147 de las cuales hablaremos en un próximo video. 00:04:52.788 --> 00:04:55.439 Además, debemos tener cuidado de otros inconvenientes 00:04:55.439 --> 00:04:58.378 antes de llegar a conclusiones definitivas. 00:04:58.773 --> 00:05:00.430 Imaginemos este escenario 00:05:00.430 --> 00:05:03.639 donde lo que está impulsando la asociación que vemos 00:05:03.639 --> 00:05:07.134 es una tercera variable que dejamos de lado. 00:05:07.134 --> 00:05:09.885 Por ejemplo, la dificultad del curso 00:05:09.885 --> 00:05:12.396 podría estar detrás de la asociación positiva 00:05:12.396 --> 00:05:15.747 entre las tasas de atractivo y los puntajes de evaluación. 00:05:15.752 --> 00:05:18.998 Los cursos introductorios fáciles obtienen evaluaciones buenas 00:05:18.998 --> 00:05:23.063 y los cursos más difíciles y avanzados obtienen evaluaciones malas. 00:05:23.520 --> 00:05:27.730 Los profesores jóvenes pueden ser asignados a los cursos introductorios. 00:05:27.730 --> 00:05:31.875 Entonces, si los estudiantes piensan que los profesores jóvenes son atractivos 00:05:31.875 --> 00:05:34.175 encontrarán una asociación positiva 00:05:34.175 --> 00:05:37.479 entre las tasas de atractivo y los puntajes de evaluación. 00:05:37.481 --> 00:05:40.198 Pero la dificultad del curso 00:05:40.198 --> 00:05:43.537 la variable que dejamos de lado, y no la parte del atractivo 00:05:43.537 --> 00:05:46.026 lo que está impulsando los puntajes de evaluaciones. 00:05:46.026 --> 00:05:49.999 En ese caso, las horas en el espejo no servirían de nada 00:05:49.999 --> 00:05:54.097 un caso de correlación erróneo por causalidad. 00:05:54.590 --> 00:05:58.238 Hablaremos sobre esto en otro video. 00:05:58.682 --> 00:06:01.989 ¿Y qué sucedería si hubiera otras variables importantes 00:06:01.989 --> 00:06:05.501 que afecten tanto las tasas de atractivo como los puntajes de evaluación? 00:06:06.266 --> 00:06:11.225 Podría agregar consideraciones como la habilidad, la raza, el sexo 00:06:11.225 --> 00:06:14.497 y si el idioma inglés es la lengua nativa del profesor 00:06:14.497 --> 00:06:19.058 para aislar más el efecto del atractivo en las evaluaciones. 00:06:19.058 --> 00:06:21.628 Cuando tenemos una regresión múltiple 00:06:21.628 --> 00:06:24.177 podremos medir el impacto del atractivo 00:06:24.177 --> 00:06:26.219 en las evaluaciones del profesor 00:06:26.219 --> 00:06:30.696 mientras consideramos otras variables que podrían confundir esta asociación. 00:06:31.672 --> 00:06:35.309 En el próximo episodio, jugaremos un poco con estos datos 00:06:35.309 --> 00:06:39.046 para obtener un mejor entendimiento de lo que esta línea puede decirnos. 00:06:40.919 --> 00:06:42.275 [Narrador] ¡Felicitaciones! 00:06:42.275 --> 00:06:45.228 Está un paso más cerca de ser un ninja de los datos. 00:06:45.228 --> 00:06:48.540 Pero para mejorar, necesita fortalecer sus habilidades 00:06:48.540 --> 00:06:50.445 con algunas preguntas de práctica. 00:06:50.445 --> 00:06:53.742 ¿Listo para su próxima misión? Haga clic en "Next Video". 00:06:54.213 --> 00:06:55.328 ¿Sigue aquí? 00:06:55.328 --> 00:06:58.205 Pase de entender los datos a entender su mundo 00:06:58.205 --> 00:07:01.592 revisando nuestros otros videos populares de economía de MRU. 00:07:01.592 --> 00:07:03.513 ♪ [música] ♪