1 00:00:00,087 --> 00:00:06,941 ♪ [música] ♪ 2 00:00:20,830 --> 00:00:22,027 [Thomas Stratmann] Hola. 3 00:00:22,027 --> 00:00:24,128 En las próximas series de videos 4 00:00:24,128 --> 00:00:26,808 les vamos a dar una herramienta nueva muy útil 5 00:00:26,808 --> 00:00:30,334 para ponerla en su caja de herramientas de Understanding Data 6 00:00:30,334 --> 00:00:31,981 regresión lineal. 7 00:00:32,685 --> 00:00:34,608 Imaginemos que tiene esta teoría. 8 00:00:34,608 --> 00:00:39,186 Ha visto que las personas atractivas parecen tener ventajas especiales. 9 00:00:39,462 --> 00:00:40,728 Y se pregunta 10 00:00:40,728 --> 00:00:43,752 "¿Dónde más se podría ver este fenómeno?". 11 00:00:43,752 --> 00:00:45,567 ¿Qué tal el caso de los profesores? 12 00:00:45,567 --> 00:00:49,930 ¿Es posible que los profesores atractivos obtengan ventajas especiales también? 13 00:00:49,930 --> 00:00:53,779 ¿Es posible que los estudiantes los traten mejor 14 00:00:53,779 --> 00:00:57,349 con evaluaciones mejores de los estudiantes? 15 00:00:57,756 --> 00:01:00,427 Si es así, ¿el efecto de la apariencia 16 00:01:00,427 --> 00:01:03,620 en las evaluaciones es grande o muy pequeño? 17 00:01:04,059 --> 00:01:08,199 Supongamos que un profesor nuevo está comenzando en una universidad. 18 00:01:08,199 --> 00:01:13,485 ¿Qué podemos predecir sobre su evaluación con solo mirar su apariencia? 19 00:01:13,830 --> 00:01:17,261 Dado que estas evaluaciones pueden determinar los aumentos salariales 20 00:01:17,261 --> 00:01:21,619 si esta teoría fuera cierta, veríamos a profesores recurrir 21 00:01:21,619 --> 00:01:24,995 a tácticas sorprendentes para mejorar sus puntajes. 22 00:01:25,331 --> 00:01:27,291 Supongamos que quería saber 23 00:01:27,291 --> 00:01:30,813 si las evaluaciones mejoran con una mejor apariencia. 24 00:01:31,261 --> 00:01:34,484 ¿Cómo haría para probar esta hipótesis? 25 00:01:34,856 --> 00:01:36,331 Podría recolectar datos. 26 00:01:36,331 --> 00:01:40,025 Primero, le pediría a los estudiantes que califiquen en una escala del 1 al 10 27 00:01:40,025 --> 00:01:42,026 qué tan apuesto les parece un profesor 28 00:01:42,026 --> 00:01:44,949 lo que les da un puntaje de atractivo promedio. 29 00:01:44,949 --> 00:01:48,552 Luego, puede extraer las evaluaciones de enseñanza del profesor 30 00:01:48,552 --> 00:01:50,361 de 25 estudiantes. 31 00:01:50,361 --> 00:01:53,203 Veamos estas dos variables al mismo tiempo 32 00:01:53,203 --> 00:01:54,771 usando una dispersión. 33 00:01:54,771 --> 00:01:57,512 Pondremos el atractivo en el eje horizontal 34 00:01:57,512 --> 00:02:00,725 y las evaluaciones del profesor en el eje vertical. 35 00:02:01,093 --> 00:02:05,444 Por ejemplo, este punto representa al profesor Peate 36 00:02:06,083 --> 00:02:08,811 que recibió un puntaje de atractivo de 3 37 00:02:08,811 --> 00:02:11,854 y una evaluación de 8.425. 38 00:02:11,854 --> 00:02:14,918 Este de aquí es el profesor Helmchen 39 00:02:14,918 --> 00:02:16,627 que es muy atractivo. 40 00:02:16,627 --> 00:02:20,721 Y obtuvo un puntaje de atractivo alto, pero una evaluación no muy buena. 41 00:02:20,721 --> 00:02:22,183 ¿Pueden ver una tendencia? 42 00:02:22,183 --> 00:02:24,483 Mientras nos movemos de izquierda a derecha 43 00:02:24,483 --> 00:02:27,753 en el eje horizontal, de lo feo a lo atractivo 44 00:02:27,753 --> 00:02:31,370 vemos una tendencia ascendente en los puntajes de evaluación. 45 00:02:31,680 --> 00:02:35,134 Por cierto, los datos que revisamos en estas series 46 00:02:35,134 --> 00:02:36,618 no son inventados 47 00:02:36,618 --> 00:02:40,914 pertenecen a un estudio real, realizado en la Universidad de Texas. 48 00:02:41,217 --> 00:02:46,023 Si se preguntan, "pulcritud" es una manera elegante y académica 49 00:02:46,023 --> 00:02:47,970 de referirse a lo atractivo. 50 00:02:48,295 --> 00:02:51,414 Con las dispersiones, puede ser difícil 51 00:02:51,414 --> 00:02:55,404 distinguir la relación exacta entre dos variables 52 00:02:55,404 --> 00:02:59,014 sobre todo, cuando los valores fluctúan un poco 53 00:02:59,014 --> 00:03:01,451 si nos desplazamos de izquierda a derecha. 54 00:03:01,910 --> 00:03:04,718 Una manera de suprimir esta fluctuación 55 00:03:04,718 --> 00:03:08,084 es dibujando una línea recta a través de la nube de datos 56 00:03:08,084 --> 00:03:10,635 de manera que esta línea resuma los datos 57 00:03:10,635 --> 00:03:12,646 lo más aproximado posible. 58 00:03:13,145 --> 00:03:17,268 El término técnico para esto es "regresión lineal". 59 00:03:17,639 --> 00:03:20,808 Más adelante, hablaremos sobre cómo se crea esta línea 60 00:03:20,808 --> 00:03:24,178 pero por ahora supongamos que la línea encaja con los datos 61 00:03:24,178 --> 00:03:26,476 lo más aproximado posible. 62 00:03:26,987 --> 00:03:29,697 ¿Qué nos puede decir esta línea? 63 00:03:29,697 --> 00:03:32,356 Primero, vemos rápidamente 64 00:03:32,356 --> 00:03:35,428 si la línea se inclina hacia arriba o hacia abajo. 65 00:03:35,907 --> 00:03:39,967 En nuestro conjunto de datos, vemos que la línea se inclina hacia arriba. 66 00:03:40,624 --> 00:03:43,667 Esto confirma lo que especulamos antes 67 00:03:43,667 --> 00:03:45,605 con solo observar la dispersión. 68 00:03:46,000 --> 00:03:49,987 La pendiente ascendente significa que existe una asociación positiva 69 00:03:49,987 --> 00:03:53,164 entre los puntajes de atractivo y de evaluación. 70 00:03:53,164 --> 00:03:55,727 En otras palabras, en promedio 71 00:03:55,727 --> 00:03:59,498 los profesores más atractivos obtienen mejores evaluaciones. 72 00:03:59,498 --> 00:04:04,017 Para otros conjuntos de datos, podríamos ver una asociación más fuerte 73 00:04:04,017 --> 00:04:07,523 o podría haber una asociación negativa. 74 00:04:07,817 --> 00:04:10,778 O quizás no obtendría ninguna asociación. 75 00:04:10,778 --> 00:04:13,985 Y nuestras líneas no tienen que ser rectas. 76 00:04:14,359 --> 00:04:17,319 Pueden ser una curva para encajar los datos cuando sea necesario. 77 00:04:17,710 --> 00:04:21,379 Esta línea también nos brinda una manera de predecir los resultados. 78 00:04:21,379 --> 00:04:25,419 Podemos tomar un puntaje de atractivo y medir la línea 79 00:04:25,419 --> 00:04:28,429 de lo que sería el puntaje de evaluación predicho. 80 00:04:28,429 --> 00:04:30,441 Ahora volvamos al profesor nuevo. 81 00:04:30,817 --> 00:04:34,217 Podemos medir con precisión su puntaje de evaluación. 82 00:04:34,603 --> 00:04:36,759 Pero esperen un momento 83 00:04:36,759 --> 00:04:38,889 ¿podemos confiar en esta predicción? 84 00:04:38,893 --> 00:04:41,465 ¿Qué tan bien esta variable de atractivo 85 00:04:41,465 --> 00:04:43,638 predice las evaluaciones? 86 00:04:44,464 --> 00:04:47,730 La regresión lineal nos brinda algunas medidas útiles 87 00:04:47,730 --> 00:04:49,640 para responder esas preguntas 88 00:04:49,640 --> 00:04:52,147 de las cuales hablaremos en un próximo video. 89 00:04:52,788 --> 00:04:55,439 Además, debemos tener cuidado de otros inconvenientes 90 00:04:55,439 --> 00:04:58,378 antes de llegar a conclusiones definitivas. 91 00:04:58,773 --> 00:05:00,430 Imaginemos este escenario 92 00:05:00,430 --> 00:05:03,639 donde lo que está impulsando la asociación que vemos 93 00:05:03,639 --> 00:05:07,134 es una tercera variable que dejamos de lado. 94 00:05:07,134 --> 00:05:09,885 Por ejemplo, la dificultad del curso 95 00:05:09,885 --> 00:05:12,396 podría estar detrás de la asociación positiva 96 00:05:12,396 --> 00:05:15,747 entre las tasas de atractivo y los puntajes de evaluación. 97 00:05:15,752 --> 00:05:18,998 Los cursos introductorios fáciles obtienen evaluaciones buenas 98 00:05:18,998 --> 00:05:23,063 y los cursos más difíciles y avanzados obtienen evaluaciones malas. 99 00:05:23,520 --> 00:05:27,730 Los profesores jóvenes pueden ser asignados a los cursos introductorios. 100 00:05:27,730 --> 00:05:31,875 Entonces, si los estudiantes piensan que los profesores jóvenes son atractivos 101 00:05:31,875 --> 00:05:34,175 encontrarán una asociación positiva 102 00:05:34,175 --> 00:05:37,479 entre las tasas de atractivo y los puntajes de evaluación. 103 00:05:37,481 --> 00:05:40,198 Pero la dificultad del curso 104 00:05:40,198 --> 00:05:43,537 la variable que dejamos de lado, y no la parte del atractivo 105 00:05:43,537 --> 00:05:46,026 lo que está impulsando los puntajes de evaluaciones. 106 00:05:46,026 --> 00:05:49,999 En ese caso, las horas en el espejo no servirían de nada 107 00:05:49,999 --> 00:05:54,097 un caso de correlación erróneo por causalidad. 108 00:05:54,590 --> 00:05:58,238 Hablaremos sobre esto en otro video. 109 00:05:58,682 --> 00:06:01,989 ¿Y qué sucedería si hubiera otras variables importantes 110 00:06:01,989 --> 00:06:05,501 que afecten tanto las tasas de atractivo como los puntajes de evaluación? 111 00:06:06,266 --> 00:06:11,225 Podría agregar consideraciones como la habilidad, la raza, el sexo 112 00:06:11,225 --> 00:06:14,497 y si el idioma inglés es la lengua nativa del profesor 113 00:06:14,497 --> 00:06:19,058 para aislar más el efecto del atractivo en las evaluaciones. 114 00:06:19,058 --> 00:06:21,628 Cuando tenemos una regresión múltiple 115 00:06:21,628 --> 00:06:24,177 podremos medir el impacto del atractivo 116 00:06:24,177 --> 00:06:26,219 en las evaluaciones del profesor 117 00:06:26,219 --> 00:06:30,696 mientras consideramos otras variables que podrían confundir esta asociación. 118 00:06:31,672 --> 00:06:35,309 En el próximo episodio, jugaremos un poco con estos datos 119 00:06:35,309 --> 00:06:39,046 para obtener un mejor entendimiento de lo que esta línea puede decirnos. 120 00:06:40,919 --> 00:06:42,275 [Narrador] ¡Felicitaciones! 121 00:06:42,275 --> 00:06:45,228 Está un paso más cerca de ser un ninja de los datos. 122 00:06:45,228 --> 00:06:48,540 Pero para mejorar, necesita fortalecer sus habilidades 123 00:06:48,540 --> 00:06:50,445 con algunas preguntas de práctica. 124 00:06:50,445 --> 00:06:53,742 ¿Listo para su próxima misión? Haga clic en "Next Video". 125 00:06:54,213 --> 00:06:55,328 ¿Sigue aquí? 126 00:06:55,328 --> 00:06:58,205 Pase de entender los datos a entender su mundo 127 00:06:58,205 --> 00:07:01,592 revisando nuestros otros videos populares de economía de MRU. 128 00:07:01,592 --> 00:07:03,513 ♪ [música] ♪