♪ [música] ♪ [Thomas Stratmann] Hola. En las próximas series de videos les vamos a dar una herramienta nueva muy útil para ponerla en su caja de herramientas de Understanding Data regresión lineal. Imaginemos que tiene esta teoría. Ha visto que personas atractivas parecen tener ventajas especiales. Y se pregunta "¿Dónde más se podría ver este fenómeno?". ¿Qué tal el caso de los profesores? ¿Es posible que los profesores atractivos obtengan ventajas especiales también? ¿Es posible que los estudiantes los traten mejor llenándolos de evaluaciones mejores de los estudiantes? Si es así, ¿el efecto de la apariencia en las evaluaciones es grande o muy pequeño? Supongamos que un profesor nuevo está comenzando en una universidad. Buenos días, amigos. ¿Qué podemos predecir sobre su evaluación con solo mirar su apariencia? Dado que estas evaluaciones pueden determinar los aumentos salariales si esta teoría fuera cierta, veríamos a profesores recurrir a tácticas sorprendentes para mejorar sus puntajes. Supongamos que quería saber si las evaluaciones mejoran con una mejor apariencia. ¿Cómo haría para probar esta hipótesis? Podría recolectar datos. Primero, le pediría a los estudiantes que califiquen en una escala del 1 al 10 qué tan apuesto les parece un profesor lo que les da un puntaje de atractivo promedio. Luego, puede extraer las evaluaciones de enseñanza del profesor de 25 estudiantes. Veamos estas dos variables al mismo tiempo usando una dispersión. Pondremos el atractivo en el eje horizontal y las evaluaciones del profesor en el eje vertical. Por ejemplo, este punto representa al profesor Peate que recibió un puntaje de atractivo de 3 y una evaluación de 8.425. Este de aquí es el profesor Helmchen que es muy atractivo. Y obtuvo un puntaje de atractivo alto pero una evaluación no muy buena. ¿Pueden ver una tendencia? Mientras nos movemos de izquierda a derecha en el eje horizontal, de lo feo a lo atractivo vemos una tendencia ascendente en los puntajes de evaluación. Por cierto, los datos que revisamos en estas series no son inventados vienen de un estudio real, realizado en la Universidad de Texas. Si se preguntan, "pulcritud" es una manera elegante y académica de referirse a lo atractivo. Con las dispersiones, puede ser difícil distinguir la relación exacta entre dos variables sobre todo, cuando los valores fluctúan un poco si nos desplazamos de izquierda a derecha. Una manera de suprimir esta fluctuación es dibujando una línea recta a través de la nube de datos de manera que esta línea resuma los datos lo más aproximado posible. El término técnico para esto es "regresión lineal". Más adelante, hablaremos sobre cómo se crea esta línea pero por ahora supongamos que la línea encaja con los datos lo más aproximado posible. ¿Qué nos puede decir esta línea? Primero, vemos rápidamente si la línea se inclina hacia arriba o hacia abajo. En nuestro conjunto de datos, vemos que la línea se inclina hacia arriba. Esto confirma lo que especulamos antes con solo observar la dispersión. La pendiente ascendente significa que existe una asociación positiva entre los puntajes de atractivo y de evaluación. En otras palabras, en promedio los profesores más atractivos obtienen mejores evaluaciones. Para otros conjuntos de datos, podríamos ver una asociación más fuerte. O podría tener una asociación negativa. O quizás no obtendría ninguna asociación. Y nuestras líneas no tienen que ser rectas. Pueden ser una curva para encajar los datos cuando sea necesario. Esta línea también nos brinda una manera de predecir los resultados. Podemos tomar un puntaje de atractivo y medir la línea de lo que sería el puntaje de evaluación predicho. Ahora volvamos al profesor nuevo. Podemos medir con precisión su puntaje de evaluación. Pero esperen un momento ¿podemos confiar en esta predicción? ¿Qué tan bien esta variable de atractivo predice las evaluaciones? La regresión lineal nos brinda algunas medidas útiles para responder esas preguntas de las cuales hablaremos en un próximo video. Además, debemos tener cuidado de otros inconvenientes antes de llegar a conclusiones definitivas. Imaginemos un escenario donde lo que está impulsando la asociación que vemos es una tercera variable que dejamos de lado. Por ejemplo, la dificultad del curso podría estar detrás de la asociación positiva entre las tasas de atractivo y los puntajes de evaluación. Los cursos introductorios fáciles obtienen evaluaciones buenas y los cursos más difíciles y avanzados obtienen evaluaciones malas. Los profesores jóvenes pueden ser asignados a los cursos introductorios. Entonces, si los estudiantes piensan que los profesores más jóvenes... encontrarán una asociación positiva entre las tasas de atractivo y los puntajes de evaluación. Pero la dificultad del curso la variable que dejamos de lado, y no la parte del atractivo lo que está impulsando los puntajes de evaluaciones. En ese caso, las horas en el espejo no servirían de nada un caso de correlación erróneo por causalidad. Hablaremos sobre esto en otro video. ¿Y qué sucedería si hubiera otras variables importantes que afecten tanto las tasas de atractivo como los puntajes de evaluación?