♪ [música] ♪
[Thomas Stratmann] Hola.
En las próximas series de videos
les vamos a dar una herramienta
nueva muy útil
para ponerla en su caja de herramientas
de Understanding Data
regresión lineal.
Imaginemos que tiene esta teoría.
Ha visto que personas atractivas
parecen tener ventajas especiales.
Y se pregunta
"¿Dónde más se podría ver este fenómeno?".
¿Qué tal el caso de los profesores?
¿Es posible que los profesores atractivos
obtengan ventajas especiales también?
¿Es posible que los estudiantes
los traten mejor
llenándolos de evaluaciones
mejores de los estudiantes?
Si es así, ¿el efecto de la apariencia
en las evaluaciones
es grande o muy pequeño?
Supongamos que un profesor nuevo
está comenzando en una universidad.
Buenos días, amigos.
¿Qué podemos predecir sobre su evaluación
con solo mirar su apariencia?
Dado que estas evaluaciones
pueden determinar los aumentos salariales
si esta teoría fuera cierta,
veríamos a profesores recurrir
a tácticas sorprendentes
para mejorar sus puntajes.
Supongamos que quería saber
si las evaluaciones mejoran
con una mejor apariencia.
¿Cómo haría para probar esta hipótesis?
Podría recolectar datos.
Primero, le pediría a los estudiantes
que califiquen en una escala del 1 al 10
qué tan apuesto les parece un profesor
lo que les da un puntaje
de atractivo promedio.
Luego, puede extraer las evaluaciones
de enseñanza del profesor
de 25 estudiantes.
Veamos estas dos variables al mismo tiempo
usando una dispersión.
Pondremos el atractivo
en el eje horizontal
y las evaluaciones del profesor
en el eje vertical.
Por ejemplo, este punto
representa al profesor Peate
que recibió un puntaje de atractivo de 3
y una evaluación de 8.425.
Este de aquí es el profesor Helmchen
que es muy atractivo.
Y obtuvo un puntaje de atractivo alto
pero una evaluación no muy buena.
¿Pueden ver una tendencia?
Mientras nos movemos
de izquierda a derecha
en el eje horizontal,
de lo feo a lo atractivo
vemos una tendencia ascendente
en los puntajes de evaluación.
Por cierto, los datos
que revisamos en estas series
no son inventados
vienen de un estudio real,
realizado en la Universidad de Texas.
Si se preguntan, "pulcritud" es una manera
elegante y académica
de referirse a lo atractivo.
Con las dispersiones, puede ser difícil
distinguir la relación exacta
entre dos variables
sobre todo, cuando los valores
fluctúan un poco
si nos desplazamos de izquierda a derecha.
Una manera de suprimir esta fluctuación
es dibujando una línea recta
a través de la nube de datos
de manera que esta línea resuma los datos
lo más aproximado posible.
El término técnico para esto
es "regresión lineal".
Más adelante, hablaremos
sobre cómo se crea esta línea
pero por ahora supongamos
que la línea encaja con los datos
lo más aproximado posible.
¿Qué nos puede decir esta línea?
Primero, vemos rápidamente
si la línea se inclina
hacia arriba o hacia abajo.
En nuestro conjunto de datos, vemos
que la línea se inclina hacia arriba.
Esto confirma lo que especulamos antes
con solo observar la dispersión.
La pendiente ascendente significa
que existe una asociación positiva
entre los puntajes
de atractivo y de evaluación.
En otras palabras, en promedio
los profesores más atractivos
obtienen mejores evaluaciones.
Para otros conjuntos de datos,
podríamos ver una asociación más fuerte.
O podría tener una asociación negativa.
O quizás no obtendría ninguna asociación.
Y nuestras líneas
no tienen que ser rectas.
Pueden ser una curva para encajar
los datos cuando sea necesario.
Esta línea también nos brinda
una manera de predecir los resultados.
Podemos tomar un puntaje de atractivo
y medir la línea
de lo que sería el puntaje
de evaluación predicho.
Ahora volvamos al profesor nuevo.
Podemos medir con precisión
su puntaje de evaluación.
Pero esperen un momento
¿podemos confiar en esta predicción?
¿Qué tan bien esta variable de atractivo
predice las evaluaciones?
La regresión lineal nos brinda
algunas medidas útiles
para responder esas preguntas
de las cuales hablaremos
en un próximo video.
Además, debemos tener cuidado
de otros inconvenientes
antes de llegar
a conclusiones definitivas.
Imaginemos un escenario
donde lo que está impulsando
la asociación que vemos
es una tercera variable
que dejamos de lado.
Por ejemplo, la dificultad del curso
podría estar
detrás de la asociación positiva
entre las tasas de atractivo
y los puntajes de evaluación.
Los cursos introductorios fáciles
obtienen evaluaciones buenas
y los cursos más difíciles y avanzados
obtienen evaluaciones malas.
Los profesores jóvenes pueden ser
asignados a los cursos introductorios.
Entonces, si los estudiantes piensan
que los profesores más jóvenes...
encontrarán una asociación positiva
entre las tasas de atractivo
y los puntajes de evaluación.
Pero la dificultad del curso
la variable que dejamos de lado,
y no la parte del atractivo
lo que está impulsando
los puntajes de evaluaciones.
En ese caso, las horas en el espejo
no servirían de nada
un caso de correlación erróneo
por causalidad.
Hablaremos sobre esto en otro video.
¿Y qué sucedería si hubiera
otras variables importantes
que afecten tanto las tasas de atractivo
como los puntajes de evaluación?
Podría querer agregar consideraciones
como la habilidad, la raza, el sexo
y si el idioma inglés es
la lengua nativa del profesor
para aislar más el efecto
del atractivo en las evaluaciones.
Cuando tenemos una regresión múltiple
podremos medir el impacto del atractivo
en las evaluaciones del profesor
mientras consideramos otras variables
que podrían confundir esta asociación.
En el próximo episodio,
jugaremos un poco con estos datos
para obtener un mejor entendimiento
de lo que esta línea puede decirnos.
[Narrador] ¡Felicitaciones!
Está un paso más cerca
de ser un ninja de los datos.
Pero para mejorar,
necesita fortalecer sus habilidades
con algunas preguntas de práctica.
¿Listo para su próxima misión?
Haga clic en "Next Video".
¿Sigue aquí?
Pase de entender los datos
a entender su mundo
revisando nuestros otros videos
populares de economía de MRU.
♪ [música] ♪