0:00:00.107,0:00:03.926
♪ [música] ♪
0:00:20.880,0:00:22.077
[Thomas Stratmann] Hola.
0:00:22.077,0:00:24.268
En las próximas series de videos
0:00:24.268,0:00:26.858
les vamos a dar una herramienta[br]nueva muy útil
0:00:26.858,0:00:30.414
para ponerla en su caja de herramientas[br]de Understanding Data
0:00:30.414,0:00:31.981
regresión lineal.
0:00:32.885,0:00:34.668
Imaginemos que tiene esta teoría.
0:00:34.668,0:00:37.249
Ha visto que personas atractivas[br]parecen tener ventajas especiales.
0:00:37.249,0:00:39.067
0:00:39.642,0:00:40.878
Y se pregunta
0:00:40.878,0:00:43.798
"¿Dónde más se podría ver este fenómeno?".
0:00:44.132,0:00:45.637
¿Qué tal el caso de los profesores?
0:00:45.637,0:00:48.259
¿Es posible que los profesores atractivos[br]obtengan ventajas especiales también?
0:00:48.259,0:00:50.010
0:00:50.350,0:00:53.899
¿Es posible que los estudiantes[br]los traten mejor
0:00:53.899,0:00:57.209
llenándolos de evaluaciones[br]mejores de los estudiantes?
0:00:57.866,0:01:00.467
Si es así, ¿el efecto de la apariencia
0:01:00.467,0:01:03.573
en las evaluaciones[br]es grande o muy pequeño?
0:01:04.159,0:01:07.519
Supongamos que un profesor nuevo[br]está comenzando en una universidad.
0:01:07.519,0:01:08.759
Buenos días, amigos.
0:01:08.759,0:01:11.810
¿Qué podemos predecir sobre su evaluación
0:01:11.810,0:01:13.371
con solo mirar su apariencia?
0:01:13.940,0:01:17.216
Dado que estas evaluaciones[br]pueden determinar los aumentos salariales
0:01:17.671,0:01:21.709
si esta teoría fuera cierta,[br]veríamos a profesores recurrir
0:01:21.709,0:01:24.519
a tácticas sorprendentes[br]para mejorar sus puntajes.
0:01:24.519,0:01:25.731
0:01:25.731,0:01:27.461
Supongamos que quería saber
0:01:27.461,0:01:30.801
si las evaluaciones mejoran[br]con una mejor apariencia.
0:01:31.441,0:01:34.450
¿Cómo haría para probar esta hipótesis?
0:01:34.956,0:01:36.552
Podría recolectar datos.
0:01:36.761,0:01:40.025
Primero, le pediría a los estudiantes[br]que califiquen en una escala del 1 al 10
0:01:40.025,0:01:42.076
qué tan apuesto les parece un profesor
0:01:42.076,0:01:44.807
lo que les da un puntaje[br]de atractivo promedio.
0:01:45.229,0:01:48.552
Luego, puede extraer las evaluaciones[br]de enseñanza del profesor
0:01:48.552,0:01:50.421
de 25 estudiantes.
0:01:50.421,0:01:53.273
Veamos estas dos variables al mismo tiempo
0:01:53.273,0:01:54.738
usando una dispersión.
0:01:54.981,0:01:57.419
Pondremos el atractivo[br]en el eje horizontal
0:01:57.852,0:02:00.589
y las evaluaciones del profesor[br]en el eje vertical.
0:02:01.223,0:02:04.903
Por ejemplo, este punto[br]representa al profesor Peate
0:02:04.903,0:02:06.423
0:02:06.423,0:02:08.811
que recibió un puntaje de atractivo de 3
0:02:08.811,0:02:11.866
y una evaluación de 8.425.
0:02:12.084,0:02:14.958
Este de aquí es el profesor Helmchen
0:02:14.958,0:02:16.797
que es muy atractivo.
0:02:16.797,0:02:18.721
Y obtuvo un puntaje de atractivo alto
0:02:18.721,0:02:20.872
pero una evaluación no muy buena.
0:02:21.101,0:02:22.283
¿Pueden ver una tendencia?
0:02:22.283,0:02:25.533
Mientras nos movemos[br]de izquierda a derecha
0:02:25.533,0:02:27.963
en el eje horizontal,[br]de lo feo a lo atractivo
0:02:27.963,0:02:31.186
vemos una tendencia ascendente[br]en los puntajes de evaluación.
0:02:31.870,0:02:35.174
Por cierto, los datos[br]que revisamos en estas series
0:02:35.174,0:02:38.923
no son inventados
0:02:38.923,0:02:40.897
vienen de un estudio real,[br]realizado en la Universidad de Texas.
0:02:41.337,0:02:46.023
Si se preguntan, "pulcritud" es una manera[br]elegante y académica
0:02:46.023,0:02:47.880
de referirse a lo atractivo.
0:02:48.405,0:02:51.474
Con las dispersiones, puede ser difícil
0:02:51.474,0:02:55.594
distinguir la relación exacta[br]entre dos variables
0:02:55.594,0:02:59.104
sobre todo, cuando los valores[br]fluctúan un poco
0:02:59.104,0:03:01.318
si nos desplazamos de izquierda a derecha.
0:03:02.000,0:03:04.908
Una manera de suprimir esta fluctuación
0:03:04.908,0:03:08.144
es dibujando una línea recta[br]a través de la nube de datos
0:03:08.144,0:03:10.775
de manera que esta línea resuma los datos
0:03:10.775,0:03:12.613
lo más aproximado posible.
0:03:13.295,0:03:17.181
El término técnico para esto[br]es "regresión lineal".
0:03:17.669,0:03:20.888
Más adelante, hablaremos[br]sobre cómo se crea esta línea
0:03:20.888,0:03:24.278
pero por ahora supongamos[br]que la línea encaja con los datos
0:03:24.278,0:03:26.456
lo más aproximado posible.
0:03:27.087,0:03:29.536
¿Qué nos puede decir esta línea?
0:03:30.067,0:03:32.596
Primero, vemos rápidamente
0:03:32.596,0:03:35.358
si la línea se inclina[br]hacia arriba o hacia abajo.
0:03:36.107,0:03:39.827
En nuestro conjunto de datos, vemos[br]que la línea se inclina hacia arriba.
0:03:40.794,0:03:43.807
Esto confirma lo que especulamos antes
0:03:43.807,0:03:45.587
con solo observar la dispersión.
0:03:46.070,0:03:50.237
La pendiente ascendente significa[br]que existe una asociación positiva
0:03:50.237,0:03:53.026
entre los puntajes[br]de atractivo y de evaluación.
0:03:53.544,0:03:55.907
En otras palabras, en promedio
0:03:55.907,0:03:59.469
los profesores más atractivos[br]obtienen mejores evaluaciones.
0:03:59.768,0:04:03.939
Para otros conjuntos de datos,[br]podríamos ver una asociación más fuerte.
0:04:04.377,0:04:07.420
O podría tener una asociación negativa.
0:04:07.857,0:04:10.764
O quizás no obtendría ninguna asociación.
0:04:11.158,0:04:13.903
Y nuestras líneas[br]no tienen que ser rectas.
0:04:14.389,0:04:17.304
Pueden ser una curva para encajar[br]los datos cuando sea necesario.
0:04:17.770,0:04:21.262
Esta línea también nos brinda[br]una manera de predecir los resultados.
0:04:21.579,0:04:25.569
Podemos tomar un puntaje de atractivo[br]y medir la línea
0:04:25.569,0:04:28.429
de lo que sería el puntaje[br]de evaluación predicho.
0:04:28.429,0:04:30.229
Ahora volvamos al profesor nuevo.
0:04:30.229,0:04:31.297
0:04:31.297,0:04:34.109
Podemos medir con precisión[br]su puntaje de evaluación.
0:04:34.683,0:04:36.749
Pero esperen un momento
0:04:37.019,0:04:38.749
¿podemos confiar en esta predicción?
0:04:39.233,0:04:41.665
¿Qué tan bien esta variable de atractivo
0:04:41.665,0:04:43.515
predice las evaluaciones?
0:04:44.844,0:04:47.890
La regresión lineal nos brinda[br]algunas medidas útiles
0:04:47.890,0:04:49.770
para responder esas preguntas
0:04:49.770,0:04:52.039
de las cuales hablaremos[br]en un próximo video.
0:04:52.838,0:04:55.439
Además, debemos tener cuidado[br]de otros inconvenientes
0:04:55.439,0:04:58.340
antes de llegar[br]a conclusiones definitivas.
0:04:58.833,0:05:00.430
Imaginemos un escenario
0:05:00.430,0:05:03.639
donde lo que está impulsando[br]la asociación que vemos
0:05:03.639,0:05:06.900
es una tercera variable[br]que dejamos de lado.
0:05:07.344,0:05:09.965
Por ejemplo, la dificultad del curso
0:05:09.965,0:05:12.456
podría estar[br]detrás de la asociación positiva
0:05:12.456,0:05:15.645
entre las tasas de atractivo[br]y los puntajes de evaluación.
0:05:16.052,0:05:18.956
Los cursos introductorios fáciles[br]obtienen evaluaciones buenas
0:05:19.228,0:05:22.972
y los cursos más difíciles y avanzados[br]obtienen evaluaciones malas.
0:05:23.660,0:05:27.668
Los profesores jóvenes pueden ser[br]asignados a los cursos introductorios.
0:05:28.080,0:05:32.095
Entonces, si los estudiantes piensan[br]que los profesores más jóvenes...
0:05:32.095,0:05:34.335
encontrarán una asociación positiva
0:05:34.335,0:05:37.383
entre las tasas de atractivo[br]y los puntajes de evaluación.
0:05:37.861,0:05:40.388
Pero la dificultad del curso
0:05:40.388,0:05:43.537
la variable que dejamos de lado,[br]y no la parte del atractivo
0:05:43.537,0:05:45.848
lo que está impulsando[br]los puntajes de evaluaciones.
0:05:46.346,0:05:49.807
En ese caso, las horas en el espejo[br]no servirían de nada
0:05:50.289,0:05:53.620
un caso de correlación erróneo[br]por causalidad.
0:05:53.620,0:05:54.900
0:05:54.900,0:05:58.166
Hablaremos sobre esto en otro video.
0:05:58.922,0:06:02.069
¿Y qué sucedería si hubiera[br]otras variables importantes
0:06:02.069,0:06:05.781
que afecten tanto las tasas de atractivo[br]como los puntajes de evaluación?
0:06:06.626,0:06:09.575
Podría querer agregar consideraciones[br]como la habilidad, la raza, el sexo
0:06:09.846,0:06:14.577
y si el idioma inglés es[br]la lengua nativa del profesor
0:06:14.577,0:06:18.994
para aislar más el efecto[br]del atractivo en las evaluaciones.
0:06:19.408,0:06:21.758
Cuando tenemos una regresión múltiple
0:06:21.758,0:06:24.477
podremos medir el impacto del atractivo
0:06:24.477,0:06:26.219
en las evaluaciones del profesor
0:06:26.219,0:06:28.368
mientras consideramos otras variables
0:06:28.368,0:06:30.737
que podrían confundir esta asociación.
0:06:31.762,0:06:35.509
En el próximo episodio,[br]jugaremos un poco con estos datos
0:06:35.509,0:06:39.070
para obtener un mejor entendimiento[br]de lo que esta línea puede decirnos.
0:06:41.169,0:06:42.445
[Narrador] ¡Felicitaciones!
0:06:42.445,0:06:45.247
Está un paso más cerca[br]de ser un ninja de los datos.
0:06:45.568,0:06:47.139
Pero para mejorar,[br]necesita fortalecer sus habilidades
0:06:47.139,0:06:48.700
0:06:48.700,0:06:50.404
con algunas preguntas de práctica.
0:06:50.865,0:06:53.976
¿Listo para su próxima misión?[br]Haga clic en "Next Video".
0:06:54.313,0:06:55.364
¿Sigue aquí?
0:06:55.598,0:06:58.325
0:06:58.325,0:07:01.642
0:07:01.892,0:07:04.406