0:00:00.107,0:00:03.926 ♪ [música] ♪ 0:00:20.880,0:00:22.077 [Thomas Stratmann] Hola. 0:00:22.077,0:00:24.268 En las próximas series de videos 0:00:24.268,0:00:26.858 les vamos a dar una herramienta[br]nueva muy útil 0:00:26.858,0:00:30.414 para ponerla en su caja de herramientas[br]de Understanding Data 0:00:30.414,0:00:31.981 regresión lineal. 0:00:32.885,0:00:34.668 Imaginemos que tiene esta teoría. 0:00:34.668,0:00:37.249 Ha visto que personas atractivas[br]parecen tener ventajas especiales. 0:00:37.249,0:00:39.067 0:00:39.642,0:00:40.878 Y se pregunta 0:00:40.878,0:00:43.798 "¿Dónde más se podría ver este fenómeno?". 0:00:44.132,0:00:45.637 ¿Qué tal el caso de los profesores? 0:00:45.637,0:00:48.259 ¿Es posible que los profesores atractivos[br]obtengan ventajas especiales también? 0:00:48.259,0:00:50.010 0:00:50.350,0:00:53.899 ¿Es posible que los estudiantes[br]los traten mejor 0:00:53.899,0:00:57.209 llenándolos de evaluaciones[br]mejores de los estudiantes? 0:00:57.866,0:01:00.467 Si es así, ¿el efecto de la apariencia 0:01:00.467,0:01:03.573 en las evaluaciones[br]es grande o muy pequeño? 0:01:04.159,0:01:07.519 Supongamos que un profesor nuevo[br]está comenzando en una universidad. 0:01:07.519,0:01:08.759 Buenos días, amigos. 0:01:08.759,0:01:11.810 ¿Qué podemos predecir sobre su evaluación 0:01:11.810,0:01:13.371 con solo mirar su apariencia? 0:01:13.940,0:01:17.216 Dado que estas evaluaciones[br]pueden determinar los aumentos salariales 0:01:17.671,0:01:21.709 si esta teoría fuera cierta,[br]veríamos a profesores recurrir 0:01:21.709,0:01:24.519 a tácticas sorprendentes[br]para mejorar sus puntajes. 0:01:24.519,0:01:25.731 0:01:25.731,0:01:27.461 Supongamos que quería saber 0:01:27.461,0:01:30.801 si las evaluaciones mejoran[br]con una mejor apariencia. 0:01:31.441,0:01:34.450 ¿Cómo haría para probar esta hipótesis? 0:01:34.956,0:01:36.552 Podría recolectar datos. 0:01:36.761,0:01:40.025 Primero, le pediría a los estudiantes[br]que califiquen en una escala del 1 al 10 0:01:40.025,0:01:42.076 qué tan apuesto les parece un profesor 0:01:42.076,0:01:44.807 lo que les da un puntaje[br]de atractivo promedio. 0:01:45.229,0:01:48.552 Luego, puede extraer las evaluaciones[br]de enseñanza del profesor 0:01:48.552,0:01:50.421 de 25 estudiantes. 0:01:50.421,0:01:53.273 Veamos estas dos variables al mismo tiempo 0:01:53.273,0:01:54.738 usando una dispersión. 0:01:54.981,0:01:57.419 Pondremos el atractivo[br]en el eje horizontal 0:01:57.852,0:02:00.589 y las evaluaciones del profesor[br]en el eje vertical. 0:02:01.223,0:02:04.903 Por ejemplo, este punto[br]representa al profesor Peate 0:02:04.903,0:02:06.423 0:02:06.423,0:02:08.811 que recibió un puntaje de atractivo de 3 0:02:08.811,0:02:11.866 y una evaluación de 8.425. 0:02:12.084,0:02:14.958 Este de aquí es el profesor Helmchen 0:02:14.958,0:02:16.797 que es muy atractivo. 0:02:16.797,0:02:18.721 Y obtuvo un puntaje de atractivo alto 0:02:18.721,0:02:20.872 pero una evaluación no muy buena. 0:02:21.101,0:02:22.283 ¿Pueden ver una tendencia? 0:02:22.283,0:02:25.533 Mientras nos movemos[br]de izquierda a derecha 0:02:25.533,0:02:27.963 en el eje horizontal,[br]de lo feo a lo atractivo 0:02:27.963,0:02:31.186 vemos una tendencia ascendente[br]en los puntajes de evaluación. 0:02:31.870,0:02:35.174 Por cierto, los datos[br]que revisamos en estas series 0:02:35.174,0:02:38.923 no son inventados 0:02:38.923,0:02:40.897 vienen de un estudio real,[br]realizado en la Universidad de Texas. 0:02:41.337,0:02:46.023 Si se preguntan, "pulcritud" es una manera[br]elegante y académica 0:02:46.023,0:02:47.880 de referirse a lo atractivo. 0:02:48.405,0:02:51.474 Con las dispersiones, puede ser difícil 0:02:51.474,0:02:55.594 distinguir la relación exacta[br]entre dos variables 0:02:55.594,0:02:59.104 sobre todo, cuando los valores[br]fluctúan un poco 0:02:59.104,0:03:01.318 si nos desplazamos de izquierda a derecha. 0:03:02.000,0:03:04.908 Una manera de suprimir esta fluctuación 0:03:04.908,0:03:08.144 es dibujando una línea recta[br]a través de la nube de datos 0:03:08.144,0:03:10.775 de manera que esta línea resuma los datos 0:03:10.775,0:03:12.613 lo más aproximado posible. 0:03:13.295,0:03:17.181 El término técnico para esto[br]es "regresión lineal". 0:03:17.669,0:03:20.888 Más adelante, hablaremos[br]sobre cómo se crea esta línea 0:03:20.888,0:03:24.278 pero por ahora supongamos[br]que la línea encaja con los datos 0:03:24.278,0:03:26.456 lo más aproximado posible. 0:03:27.087,0:03:29.536 ¿Qué nos puede decir esta línea? 0:03:30.067,0:03:32.596 Primero, vemos rápidamente 0:03:32.596,0:03:35.358 si la línea se inclina[br]hacia arriba o hacia abajo. 0:03:36.107,0:03:39.827 En nuestro conjunto de datos, vemos[br]que la línea se inclina hacia arriba. 0:03:40.794,0:03:43.807 Esto confirma lo que especulamos antes 0:03:43.807,0:03:45.587 con solo observar la dispersión. 0:03:46.070,0:03:50.237 La pendiente ascendente significa[br]que existe una asociación positiva 0:03:50.237,0:03:53.026 entre los puntajes[br]de atractivo y de evaluación. 0:03:53.544,0:03:55.907 En otras palabras, en promedio 0:03:55.907,0:03:59.469 los profesores más atractivos[br]obtienen mejores evaluaciones. 0:03:59.768,0:04:03.939 Para otros conjuntos de datos,[br]podríamos ver una asociación más fuerte. 0:04:04.377,0:04:07.420 O podría tener una asociación negativa. 0:04:07.857,0:04:10.764 O quizás no obtendría ninguna asociación. 0:04:11.158,0:04:13.903 Y nuestras líneas[br]no tienen que ser rectas. 0:04:14.389,0:04:17.304 Pueden ser una curva para encajar[br]los datos cuando sea necesario. 0:04:17.770,0:04:21.262 Esta línea también nos brinda[br]una manera de predecir los resultados. 0:04:21.579,0:04:25.569 Podemos tomar un puntaje de atractivo[br]y medir la línea 0:04:25.569,0:04:28.429 de lo que sería el puntaje[br]de evaluación predicho. 0:04:28.429,0:04:30.229 Ahora volvamos al profesor nuevo. 0:04:30.229,0:04:31.297 0:04:31.297,0:04:34.109 Podemos medir con precisión[br]su puntaje de evaluación. 0:04:34.683,0:04:36.749 Pero esperen un momento 0:04:37.019,0:04:38.749 ¿podemos confiar en esta predicción? 0:04:39.233,0:04:41.665 ¿Qué tan bien esta variable de atractivo 0:04:41.665,0:04:43.515 predice las evaluaciones? 0:04:44.844,0:04:47.890 La regresión lineal nos brinda[br]algunas medidas útiles 0:04:47.890,0:04:49.770 para responder esas preguntas 0:04:49.770,0:04:52.039 de las cuales hablaremos[br]en un próximo video. 0:04:52.838,0:04:55.439 Además, debemos tener cuidado[br]de otros inconvenientes 0:04:55.439,0:04:58.340 antes de llegar[br]a conclusiones definitivas. 0:04:58.833,0:05:00.430 Imaginemos un escenario 0:05:00.430,0:05:03.639 donde lo que está impulsando[br]la asociación que vemos 0:05:03.639,0:05:06.900 es una tercera variable[br]que dejamos de lado. 0:05:07.344,0:05:09.965 Por ejemplo, la dificultad del curso 0:05:09.965,0:05:12.456 podría estar[br]detrás de la asociación positiva 0:05:12.456,0:05:15.645 entre las tasas de atractivo[br]y los puntajes de evaluación. 0:05:16.052,0:05:18.956 Los cursos introductorios fáciles[br]obtienen evaluaciones buenas 0:05:19.228,0:05:22.972 y los cursos más difíciles y avanzados[br]obtienen evaluaciones malas. 0:05:23.660,0:05:27.668 Los profesores jóvenes pueden ser[br]asignados a los cursos introductorios. 0:05:28.080,0:05:32.095 Entonces, si los estudiantes piensan[br]que los profesores más jóvenes... 0:05:32.095,0:05:34.335 encontrarán una asociación positiva 0:05:34.335,0:05:37.383 entre las tasas de atractivo[br]y los puntajes de evaluación. 0:05:37.861,0:05:40.388 Pero la dificultad del curso 0:05:40.388,0:05:43.537 la variable que dejamos de lado,[br]y no la parte del atractivo 0:05:43.537,0:05:45.848 lo que está impulsando[br]los puntajes de evaluaciones. 0:05:46.346,0:05:49.807 En ese caso, las horas en el espejo[br]no servirían de nada 0:05:50.289,0:05:53.620 un caso de correlación erróneo[br]por causalidad. 0:05:53.620,0:05:54.900 0:05:54.900,0:05:58.166 Hablaremos sobre esto en otro video. 0:05:58.922,0:06:02.069 ¿Y qué sucedería si hubiera[br]otras variables importantes 0:06:02.069,0:06:05.781 que afecten tanto las tasas de atractivo[br]como los puntajes de evaluación? 0:06:06.626,0:06:09.575 Podría querer agregar consideraciones[br]como la habilidad, la raza, el sexo 0:06:09.846,0:06:14.577 y si el idioma inglés es[br]la lengua nativa del profesor 0:06:14.577,0:06:18.994 para aislar más el efecto[br]del atractivo en las evaluaciones. 0:06:19.408,0:06:21.758 Cuando tenemos una regresión múltiple 0:06:21.758,0:06:24.477 podremos medir el impacto del atractivo 0:06:24.477,0:06:26.219 en las evaluaciones del profesor 0:06:26.219,0:06:28.368 mientras consideramos otras variables 0:06:28.368,0:06:30.737 que podrían confundir esta asociación. 0:06:31.762,0:06:35.509 En el próximo episodio,[br]jugaremos un poco con estos datos 0:06:35.509,0:06:39.070 para obtener un mejor entendimiento[br]de lo que esta línea puede decirnos. 0:06:41.169,0:06:42.445 [Narrador] ¡Felicitaciones! 0:06:42.445,0:06:45.247 Está un paso más cerca[br]de ser un ninja de los datos. 0:06:45.568,0:06:47.139 Pero para mejorar,[br]necesita fortalecer sus habilidades 0:06:47.139,0:06:48.700 0:06:48.700,0:06:50.404 con algunas preguntas de práctica. 0:06:50.865,0:06:53.976 ¿Listo para su próxima misión?[br]Haga clic en "Next Video". 0:06:54.313,0:06:55.364 ¿Sigue aquí? 0:06:55.598,0:06:58.325 0:06:58.325,0:07:01.642 0:07:01.892,0:07:04.406