1 00:00:00,107 --> 00:00:03,926 ♪ [música] ♪ 2 00:00:20,880 --> 00:00:22,077 [Thomas Stratmann] Hola. 3 00:00:22,077 --> 00:00:24,268 En las próximas series de videos 4 00:00:24,268 --> 00:00:26,858 les vamos a dar una herramienta nueva muy útil 5 00:00:26,858 --> 00:00:30,414 para ponerla en su caja de herramientas de Understanding Data 6 00:00:30,414 --> 00:00:31,981 regresión lineal. 7 00:00:32,885 --> 00:00:34,668 Imaginemos que tiene esta teoría. 8 00:00:34,668 --> 00:00:37,249 Ha visto que personas atractivas parecen tener ventajas especiales. 9 00:00:37,249 --> 00:00:39,067 10 00:00:39,642 --> 00:00:40,878 Y se pregunta 11 00:00:40,878 --> 00:00:43,798 "¿Dónde más se podría ver este fenómeno?". 12 00:00:44,132 --> 00:00:45,637 ¿Qué tal el caso de los profesores? 13 00:00:45,637 --> 00:00:48,259 ¿Es posible que los profesores atractivos obtengan ventajas especiales también? 14 00:00:48,259 --> 00:00:50,010 15 00:00:50,350 --> 00:00:53,899 ¿Es posible que los estudiantes los traten mejor 16 00:00:53,899 --> 00:00:57,209 llenándolos de evaluaciones mejores de los estudiantes? 17 00:00:57,866 --> 00:01:00,467 Si es así, ¿el efecto de la apariencia 18 00:01:00,467 --> 00:01:03,573 en las evaluaciones es grande o muy pequeño? 19 00:01:04,159 --> 00:01:07,519 Supongamos que un profesor nuevo está comenzando en una universidad. 20 00:01:07,519 --> 00:01:08,759 Buenos días, amigos. 21 00:01:08,759 --> 00:01:11,810 ¿Qué podemos predecir sobre su evaluación 22 00:01:11,810 --> 00:01:13,371 con solo mirar su apariencia? 23 00:01:13,940 --> 00:01:17,216 Dado que estas evaluaciones pueden determinar los aumentos salariales 24 00:01:17,671 --> 00:01:21,709 si esta teoría fuera cierta, veríamos a profesores recurrir 25 00:01:21,709 --> 00:01:24,519 a tácticas sorprendentes para mejorar sus puntajes. 26 00:01:24,519 --> 00:01:25,731 27 00:01:25,731 --> 00:01:27,461 Supongamos que quería saber 28 00:01:27,461 --> 00:01:30,801 si las evaluaciones mejoran con una mejor apariencia. 29 00:01:31,441 --> 00:01:34,450 ¿Cómo haría para probar esta hipótesis? 30 00:01:34,956 --> 00:01:36,552 Podría recolectar datos. 31 00:01:36,761 --> 00:01:40,025 Primero, le pediría a los estudiantes que califiquen en una escala del 1 al 10 32 00:01:40,025 --> 00:01:42,076 qué tan apuesto les parece un profesor 33 00:01:42,076 --> 00:01:44,807 lo que les da un puntaje de atractivo promedio. 34 00:01:45,229 --> 00:01:48,552 Luego, puede extraer las evaluaciones de enseñanza del profesor 35 00:01:48,552 --> 00:01:50,421 de 25 estudiantes. 36 00:01:50,421 --> 00:01:53,273 Veamos estas dos variables al mismo tiempo 37 00:01:53,273 --> 00:01:54,738 usando una dispersión. 38 00:01:54,981 --> 00:01:57,419 Pondremos el atractivo en el eje horizontal 39 00:01:57,852 --> 00:02:00,589 y las evaluaciones del profesor en el eje vertical. 40 00:02:01,223 --> 00:02:04,903 Por ejemplo, este punto representa al profesor Peate 41 00:02:04,903 --> 00:02:06,423 42 00:02:06,423 --> 00:02:08,811 que recibió un puntaje de atractivo de 3 43 00:02:08,811 --> 00:02:11,866 y una evaluación de 8.425. 44 00:02:12,084 --> 00:02:14,958 Este de aquí es el profesor Helmchen 45 00:02:14,958 --> 00:02:16,797 que es muy atractivo. 46 00:02:16,797 --> 00:02:18,721 Y obtuvo un puntaje de atractivo alto 47 00:02:18,721 --> 00:02:20,872 pero una evaluación no muy buena. 48 00:02:21,101 --> 00:02:22,283 ¿Pueden ver una tendencia? 49 00:02:22,283 --> 00:02:25,533 Mientras nos movemos de izquierda a derecha 50 00:02:25,533 --> 00:02:27,963 en el eje horizontal, de lo feo a lo atractivo 51 00:02:27,963 --> 00:02:31,186 vemos una tendencia ascendente en los puntajes de evaluación. 52 00:02:31,870 --> 00:02:35,174 Por cierto, los datos que revisamos en estas series 53 00:02:35,174 --> 00:02:38,923 no son inventados 54 00:02:38,923 --> 00:02:40,897 vienen de un estudio real, realizado en la Universidad de Texas. 55 00:02:41,337 --> 00:02:46,023 Si se preguntan, "pulcritud" es una manera elegante y académica 56 00:02:46,023 --> 00:02:47,880 de referirse a lo atractivo. 57 00:02:48,405 --> 00:02:51,474 Con las dispersiones, puede ser difícil 58 00:02:51,474 --> 00:02:55,594 distinguir la relación exacta entre dos variables 59 00:02:55,594 --> 00:02:59,104 sobre todo, cuando los valores fluctúan un poco 60 00:02:59,104 --> 00:03:01,318 si nos desplazamos de izquierda a derecha. 61 00:03:02,000 --> 00:03:04,908 Una manera de suprimir esta fluctuación 62 00:03:04,908 --> 00:03:08,144 es dibujando una línea recta a través de la nube de datos 63 00:03:08,144 --> 00:03:10,775 de manera que esta línea resuma los datos 64 00:03:10,775 --> 00:03:12,613 lo más aproximado posible. 65 00:03:13,295 --> 00:03:17,181 El término técnico para esto es "regresión lineal". 66 00:03:17,669 --> 00:03:20,888 Más adelante, hablaremos sobre cómo se crea esta línea 67 00:03:20,888 --> 00:03:24,278 pero por ahora supongamos que la línea encaja con los datos 68 00:03:24,278 --> 00:03:26,456 lo más aproximado posible. 69 00:03:27,087 --> 00:03:29,536 ¿Qué nos puede decir esta línea? 70 00:03:30,067 --> 00:03:32,596 Primero, vemos rápidamente 71 00:03:32,596 --> 00:03:35,358 si la línea se inclina hacia arriba o hacia abajo. 72 00:03:36,107 --> 00:03:39,827 En nuestro conjunto de datos, vemos que la línea se inclina hacia arriba. 73 00:03:40,794 --> 00:03:43,807 Esto confirma lo que especulamos antes 74 00:03:43,807 --> 00:03:45,587 con solo observar la dispersión. 75 00:03:46,070 --> 00:03:50,237 76 00:03:50,237 --> 00:03:53,026 77 00:03:53,544 --> 00:03:55,907 78 00:03:55,907 --> 00:03:59,469 79 00:03:59,768 --> 00:04:03,939 80 00:04:04,377 --> 00:04:07,420 81 00:04:07,857 --> 00:04:10,764 82 00:04:11,158 --> 00:04:13,903 83 00:04:14,389 --> 00:04:17,304 84 00:04:17,770 --> 00:04:21,262 85 00:04:21,579 --> 00:04:25,569 86 00:04:25,569 --> 00:04:28,429 87 00:04:28,429 --> 00:04:30,229 88 00:04:30,229 --> 00:04:31,297 89 00:04:31,297 --> 00:04:34,109 90 00:04:34,683 --> 00:04:36,749 91 00:04:37,019 --> 00:04:38,749 92 00:04:39,233 --> 00:04:41,665 93 00:04:41,665 --> 00:04:43,515 94 00:04:44,844 --> 00:04:47,890 95 00:04:47,890 --> 00:04:49,770 96 00:04:49,770 --> 00:04:52,039 97 00:04:52,838 --> 00:04:55,439 98 00:04:55,439 --> 00:04:58,340 99 00:04:58,833 --> 00:05:00,430 100 00:05:00,430 --> 00:05:03,639 101 00:05:03,639 --> 00:05:06,900 102 00:05:07,344 --> 00:05:09,965 103 00:05:09,965 --> 00:05:12,456 104 00:05:12,456 --> 00:05:15,645 105 00:05:16,052 --> 00:05:18,956 106 00:05:19,228 --> 00:05:22,972 107 00:05:23,660 --> 00:05:27,668 108 00:05:28,080 --> 00:05:32,095 109 00:05:32,095 --> 00:05:34,335 110 00:05:34,335 --> 00:05:37,383 111 00:05:37,861 --> 00:05:40,388 112 00:05:40,388 --> 00:05:43,537 113 00:05:43,537 --> 00:05:45,848 114 00:05:46,346 --> 00:05:49,807 115 00:05:50,289 --> 00:05:53,620 116 00:05:53,620 --> 00:05:54,900 117 00:05:54,900 --> 00:05:58,166 118 00:05:58,922 --> 00:06:02,069 119 00:06:02,069 --> 00:06:05,781 120 00:06:06,626 --> 00:06:09,575 121 00:06:09,846 --> 00:06:14,577 122 00:06:14,577 --> 00:06:18,994 123 00:06:19,408 --> 00:06:21,758 124 00:06:21,758 --> 00:06:24,477 125 00:06:24,477 --> 00:06:26,219 126 00:06:26,219 --> 00:06:28,368 127 00:06:28,368 --> 00:06:30,737 128 00:06:31,762 --> 00:06:35,509 129 00:06:35,509 --> 00:06:39,070 130 00:06:41,169 --> 00:06:42,445 131 00:06:42,445 --> 00:06:45,247 132 00:06:45,568 --> 00:06:47,139 133 00:06:47,139 --> 00:06:48,700 134 00:06:48,700 --> 00:06:50,404 135 00:06:50,865 --> 00:06:53,976 136 00:06:54,313 --> 00:06:55,364 137 00:06:55,598 --> 00:06:58,325 138 00:06:58,325 --> 00:07:01,642 139 00:07:01,892 --> 00:07:04,406