0:00:06.000,0:00:09.000 Las variables de confusión [br]son un tipo de variables 0:00:09.000,0:00:11.580 que están relacionadas[br]con las variables independientes 0:00:11.580,0:00:13.410 y dependientes de un modelo. 0:00:13.545,0:00:17.320 Una variable de confusión [br]debe cumplir dos requisitos: 0:00:17.320,0:00:19.460 el primero es que [br]debe estar correlacionada 0:00:19.460,0:00:21.640 con la variable independiente. 0:00:21.640,0:00:25.290 Y el segundo es que debe tener [br]una relación causal 0:00:25.290,0:00:26.970 con la variable dependiente. 0:00:27.280,0:00:31.010 Un ejemplo bastante típico[br]consiste en recopilar datos 0:00:31.010,0:00:34.230 sobre las quemaduras solares [br]y el consumo de helado. 0:00:34.520,0:00:39.035 Si observamos que el consumo de helados [br]aumenta al mismo tiempo 0:00:39.035,0:00:41.240 que los casos de quemaduras solares, 0:00:41.240,0:00:45.370 ¿podemos deducir que el helado [br]ocasiona quemaduras solares? 0:00:45.520,0:00:48.339 Una de las variables [br]que faltan aquí es la temperatura 0:00:48.339,0:00:52.760 como indicador de la cantidad de sol [br]como variable de confusión. 0:00:52.760,0:00:57.170 Cuanto más calor haga, más probable [br]es que la gente coma helado 0:00:57.170,0:01:01.070 y se queme con el sol[br]al pasar más tiempo al aire libre. 0:01:01.280,0:01:03.770 Uno de los retos de la creación de modelos 0:01:03.770,0:01:06.599 es que hay que hacer [br]una búsqueda exhaustiva 0:01:06.599,0:01:09.419 de posibles factores de confusión, 0:01:09.419,0:01:12.222 ya que su ausencia podría [br]causar que ciertos algoritmos 0:01:12.222,0:01:15.752 identifiquen relaciones que no existen. 0:01:15.920,0:01:20.160 Del mismo modo, si se identifica [br]el factor de confusión, 0:01:20.160,0:01:23.490 pero los algoritmos en cuestión [br]no lo gestionan adecuadamente, 0:01:23.600,0:01:28.510 podrían terminar acentuando [br]las relaciones que sí existen.