-
As variáveis de confusão
são um tipo de variável
-
que está relacionado às variáveis
independentes e dependentes do modelo.
-
Uma variável deve atender a duas condições
para ser uma variável de confusão.
-
Uma delas é que deve ser correlacionada
com a variável independente.
-
E a outra é que deve ter
relação causal com a variável dependente.
-
Um exemplo bastante clássico
envolve a coleta de dados
-
sobre queimaduras solares
e consumo de sorvete.
-
Se você descobre
que o maior consumo de sorvete
-
está associado a uma maior
probabilidade de queimaduras solares,
-
devemos pensar que o consumo de sorvete
causa queimaduras solares?
-
O que está faltando é a temperatura,
que indica a quantidade de sol
-
e é uma variável de confusão.
-
Quanto mais quente, maior a probabilidade
de as pessoas comerem sorvete
-
e terem queimaduras solares,
-
pois passam mais tempo ao ar livre.
-
Um dos desafios da modelagem
é fazer uma busca exaustiva
-
de possíveis fatores de confusão.
-
Senão, podemos chegar a algoritmos
que indicam relações que não existem.
-
Pela mesma razão,
-
se identificarmos isso
sem dar um tratamento adequado
-
pelo algoritmo em questão
-
podemos acabar exagerando
as relações que realmente existem.