vimeo.com/.../722088590

0:06 - 0:09

As variáveis de confusão
são um tipo de variável
0:09 - 0:13

que está relacionado às variáveis
independentes e dependentes do modelo.
0:13 - 0:17

Uma variável deve atender a duas condições
para ser uma variável de confusão.
0:17 - 0:21

Uma delas é que deve ser correlacionada
com a variável independente.
0:22 - 0:27

E a outra é que deve ter
relação causal com a variável dependente.
0:27 - 0:31

Um exemplo bastante clássico
envolve a coleta de dados
0:31 - 0:34

sobre queimaduras solares
e consumo de sorvete.
0:34 - 0:38

Se você descobre
que o maior consumo de sorvete
0:38 - 0:41

está associado a uma maior
probabilidade de queimaduras solares,
0:41 - 0:45

devemos pensar que o consumo de sorvete
causa queimaduras solares?
0:46 - 0:51

O que está faltando é a temperatura,
que indica a quantidade de sol
0:51 - 0:53

e é uma variável de confusão.
0:53 - 0:57

Quanto mais quente, maior a probabilidade
de as pessoas comerem sorvete
0:57 - 0:59

e terem queimaduras solares,
0:59 - 1:01

pois passam mais tempo ao ar livre.
1:01 - 1:07

Um dos desafios da modelagem
é fazer uma busca exaustiva
1:07 - 1:09

de possíveis fatores de confusão.
1:09 - 1:15

Senão, podemos chegar a algoritmos
que indicam relações que não existem.
1:16 - 1:17

Pela mesma razão,
1:17 - 1:22

se identificarmos isso
sem dar um tratamento adequado
1:22 - 1:23

pelo algoritmo em questão
1:23 - 1:28

podemos acabar exagerando
as relações que realmente existem.

	daniel.fraga edited Portuguese, Brazilian subtitles for vimeo.com/.../722088590
	evellyn.schulze edited Portuguese, Brazilian subtitles for vimeo.com/.../722088590
	evellyn.schulze edited Portuguese, Brazilian subtitles for vimeo.com/.../722088590
	evellyn.schulze edited Portuguese, Brazilian subtitles for vimeo.com/.../722088590

Portuguese, Brazilian subtitles