Imagina se você não
tivesse gráficos
para representar de forma visual
os dados que você descobriu.
Seria muito chato, porque as pessoas
iam ficar lendo somente tabelas.
Os gráficos existem exatamente
para te ajudar a representar,
de forma visual, quais foram
os dados que você descobriu.
A gente tem aqui alguns
exemplos desses gráficos,
e agora vamos entender quando
a gente utiliza cada um deles.
O primeiro gráfico, que é o mais
utilizado em vários cenários,
principalmente na análise
descritiva, é o gráfico de barras.
O gráfico de barras,
a gente utiliza para variáveis
que são categóricas,
variáveis qualitativas.
A primeira coisa que a gente faz
para utilizar um gráfico de barras
é determinar quais
dados que a gente tem.
Então, eu tenho ali
uma base de dados,
eu vou classificar aquela
base de dados,
por exemplo,
do menor para o maior.
Aqui, na representação,
a gente consegue entender
a variação ali entre
essas categorias.
O gráfico de barras vai ser
muito utilizado para você,
de fato, comparar variáveis.
Um outro gráfico
que a gente utiliza
bastante também
é o gráfico de pizza.
Aqui, na tela, a gente tem a
representação desse tipo de gráfico.
Em um cenário onde
a gente está avaliando
quais são os sabores preferidos
das pessoas relacionadas a sorvete,
nós temos a variação aqui,
mostrando a representatividade
em um formato de pizza.
Então, quando a gente tem
3 sabores, por exemplo,
a gente está considerando
aqui que a pizza soma 100%,
o total dela vai ser 100%,
e, cada uma dessas fatias, vai ser
a representatividade desse sabor.
Então, a gente vai ter uma
visão de qual que é o sabor
preferido dessas pessoas
que foram entrevistadas,
porque quanto maior
for a fatia da pizza,
maior vai indicar aquela
representatividade,
ou seja, aquela preferência.
Um ponto importante
para a gente considerar
em relação ao gráfico de pizza,
é que ele não pode ser utilizado
para quando a gente
tem muitas variáveis,
porque vai ficar muito
confuso de entender ali
qual é a representatividade
de cada uma.
Então, ele é mais indicado
para até 4 fatias.
Um outro gráfico muito utilizado
também é o gráfico histograma,
O gráfico histograma,
olhando para a representação
visual dele,
ele é muito confundido
com o gráfico de barras.
Nós já sabemos que
o gráfico de barras
é utilizado para fazer
comparações entre variáveis.
O histograma também
é utilizado dessa forma.
A única diferença, você vai
visualizar aqui na tela,
é que a representação dele
é um pouquinho diferente,
Então, o histograma
vai considerar ali
a frequência de cada
uma das variáveis.
Então, quanto maior for a barra,
mais frequente é aquela variação.
Um exemplo de utilização
ali do gráfico histograma
é para quando você quer definir
os melhores clientes que você tem.
Então, numa análise que a gente faça
em relação ao volume de vendas,
a frequência de compras
e a recência das compras,
a gente vai colocar esses dados
em um gráfico histograma
e aí a gente vai conseguir
ter aquela visão
de quais são os clientes
que mais aparecem,
porque ele vai mostrar qual
é o tamanho daquela barra.
Outro gráfico que é muito utilizado
também na estatística descritiva
é o Scatterplot ou
gráfico de dispersão.
No gráfico de dispersão,
que está aqui na tela,
você vai conseguir visualizar
o quanto as variáveis,
que você está analisando,
se dispersam entre elas.
Ele é muito utilizado
para você conseguir
entender padrões
de comportamento.
Então, quando eu plot ali os meus
dados em um gráfico de dispersão,
eu vou conseguir definir
quais são as minhas variáveis
que são fora da curva,
que são os outliers.
Então, quando eu represento
dessa forma,
quanto mais perto você tiver
ali aquela concentração,
aqui no nosso cantinho do eixo,
você vai visualizar que as
variáveis ficam muito próximas.
Agora, quanto mais
elas se dispersam,
aí você vai entender
quais são essas variáveis
que fogem do seu padrão,
e aí você vai conseguir
investigar melhor essas
variações, essas variáveis,
e entender qual é o
comportamento delas.
E quando a gente precisa visualizar
variáveis que são temporais?
Para isso, nós temos
um tipo de gráfico,
que é o gráfico
de séries temporais,
ele está aparecendo
aqui na tela.
E, basicamente,
é um gráfico de linhas.
A ideia do gráfico temporal
é para mostrar essa continuidade.
Então, vamos supor que eu fiz
ali uma análise onde eu precisei
anotar os dados em dias
diferentes para ter uma média.
Quando eu ploto esses dados
em um gráfico de série temporal,
eu vou conseguir visualizar
esse ciclo, essa tendência.
Não, necessariamente, ele vai ter
sempre um aumento ou uma queda,
ele pode ter variações.
Então, através desse gráfico,
eu consigo ter essa visão
muito mais rápida de média,
do quanto que subiu,
o quanto flutuaram
os meus dados.
O último gráfico que nós
temos para representar
estatisticamente,
é o Box Plot.
Esse gráfico é muito utilizado
para você conseguir visualizar
as variações dos seus dados
e como eles estão concentrados.
Nesse formato de gráfico,
que está aparecendo aqui na tela,
você vai conseguir
visualizar os seus dados
sempre divididos
de 25% em 25%
e quanto maior for a sua caixinha,
significa que os dados
estão mais dispersos,
e, quanto menor, significa que
eles estão mais condensados.
Esse tipo de gráfico é muito útil
exatamente para você olhar ali
aquela representatividade e
você conseguir entender melhor
o comportamento dos seus dados,
que foram extraídos
ali da sua amostra.
Bom, então agora que você conhece
esses formatos de gráficos,
você vai conseguir
entender qual o gráfico
vai se aplicar melhor
a realidade dos seus dados
e vai te ajudar a transformar
aquele gráfico,
aquela visualização, de forma
muito mais visual, de fato.
Então, você vai conseguir mostrar
qual foi a descoberta que
você teve com os seus dados,
coisa que uma tabela não te ajudaria
tanto em um nível tão visual.
Então utilize aí os
gráficos a seu favor,
considerando a particularidade de
cada e quando você vai aplicar um
e quando você vai aplicar,
quando você vai selecionar
cada formato de gráfico.