0:00:07.705,0:00:10.374 Imagina se você não [br]tivesse gráficos 0:00:10.374,0:00:13.980 para representar de forma visual[br]os dados que você descobriu. 0:00:13.980,0:00:17.947 Seria muito chato, porque as pessoas[br]iam ficar lendo somente tabelas. 0:00:17.947,0:00:22.009 Os gráficos existem exatamente [br]para te ajudar a representar, 0:00:22.009,0:00:26.221 de forma visual, quais foram [br]os dados que você descobriu. 0:00:26.221,0:00:29.219 A gente tem aqui alguns [br]exemplos desses gráficos, 0:00:29.219,0:00:33.367 e agora vamos entender quando [br]a gente utiliza cada um deles. 0:00:33.367,0:00:36.903 O primeiro gráfico, que é o mais [br]utilizado em vários cenários, 0:00:36.903,0:00:41.022 principalmente na análise [br]descritiva, é o gráfico de barras. 0:00:41.022,0:00:44.577 O gráfico de barras, [br]a gente utiliza para variáveis 0:00:44.577,0:00:48.068 que são categóricas,[br]variáveis qualitativas. 0:00:48.068,0:00:51.904 A primeira coisa que a gente faz[br]para utilizar um gráfico de barras 0:00:51.904,0:00:55.321 é determinar quais [br]dados que a gente tem. 0:00:55.321,0:00:57.833 Então, eu tenho ali [br]uma base de dados, 0:00:57.833,0:01:00.320 eu vou classificar aquela [br]base de dados, 0:01:00.320,0:01:03.696 por exemplo,[br]do menor para o maior. 0:01:03.696,0:01:06.866 Aqui, na representação,[br]a gente consegue entender 0:01:06.866,0:01:09.869 a variação ali entre[br]essas categorias. 0:01:09.869,0:01:12.734 O gráfico de barras vai ser [br]muito utilizado para você, 0:01:12.734,0:01:15.251 de fato, comparar variáveis. 0:01:15.251,0:01:17.255 Um outro gráfico [br]que a gente utiliza 0:01:17.255,0:01:19.679 bastante também [br]é o gráfico de pizza. 0:01:19.679,0:01:23.032 Aqui, na tela, a gente tem a [br]representação desse tipo de gráfico. 0:01:23.032,0:01:26.152 Em um cenário onde [br]a gente está avaliando 0:01:26.152,0:01:30.649 quais são os sabores preferidos[br]das pessoas relacionadas a sorvete, 0:01:30.649,0:01:33.460 nós temos a variação aqui, 0:01:33.460,0:01:37.604 mostrando a representatividade[br]em um formato de pizza. 0:01:37.604,0:01:41.401 Então, quando a gente tem [br]3 sabores, por exemplo, 0:01:41.401,0:01:46.016 a gente está considerando [br]aqui que a pizza soma 100%, 0:01:46.016,0:01:48.508 o total dela vai ser 100%, 0:01:48.508,0:01:53.169 e, cada uma dessas fatias, vai ser [br]a representatividade desse sabor. 0:01:53.169,0:01:56.416 Então, a gente vai ter uma [br]visão de qual que é o sabor 0:01:56.416,0:01:59.619 preferido dessas pessoas[br]que foram entrevistadas, 0:01:59.619,0:02:03.284 porque quanto maior [br]for a fatia da pizza, 0:02:03.284,0:02:06.047 maior vai indicar aquela [br]representatividade, 0:02:06.047,0:02:09.868 ou seja, aquela preferência. 0:02:09.868,0:02:12.332 Um ponto importante [br]para a gente considerar 0:02:12.332,0:02:15.920 em relação ao gráfico de pizza,[br]é que ele não pode ser utilizado 0:02:15.920,0:02:18.705 para quando a gente[br]tem muitas variáveis, 0:02:18.705,0:02:21.440 porque vai ficar muito [br]confuso de entender ali 0:02:21.440,0:02:23.977 qual é a representatividade [br]de cada uma. 0:02:23.977,0:02:27.142 Então, ele é mais indicado [br]para até 4 fatias. 0:02:27.142,0:02:31.739 Um outro gráfico muito utilizado [br]também é o gráfico histograma, 0:02:31.739,0:02:33.195 O gráfico histograma, 0:02:33.195,0:02:36.070 olhando para a representação [br]visual dele, 0:02:36.070,0:02:38.916 ele é muito confundido[br]com o gráfico de barras. 0:02:38.916,0:02:41.169 Nós já sabemos que [br]o gráfico de barras 0:02:41.169,0:02:44.841 é utilizado para fazer [br]comparações entre variáveis. 0:02:44.841,0:02:47.867 O histograma também[br]é utilizado dessa forma. 0:02:47.867,0:02:50.643 A única diferença, você vai[br]visualizar aqui na tela, 0:02:50.643,0:02:54.227 é que a representação dele[br]é um pouquinho diferente, 0:02:54.227,0:02:57.477 Então, o histograma[br]vai considerar ali 0:02:57.477,0:03:00.632 a frequência de cada [br]uma das variáveis. 0:03:00.632,0:03:05.885 Então, quanto maior for a barra,[br]mais frequente é aquela variação. 0:03:05.885,0:03:08.662 Um exemplo de utilização[br]ali do gráfico histograma 0:03:08.662,0:03:13.026 é para quando você quer definir[br]os melhores clientes que você tem. 0:03:13.026,0:03:18.164 Então, numa análise que a gente faça[br]em relação ao volume de vendas, 0:03:18.164,0:03:22.355 a frequência de compras[br]e a recência das compras, 0:03:22.355,0:03:26.272 a gente vai colocar esses dados[br]em um gráfico histograma 0:03:26.272,0:03:28.537 e aí a gente vai conseguir [br]ter aquela visão 0:03:28.537,0:03:31.087 de quais são os clientes [br]que mais aparecem, 0:03:31.087,0:03:34.703 porque ele vai mostrar qual [br]é o tamanho daquela barra. 0:03:34.703,0:03:39.631 Outro gráfico que é muito utilizado [br]também na estatística descritiva 0:03:39.631,0:03:43.723 é o Scatterplot ou [br]gráfico de dispersão. 0:03:43.723,0:03:46.459 No gráfico de dispersão,[br]que está aqui na tela, 0:03:46.459,0:03:49.562 você vai conseguir visualizar[br]o quanto as variáveis, 0:03:49.562,0:03:52.532 que você está analisando,[br]se dispersam entre elas. 0:03:52.532,0:03:55.087 Ele é muito utilizado [br]para você conseguir 0:03:55.087,0:03:57.904 entender padrões [br]de comportamento. 0:03:57.904,0:04:01.560 Então, quando eu plot ali os meus [br]dados em um gráfico de dispersão, 0:04:01.560,0:04:04.922 eu vou conseguir definir[br]quais são as minhas variáveis 0:04:04.922,0:04:08.152 que são fora da curva,[br]que são os outliers. 0:04:08.152,0:04:10.658 Então, quando eu represento [br]dessa forma, 0:04:10.658,0:04:14.363 quanto mais perto você tiver [br]ali aquela concentração, 0:04:14.363,0:04:16.452 aqui no nosso cantinho do eixo, 0:04:16.452,0:04:20.310 você vai visualizar que as [br]variáveis ficam muito próximas. 0:04:20.310,0:04:22.647 Agora, quanto mais [br]elas se dispersam, 0:04:22.647,0:04:26.733 aí você vai entender [br]quais são essas variáveis 0:04:26.733,0:04:29.629 que fogem do seu padrão, [br]e aí você vai conseguir 0:04:29.629,0:04:33.403 investigar melhor essas [br]variações, essas variáveis, 0:04:33.403,0:04:36.188 e entender qual é o [br]comportamento delas. 0:04:36.188,0:04:41.458 E quando a gente precisa visualizar[br]variáveis que são temporais? 0:04:41.458,0:04:43.881 Para isso, nós temos [br]um tipo de gráfico, 0:04:43.881,0:04:45.918 que é o gráfico [br]de séries temporais, 0:04:45.918,0:04:47.754 ele está aparecendo [br]aqui na tela. 0:04:47.754,0:04:50.123 E, basicamente,[br]é um gráfico de linhas. 0:04:50.123,0:04:54.827 A ideia do gráfico temporal[br]é para mostrar essa continuidade. 0:04:54.827,0:04:58.364 Então, vamos supor que eu fiz[br]ali uma análise onde eu precisei 0:04:58.364,0:05:02.399 anotar os dados em dias [br]diferentes para ter uma média. 0:05:02.399,0:05:06.389 Quando eu ploto esses dados[br]em um gráfico de série temporal, 0:05:06.389,0:05:10.643 eu vou conseguir visualizar[br]esse ciclo, essa tendência. 0:05:10.643,0:05:14.799 Não, necessariamente, ele vai ter [br]sempre um aumento ou uma queda, 0:05:14.799,0:05:16.716 ele pode ter variações. 0:05:16.716,0:05:19.652 Então, através desse gráfico,[br]eu consigo ter essa visão 0:05:19.652,0:05:24.190 muito mais rápida de média, [br]do quanto que subiu, 0:05:24.190,0:05:26.755 o quanto flutuaram [br]os meus dados. 0:05:26.755,0:05:29.843 O último gráfico que nós [br]temos para representar 0:05:29.843,0:05:32.699 estatisticamente, [br]é o Box Plot. 0:05:32.699,0:05:36.269 Esse gráfico é muito utilizado[br]para você conseguir visualizar 0:05:36.269,0:05:40.389 as variações dos seus dados[br]e como eles estão concentrados. 0:05:40.389,0:05:43.543 Nesse formato de gráfico,[br]que está aparecendo aqui na tela, 0:05:43.543,0:05:46.346 você vai conseguir [br]visualizar os seus dados 0:05:46.346,0:05:49.468 sempre divididos [br]de 25% em 25% 0:05:49.468,0:05:52.163 e quanto maior for a sua caixinha, 0:05:52.163,0:05:55.288 significa que os dados[br]estão mais dispersos, 0:05:55.288,0:05:59.225 e, quanto menor, significa que [br]eles estão mais condensados. 0:05:59.225,0:06:02.795 Esse tipo de gráfico é muito útil[br]exatamente para você olhar ali 0:06:02.795,0:06:06.766 aquela representatividade e [br]você conseguir entender melhor 0:06:06.766,0:06:08.668 o comportamento dos seus dados, 0:06:08.668,0:06:11.868 que foram extraídos [br]ali da sua amostra. 0:06:11.868,0:06:16.676 Bom, então agora que você conhece[br]esses formatos de gráficos, 0:06:16.676,0:06:18.782 você vai conseguir [br]entender qual o gráfico 0:06:18.782,0:06:21.901 vai se aplicar melhor[br]a realidade dos seus dados 0:06:21.901,0:06:25.259 e vai te ajudar a transformar[br]aquele gráfico, 0:06:25.259,0:06:29.610 aquela visualização, de forma [br]muito mais visual, de fato. 0:06:29.610,0:06:31.831 Então, você vai conseguir mostrar 0:06:31.831,0:06:35.095 qual foi a descoberta que [br]você teve com os seus dados, 0:06:35.095,0:06:39.932 coisa que uma tabela não te ajudaria [br]tanto em um nível tão visual. 0:06:39.932,0:06:42.579 Então utilize aí os [br]gráficos a seu favor, 0:06:42.579,0:06:45.271 considerando a particularidade de [br]cada e quando você vai aplicar um 0:06:45.271,0:06:47.237 e quando você vai aplicar, 0:06:47.237,0:06:50.232 quando você vai selecionar [br]cada formato de gráfico.