0:00:07.825,0:00:10.374 Imagina se você não [br]tivesse gráficos 0:00:10.374,0:00:13.980 para representar de forma visual[br]os dados que você descobriu. 0:00:13.980,0:00:17.784 Seria muito chato, porque as pessoas[br]iam ficar lendo somente tabelas. 0:00:17.784,0:00:21.119 Os gráficos existem exatamente [br]para te ajudar a representar, 0:00:21.119,0:00:26.292 de forma visual, quais foram [br]os dados que você descobriu. 0:00:26.292,0:00:29.295 A gente tem aqui alguns [br]exemplos desses gráficos, 0:00:29.295,0:00:33.433 e agora vamos entender quando [br]a gente utiliza cada um deles. 0:00:33.433,0:00:36.903 O primeiro gráfico, que é o mais [br]utilizado em vários cenários, 0:00:36.903,0:00:40.840 principalmente na análise [br]descritiva, é o gráfico de barras. 0:00:40.840,0:00:44.577 O gráfico de barras, [br]a gente utiliza para variáveis 0:00:44.577,0:00:47.947 que são categóricas,[br]variáveis qualitativas. 0:00:47.947,0:00:51.904 A primeira coisa que a gente faz[br]para utilizar um gráfico de barras 0:00:51.904,0:00:55.321 é determinar quais [br]dados que a gente tem. 0:00:55.321,0:00:57.924 Então, eu tenho ali [br]uma base de dados, 0:00:57.924,0:01:01.861 eu vou classificar aquela base [br]de dados, por exemplo, 0:01:01.861,0:01:03.696 do menor para o maior. 0:01:03.696,0:01:06.866 Aqui, na representação,[br]a gente consegue entender 0:01:06.866,0:01:09.869 a variação ali entre[br]essas categorias. 0:01:09.869,0:01:10.870 O gráfico de barras vai ser [br]muito utilizado para você, 0:01:10.870,0:01:15.251 de fato, comparar variáveis. 0:01:15.251,0:01:19.679 Um outro gráfico que a gente utiliza[br]bastante também é o gráfico de pizza. 0:01:19.679,0:01:22.916 Aqui, na tela, a gente tem a [br]representação desse tipo de gráfico. 0:01:22.916,0:01:26.152 Em um cenário onde [br]a gente está avaliando 0:01:26.152,0:01:30.890 quais são os sabores preferidos[br]das pessoas relacionadas a sorvete, 0:01:30.890,0:01:33.460 nós temos a variação aqui, 0:01:33.460,0:01:37.664 mostrando a representatividade[br]em um formato de pizza. 0:01:37.664,0:01:41.401 Então, quando a gente tem [br]3 sabores, por exemplo, 0:01:41.401,0:01:46.106 a gente está considerando aqui[br]que a pizza soma 100%, 0:01:46.106,0:01:48.508 o total dela vai ser 100%, 0:01:48.508,0:01:52.946 e, cada uma dessas fatias, vai ser [br]a representatividade desse sabor. 0:01:52.946,0:01:56.416 Então, a gente vai ter uma [br]visão de qual que é o sabor 0:01:56.416,0:01:59.619 preferido dessas pessoas[br]que foram entrevistadas, 0:01:59.619,0:02:03.240 porque quanto maior for[br]a fatia da pizza, 0:02:03.240,0:02:06.893 maior vai indicar aquela [br]representatividade, 0:02:06.893,0:02:09.963 ou seja, aquela preferência. 0:02:09.963,0:02:12.332 Um ponto importante [br]para a gente considerar 0:02:12.332,0:02:15.920 em relação ao gráfico de pizza,[br]é que ele não pode ser utilizado 0:02:15.920,0:02:18.705 para quando a gente[br]tem muitas variáveis, 0:02:18.705,0:02:21.440 porque vai ficar muito [br]confuso de entender ali 0:02:21.440,0:02:23.977 qual é a representatividade [br]de cada uma. 0:02:23.977,0:02:27.142 Então, ele é mais indicado [br]para até 4 fatias. 0:02:27.142,0:02:31.739 Um outro gráfico muito utilizado [br]também é o gráfico histograma, 0:02:31.739,0:02:33.195 O gráfico histograma, 0:02:33.195,0:02:36.070 olhando para a representação [br]visual dele, 0:02:36.070,0:02:38.916 ele é muito confundido[br]com o gráfico de barras. 0:02:38.916,0:02:41.169 Nós já sabemos que [br]o gráfico de barras 0:02:41.169,0:02:44.931 é utilizado para fazer [br]comparações entre variáveis. 0:02:44.931,0:02:47.867 O histograma também[br]é utilizado dessa forma. 0:02:47.867,0:02:50.703 A única diferença, você vai[br]visualizar aqui na tela, 0:02:50.703,0:02:54.227 é que a representação dele[br]é um pouquinho diferente, 0:02:54.227,0:02:57.477 Então, o histograma[br]vai considerar ali 0:02:57.477,0:03:00.780 a frequência de cada [br]uma das variáveis. 0:03:00.780,0:03:05.885 Então, quanto maior for a barra,[br]mais frequente é aquela variação. 0:03:05.885,0:03:08.662 Um exemplo de utilização[br]ali do gráfico histograma 0:03:08.662,0:03:13.026 é para quando você quer definir[br]os melhores clientes que você tem. 0:03:13.026,0:03:18.164 Então, numa análise que a gente faça[br]em relação ao volume de vendas, 0:03:18.164,0:03:22.435 a frequência de compras[br]e a recência das compras, 0:03:22.435,0:03:26.272 a gente vai colocar esses dados[br]em um gráfico histograma 0:03:26.272,0:03:28.537 e aí a gente vai conseguir [br]ter aquela visão 0:03:28.537,0:03:31.087 de quais são os clientes [br]que mais aparecem, 0:03:31.087,0:03:34.703 porque ele vai mostrar qual [br]é o tamanho daquela barra. 0:03:34.703,0:03:39.631 Outro gráfico que é muito utilizado [br]também na estatística descritiva 0:03:39.631,0:03:43.723 é o Scatterplot ou [br]gráfico de dispersão 0:03:43.723,0:03:46.459 No gráfico de dispersão,[br]que está aqui na tela, 0:03:46.459,0:03:49.562 você vai conseguir visualizar[br]o quanto as variáveis, 0:03:49.562,0:03:52.532 que você está analisando,[br]se dispersam entre elas. 0:03:52.532,0:03:55.087 Ele é muito utilizado [br]para você conseguir 0:03:55.087,0:03:57.904 entender padrões [br]de comportamento. 0:03:57.904,0:04:01.608 Então, quando eu plot ali os meus [br]dados em um gráfico de dispersão, 0:04:01.608,0:04:04.978 eu vou conseguir definir[br]quais são as minhas variáveis 0:04:04.978,0:04:08.281 que são fora da curva,[br]que são os outliers. 0:04:08.281,0:04:10.658 Então, quando eu represento [br]dessa forma, 0:04:10.658,0:04:14.568 quanto mais perto você tiver [br]ali aquela concentração aqui, 0:04:14.568,0:04:16.430 no nosso cantinho do Eixo, 0:04:16.430,0:04:20.460 você vai visualizar que as [br]variáveis ficam muito próximas. 0:04:20.460,0:04:22.647 Agora, quanto mais [br]elas se dispersam, 0:04:22.647,0:04:26.733 aí você vai entender [br]quais são essas variáveis 0:04:26.733,0:04:30.837 que fogem do seu padrão, e aí você [br]vai conseguir investigar melhor 0:04:30.837,0:04:33.186 essas variações, [br]essas variáveis, 0:04:33.186,0:04:36.809 e entender qual é o [br]comportamento delas. 0:04:36.809,0:04:42.148 E quando a gente precisa visualizar[br]variáveis que são temporais para isso, 0:04:42.148,0:04:45.852 nós temos um tipo de gráfico,[br]que é o gráfico de séries temporais. 0:04:45.918,0:04:47.754 Ele está aparecendo aqui na tela. 0:04:47.754,0:04:50.123 E basicamente é um gráfico de linhas. 0:04:50.123,0:04:54.794 A ideia do gráfico temporal[br]ele é para mostrar essa continuidade. 0:04:54.827,0:04:58.364 Então, vamos supor que eu fiz[br]ali uma análise onde eu precisei 0:04:58.364,0:05:01.968 anotar os dados em dias diferentes[br]para ter uma média. 0:05:02.435,0:05:06.205 Quando eu posto esses dados[br]num gráfico de série temporal, 0:05:06.539,0:05:10.443 eu vou conseguir visualizar essa[br]esse ciclo nessa tendência. 0:05:10.643,0:05:14.881 Não necessariamente ele vai ter sempre[br]um aumento ou uma queda. 0:05:14.881,0:05:16.716 Ele pode ter variações. 0:05:16.716,0:05:19.652 Então, através desse gráfico[br]eu consigo ter essa visão 0:05:19.652,0:05:24.090 muito mais rápida de média do quanto[br]que subiu, 0:05:24.190,0:05:27.193 o quanto flutuaram os meus dados. 0:05:27.360,0:05:31.097 O último gráfico que nós temos[br]para representar ele estatisticamente 0:05:31.097,0:05:32.699 é o Box Plot. 0:05:32.699,0:05:36.269 Esse gráfico é muito utilizado[br]para você conseguir visualizar 0:05:36.269,0:05:40.173 as variações dos seus dados[br]e como eles estão concentrados 0:05:40.606,0:05:43.543 nesse formato de gráfico[br]que está aparecendo aqui na tela. 0:05:43.543,0:05:46.346 Você vai conseguir visualizar[br]os seus dados 0:05:46.346,0:05:49.349 sempre divididos de 25 e 25%. 0:05:49.682,0:05:53.419 E quanto maior for a sua caixinha,[br]significa que os dados 0:05:53.419,0:05:55.288 estão mais dispersos. 0:05:55.288,0:05:58.858 E quanto menor,[br]significa que eles estão mais condensados. 0:05:59.225,0:06:02.795 Esse tipo de gráfico é muito útil[br]exatamente para você olhar ali 0:06:02.795,0:06:06.499 aquela representatividade[br]e você conseguir entender melhor 0:06:06.766,0:06:08.668 o comportamento dos seus dados. 0:06:08.668,0:06:11.671 Foram extraídos ali da sua amostra. 0:06:12.505,0:06:16.676 Bom, então agora que você conhece[br]esses formatos de gráficos, 0:06:16.676,0:06:18.144 você vai conseguir entender 0:06:18.144,0:06:21.714 qual o gráfico que vai te aplicar melhor[br]a realidade dos seus dados 0:06:22.081,0:06:26.552 e vai te ajudar a transformar[br]aquele gráfico ou aquela visualização 0:06:26.853,0:06:29.689 de forma muito mais visual, de fato. 0:06:29.689,0:06:33.960 Então você vai conseguir mostrar[br]qual foi a descoberta que você teve 0:06:33.960,0:06:39.665 com os seus dados, coisa que uma tabela[br]não te ajudaria tanto no nível tão visual. 0:06:39.932,0:06:44.971 Então utilize aí os gráficos a seu favor,[br]considerando a particularidade de cada um 0:06:45.271,0:06:50.576 e quando você vai aplicar, quando você[br]vai selecionar cada formato de gráfico e.