0:00:08.008,0:00:09.609 Imagina se você não tivesse 0:00:09.609,0:00:13.580 gráficos para representar de forma visual[br]os dados que você descobriu? 0:00:13.980,0:00:17.784 Seria muito chato porque as pessoas[br]iam ficar lendo somente tabelas. 0:00:18.318,0:00:23.390 Os gráficos existem exatamente para te[br]ajudarem a representar de forma visual. 0:00:23.723,0:00:26.292 Quais foram os dados que você descobriu? 0:00:26.292,0:00:29.295 A gente tem aqui[br]alguns exemplos desses gráficos 0:00:29.295,0:00:33.033 e agora vamos entender[br]quando que a gente utiliza cada um deles. 0:00:33.433,0:00:36.903 O primeiro gráfico,[br]que é o mais utilizado em vários cenários, 0:00:36.903,0:00:40.840 principalmente na análise descritiva,[br]é o gráfico de barras. 0:00:41.341,0:00:44.577 Gráfico de barras[br]a gente utiliza para variáveis 0:00:44.577,0:00:47.947 que são categóricas e variáveis[br]qualitativas. 0:00:48.415,0:00:51.584 A primeira coisa que a gente faz[br]para utilizar um gráfico de barras 0:00:52.052,0:00:55.288 é determinar quais dados que a gente tem. 0:00:55.321,0:00:57.924 Então eu tenho ali uma base de dados. 0:00:57.924,0:01:01.861 Eu vou classificar aquela base de dados[br]como como, por exemplo, 0:01:01.861,0:01:03.696 do menor para o maior. 0:01:03.696,0:01:06.866 Aqui na representação,[br]a gente consegue entender 0:01:06.866,0:01:09.869 a variação ali entre essas categorias. 0:01:09.869,0:01:10.870 O gráfico de barras 0:01:10.870,0:01:14.908 ele vai ser muito utilizado para você[br]de fato comparar variáveis. 0:01:15.675,0:01:19.446 Um outro gráfico que a gente utiliza[br]bastante também é o gráfico de pizza. 0:01:19.679,0:01:22.916 Aqui na tela a gente tem a representação[br]desse tipo de gráfico. 0:01:23.349,0:01:26.152 É um cenário onde a gente está avaliando 0:01:26.152,0:01:30.423 quais são os sabores preferidos[br]das pessoas relacionadas a sorvete. 0:01:30.890,0:01:33.460 Nós temos a variação aqui 0:01:33.460,0:01:37.163 mostrando a representatividade[br]em um formato de pizza. 0:01:37.664,0:01:41.101 Então, quando a gente tem três sabores,[br]por exemplo, 0:01:41.401,0:01:45.472 a gente está considerando aqui[br]que a pizza soma 100%. 0:01:46.106,0:01:48.508 O total dela vai ser 100%. 0:01:48.508,0:01:52.946 E cada uma dessas fatias[br]vai ser a representatividade desse sabor. 0:01:53.613,0:01:56.416 Então a gente vai ter uma visão de qual[br]que é o sabor 0:01:56.416,0:01:59.619 preferido dessas pessoas[br]que foram entrevistadas. 0:01:59.619,0:02:03.723 Porque o quanto maior for[br]a fatia da pizza, maior 0:02:03.723,0:02:06.893 vai indicar aquela representatividade,[br]ou seja, 0:02:06.893,0:02:09.896 aquela, aquela preferência. 0:02:09.963,0:02:12.332 Um ponto importante para a gente[br]considerar. 0:02:12.332,0:02:16.169 Em relação ao gráfico de pizza[br]e que ele não pode ser utilizado para 0:02:16.169,0:02:18.705 quando a gente tem muitas variáveis, 0:02:18.705,0:02:23.076 porque vai ficar muito confuso de entender[br]ali qual que é a representatividade 0:02:23.076,0:02:23.977 de cada uma. 0:02:23.977,0:02:26.980 Então ele é mais indicado para[br]até quatro fatias. 0:02:27.847,0:02:29.949 Um outro gráfico muito utilizado também 0:02:29.949,0:02:33.253 é o gráfico Histograma,[br]o gráfico histograma. 0:02:33.253,0:02:37.357 Olhando para a representação visual dele,[br]ele é muito confundido 0:02:37.357,0:02:39.192 com o gráfico de barras. 0:02:39.192,0:02:43.463 Nós já sabemos que o gráfico de barras[br]é utilizado para fazer comparações 0:02:43.563,0:02:44.931 entre variáveis. 0:02:44.931,0:02:47.867 O histograma também[br]é utilizado dessa forma. 0:02:47.867,0:02:50.703 A única diferença[br]você vai visualizar aqui na tela 0:02:50.703,0:02:54.073 é que a representação dele[br]é um pouquinho diferente, 0:02:54.440,0:02:57.443 então o histograma ele vai considerar ali 0:02:57.477,0:03:00.480 a frequência de cada uma das variáveis. 0:03:00.780,0:03:05.318 Então, quanto maior for a barra,[br]mais frequente é aquela variação. 0:03:05.885,0:03:08.688 Um exemplo de utilização[br]ali do gráfico histograma 0:03:08.688,0:03:12.559 é para quando você quer definir[br]os melhores clientes que você tem. 0:03:13.026,0:03:17.864 Então, numa análise que a gente faça[br]em relação ao volume de vendas, 0:03:18.164,0:03:22.101 a frequência de compras[br]e a resistência das compras, 0:03:22.435,0:03:25.972 a gente vai colocar esses dados[br]em um gráfico, histograma 0:03:26.272,0:03:29.909 e aí a gente vai conseguir[br]ter aquela visão de quais são os clientes 0:03:29.909,0:03:34.447 que mais aparecem, porque ele vai mostrar[br]qual que é o tamanho daquela barra. 0:03:35.615,0:03:37.884 Outro gráfico que é muito utilizado também 0:03:37.884,0:03:43.156 na estatística descritiva[br]é o Scatter Plot ou gráfico de dispersão 0:03:43.723,0:03:46.459 no gráfico de dispersão[br]que está aqui na tela. 0:03:46.459,0:03:49.562 Você vai conseguir visualizar[br]o quanto as variáveis 0:03:49.562,0:03:52.532 que você está analisando[br]se dispersam entre elas. 0:03:52.932,0:03:57.537 Ele é muito utilizado para você conseguir[br]entender padrões de comportamento. 0:03:57.904,0:04:01.608 Então, quando eu coloco os meus dados[br]num gráfico de dispersão, 0:04:01.608,0:04:04.978 eu vou conseguir definir[br]quais são as minhas variáveis 0:04:04.978,0:04:07.981 que são fora da curva,[br]que são os outliers. 0:04:08.281,0:04:12.018 Então, quando eu represento dessa forma,[br]quanto mais perto 0:04:12.018,0:04:16.356 você tiver aquela concentração aqui[br]no nosso Cantinho do Eixo, 0:04:16.689,0:04:20.126 você vai visualizar que as variáveis[br]ficam muito próximas. 0:04:20.460,0:04:24.030 Agora, quanto mais elas se dispersam,[br]aí você vai entender 0:04:24.664,0:04:26.733 quais são essas variáveis 0:04:26.733,0:04:30.837 que fogem do seu padrão[br]e aí você vai conseguir investigar melhor 0:04:30.837,0:04:35.942 essas variações nessas variáveis[br]e entender qual é o comportamento delas. 0:04:36.809,0:04:42.148 E quando a gente precisa visualizar[br]variáveis que são temporais para isso, 0:04:42.148,0:04:45.852 nós temos um tipo de gráfico,[br]que é o gráfico de séries temporais. 0:04:45.918,0:04:47.754 Ele está aparecendo aqui na tela. 0:04:47.754,0:04:50.123 E basicamente é um gráfico de linhas. 0:04:50.123,0:04:54.794 A ideia do gráfico temporal[br]ele é para mostrar essa continuidade. 0:04:54.827,0:04:58.364 Então, vamos supor que eu fiz[br]ali uma análise onde eu precisei 0:04:58.364,0:05:01.968 anotar os dados em dias diferentes[br]para ter uma média. 0:05:02.435,0:05:06.205 Quando eu posto esses dados[br]num gráfico de série temporal, 0:05:06.539,0:05:10.443 eu vou conseguir visualizar essa[br]esse ciclo nessa tendência. 0:05:10.643,0:05:14.881 Não necessariamente ele vai ter sempre[br]um aumento ou uma queda. 0:05:14.881,0:05:16.716 Ele pode ter variações. 0:05:16.716,0:05:19.652 Então, através desse gráfico[br]eu consigo ter essa visão 0:05:19.652,0:05:24.090 muito mais rápida de média do quanto[br]que subiu, 0:05:24.190,0:05:27.193 o quanto flutuaram os meus dados. 0:05:27.360,0:05:31.097 O último gráfico que nós temos[br]para representar ele estatisticamente 0:05:31.097,0:05:32.699 é o Box Plot. 0:05:32.699,0:05:36.269 Esse gráfico é muito utilizado[br]para você conseguir visualizar 0:05:36.269,0:05:40.173 as variações dos seus dados[br]e como eles estão concentrados 0:05:40.606,0:05:43.543 nesse formato de gráfico[br]que está aparecendo aqui na tela. 0:05:43.543,0:05:46.346 Você vai conseguir visualizar[br]os seus dados 0:05:46.346,0:05:49.349 sempre divididos de 25 e 25%. 0:05:49.682,0:05:53.419 E quanto maior for a sua caixinha,[br]significa que os dados 0:05:53.419,0:05:55.288 estão mais dispersos. 0:05:55.288,0:05:58.858 E quanto menor,[br]significa que eles estão mais condensados. 0:05:59.225,0:06:02.795 Esse tipo de gráfico é muito útil[br]exatamente para você olhar ali 0:06:02.795,0:06:06.499 aquela representatividade[br]e você conseguir entender melhor 0:06:06.766,0:06:08.668 o comportamento dos seus dados. 0:06:08.668,0:06:11.671 Foram extraídos ali da sua amostra. 0:06:12.505,0:06:16.676 Bom, então agora que você conhece[br]esses formatos de gráficos, 0:06:16.676,0:06:18.144 você vai conseguir entender 0:06:18.144,0:06:21.714 qual o gráfico que vai te aplicar melhor[br]a realidade dos seus dados 0:06:22.081,0:06:26.552 e vai te ajudar a transformar[br]aquele gráfico ou aquela visualização 0:06:26.853,0:06:29.689 de forma muito mais visual, de fato. 0:06:29.689,0:06:33.960 Então você vai conseguir mostrar[br]qual foi a descoberta que você teve 0:06:33.960,0:06:39.665 com os seus dados, coisa que uma tabela[br]não te ajudaria tanto no nível tão visual. 0:06:39.932,0:06:44.971 Então utilize aí os gráficos a seu favor,[br]considerando a particularidade de cada um 0:06:45.271,0:06:50.576 e quando você vai aplicar, quando você[br]vai selecionar cada formato de gráfico e.