-
O dono de um restaurante gostaria de saber de onde vêm os seus clientes
-
e um dia ele decidiu coletar dados a respeito da distância em milhas que as pessoas percorriam para chegar em seu restaurante.
-
As pessoas lhe diziam as distâncias que elas viajaram. E então aqui estão todas as distâncias viajadas.
-
Ele queria criar um gráfico que o ajudasse a compreender a dispersão das distâncias
-
e esta é a palavra chave: a dispersão das distâncias e a distância mediana, que as pessoas viajavam.
-
Qual tipo de gráfico deveríamos criar?
-
Então a resposta para qual o tipo de gráfico que nós deveríamos criar deve ser mais direta
-
do que a criação do gráfico que nós também iremos criar...
-
mas ele está tentando enxergar a dispersão de informação e ao
-
mesmo tempo ele quer a mediana, então qual o gráfico que captura ambas as informações?
-
Bem, um gráfico de caixa! [NT: também chamado de gráfico e caixa e bigodes] E então vamos tentar desenhar um gráfico de caixa!
-
Para desenhar um gráfico de caixa, nós precisamos obter a mediana e nós também iremos ver a mediana das duas
-
metades de todos os dados, e nõs também iremos tentar obter a mediana, ou algo assim... e será
-
realmente útil ordenar nossos dados.
-
Então vamos tentar ordenar nossos dados. Então qual é
-
o menor número aqui? Vejamos, existe um 2... então nós vamos assinalar... e nós temos outro 2...
-
e então nós pegamos todos os 2s... e então nós temos este 3... e então nós temos este 3... eu penso que pegamos todos os 3s...
-
E então nós temos este 4... e então nós temos este 4...
-
E nós temos algum 5? Não. E nós temos algum 6? Sim, nós temos este 6...
-
E isso parece ser o único 6... Algum 7? Sim, nós temos este 7 bem aqui... E agora eu percebi
-
que eu passei este 1... então eu irei colocá-lo no começo do conjunto... e eu realmente deixei passar dois 1s...
-
Ambos os 1s estão bem aqui, no começo do conjunto.
-
Então eu tenho: 1s, 2s, 3s, 4s, nenhum 5... este 6... um 7 um 8...
-
Vejamos... algum 9? Nenhum 9... Algum 10? Sim, há um 10...
-
Algum 11? Sim, temos um 11... Algum 12? Não.
-
Nós temos 14 e 15... Nós também temos um 20 e um 22...
-
Então nós ordenamos todos os nossos dados e agora será bastante fácil obter o meio do nossos
-
dados. A mediana... E quantos pontos de dado nós temos?
-
1, 2, 3, 4, 5, 6, 7, 8, 9, 10...
-
11, 12, 13, 14, 15, 16, 17...
-
Então o número central é o número que possui 8 números maiores que ele
-
e 8 números menores que ele. E vamos pensar sobre isso... 1, 2, 3, 4...
-
5, 6, 7, 8... Então o número 6 aqui
-
é maior que oito dos valores e se eu contei corretamente...
-
isso será menor que oito dos valores... 1, 2, 3, 4...
-
5, 6, 7, 8. Então isso é realmente...
-
Isso é realmente a mediana... agora quando nós pegamos
-
um gráfico de caixa, a convenção é que nós temos nossa mediana e isso é essencialmente dividir
-
nossos dados em dois conjuntos... agora vamos fazer a mediana de cada um
-
destes conjuntos... e a convenção é pegar a mediana e obter os conjuntos
-
que restaram. Algumas vezes as pessoas deixam isso dentro, mas a convenção padrão
-
é tirar a mediana e olhar separadamente para este conjunto e olhar separadamente para este conjunto.
-
E então se nós olharmos para este primeiro conjunto, a metade inferior dos nossos números essencialmente...
-
qual é a mediana destes números?
-
Bem, nós temos 1, 2, 3, 4, 5, 6, 7...
-
8 pontos de dados... e então agora nós iremos ter dois números centrais.
-
Então os dois números centrais são este 2 e este 3...
-
Três números menores que estes dois e três números maiores que eles...
-
e quando nós estamos buscando a mediana, nós temos estes dois números centrais e nós iremos fazer a média
-
destes dois números. Então a meio caminho entre 2 e 3 há o 2,5...
-
2 mais 3 são 5,5... divididos por 2 são 2,5.
-
Então aqui nós temos a mediana desta metade inferior, de 2,5 [NT: tecnicamente se chama "quartil inferior"]
-
E então o meio da metade superior [NT: "quartil superior"], uma vez mais nós temos oito pontos de dados, então nossa
-
metade de dois números irão ser este 11 e este 14...
-
E assim, se nós quisermos fazer a média desses dois números... 11 mais 14 são 25. A metade de
-
25 são 12,5... 12,5 são exatamente o meio termo entre 11 e 14.
-
E agora nós temos toda a informação que precisamos para
-
plotar nosso gráfico de caixa [NT: também chamado "gráfico de caixa e bigodes"]
-
Então deixe-me desenhar a linha dos números, então minha melhor
-
tentativa de desenhar a linha dos números... então esta é a minha linha dos números...
-
E digamos que isso bem aqui é zero.
-
Eu tenho que me assegurar de que eu cheguei a 22... ou passei 22...
-
Isso é zero... isso são 5... isso são 10...
-
isso devem ser 15... isso deve ser 20...
-
isso deve ser 25... nós podemos continuar...
-
30, talvez 35... então a primeira
-
coisa que nós gostaríamos de pensar... existem diversas maneiras de desenhar isso...
-
E nós gostaríamosd e pensar sobre a parte da caixa do diagrama de caixa...
-
Em essência ele representa a metade central dos nossos dados [NT: tecnicamente, os dois "quartis centrais"]. Então isso em essência
-
está tentando representar estes dados, isso bem aqui...
-
então os dados entre os dois entre as
-
medianas das duas metades [NT: da fronteira dos quartis superior e inferior]. Então isso é a parte que nós podemos representar
-
com a caixa. E então nós podemos começar bem aqui, nesta
-
porção inferior ao 2,5... isso essencialmente separa
-
o primeiro quartil do segundo quartil... o primeiro quartil dos nossos números do segundo quartil
-
dos nossos números... e deixe-me fazer isso bem aqui... isso são 2,5...
-
2,5 é o meio termo entre zero e 5... então isse
-
2,5 e então bem em cima aqui, nós temos 12,5...
-
e 12,5 está bem aqui...
-
Ele está bem aqui... 12,5...
-
Isso é o meio termo entre... bem, meio caminho
-
entre 10 e 15 são 12,5...
-
12,5 bem aqui... 12,5...
-
Então isso separa o terceiro quartil do quarto quartil
-
e então nossas caixas... tudo entre... e então isso irá ser a primeira metade
-
dos nossos números... a primeira metade dos nossos números... e nós iremos querer
-
mostrar aqui a nossa mediana... e isso é uma das coisas que nós de fato queremos pensar a respeito...
-
no nosso problema... Quando o dono do restaurante
-
quer saber qual a distância que as pessas estão viajando... então a mediana são 6...
-
E então nós podemos marcar isso bem aqui...
-
Isso está perto do 6... esta cor rosa.
-
Então isso bem aqui... são 6... e então
-
os bigodes do gráfico de caixa... ele em essência nos mostra a abrangência
-
dos nossos dados... e então, deixe-me fazer isso...
-
Eu farei em uma nova cor... que tal laranja?
-
E então em essência, se nós queremos ver...
-
Olhar os números que vão por toda a vida até 22...
-
Isso são 22 bem aqui... nossos números vão por toda a vida
-
até 22... nossos números vão por toda a vida até 22.
-
E eles chegam tão pequenos, até 1...
-
1 está mais ou menos por aqui... e eles vão até tão pequenos
-
até 1...
-
Então você o tem! Nós temos nosso gráfico de caixa [NT: ou "gráfico de caixa e bigodes"]... e você pode ver
-
Se você tem um gráfico como esse... apenas visualmente você pode ver imediatamente
-
qual é a mediana? Ela é o meio da caixa...
-
Ela mostra a mostra a primeira metade... ou quanto isso se espaça... o recheio do espalhamento
-
que ela mostra acima disso... ele mostra a distância... que vai além
-
do que isso vai... ou o quão espalhados estão os nossos
-
dados. Então isso nos dá um senso muito legal da mediana e
-
do espalhamento dos nossos dados.