-
-
Właściciel restauracji chce się dowiedzieć więcej o tym
-
skąd jego klienci przychodzą.
-
Pewnego dnia zdecydował on zebrać dane
-
o dystansie (w milach) który ludzie
-
pokonują aby dostać się do jego restauracji.
-
Ludzie przekazali mu poniższe informacje o drogach, które pokonują.
-
Tutaj są zebrane wszystkie dane dotyczące tych dystansów.
-
On chce stworzyć wykres, który pomoże mu
-
zrozumieć rozpiętość dystansów
-
to jest kluczowe słowo - rozpiętość,
-
oraz medianę dystansów które pokonywali
-
lub które pokonują.
-
Jaki rodzaj wykresu powinien stworzyć?
-
Więc odpowiedź na to pytanie
-
która może być trochę bardziej oczywista
-
niż rzeczywiste stworzenie wykresu, który również wykonamy.
-
Ale on próbuje wyobrazić sobie rozpiętość tych informacji.
-
A także w tym samym czasie przedstawić na wykresie medianę.
-
Więc jaki wykres obejmuje obie te informacje?
-
Oczywiście, wykres pudełkowy!
-
Więc spróbujmy narysować ten wykres (pudełkowy).
-
Aby to zrobić, potrzebujemy wyliczyć medianę całego zestawu
-
oraz medianę dwóch połówek tego zestawu danych
-
-
Kiedykolwiek próbujemy znaleźć medianę czegoś,
-
posegregowanie danych jest bardzo pomocne.
-
Więc zacznijmy od próby posegregowania naszych danych.
-
Więc jaka jest najmniejsza liczba w tym zestawie?
-
Hm… sprawdźmy.
-
Jest jedna dwójka
-
Więc pozwólcie mi ją skreślić.
-
I mamy także drugą dwójkę.
-
Więc znaleźliśmy już wszystkie dwójki.
-
Potem mamy tę trójkę
-
Oraz inna trójkę
-
I myślę że mamy już wszystkie trójki.
-
Potem mamy tę czwórkę
-
I tę czwórkę
-
Czy mamy jakieś piątki?
-
Nie…
-
Mamy jakieś szóstki?
-
Yup.
-
Mamy tę szóstkę.
-
I to wygląda jak jedyna szóstka.
-
Jakieś siódemki?
-
Yup.
-
Mamy tę siódemkę gdzieś tutaj.
-
I właśnie zdałem sobie sprawę, że pominąłem tę jedynkę…
-
Więc postawię ją na początku naszego zestawu.
-
Więc mamy tę jedynkę.
-
Właściwie, to dwie jedynki.
-
Pominąłem je obie…
-
Więc obie te jedynki są tutaj.
-
Więc mam już 1,2,3,4,5.
-
To jest jedna szóstka.
-
Tam była jedna siódemka.
-
Tutaj jest jedna ósemka.
-
A potem, zobaczmy… Jakieś dziewiątki?
-
Nie, żadnych 9-tek.
-
Jakies dziesiątki?
-
Yup.
-
Jest jedna dziesiątka.
-
Jakieś jedenastki?
-
Mamy jedenastkę tam.
-
Jakieś dwunastki?
-
Niet.
-
13,14? (Nie…)
-
A potem mamy piętnastkę
-
A potem dwudziestkę i dwudziestkę-dwójkę.
-
Więc posortowaliśmy właśnie nasze dane.
-
Teraz powinno być relatywnie proste znalezienie
-
środka naszego zestawu, czyli mediany.
-
Więc jak dużo elementów mamy?
-
1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17.
-
Więc środkową liczbą będzie
-
liczba mająca osiem liczb za sobą
-
oraz osiem liczb przed sobą.
-
Zastanówmy się więc nad tym
-
1,2,3,4,5,6,7,8.
-
Więc liczba 6 jest większa niż 8 liczb przed nią
-
I jeśli wszystko dobrze policzyłem
-
Powinna być mniejsza od pozostałych ośmiu.
-
1,2,3,4,5,6,7,8.
-
Więc jest to mediana.
-
Więc kiedy próbujemy stworzyć wykres pudełkowy
-
konwencja jest taka, że OK, mamy naszą medianę.
-
I ona dzieli nasze dane na dwa zestawy.
-
Teraz znajdźmy mediany każdego z tych zestawów
-
I konwencja jest taka, że się jej pozbywamy i mamy
-
gotowe dwa zestawy.
-
Czasami ludzie pozostawiają tę liczbę.
-
Ale w standardowej konwencji się jej pozbywamy.
-
A teraz popatrzmy na ten
-
oraz na ten zestaw oddzielnie.
-
Więc jak patrzymy na pierwszą połowę liczb,
-
jaka jest ich mediana?
-
Więc… mamy 8 liczb.
-
Więc będziemy mieli dwie środkowe liczby.
-
Te dwie liczby to ta dwójka oraz ta trójka.
-
Trzy liczby są od tej mniejsze,
-
trzy są od tej większe.
-
I kiedy szukamy mediany
-
mamy dwie liczby środkowe.
-
Bierzemy więc ich średnią.
-
W połowie drogi między 2 i 3 jest 2.5.
-
Albo można powiedzieć, że 2 + 3 to 5 / 2, czyli 2.5.
-
Więc mamy tu medianę tej połowy, czyli 2.5.
-
A teraz środek drugiej połowy…
-
Ponownie, mamy 8 liczb.
-
Więc nasze dwa środkowe wyrazy to
-
ta jedenastka oraz ta czternastka.
-
I znów jeśli chcemy znaleźć ich średnią
-
to 11 + 14 = 25
-
a więc połowa drogi między nimi to 12.5.
-
Więc 12.5 jest dosłownie po środku między 11 i 14.
-
A teraz mamy wszystkie informacje,
-
których potrzebujemy aby stworzyć wykres
-
albo właściwie narysować nasz wykres pudełkowy.
-
Więc spróbuję narysować oś najlepiej jak potrafię
-
-
Więc to jest moja oś.
-
I załóżmy że gdzieś tutaj jest 0.
-
Muszę się upewnić, że dotrze ona do 22, albo i dalej...
-
Więc załóżmy że to jest 0,
-
a to jest 5.
-
Tutaj mamy 10.
-
Tu mogło by być 15,
-
a tutaj 20.
-
To może być 25
-
Możemy tak dalej - 30, może 35…
-
Więc pierwszą rzeczą o której możemy pomyśleć jest:
-
przecież istnieje wiele sposobów na narysowanie tego.
-
Możemy chcieć pomyśleć: pudełkowa część wykresu
-
właściwie przedstawia
-
dokładnie środek naszych danych.
-
Więc próbuje przedstawić te dane
-
czyli dane pomiędzy medianami obu zestawów.
-
Więc to jest część, którą możemy spróbować
-
przedstawić pudełkiem.
-
Więc możemy chcieć zacząć gdzieś tu od 2.5.
-
To właściwie oddziela pierwszy kwartyl
-
od drugiego kwartylu, pierwszą ćwiartkę danych
-
od drugiej ćwiartki danych.
-
Więc zaznaczmy to wszystko tutaj.
-
To jest 2.5.
-
2.5. jest w połowie pomiędzy 0 i 5.
-
Więc to jest 2.5.
-
A potem tutaj mamy 12.5.
-
A 12.5. jest gdzieś… sprawdźmy to
-
Tutaj mamy 10
-
Więc to tutaj powinno być dokładnie w połowie… ok, połowie…
-
pomiędzy 10 i 15… jest 12.5.
-
Więc zróbmy to
-
To jest 12.5, gdzieś tutaj.
-
Co oddziela trzeci kwartyl
-
od czwartego kwartyla.
-
A teraz nasze pudełka, wszystko pomiędzy…
-
więc to jest dosłownie w połowie naszych liczb.
-
-
I chcemy pokazać gdzie znajduje się główna mediana.
-
I to była właściwie jedna z tych rzeczy
-
nad którymi chcieliśmy móc się zastanowić kiedy
-
właściciel restauracji chciał
-
zastanowić się z jak daleka ludzie przybywają do niego.
-
Więc ta mediana to 6.
-
Więc możemy zaznaczyć ją dokładnie tutaj.
-
Więc to miejsce dokładnie tutaj ma wartość ok. 6.
-
Pozwólcie, że użyję tego samego różu
-
Więc dokładnie tutaj jest 6.
-
A teraz wąsy naszego wykresu
-
przedstawią zakres naszych danych.
-
I mogę to zrobić przy użyciu innego koloru, nieużytego do tej pory.
-
Narysuję to na pomarańczowo.
-
Więc właściwie, jeśli chcecie zauważyć, spójrzcie
-
numery zwiększają się aż do 22.
-
Więc one wszystkie zwiększają się do…
-
powiedzmy że to jest 22.
-
Nasze wartości zwiększają się aż do 22.
-
-
I zmniejszają aż do 1.
-
Więc 1 znajduje się gdzieś tu.
-
Pozwólcie, że to oznaczę.
-
Więc to jest 1.
-
A one zmniejszają się aż do 1.
-
Więc oto jest.
-
Mamy nasz wykres pudełkowy.
-
I możecie sobaczyć, gdy macie taki wykres
-
tylko wizualnie, możecie natychmiastowo
-
zauważyć: OK, jaka jest mediana?
-
Ona jest w połowie pudełka, tak właściwie.
-
Ono ma zaznaczone środkową połowę danych
-
Więc to pokazuje jak daleko sięgają dane
-
oraz gdzie znajdują się główne wartości tej rozpiętości.
-
A także pokazuje to, oczywiście, poza tym, mamy zakres który
-
sięga dużo dalej niż całkowita rozpiętość naszych danych.
-
-
To daje nawet niezłe przedstawienie obu median
-
i rozpiętość naszych danych.
-