< Return to Video

Constructing a box-and-whisker plot

  • 0:00 - 0:01
  • 0:01 - 0:04
    Właściciel restauracji chce się dowiedzieć więcej o tym
  • 0:04 - 0:06
    skąd jego klienci przychodzą.
  • 0:06 - 0:08
    Pewnego dnia zdecydował on zebrać dane
  • 0:08 - 0:11
    o dystansie (w milach) który ludzie
  • 0:11 - 0:13
    pokonują aby dostać się do jego restauracji.
  • 0:13 - 0:16
    Ludzie przekazali mu poniższe informacje o drogach, które pokonują.
  • 0:16 - 0:18
    Tutaj są zebrane wszystkie dane dotyczące tych dystansów.
  • 0:18 - 0:20
    On chce stworzyć wykres, który pomoże mu
  • 0:20 - 0:23
    zrozumieć rozpiętość dystansów
  • 0:23 - 0:26
    to jest kluczowe słowo - rozpiętość,
  • 0:26 - 0:33
    oraz medianę dystansów które pokonywali
  • 0:33 - 0:34
    lub które pokonują.
  • 0:34 - 0:37
    Jaki rodzaj wykresu powinien stworzyć?
  • 0:37 - 0:40
    Więc odpowiedź na to pytanie
  • 0:40 - 0:42
    która może być trochę bardziej oczywista
  • 0:42 - 0:45
    niż rzeczywiste stworzenie wykresu, który również wykonamy.
  • 0:45 - 0:50
    Ale on próbuje wyobrazić sobie rozpiętość tych informacji.
  • 0:50 - 0:52
    A także w tym samym czasie przedstawić na wykresie medianę.
  • 0:52 - 0:56
    Więc jaki wykres obejmuje obie te informacje?
  • 0:56 - 0:58
    Oczywiście, wykres pudełkowy!
  • 0:58 - 1:02
    Więc spróbujmy narysować ten wykres (pudełkowy).
  • 1:02 - 1:04
    Aby to zrobić, potrzebujemy wyliczyć medianę całego zestawu
  • 1:04 - 1:07
    oraz medianę dwóch połówek tego zestawu danych
  • 1:07 - 1:07
  • 1:07 - 1:10
    Kiedykolwiek próbujemy znaleźć medianę czegoś,
  • 1:10 - 1:12
    posegregowanie danych jest bardzo pomocne.
  • 1:12 - 1:16
    Więc zacznijmy od próby posegregowania naszych danych.
  • 1:16 - 1:19
    Więc jaka jest najmniejsza liczba w tym zestawie?
  • 1:19 - 1:20
    Hm… sprawdźmy.
  • 1:20 - 1:21
    Jest jedna dwójka
  • 1:21 - 1:22
    Więc pozwólcie mi ją skreślić.
  • 1:22 - 1:26
    I mamy także drugą dwójkę.
  • 1:26 - 1:27
    Więc znaleźliśmy już wszystkie dwójki.
  • 1:27 - 1:30
    Potem mamy tę trójkę
  • 1:30 - 1:32
    Oraz inna trójkę
  • 1:32 - 1:34
    I myślę że mamy już wszystkie trójki.
  • 1:34 - 1:37
    Potem mamy tę czwórkę
  • 1:37 - 1:41
    I tę czwórkę
  • 1:41 - 1:42
    Czy mamy jakieś piątki?
  • 1:42 - 1:43
    Nie…
  • 1:43 - 1:43
    Mamy jakieś szóstki?
  • 1:43 - 1:44
    Yup.
  • 1:44 - 1:45
    Mamy tę szóstkę.
  • 1:45 - 1:48
    I to wygląda jak jedyna szóstka.
  • 1:48 - 1:49
    Jakieś siódemki?
  • 1:49 - 1:50
    Yup.
  • 1:50 - 1:52
    Mamy tę siódemkę gdzieś tutaj.
  • 1:52 - 1:54
    I właśnie zdałem sobie sprawę, że pominąłem tę jedynkę…
  • 1:54 - 1:57
    Więc postawię ją na początku naszego zestawu.
  • 1:57 - 1:58
    Więc mamy tę jedynkę.
  • 1:58 - 2:00
    Właściwie, to dwie jedynki.
  • 2:00 - 2:01
    Pominąłem je obie…
  • 2:01 - 2:04
    Więc obie te jedynki są tutaj.
  • 2:04 - 2:07
    Więc mam już 1,2,3,4,5.
  • 2:07 - 2:09
    To jest jedna szóstka.
  • 2:09 - 2:10
    Tam była jedna siódemka.
  • 2:10 - 2:13
    Tutaj jest jedna ósemka.
  • 2:13 - 2:15
    A potem, zobaczmy… Jakieś dziewiątki?
  • 2:15 - 2:16
    Nie, żadnych 9-tek.
  • 2:16 - 2:17
    Jakies dziesiątki?
  • 2:17 - 2:17
    Yup.
  • 2:17 - 2:19
    Jest jedna dziesiątka.
  • 2:19 - 2:20
    Jakieś jedenastki?
  • 2:20 - 2:22
    Mamy jedenastkę tam.
  • 2:22 - 2:23
    Jakieś dwunastki?
  • 2:23 - 2:24
    Niet.
  • 2:24 - 2:27
    13,14? (Nie…)
  • 2:27 - 2:31
    A potem mamy piętnastkę
  • 2:31 - 2:35
    A potem dwudziestkę i dwudziestkę-dwójkę.
  • 2:35 - 2:36
    Więc posortowaliśmy właśnie nasze dane.
  • 2:36 - 2:38
    Teraz powinno być relatywnie proste znalezienie
  • 2:38 - 2:41
    środka naszego zestawu, czyli mediany.
  • 2:41 - 2:43
    Więc jak dużo elementów mamy?
  • 2:43 - 2:50
    1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17.
  • 2:50 - 2:52
    Więc środkową liczbą będzie
  • 2:52 - 2:54
    liczba mająca osiem liczb za sobą
  • 2:54 - 2:56
    oraz osiem liczb przed sobą.
  • 2:56 - 2:57
    Zastanówmy się więc nad tym
  • 2:57 - 3:00
    1,2,3,4,5,6,7,8.
  • 3:00 - 3:04
    Więc liczba 6 jest większa niż 8 liczb przed nią
  • 3:04 - 3:06
    I jeśli wszystko dobrze policzyłem
  • 3:06 - 3:08
    Powinna być mniejsza od pozostałych ośmiu.
  • 3:08 - 3:12
    1,2,3,4,5,6,7,8.
  • 3:12 - 3:17
    Więc jest to mediana.
  • 3:17 - 3:21
    Więc kiedy próbujemy stworzyć wykres pudełkowy
  • 3:21 - 3:25
    konwencja jest taka, że OK, mamy naszą medianę.
  • 3:25 - 3:27
    I ona dzieli nasze dane na dwa zestawy.
  • 3:27 - 3:31
    Teraz znajdźmy mediany każdego z tych zestawów
  • 3:31 - 3:33
    I konwencja jest taka, że się jej pozbywamy i mamy
  • 3:33 - 3:34
    gotowe dwa zestawy.
  • 3:34 - 3:36
    Czasami ludzie pozostawiają tę liczbę.
  • 3:36 - 3:38
    Ale w standardowej konwencji się jej pozbywamy.
  • 3:38 - 3:39
    A teraz popatrzmy na ten
  • 3:39 - 3:42
    oraz na ten zestaw oddzielnie.
  • 3:42 - 3:45
    Więc jak patrzymy na pierwszą połowę liczb,
  • 3:45 - 3:49
    jaka jest ich mediana?
  • 3:49 - 3:55
    Więc… mamy 8 liczb.
  • 3:55 - 3:57
    Więc będziemy mieli dwie środkowe liczby.
  • 3:57 - 4:01
    Te dwie liczby to ta dwójka oraz ta trójka.
  • 4:01 - 4:02
    Trzy liczby są od tej mniejsze,
  • 4:02 - 4:04
    trzy są od tej większe.
  • 4:04 - 4:05
    I kiedy szukamy mediany
  • 4:05 - 4:07
    mamy dwie liczby środkowe.
  • 4:07 - 4:08
    Bierzemy więc ich średnią.
  • 4:08 - 4:13
    W połowie drogi między 2 i 3 jest 2.5.
  • 4:13 - 4:17
    Albo można powiedzieć, że 2 + 3 to 5 / 2, czyli 2.5.
  • 4:17 - 4:22
    Więc mamy tu medianę tej połowy, czyli 2.5.
  • 4:22 - 4:25
    A teraz środek drugiej połowy…
  • 4:25 - 4:27
    Ponownie, mamy 8 liczb.
  • 4:27 - 4:30
    Więc nasze dwa środkowe wyrazy to
  • 4:30 - 4:34
    ta jedenastka oraz ta czternastka.
  • 4:34 - 4:36
    I znów jeśli chcemy znaleźć ich średnią
  • 4:36 - 4:39
    to 11 + 14 = 25
  • 4:39 - 4:43
    a więc połowa drogi między nimi to 12.5.
  • 4:43 - 4:47
    Więc 12.5 jest dosłownie po środku między 11 i 14.
  • 4:47 - 4:49
    A teraz mamy wszystkie informacje,
  • 4:49 - 4:52
    których potrzebujemy aby stworzyć wykres
  • 4:52 - 4:55
    albo właściwie narysować nasz wykres pudełkowy.
  • 4:55 - 5:03
    Więc spróbuję narysować oś najlepiej jak potrafię
  • 5:03 - 5:05
  • 5:05 - 5:07
    Więc to jest moja oś.
  • 5:07 - 5:10
    I załóżmy że gdzieś tutaj jest 0.
  • 5:10 - 5:14
    Muszę się upewnić, że dotrze ona do 22, albo i dalej...
  • 5:14 - 5:15
    Więc załóżmy że to jest 0,
  • 5:15 - 5:17
    a to jest 5.
  • 5:17 - 5:18
    Tutaj mamy 10.
  • 5:18 - 5:21
    Tu mogło by być 15,
  • 5:21 - 5:23
    a tutaj 20.
  • 5:23 - 5:25
    To może być 25
  • 5:25 - 5:30
    Możemy tak dalej - 30, może 35…
  • 5:30 - 5:33
    Więc pierwszą rzeczą o której możemy pomyśleć jest:
  • 5:33 - 5:34
    przecież istnieje wiele sposobów na narysowanie tego.
  • 5:34 - 5:37
    Możemy chcieć pomyśleć: pudełkowa część wykresu
  • 5:37 - 5:39
    właściwie przedstawia
  • 5:39 - 5:41
    dokładnie środek naszych danych.
  • 5:41 - 5:46
    Więc próbuje przedstawić te dane
  • 5:46 - 5:52
    czyli dane pomiędzy medianami obu zestawów.
  • 5:52 - 5:54
    Więc to jest część, którą możemy spróbować
  • 5:54 - 5:55
    przedstawić pudełkiem.
  • 5:55 - 6:00
    Więc możemy chcieć zacząć gdzieś tu od 2.5.
  • 6:00 - 6:02
    To właściwie oddziela pierwszy kwartyl
  • 6:02 - 6:05
    od drugiego kwartylu, pierwszą ćwiartkę danych
  • 6:05 - 6:07
    od drugiej ćwiartki danych.
  • 6:07 - 6:08
    Więc zaznaczmy to wszystko tutaj.
  • 6:08 - 6:10
    To jest 2.5.
  • 6:10 - 6:13
    2.5. jest w połowie pomiędzy 0 i 5.
  • 6:13 - 6:15
    Więc to jest 2.5.
  • 6:15 - 6:17
    A potem tutaj mamy 12.5.
  • 6:17 - 6:22
    A 12.5. jest gdzieś… sprawdźmy to
  • 6:22 - 6:25
    Tutaj mamy 10
  • 6:25 - 6:29
    Więc to tutaj powinno być dokładnie w połowie… ok, połowie…
  • 6:29 - 6:32
    pomiędzy 10 i 15… jest 12.5.
  • 6:32 - 6:33
    Więc zróbmy to
  • 6:33 - 6:38
    To jest 12.5, gdzieś tutaj.
  • 6:38 - 6:40
    Co oddziela trzeci kwartyl
  • 6:40 - 6:41
    od czwartego kwartyla.
  • 6:41 - 6:44
    A teraz nasze pudełka, wszystko pomiędzy…
  • 6:44 - 6:46
    więc to jest dosłownie w połowie naszych liczb.
  • 6:46 - 6:48
  • 6:48 - 6:50
    I chcemy pokazać gdzie znajduje się główna mediana.
  • 6:50 - 6:52
    I to była właściwie jedna z tych rzeczy
  • 6:52 - 6:54
    nad którymi chcieliśmy móc się zastanowić kiedy
  • 6:54 - 6:55
    właściciel restauracji chciał
  • 6:55 - 6:58
    zastanowić się z jak daleka ludzie przybywają do niego.
  • 6:58 - 7:00
    Więc ta mediana to 6.
  • 7:00 - 7:02
    Więc możemy zaznaczyć ją dokładnie tutaj.
  • 7:02 - 7:06
    Więc to miejsce dokładnie tutaj ma wartość ok. 6.
  • 7:06 - 7:08
    Pozwólcie, że użyję tego samego różu
  • 7:08 - 7:12
    Więc dokładnie tutaj jest 6.
  • 7:12 - 7:15
    A teraz wąsy naszego wykresu
  • 7:15 - 7:17
    przedstawią zakres naszych danych.
  • 7:17 - 7:21
    I mogę to zrobić przy użyciu innego koloru, nieużytego do tej pory.
  • 7:21 - 7:22
    Narysuję to na pomarańczowo.
  • 7:22 - 7:24
    Więc właściwie, jeśli chcecie zauważyć, spójrzcie
  • 7:24 - 7:26
    numery zwiększają się aż do 22.
  • 7:26 - 7:27
    Więc one wszystkie zwiększają się do…
  • 7:27 - 7:30
    powiedzmy że to jest 22.
  • 7:30 - 7:32
    Nasze wartości zwiększają się aż do 22.
  • 7:32 - 7:37
  • 7:37 - 7:39
    I zmniejszają aż do 1.
  • 7:39 - 7:43
    Więc 1 znajduje się gdzieś tu.
  • 7:43 - 7:44
    Pozwólcie, że to oznaczę.
  • 7:44 - 7:45
    Więc to jest 1.
  • 7:45 - 7:48
    A one zmniejszają się aż do 1.
  • 7:48 - 7:48
    Więc oto jest.
  • 7:48 - 7:50
    Mamy nasz wykres pudełkowy.
  • 7:50 - 7:52
    I możecie sobaczyć, gdy macie taki wykres
  • 7:52 - 7:54
    tylko wizualnie, możecie natychmiastowo
  • 7:54 - 7:55
    zauważyć: OK, jaka jest mediana?
  • 7:55 - 7:58
    Ona jest w połowie pudełka, tak właściwie.
  • 7:58 - 7:59
    Ono ma zaznaczone środkową połowę danych
  • 7:59 - 8:00
    Więc to pokazuje jak daleko sięgają dane
  • 8:00 - 8:02
    oraz gdzie znajdują się główne wartości tej rozpiętości.
  • 8:02 - 8:05
    A także pokazuje to, oczywiście, poza tym, mamy zakres który
  • 8:05 - 8:10
    sięga dużo dalej niż całkowita rozpiętość naszych danych.
  • 8:10 - 8:11
  • 8:11 - 8:14
    To daje nawet niezłe przedstawienie obu median
  • 8:14 - 8:17
    i rozpiętość naszych danych.
  • 8:17 - 8:18
Title:
Constructing a box-and-whisker plot
Description:

more » « less
Video Language:
English
Team:
Khan Academy
Duration:
08:18

Polish subtitles

Revisions