< Return to Video

Statystyka: Średnia z próby vs populacji

  • 0:01 - 0:03
    Na końcu poprzedniego filmu powiedziałem,
  • 0:03 - 0:06
    że będziemy mówić o miarach rozproszenia lub tego jak wartości są rozdystrybuowane,
  • 0:06 - 0:08
    zanim jednak przejdziemy do tego zagadnienia,
  • 0:08 - 0:11
    zdałem sobie sprawę, że chciałbym opowiedzieć jeszcze więcej o średniej.
  • 0:11 - 0:16
    I zanim do tego przejdę, chciałbym wprowadzić rozróżnienie
  • 0:16 - 0:17
    pomiędzy próbą a populacją.
  • 0:23 - 0:26
    Musnąłem jedynie ten temat w poprzednim filmie.
  • 0:26 - 0:29
    Załóżmy, że chcę wiedzieć jaka jest
  • 0:29 - 0:32
    średnia wysokość
  • 0:32 - 0:34
    wszystkich mężczyzn w Ameryce, dobrze?
  • 0:34 - 0:38
    Stwórzmy sobie więc zbiór wszystkich mężczyzn w Ameryce.
  • 0:38 - 0:39
    To są wszyscy mężczyźni w Ameryce.
  • 0:39 - 0:43
    Wiem, że w USA mieszka 300 milionów ludzi
  • 0:43 - 0:45
    i prawdopodobnie połowa z nich to mężczyźni,
  • 0:45 - 0:49
    daje to łącznie 150 milionów mężczyzn, prawda?
  • 0:49 - 0:53
    Graniczyłoby z niemożliwością, nawet jeżeli bardzo bym się starał,
  • 0:53 - 0:57
    by zmierzyć średnią wysokość
  • 0:57 - 0:58
    wszystkich mężczyzn w Ameryce.
  • 0:58 - 1:01
    W zasadzie, co parę sekund jeden z tych mężczyzn
  • 1:01 - 1:02
    się rodzi, jakiś inny umiera.
  • 1:02 - 1:05
    Czyli w momencie, gdy skończyłbym mierzyć wszystkich,
  • 1:05 - 1:07
    ktoś by umarł i wielu nowych mężczyzn
  • 1:07 - 1:10
    by się urodziło, więc jest to praktycznie niemożliwe.
  • 1:10 - 1:16
    Nawet jeżeli nie jest to niemożliwe, to bardzo czasochłonne
  • 1:16 - 1:19
    jest zmierzenie średniej arytmetycznej, mediany czy też dominanty
  • 1:19 - 1:21
    całej tej populacji, prawda?
  • 1:21 - 1:24
    Najlepszym sposobem na otrzymanie prawdopodobnego wyniku,
  • 1:24 - 1:28
    ponieważ zależy nam na obliczeniu średniej dla całej populacji,
  • 1:28 - 1:30
    jest ustalenie średniej na podstawie próbki populacji.
  • 1:30 - 1:33
    Mogę wybrać mniejszą grupę osobników z populacji --
  • 1:33 - 1:34
    będę starał się dobierać ją w sposób losowy.
  • 1:34 - 1:37
    Nie chciałbym -- mam nadzieję, że moja próbka
  • 1:37 - 1:41
    nie będzie składać się głównie z mojej szkolnej drużyny koszykówki,
  • 1:41 - 1:44
    ponieważ taka próbka zawyżyłaby wartość średnią. Będę próbował wybierać losowe osoby
  • 1:44 - 1:47
    w losowych sytuacjach, gdzie wiem że ich wysokość
  • 1:47 - 1:48
    nie będzie grała znaczącej roli.
  • 1:48 - 1:51
    Jeżeli pozbieram 10 wysokości --
  • 1:51 - 1:53
    im więcej wysokości pozbieram tym próbka będzie
  • 1:53 - 1:55
    lepiej opisywała ogół populacji -- ale powiedzmy, że zbiorę 10 różnych wysokości
  • 1:55 - 1:58
    i będą one równe:
  • 1:58 - 2:03
    5 stóp, 6 stóp, 5.5 stopy,
  • 2:03 - 2:09
    5.75 stopy, powiedzmy że 6 wysokości wystarczy,
  • 2:09 - 2:11
    czyli jest dodajmy jeszcze wysokość 6.5 stopy, dobrze?
  • 2:11 - 2:14
    To jest pięć osób, które wybrałem. Możemy teraz zastanowić się
  • 2:14 - 2:17
    nad różnymi sposobami wyciągania próbek dobrze reprezentujących całą populacje,
  • 2:17 - 2:20
    tak żeby nie były przechylone w którąkolwiek ze stron.
  • 2:20 - 2:22
    Niemniej jednak, jeżeli chciałbym orientacyjnie poznać średnią
  • 2:22 - 2:24
    i byłbym trochę leniwy, tak leniwy że dokonałem jedynie 5 pomiarów,
  • 2:24 - 2:25
    to zrobiłbym to właśnie w ten sposób.
  • 2:25 - 2:28
    To byłaby moja próba.
  • 2:28 - 2:30
    Próba populacji.
  • 2:30 - 2:34
    Załóżmy, że chciałem obliczyć wartość średnią
  • 2:34 - 2:36
    za pomocą średniej arytmetycznej.
  • 2:36 - 2:39
    Zamiast obliczać średnią arytmetyczną z całej tej grupy
  • 2:39 - 2:42
    150 milionów osób, mogę radośnie sobie
  • 2:42 - 2:44
    obliczyć wartość średnią dla tej próbki i będzie to,
  • 2:44 - 2:46
    średnia próby.
  • 2:46 - 2:49
    Chciałbym zapoznać was z obowiązującą w tym temacie notacją.
  • 2:49 - 2:54
    W języku statystyki, średnia to "mi", litera greckiego alfabetu,
  • 2:54 - 2:57
    która z czasem dała początek dobrze znanej literze "m",
  • 2:57 - 3:03
    oznacza wartość średnią populacji,
  • 3:03 - 3:07
    to jest oczywiscie tylko konwencja, wartość średnia populacji.
  • 3:10 - 3:15
    X z kreską, odpowiada wartości średniej próby.
  • 3:18 - 3:20
    To są tylko notacje, z którymi możecie się spotkać,
  • 3:20 - 3:22
    bez tego można się czuć nieco zdezorientowanym,
  • 3:22 - 3:24
    gdy ludzie mówiąc o średnich czasem zapisują "mi"
  • 3:24 - 3:28
    a czasem X z kreską,
  • 3:28 - 3:29
    warto wiedzieć jaka jest między nimi różnica.
  • 3:29 - 3:31
    Tutaj ma się na myśli średnią próbki populacji,
  • 3:31 - 3:35
    a tutaj chodzi o średnią wartość
  • 3:35 - 3:38
    całej populacji.
  • 3:38 - 3:41
    Sposób obliczania jest zasadniczo taki sam.
  • 3:41 - 3:43
    Jeżeli chcemy obliczyć średnią populacji,
  • 3:43 - 3:48
    pytamy 150 milionów osób w jednym momencie o wzrost,
  • 3:48 - 3:51
    sumujemy ich wysokości i dzielimy przez 150 milionów,
  • 3:51 - 3:52
    by uzyskać średnią populacji.
  • 3:52 - 3:55
    W średniej próby, dodajemy jedynie wysokości w naszej próbce
  • 3:55 - 3:58
    i dzielimy przez ilość punktów pomiarowych w niej znajdujących.
  • 3:58 - 4:00
    Wzory, które chce wam pokazać,
  • 4:00 - 4:03
    oczywiście potraficie obliczyć średnią arytmetyczną,
  • 4:03 - 4:06
    jest to bardzo prosta operacja, ale chcę pokazać
  • 4:06 - 4:08
    jak często bywa zapisywana w książkach statystycznych,
  • 4:08 - 4:10
    tak żebyście nie czuli się onieśmieleni, gdy zobaczycie formalny zapis.
  • 4:10 - 4:12
    Średnia populacji będzie zapisywana jako --
  • 4:12 - 4:14
    tak żebyście znali konwencję.
  • 4:14 - 4:17
    Każdy element -- zacznijmy najpierw od próby.
  • 4:17 - 4:20
    Każdy element próby, powiedzmy że ten jest pierwszy.
  • 4:20 - 4:22
    To jest x z 1 w indeksie dolnym.
  • 4:22 - 4:25
    To jest x z 2 w indeksie dolnym.
  • 4:25 - 4:30
    To jest x z 3 w indeksie dolnym, x z 4 w indeksie dolnym,
  • 4:30 - 4:32
    x z 5 w indeksie dolnym, prawda?
  • 4:32 - 4:33
    To jest po prostu sposób na odnoszenie się do
  • 4:33 - 4:34
    poszczególnych elementów próby.
  • 4:34 - 4:36
    Co trzeba zrobić by obliczyć średnią próby?
  • 4:36 - 4:38
    Sumujemy te wszystkie liczby.
  • 4:38 - 4:41
    Oczywiście wiecie jak to się robi, ale jest bardziej formalny sposób
  • 4:41 - 4:43
    zapisania sumowania, zapisujemy dużą sigmę.
  • 4:43 - 4:46
    Oznacza ona sumę.
  • 4:46 - 4:49
    Suma po każdym x z n w indeksie dolnym, prawda?
  • 4:49 - 4:52
    Bierzemy sumę po każdej z tych liczb, prawda?
  • 4:52 - 4:58
    To jest x z 1 w indeksie dolnym, x z 2 w indeksie dolnym, gdzie n jest jest równe od 1 do
  • 4:58 - 5:01
    rozmiaru próby.
  • 5:01 - 5:05
    Oczywiście próba może być większa lub mniejsza, w tym przypadku będzie to 5,
  • 5:05 - 5:08
    na górze sumy możemy również spotkać się z małym "n".
  • 5:08 - 5:11
    i dzielimy przez ilość elementów,
  • 5:11 - 5:15
    które znalazły się w próbce, więc dzielimy przez n.
  • 5:15 - 5:17
    Gdy widzimy taki zapis w książce, to wygląda
  • 5:17 - 5:18
    jak niesamowicie zaawansowana matematyka.
  • 5:18 - 5:21
    Ale chodzi o sumę wszystkich punktów pomiarowych,
  • 5:21 - 5:23
    sumę liczb i podzielenie
  • 5:23 - 5:24
    przez ilość punktów pomiarowych.
  • 5:24 - 5:27
    Dla tego przypadku to będzie 5+ 5 + 5.5 + 5.75
  • 5:27 - 5:30
    + 6.5 podzielone przez 5.
  • 5:30 - 5:32
    To właśnie mówi nam ten wzór.
  • 5:32 - 5:34
    Do obliczenia średniej populacji robimy to samo.
  • 5:34 - 5:36
    Używa się jedynie nieco innej notacji.
  • 5:36 - 5:42
    Średnia populacji jest równa sumie od n równego 1 do
  • 5:42 - 5:46
    dużego N -- i wytłumaczę dlaczego zapisuje się duże N --
  • 5:46 - 5:50
    każdy z punktów pomiarowych w populacji, nie tylko w próbie,
  • 5:50 - 5:53
    jest podzielony przez duże N.
  • 5:53 - 5:55
    Duże N pojawia się gdy mówimy o dużych liczbach,
  • 5:55 - 5:57
    mamy wtedy na myśli 150 milionów.
  • 5:57 - 6:00
    Zapisujemy w ten sposób gdy chcemy podkreślić, że liczymy
  • 6:00 - 6:01
    wszystkie elementy w populacji.
  • 6:01 - 6:04
    Następnie dzielimy przez wielkość
  • 6:04 - 6:05
    całej populacji.
  • 6:05 - 6:08
    W momencie, gdy mamy małe n, przez konwencję
  • 6:08 - 6:11
    notacja chce zasugerować nam,
  • 6:11 - 6:14
    że chodzi o mniejszą liczbę elementów, a nie całą populację.
  • 6:14 - 6:16
    Ale sposób ich obliczania
  • 6:16 - 6:19
    jest zasadniczo ten sam.
  • 6:19 - 6:22
    Zostawię wam chwilę do przemyślenia,
  • 6:22 - 6:25
    ponieważ jeżeli nie zrozumiecie tego na samym początku,
  • 6:25 - 6:28
    tej całkiem prostej idei -- to z czasem może okazać się kłopotliwe,
  • 6:28 - 6:29
    gdy ktoś będzie chciał rozróżnić pomiędzy
  • 6:29 - 6:31
    średnią próby i populacji.
  • 6:31 - 6:33
    Również te formuły są zapisane nieco inaczej.
  • 6:33 - 6:37
    Czasem widzimy mi, a czasem
  • 6:37 - 6:39
    x z kreską, oznaczające średnią próby.
  • 6:39 - 6:41
    Do zobaczenia w następnym filmie.
Title:
Statystyka: Średnia z próby vs populacji
Description:

Różnica pomiędzy średnią z próby i populacji.

more » « less
Video Language:
English
Duration:
06:42

Polish subtitles

Revisions