-
Na końcu poprzedniego filmu powiedziałem,
-
że będziemy mówić o miarach rozproszenia lub tego jak wartości są rozdystrybuowane,
-
zanim jednak przejdziemy do tego zagadnienia,
-
zdałem sobie sprawę, że chciałbym opowiedzieć jeszcze więcej o średniej.
-
I zanim do tego przejdę, chciałbym wprowadzić rozróżnienie
-
pomiędzy próbą a populacją.
-
Musnąłem jedynie ten temat w poprzednim filmie.
-
Załóżmy, że chcę wiedzieć jaka jest
-
średnia wysokość
-
wszystkich mężczyzn w Ameryce, dobrze?
-
Stwórzmy sobie więc zbiór wszystkich mężczyzn w Ameryce.
-
To są wszyscy mężczyźni w Ameryce.
-
Wiem, że w USA mieszka 300 milionów ludzi
-
i prawdopodobnie połowa z nich to mężczyźni,
-
daje to łącznie 150 milionów mężczyzn, prawda?
-
Graniczyłoby z niemożliwością, nawet jeżeli bardzo bym się starał,
-
by zmierzyć średnią wysokość
-
wszystkich mężczyzn w Ameryce.
-
W zasadzie, co parę sekund jeden z tych mężczyzn
-
się rodzi, jakiś inny umiera.
-
Czyli w momencie, gdy skończyłbym mierzyć wszystkich,
-
ktoś by umarł i wielu nowych mężczyzn
-
by się urodziło, więc jest to praktycznie niemożliwe.
-
Nawet jeżeli nie jest to niemożliwe, to bardzo czasochłonne
-
jest zmierzenie średniej arytmetycznej, mediany czy też dominanty
-
całej tej populacji, prawda?
-
Najlepszym sposobem na otrzymanie prawdopodobnego wyniku,
-
ponieważ zależy nam na obliczeniu średniej dla całej populacji,
-
jest ustalenie średniej na podstawie próbki populacji.
-
Mogę wybrać mniejszą grupę osobników z populacji --
-
będę starał się dobierać ją w sposób losowy.
-
Nie chciałbym -- mam nadzieję, że moja próbka
-
nie będzie składać się głównie z mojej szkolnej drużyny koszykówki,
-
ponieważ taka próbka zawyżyłaby wartość średnią. Będę próbował wybierać losowe osoby
-
w losowych sytuacjach, gdzie wiem że ich wysokość
-
nie będzie grała znaczącej roli.
-
Jeżeli pozbieram 10 wysokości --
-
im więcej wysokości pozbieram tym próbka będzie
-
lepiej opisywała ogół populacji -- ale powiedzmy, że zbiorę 10 różnych wysokości
-
i będą one równe:
-
5 stóp, 6 stóp, 5.5 stopy,
-
5.75 stopy, powiedzmy że 6 wysokości wystarczy,
-
czyli jest dodajmy jeszcze wysokość 6.5 stopy, dobrze?
-
To jest pięć osób, które wybrałem. Możemy teraz zastanowić się
-
nad różnymi sposobami wyciągania próbek dobrze reprezentujących całą populacje,
-
tak żeby nie były przechylone w którąkolwiek ze stron.
-
Niemniej jednak, jeżeli chciałbym orientacyjnie poznać średnią
-
i byłbym trochę leniwy, tak leniwy że dokonałem jedynie 5 pomiarów,
-
to zrobiłbym to właśnie w ten sposób.
-
To byłaby moja próba.
-
Próba populacji.
-
Załóżmy, że chciałem obliczyć wartość średnią
-
za pomocą średniej arytmetycznej.
-
Zamiast obliczać średnią arytmetyczną z całej tej grupy
-
150 milionów osób, mogę radośnie sobie
-
obliczyć wartość średnią dla tej próbki i będzie to,
-
średnia próby.
-
Chciałbym zapoznać was z obowiązującą w tym temacie notacją.
-
W języku statystyki, średnia to "mi", litera greckiego alfabetu,
-
która z czasem dała początek dobrze znanej literze "m",
-
oznacza wartość średnią populacji,
-
to jest oczywiscie tylko konwencja, wartość średnia populacji.
-
X z kreską, odpowiada wartości średniej próby.
-
To są tylko notacje, z którymi możecie się spotkać,
-
bez tego można się czuć nieco zdezorientowanym,
-
gdy ludzie mówiąc o średnich czasem zapisują "mi"
-
a czasem X z kreską,
-
warto wiedzieć jaka jest między nimi różnica.
-
Tutaj ma się na myśli średnią próbki populacji,
-
a tutaj chodzi o średnią wartość
-
całej populacji.
-
Sposób obliczania jest zasadniczo taki sam.
-
Jeżeli chcemy obliczyć średnią populacji,
-
pytamy 150 milionów osób w jednym momencie o wzrost,
-
sumujemy ich wysokości i dzielimy przez 150 milionów,
-
by uzyskać średnią populacji.
-
W średniej próby, dodajemy jedynie wysokości w naszej próbce
-
i dzielimy przez ilość punktów pomiarowych w niej znajdujących.
-
Wzory, które chce wam pokazać,
-
oczywiście potraficie obliczyć średnią arytmetyczną,
-
jest to bardzo prosta operacja, ale chcę pokazać
-
jak często bywa zapisywana w książkach statystycznych,
-
tak żebyście nie czuli się onieśmieleni, gdy zobaczycie formalny zapis.
-
Średnia populacji będzie zapisywana jako --
-
tak żebyście znali konwencję.
-
Każdy element -- zacznijmy najpierw od próby.
-
Każdy element próby, powiedzmy że ten jest pierwszy.
-
To jest x z 1 w indeksie dolnym.
-
To jest x z 2 w indeksie dolnym.
-
To jest x z 3 w indeksie dolnym, x z 4 w indeksie dolnym,
-
x z 5 w indeksie dolnym, prawda?
-
To jest po prostu sposób na odnoszenie się do
-
poszczególnych elementów próby.
-
Co trzeba zrobić by obliczyć średnią próby?
-
Sumujemy te wszystkie liczby.
-
Oczywiście wiecie jak to się robi, ale jest bardziej formalny sposób
-
zapisania sumowania, zapisujemy dużą sigmę.
-
Oznacza ona sumę.
-
Suma po każdym x z n w indeksie dolnym, prawda?
-
Bierzemy sumę po każdej z tych liczb, prawda?
-
To jest x z 1 w indeksie dolnym, x z 2 w indeksie dolnym, gdzie n jest jest równe od 1 do
-
rozmiaru próby.
-
Oczywiście próba może być większa lub mniejsza, w tym przypadku będzie to 5,
-
na górze sumy możemy również spotkać się z małym "n".
-
i dzielimy przez ilość elementów,
-
które znalazły się w próbce, więc dzielimy przez n.
-
Gdy widzimy taki zapis w książce, to wygląda
-
jak niesamowicie zaawansowana matematyka.
-
Ale chodzi o sumę wszystkich punktów pomiarowych,
-
sumę liczb i podzielenie
-
przez ilość punktów pomiarowych.
-
Dla tego przypadku to będzie 5+ 5 + 5.5 + 5.75
-
+ 6.5 podzielone przez 5.
-
To właśnie mówi nam ten wzór.
-
Do obliczenia średniej populacji robimy to samo.
-
Używa się jedynie nieco innej notacji.
-
Średnia populacji jest równa sumie od n równego 1 do
-
dużego N -- i wytłumaczę dlaczego zapisuje się duże N --
-
każdy z punktów pomiarowych w populacji, nie tylko w próbie,
-
jest podzielony przez duże N.
-
Duże N pojawia się gdy mówimy o dużych liczbach,
-
mamy wtedy na myśli 150 milionów.
-
Zapisujemy w ten sposób gdy chcemy podkreślić, że liczymy
-
wszystkie elementy w populacji.
-
Następnie dzielimy przez wielkość
-
całej populacji.
-
W momencie, gdy mamy małe n, przez konwencję
-
notacja chce zasugerować nam,
-
że chodzi o mniejszą liczbę elementów, a nie całą populację.
-
Ale sposób ich obliczania
-
jest zasadniczo ten sam.
-
Zostawię wam chwilę do przemyślenia,
-
ponieważ jeżeli nie zrozumiecie tego na samym początku,
-
tej całkiem prostej idei -- to z czasem może okazać się kłopotliwe,
-
gdy ktoś będzie chciał rozróżnić pomiędzy
-
średnią próby i populacji.
-
Również te formuły są zapisane nieco inaczej.
-
Czasem widzimy mi, a czasem
-
x z kreską, oznaczające średnią próby.
-
Do zobaczenia w następnym filmie.