Most belépünk a statisztika világába.
A statisztika abban segít nekünk,
hogy megértsük az adatokat,
és értelmezni tudjuk őket.
Tehát a statisztika adatokról szól.
Ha belépünk a
a statisztika világába,
az elején sokat foglalkozunk azzal,
amit leíró statisztikának hívunk.
Ha van egy csomó adatunk,
és ezekről szeretnénk
valamit közölni úgy,
hogy nem adjuk meg
az összes adatot,
vajon ezt meg tudjuk-e tenni
valahogy úgy,
hogy kevesebb számot használunk?
Pontosan ezzel fogunk most
foglalkozni.
És amikor már jól értjük
a leíró statisztikát,
el fogunk kezdeni megállapításokat,
becsléseket
vagy következtetéseket tenni
az adatok alapján,
azaz a következtető statisztikával
fogunk foglalkozni.
Erről ennyit,
most nézzük meg,
hogyan jellemezhetünk adatokat.
Vegyünk néhány számot,
nevezhetjük őket adatoknak.
Például megmérjük
a növények magasságát a kertünkben.
Mondjuk, van hat növényünk.
A magasságuk: 4 cm, 3 cm,
1 cm, 6 cm,
még egy 1 centiméteres,
és egy 7 centiméteres.
És mondjuk, valaki,
– aki a másik szobában van,
és nem látja a növényeket -,
megkérdezi tőled,
hogy milyen magasak a növényeid?
És csak egyetlen számmal
válaszolhatsz.
Egy olyan számot szeretne
ez a valaki kapni,
amelyik jól jellemzi ezeket a
különböző magasságú növényeket.
Mit fogsz tenni?
Nos, elgondolkodhatsz azon,
hogy hogyan kereshetnél
egy olyan számot, ami jellemző rájuk.
Mondjuk, egy olyat, amelyik
az átlagos magasságukat mutatja.
Vagy a leggyakrabban előforduló számot.
Esetleg azt a számot,
amelyik ezeknek a számoknak
a középső értékét mutatja.
És ha ilyesfélék jutottak eszedbe,
akkor igazából ugyanazt tetted,
amit a leíró statisztika
kitalálói tettek.
Ők is eltűnődtek azon,
hogy hogy is lehetne ezt megtenni.
Kezdjük akkor az átlag fogalmával!
A köznyelvben az átlagnak
szűkebb jelentése van.
Általában, amikor átlagról beszélünk,
a számtani középre gondolunk,
amiről hamarosan beszélni fogunk.
De a statisztikában az átlagnak
általánosabb jelentése van.
Itt azt jelenti, hogy
egy tipikus értéket keresünk,
vagy – és ez fontos, hogy vagy –
egy középső értéket,
tehát azt a mérőszámot keressük,
ami azt mutatja, hogy mi felé
tendálnak a számok.
Szóval, van egy csomó számunk,
és egy számmal szeretnénk
jellemezni őket
– ezt átlagnak nevezzük –
ami ezeknek a számoknak
a tipikus vagy középső értéke.
És majd látni fogjuk, hogy sokféle
átlag létezik.
Az elsővel valószínűleg már sokszor
találkoztál,
erre gondolunk, amikor a jegyeink
átlagáról
vagy átlagmagasságról beszélünk.
Ez a számtani közép.
Ezt sárgával írom.
Számtani közép.
Ezt úgy kapjuk meg
– ez egyébként egy
az ember alkotta definíció,
ami aztán hasznosnak bizonyult –,
tehát úgy kapjuk meg, hogy
összeadjuk az összes számot,
és elosztjuk őket azzal,
ahány szám van.
Ez alapján nézzük meg,
mennyi ennek az adathalmaznak
a számtani közepe.
Számoljuk ki!
4 + 3 + 1 + 6 + 1 + 7
osztva az adathalmaz elemeinek számával.
Hat eleme van az adatsokaságnak,
tehát 6-tal fogunk osztani.
4 plusz 3 az 7, 7 plusz 1 az 8,
8 plusz 6 az 14,
14 plusz 1 az 15, 15 plusz 7 az 22.
Összeadom még egyszer.
7, 8, 14, 15, 22,
és ezt elosztjuk 6-tal.
Ezt felírhatjuk vegyes tört alakban.
22-ben a 6 megvan 3-szor,
marad a 4,
tehát 3 egész négy hatod,
azaz 3 egész két harmad.
Vagy felírhatjuk tizedes tört alakban is,
3,6, és a hatos ismétlődik.
Bármelyik alakban felírhatjuk,
a lényeg, hogy ez egyfajta jellemzője
az adatsokaságnak.
Az általános tendenciát mutatja meg.
Ismétlem,
ezek ember alkotta fogalmak.
Nem az történt,
hogy valaki egyszer csak talált
egy vallási dokumentumot,
amiben az állt,
hogy így kell meghatározni
a számtani közepet.
Ez nem egy olyan alapvető számítás,
mint mondjuk
a kör kerületének a kiszámítása,
ami tényleg onnan jön,
hogy tanulmányoztuk a világegyetemet,
és az alapján erre jutottunk.
A számtani közép egy
ember alkotta fogalom,
amely hasznosnak bizonyult.
Máshogy is
meghatározhatjuk az átlagot,
azaz kereshetünk egy tipikus
vagy középső értéket.
A másik nagyon gyakori érték
a medián.
Felírom, hogy medián.
Kezdek kifogyni a színekből.
A mediánt rózsaszínnel írom.
Szóval a medián.
A medián gyakorlatilag azt jelenti,
hogy a középső számot keressük.
Tehát ha az összes számot
sorba rendezzük az adathalmazban,
és megkeressük a középsőt,
az lesz a medián.
Ez alapján mennyi ezeknek
az adatoknak a mediánja?
Keressük meg.
Rendezzük növekvő
sorrendbe a számokat.
Van egy egyes,
aztán még egy egyes,
aztán egy hármas,
aztán egy négyes, egy hatos, egy hetes.
Csak megváltoztattam a sorrendet.
Szóval, melyik a középső szám?
Hát, nézzük csak,
mivel hat számunk van,
és a 6 páros,
nem egy középső szám lesz,
hanem kettő.
Itt van a két középső szám,
a 3 és a 4.
És ilyenkor, amikor két középső szám van,
a kettő között félúton lévő számra
van szükségünk.
Tehát a medián kiszámításához
ennek a két számnak
a számtani közepét vesszük.
A medián középen van
a 3 és a 4 között, ami 3,5,
ezért itt a medián 3,5.
Tehát ha a számok darabszáma páros,
a medián a két középső szám
számtani közepe.
Ha a számok darabszáma páratlan,
akkor egy kicsit könnyebb dolgunk van.
Nézzük meg ezt is!
Felírok egy másik adathalmazt.
Mondjuk, az adathalmazunk
– és most sorrendben fogom felírni –,
mondjuk
0, 7, 50, mondjuk 10 000 és 1 millió.
Legyen most ez a kicsit furcsa
adatsor az adathalmazunk.
De mennyi lesz itt a medián?
Nos, itt öt szám van.
Páratlan számú számunk van,
így könnyebb kiválasztani a középsőt.
Az a szám a középső,
amelyik két számnál nagyobb
és két számnál kisebb.
Pontosan középen van.
Tehát ebben az esetben a medián 50.
Az általános tendencia
harmadik mérőszáma
– és valószínűleg ezt használják
a legkevesebbet –
a módusz.
Gyakran elfeledkeznek róla.
Úgy hangzik, mintha valami
bonyolult dolog lenne,
de valójában
egy nagyon egyszerű fogalom.
Bizonyos szempontból
ez a legegyszerűbb.
A módusz a leggyakoribb szám
az adathalmazban,
ha van leggyakoribb szám.
Ha minden szám ugyanannyiszor szerepel,
ha nincs egyetlen leggyakoribb szám,
akkor nincs módusz.
Akkor a módusz definíciója alapján
melyik az egyetlen leggyakoribb szám
az első adathalmazunkban,
ebben az adathalmazban?
Csak egy négyes van,
egy hármas,
de két egyes van,
és van egy hatos meg egy hetes.
Tehát amelyik leggyakrabban szerepel itt,
az az egyes.
Vagyis a módusz, a leginkább tipikus
vagy leggyakoribb szám
itt az 1.
Láthattuk, mennyiféle módja van annak,
hogy találjunk egy tipikus, középső vagy
általános tendenciára utaló számot,
és mindegyik módszer
nagyon-nagyon különböző.
Ahogy haladunk a statiszikával,
látni fogjuk,
hogy különböző dolgokra használhatóak.
Ezt nagyon gyakran használjuk.
A medián nagyon jó, ha van egy szám,
ami nagyon kilóg,
és torzítaná az átlagot.
Ilyenkor a módusz is hasznos lehet,
főleg akkor, ha van egy olyan szám,
amelyik sokkal többször szerepel,
mint a többi.
Mára ennyi.
A következő néhány videóban
még jobban elmélyülünk
a statisztika világában.