Most belépünk a statisztika világába.
A statisztika abban segít nekünk,
hogy megértsük az adatokat,
és értelmezni tudjuk őket.
Tehát a statisztika adatokról szól.
Ha belépünk a
a statisztika világába,
az elején sokat foglalkozunk azzal,
amit leíró statisztikának hívunk.
Ha van egy csomó adatunk,
és ezekről szeretnénk
valamit közölni úgy,
hogy nem adjuk meg
az összes adatot,
vajon ezt meg tudjuk-e tenni
valahogy úgy,
hogy kevesebb számot használunk?
Pontosan ezzel fogunk most
foglalkozni.
És amikor már jól értjük
a leíró statisztikát,
el fogunk kezdeni megállapításokat,
becsléseket
vagy következtetéseket tenni
az adatok alapján,
azaz a következtető statisztikával
fogunk foglalkozni.
Erről ennyit,
most nézzük meg,
hogyan jellemezhetünk adatokat.
Vegyünk néhány számot,
nevezhetjük őket adatoknak.
Például megmérjük
a növények magasságát a kertünkben.
Mondjuk, van hat növényünk.
A magasságuk: 4 cm, 3 cm,
1 cm, 6 cm,
még egy 1 centiméteres,
és egy 7 centiméteres.
És mondjuk, valaki,
– aki a másik szobában van,
és nem látja a növényeket -,
megkérdezi tőled,
hogy milyen magasak a növényeid?
És csak egyetlen számmal
válaszolhatsz.
Egy olyan számot szeretne
ez a valaki kapni,
amelyik jól jellemzi ezeket a
különböző magasságú növényeket.
Mit fogsz tenni?
Nos, elgondolkodhatsz azon,
hogy hogyan kereshetnél
egy olyan számot, ami jellemző rájuk.
Mondjuk, egy olyat, amelyik
az átlagos magasságukat mutatja.
Vagy a leggyakrabban előforduló számot.
Esetleg azt a számot,
amelyik ezeknek a számoknak
a középső értékét mutatja.
És ha ilyesfélék jutottak eszedbe,
akkor igazából ugyanazt tetted,
amit a leíró statisztika
kitalálói tettek.
Ők is eltűnődtek azon,
hogy hogy is lehetne ezt megtenni.
Kezdjük akkor az átlag fogalmával!
A köznyelvben az átlagnak
szűkebb jelentése van.
Általában, amikor átlagról beszélünk,
a számtani középre gondolunk,
amiről hamarosan beszélni fogunk.
De a statisztikában az átlagnak
általánosabb jelentése van.
Itt azt jelenti, hogy
egy tipikus értéket keresünk,
vagy – és ez fontos, hogy vagy –
egy középső értéket,
tehát azt a mérőszámot keressük,
ami azt mutatja, hogy mi felé
tendálnak a számok.
Szóval, van egy csomó számunk,
és egy számmal szeretnénk
jellemezni őket
– ezt átlagnak nevezzük –
ami ezeknek a számoknak
a tipikus vagy középső értéke.
És majd látni fogjuk, hogy sokféle
átlag létezik.
Az elsővel valószínűleg már sokszor
találkoztál,
erre gondolunk, amikor a jegyeink
átlagáról
vagy átlagmagasságról beszélünk.
Ez a számtani közép.
Ezt sárgával írom.
Számtani közép.
Ezt úgy kapjuk meg
– ez egyébként egy
az ember alkotta definíció,
ami aztán hasznosnak bizonyult –,
tehát úgy kapjuk meg, hogy
összeadjuk az összes számot,
és elosztjuk őket azzal, ahány szám van.
Ez alapján nézzük meg,
mi ennek az adathalmaznak
a számtani közepe.
Számoljuk ki!
4 + 3 + 1 + 6 + 1 + 7
osztva az adathalmaz elemeinek számával.
Hat eleme van az adatsokaságnak,
tehát 6-tal fogunk osztani.
4 plusz 3 az 7, plusz 1 az 8,
plusz 6 az 14,
plusz 1 az 15, plusz 7 az 22.
Ellenőrizzük le!
7, 8, 14, 15, 22,
és ezt elosztjuk 6-tal.
Ezt felírhatjuk vegyes tört alakban.
22-ben a 6 megvan 3-szor,
marad a 4,
szóval 3 egész négy hatod,
azaz 3 egész két harmad.
Ezt felírhatjuk tizedes tört alakban is,
3,6, és a hatos ismétlődik.
Bármelyik alakban felírhatjuk,
a lényeg, hogy ez egy reprezentatív szám.
Az általános tendenciát mutatja meg.
Ismétlem, ezek ember alkotta fogalmak.
Nem az történt, hogy valaki
egyszer csak talált
egy vallási dokumentumot, amiben az állt,
hogy ez a számtani közép
meghatározása.
Nem tisztán egy olyan számítás,
mint a kör kerületének kiszámítása,
ami tényleg onnan jön,
hogy tanulmányoztuk a világegyetemet,
és az alapján erre jutottunk.
A számtani közép viszont
ember alkotta fogalom,
amit hasznosnak találtunk.
Máshogy is
meghatározhatjuk az átlagot,
azaz kereshetünk egy tipikus
vagy középső értéket.
A másik nagyon gyakori módszer
a medián.
Felírom, hogy medián.
Kezdek kifogyni a színekből.
A mediánt rózsaszínnel írom.
Szóval itt a medián.
A medián szó szerint azt jelenti,
hogy a középső számot keressük.
Tehát, ha az összes számot
sorba rendezed az adathalmazban,
és megkeresed a középsőt,
az lesz a medián.
Ez alapján
mi ezeknek az adatoknak
a mediánja?
Keressük meg.
Rendezzük sorba a számokat.
Van egy egyes.
Aztán még egy egyes.
Aztán egy hármas.
Aztán egy négyes, egy hatos, egy hetes.
Csak annyit csináltam,
hogy megváltoztattam a sorrendet.
Szóval, melyik a középső szám?
Ha itt megnézed,
mivel hat darab számunk van, ami páros,
nem egy középső szám lesz,
hanem kettő.
Itt van a két középső szám.
A 3 és a 4.
És ilyenkor, amikor két középső szám van,
a kettő között félúton lévő számra
van szükségünk.
Tehát a medián kiszámításához
ennek a két számnak
a számtani közepét veszed.
A medián félúton van
a 3 és a 4 között, ami 3,5 lesz.
Tehát itt a medián 3,5.
Tehát, ha páros darabszámú számod van,
a medián a két középső szám,
azaz ezek számtani közepe,
félúton a két középső között.
Ha számok darabszáma páratlan,
akkor egy kicsit könnyebb meghatározni.
Hogy ezt is megnézzük,
felírok egy másik adathalmazt.
Mondjuk, az adathalmazunk,
– és sorrendben fogom felírni –,
mondjuk
0, 7, 50, mondjuk 10000 és 1 millió.
Legyen most ez az adathalmazunk,
furcsa adathalmaz.
De ilyenkor, mi a medián?
Nos, itt öt darab szám van.
Páratlan a darabszám,
így könnyebb kiválasztani a középsőt.
Az a szám a középső, amelyik két számnál nagyobb
és két számnál kisebb.
Pontosan középen van.
Tehát ebben az esetben a medián 50.
Na most, az általános tendencia
harmadik mérőszáma,
és valószínűleg ez az, amelyet
a legkevesebbet használnak
a módusz.
Gyakran elfeledkeznek róla.
Nagyon összetettnek hangzik,
de valójában nagyon egyszerű
a koncepció.
Bizonyos szempontból
ez a legegyszerűbb koncepció.
Tehát a módusz a leggyakoribb szám
az adathalmazban,
ha van egy leggyakoribb.
Ha minden szám ugyanannyiszor szerepel,
ha nincs egyetlen leggyakoribb szám,
akkor nincs módusz.
Akkor a módusz definíciója alapján
melyik az egyetlen legyakoribb szám
az eredeti adathalmazban,
ebben itt?
Egy darab négyes van,
egy hármas,
van két egyes,
van egy hatos és egy hetes.
Tehát, amelyik leggyakrabban szerepel,
az az egyes.
Vagyis a módusz, a leggyakoribb szám
itt az 1.
Láthattuk, mennyiféle módja van annak,
hogy találjunk egy tipikus, középső vagy
általános tendenciára utaló számot,
és mindegyik módszer
nagyon-nagyon különböző.
Ahogy haladunk a statiszikával,
látni fogjuk, hogy különböző dolgokra használhatóak.
A számtani közepet nagyon gyakran használjuk.
A medián nagyon jó, ha van egy szám,
ami nagyon kilóg,
és torzítaná az átlagot.
Ilyenkor a módusz is hasznos lehet,
főleg, ha van egy olyan szám,
amelyik sokkal többször szerepel,
mint a többi.
Mára ennyi.
A következő néhány videóban
még jobban belemegyünk a statisztikába.