Most belépünk a statisztika világába. A statisztika abban segít nekünk, hogy megértsük az adatokat, és értelmezni tudjuk őket. Tehát a statisztika adatokról szól. Ha belépünk a a statisztika világába, az elején sokat foglalkozunk azzal, amit leíró statisztikának hívunk. Ha van egy csomó adatunk, és ezekről szeretnénk valamit közölni úgy, hogy nem adjuk meg az összes adatot, vajon ezt meg tudjuk-e tenni valahogy úgy, hogy kevesebb számot használunk? Pontosan ezzel fogunk most foglalkozni. És amikor már jól értjük a leíró statisztikát, el fogunk kezdeni megállapításokat, becsléseket vagy következtetéseket tenni az adatok alapján, azaz a következtető statisztikával fogunk foglalkozni. Erről ennyit, most nézzük meg, hogyan jellemezhetünk adatokat. Vegyünk néhány számot, nevezhetjük őket adatoknak. Például megmérjük a növények magasságát a kertünkben. Mondjuk, van hat növényünk. A magasságuk: 4 cm, 3 cm, 1 cm, 6 cm, még egy 1 centiméteres, és egy 7 centiméteres. És mondjuk, valaki, – aki a másik szobában van, és nem látja a növényeket -, megkérdezi tőled, hogy milyen magasak a növényeid? És csak egyetlen számmal válaszolhatsz. Egy olyan számot szeretne ez a valaki kapni, amelyik jól jellemzi ezeket a különböző magasságú növényeket. Mit fogsz tenni? Nos, elgondolkodhatsz azon, hogy hogyan kereshetnél egy olyan számot, ami jellemző rájuk. Mondjuk, egy olyat, amelyik az átlagos magasságukat mutatja. Vagy a leggyakrabban előforduló számot. Esetleg azt a számot, amelyik ezeknek a számoknak a középső értékét mutatja. És ha ilyesfélék jutottak eszedbe, akkor igazából ugyanazt tetted, amit a leíró statisztika kitalálói tettek. Ők is eltűnődtek azon, hogy hogy is lehetne ezt megtenni. Kezdjük akkor az átlag fogalmával! A köznyelvben az átlagnak szűkebb jelentése van. Általában, amikor átlagról beszélünk, a számtani középre gondolunk, amiről hamarosan beszélni fogunk. De a statisztikában az átlagnak általánosabb jelentése van. Itt azt jelenti, hogy egy tipikus értéket keresünk, vagy – és ez fontos, hogy vagy – egy középső értéket, tehát azt a mérőszámot keressük, ami azt mutatja, hogy mi felé tendálnak a számok. Szóval, van egy csomó számunk, és egy számmal szeretnénk jellemezni őket – ezt átlagnak nevezzük – ami ezeknek a számoknak a tipikus vagy középső értéke. És majd látni fogjuk, hogy sokféle átlag létezik. Az elsővel valószínűleg már sokszor találkoztál, erre gondolunk, amikor a jegyeink átlagáról vagy átlagmagasságról beszélünk. Ez a számtani közép. Ezt sárgával írom. Számtani közép. Ezt úgy kapjuk meg – ez egyébként egy az ember alkotta definíció, ami aztán hasznosnak bizonyult –, tehát úgy kapjuk meg, hogy összeadjuk az összes számot, és elosztjuk őket azzal, ahány szám van. Ez alapján nézzük meg, mennyi ennek az adathalmaznak a számtani közepe. Számoljuk ki! 4 + 3 + 1 + 6 + 1 + 7 osztva az adathalmaz elemeinek számával. Hat eleme van az adatsokaságnak, tehát 6-tal fogunk osztani. 4 plusz 3 az 7, 7 plusz 1 az 8, 8 plusz 6 az 14, 14 plusz 1 az 15, 15 plusz 7 az 22. Összeadom még egyszer. 7, 8, 14, 15, 22, és ezt elosztjuk 6-tal. Ezt felírhatjuk vegyes tört alakban. 22-ben a 6 megvan 3-szor, marad a 4, tehát 3 egész négy hatod, azaz 3 egész két harmad. Vagy felírhatjuk tizedes tört alakban is, 3,6, és a hatos ismétlődik. Bármelyik alakban felírhatjuk, a lényeg, hogy ez egyfajta jellemzője az adatsokaságnak. Az általános tendenciát mutatja meg. Ismétlem, ezek ember alkotta fogalmak. Nem az történt, hogy valaki egyszer csak talált egy vallási dokumentumot, amiben az állt, hogy így kell meghatározni a számtani közepet. Ez nem egy olyan alapvető számítás, mint mondjuk a kör kerületének a kiszámítása, ami tényleg onnan jön, hogy tanulmányoztuk a világegyetemet, és az alapján erre jutottunk. A számtani közép egy ember alkotta fogalom, amely hasznosnak bizonyult. Máshogy is meghatározhatjuk az átlagot, azaz kereshetünk egy tipikus vagy középső értéket. A másik nagyon gyakori érték a medián. Felírom, hogy medián. Kezdek kifogyni a színekből. A mediánt rózsaszínnel írom. Szóval a medián. A medián gyakorlatilag azt jelenti, hogy a középső számot keressük. Tehát ha az összes számot sorba rendezed az adathalmazban, és megkeresed a középsőt, az lesz a medián. Ez alapján mennyi ezeknek az adatoknak a mediánja? Keressük meg. Rendezzük növekvő sorrendbe a számokat. Van egy egyes, aztán még egy egyes, aztán egy hármas, aztán egy négyes, egy hatos, egy hetes. Csak megváltoztattam a sorrendet. Szóval, melyik a középső szám? Hát, nézzük csak, mivel hat számunk van, és a 6 páros, nem egy középső szám lesz, hanem kettő. Itt van a két középső szám, a 3 és a 4. És ilyenkor, amikor két középső szám van, a kettő között félúton lévő számra van szükségünk. Tehát a medián kiszámításához ennek a két számnak a számtani közepét vesszük. A medián középen van a 3 és a 4 között, ami 3,5, ezért itt a medián 3,5. Tehát ha a számok darabszáma páros, a medián a két középső szám számtani közepe. Ha a számok darabszáma páratlan, akkor egy kicsit könnyebb dolgunk van. Nézzük meg ezt is! Felírok egy másik adathalmazt. Mondjuk, az adathalmazunk – és most sorrendben fogom felírni –, mondjuk 0, 7, 50, mondjuk 10 000 és 1 millió. Legyen most ez a kicsit furcsa adatsor az adathalmazunk. De mennyi lesz itt a medián? Nos, itt öt szám van. Páratlan számú számunk van, így könnyebb kiválasztani a középsőt. Az a szám a középső, amelyik két számnál nagyobb és két számnál kisebb. Pontosan középen van. Tehát ebben az esetben a medián 50. Az általános tendencia harmadik mérőszáma – és valószínűleg ezt használják a legkevesebbet – a módusz. Gyakran elfeledkeznek róla. Úgy hangzik, mintha valami bonyolult dolog lenne, de valójában egy nagyon egyszerű fogalom. Bizonyos szempontból ez a legegyszerűbb. A módusz a leggyakoribb szám az adathalmazban, ha van leggyakoribb szám. Ha minden szám ugyanannyiszor szerepel, ha nincs egyetlen leggyakoribb szám, akkor nincs módusz. Akkor a módusz definíciója alapján melyik az egyetlen leggyakoribb szám az első adathalmazunkban, ebben az adathalmazban? Csak egy négyes van, egy hármas, de két egyes van, és van egy hatos meg egy hetes. Tehát amelyik leggyakrabban szerepel itt, az az egyes. Vagyis a módusz, a leginkább tipikus vagy leggyakoribb szám itt az 1. Láthattuk, mennyiféle módja van annak, hogy találjunk egy tipikus, középső vagy általános tendenciára utaló számot, és mindegyik módszer nagyon-nagyon különböző. Ahogy haladunk a statiszikával, látni fogjuk, hogy különböző dolgokra használhatóak. Ezt nagyon gyakran használjuk. A medián nagyon jó, ha van egy szám, ami nagyon kilóg, és torzítaná az átlagot. Ilyenkor a módusz is hasznos lehet, főleg akkor, ha van egy olyan szám, amelyik sokkal többször szerepel, mint a többi. Mára ennyi. A következő néhány videóban még jobban elmélyülünk a statisztika világában.