Most belépünk a statisztika világába. A statisztika abban segít nekünk, hogy megértsük az adatokat, és értelmezni tudjuk őket. Tehát a statisztika adatokról szól. Ha belépünk a a statisztika világába, az elején sokat foglalkozunk azzal, amit leíró statisztikának hívunk. Ha van egy csomó adatunk, és ezekről szeretnénk valamit közölni úgy, hogy nem adjuk meg az összes adatot, vajon ezt meg tudjuk-e tenni valahogy úgy, hogy kevesebb számot használunk? Pontosan ezzel fogunk most foglalkozni. És amikor már jól értjük a leíró statisztikát, el fogunk kezdeni megállapításokat, becsléseket vagy következtetéseket tenni az adatok alapján, azaz a következtető statisztikával fogunk foglalkozni. Erről ennyit, most nézzük meg, hogyan jellemezhetünk adatokat. Vegyünk néhány számot, nevezhetjük őket adatoknak. Például megmérjük a növények magasságát a kertünkben. Mondjuk, van hat növényünk. A magasságuk: 4 cm, 3 cm, 1 cm, 6 cm, még egy 1 centiméteres, és egy 7 centiméteres. És mondjuk, valaki, – aki a másik szobában van, és nem látja a növényeket -, megkérdezi tőled, hogy milyen magasak a növényeid? És csak egyetlen számmal válaszolhatsz. Egy olyan számot szeretne ez a valaki kapni, amelyik jól jellemzi ezeket a különböző magasságú növényeket. Mit fogsz tenni? Nos, elgondolkodhatsz azon, hogy hogyan kereshetnél egy olyan számot, ami jellemző rájuk. Mondjuk, egy olyat, amelyik az átlagos magasságukat mutatja. Vagy a leggyakrabban előforduló számot. Esetleg azt a számot, amelyik ezeknek a számoknak a középső értékét mutatja. És ha ilyesfélék jutottak eszedbe, akkor igazából ugyanazt tetted, amit a leíró statisztika kitalálói tettek. Ők is eltűnődtek azon, hogy hogy is lehetne ezt megtenni. Kezdjük akkor az átlag fogalmával! A köznyelvben az átlagnak szűkebb jelentése van. Általában, amikor átlagról beszélünk, a számtani középre gondolunk, amiről hamarosan beszélni fogunk. De a statisztikában az átlagnak általánosabb jelentése van. Itt azt jelenti, hogy egy tipikus értéket keresünk, vagy – és ez fontos, hogy vagy – egy középső értéket, tehát azt a mérőszámot keressük, ami azt mutatja, hogy mi felé tendálnak a számok. Szóval, van egy csomó számunk, és egy számmal szeretnénk jellemezni őket – ezt átlagnak nevezzük – ami ezeknek a számoknak a tipikus vagy középső értéke. És majd látni fogjuk, hogy sokféle átlag létezik. Az elsővel valószínűleg már sokszor találkoztál, erre gondolunk, amikor a jegyeink átlagáról vagy átlagmagasságról beszélünk. Ez a számtani közép. Ezt sárgával írom. Számtani közép. Ezt úgy kapjuk meg – ez egyébként egy az ember alkotta definíció, ami aztán hasznosnak bizonyult –, tehát úgy kapjuk meg, hogy összeadjuk az összes számot, és elosztjuk őket azzal, ahány szám van. Ez alapján nézzük meg, mi ennek az adathalmaznak a számtani közepe. Számoljuk ki! 4 + 3 + 1 + 6 + 1 + 7 osztva az adathalmaz elemeinek számával. Hat eleme van az adatsokaságnak, tehát 6-tal fogunk osztani. 4 plusz 3 az 7, plusz 1 az 8, plusz 6 az 14, plusz 1 az 15, plusz 7 az 22. Ellenőrizzük le! 7, 8, 14, 15, 22, és ezt elosztjuk 6-tal. Ezt felírhatjuk vegyes tört alakban. 22-ben a 6 megvan 3-szor, marad a 4, szóval 3 egész négy hatod, azaz 3 egész két harmad. Ezt felírhatjuk tizedes tört alakban is, 3,6, és a hatos ismétlődik. Bármelyik alakban felírhatjuk, a lényeg, hogy ez egy reprezentatív szám. Az általános tendenciát mutatja meg. Ismétlem, ezek ember alkotta fogalmak. Nem az történt, hogy valaki egyszer csak talált egy vallási dokumentumot, amiben az állt, hogy ez a számtani közép meghatározása. Nem tisztán egy olyan számítás, mint a kör kerületének kiszámítása, ami tényleg onnan jön, hogy tanulmányoztuk a világegyetemet, és az alapján erre jutottunk. A számtani közép viszont ember alkotta fogalom, amit hasznosnak találtunk. Máshogy is meghatározhatjuk az átlagot, azaz kereshetünk egy tipikus vagy középső értéket. A másik nagyon gyakori módszer a medián. Felírom, hogy medián. Kezdek kifogyni a színekből. A mediánt rózsaszínnel írom. Szóval itt a medián. A medián szó szerint azt jelenti, hogy a középső számot keressük. Tehát, ha az összes számot sorba rendezed az adathalmazban, és megkeresed a középsőt, az lesz a medián. Ez alapján mi ezeknek az adatoknak a mediánja? Keressük meg. Rendezzük sorba a számokat. Van egy egyes. Aztán még egy egyes. Aztán egy hármas. Aztán egy négyes, egy hatos, egy hetes. Csak annyit csináltam, hogy megváltoztattam a sorrendet. Szóval, melyik a középső szám? Ha itt megnézed, mivel hat darab számunk van, ami páros, nem egy középső szám lesz, hanem kettő. Itt van a két középső szám. A 3 és a 4. És ilyenkor, amikor két középső szám van, a kettő között félúton lévő számra van szükségünk. Tehát a medián kiszámításához ennek a két számnak a számtani közepét veszed. A medián félúton van a 3 és a 4 között, ami 3,5 lesz. Tehát itt a medián 3,5. Tehát, ha a számok darabszáma páros, a medián a két középső szám, azaz ezek számtani közepe, félúton a két középső között. Ha számok darabszáma páratlan, akkor egy kicsit könnyebb meghatározni. Hogy ezt is megnézzük, felírok egy másik adathalmazt. Mondjuk, az adathalmazunk, – és sorrendben fogom felírni –, mondjuk 0, 7, 50, mondjuk 10000 és 1 millió. Legyen most ez az adathalmazunk, furcsa adathalmaz. De ilyenkor, mi a medián? Nos, itt öt darab szám van. Páratlan a darabszám, így könnyebb kiválasztani a középsőt. Az a szám a középső, amelyik két számnál nagyobb és két számnál kisebb. Pontosan középen van. Tehát ebben az esetben a medián 50. Na most, az általános tendencia harmadik mérőszáma, és valószínűleg ez az, amelyet a legkevesebbet használnak a módusz. Gyakran elfeledkeznek róla. Nagyon összetettnek hangzik, de valójában nagyon egyszerű a koncepció. Bizonyos szempontból ez a legegyszerűbb koncepció. Tehát a módusz a leggyakoribb szám az adathalmazban, ha van egy leggyakoribb. Ha minden szám ugyanannyiszor szerepel, ha nincs egyetlen leggyakoribb szám, akkor nincs módusz. Akkor a módusz definíciója alapján melyik az egyetlen legyakoribb szám az eredeti adathalmazban, ebben itt? Egy darab négyes van, egy hármas, van két egyes, van egy hatos és egy hetes. Tehát, amelyik leggyakrabban szerepel, az az egyes. Vagyis a módusz, a leggyakoribb szám itt az 1. Láthattuk, mennyiféle módja van annak, hogy találjunk egy tipikus, középső vagy általános tendenciára utaló számot, és mindegyik módszer nagyon-nagyon különböző. Ahogy haladunk a statiszikával, látni fogjuk, hogy különböző dolgokra használhatóak. A számtani közepet nagyon gyakran használjuk. A medián nagyon jó, ha van egy szám, ami nagyon kilóg, és torzítaná az átlagot. Ilyenkor a módusz is hasznos lehet, főleg, ha van egy olyan szám, amelyik sokkal többször szerepel, mint a többi. Mára ennyi. A következő néhány videóban még jobban belemegyünk a statisztikába.