1 00:00:00,660 --> 00:00:06,650 Most belépünk a statisztika világába. 2 00:00:06,650 --> 00:00:09,750 A statisztika abban segít nekünk, hogy megértsük az adatokat, 3 00:00:09,750 --> 00:00:11,520 és értelmezni tudjuk őket. 4 00:00:11,520 --> 00:00:14,670 Tehát a statisztika adatokról szól. 5 00:00:14,670 --> 00:00:19,000 Ha belépünk a a statisztika világába, 6 00:00:19,000 --> 00:00:20,670 az elején sokat foglalkozunk azzal, 7 00:00:20,670 --> 00:00:23,210 amit leíró statisztikának hívunk. 8 00:00:23,210 --> 00:00:25,218 Ha van egy csomó adatunk, 9 00:00:25,218 --> 00:00:27,930 és ezekről szeretnénk valamit közölni úgy, 10 00:00:27,930 --> 00:00:29,885 hogy nem adjuk meg az összes adatot, 11 00:00:29,885 --> 00:00:32,323 vajon ezt meg tudjuk-e tenni valahogy úgy, 12 00:00:32,323 --> 00:00:33,870 hogy kevesebb számot használunk? 13 00:00:33,870 --> 00:00:35,720 Pontosan ezzel fogunk most foglalkozni. 14 00:00:35,720 --> 00:00:39,260 És amikor már jól értjük a leíró statisztikát, 15 00:00:39,260 --> 00:00:41,730 el fogunk kezdeni megállapításokat, becsléseket 16 00:00:41,730 --> 00:00:44,200 vagy következtetéseket tenni az adatok alapján, 17 00:00:44,200 --> 00:00:49,430 azaz a következtető statisztikával fogunk foglalkozni. 18 00:00:51,160 --> 00:00:53,110 Erről ennyit, 19 00:00:53,110 --> 00:00:56,390 most nézzük meg, hogyan jellemezhetünk adatokat. 20 00:00:56,390 --> 00:01:00,710 Vegyünk néhány számot, 21 00:01:00,710 --> 00:01:02,360 nevezhetjük őket adatoknak. 22 00:01:02,360 --> 00:01:05,740 Például megmérjük a növények magasságát a kertünkben. 23 00:01:05,740 --> 00:01:07,400 Mondjuk, van hat növényünk. 24 00:01:07,400 --> 00:01:13,870 A magasságuk: 4 cm, 3 cm, 1 cm, 6 cm, 25 00:01:13,870 --> 00:01:17,990 még egy 1 centiméteres, és egy 7 centiméteres. 26 00:01:17,990 --> 00:01:20,951 És mondjuk, valaki, – aki a másik szobában van, 27 00:01:20,951 --> 00:01:23,140 és nem látja a növényeket -, megkérdezi tőled, 28 00:01:23,140 --> 00:01:24,687 hogy milyen magasak a növényeid? 29 00:01:24,687 --> 00:01:26,360 És csak egyetlen számmal válaszolhatsz. 30 00:01:26,360 --> 00:01:30,480 Egy olyan számot szeretne ez a valaki kapni, 31 00:01:30,480 --> 00:01:33,410 amelyik jól jellemzi ezeket a különböző magasságú növényeket. 32 00:01:33,410 --> 00:01:36,580 Mit fogsz tenni? 33 00:01:36,580 --> 00:01:38,785 Nos, elgondolkodhatsz azon, hogy hogyan kereshetnél 34 00:01:38,785 --> 00:01:40,990 egy olyan számot, ami jellemző rájuk. 35 00:01:40,990 --> 00:01:44,060 Mondjuk, egy olyat, amelyik az átlagos magasságukat mutatja. 36 00:01:44,060 --> 00:01:46,250 Vagy a leggyakrabban előforduló számot. 37 00:01:46,250 --> 00:01:48,030 Esetleg azt a számot, 38 00:01:48,030 --> 00:01:51,280 amelyik ezeknek a számoknak a középső értékét mutatja. 39 00:01:51,280 --> 00:01:53,220 És ha ilyesfélék jutottak eszedbe, 40 00:01:53,220 --> 00:01:55,189 akkor igazából ugyanazt tetted, 41 00:01:55,189 --> 00:01:58,230 amit a leíró statisztika kitalálói tettek. 42 00:01:58,230 --> 00:01:59,190 Ők is eltűnődtek azon, 43 00:01:59,190 --> 00:02:00,150 hogy hogy is lehetne ezt megtenni. 44 00:02:00,150 --> 00:02:04,960 Kezdjük akkor az átlag fogalmával! 45 00:02:04,960 --> 00:02:09,720 A köznyelvben az átlagnak szűkebb jelentése van. 46 00:02:09,720 --> 00:02:11,570 Általában, amikor átlagról beszélünk, 47 00:02:11,570 --> 00:02:13,070 a számtani középre gondolunk, 48 00:02:13,070 --> 00:02:14,960 amiről hamarosan beszélni fogunk. 49 00:02:14,960 --> 00:02:18,100 De a statisztikában az átlagnak általánosabb jelentése van. 50 00:02:18,100 --> 00:02:22,980 Itt azt jelenti, hogy egy tipikus értéket keresünk, 51 00:02:22,980 --> 00:02:29,810 vagy – és ez fontos, hogy vagy – egy középső értéket, 52 00:02:29,810 --> 00:02:34,000 tehát azt a mérőszámot keressük, 53 00:02:34,000 --> 00:02:38,550 ami azt mutatja, hogy mi felé tendálnak a számok. 54 00:02:38,550 --> 00:02:40,560 Szóval, van egy csomó számunk, 55 00:02:40,560 --> 00:02:44,220 és egy számmal szeretnénk jellemezni őket 56 00:02:44,220 --> 00:02:45,840 – ezt átlagnak nevezzük – 57 00:02:45,840 --> 00:02:50,450 ami ezeknek a számoknak a tipikus vagy középső értéke. 58 00:02:50,450 --> 00:02:54,110 És majd látni fogjuk, hogy sokféle átlag létezik. 59 00:02:54,110 --> 00:02:56,690 Az elsővel valószínűleg már sokszor találkoztál, 60 00:02:56,690 --> 00:02:58,765 erre gondolunk, amikor a jegyeink átlagáról 61 00:02:58,765 --> 00:03:00,840 vagy átlagmagasságról beszélünk. 62 00:03:00,840 --> 00:03:02,970 Ez a számtani közép. 63 00:03:02,970 --> 00:03:05,470 Ezt sárgával írom. 64 00:03:05,470 --> 00:03:13,100 Számtani közép. 65 00:03:21,620 --> 00:03:25,300 Ezt úgy kapjuk meg 66 00:03:25,300 --> 00:03:28,180 – ez egyébként egy az ember alkotta definíció, 67 00:03:28,180 --> 00:03:29,905 ami aztán hasznosnak bizonyult –, 68 00:03:29,905 --> 00:03:31,630 tehát úgy kapjuk meg, hogy összeadjuk az összes számot, 69 00:03:31,630 --> 00:03:34,460 és elosztjuk őket azzal, ahány szám van. 70 00:03:34,460 --> 00:03:36,830 Ez alapján nézzük meg, mennyi ennek az adathalmaznak 71 00:03:36,830 --> 00:03:39,114 a számtani közepe. 72 00:03:39,114 --> 00:03:40,280 Számoljuk ki! 73 00:03:40,280 --> 00:03:47,419 4 + 3 + 1 + 6 + 1 + 7 74 00:03:47,419 --> 00:03:51,210 osztva az adathalmaz elemeinek számával. 75 00:03:51,210 --> 00:03:53,210 Hat eleme van az adatsokaságnak, 76 00:03:53,210 --> 00:03:54,860 tehát 6-tal fogunk osztani. 77 00:03:54,860 --> 00:04:01,840 4 plusz 3 az 7, 7 plusz 1 az 8, 8 plusz 6 az 14, 78 00:04:01,840 --> 00:04:07,927 14 plusz 1 az 15, 15 plusz 7 az 22. 79 00:04:07,927 --> 00:04:09,135 Összeadom még egyszer. 80 00:04:09,135 --> 00:04:15,180 7, 8, 14, 15, 22, és ezt elosztjuk 6-tal. 81 00:04:15,180 --> 00:04:17,070 Ezt felírhatjuk vegyes tört alakban. 82 00:04:17,070 --> 00:04:21,120 22-ben a 6 megvan 3-szor, marad a 4, 83 00:04:21,120 --> 00:04:25,200 tehát 3 egész négy hatod, azaz 3 egész két harmad. 84 00:04:25,200 --> 00:04:28,670 Vagy felírhatjuk tizedes tört alakban is, 85 00:04:28,670 --> 00:04:32,360 3,6, és a hatos ismétlődik. 86 00:04:32,360 --> 00:04:34,380 Bármelyik alakban felírhatjuk, 87 00:04:34,380 --> 00:04:36,700 a lényeg, hogy ez egyfajta jellemzője az adatsokaságnak. 88 00:04:36,700 --> 00:04:39,820 Az általános tendenciát mutatja meg. 89 00:04:39,820 --> 00:04:41,620 Ismétlem, ezek ember alkotta fogalmak. 90 00:04:41,620 --> 00:04:42,745 Nem az történt, 91 00:04:42,745 --> 00:04:45,192 hogy valaki egyszer csak talált egy vallási dokumentumot, 92 00:04:45,192 --> 00:04:46,140 amiben az állt, 93 00:04:46,140 --> 00:04:49,180 hogy így kell meghatározni a számtani közepet. 94 00:04:49,180 --> 00:04:52,700 Ez nem egy olyan alapvető számítás, 95 00:04:52,700 --> 00:04:55,120 mint mondjuk a kör kerületének a kiszámítása, 96 00:04:55,120 --> 00:04:56,875 ami tényleg onnan jön, 97 00:04:56,875 --> 00:04:58,730 hogy tanulmányoztuk a világegyetemet, 98 00:04:58,730 --> 00:05:00,340 és az alapján erre jutottunk. 99 00:05:00,340 --> 00:05:02,337 A számtani közép egy ember alkotta fogalom, 100 00:05:02,337 --> 00:05:04,110 amely hasznosnak bizonyult. 101 00:05:04,110 --> 00:05:07,260 Máshogy is meghatározhatjuk az átlagot, 102 00:05:07,260 --> 00:05:10,130 azaz kereshetünk egy tipikus vagy középső értéket. 103 00:05:10,130 --> 00:05:14,470 A másik nagyon gyakori érték a medián. 104 00:05:14,470 --> 00:05:15,667 Felírom, hogy medián. 105 00:05:15,667 --> 00:05:17,070 Kezdek kifogyni a színekből. 106 00:05:17,070 --> 00:05:18,660 A mediánt rózsaszínnel írom. 107 00:05:18,660 --> 00:05:21,280 Szóval a medián. 108 00:05:21,280 --> 00:05:25,160 A medián gyakorlatilag azt jelenti, hogy a középső számot keressük. 109 00:05:25,160 --> 00:05:28,014 Tehát ha az összes számot sorba rendezzük az adathalmazban, 110 00:05:28,014 --> 00:05:31,460 és megkeressük a középsőt, az lesz a medián. 111 00:05:31,460 --> 00:05:34,050 Ez alapján mennyi ezeknek az adatoknak a mediánja? 112 00:05:35,806 --> 00:05:36,930 Keressük meg. 113 00:05:36,930 --> 00:05:38,240 Rendezzük növekvő sorrendbe a számokat. 114 00:05:38,240 --> 00:05:39,810 Van egy egyes, 115 00:05:39,810 --> 00:05:41,010 aztán még egy egyes, 116 00:05:41,010 --> 00:05:42,860 aztán egy hármas, 117 00:05:42,860 --> 00:05:46,630 aztán egy négyes, egy hatos, egy hetes. 118 00:05:46,630 --> 00:05:48,700 Csak megváltoztattam a sorrendet. 119 00:05:48,700 --> 00:05:50,890 Szóval, melyik a középső szám? 120 00:05:50,890 --> 00:05:52,320 Hát, nézzük csak, 121 00:05:52,320 --> 00:05:54,960 mivel hat számunk van, és a 6 páros, 122 00:05:54,960 --> 00:05:57,260 nem egy középső szám lesz, 123 00:05:57,260 --> 00:05:59,650 hanem kettő. 124 00:05:59,650 --> 00:06:02,050 Itt van a két középső szám, 125 00:06:02,050 --> 00:06:03,160 a 3 és a 4. 126 00:06:03,160 --> 00:06:05,940 És ilyenkor, amikor két középső szám van, 127 00:06:05,940 --> 00:06:09,640 a kettő között félúton lévő számra van szükségünk. 128 00:06:09,640 --> 00:06:12,080 Tehát a medián kiszámításához 129 00:06:12,080 --> 00:06:14,272 ennek a két számnak a számtani közepét vesszük. 130 00:06:14,272 --> 00:06:16,230 A medián középen van 131 00:06:16,230 --> 00:06:19,190 a 3 és a 4 között, ami 3,5, 132 00:06:19,190 --> 00:06:24,424 ezért itt a medián 3,5. 133 00:06:24,424 --> 00:06:26,590 Tehát ha a számok darabszáma páros, 134 00:06:26,590 --> 00:06:29,774 a medián a két középső szám számtani közepe. 135 00:06:31,329 --> 00:06:32,780 Ha a számok darabszáma páratlan, 136 00:06:32,780 --> 00:06:34,650 akkor egy kicsit könnyebb dolgunk van. 137 00:06:34,650 --> 00:06:35,644 Nézzük meg ezt is! 138 00:06:35,644 --> 00:06:37,250 Felírok egy másik adathalmazt. 139 00:06:37,250 --> 00:06:39,030 Mondjuk, az adathalmazunk 140 00:06:39,030 --> 00:06:41,756 – és most sorrendben fogom felírni –, mondjuk 141 00:06:41,756 --> 00:06:55,689 0, 7, 50, mondjuk 10 000 és 1 millió. 142 00:06:55,689 --> 00:06:58,450 Legyen most ez a kicsit furcsa adatsor az adathalmazunk. 143 00:06:58,450 --> 00:07:02,400 De mennyi lesz itt a medián? 144 00:07:02,400 --> 00:07:04,045 Nos, itt öt szám van. 145 00:07:04,045 --> 00:07:05,420 Páratlan számú számunk van, 146 00:07:05,420 --> 00:07:07,200 így könnyebb kiválasztani a középsőt. 147 00:07:07,200 --> 00:07:08,820 Az a szám a középső, 148 00:07:08,820 --> 00:07:13,540 amelyik két számnál nagyobb és két számnál kisebb. 149 00:07:13,540 --> 00:07:14,760 Pontosan középen van. 150 00:07:14,760 --> 00:07:18,840 Tehát ebben az esetben a medián 50. 151 00:07:18,840 --> 00:07:21,352 Az általános tendencia harmadik mérőszáma 152 00:07:21,352 --> 00:07:25,120 – és valószínűleg ezt használják a legkevesebbet – 153 00:07:25,120 --> 00:07:26,426 a módusz. 154 00:07:26,426 --> 00:07:27,800 Gyakran elfeledkeznek róla. 155 00:07:27,800 --> 00:07:29,852 Úgy hangzik, mintha valami bonyolult dolog lenne, 156 00:07:29,852 --> 00:07:31,310 de valójában egy nagyon egyszerű fogalom. 157 00:07:33,080 --> 00:07:36,180 Bizonyos szempontból ez a legegyszerűbb. 158 00:07:36,180 --> 00:07:40,510 A módusz a leggyakoribb szám az adathalmazban, 159 00:07:40,510 --> 00:07:41,894 ha van leggyakoribb szám. 160 00:07:41,894 --> 00:07:43,837 Ha minden szám ugyanannyiszor szerepel, 161 00:07:43,837 --> 00:07:45,730 ha nincs egyetlen leggyakoribb szám, 162 00:07:45,730 --> 00:07:47,100 akkor nincs módusz. 163 00:07:47,100 --> 00:07:50,240 Akkor a módusz definíciója alapján 164 00:07:50,240 --> 00:07:54,581 melyik az egyetlen leggyakoribb szám az első adathalmazunkban, 165 00:07:54,581 --> 00:07:58,300 ebben az adathalmazban? 166 00:07:58,300 --> 00:08:00,100 Csak egy négyes van, 167 00:08:00,100 --> 00:08:01,480 egy hármas, 168 00:08:01,480 --> 00:08:03,370 de két egyes van, 169 00:08:03,370 --> 00:08:04,880 és van egy hatos meg egy hetes. 170 00:08:04,880 --> 00:08:08,730 Tehát amelyik leggyakrabban szerepel itt, 171 00:08:08,730 --> 00:08:11,060 az az egyes. 172 00:08:11,060 --> 00:08:15,117 Vagyis a módusz, a leginkább tipikus vagy leggyakoribb szám 173 00:08:15,117 --> 00:08:17,598 itt az 1. 174 00:08:17,598 --> 00:08:19,600 Láthattuk, mennyiféle módja van annak, 175 00:08:19,600 --> 00:08:23,320 hogy találjunk egy tipikus, középső vagy általános tendenciára utaló számot, 176 00:08:23,320 --> 00:08:25,628 és mindegyik módszer nagyon-nagyon különböző. 177 00:08:25,628 --> 00:08:27,220 Ahogy haladunk a statiszikával, 178 00:08:27,220 --> 00:08:29,750 látni fogjuk, hogy különböző dolgokra használhatóak. 179 00:08:29,750 --> 00:08:31,600 Ezt nagyon gyakran használjuk. 180 00:08:31,600 --> 00:08:34,574 A medián nagyon jó, ha van egy szám, 181 00:08:34,574 --> 00:08:35,990 ami nagyon kilóg, 182 00:08:35,990 --> 00:08:38,100 és torzítaná az átlagot. 183 00:08:38,100 --> 00:08:41,449 Ilyenkor a módusz is hasznos lehet, 184 00:08:41,449 --> 00:08:43,240 főleg akkor, ha van egy olyan szám, 185 00:08:43,240 --> 00:08:45,960 amelyik sokkal többször szerepel, mint a többi. 186 00:08:45,960 --> 00:08:47,570 Mára ennyi. 187 00:08:47,570 --> 00:08:49,900 A következő néhány videóban 188 00:08:49,900 --> 00:08:52,909 még jobban elmélyülünk a statisztika világában.