1 00:00:00,660 --> 00:00:06,650 Most belépünk a statisztika világába. 2 00:00:06,650 --> 00:00:09,750 A statisztika abban segít nekünk, hogy megértsük az adatokat, 3 00:00:09,750 --> 00:00:11,520 és értelmezni tudjuk őket. 4 00:00:11,520 --> 00:00:14,670 Tehát a statisztika adatokról szól. 5 00:00:14,670 --> 00:00:19,000 Ha belépünk a a statisztika világába, 6 00:00:19,000 --> 00:00:20,670 az elején sokat foglalkozunk azzal, 7 00:00:20,670 --> 00:00:23,210 amit leíró statisztikának hívunk. 8 00:00:23,210 --> 00:00:25,218 Ha van egy csomó adatunk, 9 00:00:25,218 --> 00:00:27,930 és ezekről szeretnénk valamit közölni úgy, 10 00:00:27,930 --> 00:00:29,885 hogy nem adjuk meg az összes adatot, 11 00:00:29,885 --> 00:00:32,323 vajon ezt meg tudjuk-e tenni valahogy úgy, 12 00:00:32,323 --> 00:00:33,870 hogy kevesebb számot használunk? 13 00:00:33,870 --> 00:00:35,720 Pontosan ezzel fogunk most foglalkozni. 14 00:00:35,720 --> 00:00:39,260 És amikor már jól értjük a leíró statisztikát, 15 00:00:39,260 --> 00:00:41,730 el fogunk kezdeni megállapításokat, becsléseket 16 00:00:41,730 --> 00:00:44,200 vagy következtetéseket tenni az adatok alapján, 17 00:00:44,200 --> 00:00:49,430 azaz a következtető statisztikával fogunk foglalkozni. 18 00:00:51,160 --> 00:00:53,110 Erről ennyit, 19 00:00:53,110 --> 00:00:56,390 most nézzük meg, hogyan jellemezhetünk adatokat. 20 00:00:56,390 --> 00:01:00,710 Vegyünk néhány számot, 21 00:01:00,710 --> 00:01:02,360 nevezhetjük őket adatoknak. 22 00:01:02,360 --> 00:01:05,740 Például megmérjük a növények magasságát a kertünkben. 23 00:01:05,740 --> 00:01:07,400 Mondjuk, van hat növényünk. 24 00:01:07,400 --> 00:01:13,870 A magasságuk: 4 cm, 3 cm, 1 cm, 6 cm, 25 00:01:13,870 --> 00:01:17,990 még egy 1 centiméteres, és egy 7 centiméteres. 26 00:01:17,990 --> 00:01:20,951 És mondjuk, valaki, – aki a másik szobában van, 27 00:01:20,951 --> 00:01:23,140 és nem látja a növényeket -, megkérdezi tőled, 28 00:01:23,140 --> 00:01:24,687 hogy milyen magasak a növényeid? 29 00:01:24,687 --> 00:01:26,360 És csak egyetlen számmal válaszolhatsz. 30 00:01:26,360 --> 00:01:30,480 Egy olyan számot szeretne ez a valaki kapni, 31 00:01:30,480 --> 00:01:33,410 amelyik jól jellemzi ezeket a különböző magasságú növényeket. 32 00:01:33,410 --> 00:01:36,580 Mit fogsz tenni? 33 00:01:36,580 --> 00:01:38,785 Nos, elgondolkodhatsz azon, hogy hogyan kereshetnél 34 00:01:38,785 --> 00:01:40,990 egy olyan számot, ami jellemző rájuk. 35 00:01:40,990 --> 00:01:44,060 Mondjuk, egy olyat, amelyik az átlagos magasságukat mutatja. 36 00:01:44,060 --> 00:01:46,250 Vagy a leggyakrabban előforduló számot. 37 00:01:46,250 --> 00:01:48,030 Esetleg azt a számot, 38 00:01:48,030 --> 00:01:51,280 amelyik ezeknek a számoknak a középső értékét mutatja. 39 00:01:51,280 --> 00:01:53,220 És ha ilyesfélék jutottak eszedbe, 40 00:01:53,220 --> 00:01:55,189 akkor igazából ugyanazt tetted, 41 00:01:55,189 --> 00:01:58,230 amit a leíró statisztika kitalálói tettek. 42 00:01:58,230 --> 00:01:59,190 Ők is eltűnődtek azon, 43 00:01:59,190 --> 00:02:00,150 hogy hogy is lehetne ezt megtenni. 44 00:02:00,150 --> 00:02:04,960 Kezdjük akkor az átlag fogalmával! 45 00:02:04,960 --> 00:02:09,720 A köznyelvben az átlagnak szűkebb jelentése van. 46 00:02:09,720 --> 00:02:11,570 Általában, amikor átlagról beszélünk, 47 00:02:11,570 --> 00:02:13,070 a számtani középre gondolunk, 48 00:02:13,070 --> 00:02:14,960 amiről hamarosan beszélni fogunk. 49 00:02:14,960 --> 00:02:18,100 De a statisztikában az átlagnak általánosabb jelentése van. 50 00:02:18,100 --> 00:02:22,980 Itt azt jelenti, hogy egy tipikus értéket keresünk, 51 00:02:22,980 --> 00:02:29,810 vagy – és ez fontos, hogy vagy – egy középső értéket, 52 00:02:29,810 --> 00:02:34,000 tehát azt a mérőszámot keressük, 53 00:02:34,000 --> 00:02:38,550 ami azt mutatja, hogy mi felé tendálnak a számok. 54 00:02:38,550 --> 00:02:40,560 Szóval, van egy csomó számunk, 55 00:02:40,560 --> 00:02:44,220 és egy számmal szeretnénk jellemezni őket 56 00:02:44,220 --> 00:02:45,840 – ezt átlagnak nevezzük – 57 00:02:45,840 --> 00:02:50,450 ami ezeknek a számoknak a tipikus vagy középső értéke. 58 00:02:50,450 --> 00:02:54,110 És majd látni fogjuk, hogy sokféle átlag létezik. 59 00:02:54,110 --> 00:02:56,690 Az elsővel valószínűleg már sokszor találkoztál, 60 00:02:56,690 --> 00:02:58,765 erre gondolunk, amikor a jegyeink átlagáról 61 00:02:58,765 --> 00:03:00,840 vagy átlagmagasságról beszélünk. 62 00:03:00,840 --> 00:03:02,970 Ez a számtani közép. 63 00:03:02,970 --> 00:03:05,470 Ezt sárgával írom. 64 00:03:05,470 --> 00:03:13,100 Számtani közép. 65 00:03:13,100 --> 00:03:16,010 66 00:03:16,010 --> 00:03:19,960 67 00:03:19,960 --> 00:03:21,620 68 00:03:21,620 --> 00:03:25,300 Ezt úgy kapjuk meg 69 00:03:25,300 --> 00:03:28,180 – ez egyébként egy az ember alkotta definíció, 70 00:03:28,180 --> 00:03:29,905 ami aztán hasznosnak bizonyult –, 71 00:03:29,905 --> 00:03:31,630 tehát úgy kapjuk meg, hogy összeadjuk az összes számot, 72 00:03:31,630 --> 00:03:34,460 és elosztjuk őket azzal, ahány szám van. 73 00:03:34,460 --> 00:03:36,830 Ez alapján nézzük meg, mi ennek az adathalmaznak 74 00:03:36,830 --> 00:03:39,114 a számtani közepe. 75 00:03:39,114 --> 00:03:40,280 Számoljuk ki! 76 00:03:40,280 --> 00:03:47,419 4 + 3 + 1 + 6 + 1 + 7 77 00:03:47,419 --> 00:03:51,210 osztva az adathalmaz elemeinek számával. 78 00:03:51,210 --> 00:03:53,210 Hat eleme van az adatsokaságnak, 79 00:03:53,210 --> 00:03:54,860 tehát 6-tal fogunk osztani. 80 00:03:54,860 --> 00:04:01,840 4 plusz 3 az 7, plusz 1 az 8, plusz 6 az 14, 81 00:04:01,840 --> 00:04:07,927 plusz 1 az 15, plusz 7 az 22. 82 00:04:07,927 --> 00:04:09,135 Ellenőrizzük le! 83 00:04:09,135 --> 00:04:15,180 7, 8, 14, 15, 22, és ezt elosztjuk 6-tal. 84 00:04:15,180 --> 00:04:17,070 Ezt felírhatjuk vegyes tört alakban. 85 00:04:17,070 --> 00:04:21,120 22-ben a 6 megvan 3-szor, marad a 4, 86 00:04:21,120 --> 00:04:25,200 szóval 3 egész négy hatod, azaz 3 egész két harmad. 87 00:04:25,200 --> 00:04:28,670 Ezt felírhatjuk tizedes tört alakban is, 88 00:04:28,670 --> 00:04:32,360 3,6, és a hatos ismétlődik. 89 00:04:32,360 --> 00:04:34,380 Bármelyik alakban felírhatjuk ezek közül. 90 00:04:34,380 --> 00:04:36,700 De ez valamilyen reprezentatív szám. 91 00:04:36,700 --> 00:04:39,820 Az általános tendenciát mutatja meg. 92 00:04:39,820 --> 00:04:41,620 Ismétlem, ezek ember alkotta fogalmak. 93 00:04:41,620 --> 00:04:43,590 Nem az történt, hogy valaki egyszer csak talált 94 00:04:43,590 --> 00:04:46,140 egy vallási dokumentumot, amiben az állt, 95 00:04:46,140 --> 00:04:47,990 hogy így kell meghatározni a számtani közepet. 96 00:04:47,990 --> 00:04:49,180 97 00:04:49,180 --> 00:04:52,700 Nem olyan egyszerű számítás, 98 00:04:52,700 --> 00:04:55,012 mint a kör kerületének kiszámítása, 99 00:04:55,012 --> 00:04:56,875 ami tényleg abból jön, 100 00:04:56,875 --> 00:04:58,350 hogy tanulmányoztuk a világegyetemet. 101 00:04:58,350 --> 00:05:00,340 És ez annak lett az eredménye. 102 00:05:00,340 --> 00:05:02,240 A számtani közép egy ember alkotta fogalom, 103 00:05:02,240 --> 00:05:04,110 amit hasznosnak találtunk. 104 00:05:04,110 --> 00:05:07,260 Namost, máshogyan is meghatározhatjuk az átlagot 105 00:05:07,260 --> 00:05:10,130 vagy kereshetünk egy tipikus vagy középső értéket. 106 00:05:10,130 --> 00:05:14,470 A másik nagyon gyakori módszer a medián. 107 00:05:14,470 --> 00:05:15,667 Felírom a mediánt. 108 00:05:15,667 --> 00:05:16,750 Kezdek kifogyni a színekből. 109 00:05:16,750 --> 00:05:18,660 A mediánt rózsaszínnel írom. 110 00:05:18,660 --> 00:05:21,280 111 00:05:21,280 --> 00:05:25,160 A medián szó szerint azt jelenti, hogy a középső számot keressük. 112 00:05:25,160 --> 00:05:27,350 Tehát, ha az összes számot sorba rendezed, 113 00:05:27,350 --> 00:05:31,460 és megkeresed a középsőt, az lesz a medián. 114 00:05:31,460 --> 00:05:34,050 Ez alapján, mi lesz ezeknek az adatoknak 115 00:05:34,050 --> 00:05:35,806 a mediánja? 116 00:05:35,806 --> 00:05:36,930 Keressük meg. 117 00:05:36,930 --> 00:05:38,170 Rendezzük sorba a számokat. 118 00:05:38,170 --> 00:05:39,810 Van egy egyes. 119 00:05:39,810 --> 00:05:41,010 Aztán még egy egyes. 120 00:05:41,010 --> 00:05:42,860 Aztán egy hármas. 121 00:05:42,860 --> 00:05:46,630 Aztán a négyes, a hatos, a hetes. 122 00:05:46,630 --> 00:05:48,700 Csak a sorrendet változtattam meg. 123 00:05:48,700 --> 00:05:50,890 Szóval, melyik a középső szám? 124 00:05:50,890 --> 00:05:52,320 Nézz ide, 125 00:05:52,320 --> 00:05:54,960 mivel hat számunk van, ami páros szám, 126 00:05:54,960 --> 00:05:57,260 nem egy középső szám lesz, 127 00:05:57,260 --> 00:05:59,650 hanem kettő. 128 00:05:59,650 --> 00:06:02,050 Itt van a két középső szám. 129 00:06:02,050 --> 00:06:03,160 A 3 és a 4. 130 00:06:03,160 --> 00:06:05,940 És ilyenkor, amikor két középső szám van, 131 00:06:05,940 --> 00:06:09,640 a kettő között félúton lévő számra van szükségünk. 132 00:06:09,640 --> 00:06:12,080 Tehát a medián kiszámításához, 133 00:06:12,080 --> 00:06:14,272 ennek a két számnak a számtani átlagát veszed. 134 00:06:14,272 --> 00:06:16,230 Tehát a medián félúton van 135 00:06:16,230 --> 00:06:19,190 a 3 és a 4 között, ami 3,5. 136 00:06:19,190 --> 00:06:24,424 Tehát itt a medián 3,5. 137 00:06:24,424 --> 00:06:26,590 Tehát, ha páros darabszám számod van, 138 00:06:26,590 --> 00:06:28,714 a medián a két középső szám, azaz ezek számtani átlaga, 139 00:06:28,714 --> 00:06:31,329 félúton a két középső között. 140 00:06:31,329 --> 00:06:32,870 Ha számok darabszáma páratlan, 141 00:06:32,870 --> 00:06:34,270 akkor egy kicsit könnyebb meghatározni. 142 00:06:34,270 --> 00:06:35,644 Hogy ezt is megnézzük, 143 00:06:35,644 --> 00:06:36,920 felírok egy másik adathalmazt. 144 00:06:36,920 --> 00:06:39,030 Mondjuk, az adathalmazunk, – és sorrendben fogom felírni –, 145 00:06:39,030 --> 00:06:41,740 mondjuk 146 00:06:41,740 --> 00:06:55,689 0, 7, 50, mondjuk 10000 és 1 millió. 147 00:06:55,689 --> 00:06:56,980 Legyen most ez az adathalmazunk, 148 00:06:56,980 --> 00:06:58,450 furcsa adathalmaz. 149 00:06:58,450 --> 00:07:02,400 De ilyenkor, mi a medián? 150 00:07:02,400 --> 00:07:04,045 Nos, itt öt darab szám van. 151 00:07:04,045 --> 00:07:05,420 Páratlan a darabszám, 152 00:07:05,420 --> 00:07:07,200 így könnyebb kiválasztani a középsőt. 153 00:07:07,200 --> 00:07:12,040 Az a szám a középső, amelyik két számnál nagyobb 154 00:07:12,040 --> 00:07:13,540 és két számnál kisebb. 155 00:07:13,540 --> 00:07:14,760 Pontosan középen van. 156 00:07:14,760 --> 00:07:18,840 Tehát ebben az esetben a medián 50. 157 00:07:18,840 --> 00:07:20,742 Na most, az általános tendencia harmadik mérőszáma, 158 00:07:20,742 --> 00:07:22,200 és valószínűleg ez az, amelyet a legkevesebbet használnak 159 00:07:22,200 --> 00:07:26,426 a módusz. 160 00:07:26,426 --> 00:07:27,800 Gyakran elfeledkeznek róla. 161 00:07:27,800 --> 00:07:29,852 Nagyon összetettnek hangzik, 162 00:07:29,852 --> 00:07:31,310 de valójában nagyon egyszerű 163 00:07:31,310 --> 00:07:33,080 a koncepció. 164 00:07:33,080 --> 00:07:36,180 Bizonyos szempontból ez a legegyszerűbb koncepció. 165 00:07:36,180 --> 00:07:40,510 Tehát a módusz a leggyakoribb szám az adathalmazban, 166 00:07:40,510 --> 00:07:41,197 ha van egy leggyakoribb. 167 00:07:41,197 --> 00:07:41,885 Ha minden szám ugyanannyiszor szerepel, 168 00:07:41,885 --> 00:07:43,801 ha nincs egyetlen leggyakoribb szám, 169 00:07:43,801 --> 00:07:45,760 akkor nincs módusz. 170 00:07:45,760 --> 00:07:47,320 Akkor a módusz definíciója alapján 171 00:07:47,320 --> 00:07:50,240 melyik az egyetlen legyakoribb szám az eredeti adathalmazban, 172 00:07:50,240 --> 00:07:54,190 ebben itt? 173 00:07:54,190 --> 00:07:58,300 Egy darab négyes van, 174 00:07:58,300 --> 00:08:00,100 egy hármas, 175 00:08:00,100 --> 00:08:01,490 van két egyes, 176 00:08:01,490 --> 00:08:03,370 van egy hatos és egy hetes. 177 00:08:03,370 --> 00:08:04,880 Tehát, amelyik leggyakrabban szerepel, 178 00:08:04,880 --> 00:08:08,730 az az egyes. 179 00:08:08,730 --> 00:08:11,060 Vagyis a módusz, a leggyakoribb szám 180 00:08:11,060 --> 00:08:14,070 itt az 1. 181 00:08:14,070 --> 00:08:17,610 Láthattuk, mennyiféle módja van annak, 182 00:08:17,610 --> 00:08:19,590 hogy találjunk egy tipikus, középső vagy általános tendenciára utaló számot, 183 00:08:19,590 --> 00:08:23,320 és mindegyik módszer nagyon-nagyon különböző. 184 00:08:23,320 --> 00:08:25,600 Ahogy haladunk a statiszikával, 185 00:08:25,600 --> 00:08:29,760 látni fogjuk, hogy különböző dolgokra használhatóak. 186 00:08:29,760 --> 00:08:31,600 A számtani közepet nagyon gyakran használjuk. 187 00:08:31,600 --> 00:08:34,574 A medián nagyon jó, ha van egy szám, 188 00:08:34,574 --> 00:08:35,990 ami nagyon kilóg, 189 00:08:35,990 --> 00:08:38,100 és torzítaná az átlagot. 190 00:08:38,100 --> 00:08:41,449 Ilyenkor a módusz is hasznos lehet, 191 00:08:41,449 --> 00:08:43,240 főleg, ha van egy olyan szám, 192 00:08:43,240 --> 00:08:45,960 amelyik sokkal többször szerepel, mint a többi. 193 00:08:45,960 --> 00:08:47,570 Mára ennyi. 194 00:08:47,570 --> 00:08:51,710 A következő néhány videóban még jobban belemegyünk a statisztikába. 195 00:08:51,710 --> 00:08:53,260 196 99:59:59,999 --> 99:59:59,999