WEBVTT 00:00:00.660 --> 00:00:06.650 Most belépünk a statisztika világába. 00:00:06.650 --> 00:00:09.750 A statisztika abban segít nekünk, hogy megértsük az adatokat, 00:00:09.750 --> 00:00:11.520 és értelmezni tudjuk őket. 00:00:11.520 --> 00:00:14.670 Tehát a statisztika adatokról szól. 00:00:14.670 --> 00:00:19.000 Ha belépünk a a statisztika világába, 00:00:19.000 --> 00:00:20.670 az elején sokat foglalkozunk azzal, 00:00:20.670 --> 00:00:23.210 amit leíró statisztikának hívunk. 00:00:23.210 --> 00:00:25.218 Ha van egy csomó adatunk, 00:00:25.218 --> 00:00:27.930 és ezekről szeretnénk valamit közölni úgy, 00:00:27.930 --> 00:00:29.885 hogy nem adjuk meg az összes adatot, 00:00:29.885 --> 00:00:32.323 vajon ezt meg tudjuk-e tenni valahogy úgy, 00:00:32.323 --> 00:00:33.870 hogy kevesebb számot használunk? 00:00:33.870 --> 00:00:35.720 Pontosan ezzel fogunk most foglalkozni. 00:00:35.720 --> 00:00:39.260 És amikor már jól értjük a leíró statisztikát, 00:00:39.260 --> 00:00:41.730 el fogunk kezdeni megállapításokat, becsléseket 00:00:41.730 --> 00:00:44.200 vagy következtetéseket tenni az adatok alapján, 00:00:44.200 --> 00:00:49.430 azaz a következtető statisztikával fogunk foglalkozni. 00:00:51.160 --> 00:00:53.110 Erről ennyit, 00:00:53.110 --> 00:00:56.390 most nézzük meg, hogyan jellemezhetünk adatokat. 00:00:56.390 --> 00:01:00.710 Vegyünk néhány számot, 00:01:00.710 --> 00:01:02.360 nevezhetjük őket adatoknak. 00:01:02.360 --> 00:01:05.740 Például megmérjük a növények magasságát a kertünkben. 00:01:05.740 --> 00:01:07.400 Mondjuk, van hat növényünk. 00:01:07.400 --> 00:01:13.870 A magasságuk: 4 cm, 3 cm, 1 cm, 6 cm, 00:01:13.870 --> 00:01:17.990 még egy 1 centiméteres, és egy 7 centiméteres. 00:01:17.990 --> 00:01:20.951 És mondjuk, valaki, – aki a másik szobában van, 00:01:20.951 --> 00:01:23.140 és nem látja a növényeket -, megkérdezi tőled, 00:01:23.140 --> 00:01:24.687 hogy milyen magasak a növényeid? 00:01:24.687 --> 00:01:26.360 És csak egyetlen számmal válaszolhatsz. 00:01:26.360 --> 00:01:30.480 Egy olyan számot szeretne ez a valaki kapni, 00:01:30.480 --> 00:01:33.410 amelyik jól jellemzi ezeket a különböző magasságú növényeket. 00:01:33.410 --> 00:01:36.580 Mit fogsz tenni? 00:01:36.580 --> 00:01:38.785 Nos, elgondolkodhatsz azon, hogy hogyan kereshetnél 00:01:38.785 --> 00:01:40.990 egy olyan számot, ami jellemző rájuk. 00:01:40.990 --> 00:01:44.060 Mondjuk, egy olyat, amelyik az átlagos magasságukat mutatja. 00:01:44.060 --> 00:01:46.250 Vagy a leggyakrabban előforduló számot. 00:01:46.250 --> 00:01:48.030 Esetleg azt a számot, 00:01:48.030 --> 00:01:51.280 amelyik ezeknek a számoknak a középső értékét mutatja. 00:01:51.280 --> 00:01:53.220 És ha ilyesfélék jutottak eszedbe, 00:01:53.220 --> 00:01:55.189 akkor igazából ugyanazt tetted, 00:01:55.189 --> 00:01:58.230 amit a leíró statisztika kitalálói tettek. 00:01:58.230 --> 00:01:59.190 Ők is eltűnődtek azon, 00:01:59.190 --> 00:02:00.150 hogy hogy is lehetne ezt megtenni. 00:02:00.150 --> 00:02:04.960 Kezdjük akkor az átlag fogalmával! 00:02:04.960 --> 00:02:09.720 A köznyelvben az átlagnak szűkebb jelentése van. 00:02:09.720 --> 00:02:11.570 Általában, amikor átlagról beszélünk, 00:02:11.570 --> 00:02:13.070 a számtani középre gondolunk, 00:02:13.070 --> 00:02:14.960 amiről hamarosan beszélni fogunk. 00:02:14.960 --> 00:02:18.100 De a statisztikában az átlagnak általánosabb jelentése van. 00:02:18.100 --> 00:02:22.980 Itt azt jelenti, hogy egy tipikus értéket keresünk, 00:02:22.980 --> 00:02:29.810 vagy – és ez fontos, hogy vagy – egy középső értéket, 00:02:29.810 --> 00:02:34.000 tehát azt a mérőszámot keressük, 00:02:34.000 --> 00:02:38.550 ami azt mutatja, hogy mi felé tendálnak a számok. 00:02:38.550 --> 00:02:40.560 Szóval, van egy csomó számunk, 00:02:40.560 --> 00:02:44.220 és egy számmal szeretnénk jellemezni őket 00:02:44.220 --> 00:02:45.840 – ezt átlagnak nevezzük – 00:02:45.840 --> 00:02:50.450 ami ezeknek a számoknak a tipikus vagy középső értéke. 00:02:50.450 --> 00:02:54.110 És majd látni fogjuk, hogy sokféle átlag létezik. 00:02:54.110 --> 00:02:56.690 Az elsővel valószínűleg már sokszor találkoztál, 00:02:56.690 --> 00:02:58.765 erre gondolunk, amikor a jegyeink átlagáról 00:02:58.765 --> 00:03:00.840 vagy átlagmagasságról beszélünk. 00:03:00.840 --> 00:03:02.970 Ez a számtani közép. 00:03:02.970 --> 00:03:05.470 Ezt sárgával írom. 00:03:05.470 --> 00:03:13.100 Számtani közép. 00:03:21.620 --> 00:03:25.300 Ezt úgy kapjuk meg 00:03:25.300 --> 00:03:28.180 – ez egyébként egy az ember alkotta definíció, 00:03:28.180 --> 00:03:29.905 ami aztán hasznosnak bizonyult –, 00:03:29.905 --> 00:03:31.630 tehát úgy kapjuk meg, hogy összeadjuk az összes számot, 00:03:31.630 --> 00:03:34.460 és elosztjuk őket azzal, ahány szám van. 00:03:34.460 --> 00:03:36.830 Ez alapján nézzük meg, mennyi ennek az adathalmaznak 00:03:36.830 --> 00:03:39.114 a számtani közepe. 00:03:39.114 --> 00:03:40.280 Számoljuk ki! 00:03:40.280 --> 00:03:47.419 4 + 3 + 1 + 6 + 1 + 7 00:03:47.419 --> 00:03:51.210 osztva az adathalmaz elemeinek számával. 00:03:51.210 --> 00:03:53.210 Hat eleme van az adatsokaságnak, 00:03:53.210 --> 00:03:54.860 tehát 6-tal fogunk osztani. 00:03:54.860 --> 00:04:01.840 4 plusz 3 az 7, 7 plusz 1 az 8, 8 plusz 6 az 14, 00:04:01.840 --> 00:04:07.927 14 plusz 1 az 15, 15 plusz 7 az 22. 00:04:07.927 --> 00:04:09.135 Összeadom még egyszer. 00:04:09.135 --> 00:04:15.180 7, 8, 14, 15, 22, és ezt elosztjuk 6-tal. 00:04:15.180 --> 00:04:17.070 Ezt felírhatjuk vegyes tört alakban. 00:04:17.070 --> 00:04:21.120 22-ben a 6 megvan 3-szor, marad a 4, 00:04:21.120 --> 00:04:25.200 tehát 3 egész négy hatod, azaz 3 egész két harmad. 00:04:25.200 --> 00:04:28.670 Vagy felírhatjuk tizedes tört alakban is, 00:04:28.670 --> 00:04:32.360 3,6, és a hatos ismétlődik. 00:04:32.360 --> 00:04:34.380 Bármelyik alakban felírhatjuk, 00:04:34.380 --> 00:04:36.700 a lényeg, hogy ez egyfajta jellemzője az adatsokaságnak. 00:04:36.700 --> 00:04:39.820 Az általános tendenciát mutatja meg. 00:04:39.820 --> 00:04:41.620 Ismétlem, ezek ember alkotta fogalmak. 00:04:41.620 --> 00:04:42.745 Nem az történt, 00:04:42.745 --> 00:04:45.192 hogy valaki egyszer csak talált egy vallási dokumentumot, 00:04:45.192 --> 00:04:46.140 amiben az állt, 00:04:46.140 --> 00:04:49.180 hogy így kell meghatározni a számtani közepet. 00:04:49.180 --> 00:04:52.700 Ez nem egy olyan alapvető számítás, 00:04:52.700 --> 00:04:55.120 mint mondjuk a kör kerületének a kiszámítása, 00:04:55.120 --> 00:04:56.875 ami tényleg onnan jön, 00:04:56.875 --> 00:04:58.730 hogy tanulmányoztuk a világegyetemet, 00:04:58.730 --> 00:05:00.340 és az alapján erre jutottunk. 00:05:00.340 --> 00:05:02.337 A számtani közép egy ember alkotta fogalom, 00:05:02.337 --> 00:05:04.110 amely hasznosnak bizonyult. 00:05:04.110 --> 00:05:07.260 Máshogy is meghatározhatjuk az átlagot, 00:05:07.260 --> 00:05:10.130 azaz kereshetünk egy tipikus vagy középső értéket. 00:05:10.130 --> 00:05:14.470 A másik nagyon gyakori érték a medián. 00:05:14.470 --> 00:05:15.667 Felírom, hogy medián. 00:05:15.667 --> 00:05:17.070 Kezdek kifogyni a színekből. 00:05:17.070 --> 00:05:18.660 A mediánt rózsaszínnel írom. 00:05:18.660 --> 00:05:21.280 Szóval a medián. 00:05:21.280 --> 00:05:25.160 A medián gyakorlatilag azt jelenti, hogy a középső számot keressük. 00:05:25.160 --> 00:05:28.014 Tehát ha az összes számot sorba rendezzük az adathalmazban, 00:05:28.014 --> 00:05:31.460 és megkeressük a középsőt, az lesz a medián. 00:05:31.460 --> 00:05:34.050 Ez alapján mennyi ezeknek az adatoknak a mediánja? 00:05:35.806 --> 00:05:36.930 Keressük meg. 00:05:36.930 --> 00:05:38.240 Rendezzük növekvő sorrendbe a számokat. 00:05:38.240 --> 00:05:39.810 Van egy egyes, 00:05:39.810 --> 00:05:41.010 aztán még egy egyes, 00:05:41.010 --> 00:05:42.860 aztán egy hármas, 00:05:42.860 --> 00:05:46.630 aztán egy négyes, egy hatos, egy hetes. 00:05:46.630 --> 00:05:48.700 Csak megváltoztattam a sorrendet. 00:05:48.700 --> 00:05:50.890 Szóval, melyik a középső szám? 00:05:50.890 --> 00:05:52.320 Hát, nézzük csak, 00:05:52.320 --> 00:05:54.960 mivel hat számunk van, és a 6 páros, 00:05:54.960 --> 00:05:57.260 nem egy középső szám lesz, 00:05:57.260 --> 00:05:59.650 hanem kettő. 00:05:59.650 --> 00:06:02.050 Itt van a két középső szám, 00:06:02.050 --> 00:06:03.160 a 3 és a 4. 00:06:03.160 --> 00:06:05.940 És ilyenkor, amikor két középső szám van, 00:06:05.940 --> 00:06:09.640 a kettő között félúton lévő számra van szükségünk. 00:06:09.640 --> 00:06:12.080 Tehát a medián kiszámításához 00:06:12.080 --> 00:06:14.272 ennek a két számnak a számtani közepét vesszük. 00:06:14.272 --> 00:06:16.230 A medián középen van 00:06:16.230 --> 00:06:19.190 a 3 és a 4 között, ami 3,5, 00:06:19.190 --> 00:06:24.424 ezért itt a medián 3,5. 00:06:24.424 --> 00:06:26.590 Tehát ha a számok darabszáma páros, 00:06:26.590 --> 00:06:29.774 a medián a két középső szám számtani közepe. 00:06:31.329 --> 00:06:32.780 Ha a számok darabszáma páratlan, 00:06:32.780 --> 00:06:34.650 akkor egy kicsit könnyebb dolgunk van. 00:06:34.650 --> 00:06:35.644 Nézzük meg ezt is! 00:06:35.644 --> 00:06:37.250 Felírok egy másik adathalmazt. 00:06:37.250 --> 00:06:39.030 Mondjuk, az adathalmazunk 00:06:39.030 --> 00:06:41.756 – és most sorrendben fogom felírni –, mondjuk 00:06:41.756 --> 00:06:55.689 0, 7, 50, mondjuk 10 000 és 1 millió. 00:06:55.689 --> 00:06:58.450 Legyen most ez a kicsit furcsa adatsor az adathalmazunk. 00:06:58.450 --> 00:07:02.400 De mennyi lesz itt a medián? 00:07:02.400 --> 00:07:04.045 Nos, itt öt szám van. 00:07:04.045 --> 00:07:05.420 Páratlan számú számunk van, 00:07:05.420 --> 00:07:07.200 így könnyebb kiválasztani a középsőt. 00:07:07.200 --> 00:07:08.820 Az a szám a középső, 00:07:08.820 --> 00:07:13.540 amelyik két számnál nagyobb és két számnál kisebb. 00:07:13.540 --> 00:07:14.760 Pontosan középen van. 00:07:14.760 --> 00:07:18.840 Tehát ebben az esetben a medián 50. 00:07:18.840 --> 00:07:21.352 Az általános tendencia harmadik mérőszáma 00:07:21.352 --> 00:07:25.120 – és valószínűleg ezt használják a legkevesebbet – 00:07:25.120 --> 00:07:26.426 a módusz. 00:07:26.426 --> 00:07:27.800 Gyakran elfeledkeznek róla. 00:07:27.800 --> 00:07:29.852 Úgy hangzik, mintha valami bonyolult dolog lenne, 00:07:29.852 --> 00:07:31.310 de valójában egy nagyon egyszerű fogalom. 00:07:33.080 --> 00:07:36.180 Bizonyos szempontból ez a legegyszerűbb. 00:07:36.180 --> 00:07:40.510 A módusz a leggyakoribb szám az adathalmazban, 00:07:40.510 --> 00:07:41.894 ha van leggyakoribb szám. 00:07:41.894 --> 00:07:43.837 Ha minden szám ugyanannyiszor szerepel, 00:07:43.837 --> 00:07:45.730 ha nincs egyetlen leggyakoribb szám, 00:07:45.730 --> 00:07:47.100 akkor nincs módusz. 00:07:47.100 --> 00:07:50.240 Akkor a módusz definíciója alapján 00:07:50.240 --> 00:07:54.581 melyik az egyetlen leggyakoribb szám az első adathalmazunkban, 00:07:54.581 --> 00:07:58.300 ebben az adathalmazban? 00:07:58.300 --> 00:08:00.100 Csak egy négyes van, 00:08:00.100 --> 00:08:01.480 egy hármas, 00:08:01.480 --> 00:08:03.370 de két egyes van, 00:08:03.370 --> 00:08:04.880 és van egy hatos meg egy hetes. 00:08:04.880 --> 00:08:08.730 Tehát amelyik leggyakrabban szerepel itt, 00:08:08.730 --> 00:08:11.060 az az egyes. 00:08:11.060 --> 00:08:15.117 Vagyis a módusz, a leginkább tipikus vagy leggyakoribb szám 00:08:15.117 --> 00:08:17.598 itt az 1. 00:08:17.598 --> 00:08:19.600 Láthattuk, mennyiféle módja van annak, 00:08:19.600 --> 00:08:23.320 hogy találjunk egy tipikus, középső vagy általános tendenciára utaló számot, 00:08:23.320 --> 00:08:25.628 és mindegyik módszer nagyon-nagyon különböző. 00:08:25.628 --> 00:08:27.220 Ahogy haladunk a statiszikával, 00:08:27.220 --> 00:08:29.750 látni fogjuk, hogy különböző dolgokra használhatóak. 00:08:29.750 --> 00:08:31.600 Ezt nagyon gyakran használjuk. 00:08:31.600 --> 00:08:34.574 A medián nagyon jó, ha van egy szám, 00:08:34.574 --> 00:08:35.990 ami nagyon kilóg, 00:08:35.990 --> 00:08:38.100 és torzítaná az átlagot. 00:08:38.100 --> 00:08:41.449 Ilyenkor a módusz is hasznos lehet, 00:08:41.449 --> 00:08:43.240 főleg akkor, ha van egy olyan szám, 00:08:43.240 --> 00:08:45.960 amelyik sokkal többször szerepel, mint a többi. 00:08:45.960 --> 00:08:47.570 Mára ennyi. 00:08:47.570 --> 00:08:49.900 A következő néhány videóban 00:08:49.900 --> 00:08:52.909 még jobban elmélyülünk a statisztika világában.