< Return to Video

Средна стойност и стандартно отклонение или медиана и интерквартилен размах

  • 0:01 - 0:03
    Имаме девет ученици, които наскоро
  • 0:03 - 0:08
    са завършили малко училище, в което
    имало клас с девет души,
  • 0:08 - 0:11
    и те искат да разберат
    каква е централната тенденция
  • 0:11 - 0:14
    за заплатите една година
    след завършването?
  • 0:14 - 0:17
    Те искат също да разберат
    какво е разсейването около
  • 0:17 - 0:20
    тази централна тенденция
    една година след завършване.
  • 0:20 - 0:24
    Те се съгласяват да въведат
    заплатите си в компютър
  • 0:24 - 0:26
    и това са техните заплати.
  • 0:26 - 0:27
    Те биват измервани в хиляди.
  • 0:27 - 0:31
    Заплатите са 35 000; 50 000; 50 000; 50 000; 56 000;
  • 0:31 - 0:35
    двама изкарват по 60 000; един изкарва 75 000 и един изкарва 250 000.
  • 0:35 - 0:37
    Последният доста добре се справя.
  • 0:37 - 0:41
    Компютърът извежда няколко параметъра,
  • 0:41 - 0:43
    въз основа на тази информация тук.
  • 0:43 - 0:47
    Той изважда два типични показателя
    за централна тенденция.
  • 0:47 - 0:50
    Средната стойност е приблизително 76,2.
  • 0:50 - 0:53
    Компютърът я изчислява,
    като събира всички тези
  • 0:53 - 0:56
    числа, тези девет числа,
    и после ги дели на девет,
  • 0:56 - 1:00
    а медианата е 56, тя е
    много лесна за изчисляване.
  • 1:00 - 1:02
    Просто подреждаш
    числата и взимаш
  • 1:02 - 1:05
    числото по средата, което тук е 56.
  • 1:05 - 1:08
    Сега искам да поставиш
    това видео на пауза
  • 1:08 - 1:10
    и да помислиш върху
    този набор данни.
  • 1:10 - 1:14
    За тази група заплати
  • 1:14 - 1:19
    кой показател за централна тенденция
    е по-добър?
  • 1:19 - 1:21
    Нека помислим върху това.
  • 1:21 - 1:24
    Ще направя една линия тук.
  • 1:24 - 1:26
    Ще направя схема на информацията си,
    за да я разберем по-добре,
  • 1:26 - 1:28
    така че да не виждаме
    нещата само като числа,
  • 1:28 - 1:31
    но и да видим къде тези числа се
  • 1:31 - 1:33
    намират едно спрямо друго.
  • 1:33 - 1:35
    Нека това е нула.
  • 1:35 - 1:41
    Да кажем, че това е едно, две,
    три, четири, пет.
  • 1:42 - 1:47
    Това ще е 350, това е 50,
    100, 150, 200, 200.
  • 1:52 - 1:53
    Да видим.
  • 1:53 - 1:56
    Да кажем, че ако това е 50,
    тогава това
  • 1:56 - 1:59
    тук ще е приблизително 40.
  • 1:59 - 2:04
    Това ще е около 60, 70, 80, 90.
  • 2:04 - 2:06
    Можех да направя това
    малко по-спретнато,
  • 2:06 - 2:07
    60, 70, 80, 90.
  • 2:09 - 2:12
    Нека разчистя малко повече тук.
  • 2:12 - 2:14
    Това ето тук ще е
  • 2:14 - 2:17
    малко по-близо до това.
  • 2:18 - 2:22
    Нека го направя правилно.
  • 2:22 - 2:26
    Това е 40, а това ще е 30, 20, 10.
  • 2:27 - 2:29
    Така е доста добре.
  • 2:29 - 2:30
    Нека нанесем тази информация.
  • 2:30 - 2:34
    Един ученик изкарва 35 000,
    което е ето тук.
  • 2:36 - 2:38
    Трима изкарват 50 000,
  • 2:38 - 2:40
    така че имаме едно, две, три.
  • 2:42 - 2:44
    Ще го направя така.
  • 2:44 - 2:48
    Един изкарва 56 000,
    което го поставя ето тук.
  • 2:50 - 2:53
    Двама изкарват по 60 000,
  • 2:53 - 2:55
    което е ето така.
  • 2:55 - 2:58
    Един изкарва 75 000,
    това е 60, 70, 75 000.
  • 3:00 - 3:02
    Това ще е някъде тук.
  • 3:02 - 3:04
    А един изкарва 250 000.
  • 3:04 - 3:08
    Една заплата е чак тук.
  • 3:08 - 3:11
    После, когато пресметнем
    средната стойност като 76,2
  • 3:11 - 3:13
    и като мярка за
    нашата централна тенденция,
  • 3:13 - 3:15
    76,2 е ето тук.
  • 3:17 - 3:21
    Добро ли е това измерване
    на централната тенденция?
  • 3:21 - 3:23
    Не ми се струва така,
  • 3:23 - 3:26
    понеже нашето измерване за централната тенденция
    е по-високо от всички
  • 3:26 - 3:30
    тези стойности, освен една,
    и причината за това е,
  • 3:30 - 3:34
    че информацията ни е изкривена
  • 3:34 - 3:37
    значително от тази стойност
    от 250 000 долара.
  • 3:39 - 3:41
    Тя е толкова далеч
    от останалото разпределение,
  • 3:41 - 3:45
    от останалата информация,
    че е изкривила средната стойност
  • 3:45 - 3:47
    и това е нещо, което
    може да се види като цяло.
  • 3:47 - 3:50
    Ако имаш изкривена информация
    и особено неща като
  • 3:50 - 3:53
    информация за заплата,
    където повечето хора изкарват
  • 3:53 - 3:56
    50, 60, 70 000 долара, но някой
    може да изкарва два милиона долара,
  • 3:56 - 4:00
    това ще изкриви
    средната стойност,
  • 4:00 - 4:02
    когато ги събереш и
    разделиш на броя
  • 4:02 - 4:03
    стойности, които имаш.
  • 4:03 - 4:06
    В този случай, особено, когато
    имаш стойности, които
  • 4:06 - 4:10
    биха изкривили средната стойност,
    медианата е много по-ясна.
  • 4:10 - 4:14
    Медианата 56 стои ето тук,
    което изглежда
  • 4:14 - 4:17
    много по-показателно за
    централната тенденция.
  • 4:17 - 4:19
    Замисли се.
  • 4:19 - 4:22
    Дори ако изкарваш толкова,
    вместо 250 000,
  • 4:22 - 4:26
    ако правиш 250 милиона долара,
  • 4:26 - 4:29
    което е огромна сума пари,
  • 4:29 - 4:33
    то ще изкриви изключително много средната стойност,
  • 4:33 - 4:36
    но няма да промени медианата,
  • 4:36 - 4:37
    понеже за медианата няма значение
  • 4:37 - 4:39
    колко голямо е това число.
  • 4:39 - 4:40
    Може да е милиард долара.
  • 4:40 - 4:42
    Може да е квадрилион (10 на степен 15) долара.
  • 4:42 - 4:44
    Медианата ще си остане същата.
  • 4:44 - 4:46
    Така че медианата е много по-ясна,
  • 4:46 - 4:48
    ако имаш изкривен набор данни.
  • 4:48 - 4:52
    Средната стойност има малко повече
    смисъл, ако имаш симетричен
  • 4:52 - 4:55
    набор данни или ако имаш неща, които са
  • 4:55 - 4:57
    приблизително над и под средната стойност,
  • 4:57 - 5:00
    или нещата не са изкривени
    изключително много в една посока,
  • 5:00 - 5:01
    особено от малко точки
  • 5:01 - 5:04
    информация, както тук.
  • 5:04 - 5:07
    В този пример медианата е много
  • 5:07 - 5:10
    по-добро измерване за централната тенденция.
  • 5:10 - 5:11
    А какво да кажем за разсейването?
  • 5:11 - 5:14
    Може да си помислиш, че вече казах,
  • 5:14 - 5:16
    че средната стойност не е толкова добра
  • 5:16 - 5:18
    и стандартното отклонение
    се базира на средната стойност.
  • 5:18 - 5:22
    Вземаш всяка една от тези точки
    информация, намираш разстоянието им
  • 5:22 - 5:25
    от средната стойност, повдигаш
    числото на квадрат, събираш тези
  • 5:25 - 5:28
    повдигнати на квадрат отклонения,
    разделяш на броя точки информация, ако
  • 5:28 - 5:31
    това е стандартно отклонение на извадка,
  • 5:31 - 5:35
    а после намираш корен квадратен
    от цялото това нещо.
  • 5:35 - 5:38
    След като това се базира на
    средната стойност, която не е добро
  • 5:38 - 5:41
    измерване за централната тенденция в тази ситуация,
  • 5:41 - 5:45
    това също ще изкриви и
    стандартното отклонение.
  • 5:45 - 5:48
    Това ще е много по-голямо,
  • 5:48 - 5:50
    отколкото ако погледнеш реалния случай,
  • 5:50 - 5:53
    когато искаш индикация за разсейването.
  • 5:53 - 5:57
    Имаш тази една точка информация, която е много далече
  • 5:57 - 6:00
    от средната стойност или от медианата, в зависимост как
  • 6:00 - 6:02
    си го представяш, но повечето точки информация изглеждат
  • 6:02 - 6:05
    доста по-приближени, така че за тази ситуация,
  • 6:05 - 6:07
    не само използваме медианата,
  • 6:07 - 6:11
    но интерквартилният размах
    също дава по-ясна оценка.
  • 6:11 - 6:13
    Как пресмятаме интерквартилния размах ?
  • 6:13 - 6:15
    Взимаме медианата и взимаме долната
  • 6:15 - 6:19
    група числа и пресмятаме тяхната медиана.
  • 6:19 - 6:22
    Това тук е 50, а после взимаме горната
  • 6:22 - 6:25
    група числа
  • 6:25 - 6:29
    и те са 60 и 75, като медианата е 67,5.
  • 6:29 - 6:31
    Ако това не ти изглежда познато,
    имаме много видеа
  • 6:31 - 6:33
    за интерквартилен размах
    и пресмятане
  • 6:33 - 6:35
    на стандартно отклонение, и за медиана, и за средна стойност.
  • 6:35 - 6:36
    Това е нещо като преговор.
  • 6:36 - 6:39
    И разликата между тези двете е 17,5.
  • 6:39 - 6:43
    Забележи, разстоянието
    между тези две стойности е 17,5.
  • 6:43 - 6:45
    Това няма да се промени,
  • 6:45 - 6:48
    дори ако това е
    250 милиарда долара.
  • 6:48 - 6:52
    Отново, и двата показателя
    са по-ясни,
  • 6:52 - 6:55
    когато имаш
    изкривен набор данни.
  • 6:56 - 6:59
    Това, което трябва да запомниш тук е, че средната стойност и стандартното отклонение
  • 6:59 - 7:02
    не са лоши, ако имаш приблизително
    симетричен набор данни,
  • 7:02 - 7:05
    ако нямаш значителни големи
    разлики в стойностите,
  • 7:05 - 7:07
    неща, които наистина
    изкривяват набора данни,
  • 7:07 - 7:10
    средната стойност и стандартното отклонение
    могат да са доста надеждни.
  • 7:10 - 7:13
    Но ако гледаш нещо, което
    може доста да бъде
  • 7:13 - 7:16
    изкривено от няколко стойности,
  • 7:16 - 7:19
    медианата и интерквартилният размах, медианата за централната тенденция,
  • 7:19 - 7:23
    а интерквартилният размах за разсейването
    около тази централна тенденция.
  • 7:23 - 7:26
    Затова, когато хората говорят за заплати,
  • 7:26 - 7:28
    те често говорят за медиани,
    понеже може да има
  • 7:28 - 7:30
    някои твърде различни стойности на заплатите,
    особено в горния край.
  • 7:30 - 7:32
    Когато говорим за неща като
    цени на домове, ще видиш,
  • 7:32 - 7:35
    че медианата по-често бива пресмятана,
    отколкото средната стойност,
  • 7:35 - 7:39
    понеже цените на домовете
    в даден квартал
  • 7:39 - 7:42
    или град, цените на къщите
    могат да са около 200 000
  • 7:42 - 7:46
    или 300 000 долара,
    но може да има едно огромно имение,
  • 7:46 - 7:49
    което е 100 милиона долара и
    ако пресметнеш средната стойност,
  • 7:49 - 7:52
    това ще се изкриви и ще даде
    фалшива представа за средната
  • 7:52 - 7:56
    или централната тенденция
    на цените в този град.
Title:
Средна стойност и стандартно отклонение или медиана и интерквартилен размах
Description:

Научи се да избираш "предпочитаните" мерки за централна тенденция и разсейване, когато в набор от данни има големи отклонения.

Виж повече уроци и се упражнявай на
http://www.khanacademy.org/math/ap-statistics/summarizing-quantitative-data-ap/measuring-spread-quantitative/v/mean-and-standard-deviation-versus-median-and-iqr?utm_source=youtube&utm_medium=desc&utm_campaign=apstatistics

more » « less
Video Language:
English
Team:
Khan Academy
Duration:
07:59

Bulgarian subtitles

Revisions Compare revisions