< Return to Video

Examples analyzing clusters, gaps, peaks and outliers for distributions

  • 0:00 - 0:02
    В това видео искам да реша няколко
    примера, като разгледам
  • 0:02 - 0:05
    разпределението и
    различните му характеристики,
  • 0:05 - 0:08
    като струпвания, празнини и върхове.
  • 0:08 - 0:11
    Тук искам да решим няколко примера.
  • 0:11 - 0:13
    Кои от следните са верни описания
  • 0:13 - 0:15
    на разпределението по-долу?
  • 0:15 - 0:17
    Избери всички верни отговори.
  • 0:17 - 0:20
    Първото твърдение гласи, че
    разпределението има отдалечена точка.
  • 0:20 - 0:23
    Отдалечена точка е точка с данни,
    която е на голямо разстояние
  • 0:23 - 0:25
    от мястото, на което се намират другите точки с данни.
  • 0:25 - 0:27
    Тя има по-голяма или по-малка стойност и е на разстояние
  • 0:27 - 0:29
    от мястото, на което са струпани
  • 0:29 - 0:31
    всички останали точки с данни, и ако погледнем тук,
  • 0:31 - 0:34
    имаме много точки с данни между 0 и 6.
  • 0:34 - 0:36
    Нека само помислим какво измерват те:
  • 0:36 - 0:38
    това е срокът на годност на всяка ябълка
  • 0:38 - 0:42
    в магазина на Гордж.
  • 0:42 - 0:45
    Например виждаме, че има 1, 2, 3, 4,
  • 0:45 - 0:50
    5, 6, 7 ябълки, които имат срок на годност
  • 0:50 - 0:53
    0 дни, така че (смях), те ще се развалят.
  • 0:53 - 0:57
    Виждаш, че имаш 1, 2, 3, 4, 5, 6, 7,
  • 0:57 - 0:59
    8 ябълки, които ще бъдат годни още един ден.
  • 0:59 - 1:01
    Имаш 2 ябълки, които ще бъдат годни
  • 1:01 - 1:04
    още 6 дни и имаш една ябълка,
  • 1:04 - 1:06
    която ще бъде годна още 10 дни, като това е необичайно.
  • 1:06 - 1:10
    Това тук е отдалечена точка, тя има много по-голям скор на годност
  • 1:10 - 1:12
    от всички други данни, така че бих казал,
  • 1:12 - 1:14
    че тук определено имаме отдалечена точка.
  • 1:14 - 1:15
    Имаме само тази точка с данни,
  • 1:15 - 1:18
    която се намира толкова надясно, много по-голяма,
  • 1:18 - 1:21
    с много по-дълъг срок на годност от всичко
    друго, така че разпределението определено
  • 1:21 - 1:24
    има отдалечена точка и това ще бъде тази точка.
  • 1:24 - 1:27
    Разпределението има струпване при 4 до 6 дни.
  • 1:27 - 1:30
    Наистина виждаме струпване при 4 до 6 дни.
  • 1:30 - 1:33
    Струпването, както може да си представиш, е групирането на данните,
  • 1:33 - 1:36
    които се намират там, или имаш групиране на ябълки,
  • 1:36 - 1:38
    които имат срок на годност между 4 и 6 дни,
  • 1:38 - 1:40
    като несъмено виждаш това струпване там.
  • 1:40 - 1:42
    Тъй като вече избрах две неща,
  • 1:42 - 1:45
    определено няма да избера "Нито едно от горните".
  • 1:45 - 1:46
    Ще проверя отговора си.
  • 1:46 - 1:50
    Нека решим още няколко от тези задачи.
  • 1:50 - 1:53
    Кои от следните са верни описания
  • 1:53 - 1:54
    на разпределението по-долу?
  • 1:54 - 1:57
    Ще изберем всички, които са верни.
  • 1:57 - 2:00
    Разпределението има отдалечена точка.
  • 2:00 - 2:02
    Нека разгледаме това разпределение.
  • 2:02 - 2:04
    Наистина имам една точка тук, която е накрая
  • 2:04 - 2:07
    и имам още една тук, която е в началото,
  • 2:07 - 2:09
    но нямам никакви точки с данни, които се намират
  • 2:09 - 2:12
    на голямо разстояние над или под всички данни.
  • 2:12 - 2:14
    Ако имах точка с данни, която се намираш тук, тогава да,
  • 2:14 - 2:16
    бих казал, че тя е отдалечена вдясно
  • 2:16 - 2:19
    или отдалечена от другите,
    ако имах точка далеч вляво
  • 2:19 - 2:22
    на екрана тук, може би това щеше да бъде отдалечена точка.
  • 2:22 - 2:23
    Но аз наистина не виждам някоя очевидна отдалечена точка.
  • 2:23 - 2:27
    Всичките данни са доста струпани на едно място.
  • 2:27 - 2:31
    Така че не бих казал, че разпределението има отдалечена точка.
  • 2:31 - 2:35
    Разпределението има връх при 22 градуса.
  • 2:35 - 2:37
    Да, наистина изглежда, че има -
  • 2:37 - 2:38
    като нека само погледнем, какво в действителност измерваме.
  • 2:38 - 2:43
    Височината на температурата всеки ден в Еджъртън, Айова през юли.
  • 2:43 - 2:45
    Наистина изглежда, че имаме най-голям брой
  • 2:45 - 2:49
    дни през юли, които са имали
  • 2:49 - 2:52
    температура 22 градуса по Целзий,
  • 2:52 - 2:56
    така че това е връх.
  • 2:56 - 2:58
    Представи си,
    че това е нещо като планина,
  • 2:58 - 2:59
    това тук е върхът,
    най-високата точка.
  • 2:59 - 3:04
    Имаш, поне на това място, най-голям брой дни
  • 3:04 - 3:07
    с 22 градуса по Целзий.
  • 3:07 - 3:09
    Така че бих казал, че определено имаме връх там.
  • 3:09 - 3:11
    Тъй като избрах нещо, няма да избера
  • 3:11 - 3:12
    "Нито едно от горните".
  • 3:12 - 3:14
    Нека решим още няколко от тези задачи.
  • 3:14 - 3:16
    Кои от следните са верни описания
  • 3:16 - 3:18
    на разпределението по-долу?
  • 3:18 - 3:21
    Първото гласи, че разпределението
    има отдалечена точка.
  • 3:21 - 3:21
    Значи брой посетители на ден
  • 3:22 - 3:26
    в Магазина за сандвичи на Сет.
  • 3:26 - 3:29
    Да видим, най-малко...
  • 3:30 - 3:32
    Няма никакви дни...
  • 3:32 - 3:36
    Няма никакви дни, в които да е имал между 0 и 19 посетители,
  • 3:36 - 3:39
    никакви дни, в които да е имал между 20 и 39 посетители,
  • 3:39 - 3:40
    изглежда, че има около 9 дни,
  • 3:40 - 3:42
    в които е имал между 40 и 59 посетители,
  • 3:42 - 3:46
    изглежда, че около 20 дни е имал между 60 и 79 посетители.
  • 3:46 - 3:48
    Чак до там, където - това изглежда може би като 8 дни -
  • 3:48 - 3:51
    е имал между 180 и 199 посетители.
  • 3:51 - 3:54
    Но относно въпроса за отдалечените точки - не изглежда да има
  • 3:54 - 3:58
    някакъв ден, при който да е имал необичаен брой посетители.
  • 3:58 - 4:00
    Няма никакъв ден, който да се намира чак тук,
  • 4:00 - 4:02
    в който да е имал например 500 посетители.
  • 4:02 - 4:06
    Така че бих казал, че разпределението няма отдалечени точки.
  • 4:06 - 4:09
    Разпределението има струпване от 0 до 39 посетители.
  • 4:09 - 4:14
    И така, от 0 до 39 посетителя са точно ето тук.
  • 4:14 - 4:17
    Нямало е никакви дни, в които той да е имал между 0 и 39 посетителя,
  • 4:17 - 4:20
    нито от 0 до 10, нито от 20 до 39.
  • 4:20 - 4:21
    Така че определено нямаме струпване там.
  • 4:21 - 4:24
    Бих казал, че струпването ще бъде между дните,
  • 4:24 - 4:28
    които се намират между 40 и 199 посетители.
  • 4:28 - 4:30
    Определено не при 0 и 30, не е имало никакви дни,
  • 4:30 - 4:32
    които да са имали от 0 до 39 посетители.
  • 4:32 - 4:36
    Така че бих казал доста уверено - Нито едно от горните.
  • 4:36 - 4:38
    Нека решим още една от тези задачи.
  • 4:38 - 4:40
    Кои от следните са верни описания
  • 4:40 - 4:41
    на разпределението по-долу?
  • 4:41 - 4:42
    (смях) Добре.
  • 4:42 - 4:46
    Разпределението има връх от 12 до 13 точки.
  • 4:46 - 4:51
    Нека видим, какво е измерено тук, за какво се отнасят тези данни.
  • 4:51 - 4:55
    Резултати от изпита на всеки ученик в класа на г-жа Фрайн.
  • 4:55 - 4:58
    Имало е 1 ученик, който е получил между 0 и 1
  • 4:58 - 5:01
    по 20 точкова скала, така че имаме между...
  • 5:01 - 5:05
    Предполагам, че от 20 въпроса, той е получил между 0 и 1 точка.
  • 5:05 - 5:07
    И след това виждаш, че няма никакви ученици,
  • 5:07 - 5:10
    които са получили между 2 и 3 или 4 и 5, или 6 и 7 точки.
  • 5:10 - 5:12
    След това имаме друг ученик, който е получил между 8 и 9,
  • 5:12 - 5:15
    изглежда, че 3 ученици са получили между 10 и 11,
  • 5:15 - 5:16
    и после продължават да растат. Изглежда, че около
  • 5:16 - 5:21
    12 ученици са получили 16 или 17,
  • 5:21 - 5:22
    или нещо между тях може би,
  • 5:22 - 5:25
    ако можеш да получиш
    дробен израз за точките на изпита.
  • 5:25 - 5:29
    И след това изглежда, че 10 ученици са получили от 18 до 19.
  • 5:29 - 5:32
    Добре, тук се казва, че разпределението има връх
  • 5:32 - 5:36
    от 12 до 13 точки.
  • 5:36 - 5:38
    Там е имало 5 ученици, но това не е върхът.
  • 5:38 - 5:41
    Ако се придвижиш до 14 -15 точки, там вече имаш повече ученици.
  • 5:41 - 5:42
    Така че това определено не е връх.
  • 5:42 - 5:44
    Ако разглеждаш това като някакъв вид планина,
  • 5:44 - 5:46
    определено нямаше да опишеш тази точка като връх.
  • 5:46 - 5:48
    Щеше да кажеш, че разпределението има връх,
  • 5:48 - 5:49
    има най-голям брой ученици,
  • 5:49 - 5:51
    които са получили между 16 и 17 точки,
  • 5:51 - 5:54
    така че това там е върхът, а не от 12 до 13 точки.
  • 5:54 - 5:57
    Значи няма да избера първия отговор.
  • 5:57 - 6:00
    Разпределението има отдалечена точка.
  • 6:00 - 6:01
    Ами да, виж това. Имаш тази отдалечена точка.
  • 6:01 - 6:05
    Повечето ученици са получили между 8 и 19 точки,
  • 6:05 - 6:07
    а после имаш този единствен ученик,
  • 6:07 - 6:09
    който е получил от 0 до 1, това наистина е отдалечена точка.
  • 6:09 - 6:11
    Ти дори го виждаш нагледно,
  • 6:11 - 6:14
    тя дори не е свързана с останалата част от разпределението.
  • 6:14 - 6:15
    Тя се намира далеч вляво.
  • 6:15 - 6:17
    Ако нещо е далеч вляво или далеч вдясно,
  • 6:17 - 6:22
    то е отдалечена точка, ако е необичано ниско, или необичано високо.
  • 6:22 - 6:24
    Бих казал, че това разпределение определено
  • 6:24 - 6:26
    има отдалечена точка и няма да избера "Нито едно от горните",
  • 6:26 - 6:28
    тъй като намерих отговор.
  • 6:29 - 6:31
    Мисля, че свършихме.
Title:
Examples analyzing clusters, gaps, peaks and outliers for distributions
Description:

more » « less
Video Language:
English
Team:
Khan Academy
Duration:
06:32

Bulgarian subtitles

Revisions