< Return to Video

Examples analyzing clusters, gaps, peaks and outliers for distributions

  • 0:00 - 0:06
    여러 예제를 풀어보며
    분포의 특징인 군집, 변량이 없는 계급
  • 0:06 - 0:08
    정상점, 이상치에 대해 알아봅시다
  • 0:08 - 0:17
    아래 분포를 올바르게 설명한 것을
    모두 골라 보세요
  • 0:17 - 0:20
    첫 번째 문장은 분포는
    이상치가 있다는 것입니다
  • 0:20 - 0:25
    분포의 이상치란
    다른 자료보다 어떤 한 부분이
  • 0:25 - 0:30
    비정상적으로 크거나
    작은 값을 말합니다
  • 0:30 - 0:34
    분포를 보면 0에서 6사이에
    자료가 많이 몰려 있죠
  • 0:34 - 0:42
    이 분포는 Gorg의 상점에 있는
    사과의 유통기한을 나타낸 것입니다
  • 0:42 - 0:50
    예를 들어 여기 사과 7개는
    유통기한이 0일이므로
  • 0:50 - 0:53
    곧 상할 거예요
  • 0:53 - 0:59
    다음 사과 8개는
    하루 동안 싱싱할 것이고
  • 0:59 - 1:03
    사과 두 개는 6일 동안
    싱싱할 것입니다
  • 1:03 - 1:05
    그런데 사과 한 개가
    유통기한이 유독 기네요
  • 1:05 - 1:08
    유통기한이 10일이나 됩니다
  • 1:08 - 1:10
    다른 사과의 유통기한과
    멀리 떨어져 있어요
  • 1:10 - 1:15
    이렇게 혼자서만 비정상적으로
    값이 큰 것을 이상치라고 합니다
  • 1:15 - 1:18
    여기 단 한 개의 사과만
    가장 오른쪽에 위치하며
  • 1:18 - 1:22
    지나치게 유통기한이 길기 때문에
    이상치라고 할 수 있어요
  • 1:22 - 1:24
    이게 바로 이상치가 되겠죠
  • 1:24 - 1:28
    두 번째 문장은 분포가 4일에서 6일
    사이에 군집해있다는 내용입니다
  • 1:28 - 1:30
    실제로 분포에서 자료는
    4일에서 6일까지 군집해있습니다
  • 1:30 - 1:35
    군집이란 그 범위 내의 값끼리
    묶은 것을 말하며
  • 1:35 - 1:38
    유통기한이 4일에서 6일인 사과를
    하나로 묶은 것이 군집이 됩니다
  • 1:38 - 1:40
    도표를 보면 4일에서 6일 사이에
    값들이 군집해있죠
  • 1:40 - 1:43
    보기 둘 다 정답이므로
  • 1:43 - 1:46
    '둘 다 아니다'라는 세 번째 문장은
    틀렸습니다
  • 1:46 - 1:50
    다음 문제를 볼까요?
  • 1:50 - 1:57
    아래 분포를 올바르게 설명한 것을
    모두 골라 보세요
  • 1:57 - 2:02
    첫 번째 문장을 봅시다
    '분포에는 이상치가 있다'
  • 2:02 - 2:05
    분포를 보면 가장 높은 온도에
    값이 하나 있고
  • 2:05 - 2:08
    가장 낮은 온도에도
    값이 하나 있지만
  • 2:08 - 2:12
    이 값들과 멀리 떨어져 있는 값은
    찾을 수 없습니다
  • 2:12 - 2:15
    값이 분포의 오른쪽
    바깥에 있다고 생각하면
  • 2:15 - 2:18
    오른쪽에 있는
    이상치가 될 것이고
  • 2:18 - 2:22
    왼쪽 바깥에 있다면
    왼쪽에 있는 이상치가 될 거예요
  • 2:22 - 2:24
    하지만 이 분포에는
    이상치가 될 만한 값이 없습니다
  • 2:24 - 2:28
    값들이 모두 군집되어 있습니다
  • 2:28 - 2:31
    따라서 이 분포에는
    이상치는 없습니다
  • 2:31 - 2:35
    두 번째 문장은 이 분포의
    정상은 22도입니다
  • 2:35 - 2:38
    먼저 이 분포는 에지톤시의
    7월 동안
  • 2:38 - 2:43
    가장 높았던 온도를
    나타내고 있습니다
  • 2:43 - 2:51
    분포를 보면 7월 중 최고 온도가
    섭씨 22도였던 날이 가장 많으므로
  • 2:51 - 2:56
    이것이 정상점이 됩니다
  • 2:56 - 3:00
    이것을 산이라고 본다면
    여기가 가장 높은 곳이 되는 거예요
  • 3:00 - 3:07
    온도가 섭씨 22도였던 날 수가
    가장 많으므로
  • 3:07 - 3:09
    섭씨 22도가 정상점이 되겠죠
  • 3:09 - 3:12
    두 번째 문장이 정답입니다
  • 3:12 - 3:14
    다음 문제를 풀어 볼까요?
  • 3:14 - 3:18
    아래 분포도를 올바르게 설명한 것을
    모두 골라 보세요
  • 3:18 - 3:22
    첫 번째 문장은 분포도에
    이상치가 있다는 것입니다
  • 3:22 - 3:25
    이 분포도는
    Seth의 샌드위치 가게에
  • 3:25 - 3:29
    하루 동안 오는 고객의 수를
    나타내고 있습니다
  • 3:29 - 3:36
    고객이 0명에서
    19명 사이였던 날이나
  • 3:36 - 3:39
    20명에서 39명 사이였던 날은
    없었습니다
  • 3:39 - 3:42
    고객이 40명에서
    59명 사이였던 날은 9일이고
  • 3:42 - 3:46
    고객이 60명에서
    79명 사이였던 날은 20일이었습니다
  • 3:46 - 3:49
    그리고 고객이 180명에서
    199명 사이였던 날은
  • 3:49 - 3:51
    8일 정도였습니다
  • 3:51 - 3:55
    이상치를 찾아야 하는데
  • 3:55 - 3:58
    고객의 수가 특별하게
    많거나 적은 날이 없습니다
  • 3:58 - 4:02
    예를 들자면 하루에 고객이
    500명 정도가 온 날은 없습니다
  • 4:02 - 4:06
    따라서 이 분포에는
    이상치는 없습니다
  • 4:06 - 4:09
    두 번째 문장은 분포가 0명에서
    39명 사이에 군집해 있다는 것입니다
  • 4:09 - 4:12
    분포를 보면
  • 4:12 - 4:17
    고객이 0명에서 39명 사이였던
    날은 하루도 없습니다
  • 4:17 - 4:21
    0명에서 19명 사이나
    20명에서 39명 사이도 마찬가지예요
  • 4:21 - 4:28
    40명에서 199명 사이에는 자료가
    군집해 있지만
  • 4:28 - 4:31
    고객이 0명에서 39명 사이였던 날은
    없기 때문에
  • 4:31 - 4:34
    군집해 있다고 볼 수 없습니다
  • 4:34 - 4:38
    따라서 답은 둘 다 아님을
    알 수 있습니다
  • 4:38 - 4:42
    아래 분포를 올바르게 설명한 것을
    모두 골라 보세요
  • 4:42 - 4:51
    첫 번째 문장은 분포의 정상점이
    12와 13 사이에 있다는 것입니다
  • 4:51 - 4:55
    이 분포는 Frine 선생님 반 학생들의
    시험 성적을 나타내고 있습니다
  • 4:55 - 5:01
    20점 만점에서 0에서 1점 사이의
    점수를 받은 학생이 한 명 있습니다
  • 5:01 - 5:05
    즉 20문제 중에 0문제 또는
    1문제를 맞췄다는 뜻입니다
  • 5:05 - 5:10
    2에서 3점, 4에서 5점, 6에서 7점을
    받은 학생은 한 명도 없고
  • 5:10 - 5:12
    8에서 9점을 맞은 학생은
    한 명이고
  • 5:12 - 5:15
    10에서 11점을 맞은 학생은
    3명입니다
  • 5:15 - 5:17
    계속 값이 증가합니다
  • 5:17 - 5:25
    16에서 17점을 맞은 학생이
    12명이고
  • 5:25 - 5:29
    18에서 19점인 학생이
    약 10명 정도 있습니다
  • 5:29 - 5:34
    정상점이 12점과
    13점 사이에 있나요?
  • 5:34 - 5:38
    12와 13점 사이에는 5명이 있지만
    정상점은 될 수 없습니다
  • 5:38 - 5:43
    14에서 15점을 받은
    학생 수가 더 많기 때문이죠
  • 5:43 - 5:46
    이것을 산이라고 본다면
    여기는 정상점이 될 수 없습니다
  • 5:46 - 5:50
    이 분포도의 정상점은
  • 5:50 - 5:53
    학생 수가 가장 많은 구간인
    16점과 17점 사이입니다
  • 5:53 - 5:55
    12에서 13점 사이는
    정상점이 아니므로
  • 5:55 - 5:57
    첫 번째 문장은 답이 아닙니다
  • 5:57 - 6:00
    두 번째 문장은 이 분포도에
    이상치가 있다는 것입니다
  • 6:00 - 6:03
    여기 왼쪽에 이상치가 있죠
  • 6:03 - 6:06
    대부분 8에서 19점 사이에
    값이 몰려있는데
  • 6:06 - 6:10
    값 한 개만 0에서 1점 사이에요
  • 6:10 - 6:13
    따라서 이것이 이상치가 됩니다
  • 6:13 - 6:16
    혼자 다른 값들과 동떨어져 있는 것을
    눈으로 확인할 수 있습니다
  • 6:16 - 6:18
    왼쪽이든 오른쪽이든
  • 6:18 - 6:22
    비정상적으로 크거나 작은 값은
    이상치가 됩니다
  • 6:22 - 6:25
    따라서 이 분포도는
    이상치를 가지고 있습니다
  • 6:25 - 6:29
    두 번째 문장이 정답입니다
  • 6:29 - 6:31
    끝났습니다
Title:
Examples analyzing clusters, gaps, peaks and outliers for distributions
Description:

more » « less
Video Language:
English
Team:
Khan Academy
Duration:
06:32

Korean subtitles

Revisions