< Return to Video

ANOVA 3-Hypothesis Test with F-Statistic

  • 0:00 - 0:06
    지난 동영상들에서
    여기 9개 측정점의 총 변화량
  • 0:06 - 0:10
    그러니까 총 제곱합이
    30이라고 계산하였습니다
  • 0:10 - 0:15
    그리고 그 변화량 중 얼마가
    집합 내의 변화량 때문이며
  • 0:15 - 0:20
    얼마가 집합 간의
    변화량 때문인지 알아보았습니다
  • 0:20 - 0:25
    집합 내의 변화량 SSW는 6이었고
  • 0:25 - 0:27
    집합 내의 변화량 SSW는 6이었고
  • 0:27 - 0:33
    30의 나머지인 집합 간의 변화량
    SSB는 24였습니다
  • 0:33 - 0:36
    30의 나머지인 집합 간의 변화량
    SSB는 24였습니다
  • 0:36 - 0:39
    30의 나머지인 집합 간의 변화량
    SSB는 24였습니다
  • 0:39 - 0:45
    이 동영상에서는 여기서
    계산한 통계량같은 정보를
  • 0:45 - 0:49
    추리통계를 이용해
  • 0:49 - 0:53
    결론을 내릴 수 있는지 알아보는
    방법을 살펴보겠습니다
  • 0:53 - 0:57
    먼저 이 집합에 의미를 부여해 볼까요?
  • 0:57 - 0:59
    여태까지 임의의 집합을
    사용해 왔는데
  • 0:59 - 1:03
    상상력을 발휘해서
    어떤 실험의 결과라고 해 보죠
  • 1:03 - 1:10
    사람들에게
    음식 세 종류를 먹이고
  • 1:10 - 1:14
    시험을 보았는데
    이런 결과를 얻었습니다
  • 1:14 - 1:27
    1번 음식, 2번 음식, 3번 음식이라 하고
  • 1:27 - 1:33
    먹은 음식이 시험 점수에
    영향을 주는지 알아보고 싶다고 합시다
  • 1:33 - 1:41
    평균을 보면 3번 집합은 2번,1번 집합
    보다 더 잘 한 것 같은데
  • 1:41 - 1:44
    이 차이가 순수히 우연일 수 있을까요?
  • 1:44 - 1:51
    아니면 정말 1번, 2번, 3번
    음식을 먹을 모든 사람의 모평균에
  • 1:51 - 1:56
    차이가 있는 것이라고
    신뢰할 수 있을까요?
  • 1:56 - 2:04
    이 평균이 실제 모평균과
    같은지 물어보는 것과 같습니다
  • 2:04 - 2:10
    여기 평균은 표본 3개를
    기반으로한 표본평균인데
  • 2:10 - 2:17
    1번 음식을 먹은 모평균과
    2번 음식을 먹은 모평균이 같을까요?
  • 2:17 - 2:22
    당연히 이 세상 모든 사람에게
  • 2:22 - 2:26
    두 음식을 먹이고
    시험을 보게 할 순 없겠지만
  • 2:26 - 2:30
    어떤 실제 평균은 존재합니다
    단지 측정할 수 없는 것이죠
  • 2:30 - 2:36
    그러면 이것과 이것 그리고
    3번 집합의 실제 모평균은 같을까요?
  • 2:36 - 2:39
    그러면 이것과 이것 그리고
    3번 집합의 실제 모평균은 같을까요?
  • 2:39 - 2:48
    같지 않다면 먹음 음식이 시험 결과에
    어떤 영향을 끼친다는 것입니다
  • 2:48 - 2:50
    같지 않다면 먹음 음식이 시험 결과에
    어떤 영향을 끼친다는 것입니다
  • 2:50 - 2:52
    그러면 가설검정을 해보죠
  • 2:52 - 2:59
    귀무가설은 평균이 같다는 것입니다
    다른 말로는
  • 2:59 - 3:11
    음식은 영향을 끼치지 않는다는 말이죠
  • 3:11 - 3:17
    그리고 대립가설은 영향을
    끼친다는 것입니다
  • 3:17 - 3:19
    그리고 영향을 끼치지 않을 때는
  • 3:19 - 3:21
    세 집합의 모평균이 같은 것을
    관찰할 수 있을 것입니다
  • 3:21 - 3:24
    세 집합의 모평균이 같은 것을
    관찰할 수 있을 것입니다
  • 3:24 - 3:29
    그렇다면 1번 음식을 먹은 집합의
    실제 모평균이
  • 3:29 - 3:33
    2번 음식을 먹은 집합의
    실제 모평균이 같고
  • 3:33 - 3:35
    3번 음식을 먹은 집합의
    실제 모평균과도 같을 것입니다
  • 3:35 - 3:41
    대립가설이 맞다면
    이 평균들은 같지 않을 것이고요
  • 3:41 - 3:43
    어떻게 가설검정을 할까요?
  • 3:43 - 3:47
    일단 항상 가설검정할 때 그랬듯이
    귀무가설을 가정합니다
  • 3:47 - 3:50
    일단 항상 가설검정할 때 그랬듯이
    귀무가설을 가정합니다
  • 3:50 - 3:53
    일단 항상 가설검정할 때 그랬듯이
    귀무가설을 가정합니다
  • 3:53 - 3:56
    그리고 이만큼 극단적인
    어떤 통계량을 얻을 확률을 알아봅니다
  • 3:56 - 3:59
    그리고 이만큼 극단적인
    어떤 통계량을 얻을 확률을 알아봅니다
  • 3:59 - 4:01
    아직 그 통계량이 무엇인지는
    정하지 않았습니다
  • 4:01 - 4:05
    그럼 귀무가설을 가정하고
    F-통계량이란 것을 계산해 보죠
  • 4:05 - 4:09
    그럼 귀무가설을 가정하고
    F-통계량이란 것을 계산해 보죠
  • 4:09 - 4:12
    F-통계량은
  • 4:12 - 4:17
    F-분포를 가지고 있습니다
    분포에 대해 자세히 설명하진 않겠지만
  • 4:17 - 4:19
    자유도가 다르거나 같은
  • 4:19 - 4:24
    두 카이제곱분포의 비율이라고
    생각할 수 있습니다
  • 4:24 - 4:32
    이 경우 F-통계량은
    표본 간의 제곱합 SSB를
  • 4:32 - 4:38
    이 경우 F-통계량은
    표본 간의 제곱합 SSB를
  • 4:38 - 4:42
    그 자유도로 나누고
  • 4:42 - 4:48
    이것을 MSB라고 부르기도 합니다
  • 4:48 - 4:52
    SSW로 다시 나누어 준 후
  • 4:52 - 4:56
    SSW로 다시 나누어 준 후
  • 4:56 - 5:01
    SSW로 다시 나누어 준 후
  • 5:01 - 5:09
    SSW의 자유도, m(n -1)로 나눕니다
  • 5:09 - 5:12
    이것이 무엇을 의미할까요?
  • 5:12 - 5:18
    분자가 분모보다 훨씬 크다면
  • 5:18 - 5:27
    이 자료의 변화량은 대부분
  • 5:27 - 5:32
    평균 내의 변화량보다
    평균 간의 차 때문입니다
  • 5:32 - 5:36
    평균 내의 변화량보다
    평균 간의 차 때문입니다
  • 5:36 - 5:41
    여기 분자가 분모보다 클 때 말이죠
  • 5:41 - 5:44
    그렇다면 실제 모평균에
    차이가 있다고 믿을 수 있을 것입니다
  • 5:44 - 5:46
    그렇다면 실제 모평균에
    차이가 있다고 믿을 수 있을 것입니다
  • 5:46 - 5:49
    이 수가 아주 크다면
  • 5:49 - 5:51
    귀무가설이 맞을 확률이
    낮다고 알 수 있습니다
  • 5:51 - 5:54
    귀무가설이 맞을 확률이
    낮다고 알 수 있습니다
  • 5:54 - 5:59
    만약 분모가 더 커서 수가 작아진다면
  • 5:59 - 6:02
    각 표본 내의 변화량이
  • 6:02 - 6:05
    총 변화량에 표본 간 변화량보다
    더 큰 기여를 하는 것이고
  • 6:05 - 6:07
    총 변화량에서 표본 내 변화량의 백분율이
    표본 간 변화량보다 큰 것이죠
  • 6:07 - 6:13
    총 변화량에서
    표본 내 변화량의 백분율이
  • 6:13 - 6:15
    표본 간 변화량보다 큰 것이죠
  • 6:15 - 6:18
    그렇다면 관찰한 평균 간 차이는
    아마 우연이라고 생각할 수 있습니다
  • 6:18 - 6:21
    그렇다면 관찰한 평균 간 차이는
    아마 우연이라고 생각할 수 있습니다
  • 6:21 - 6:25
    귀무가설을 기각하기 힘들겠죠
  • 6:25 - 6:27
    그럼 계산해 봅시다
  • 6:27 - 6:35
    이 경우 SSB는 24
  • 6:35 - 6:39
    자유도는 2였습니다
  • 6:39 - 6:50
    SSW는 6에 자유도가 6이었고요
  • 6:50 - 6:53
    SSW는 6에 자유도가 6이었고요
  • 6:53 - 7:00
    24/2는 12이고 다시 1로 나누면
  • 7:00 - 7:04
    F-통계량은 12입니다
  • 7:04 - 7:12
    F는 피셔(Fisher)라는 생물학자이자
    통계학자의 이름에서 딴 것입니다
  • 7:12 - 7:15
    F-통계량은 12이고요
  • 7:15 - 7:18
    꽤 큰 수 같아 보이네요
  • 7:18 - 7:20
    그리고 모든 가설검정에는
  • 7:20 - 7:22
    어떤 유의수준이 필요합니다
  • 7:22 - 7:25
    이 가설검정에서 사용할
    유의수준은 10%라고 할게요
  • 7:25 - 7:28
    이 가설검정에서 사용할
    유의수준은 10%라고 할게요
  • 7:28 - 7:31
    0.10입니다
  • 7:31 - 7:35
    귀무가설을 가정했을 때
  • 7:35 - 7:40
    계산한 이 F-통계량을 얻을 확률이
    10%이하라면
  • 7:40 - 7:42
    계산한 이 F-통계량을 얻을 확률이
    10%이하라면
  • 7:42 - 7:45
    귀무가설을 기각한다는 뜻입니다
  • 7:45 - 7:49
    그럼 이제 그 값이나
    그 이상 극값을 얻을 확률이
  • 7:49 - 7:54
    10%인 임계점의 F-통계량을 찾고
  • 7:54 - 7:57
    그 값이 여기 있는
    F-통계량의 값보다 크다면
  • 7:57 - 8:00
    귀무가설을 기각합니다
  • 8:00 - 8:01
    그렇지 않다면 귀무가설을
    기각할 수 없죠
  • 8:01 - 8:06
    F-통계량에 대해 심도있게
    설명하지는 않겠지만
  • 8:06 - 8:11
    이미 각 제곱합이 카이제곱분포를
    갖고 있음을 알 수 있습니다
  • 8:11 - 8:13
    이것도 카이제곱분포를 갖고
  • 8:13 - 8:15
    이것은 다른
    카이제곱분포를 가집니다
  • 8:15 - 8:18
    위의 것은 자유도가 2인
    카이제곱분포이고
  • 8:18 - 8:21
    밑에 것은 자유도가 6인
    카이제곱분포입니다
  • 8:21 - 8:24
    둘 다 정규화 하진 않았지만
    거의 그렇죠
  • 8:24 - 8:30
    따라서 F-통계량은
    두 카이제곱분포의 비율입니다
  • 8:30 - 8:34
    이것은 UCLA 교수님의 강의 자료인데
  • 8:34 - 8:39
    여기서 사용해도 괜찮겠죠?
  • 8:39 - 8:41
    어쨋든 F-분포는 이렇게 생겼습니다
  • 8:41 - 8:43
    당연히 분자와 분모의 자유도에 따라
    다르게 생겼겠죠
  • 8:43 - 8:47
    당연히 분자와 분모의 자유도에 따라
    다르게 생겼겠죠
  • 8:47 - 8:49
    생각해야 할 자유도가 두 개입니다
  • 8:49 - 8:53
    분자의 자유도와
    분모의 자유도 말입니다
  • 8:53 - 8:57
    그러면 이제 ⍺가 0.10인
    임계점의 F-통계량을 계산해 봅시다
  • 8:57 - 9:02
    그러면 이제 ⍺가 0.10인
    임계점의 F-통계량을 계산해 봅시다
  • 9:02 - 9:07
    F-분포표는 ⍺에 따라 달라집니다
  • 9:07 - 9:12
    분자의 자유도가 2
    분모의 자유도가 6이니까
  • 9:12 - 9:19
    이것은 ⍺가 10%
    0.10인 분포표인데
  • 9:19 - 9:26
    분자의 자유도가 2
    분모의 자유도가 6이니까
  • 9:26 - 9:30
    따라서 임계점의 F-값은 3.46입니다
  • 9:30 - 9:40
    따라서 임계점의 F-값은 3.46입니다
  • 9:40 - 9:44
    여기서 주어진 자료로
    계산한 값이 훨씬 크니까
  • 9:44 - 9:46
    p값은 아주 아주 작을 것입니다
  • 9:46 - 9:48
    이런 값을 우연이 얻을 확률은
  • 9:48 - 9:51
    귀무가설을 가정했을 때 아주 낮습니다
  • 9:51 - 9:55
    이것은 유의수준이 10%인 임계점의
    F-통계량보다 훨씬 큽니다
  • 9:55 - 9:57
    이것은 유의수준이 10%인 임계점의
    F-통계량보다 훨씬 큽니다
  • 9:57 - 10:02
    그러므로 귀무가설을 기각할 수 있고
  • 10:02 - 10:04
    따라서 모평균에 정말로 차이가 있다고
    믿을 수 있습니다
  • 10:04 - 10:07
    따라서 모평균에 정말로 차이가 있다고
    믿을 수 있습니다
  • 10:07 - 10:10
    아마 다른 음식이 시험 결과의
    변화를 만들 것이라고 말이죠
  • 10:10 - 10:13
    아마 다른 음식이 시험 결과의
    변화를 만들 것이라고 말이죠
Title:
ANOVA 3-Hypothesis Test with F-Statistic
Description:

more » « less
Video Language:
English
Team:
Khan Academy
Duration:
10:14

Korean subtitles

Revisions