-
이 비디오에서 저는
-
통계학에서 아마 모든 수학을 통틀어서
가장 기본적이고 깊은
-
주제를 다룰 것입니다.
-
그것은 중심극한정리에요.
-
그리고 이것은
-
뚜렷한 일체의 분포 그리고
-
변화량--그리고 만약 특정한 변화량이면,
-
특정한 표준편차가 존재한다는 것을 말해줍니다.
-
그리고 이것은 연속적 분포 또는 이산형이 될 수 있습니다.
-
그저 생각하기 쉽게 이산형을 그리겠습니다.
-
적어도 이 영상의 목적을 위해서.
-
이제 이산확률분포함수가 있습니다.
-
그리고 이것을 정규분포와
-
헷갈리지 않도록 조심하세요.
-
왜냐하면 당신에게 중심극한정리의 힘을 보여주기 위함입니다.
-
이제 분포가 있습니다.
-
이것이 1에서 6까지의 값을 가진다고 합시다.
-
1, 2, 3, 4, 5, 6.
-
이것은 일종의 정상이 아닌 주사위죠.
-
이것은 1을 얻을 가능성이 매우 높습니다.
-
이것을 불가능하다고 합시다--자,
-
일직선이 되도록 합시다.
-
당신은 1을 얻을 가능성이 매우 높습니다.
-
2를 얻는 것이 불가능하다고 가정합시다.
-
3과 4를 얻을 가능성이 있다고 합시다.
-
5를 얻는 것은 불가능하다고 가정합시다.
-
그리고 다음과 같이 6을 얻을 가능성이 매우 높다 가정합시다.
-
이제 이것이 저의 확률분포함수입니다.
-
만약 내가 어떤 평균을--대칭이 되도록 그린다면,
-
그래서 아마 그 평균은 다음과 같을 것입니다.
-
평균은 중간입니다.
-
그래서 그것이 바로 그곳의 평균입니다.
-
이 표준편차는 아마도--
-
이것은 아마 평균을 사이에 두고
-
저쪽 그리고 저쪽일 것입니다.
-
하지만 그것은 내 이산분포확률함수입니다.
-
지금부터 그냥 이 확률분포함수에 묘사되어 있는
-
확률랜덤 변수의 샘플을 뽑는 것 대신에
-
나는 이것의 샘플을 뽑으려 한다.
-
하지만 나는 샘플을 평균화할 것이고
-
그것들의 샘플을 살피고
-
얻어지는 빈도평균을 봅시다.
-
평균이라고 하는것은, 평균을 뜻합니다.
-
뭔가를 정의해보겠습니다.
-
샘플의 크기가----나는 여기에 어떤 값이든 넣을 수 있습니다.
-
우선 n의 샘플 크기를 4로 놓는 것을 시도해봅시다.
-
그리고 이것이 뜻하는 것은 네개의 샘플을
-
그래서 처음에 선택했던 네 개의 샘플들을 --
-
샘플 크기들은 네 개입니다. 내가 1을 가졌다고 합시다.
-
또다른 1을 가졌다고 합시다.
-
그리고 3을 가졌다고 합시다.
-
그리고 6을 가졌습니다.
-
그러므로 저것들은 샘플크기 4인 저의 첫 표본입니다.
-
전문용어들이 헷갈린다는 것을 압니다.
-
왜냐하면 이 샘플들은 표본 네 개로 이루어져있기 때문이에요.
-
하지만 우리가 표본 평균과 표본 평균의
-
표본 분포에 대해서 말할 때,
-
다음 몇개의 비디오에서 말할 예정인,
-
일반적으로 당신의 분포에서부터 나온 샘플의 집합이 표본을 나타냅니다.
-
그리고 표본의 크기는 분포에서 얼만큼 추출했느냐를 의미합니다.
-
하지만 용어가 많이 헷갈릴 수 있습니다.
-
왜냐하면 당신은 이것들 중 하나를 하나의 표본으로 착각할 가능성이 있기 때문입니다.
-
하지만 우리는 여기서 네 개의 샘플을 추출합니다.
-
우리는 네 개의 샘플 사이즈가 있습니다.
-
그리고 나는 그것들의 평균을 낼 것입니다.
-
평균(수학적 의미의)으로 정정합시다-- 평균이라고 할 때 조심하고 싶습니다.
-
크기가 4인 첫번째 표본의 크기는 무엇일까요?
-
1+1=2.
-
2+3=5.
-
5+6=11.
-
11 나누기 4는 2.75.
-
이것이 크기가 4인 첫번째 표본의 첫번째 표본 평균입니다.
-
이제 다른 것을 합시다.
-
크기가 4인 제 두번째 표본은, 제가 3, 4,
-
또 다른 3,
-
그리고 1을 추출했다고 합시다.
-
이때 6을 얻을 가능성은 일어나지 않습니다.
-
그리고 2 또는 5를 얻지 못한다는 점에 주목하세요.
-
이것은 이 분포에 대하여 불가능합니다.
-
2 또는 5를 얻을 기회는 0입니다.
-
그래서 저는 2 또는 5를 가질 수 없습니다.
-
그렇기 때문에 크기가 4인 표본의 두번째 샘플에 대해서,
-
내 두번째 표본 평균은 3+4=7입니다.
-
7+3=10이고 10+1=11.
-
11 나누기 4는, 다시 한 번, 2.75이다.
-
한 가지를 더 합시다. 왜냐하면 저는
-
여기서 하는 것을 분명하게 하고 싶습니다.
-
그래서 한 가지 더 합시다.
-
사실 우리는 엄청난 것을 더 할 것입니다.
-
하지만 하나만 더 구체적으로 합시다.
-
그래서 크기가 4인 세번째 표폰을---
-
그래서 저는 말 그대로 네개의 샘플을 추출할 것입니다.
-
그래서 제 표본은 원래의 비정상적인 분포의 네개의 샘플로 이루어져 있습니다.
-
제가 1, 1, 그리고 6과 6을 추출했다고 합시다.
-
그래서 제 세번째 표본 평균은 1+1=2.
-
2+6=8.
-
8+6=14.
-
14 나누기 3은 3.5입니다.
-
그리고 내가 찾는 이 표본평균--
-
그래서 표본의 크기가 4인 각각의 표본에 대해서
-
평균을 계산합니다
-
각각에 대해서 한 뒤에,
-
도수분포에 그려넣을 것입니다
-
그리고 이 모든것은 곳 당신을 놀라게 할 것입니다
-
나는 이 모든 것들을 도수분포에 넣을 겁니다
-
첫번째 표본평균은 2.75였습니다
-
그래서 나는 각각의 평균에서 얻은
-
표본평균의 실제 빈도수를 그려넣을 것입니다
-
내가 한 번 얻었던 2.75
-
그래서 작은 그래프를 그릴 것입니다
-
그래서 저렇게 그렸습니다
-
그 다음에, 2.75도 얻었습니다
-
저게 2.75 입니다
-
그래서 나는 두 번 얻었습니다
-
그래서 나는 빈도수를 바로 저기에 그릴 것입니다
-
다음에 3,5를 얻었었습니다
-
그래서 내가 가질 수 있는 가능한 모든 값들은
-
3, 3.25, 3.5이다.
-
그러면 나는 3.5를 가지고, 나는 바로 저기에 그래프를 그릴 것입니다.
-
내가 지금 하려고 하는 것은
-
이 견본들을 계속해서 뽑아내는 것입니다
-
아마 나는 저중에서 10000개를 뽑을 것입니다
-
그래서 표본들을 계속해서 뽑아낼 것입니다
-
나는 10000까지 다 왔습니다
-
나는 그저 이들을 다룹니다
-
시간이 지남에 따라 어떻게 생겼는지는 각각 다음과 같습니다
-
나는 한 점을 그릴 것입니다
-
왜냐하면 축소할 것이기 때문입니다
-
그래서 만약 내가 이것을 시간이 지남에 따라 이렇게 본다면--
-
아직 뽑을 수 있을지도 모르는 모든 값을,
-
2.75 가 여기 있을 것이다
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-