-
식당주인이 고객들이 어디서 오는지 알고싶어합니다.
-
그래서 고객들의 방문거리에 관한 데이터를 수집하기로 했어요
-
여기 고객들이 제공한 이동거리가 있네요
-
그는 그래프를그려 거리분포를 알고싶었어요
-
핵심어는 이동거리의 분포와 중앙값입니다
-
어떤 그래프를 사용할까요
-
그가 그려야하는 그래프는
-
우리가 생각하는 것보다 더 직관적이어야 합니다
-
수집된정보의 분포를 시각화하고
-
중앙값을 나타내고요. 어떤 그래프가 두 정보를 모두 나타낼까요
-
박스와 위스커 구상...입니다
-
박스와 위스커구상을위해 중앙값을 찾고
-
양쪽 절반값의 중앙값을 찾을거예요.
-
중앙값을 계산할 때는 자료를 정렬해야죠
-
데이터정렬을 위해
-
가장 작은수는?? 2가 하나있고 또 2가 있네요
-
모든 2. 그리고3
-
4
-
5는? 6은? 6이 있네요
-
6은 하나고 7이 있네요
-
1을 빼먹었어요
-
두 1을 시작으로 하죠
-
1 1 2 2 3 3 3 4 5 5 6 7 8
-
9가 있나? 없네요. 10은? 10
-
11은? 11 12는? 없어요
-
14, 15가 있고 20, 22 가 있어요
-
자, 모든 데이터를 정렬한것은 중앙을 찾기 위해서죠
-
중앙값이요. 데이터가 몇개죠??
-
하나, 둘.....열
-
열하나, 열둘..................열일곱
-
그래서 가운데 수는 자신보다 큰 수가 8개죠
-
작은수도 8개 고요. 생각해봐요, 하나, 둘 . 셋, 넷
-
다섯, 여섯, 일곱, 여덟,,,여기 6이
-
8개의 값보다 커요, 내가 맞다면요
-
8개 수 보다 작아야되요, 하나, 둘, 셋, 넷,
-
다섯, 여섯, 일곱, 여럷,,,정말로
-
이건 중앙값이예요. 이제
-
박스와 위스커구상을 위해 중앙값이 필요하고
-
자료들를 두 세트로 나눠요. 이제 각각의 중앙값을 택하고
-
중앙값을 제외하고
-
남은 두 부분을 봅시다. 때로 남겨두기도 하지만 대체로...
-
중앙값을 빼고 이쪽 저쪽을 분리해요
-
우선, 작은쪽 절반이요
-
중앙값은 뭐예요?
-
하나, 둘, 셋, 넷, 다섯, 여섯, 일곱
-
여덟, 그래서 두개의 중앙값을 가지게 되요
-
중앙값은 2와 3이죠
-
세개의 수들은 이 둘보다 작고 세개의 수들은 그보다 커요
-
중앙값을 찾을때, 우리는 이 두 가운데 수들을 택해서 평균을 구해요
-
2와 3의 가운데는 2.5죠
-
2+3=5, 5 나누기 2는 2.5
-
그래서 작은쪽 그룹의 중앙값은 2.5
-
큰쪽 그룹에서 다시 8개의 데이터가 있어요
-
가운데 두 수는 11과 14예요
-
이 두 수의 평균을 구하려면 11+14=25
-
25의 반은 12.5, 12.5는 정확히 11과 14의 절반이예요
-
이제 우리는 박스와 위스커 구상을 위한....
-
모든 정보를 얻었어요
-
수직선을 그릴께요
-
네. 수직선이요
-
여기를 0 이라 하고
-
22를
-
여기가 0, 여기가 5, 여기가 10
-
여기는 15, 여기는 20
-
25, 계속해서
-
30, 35
-
먼저 생각할 것은.....여러 방법이 있다는거죠
-
박스와 위스커 구상에서 박스를 먼저 생각해봐요
-
데이터의 중앙의 절반을 나타내죠.
-
여기 이 데이터를 나타내고
-
두 파트의 중앙값사이의 데이터가
-
우리가 박스로 나타내야할 부분이죠
-
박스를, 여기서 시작해요
-
2.5 에서...
-
첫번째 1/4부터 두번째 1/4까지
-
여기에 2.5
-
2.5는 0과 5의 가운데
-
2.5 그리고 여기 12.5
-
12.5
-
12.5
-
이등분하면
-
10과 15사이에 12.5
-
12.5가 여기
-
네번째 1/4에서 세번째 1/4를 분리해요
-
상자는, 가운데 절반의 자료를 포함해요
-
그리고 우린
-
중앙값을 보이길 원해요. 우린
-
식당주인이
-
고객이 얼마나 멀리서 오나 조사하는 중이예요......중앙값은 6
-
여기 표시해요
-
핑크색 6은
-
여기에
-
박스와 위스커 구상에서 위스커는 전체 범위를 보여주죠
-
해볼께요
-
새로은 색깔로 할께요, 오렌지색 어때요?
-
살펴보면
-
22가 최대값
-
22가 여기있고
-
모든 수가 22 아래에 위치하죠
-
1이 최소죠
-
1은 여기
-
1이요
-
박스와 위스커 구상을 완성했어요
-
이제 바로 확인할 수 있어요
-
중앙값이란? 박스의 중앙이죠
-
가운데 절반값을 보여주고 . 얼마나 흩어져 있나를 보여주죠
-
전체 범위를 보여주고요
-
즉 모든 자료의 분산정도
-
이것은 중앙값과 분산을 파악하는
-
좋은 방법이예요