0:00:00.000,0:00:06.586 지금부터 통계학의 세계로 빠져봅시다 0:00:06.586,0:00:11.816 통계는 어떤 자료를 이해하거나[br]이것을 통해 무엇을 알아낼 때 쓰입니다 0:00:11.816,0:00:14.754 통계는 자료에 대한 [br]모든 것을 다룹니다 0:00:14.754,0:00:19.111 여러분이 통계학의 세계에 [br]발을 들이게 되면 0:00:19.111,0:00:22.822 많은 부분을 [br]기술통계학 관점에서 배울겁니다 0:00:22.822,0:00:27.966 어떤 수많은 자료값이 있는데[br]여기에서 정보를 보여주고 싶을 때 0:00:27.966,0:00:33.775 모든 자료값을 나타내지 않고[br]더 작은 범위의 값으로 나타낼 순 없을까요? 0:00:33.778,0:00:35.772 앞으로 이것에 중점을 둘 겁니다 0:00:35.772,0:00:39.034 기술통계의 개념을 [br]학습하고 나면 0:00:39.038,0:00:44.135 자료를 추론해서 어떤 결론을 내거나[br]판단을 내릴 수 있습니다 0:00:44.135,0:00:49.414 이런 종류의 통계학이[br]추리통계학입니다 0:00:49.414,0:00:51.274 말 그대로 추리하는 것이죠 0:00:51.274,0:00:56.013 그럼 먼저 자료를 어떻게 [br]기술할 수 있는지 생각해 봅시다 0:00:56.013,0:01:02.462 어떤 수의 집합이 있다고 합시다[br]이런 수는 자료라고 할 수 있어요 0:01:02.462,0:01:05.794 어떤 정원에 있는 식물의 [br]키를 쟀다고 해봅시다 0:01:05.794,0:01:08.529 식물이 6 개체가 있고 0:01:08.534,0:01:17.939 키가 각각 4 인치, 3인치, 1인치, [br]6인치, 1인치, 7인치입니다 0:01:17.939,0:01:22.390 그런데 식물을 볼 수 없는 [br]어떤 방 안에 있는 사람이 0:01:22.390,0:01:24.926 식물들의 키를 궁금해합니다 0:01:24.926,0:01:30.021 식물의 키를 한 자리 [br]숫자로 말해줘야 합니다 0:01:30.021,0:01:33.581 모든 식물의 키를 대표할 수 있는 [br]수 하나만 말할 수 있습니다 0:01:33.581,0:01:36.475 어떻게 해야 할까요? 0:01:36.475,0:01:40.736 어떻게 이 여러 수를 대표하는 값을[br]어떻게 찾을 수 있을까요? 0:01:40.736,0:01:44.066 딱 중간을 나타내는 [br]어떤 값일 수도 있고 0:01:44.066,0:01:47.063 가장 자주 나오는 [br]값일 수도 있고 0:01:47.063,0:01:51.229 정 가운데에 있는 값일 수도 있어요 0:01:51.229,0:01:53.144 이 셋 중에 하나라도 생각했다면[br] 0:01:53.144,0:01:57.954 여러분은 기술통계학을 [br]처음 만들어낸 사람들과 똑같이 생각한 거에요 0:01:57.954,0:01:59.946 그 사람들도 어떻게 구할지 [br]생각해 봤을거에요 0:01:59.948,0:02:04.988 먼저 평균의 개념에 대해 배워봅시다 0:02:04.988,0:02:09.448 일상생활에서 말할 때 평균은[br]특정한 뜻이 있는 단어에요 0:02:09.448,0:02:14.768 보통 사람들이 말하는 평균은 [br]사실 산술평균입니다 0:02:14.768,0:02:17.896 하지만 통계학에서 평균은 [br]좀 더 광범위한 단어에요 0:02:17.896,0:02:23.073 평균을 구한다는 뜻은[br]어떤 대표적인 값을 구하거나 0:02:23.073,0:02:29.693 가운데에 있는 [br]값을 구한다는 겁니다 0:02:29.693,0:02:38.223 이렇게 평균을 구한다는 것은 [br]집중경향성 수치를 구한다는 것과 똑같습니다 0:02:38.223,0:02:44.119 다시 말하자면 여기 여러 수가 있고[br]이를 대표하는 어떤 값을 구해야 합니다 0:02:44.119,0:02:50.729 이것은 평균이고 여러 값을 [br]대표하는 값이나 가운데에 있는 값을 구하는 겁니다 0:02:50.729,0:02:54.173 평균에는 여러 가지 종류가 있습니다 0:02:54.173,0:02:56.950 첫 번째는 가장 익숙한 개념입니다 0:02:56.950,0:03:00.737 보통 말하는 시험 평균 점수나 [br]평균 키에서 보는 평균입니다 0:03:00.737,0:03:02.897 바로 산술평균입니다 0:03:02.897,0:03:13.375 바로 산술평균입니다 0:03:13.375,0:03:21.834 산술평균이 명사로 쓰일 때 Uh-rith'-me-tik 이라고 발음합니다[br]지금처럼 형용사일 때는 Eh'-rith-me'-tik이라고 발음합니다 0:03:21.834,0:03:25.761 산술평균은 모든 수의 합을 [br]그 개수로 나눈 것입니다 0:03:25.761,0:03:29.827 사람이 편리하게 계산하려고 만든 [br]유용한 개념이에요 0:03:29.827,0:03:34.101 모든 수의 합에 [br]그 개수를 나누면 돼요 0:03:34.101,0:03:39.403 그렇다면 이 자료집합의 [br]산술평균은 무엇일까요? 0:03:39.403,0:03:41.005 계산해 봅시다[br] 0:03:41.005,0:03:47.335 4+3+1+6+1+7 0:03:47.335,0:03:51.855 4+3+1+6+1+7[br]여기에 개수를 나눠줘요 0:03:51.855,0:03:55.005 총 6개의 수가 있으니까[br]6으로 나눠줍시다 0:03:55.005,0:03:58.000 그러면 4 +3 = 7 0:03:58.000,0:03:59.880 7+1=8 0:03:59.880,0:04:01.850 8+6=14 0:04:01.850,0:04:03.700 14+1=15 0:04:03.700,0:04:08.130 15+7=22 0:04:08.130,0:04:13.290 다시 해봅시다[br]4+3+1+6+1+7=22 0:04:13.290,0:04:15.560 22에 6을 나눠주면 0:04:15.560,0:04:20.938 대분수로 쓸 수 있습니다[br]22안에 6이 3번 들어가고 4가 남으므로 0:04:20.938,0:04:25.148 3과 4/6가 되고[br]3과 2/3으로 약분됩니다 0:04:25.148,0:04:32.128 소숫점으로 나타내면 3.6이에요[br]6이 반복되는 반복소수죠 0:04:32.128,0:04:34.262 어떻게 나타내든 상관없어요 0:04:34.262,0:04:39.792 이 값은 위의 수들을 대표하는 값이에요[br]즉 집중경향성을 보여주는 값이에요 0:04:39.792,0:04:42.199 다시 한 번 강조하지만[br]이것은 인간이 만들어낸 개념입니다 0:04:42.199,0:04:50.066 산술평균 개념은 어떤 종교적인 [br]자료에서 찾아낸 진리는 아닙니다 0:04:50.066,0:04:55.944 원주율을 알아낸 것 처럼[br]순수하게 발견해낸 것이 아니라는 것이죠 0:04:55.944,0:05:00.370 원주율은 인간이 우주를 공부하다가 [br]우연히 알아낸 공식이니까요 0:05:00.370,0:05:04.100 이처럼 산술평균은 [br]인간의 편리 때문에 만든 개념입니다 0:05:04.100,0:05:10.591 대표하는 값이나 가운데 값을 [br]구하는 다른 많은 방법도 많습니다 0:05:10.591,0:05:15.178 또 다른 대표적인 것은 [br]중앙값입니다 0:05:15.178,0:05:19.292 중앙값은 분홍색으로 표시할게요 0:05:19.292,0:05:25.272 중앙값은 말 그대로 [br]가운데에 있는 값입니다 0:05:25.282,0:05:29.565 수를 순서대로 나열하고[br]가운데에 있는 값을 구하면 0:05:29.565,0:05:31.758 그 수가 바로 중앙값입니다 0:05:31.758,0:05:35.657 그렇다면 여기에서 [br]중앙값은 무엇일까요? 0:05:35.657,0:05:38.687 알아봅시다[br]먼저 순서대로 나열하죠 0:05:38.687,0:05:46.583 1이 두 개, 3, 4, 6, 7이 있어요 0:05:46.583,0:05:48.750 위에 있는 수의 순서만 바꿨어요 0:05:48.750,0:05:51.030 중앙값은 어떤 것일까요? 0:05:51.030,0:05:57.133 수가 짝수개수 만큼 있으니까[br]중앙값은 한 개가 아니에요 0:05:57.133,0:06:00.772 중앙값은 두 개입니다 0:06:00.772,0:06:03.649 바로 3과 4입니다. 0:06:03.649,0:06:09.840 중앙값이 2개라면[br]두 값의 차의 1/2이 실제 중앙값입니다 0:06:09.840,0:06:14.141 두 중앙값의 산술평균을 구하는 것이죠 0:06:14.141,0:06:19.071 3과 4의 중간은 3.5예요 0:06:19.071,0:06:24.384 이 예제의 경우 [br]중앙값이 3.5가 되는거에요 0:06:24.384,0:06:31.707 중앙값이 두 개가 있으면[br]두 값의 산술평균을 구하면 되고요 0:06:31.707,0:06:34.508 수가 홀수개수만큼 있으면[br]좀 더 쉽습니다 0:06:34.508,0:06:36.905 이번에는 다른 값들로 확인해 봅시다 0:06:36.905,0:06:39.887 바로 순서대로 써 볼게요 0:06:39.887,0:06:56.661 자료값은[br]0, 7, 50, 10,000, 1,000,000 입니다 0:06:56.661,0:07:01.957 희한한 자료집합이에요[br]이 경우에 중앙값은 무엇일까요? 0:07:01.957,0:07:04.001 수가 5개 있네요 0:07:04.001,0:07:07.551 홀수개만큼 있으므로 [br]가운데를 찾기 더욱 쉽습니다 0:07:07.551,0:07:13.991 중앙값은 어떤 두 수 보다는 크고 [br]다른 두 수 보다는 작은 수입니다 0:07:13.994,0:07:18.902 정확히 가운데에 있는 수입니다[br]이 경우에는 50이 되겠네요 0:07:18.902,0:07:26.862 세 번째로는 가장 적게 쓰이는[br]최빈값에 대해 배워봐요 0:07:26.862,0:07:33.134 최빈값은 적게 쓰여서 복잡한 개념같지만[br]사실은 굉장히 간단합니다 0:07:33.134,0:07:36.144 어떤 면에서는 [br]가장 기초적인 개념입니다 0:07:36.144,0:07:41.114 최빈값은 자료집합 안에서 [br]가장 많이 존재하는 수입니다 0:07:41.114,0:07:47.414 만약 모든 수가 각각 한 번씩만 [br]등장하면 최빈값은 없습니다 0:07:47.414,0:08:05.062 그러면 여기서 최빈값은 무엇일까요? [br]4,3,6,7은 한 번 나오고 1은 두 번 나와요 0:08:05.062,0:08:17.615 가장 자주 나오는 숫자는 1입니다 [br]그래서 최빈값은 1이지요 0:08:17.615,0:08:25.810 자료를 대표하는 값을 찾을 때 [br]여러 방법으로 할 수 있다는 것을 알 수 있습니다 0:08:25.810,0:08:29.757 그리고 통계학을 공부할 때 [br]각자 쓰임새가 다르다는 걸 배우게 될 겁니다 0:08:29.757,0:08:32.075 산술평균이 가장 많이 사용되고요 0:08:32.075,0:08:38.123 중앙값은 굉장히 큰 값 때문에 [br]산술평균이 왜곡될 때 유용하고요 0:08:38.133,0:08:45.997 최빈값도 마찬가지로 똑같은 수가 여러번 [br]등장해서 평균이 왜곡될 수 있을 때 유용합니다 0:08:45.997,0:08:48.856 오늘은 이만 여기서 마치기로하고 [br] 0:08:48.856,0:08:52.856 다음 시간에는 통계학을 [br]더욱 자세하게 배워봅시다