WEBVTT 00:00:00.000 --> 00:00:01.100 - 00:00:01.100 --> 00:00:03.320 วิดีโออันนี้เป็นวิดีโอที่พิเศษสุด 00:00:03.320 --> 00:00:05.340 ด้วยเหตุผลหลายอย่าง 00:00:05.340 --> 00:00:09.910 อย่างแรก, ผมจะแนะนำให้คุณรู้จักความแปรปรวนของตัวอย่าง, 00:00:09.910 --> 00:00:11.750 ซึ่งเป็นเรื่องที่น่สนใจ 00:00:11.750 --> 00:00:14.520 และผมพายามจะบันทึกวิดีโอนี้เป็นแบบ HD 00:00:14.520 --> 00:00:16.370 หวังว่าคุณจะเห็นได้ใหญ่ขึ้นและชัดขึ้น 00:00:16.370 --> 00:00:17.030 กว่าที่เคย 00:00:17.030 --> 00:00:19.150 แต่เราจะดุว่ามันเป็นอย่างไร 00:00:19.150 --> 00:00:22.060 นี่เป็นการทดลองนิดหน่อย, ทนกับผมหน่อยนะ 00:00:22.060 --> 00:00:25.180 แต่, ก่อนที่เราจะพูดถึงความแปรปรวนของตัวอย่างล 00:00:25.180 --> 00:00:28.090 ผมคิดว่ามันดีต่อการเรียน ถ้าเราจะทบทวนความแปรปรวน 00:00:28.090 --> 00:00:28.870 ของประชากรกันก่อน 00:00:28.870 --> 00:00:32.180 แล้วเราถึงเปรียบเทียบสูตรของมันได้ 00:00:32.180 --> 00:00:34.790 ความแปรปรวนของประชากร -- นี่คือตัวอักษร 00:00:34.790 --> 00:00:36.100 กรีกซิกม่า 00:00:36.100 --> 00:00:37.420 ซิกม่าเล็ก กำลังสอง 00:00:37.420 --> 00:00:38.500 นั่นหมายถึงความแปรปรวน 00:00:38.500 --> 00:00:41.010 ผมรู้ว่ามันแปลกๆ ที่ตัวแปร 00:00:41.010 --> 00:00:41.710 มีกำลังสองติดมาอยู่แล้ว 00:00:41.710 --> 00:00:42.840 คุณได้กำลังสองตัวแปรนี้ 00:00:42.840 --> 00:00:44.240 นี่คือตัวแปร 00:00:44.240 --> 00:00:45.780 ซิกม่ากำลังสอง หมายถึงความแปรปรวน 00:00:45.780 --> 00:00:46.840 ที่จริง, ขอผมเขียนลงไปนะ 00:00:46.840 --> 00:00:48.005 นั่นเท่ากับความแปรปรวน 00:00:48.005 --> 00:00:51.550 - 00:00:51.550 --> 00:00:55.430 และนั่นเท่ากับ -- คุณหาจุดข้อมูลแต่ละจุดมา -- แล้ว 00:00:55.430 --> 00:00:58.800 เราจะเรียกมันว่า x ห้อย i 00:00:58.800 --> 00:01:01.700 คุณเอาจุดข้อมูลแต่จุดมา หาว่ามันห่างจาก 00:01:01.700 --> 00:01:08.750 ค่าเฉลี่ยประชากรเท่าไหร่, คุณกำลังสองมัน, แล้วคุณก็ 00:01:08.750 --> 00:01:11.160 หาค่าเฉลี่ยของทั้งหมดนั้น 00:01:11.160 --> 00:01:12.900 แล้วคุณหาค่าเฉลี่ย, คุณบวกทุกอย่างเข้าด้วยกัน 00:01:12.900 --> 00:01:14.200 คุณก็ไปจาก i เท่ากับ 1 00:01:14.200 --> 00:01:17.700 จากจุดนั้น, ไปจนถึงจุดที่ n 00:01:17.700 --> 00:01:19.940 แล้ว, เวลาเฉลี่ย, คุณบวกมันจนหมด 00:01:19.940 --> 00:01:21.970 แล้วหารด้วย n 00:01:21.970 --> 00:01:25.970 ความแปรปรวนก็คือค่าเฉลี่ยของกำลังสองของระยะห่าง 00:01:25.970 --> 00:01:27.390 แต่ละจุดเหล่านี้ ไปยังค่าเฉลี่ย 00:01:27.390 --> 00:01:29.700 เพื่อให้คุณได้สัญชาตญาณอีกที, มันบอกว่า 00:01:29.700 --> 00:01:32.920 โดยเฉลี่ยแล้ว, แต่ละจุด 00:01:32.920 --> 00:01:34.420 หาจากตรงกลางแค่ไหน 00:01:34.420 --> 00:01:36.250 นั่นคือวิธีคิดถึงความแปรปรวนที่ดีที่สุด 00:01:36.250 --> 00:01:37.640 ทีนี้ ถ้าเกิดเรามี -- นี่ 00:01:37.640 --> 00:01:39.140 สำหรับประชากร, จริงไหม? 00:01:39.140 --> 00:01:42.050 และเราบอกว่า ถ้าเราอยากหาความแปรปรวนของ 00:01:42.050 --> 00:01:44.580 ความสูงของคนในประเทศนี้, มันยาก 00:01:44.580 --> 00:01:46.480 ที่จะหาความแปรปรวนของประชากร 00:01:46.480 --> 00:01:48.910 คุณต้องไป, วัดความสูง 00:01:48.910 --> 00:01:49.790 ของทุกคน 00:01:49.790 --> 00:01:51.360 250 ล้านคน 00:01:51.360 --> 00:01:55.080 หรือถ้ามีประชากรซึ่งเราไม่มีทาง 00:01:55.080 --> 00:01:56.860 หาข้อมูลได้ มาจาก 00:01:56.860 --> 00:01:57.640 ตัวแปรสุ่ม 00:01:57.640 --> 00:01:59.100 เราจะพูดถึงเรื่องนั้นทีหลัง 00:01:59.100 --> 00:02:02.660 หลายครั้งคุณต้องประมาณค่าความแปรปรวนนี้ 00:02:02.660 --> 00:02:04.690 ด้วยการหาความแปรปรวนของตัวอย่างแทน 00:02:04.690 --> 00:02:07.420 เหมือนกับที่คุณไม่มีทางหาค่าเฉลี่ยของประชากร 00:02:07.420 --> 00:02:09.570 บางทีคุณอาจกะค่ามันด้วย 00:02:09.570 --> 00:02:11.064 การหาค่าเฉลี่ยของตัวอย่าง 00:02:11.064 --> 00:02:13.890 และเราเรียนไปในวิดีโอที่แล้ว 00:02:13.890 --> 00:02:17.520 ถ้านี่คือ -- ถ้านี่คือประชากรทั้งหมด 00:02:17.520 --> 00:02:20.280 นั่นคือจุดข้อมูลเป็นล้าน, หรือแม้กระทั่งจุดข้อมูล 00:02:20.280 --> 00:02:21.870 ในอนาคตที่คุณหาไม่ได้ เพราะมันเป็น 00:02:21.870 --> 00:02:23.290 ตัวแปรสุ่ม 00:02:23.290 --> 00:02:24.243 นี่คือประชากร 00:02:24.243 --> 00:02:26.920 - 00:02:26.920 --> 00:02:32.390 คุณอาจอยากประมาณค่าด้วยการดูที่กลุ่มตัวอย่าง 00:02:32.390 --> 00:02:35.020 และนี่คือสถิติเชิงอนุมาน 00:02:35.020 --> 00:02:36.360 เกี่ยวข้องเป็นส่วนใหญ่ 00:02:36.360 --> 00:02:38.720 คือการหาสถิติเชิงพรรณนาของกลุ่มตัวอย่าง 00:02:38.720 --> 00:02:40.890 แล้วอนุมานไปถึงประชากร 00:02:40.890 --> 00:02:44.610 ขอผมลองใช้ยานี้กับคน 100 คน แล้วถ้ามัน 00:02:44.610 --> 00:02:46.880 ดูได้ผลอย่างมีนัยสำคัญทางสถิติ, ยานี้ก็ควร 00:02:46.880 --> 00:02:48.850 ใช้ได้กับประชาการทั้งหมดด้วย 00:02:48.850 --> 00:02:49.800 นั่นคือสิ่งที่มันหมายถึง 00:02:49.800 --> 00:02:51.920 การเข้าใจแนวคิดเรื่องกลุ่มตัวอย่าง 00:02:51.920 --> 00:02:53.580 เทียบกับประชากรเป็นสิ่งสำคัญ 00:02:53.580 --> 00:02:57.510 การหาค่าทางสถิติของตัวอย่างได้, 00:02:57.510 --> 00:03:00.160 ส่วนใหญ่แล้ว, สามารถใช้บรรยายประชากร หรือช่วย 00:03:00.160 --> 00:03:03.720 ให้ประมาณค่า, เขาเรียกกันว่า, พารามิเตอร์ของประชากรได้ 00:03:03.720 --> 00:03:07.330 แล้วค่าเฉลี่ยของ -- ขอผมเขียนนิยามพวกนี้ใหม่นะ 00:03:07.330 --> 00:03:08.830 ค่าเฉลี่ยของประชากรคืออะไร? 00:03:08.830 --> 00:03:09.940 ผมจะใช้สีม่วงนะ 00:03:09.940 --> 00:03:11.630 สีม่วงแทนประชากร 00:03:11.630 --> 00:03:13.680 ค่าเฉลี่ยของประชากร 00:03:13.680 --> 00:03:19.700 คุณแค่เอาจุดข้อมูลแต่ละตัวมาในประชากร, x i 00:03:19.700 --> 00:03:21.850 คุณบวกมันเข้า 00:03:21.850 --> 00:03:23.830 คุณเริ่มด้วยจุดข้อมูลอันแรก แล้วคุณก็ทำ 00:03:23.830 --> 00:03:25.620 ไปจนถึงจุดข้อมูลที่ n 00:03:25.620 --> 00:03:26.740 แล้วคุณหารด้วย n 00:03:26.740 --> 00:03:27.800 คุณบวกพวกมันไปจนถึง n 00:03:27.800 --> 00:03:28.920 นั่นคือค่าเฉลี่ย 00:03:28.920 --> 00:03:30.500 แล้วคุณก็แทนมันลงในสูตรนี้ 00:03:30.500 --> 00:03:33.060 แล้วคุณก็หาได้ว่าแต่ละจุดไกลจากจุดศูนย์กลาง 00:03:33.060 --> 00:03:34.270 จากค่าเฉลี่ยนั้นแค่ไหน 00:03:34.270 --> 00:03:36.260 และคุณจะได้ความแปรปรวน 00:03:36.260 --> 00:03:39.670 ทีนี้ เกิดอะไรขึ้นถ้าเราทำสำหรับตัวอย่างด้วย? 00:03:39.670 --> 00:03:43.350 ทีนี้, ถ้าเราอยากประมาณค่าเฉลี่ยประชากร ด้วย 00:03:43.350 --> 00:03:46.600 การคำนวณค่าเฉลี่ยของตัวอย่าง, สิ่งที่ดีที่สุดที่ผม 00:03:46.600 --> 00:03:49.170 คิดได้ -- นี่คือสูตรที่ประดิษฐ์ขึ้นมาทั้งนั้น 00:03:49.170 --> 00:03:51.140 มีคนบอกว่า, เราจะหาค่าตัวอย่าง 00:03:51.140 --> 00:03:51.710 ที่ดีที่สุดอย่างไร? 00:03:51.710 --> 00:03:54.550 ทีนี้ สิ่งที่เราทำได้ ก็แค่หาค่าเฉลี่ยของตัวอย่าง 00:03:54.550 --> 00:03:56.820 และนั่นคือค่าเฉลี่ยของกลุ่มตัวอย่าง 00:03:56.820 --> 00:03:58.920 และเราเรียนในวิดีโอแรก ว่าสัญลักษณ์ -- 00:03:58.920 --> 00:04:00.450 สูตรเกือบเหมือนกันเลย 00:04:00.450 --> 00:04:01.540 แต่สัญลักษณ์ต่างกัน 00:04:01.540 --> 00:04:04.990 แทนที่จะเขีน มิว, คุณเขียนว่า x มีขีดอยู่ข้างบน 00:04:04.990 --> 00:04:08.620 ค่าเฉลี่ยตัวอย่าง เท่ากับ -- เหมือนเดิม, คุณเอา 00:04:08.620 --> 00:04:12.100 จุดข้อมูลตอนนี้ คือในกลุ่มตัวอย่าง, ไม่ใช่ประชากรทั้งหมด 00:04:12.100 --> 00:04:16.370 คุณบวกพวกมันเข้า จากอันแรกไป 00:04:16.370 --> 00:04:17.380 จนถึงตัวที่ n, จริงไหม? 00:04:17.380 --> 00:04:20.640 เขาบอกว่า มันมีจุดข้อมูล n ตัวในกลุ่มตัวอย่าง 00:04:20.640 --> 00:04:23.390 แล้วคุณหารมันด้วยจำนวนจุดข้อมูลที่คุณมี 00:04:23.390 --> 00:04:24.320 ใช้ได้ 00:04:24.320 --> 00:04:25.660 นี่มีสูตรเหมือนกัน 00:04:25.660 --> 00:04:27.500 วิธีที่ผมหาค่าเฉลี่ยขอประชากร, ผมบอกว่า, เอาล่ะ, ถ้า 00:04:27.500 --> 00:04:29.590 ผมมีตัวอย่าง, ขอผมหาค่าเฉลี่ยแบบเดียวกัน 00:04:29.590 --> 00:04:32.560 และมันอาจเป็นค่าประมาณที่ดีสำหรับค่าเฉลี่ย 00:04:32.560 --> 00:04:33.930 ของประชากรด้วย 00:04:33.930 --> 00:04:36.340 ทีนี้ มันน่าสนใจตอนเราพูดถึงความแปรปรวน 00:04:36.340 --> 00:04:39.250 ปฏิกิริยาตามธรรมชาติคือว่า โอเค, ผมมีกลุ่มตัวอย่างนี้ 00:04:39.250 --> 00:04:43.260 ถ้าผมอยากหาค่าความแปรปรวนของประชากร, ทำไม 00:04:43.260 --> 00:04:45.230 เราไม่ใช้สูตรเดียวกับที่เรา 00:04:45.230 --> 00:04:46.150 ใช้กับตัวอย่างล่ะ? 00:04:46.150 --> 00:04:49.330 ผมก็บอกได้ว่า -- นี่คือความแปรปรวนตัวอย่าง 00:04:49.330 --> 00:04:54.570 เขาใช้สูตร s กำลังสอง 00:04:54.570 --> 00:04:58.220 ซิกม่าก็เหมือนกับตัวอักษรกรีกของ s 00:04:58.220 --> 00:04:59.980 ตอนนี้เวลาเราคิดกลุ่มตัวอย่าง, เรา 00:04:59.980 --> 00:05:01.000 แค่เขียน s ลงไป 00:05:01.000 --> 00:05:02.320 นี่ก็คือความแปรปรวนของตัวอย่าง 00:05:02.320 --> 00:05:03.070 ขอผมเขียนมันลงไปนะ 00:05:03.070 --> 00:05:03.950 ความแปรปรวนของตัวอย่าง 00:05:03.950 --> 00:05:11.860 - 00:05:11.860 --> 00:05:15.870 นี่คือ -- เราก็อาจบอกว่า, นี่อาจเป็นวิธีที่ดีในการ 00:05:15.870 --> 00:05:17.340 หาความแปรปรวนตัวอย่าง คือทำแบบนี้ 00:05:17.340 --> 00:05:23.670 ลองหาระยะห่างของแต่ละจุดในตัวอย่าง 00:05:23.670 --> 00:05:26.600 หาว่ามันห่างจากค่าเฉลี่ยตัวอย่างแค่ไหน 00:05:26.600 --> 00:05:29.230 ตรงนี้ เราใช้ค่าเฉลี่ยประชากร, แต่ตอนนี้เราจะใช้ 00:05:29.230 --> 00:05:31.450 ค่าเฉลี่ยตัวอย่าง เพราะนั่นคือสิ่งที่เรามี 00:05:31.450 --> 00:05:33.160 เราไม่รู้ว่าค่าเฉลี่ยประชากรเป็นเท่าไหร่ 00:05:33.160 --> 00:05:35.510 หากไม่ดูประชากรทั้งหมด 00:05:35.510 --> 00:05:36.400 ยกกำลังมัน 00:05:36.400 --> 00:05:38.160 นั่นทำให้มันเป็นบวก และมันมีสมบัติอื่น 00:05:38.160 --> 00:05:40.160 ซึ่งเราจะพูดถึงต่อไป 00:05:40.160 --> 00:05:42.730 แล้วถ้าเราหาค่าเฉลี่ยของระยะกำลังสองพวกนี้ 00:05:42.730 --> 00:05:44.970 แล้วคุณก็หาค่ามันจาก -- คุณรวมพวกมันเข้า 00:05:44.970 --> 00:05:47.430 มันมีอยู่ n ตัวให้รวม, จริงไหม? 00:05:47.430 --> 00:05:48.400 n เล็ก 00:05:48.400 --> 00:05:51.820 แล้วคุณก็หารมันด้วยตัว n เล็ก 00:05:51.820 --> 00:05:53.230 และคุณบอกว่า, นี่เป็นค่าประมาณที่ดี 00:05:53.230 --> 00:05:55.580 ไม่ว่าความแปรปรวนนี้เป็นอะไร, มันน่าจะเป็นค่าประมาณที่ดี 00:05:55.580 --> 00:05:56.720 สำหรับประชากรทั้งหมด 00:05:56.720 --> 00:06:00.620 ที่จริง นี่คือสิ่งที่บางคนมักหมายถึง เวลาเขา 00:06:00.620 --> 00:06:01.980 พูดถึงความแปรปรวนของตัวอย่าง 00:06:01.980 --> 00:06:05.260 และบางครั้ง มันมักหมายถึงอันนี้ 00:06:05.260 --> 00:06:07.520 เขาจะเขียน n เล็กตรงนี้ 00:06:07.520 --> 00:06:09.840 และสาเหตุที่เขาทำอย่างนั้น เพราะเราหารด้วย n 00:06:09.840 --> 00:06:11.840 แล้วคุณบอกว่า, ซาล มันมีปัญหาอะไรเหรอ? 00:06:11.840 --> 00:06:14.000 และปัญหา -- ผมจะบอกถึงสัญชาตญาณให้ฟัง เพราะนี่ 00:06:14.000 --> 00:06:16.180 เป็นบางสิ่งที่ผมเคยสงสัยในใจ 00:06:16.180 --> 00:06:19.340 และผมยังคงมีปัญหากับ 00:06:19.340 --> 00:06:21.530 สัญชาตญาณเบื้องหลังเรื่องนี้อยู่ 00:06:21.530 --> 00:06:24.510 ผมมีสัญชาตญาณอยู่, แต่เราต้องพิสูจน์ 00:06:24.510 --> 00:06:26.950 ด้วยตัวองว่ามันเป็นอย่างนั้นจริง 00:06:26.950 --> 00:06:28.280 แต่ลองคิดดู 00:06:28.280 --> 00:06:29.905 ถ้าผมมีเลขหลายๆ ตัว, และผมจะวาด 00:06:29.905 --> 00:06:32.740 เส้นจำนวนตรงนี้ 00:06:32.740 --> 00:06:35.740 ถ้าผมวาดเส้นจำนวนตรงนี้ -- สมมุติคุณรู้ว่า -- 00:06:35.740 --> 00:06:39.430 สมมุติว่าผมมีเลขหลายๆ ตัวในประชากร 00:06:39.430 --> 00:06:41.660 สมมุติว่า -- ผมจะสุ่มใส่เลข 00:06:41.660 --> 00:06:44.280 ลงไปเป็นประชากรนะ 00:06:44.280 --> 00:06:45.928 อันที่อยู่ทางขวา มากกว่าอัน 00:06:45.928 --> 00:06:46.355 ที่อยู่ทางซ้าย 00:06:46.355 --> 00:06:48.900 - 00:06:48.900 --> 00:06:52.990 แล้วถ้าผมเลือกกลุ่มตัวอย่างจากมัน, บางทีผมเลือก -- 00:06:52.990 --> 00:06:54.820 ตัวอย่าง, มันเป็นไปอย่างสุ่ม 00:06:54.820 --> 00:06:56.210 ที่จริงคุณอยากเลือกตัวอย่างแบบสุ่ม 00:06:56.210 --> 00:06:57.320 คุณไม่อยากเลือกให้มันเบี้ยวไป 00:06:57.320 --> 00:07:02.900 บางทีผมเลือกอันนี้, อันนี้, อันนี้, 00:07:02.900 --> 00:07:05.420 แล้วก็อันนั้น, ดีไหม? 00:07:05.420 --> 00:07:07.480 แล้วถ้าเราหาค่าเฉลี่ยและเลขนั้น, 00:07:07.480 --> 00:07:08.460 เลขนั้น, เลขนั้น, เลขนั้น 00:07:08.460 --> 00:07:09.320 มันจะอยู่ตรงกลางสักที่ 00:07:09.320 --> 00:07:11.010 มันอาจจะอยู่แถวโน้น 00:07:11.010 --> 00:07:13.240 แล้วถ้าเราหาความแปรปรวนตัวอย่าง โดยใช้ 00:07:13.240 --> 00:07:16.780 สูตรนี้, ผมก็บอกว่า โอเค ระยะนี่กำลังสอง บวกระยะนี่ 00:07:16.780 --> 00:07:21.060 กำลังสอง บวกระยะนี่กำลังสอง บวก 00:07:21.060 --> 00:07:23.520 ระยะนั่นกำลังสอง แล้วเฉลี่ยทุกอย่างออกมา 00:07:23.520 --> 00:07:24.700 แล้วผมจะได้เลขนี้มา 00:07:24.700 --> 00:07:27.820 แล้วมันอาจเป็นค่าประมาณที่ดี 00:07:27.820 --> 00:07:30.260 สำหรับความแปรปรวนของประชากรทั้งหมดนี้ 00:07:30.260 --> 00:07:32.070 ค่าเฉลี่ยของประชากรก็จะ 00:07:32.070 --> 00:07:33.030 -- ไม่รู้สิ 00:07:33.030 --> 00:07:35.020 มันอาจอยู่ใกล้อันนี้ 00:07:35.020 --> 00:07:37.150 ถ้าเราเอาข้อมูลทุกจุดมาแล้วเฉลี่ยมัน, 00:07:37.150 --> 00:07:39.060 มันอาจอยู่ตรงนี้สักที่ 00:07:39.060 --> 00:07:40.660 แล้วถ้าคุณหาความแปรปรวน, มันอาจอยู่ 00:07:40.660 --> 00:07:43.590 ใกล้กับค่าเฉลี่ยของเส้นพวกนี้มาก, จริงไหม? 00:07:43.590 --> 00:07:46.810 ระยะทางของความแปรปรวนตัวอย่างทั้งหมด, จริงไหม? 00:07:46.810 --> 00:07:47.250 ใช้ได้ 00:07:47.250 --> 00:07:47.900 แล้วคุณบอกว่า, เฮ้ ซาล 00:07:47.900 --> 00:07:49.710 นี่ก็ดูดีแล้วนี่ 00:07:49.710 --> 00:07:51.940 แต่มันมีปัญหาอยู่นิดหน่อย 00:07:51.940 --> 00:07:54.560 ถ้าเกิด -- มันมีโอกาสที่ แทนที่จะ 00:07:54.560 --> 00:07:56.990 เลือกตัวเลขที่กระจายตัวดีอย่างนี้ 00:07:56.990 --> 00:08:00.800 เป็นตัวอย่าง, ถ้าเกิดผมเลือกได้เลขนี้, เลขนี้ 00:08:00.800 --> 00:08:03.920 แล้วก็เลขนั้น เป็นกลุ่ม -- สมมุติว่าเลขนั้นด้วย 00:08:03.920 --> 00:08:05.400 เป็นกลุ่มตัวอย่างของผมล่ะ? 00:08:05.400 --> 00:08:08.370 ทีนี้ ไม่ว่ากลุ่มตัวอย่างคุณเป็นอะไร ค่าเฉลี่ยตัวอย่าง 00:08:08.370 --> 00:08:10.210 จะอยู่ตรงกลางของมัน, จริงไหม? 00:08:10.210 --> 00:08:12.960 ในกรณีนี้, ค่าเฉลี่ยตัวอย่างอาจอยู่ตรงนี้ 00:08:12.960 --> 00:08:15.010 แล้วตัวเลขทั้งหมดนี้, คุณอาจบอกว่า โอเค เลขนี้ 00:08:15.010 --> 00:08:17.810 ไม่ไกลจากเลขนั้น, แต่เลขนั้นไม่ไกลนัก, แล้ว 00:08:17.810 --> 00:08:19.100 เลขนั้นก็ไม่ไกลเกินไป 00:08:19.100 --> 00:08:21.790 ค่าความแปรปรวนตัวอย่าง, เมื่อคุณหาแบบนี้, มันจะ 00:08:21.790 --> 00:08:23.610 ออกมาต่ำไปหน่อย 00:08:23.610 --> 00:08:26.920 เพราะตัวเลขพวกนี้, พวกมัน -- พวกมัน 00:08:26.920 --> 00:08:28.920 ตามนิยามนี้, จะอยู่ใกล้ค่าเฉลี่ย 00:08:28.920 --> 00:08:30.350 ของกันและกัน 00:08:30.350 --> 00:08:34.600 แต่ในกรณนี้, ตัวอย่างของคุณเบี้ยว 00:08:34.600 --> 00:08:37.980 ค่าเฉลี่ยของประชากรจริง อยู่ข้างนอกสักที่ 00:08:37.980 --> 00:08:40.800 ดังนั้นความแปรปรวนจริงของตัวอย่าง, ถ้าคุณรู้ 00:08:40.800 --> 00:08:43.670 ค่าเฉลี่ยจริง -- ผมรู้ว่านี่มันน่าสับสนหน่อย 00:08:43.670 --> 00:08:44.980 ถ้าคุณรู้ค่าเฉลี่ย, คุณจะบอกว่า 00:08:44.980 --> 00:08:46.830 โอ้ ว้าว 00:08:46.830 --> 00:08:48.386 คุณหาระยะพวกนี้ได้, ซึ่ง 00:08:48.386 --> 00:08:51.320 มีมากกว่านี้อีก 00:08:51.320 --> 00:08:53.640 ประเด็นที่ผมบอกคือว่า, เวลาคุณเลือก 00:08:53.640 --> 00:08:58.280 กลุ่มตัวอย่าง, มันมีโอกาสที่ค่าเฉลี่ยตัวอย่างของคุณ 00:08:58.280 --> 00:09:00.380 มันใกล้กับค่าเฉลี่ยประชากร, จริงไหม? 00:09:00.380 --> 00:09:02.610 บางทีค่าเฉลี่ยตัวอย่างอยู่ตรงนี้ และค่าเฉลี่ย 00:09:02.610 --> 00:09:03.360 ประชากรอยู่ตรงนี้ 00:09:03.360 --> 00:09:05.770 แล้วสูตรนี้จะใช้ได้เหมือนกัน, 00:09:05.770 --> 00:09:07.770 อย่างน้อยเมื่อรู้จุดข้อมูลของกลุ่มตัวอย่าง แล้วหา 00:09:07.770 --> 00:09:09.280 ว่าความแปรปรวนเป็นเท่าไหร่ 00:09:09.280 --> 00:09:14.240 แต่มันมีโอกาสทีเดียว ที่ค่าเฉลี่ยตัวอย่างของคุณ -- ค่าเฉลี่ยตัวอย่าง 00:09:14.240 --> 00:09:16.730 จะอยู่ข้างในกลุ่มตัวอย่างเสมอ, จริงไหม? 00:09:16.730 --> 00:09:18.740 มันจะอยู่ตรงศูนย์กลางของกลุ่มตัวอย่างเสมอ 00:09:18.740 --> 00:09:21.470 แต่มันเป็นไปได้ที่ค่าเฉลี่ยประชากร 00:09:21.470 --> 00:09:22.590 อยู่ข้างนอกกลุ่มตัวอย่าง 00:09:22.590 --> 00:09:24.750 มันอาจเป็นว่า คุณเลือกอัน 00:09:24.750 --> 00:09:28.110 ที่มันไม่มีค่าเฉลี่ยประชากรอยู่ข้างใน 00:09:28.110 --> 00:09:31.670 แล้วความแปรปรวนตัวอย่าง ที่คำนวณแบบนี้ จะ 00:09:31.670 --> 00:09:34.990 คาดเดาความแปรปรวนประชากรต่ำไป 00:09:34.990 --> 00:09:36.240 , จริงไหม? 00:09:36.240 --> 00:09:38.230 เพราะมันเลือกค่าเฉลี่ยที่ใกล้ตัวเอง 00:09:38.230 --> 00:09:39.960 มากกว่าค่าเฉลี่ยประชากร 00:09:39.960 --> 00:09:43.460 และถ้าคุณเข้าใจ, ที่จริง, แค่สัก 10% 00:09:43.460 --> 00:09:45.770 ของอันนี้, คุณก็เป็นนักเรียนวิชาสิถิตระดับสูงแล้ว 00:09:45.770 --> 00:09:49.120 แต่ผมบอกเรื่องพวกนี้ให้คุณ, หวังว่า 00:09:49.120 --> 00:09:53.500 จะได้สัญชาตญาณเพื่อเข้าใจว่า อันนี้มักประเมินค่าต่ำไป 00:09:53.500 --> 00:09:57.240 สูตรนี้มักกะค่าความแปรปรวนของ 00:09:57.240 --> 00:09:59.110 ประชากรจริงต่ำไป 00:09:59.110 --> 00:10:01.420 และมันมีสูตร, และที่จริงมีวิธีพิสูจน์ 00:10:01.420 --> 00:10:04.740 ที่รัดกุมกว่าที่ผมทำ, มันมีวิธีที่ดีกว่า 00:10:04.740 --> 00:10:08.000 และเขาเรียกมันว่าค่าประมาณความแปรปรวน 00:10:08.000 --> 00:10:09.030 ประชารที่ไม่เอนเอียง 00:10:09.030 --> 00:10:11.390 หรือความแปรปรวนตัวอย่างแบบไม่เอนเอียง 00:10:11.390 --> 00:10:14.160 บางครั้งเขาเขียนแทนด้วย s กำลังสองเหมือนเดิม 00:10:14.160 --> 00:10:18.930 บางครั้งเขาเขียนด้วย s n ลบ 1 กำลังสอง 00:10:18.930 --> 00:10:20.720 และผมจะแสดงให้ดูว่าทำไม 00:10:20.720 --> 00:10:22.340 มันเกือบเหมือนเดิม 00:10:22.340 --> 00:10:24.730 คุณเอาจุดข้อมูลแต่ละจุดมา, หาว่าพวกมัน 00:10:24.730 --> 00:10:28.170 ใกล้จากค่าเฉลี่ยตัวอย่างแค่ไหน 00:10:28.170 --> 00:10:28.900 คุณยกกำลังพวกมัน 00:10:28.900 --> 00:10:31.830 แล้วคุณหาค่าเฉลี่ยของพวกนั้นกำลังสอง, ยกเว้น 00:10:31.830 --> 00:10:33.430 อยู่อย่างเดียว 00:10:33.430 --> 00:10:35.720 i เท่ากับ 1 ถึง i เท่ากับ n 00:10:35.720 --> 00:10:39.370 แทนที่จะหารด้วย n, คุณหารด้วยเลข 00:10:39.370 --> 00:10:41.920 ที่น้อยลงหน่อย 00:10:41.920 --> 00:10:44.350 คุณหารด้วย n ลบ 1 00:10:44.350 --> 00:10:46.880 แล้วเมื่อคุณหารด้วย n-1 แทนที่จะหารด้วย 00:10:46.880 --> 00:10:49.590 n, คุณจะได้ค่าที่มากกว่านิดหน่อยตรงนี้ 00:10:49.590 --> 00:10:51.060 ปรากฏว่านี่คือ 00:10:51.060 --> 00:10:52.260 ค่าประมาณที่ดีกว่า 00:10:52.260 --> 00:10:54.810 และวันหนึ่ง ผมจะเขียนโปรแกรมคอมพิวเตอร์เพื่อพิสูจน์ 00:10:54.810 --> 00:10:57.430 อย่างน้อยด้วยการทดลอง ว่านี่ 00:10:57.430 --> 00:11:01.750 คือการประมาณควาามแปรปรวนของประชากรที่ดีกว่า 00:11:01.750 --> 00:11:03.430 และคุณสามารถคำนวณมันแบบเดียวกันได้ 00:11:03.430 --> 00:11:05.270 คุณแค่หารด้วย n ลบ 1 00:11:05.270 --> 00:11:07.450 วิธีคิดอีกอย่างคือว่า -- และที่จริง, ไม่ 00:11:07.450 --> 00:11:08.340 ผมหมดเวลาแล้ว 00:11:08.340 --> 00:11:09.500 ผมปล่อยคุณไปก่อนนะ 00:11:09.500 --> 00:11:10.710 แล้วในวิดีโอหน้าล เราจะมาคำนวณ 00:11:10.710 --> 00:11:12.590 เพื่อให้คุณไม่รู้สึกล้นเกินไป 00:11:12.590 --> 00:11:13.270 เนื่องจากแนวคิดพวกนี้ 00:11:13.270 --> 00:11:14.810 เพราะเราใช้แนวคิดที่เป็นนามธรรมอยู่ 00:11:14.810 --> 00:11:16.660 แล้วพบกันในวิดีโอหน้าครับ 00:11:16.660 --> 00:11:17.000 -