1 00:00:00,000 --> 00:00:01,100 - 2 00:00:01,100 --> 00:00:03,320 วิดีโออันนี้เป็นวิดีโอที่พิเศษสุด 3 00:00:03,320 --> 00:00:05,340 ด้วยเหตุผลหลายอย่าง 4 00:00:05,340 --> 00:00:09,910 อย่างแรก, ผมจะแนะนำให้คุณรู้จักความแปรปรวนของตัวอย่าง, 5 00:00:09,910 --> 00:00:11,750 ซึ่งเป็นเรื่องที่น่สนใจ 6 00:00:11,750 --> 00:00:14,520 และผมพายามจะบันทึกวิดีโอนี้เป็นแบบ HD 7 00:00:14,520 --> 00:00:16,370 หวังว่าคุณจะเห็นได้ใหญ่ขึ้นและชัดขึ้น 8 00:00:16,370 --> 00:00:17,030 กว่าที่เคย 9 00:00:17,030 --> 00:00:19,150 แต่เราจะดุว่ามันเป็นอย่างไร 10 00:00:19,150 --> 00:00:22,060 นี่เป็นการทดลองนิดหน่อย, ทนกับผมหน่อยนะ 11 00:00:22,060 --> 00:00:25,180 แต่, ก่อนที่เราจะพูดถึงความแปรปรวนของตัวอย่างล 12 00:00:25,180 --> 00:00:28,090 ผมคิดว่ามันดีต่อการเรียน ถ้าเราจะทบทวนความแปรปรวน 13 00:00:28,090 --> 00:00:28,870 ของประชากรกันก่อน 14 00:00:28,870 --> 00:00:32,180 แล้วเราถึงเปรียบเทียบสูตรของมันได้ 15 00:00:32,180 --> 00:00:34,790 ความแปรปรวนของประชากร -- นี่คือตัวอักษร 16 00:00:34,790 --> 00:00:36,100 กรีกซิกม่า 17 00:00:36,100 --> 00:00:37,420 ซิกม่าเล็ก กำลังสอง 18 00:00:37,420 --> 00:00:38,500 นั่นหมายถึงความแปรปรวน 19 00:00:38,500 --> 00:00:41,010 ผมรู้ว่ามันแปลกๆ ที่ตัวแปร 20 00:00:41,010 --> 00:00:41,710 มีกำลังสองติดมาอยู่แล้ว 21 00:00:41,710 --> 00:00:42,840 คุณได้กำลังสองตัวแปรนี้ 22 00:00:42,840 --> 00:00:44,240 นี่คือตัวแปร 23 00:00:44,240 --> 00:00:45,780 ซิกม่ากำลังสอง หมายถึงความแปรปรวน 24 00:00:45,780 --> 00:00:46,840 ที่จริง, ขอผมเขียนลงไปนะ 25 00:00:46,840 --> 00:00:48,005 นั่นเท่ากับความแปรปรวน 26 00:00:48,005 --> 00:00:51,550 - 27 00:00:51,550 --> 00:00:55,430 และนั่นเท่ากับ -- คุณหาจุดข้อมูลแต่ละจุดมา -- แล้ว 28 00:00:55,430 --> 00:00:58,800 เราจะเรียกมันว่า x ห้อย i 29 00:00:58,800 --> 00:01:01,700 คุณเอาจุดข้อมูลแต่จุดมา หาว่ามันห่างจาก 30 00:01:01,700 --> 00:01:08,750 ค่าเฉลี่ยประชากรเท่าไหร่, คุณกำลังสองมัน, แล้วคุณก็ 31 00:01:08,750 --> 00:01:11,160 หาค่าเฉลี่ยของทั้งหมดนั้น 32 00:01:11,160 --> 00:01:12,900 แล้วคุณหาค่าเฉลี่ย, คุณบวกทุกอย่างเข้าด้วยกัน 33 00:01:12,900 --> 00:01:14,200 คุณก็ไปจาก i เท่ากับ 1 34 00:01:14,200 --> 00:01:17,700 จากจุดนั้น, ไปจนถึงจุดที่ n 35 00:01:17,700 --> 00:01:19,940 แล้ว, เวลาเฉลี่ย, คุณบวกมันจนหมด 36 00:01:19,940 --> 00:01:21,970 แล้วหารด้วย n 37 00:01:21,970 --> 00:01:25,970 ความแปรปรวนก็คือค่าเฉลี่ยของกำลังสองของระยะห่าง 38 00:01:25,970 --> 00:01:27,390 แต่ละจุดเหล่านี้ ไปยังค่าเฉลี่ย 39 00:01:27,390 --> 00:01:29,700 เพื่อให้คุณได้สัญชาตญาณอีกที, มันบอกว่า 40 00:01:29,700 --> 00:01:32,920 โดยเฉลี่ยแล้ว, แต่ละจุด 41 00:01:32,920 --> 00:01:34,420 หาจากตรงกลางแค่ไหน 42 00:01:34,420 --> 00:01:36,250 นั่นคือวิธีคิดถึงความแปรปรวนที่ดีที่สุด 43 00:01:36,250 --> 00:01:37,640 ทีนี้ ถ้าเกิดเรามี -- นี่ 44 00:01:37,640 --> 00:01:39,140 สำหรับประชากร, จริงไหม? 45 00:01:39,140 --> 00:01:42,050 และเราบอกว่า ถ้าเราอยากหาความแปรปรวนของ 46 00:01:42,050 --> 00:01:44,580 ความสูงของคนในประเทศนี้, มันยาก 47 00:01:44,580 --> 00:01:46,480 ที่จะหาความแปรปรวนของประชากร 48 00:01:46,480 --> 00:01:48,910 คุณต้องไป, วัดความสูง 49 00:01:48,910 --> 00:01:49,790 ของทุกคน 50 00:01:49,790 --> 00:01:51,360 250 ล้านคน 51 00:01:51,360 --> 00:01:55,080 หรือถ้ามีประชากรซึ่งเราไม่มีทาง 52 00:01:55,080 --> 00:01:56,860 หาข้อมูลได้ มาจาก 53 00:01:56,860 --> 00:01:57,640 ตัวแปรสุ่ม 54 00:01:57,640 --> 00:01:59,100 เราจะพูดถึงเรื่องนั้นทีหลัง 55 00:01:59,100 --> 00:02:02,660 หลายครั้งคุณต้องประมาณค่าความแปรปรวนนี้ 56 00:02:02,660 --> 00:02:04,690 ด้วยการหาความแปรปรวนของตัวอย่างแทน 57 00:02:04,690 --> 00:02:07,420 เหมือนกับที่คุณไม่มีทางหาค่าเฉลี่ยของประชากร 58 00:02:07,420 --> 00:02:09,570 บางทีคุณอาจกะค่ามันด้วย 59 00:02:09,570 --> 00:02:11,064 การหาค่าเฉลี่ยของตัวอย่าง 60 00:02:11,064 --> 00:02:13,890 และเราเรียนไปในวิดีโอที่แล้ว 61 00:02:13,890 --> 00:02:17,520 ถ้านี่คือ -- ถ้านี่คือประชากรทั้งหมด 62 00:02:17,520 --> 00:02:20,280 นั่นคือจุดข้อมูลเป็นล้าน, หรือแม้กระทั่งจุดข้อมูล 63 00:02:20,280 --> 00:02:21,870 ในอนาคตที่คุณหาไม่ได้ เพราะมันเป็น 64 00:02:21,870 --> 00:02:23,290 ตัวแปรสุ่ม 65 00:02:23,290 --> 00:02:24,243 นี่คือประชากร 66 00:02:24,243 --> 00:02:26,920 - 67 00:02:26,920 --> 00:02:32,390 คุณอาจอยากประมาณค่าด้วยการดูที่กลุ่มตัวอย่าง 68 00:02:32,390 --> 00:02:35,020 และนี่คือสถิติเชิงอนุมาน 69 00:02:35,020 --> 00:02:36,360 เกี่ยวข้องเป็นส่วนใหญ่ 70 00:02:36,360 --> 00:02:38,720 คือการหาสถิติเชิงพรรณนาของกลุ่มตัวอย่าง 71 00:02:38,720 --> 00:02:40,890 แล้วอนุมานไปถึงประชากร 72 00:02:40,890 --> 00:02:44,610 ขอผมลองใช้ยานี้กับคน 100 คน แล้วถ้ามัน 73 00:02:44,610 --> 00:02:46,880 ดูได้ผลอย่างมีนัยสำคัญทางสถิติ, ยานี้ก็ควร 74 00:02:46,880 --> 00:02:48,850 ใช้ได้กับประชาการทั้งหมดด้วย 75 00:02:48,850 --> 00:02:49,800 นั่นคือสิ่งที่มันหมายถึง 76 00:02:49,800 --> 00:02:51,920 การเข้าใจแนวคิดเรื่องกลุ่มตัวอย่าง 77 00:02:51,920 --> 00:02:53,580 เทียบกับประชากรเป็นสิ่งสำคัญ 78 00:02:53,580 --> 00:02:57,510 การหาค่าทางสถิติของตัวอย่างได้, 79 00:02:57,510 --> 00:03:00,160 ส่วนใหญ่แล้ว, สามารถใช้บรรยายประชากร หรือช่วย 80 00:03:00,160 --> 00:03:03,720 ให้ประมาณค่า, เขาเรียกกันว่า, พารามิเตอร์ของประชากรได้ 81 00:03:03,720 --> 00:03:07,330 แล้วค่าเฉลี่ยของ -- ขอผมเขียนนิยามพวกนี้ใหม่นะ 82 00:03:07,330 --> 00:03:08,830 ค่าเฉลี่ยของประชากรคืออะไร? 83 00:03:08,830 --> 00:03:09,940 ผมจะใช้สีม่วงนะ 84 00:03:09,940 --> 00:03:11,630 สีม่วงแทนประชากร 85 00:03:11,630 --> 00:03:13,680 ค่าเฉลี่ยของประชากร 86 00:03:13,680 --> 00:03:19,700 คุณแค่เอาจุดข้อมูลแต่ละตัวมาในประชากร, x i 87 00:03:19,700 --> 00:03:21,850 คุณบวกมันเข้า 88 00:03:21,850 --> 00:03:23,830 คุณเริ่มด้วยจุดข้อมูลอันแรก แล้วคุณก็ทำ 89 00:03:23,830 --> 00:03:25,620 ไปจนถึงจุดข้อมูลที่ n 90 00:03:25,620 --> 00:03:26,740 แล้วคุณหารด้วย n 91 00:03:26,740 --> 00:03:27,800 คุณบวกพวกมันไปจนถึง n 92 00:03:27,800 --> 00:03:28,920 นั่นคือค่าเฉลี่ย 93 00:03:28,920 --> 00:03:30,500 แล้วคุณก็แทนมันลงในสูตรนี้ 94 00:03:30,500 --> 00:03:33,060 แล้วคุณก็หาได้ว่าแต่ละจุดไกลจากจุดศูนย์กลาง 95 00:03:33,060 --> 00:03:34,270 จากค่าเฉลี่ยนั้นแค่ไหน 96 00:03:34,270 --> 00:03:36,260 และคุณจะได้ความแปรปรวน 97 00:03:36,260 --> 00:03:39,670 ทีนี้ เกิดอะไรขึ้นถ้าเราทำสำหรับตัวอย่างด้วย? 98 00:03:39,670 --> 00:03:43,350 ทีนี้, ถ้าเราอยากประมาณค่าเฉลี่ยประชากร ด้วย 99 00:03:43,350 --> 00:03:46,600 การคำนวณค่าเฉลี่ยของตัวอย่าง, สิ่งที่ดีที่สุดที่ผม 100 00:03:46,600 --> 00:03:49,170 คิดได้ -- นี่คือสูตรที่ประดิษฐ์ขึ้นมาทั้งนั้น 101 00:03:49,170 --> 00:03:51,140 มีคนบอกว่า, เราจะหาค่าตัวอย่าง 102 00:03:51,140 --> 00:03:51,710 ที่ดีที่สุดอย่างไร? 103 00:03:51,710 --> 00:03:54,550 ทีนี้ สิ่งที่เราทำได้ ก็แค่หาค่าเฉลี่ยของตัวอย่าง 104 00:03:54,550 --> 00:03:56,820 และนั่นคือค่าเฉลี่ยของกลุ่มตัวอย่าง 105 00:03:56,820 --> 00:03:58,920 และเราเรียนในวิดีโอแรก ว่าสัญลักษณ์ -- 106 00:03:58,920 --> 00:04:00,450 สูตรเกือบเหมือนกันเลย 107 00:04:00,450 --> 00:04:01,540 แต่สัญลักษณ์ต่างกัน 108 00:04:01,540 --> 00:04:04,990 แทนที่จะเขีน มิว, คุณเขียนว่า x มีขีดอยู่ข้างบน 109 00:04:04,990 --> 00:04:08,620 ค่าเฉลี่ยตัวอย่าง เท่ากับ -- เหมือนเดิม, คุณเอา 110 00:04:08,620 --> 00:04:12,100 จุดข้อมูลตอนนี้ คือในกลุ่มตัวอย่าง, ไม่ใช่ประชากรทั้งหมด 111 00:04:12,100 --> 00:04:16,370 คุณบวกพวกมันเข้า จากอันแรกไป 112 00:04:16,370 --> 00:04:17,380 จนถึงตัวที่ n, จริงไหม? 113 00:04:17,380 --> 00:04:20,640 เขาบอกว่า มันมีจุดข้อมูล n ตัวในกลุ่มตัวอย่าง 114 00:04:20,640 --> 00:04:23,390 แล้วคุณหารมันด้วยจำนวนจุดข้อมูลที่คุณมี 115 00:04:23,390 --> 00:04:24,320 ใช้ได้ 116 00:04:24,320 --> 00:04:25,660 นี่มีสูตรเหมือนกัน 117 00:04:25,660 --> 00:04:27,500 วิธีที่ผมหาค่าเฉลี่ยขอประชากร, ผมบอกว่า, เอาล่ะ, ถ้า 118 00:04:27,500 --> 00:04:29,590 ผมมีตัวอย่าง, ขอผมหาค่าเฉลี่ยแบบเดียวกัน 119 00:04:29,590 --> 00:04:32,560 และมันอาจเป็นค่าประมาณที่ดีสำหรับค่าเฉลี่ย 120 00:04:32,560 --> 00:04:33,930 ของประชากรด้วย 121 00:04:33,930 --> 00:04:36,340 ทีนี้ มันน่าสนใจตอนเราพูดถึงความแปรปรวน 122 00:04:36,340 --> 00:04:39,250 ปฏิกิริยาตามธรรมชาติคือว่า โอเค, ผมมีกลุ่มตัวอย่างนี้ 123 00:04:39,250 --> 00:04:43,260 ถ้าผมอยากหาค่าความแปรปรวนของประชากร, ทำไม 124 00:04:43,260 --> 00:04:45,230 เราไม่ใช้สูตรเดียวกับที่เรา 125 00:04:45,230 --> 00:04:46,150 ใช้กับตัวอย่างล่ะ? 126 00:04:46,150 --> 00:04:49,330 ผมก็บอกได้ว่า -- นี่คือความแปรปรวนตัวอย่าง 127 00:04:49,330 --> 00:04:54,570 เขาใช้สูตร s กำลังสอง 128 00:04:54,570 --> 00:04:58,220 ซิกม่าก็เหมือนกับตัวอักษรกรีกของ s 129 00:04:58,220 --> 00:04:59,980 ตอนนี้เวลาเราคิดกลุ่มตัวอย่าง, เรา 130 00:04:59,980 --> 00:05:01,000 แค่เขียน s ลงไป 131 00:05:01,000 --> 00:05:02,320 นี่ก็คือความแปรปรวนของตัวอย่าง 132 00:05:02,320 --> 00:05:03,070 ขอผมเขียนมันลงไปนะ 133 00:05:03,070 --> 00:05:03,950 ความแปรปรวนของตัวอย่าง 134 00:05:03,950 --> 00:05:11,860 - 135 00:05:11,860 --> 00:05:15,870 นี่คือ -- เราก็อาจบอกว่า, นี่อาจเป็นวิธีที่ดีในการ 136 00:05:15,870 --> 00:05:17,340 หาความแปรปรวนตัวอย่าง คือทำแบบนี้ 137 00:05:17,340 --> 00:05:23,670 ลองหาระยะห่างของแต่ละจุดในตัวอย่าง 138 00:05:23,670 --> 00:05:26,600 หาว่ามันห่างจากค่าเฉลี่ยตัวอย่างแค่ไหน 139 00:05:26,600 --> 00:05:29,230 ตรงนี้ เราใช้ค่าเฉลี่ยประชากร, แต่ตอนนี้เราจะใช้ 140 00:05:29,230 --> 00:05:31,450 ค่าเฉลี่ยตัวอย่าง เพราะนั่นคือสิ่งที่เรามี 141 00:05:31,450 --> 00:05:33,160 เราไม่รู้ว่าค่าเฉลี่ยประชากรเป็นเท่าไหร่ 142 00:05:33,160 --> 00:05:35,510 หากไม่ดูประชากรทั้งหมด 143 00:05:35,510 --> 00:05:36,400 ยกกำลังมัน 144 00:05:36,400 --> 00:05:38,160 นั่นทำให้มันเป็นบวก และมันมีสมบัติอื่น 145 00:05:38,160 --> 00:05:40,160 ซึ่งเราจะพูดถึงต่อไป 146 00:05:40,160 --> 00:05:42,730 แล้วถ้าเราหาค่าเฉลี่ยของระยะกำลังสองพวกนี้ 147 00:05:42,730 --> 00:05:44,970 แล้วคุณก็หาค่ามันจาก -- คุณรวมพวกมันเข้า 148 00:05:44,970 --> 00:05:47,430 มันมีอยู่ n ตัวให้รวม, จริงไหม? 149 00:05:47,430 --> 00:05:48,400 n เล็ก 150 00:05:48,400 --> 00:05:51,820 แล้วคุณก็หารมันด้วยตัว n เล็ก 151 00:05:51,820 --> 00:05:53,230 และคุณบอกว่า, นี่เป็นค่าประมาณที่ดี 152 00:05:53,230 --> 00:05:55,580 ไม่ว่าความแปรปรวนนี้เป็นอะไร, มันน่าจะเป็นค่าประมาณที่ดี 153 00:05:55,580 --> 00:05:56,720 สำหรับประชากรทั้งหมด 154 00:05:56,720 --> 00:06:00,620 ที่จริง นี่คือสิ่งที่บางคนมักหมายถึง เวลาเขา 155 00:06:00,620 --> 00:06:01,980 พูดถึงความแปรปรวนของตัวอย่าง 156 00:06:01,980 --> 00:06:05,260 และบางครั้ง มันมักหมายถึงอันนี้ 157 00:06:05,260 --> 00:06:07,520 เขาจะเขียน n เล็กตรงนี้ 158 00:06:07,520 --> 00:06:09,840 และสาเหตุที่เขาทำอย่างนั้น เพราะเราหารด้วย n 159 00:06:09,840 --> 00:06:11,840 แล้วคุณบอกว่า, ซาล มันมีปัญหาอะไรเหรอ? 160 00:06:11,840 --> 00:06:14,000 และปัญหา -- ผมจะบอกถึงสัญชาตญาณให้ฟัง เพราะนี่ 161 00:06:14,000 --> 00:06:16,180 เป็นบางสิ่งที่ผมเคยสงสัยในใจ 162 00:06:16,180 --> 00:06:19,340 และผมยังคงมีปัญหากับ 163 00:06:19,340 --> 00:06:21,530 สัญชาตญาณเบื้องหลังเรื่องนี้อยู่ 164 00:06:21,530 --> 00:06:24,510 ผมมีสัญชาตญาณอยู่, แต่เราต้องพิสูจน์ 165 00:06:24,510 --> 00:06:26,950 ด้วยตัวองว่ามันเป็นอย่างนั้นจริง 166 00:06:26,950 --> 00:06:28,280 แต่ลองคิดดู 167 00:06:28,280 --> 00:06:29,905 ถ้าผมมีเลขหลายๆ ตัว, และผมจะวาด 168 00:06:29,905 --> 00:06:32,740 เส้นจำนวนตรงนี้ 169 00:06:32,740 --> 00:06:35,740 ถ้าผมวาดเส้นจำนวนตรงนี้ -- สมมุติคุณรู้ว่า -- 170 00:06:35,740 --> 00:06:39,430 สมมุติว่าผมมีเลขหลายๆ ตัวในประชากร 171 00:06:39,430 --> 00:06:41,660 สมมุติว่า -- ผมจะสุ่มใส่เลข 172 00:06:41,660 --> 00:06:44,280 ลงไปเป็นประชากรนะ 173 00:06:44,280 --> 00:06:45,928 อันที่อยู่ทางขวา มากกว่าอัน 174 00:06:45,928 --> 00:06:46,355 ที่อยู่ทางซ้าย 175 00:06:46,355 --> 00:06:48,900 - 176 00:06:48,900 --> 00:06:52,990 แล้วถ้าผมเลือกกลุ่มตัวอย่างจากมัน, บางทีผมเลือก -- 177 00:06:52,990 --> 00:06:54,820 ตัวอย่าง, มันเป็นไปอย่างสุ่ม 178 00:06:54,820 --> 00:06:56,210 ที่จริงคุณอยากเลือกตัวอย่างแบบสุ่ม 179 00:06:56,210 --> 00:06:57,320 คุณไม่อยากเลือกให้มันเบี้ยวไป 180 00:06:57,320 --> 00:07:02,900 บางทีผมเลือกอันนี้, อันนี้, อันนี้, 181 00:07:02,900 --> 00:07:05,420 แล้วก็อันนั้น, ดีไหม? 182 00:07:05,420 --> 00:07:07,480 แล้วถ้าเราหาค่าเฉลี่ยและเลขนั้น, 183 00:07:07,480 --> 00:07:08,460 เลขนั้น, เลขนั้น, เลขนั้น 184 00:07:08,460 --> 00:07:09,320 มันจะอยู่ตรงกลางสักที่ 185 00:07:09,320 --> 00:07:11,010 มันอาจจะอยู่แถวโน้น 186 00:07:11,010 --> 00:07:13,240 แล้วถ้าเราหาความแปรปรวนตัวอย่าง โดยใช้ 187 00:07:13,240 --> 00:07:16,780 สูตรนี้, ผมก็บอกว่า โอเค ระยะนี่กำลังสอง บวกระยะนี่ 188 00:07:16,780 --> 00:07:21,060 กำลังสอง บวกระยะนี่กำลังสอง บวก 189 00:07:21,060 --> 00:07:23,520 ระยะนั่นกำลังสอง แล้วเฉลี่ยทุกอย่างออกมา 190 00:07:23,520 --> 00:07:24,700 แล้วผมจะได้เลขนี้มา 191 00:07:24,700 --> 00:07:27,820 แล้วมันอาจเป็นค่าประมาณที่ดี 192 00:07:27,820 --> 00:07:30,260 สำหรับความแปรปรวนของประชากรทั้งหมดนี้ 193 00:07:30,260 --> 00:07:32,070 ค่าเฉลี่ยของประชากรก็จะ 194 00:07:32,070 --> 00:07:33,030 -- ไม่รู้สิ 195 00:07:33,030 --> 00:07:35,020 มันอาจอยู่ใกล้อันนี้ 196 00:07:35,020 --> 00:07:37,150 ถ้าเราเอาข้อมูลทุกจุดมาแล้วเฉลี่ยมัน, 197 00:07:37,150 --> 00:07:39,060 มันอาจอยู่ตรงนี้สักที่ 198 00:07:39,060 --> 00:07:40,660 แล้วถ้าคุณหาความแปรปรวน, มันอาจอยู่ 199 00:07:40,660 --> 00:07:43,590 ใกล้กับค่าเฉลี่ยของเส้นพวกนี้มาก, จริงไหม? 200 00:07:43,590 --> 00:07:46,810 ระยะทางของความแปรปรวนตัวอย่างทั้งหมด, จริงไหม? 201 00:07:46,810 --> 00:07:47,250 ใช้ได้ 202 00:07:47,250 --> 00:07:47,900 แล้วคุณบอกว่า, เฮ้ ซาล 203 00:07:47,900 --> 00:07:49,710 นี่ก็ดูดีแล้วนี่ 204 00:07:49,710 --> 00:07:51,940 แต่มันมีปัญหาอยู่นิดหน่อย 205 00:07:51,940 --> 00:07:54,560 ถ้าเกิด -- มันมีโอกาสที่ แทนที่จะ 206 00:07:54,560 --> 00:07:56,990 เลือกตัวเลขที่กระจายตัวดีอย่างนี้ 207 00:07:56,990 --> 00:08:00,800 เป็นตัวอย่าง, ถ้าเกิดผมเลือกได้เลขนี้, เลขนี้ 208 00:08:00,800 --> 00:08:03,920 แล้วก็เลขนั้น เป็นกลุ่ม -- สมมุติว่าเลขนั้นด้วย 209 00:08:03,920 --> 00:08:05,400 เป็นกลุ่มตัวอย่างของผมล่ะ? 210 00:08:05,400 --> 00:08:08,370 ทีนี้ ไม่ว่ากลุ่มตัวอย่างคุณเป็นอะไร ค่าเฉลี่ยตัวอย่าง 211 00:08:08,370 --> 00:08:10,210 จะอยู่ตรงกลางของมัน, จริงไหม? 212 00:08:10,210 --> 00:08:12,960 ในกรณีนี้, ค่าเฉลี่ยตัวอย่างอาจอยู่ตรงนี้ 213 00:08:12,960 --> 00:08:15,010 แล้วตัวเลขทั้งหมดนี้, คุณอาจบอกว่า โอเค เลขนี้ 214 00:08:15,010 --> 00:08:17,810 ไม่ไกลจากเลขนั้น, แต่เลขนั้นไม่ไกลนัก, แล้ว 215 00:08:17,810 --> 00:08:19,100 เลขนั้นก็ไม่ไกลเกินไป 216 00:08:19,100 --> 00:08:21,790 ค่าความแปรปรวนตัวอย่าง, เมื่อคุณหาแบบนี้, มันจะ 217 00:08:21,790 --> 00:08:23,610 ออกมาต่ำไปหน่อย 218 00:08:23,610 --> 00:08:26,920 เพราะตัวเลขพวกนี้, พวกมัน -- พวกมัน 219 00:08:26,920 --> 00:08:28,920 ตามนิยามนี้, จะอยู่ใกล้ค่าเฉลี่ย 220 00:08:28,920 --> 00:08:30,350 ของกันและกัน 221 00:08:30,350 --> 00:08:34,600 แต่ในกรณนี้, ตัวอย่างของคุณเบี้ยว 222 00:08:34,600 --> 00:08:37,980 ค่าเฉลี่ยของประชากรจริง อยู่ข้างนอกสักที่ 223 00:08:37,980 --> 00:08:40,800 ดังนั้นความแปรปรวนจริงของตัวอย่าง, ถ้าคุณรู้ 224 00:08:40,800 --> 00:08:43,670 ค่าเฉลี่ยจริง -- ผมรู้ว่านี่มันน่าสับสนหน่อย 225 00:08:43,670 --> 00:08:44,980 ถ้าคุณรู้ค่าเฉลี่ย, คุณจะบอกว่า 226 00:08:44,980 --> 00:08:46,830 โอ้ ว้าว 227 00:08:46,830 --> 00:08:48,386 คุณหาระยะพวกนี้ได้, ซึ่ง 228 00:08:48,386 --> 00:08:51,320 มีมากกว่านี้อีก 229 00:08:51,320 --> 00:08:53,640 ประเด็นที่ผมบอกคือว่า, เวลาคุณเลือก 230 00:08:53,640 --> 00:08:58,280 กลุ่มตัวอย่าง, มันมีโอกาสที่ค่าเฉลี่ยตัวอย่างของคุณ 231 00:08:58,280 --> 00:09:00,380 มันใกล้กับค่าเฉลี่ยประชากร, จริงไหม? 232 00:09:00,380 --> 00:09:02,610 บางทีค่าเฉลี่ยตัวอย่างอยู่ตรงนี้ และค่าเฉลี่ย 233 00:09:02,610 --> 00:09:03,360 ประชากรอยู่ตรงนี้ 234 00:09:03,360 --> 00:09:05,770 แล้วสูตรนี้จะใช้ได้เหมือนกัน, 235 00:09:05,770 --> 00:09:07,770 อย่างน้อยเมื่อรู้จุดข้อมูลของกลุ่มตัวอย่าง แล้วหา 236 00:09:07,770 --> 00:09:09,280 ว่าความแปรปรวนเป็นเท่าไหร่ 237 00:09:09,280 --> 00:09:14,240 แต่มันมีโอกาสทีเดียว ที่ค่าเฉลี่ยตัวอย่างของคุณ -- ค่าเฉลี่ยตัวอย่าง 238 00:09:14,240 --> 00:09:16,730 จะอยู่ข้างในกลุ่มตัวอย่างเสมอ, จริงไหม? 239 00:09:16,730 --> 00:09:18,740 มันจะอยู่ตรงศูนย์กลางของกลุ่มตัวอย่างเสมอ 240 00:09:18,740 --> 00:09:21,470 แต่มันเป็นไปได้ที่ค่าเฉลี่ยประชากร 241 00:09:21,470 --> 00:09:22,590 อยู่ข้างนอกกลุ่มตัวอย่าง 242 00:09:22,590 --> 00:09:24,750 มันอาจเป็นว่า คุณเลือกอัน 243 00:09:24,750 --> 00:09:28,110 ที่มันไม่มีค่าเฉลี่ยประชากรอยู่ข้างใน 244 00:09:28,110 --> 00:09:31,670 แล้วความแปรปรวนตัวอย่าง ที่คำนวณแบบนี้ จะ 245 00:09:31,670 --> 00:09:34,990 คาดเดาความแปรปรวนประชากรต่ำไป 246 00:09:34,990 --> 00:09:36,240 , จริงไหม? 247 00:09:36,240 --> 00:09:38,230 เพราะมันเลือกค่าเฉลี่ยที่ใกล้ตัวเอง 248 00:09:38,230 --> 00:09:39,960 มากกว่าค่าเฉลี่ยประชากร 249 00:09:39,960 --> 00:09:43,460 และถ้าคุณเข้าใจ, ที่จริง, แค่สัก 10% 250 00:09:43,460 --> 00:09:45,770 ของอันนี้, คุณก็เป็นนักเรียนวิชาสิถิตระดับสูงแล้ว 251 00:09:45,770 --> 00:09:49,120 แต่ผมบอกเรื่องพวกนี้ให้คุณ, หวังว่า 252 00:09:49,120 --> 00:09:53,500 จะได้สัญชาตญาณเพื่อเข้าใจว่า อันนี้มักประเมินค่าต่ำไป 253 00:09:53,500 --> 00:09:57,240 สูตรนี้มักกะค่าความแปรปรวนของ 254 00:09:57,240 --> 00:09:59,110 ประชากรจริงต่ำไป 255 00:09:59,110 --> 00:10:01,420 และมันมีสูตร, และที่จริงมีวิธีพิสูจน์ 256 00:10:01,420 --> 00:10:04,740 ที่รัดกุมกว่าที่ผมทำ, มันมีวิธีที่ดีกว่า 257 00:10:04,740 --> 00:10:08,000 และเขาเรียกมันว่าค่าประมาณความแปรปรวน 258 00:10:08,000 --> 00:10:09,030 ประชารที่ไม่เอนเอียง 259 00:10:09,030 --> 00:10:11,390 หรือความแปรปรวนตัวอย่างแบบไม่เอนเอียง 260 00:10:11,390 --> 00:10:14,160 บางครั้งเขาเขียนแทนด้วย s กำลังสองเหมือนเดิม 261 00:10:14,160 --> 00:10:18,930 บางครั้งเขาเขียนด้วย s n ลบ 1 กำลังสอง 262 00:10:18,930 --> 00:10:20,720 และผมจะแสดงให้ดูว่าทำไม 263 00:10:20,720 --> 00:10:22,340 มันเกือบเหมือนเดิม 264 00:10:22,340 --> 00:10:24,730 คุณเอาจุดข้อมูลแต่ละจุดมา, หาว่าพวกมัน 265 00:10:24,730 --> 00:10:28,170 ใกล้จากค่าเฉลี่ยตัวอย่างแค่ไหน 266 00:10:28,170 --> 00:10:28,900 คุณยกกำลังพวกมัน 267 00:10:28,900 --> 00:10:31,830 แล้วคุณหาค่าเฉลี่ยของพวกนั้นกำลังสอง, ยกเว้น 268 00:10:31,830 --> 00:10:33,430 อยู่อย่างเดียว 269 00:10:33,430 --> 00:10:35,720 i เท่ากับ 1 ถึง i เท่ากับ n 270 00:10:35,720 --> 00:10:39,370 แทนที่จะหารด้วย n, คุณหารด้วยเลข 271 00:10:39,370 --> 00:10:41,920 ที่น้อยลงหน่อย 272 00:10:41,920 --> 00:10:44,350 คุณหารด้วย n ลบ 1 273 00:10:44,350 --> 00:10:46,880 แล้วเมื่อคุณหารด้วย n-1 แทนที่จะหารด้วย 274 00:10:46,880 --> 00:10:49,590 n, คุณจะได้ค่าที่มากกว่านิดหน่อยตรงนี้ 275 00:10:49,590 --> 00:10:51,060 ปรากฏว่านี่คือ 276 00:10:51,060 --> 00:10:52,260 ค่าประมาณที่ดีกว่า 277 00:10:52,260 --> 00:10:54,810 และวันหนึ่ง ผมจะเขียนโปรแกรมคอมพิวเตอร์เพื่อพิสูจน์ 278 00:10:54,810 --> 00:10:57,430 อย่างน้อยด้วยการทดลอง ว่านี่ 279 00:10:57,430 --> 00:11:01,750 คือการประมาณควาามแปรปรวนของประชากรที่ดีกว่า 280 00:11:01,750 --> 00:11:03,430 และคุณสามารถคำนวณมันแบบเดียวกันได้ 281 00:11:03,430 --> 00:11:05,270 คุณแค่หารด้วย n ลบ 1 282 00:11:05,270 --> 00:11:07,450 วิธีคิดอีกอย่างคือว่า -- และที่จริง, ไม่ 283 00:11:07,450 --> 00:11:08,340 ผมหมดเวลาแล้ว 284 00:11:08,340 --> 00:11:09,500 ผมปล่อยคุณไปก่อนนะ 285 00:11:09,500 --> 00:11:10,710 แล้วในวิดีโอหน้าล เราจะมาคำนวณ 286 00:11:10,710 --> 00:11:12,590 เพื่อให้คุณไม่รู้สึกล้นเกินไป 287 00:11:12,590 --> 00:11:13,270 เนื่องจากแนวคิดพวกนี้ 288 00:11:13,270 --> 00:11:14,810 เพราะเราใช้แนวคิดที่เป็นนามธรรมอยู่ 289 00:11:14,810 --> 00:11:16,660 แล้วพบกันในวิดีโอหน้าครับ 290 00:11:16,660 --> 00:11:17,000 -