1 00:00:00,441 --> 00:00:07,657 ในวิดีโอนี้ และวิดีโอต่อๆ ไป เราจะทำการคำนวณเกี่ยวกับข้อมูลชุดนี่ตรงนี้ 2 00:00:07,657 --> 00:00:12,608 และหวังว่าเมื่อผ่านการคำนวณนี้แล้ว คุณจะได้สัญชาตญาณว่า การวิเคราะห์ 3 00:00:12,608 --> 00:00:18,941 ความแปรปรวนคืออะไร. ทีนี้สิ่งแรกที่ผมอยากทำในวิดีโอนี้ คือคำนวณผลรวมของ 4 00:00:18,941 --> 00:00:27,455 กำลังสอง. ผมจะเรียกมันว่า 'SST' ผลบวกของกำลังสองรวม (Sum of squares total). และคุณมองมันเป็นตัวเศษ เวลา 5 00:00:27,455 --> 00:00:31,576 คุณคำนวณความแปรปรวนก็ได้. เราจะหาระยะห่างระหว่างจุดข้อมูลพวกนี้แต่ละจุด 6 00:00:31,576 --> 00:00:36,078 ไปยังค่าเฉลี่ยของจุดข้อมูลเหล่านั้นทั้งหมด, กำลังสองมันแล้วหาผลรวม, เราจะไม่หารมันด้วย 7 00:00:36,078 --> 00:00:40,732 ดีกรีอิสระ, ซึ่งคุณมักทำเวลาคำนวณความแปรปรวนตัวอย่าง 8 00:00:40,763 --> 00:00:45,279 ทีนี้ นี่จะเท่ากับอะไร? ทีนี้อย่างแรกที่ะราจะทำ คือหาค่าเฉลี่ย 9 00:00:45,279 --> 00:00:49,692 ของเจ้าพวกนี้ทั้งหมดก่อน. และผมจะเรียกมันว่าค่าเฉลี่ยใหญ่ 10 00:00:49,692 --> 00:00:53,359 ผมจะเรียกมันว่าค่าเฉลี่ยใหญ่, และขอผมแสดงให้ดูว่า มันก็เหมือนกับค่าเฉลี่ยของ 11 00:00:53,359 --> 00:00:59,013 ค่าเฉลี่ยแต่ละชุดข้อมูลพวกนี้แต่ละตัว. ลองคำนวณค่าเฉลี่ยใหญ่ก่อน 12 00:00:59,013 --> 00:01:16,152 มันจะเป็น 3+2+1. 3+2+1+5+3+4+5+6+7 -- +5+6+7 13 00:01:16,152 --> 00:01:22,102 แล้วเรามีจุดข้อมูล 9 จุดตรงนี้, เรามีจุดข้อมู, 9 จุด เราจึงหารมันด้วย 9 14 00:01:22,102 --> 00:01:30,354 แล้วมันจะเท่ากับ -- 3 บวก 2 บวก 1 ได้ 6. 6 บวก, ขอผม -- อืม นี่คือ 6. 5 บวก 15 00:01:30,385 --> 00:01:43,944 3 บวก 4 เป็น, นั่นคือ 12. แล้ว 5 บวก 6 บวก 7 ได้ 18. แล้ว 6 บวก 12 ได้ 18, บวกอีก 18 เป็น 26 16 00:01:43,944 --> 00:01:50,241 หารด้วย 9 ได้ เท่ากับ 4. ขอผมแสดงให้ดูว่ามันเท่ากับค่าเฉลี่ยของค่าเฉลี่ยนะ 17 00:01:50,302 --> 00:01:57,056 ตรงนี้, ค่าเฉลี่ยของกลุ่มที่ 1 ตรงนี้, นั่นคือสีเขียว, ค่าเฉลี่ยของกลุ่ม 1 ตรงนี้ 18 00:01:57,056 --> 00:02:03,856 คือ 3 บวก 2 บวก 1, นั่นคือ 6 ตรงนั้น, หารด้วยจุดข้อมูล 3 จุด, มันจึงเท่ากับ 2 19 00:02:03,856 --> 00:02:12,677 ค่าเฉลี่ยของกลุ่ม 2, ผลบวกตรงนี้คือ 12, เราเห็นแล้วตรงนี้: 5 บวก 3 บวก 4 เป็น 12, หารด้วย 3 20 00:02:12,677 --> 00:02:21,846 เป็น 4, เพราะเรามีจุดข้อมูล 3 จุด. แล้วค่าเฉลี่ยของกลุ่ม 3, 5 บวก 6 บวก 7 21 00:02:21,846 --> 00:02:27,256 ได้ 18 หารด้วย 3 เป็น 6. แล้วถ้าคุณหาค่าเฉลี่ยของค่าเฉลี่ย 22 00:02:27,256 --> 00:02:31,015 ซึ่งก็วิธีหาค่าเฉลี่ยใหญ่ตรงนี้, คุณได้ 2 บวก 4 บวก 6 23 00:02:31,015 --> 00:02:35,892 ซึ่งเท่ากับ 12 หารด้วยค่าเฉลี่ย 3 ค่าตรงนี้ เหมือนเดิมคุณได้ 4 24 00:02:35,892 --> 00:02:38,933 คุณสามารถมองนี่เป็นค่าเฉลี่ยของข้อมูลทั้งหมดทุกกลุ่ม 25 00:02:38,933 --> 00:02:43,600 หรือค่าเฉลี่ยของค่าเฉลี่ยในแต่ละกลุ่มก็ได้. แต่ไม่ว่าวิธีไหน เราสามารถหาได้ 26 00:02:43,600 --> 00:02:48,836 เราสามารถหาผลบวกกำลังสองรวมได้แล้ว. ลองทำกันดู 27 00:02:48,836 --> 00:02:57,887 มันจะเท่ากับ 3 ลบ 4, 4 คือ 4 นี่ตรงนี้, กำลังสอง บวก 28 00:02:57,887 --> 00:03:05,667 2 ลบ 4 กำลังสอง บวก 1 ลบ 4 กำลังสอง, ตอนนี้ผมจะทำเจ้านี่ตรงนี้ด้วยสีม่วง, 29 00:03:05,667 --> 00:03:16,031 บวก 5 ลบ 4 กำลังสอง บวก 3 ลบ 4 กำลังสอง บวก 4 ลบ 4 กำลังสอง 30 00:03:16,031 --> 00:03:20,667 ผมจะเลื่อนมาตรงนี้หน่อยนะ, บวก 4 ลบ 4 กำลังสอง. ตอนนี้เราเหลืออีกแค่สามตัวเท่านั้น 31 00:03:20,667 --> 00:03:32,887 บวก 5 ลบ 4 กำลังสอง บวก 6 ลบ 4 กำลังสอง บวก 7 ลบ 4 กำลังสอง. แล้วนี่ได้เท่ากับอะไร? 32 00:03:32,887 --> 00:03:38,436 บนนี้อันแรกจะเท่ากับ, 3 ลบ 4 ผลต่างคือ 1, คุณกำลังสองมัน, 33 00:03:38,436 --> 00:03:42,200 คุณจะได้, เอ่อ, มันก็คือลบ 1, คุณกำลังสองมันได้ 1 34 00:03:42,200 --> 00:03:51,000 บวก, คุณได้ ลบ 2 กำลังสอง เป็น 4 บวกลบ 3 กำลังสอง. ลบ 3 กำลังสองเป็น 9 35 00:03:51,000 --> 00:03:57,698 แล้วเรามีตรงนี้สีบานเย็นคือ 5 ลบ 4 เป็น 1, กำลังสองก็ยังได้ 1. 3 ลบ 4 กำลังสองเป็น 1 คุณ 36 00:03:57,698 --> 00:04:03,210 กำลังสองมันอีกที คุณก็ยังได้ 1 และ 4 ลบ 4 ก็แค่ 0. เราก็สามารถ -- ขอผมเขียน 0 ตรงนี้นะ 37 00:04:03,210 --> 00:04:06,985 เพื่อให้คุณเห็นว่าเราคิดไปแล้ว. แล้วเรามีจุดข้อมูล 3 จุดสุดท้าย 38 00:04:06,985 --> 00:04:16,667 5 ลบ 4 กำลังสอง, นั่นคือ 1. 6 ลบ 4 กำลังสอง, นั่นคือ 4, มันคือ 2 กำลังสอง. แล้ว บวก 7 ลบ 4 ได้ 3 39 00:04:16,667 --> 00:04:24,952 กำลังสองเป็น 9. แล้วนี่จะเท่ากับอะไร. ผมก็ได้ 1 บวก 4 บวก 9 40 00:04:25,629 --> 00:04:33,436 1 บวก 4 บวก 9 ตรงนี้, นั่นคือ 5 บวก 9. เจ้านี่ตรงนี้คือ 14, จริงไหม? 41 00:04:33,436 --> 00:04:39,638 5 บวก -- ใช่แล้ว, 14. แล้วเรามี 14 อีกตัวตรงนี้เพราะเรามี 1 บวก 4 บวก 9 42 00:04:39,638 --> 00:04:43,632 แล้วนั่นตรงนี้ก็คือ 14 ด้วย. แล้วเราได้ 2 ตรงนี้. มันจะ 43 00:04:43,632 --> 00:04:55,056 เป็น 28, 14 คูณ 2, 14 บวก 14 ได้ 28, บวก 2 เป็น 30. เท่ากับ 30. ดังนั้นผลบวกกำลังสองรวม 44 00:04:55,056 --> 00:04:59,561 และที่จริงถ้าเราอยากได้ความแปรปรวนตรงนี้ เราก็หารมันด้วยดีกรีอิสระ 45 00:04:59,561 --> 00:05:05,551 และพวกนี้มีดีกรีอิสระหลายตัวอยู่. สมมุติ, สมมุติว่าเรามี 46 00:05:05,551 --> 00:05:11,031 เรารู้ว่าเรามีกลุ่ม m กลุ่มตรงนี้, ขอผมเขียนนี่ว่า m นะ. และผมจะ 47 00:05:11,031 --> 00:05:14,236 ไม่พิสูจน์มันอย่างรัดกุมตรงนี้ แต่ผมอยากแสดงให้คุณเห็น, ผมอยาก 48 00:05:14,236 --> 00:05:18,740 แสดงให้คุณเห็นว่าสูตรประหลาดเหล่านี้ในสถิติ มันมาจากไหน 49 00:05:18,740 --> 00:05:25,667 โดยไม่ได้พิสูจร์อย่างรัดกุม, ให้คุณได้สัญชาตญาณมากกว่า. เรามีกลุ่ม m กลุ่มตรงนี้ 50 00:05:25,667 --> 00:05:34,344 และแต่ละกลุ่มตรงนี้มีสมาชิก n ตัว. แล้วเรามีจำนวนสมาชิกทั้งหมดเท่าไหร่? 51 00:05:34,344 --> 00:05:41,498 เรามี m คูณ n หรือ 9, จริงไหม? จำนวนสมาชิกเท่ากับ 3 คูณ 3. ดังนั้นดีกรีอิสระ, เราจำได้, คุณ 52 00:05:41,498 --> 00:05:47,800 มีเท่านี้, ดีกรีอิสระคือจำนวนข้อมูลที่คุณมีลบ 1. เพราะถ้าคุณรู้ 53 00:05:47,800 --> 00:05:52,800 ถ้าคุณรู้ค่าเฉลี่ยของค่าเฉลี่ย, ถ้าคุณรู้ค่าเฉลี่ยของค่าเฉลี่ย, ถ้าคุณถือว่าคุณรู้ค่านั้น 54 00:05:52,800 --> 00:05:59,323 คุณก็, คุณก็ใช้, n แค่นี้ เอ่อ. 9 ลบ 1, มีแค่ 8 ตัวนี้ที่ให้ข้อมูล 55 00:05:59,323 --> 00:06:04,471 ใหม่คุณ เพราะถ้าคุณรู้แล้ว คุณสามารถหาตัวสุดท้ายได้, หรือมันไม่จำเป็นต้องเป็นตัวสุดท้ายก็ได้ 56 00:06:04,471 --> 00:06:09,824 ถ้าคุณมี 8 ตัวอยู๋แล้ว คุณสามารถหาอันนี้ได้. ถ้าคุณรู้ค่า 8 ค่า คุณสามารถคำนวณ 57 00:06:09,824 --> 00:06:16,600 ตัวที่ 9 ได้โดยใช้ค่าเฉลี่ยของค่าเฉลี่ย. วิธีคิดอย่างหนึ่งคือว่า มันมีค่าที่วัดได้ซึ่งอิสระจากกัน 58 00:06:16,600 --> 00:06:22,883 อยู่ 8 ค่าตรงนี้. หรือถ้าคุณอยากพูดถึงโดยทั่วไป, คุณอยากพูดถึงกรณีทั่วไป, มันมี 59 00:06:22,883 --> 00:06:30,397 m คูณ n, นั่นคือจำนวนตัวอย่างทั้งหมด, ลบ 1 เป็นดีกรีอิสระ 60 00:06:33,720 --> 00:06:41,810 แลถ้าคุณอยากคำนวณความแปรปรวนตรงนี้ เราก็แค่หาร 30 ด้วย m คูณ n ลบ 1 61 00:06:41,810 --> 00:06:47,077 หรือนี่คือวิธีหนึ่งในการบอกว่าดีกรีอิสระของตัวอย่างนี่คือ 8 พอดี. คุณเอา 30 62 00:06:47,077 --> 00:06:53,000 มาหารด้วย 8 แล้วคุณก็สามารถหาความแปรปรวนของกลุ่มทั้งหมดได้. กลุ่มขนาด 9 63 00:06:53,000 --> 00:06:58,533 ผมจะปล่อยคุณไปในวิดีโอนี้แล้วกัน. ในวิดีโอหน้า เราจะพยายามหาความแปรผันรวมนี้มีเท่าไหร่ 64 00:06:58,533 --> 00:07:08,333 ผลบวกกำลังสองรวมนี้, ความแปรผันทั้งหมดนี้, มีเท่าไหร่ที่มาจากความแปรผัน 65 00:07:08,333 --> 00:07:14,313 ภายในแต่ละกลุ่ม เทียบกับความแปรผันระหว่างกลุ่ม. และผมว่าคุณจะเริ่ม 66 00:07:14,313 --> 00:07:19,667 เข้าใจแล้วว่าการวิเคราะห์ความแปรปรวนทั้งหมดนี่มาจากไหน. ลองดู มันมีความแปรปรวน 67 00:07:19,667 --> 00:07:24,800 ของตัวอย่างขนาด 9 คือทั้งหมดนี้ แต่ความแปรปรวนบางตัว, ในแต่ละกลุ่มมันต่างกัน 68 00:07:24,800 --> 00:07:31,267 มันอาจมากจากความแปรปรวนจากการอยู่ต่างกลุ่มกัน กับการแปรปรวนจาก 69 00:07:31,267 --> 00:07:34,564 การอยู่ในกลุ่มเดียวกัน. เราจะคำนวณสองอย่างนั้น และเราจะเห็นว่ามัน 70 00:07:34,579 --> 99:59:59,999 รวมกันได้เท่ากับความแปรผันรวมกำลังสองต่อไป