0:00:00.441,0:00:07.657 ในวิดีโอนี้ และวิดีโอต่อๆ ไป เราจะทำการคำนวณเกี่ยวกับข้อมูลชุดนี่ตรงนี้ 0:00:07.657,0:00:12.608 และหวังว่าเมื่อผ่านการคำนวณนี้แล้ว คุณจะได้สัญชาตญาณว่า การวิเคราะห์ 0:00:12.608,0:00:18.941 ความแปรปรวนคืออะไร. ทีนี้สิ่งแรกที่ผมอยากทำในวิดีโอนี้ คือคำนวณผลรวมของ 0:00:18.941,0:00:27.455 กำลังสอง. ผมจะเรียกมันว่า 'SST' ผลบวกของกำลังสองรวม (Sum of squares total). และคุณมองมันเป็นตัวเศษ เวลา 0:00:27.455,0:00:31.576 คุณคำนวณความแปรปรวนก็ได้. เราจะหาระยะห่างระหว่างจุดข้อมูลพวกนี้แต่ละจุด 0:00:31.576,0:00:36.078 ไปยังค่าเฉลี่ยของจุดข้อมูลเหล่านั้นทั้งหมด, กำลังสองมันแล้วหาผลรวม, เราจะไม่หารมันด้วย 0:00:36.078,0:00:40.732 ดีกรีอิสระ, ซึ่งคุณมักทำเวลาคำนวณความแปรปรวนตัวอย่าง 0:00:40.763,0:00:45.279 ทีนี้ นี่จะเท่ากับอะไร? ทีนี้อย่างแรกที่ะราจะทำ คือหาค่าเฉลี่ย 0:00:45.279,0:00:49.692 ของเจ้าพวกนี้ทั้งหมดก่อน. และผมจะเรียกมันว่าค่าเฉลี่ยใหญ่ 0:00:49.692,0:00:53.359 ผมจะเรียกมันว่าค่าเฉลี่ยใหญ่, และขอผมแสดงให้ดูว่า มันก็เหมือนกับค่าเฉลี่ยของ 0:00:53.359,0:00:59.013 ค่าเฉลี่ยแต่ละชุดข้อมูลพวกนี้แต่ละตัว. ลองคำนวณค่าเฉลี่ยใหญ่ก่อน 0:00:59.013,0:01:16.152 มันจะเป็น 3+2+1. 3+2+1+5+3+4+5+6+7 -- +5+6+7 0:01:16.152,0:01:22.102 แล้วเรามีจุดข้อมูล 9 จุดตรงนี้, เรามีจุดข้อมู, 9 จุด เราจึงหารมันด้วย 9 0:01:22.102,0:01:30.354 แล้วมันจะเท่ากับ -- 3 บวก 2 บวก 1 ได้ 6. 6 บวก, ขอผม -- อืม นี่คือ 6. 5 บวก 0:01:30.385,0:01:43.944 3 บวก 4 เป็น, นั่นคือ 12. แล้ว 5 บวก 6 บวก 7 ได้ 18. แล้ว 6 บวก 12 ได้ 18, บวกอีก 18 เป็น 26 0:01:43.944,0:01:50.241 หารด้วย 9 ได้ เท่ากับ 4. ขอผมแสดงให้ดูว่ามันเท่ากับค่าเฉลี่ยของค่าเฉลี่ยนะ 0:01:50.302,0:01:57.056 ตรงนี้, ค่าเฉลี่ยของกลุ่มที่ 1 ตรงนี้, นั่นคือสีเขียว, ค่าเฉลี่ยของกลุ่ม 1 ตรงนี้ 0:01:57.056,0:02:03.856 คือ 3 บวก 2 บวก 1, นั่นคือ 6 ตรงนั้น, หารด้วยจุดข้อมูล 3 จุด, มันจึงเท่ากับ 2 0:02:03.856,0:02:12.677 ค่าเฉลี่ยของกลุ่ม 2, ผลบวกตรงนี้คือ 12, เราเห็นแล้วตรงนี้: 5 บวก 3 บวก 4 เป็น 12, หารด้วย 3 0:02:12.677,0:02:21.846 เป็น 4, เพราะเรามีจุดข้อมูล 3 จุด. แล้วค่าเฉลี่ยของกลุ่ม 3, 5 บวก 6 บวก 7 0:02:21.846,0:02:27.256 ได้ 18 หารด้วย 3 เป็น 6. แล้วถ้าคุณหาค่าเฉลี่ยของค่าเฉลี่ย 0:02:27.256,0:02:31.015 ซึ่งก็วิธีหาค่าเฉลี่ยใหญ่ตรงนี้, คุณได้ 2 บวก 4 บวก 6 0:02:31.015,0:02:35.892 ซึ่งเท่ากับ 12 หารด้วยค่าเฉลี่ย 3 ค่าตรงนี้ เหมือนเดิมคุณได้ 4 0:02:35.892,0:02:38.933 คุณสามารถมองนี่เป็นค่าเฉลี่ยของข้อมูลทั้งหมดทุกกลุ่ม 0:02:38.933,0:02:43.600 หรือค่าเฉลี่ยของค่าเฉลี่ยในแต่ละกลุ่มก็ได้. แต่ไม่ว่าวิธีไหน เราสามารถหาได้ 0:02:43.600,0:02:48.836 เราสามารถหาผลบวกกำลังสองรวมได้แล้ว. ลองทำกันดู 0:02:48.836,0:02:57.887 มันจะเท่ากับ 3 ลบ 4, 4 คือ 4 นี่ตรงนี้, กำลังสอง บวก 0:02:57.887,0:03:05.667 2 ลบ 4 กำลังสอง บวก 1 ลบ 4 กำลังสอง, ตอนนี้ผมจะทำเจ้านี่ตรงนี้ด้วยสีม่วง, 0:03:05.667,0:03:16.031 บวก 5 ลบ 4 กำลังสอง บวก 3 ลบ 4 กำลังสอง บวก 4 ลบ 4 กำลังสอง 0:03:16.031,0:03:20.667 ผมจะเลื่อนมาตรงนี้หน่อยนะ, บวก 4 ลบ 4 กำลังสอง. ตอนนี้เราเหลืออีกแค่สามตัวเท่านั้น 0:03:20.667,0:03:32.887 บวก 5 ลบ 4 กำลังสอง บวก 6 ลบ 4 กำลังสอง บวก 7 ลบ 4 กำลังสอง. แล้วนี่ได้เท่ากับอะไร? 0:03:32.887,0:03:38.436 บนนี้อันแรกจะเท่ากับ, 3 ลบ 4 ผลต่างคือ 1, คุณกำลังสองมัน, 0:03:38.436,0:03:42.200 คุณจะได้, เอ่อ, มันก็คือลบ 1, คุณกำลังสองมันได้ 1 0:03:42.200,0:03:51.000 บวก, คุณได้ ลบ 2 กำลังสอง เป็น 4 บวกลบ 3 กำลังสอง. ลบ 3 กำลังสองเป็น 9 0:03:51.000,0:03:57.698 แล้วเรามีตรงนี้สีบานเย็นคือ 5 ลบ 4 เป็น 1, กำลังสองก็ยังได้ 1. 3 ลบ 4 กำลังสองเป็น 1 คุณ 0:03:57.698,0:04:03.210 กำลังสองมันอีกที คุณก็ยังได้ 1 และ 4 ลบ 4 ก็แค่ 0. เราก็สามารถ -- ขอผมเขียน 0 ตรงนี้นะ 0:04:03.210,0:04:06.985 เพื่อให้คุณเห็นว่าเราคิดไปแล้ว. แล้วเรามีจุดข้อมูล 3 จุดสุดท้าย 0:04:06.985,0:04:16.667 5 ลบ 4 กำลังสอง, นั่นคือ 1. 6 ลบ 4 กำลังสอง, นั่นคือ 4, มันคือ 2 กำลังสอง. แล้ว บวก 7 ลบ 4 ได้ 3 0:04:16.667,0:04:24.952 กำลังสองเป็น 9. แล้วนี่จะเท่ากับอะไร. ผมก็ได้ 1 บวก 4 บวก 9 0:04:25.629,0:04:33.436 1 บวก 4 บวก 9 ตรงนี้, นั่นคือ 5 บวก 9. เจ้านี่ตรงนี้คือ 14, จริงไหม? 0:04:33.436,0:04:39.638 5 บวก -- ใช่แล้ว, 14. แล้วเรามี 14 อีกตัวตรงนี้เพราะเรามี 1 บวก 4 บวก 9 0:04:39.638,0:04:43.632 แล้วนั่นตรงนี้ก็คือ 14 ด้วย. แล้วเราได้ 2 ตรงนี้. มันจะ 0:04:43.632,0:04:55.056 เป็น 28, 14 คูณ 2, 14 บวก 14 ได้ 28, บวก 2 เป็น 30. เท่ากับ 30. ดังนั้นผลบวกกำลังสองรวม 0:04:55.056,0:04:59.561 และที่จริงถ้าเราอยากได้ความแปรปรวนตรงนี้ เราก็หารมันด้วยดีกรีอิสระ 0:04:59.561,0:05:05.551 และพวกนี้มีดีกรีอิสระหลายตัวอยู่. สมมุติ, สมมุติว่าเรามี 0:05:05.551,0:05:11.031 เรารู้ว่าเรามีกลุ่ม m กลุ่มตรงนี้, ขอผมเขียนนี่ว่า m นะ. และผมจะ 0:05:11.031,0:05:14.236 ไม่พิสูจน์มันอย่างรัดกุมตรงนี้ แต่ผมอยากแสดงให้คุณเห็น, ผมอยาก 0:05:14.236,0:05:18.740 แสดงให้คุณเห็นว่าสูตรประหลาดเหล่านี้ในสถิติ มันมาจากไหน 0:05:18.740,0:05:25.667 โดยไม่ได้พิสูจร์อย่างรัดกุม, ให้คุณได้สัญชาตญาณมากกว่า. เรามีกลุ่ม m กลุ่มตรงนี้ 0:05:25.667,0:05:34.344 และแต่ละกลุ่มตรงนี้มีสมาชิก n ตัว. แล้วเรามีจำนวนสมาชิกทั้งหมดเท่าไหร่? 0:05:34.344,0:05:41.498 เรามี m คูณ n หรือ 9, จริงไหม? จำนวนสมาชิกเท่ากับ 3 คูณ 3. ดังนั้นดีกรีอิสระ, เราจำได้, คุณ 0:05:41.498,0:05:47.800 มีเท่านี้, ดีกรีอิสระคือจำนวนข้อมูลที่คุณมีลบ 1. เพราะถ้าคุณรู้ 0:05:47.800,0:05:52.800 ถ้าคุณรู้ค่าเฉลี่ยของค่าเฉลี่ย, ถ้าคุณรู้ค่าเฉลี่ยของค่าเฉลี่ย, ถ้าคุณถือว่าคุณรู้ค่านั้น 0:05:52.800,0:05:59.323 คุณก็, คุณก็ใช้, n แค่นี้ เอ่อ. 9 ลบ 1, มีแค่ 8 ตัวนี้ที่ให้ข้อมูล 0:05:59.323,0:06:04.471 ใหม่คุณ เพราะถ้าคุณรู้แล้ว คุณสามารถหาตัวสุดท้ายได้, หรือมันไม่จำเป็นต้องเป็นตัวสุดท้ายก็ได้ 0:06:04.471,0:06:09.824 ถ้าคุณมี 8 ตัวอยู๋แล้ว คุณสามารถหาอันนี้ได้. ถ้าคุณรู้ค่า 8 ค่า คุณสามารถคำนวณ 0:06:09.824,0:06:16.600 ตัวที่ 9 ได้โดยใช้ค่าเฉลี่ยของค่าเฉลี่ย. วิธีคิดอย่างหนึ่งคือว่า มันมีค่าที่วัดได้ซึ่งอิสระจากกัน 0:06:16.600,0:06:22.883 อยู่ 8 ค่าตรงนี้. หรือถ้าคุณอยากพูดถึงโดยทั่วไป, คุณอยากพูดถึงกรณีทั่วไป, มันมี 0:06:22.883,0:06:30.397 m คูณ n, นั่นคือจำนวนตัวอย่างทั้งหมด, ลบ 1 เป็นดีกรีอิสระ 0:06:33.720,0:06:41.810 แลถ้าคุณอยากคำนวณความแปรปรวนตรงนี้ เราก็แค่หาร 30 ด้วย m คูณ n ลบ 1 0:06:41.810,0:06:47.077 หรือนี่คือวิธีหนึ่งในการบอกว่าดีกรีอิสระของตัวอย่างนี่คือ 8 พอดี. คุณเอา 30 0:06:47.077,0:06:53.000 มาหารด้วย 8 แล้วคุณก็สามารถหาความแปรปรวนของกลุ่มทั้งหมดได้. กลุ่มขนาด 9 0:06:53.000,0:06:58.533 ผมจะปล่อยคุณไปในวิดีโอนี้แล้วกัน. ในวิดีโอหน้า เราจะพยายามหาความแปรผันรวมนี้มีเท่าไหร่ 0:06:58.533,0:07:08.333 ผลบวกกำลังสองรวมนี้, ความแปรผันทั้งหมดนี้, มีเท่าไหร่ที่มาจากความแปรผัน 0:07:08.333,0:07:14.313 ภายในแต่ละกลุ่ม เทียบกับความแปรผันระหว่างกลุ่ม. และผมว่าคุณจะเริ่ม 0:07:14.313,0:07:19.667 เข้าใจแล้วว่าการวิเคราะห์ความแปรปรวนทั้งหมดนี่มาจากไหน. ลองดู มันมีความแปรปรวน 0:07:19.667,0:07:24.800 ของตัวอย่างขนาด 9 คือทั้งหมดนี้ แต่ความแปรปรวนบางตัว, ในแต่ละกลุ่มมันต่างกัน 0:07:24.800,0:07:31.267 มันอาจมากจากความแปรปรวนจากการอยู่ต่างกลุ่มกัน กับการแปรปรวนจาก 0:07:31.267,0:07:34.564 การอยู่ในกลุ่มเดียวกัน. เราจะคำนวณสองอย่างนั้น และเราจะเห็นว่ามัน 0:07:34.579,99:59:59.999 รวมกันได้เท่ากับความแปรผันรวมกำลังสองต่อไป