ในวิดีโอนี้ และวิดีโอต่อๆ ไป เราจะทำการคำนวณเกี่ยวกับข้อมูลชุดนี่ตรงนี้
และหวังว่าเมื่อผ่านการคำนวณนี้แล้ว คุณจะได้สัญชาตญาณว่า การวิเคราะห์
ความแปรปรวนคืออะไร. ทีนี้สิ่งแรกที่ผมอยากทำในวิดีโอนี้ คือคำนวณผลรวมของ
กำลังสอง. ผมจะเรียกมันว่า 'SST' ผลบวกของกำลังสองรวม (Sum of squares total). และคุณมองมันเป็นตัวเศษ เวลา
คุณคำนวณความแปรปรวนก็ได้. เราจะหาระยะห่างระหว่างจุดข้อมูลพวกนี้แต่ละจุด
ไปยังค่าเฉลี่ยของจุดข้อมูลเหล่านั้นทั้งหมด, กำลังสองมันแล้วหาผลรวม, เราจะไม่หารมันด้วย
ดีกรีอิสระ, ซึ่งคุณมักทำเวลาคำนวณความแปรปรวนตัวอย่าง
ทีนี้ นี่จะเท่ากับอะไร? ทีนี้อย่างแรกที่ะราจะทำ คือหาค่าเฉลี่ย
ของเจ้าพวกนี้ทั้งหมดก่อน. และผมจะเรียกมันว่าค่าเฉลี่ยใหญ่
ผมจะเรียกมันว่าค่าเฉลี่ยใหญ่, และขอผมแสดงให้ดูว่า มันก็เหมือนกับค่าเฉลี่ยของ
ค่าเฉลี่ยแต่ละชุดข้อมูลพวกนี้แต่ละตัว. ลองคำนวณค่าเฉลี่ยใหญ่ก่อน
มันจะเป็น 3+2+1. 3+2+1+5+3+4+5+6+7 -- +5+6+7
แล้วเรามีจุดข้อมูล 9 จุดตรงนี้, เรามีจุดข้อมู, 9 จุด เราจึงหารมันด้วย 9
แล้วมันจะเท่ากับ -- 3 บวก 2 บวก 1 ได้ 6. 6 บวก, ขอผม -- อืม นี่คือ 6. 5 บวก
3 บวก 4 เป็น, นั่นคือ 12. แล้ว 5 บวก 6 บวก 7 ได้ 18. แล้ว 6 บวก 12 ได้ 18, บวกอีก 18 เป็น 26
หารด้วย 9 ได้ เท่ากับ 4. ขอผมแสดงให้ดูว่ามันเท่ากับค่าเฉลี่ยของค่าเฉลี่ยนะ
ตรงนี้, ค่าเฉลี่ยของกลุ่มที่ 1 ตรงนี้, นั่นคือสีเขียว, ค่าเฉลี่ยของกลุ่ม 1 ตรงนี้
คือ 3 บวก 2 บวก 1, นั่นคือ 6 ตรงนั้น, หารด้วยจุดข้อมูล 3 จุด, มันจึงเท่ากับ 2
ค่าเฉลี่ยของกลุ่ม 2, ผลบวกตรงนี้คือ 12, เราเห็นแล้วตรงนี้: 5 บวก 3 บวก 4 เป็น 12, หารด้วย 3
เป็น 4, เพราะเรามีจุดข้อมูล 3 จุด. แล้วค่าเฉลี่ยของกลุ่ม 3, 5 บวก 6 บวก 7
ได้ 18 หารด้วย 3 เป็น 6. แล้วถ้าคุณหาค่าเฉลี่ยของค่าเฉลี่ย
ซึ่งก็วิธีหาค่าเฉลี่ยใหญ่ตรงนี้, คุณได้ 2 บวก 4 บวก 6
ซึ่งเท่ากับ 12 หารด้วยค่าเฉลี่ย 3 ค่าตรงนี้ เหมือนเดิมคุณได้ 4
คุณสามารถมองนี่เป็นค่าเฉลี่ยของข้อมูลทั้งหมดทุกกลุ่ม
หรือค่าเฉลี่ยของค่าเฉลี่ยในแต่ละกลุ่มก็ได้. แต่ไม่ว่าวิธีไหน เราสามารถหาได้
เราสามารถหาผลบวกกำลังสองรวมได้แล้ว. ลองทำกันดู
มันจะเท่ากับ 3 ลบ 4, 4 คือ 4 นี่ตรงนี้, กำลังสอง บวก
2 ลบ 4 กำลังสอง บวก 1 ลบ 4 กำลังสอง, ตอนนี้ผมจะทำเจ้านี่ตรงนี้ด้วยสีม่วง,
บวก 5 ลบ 4 กำลังสอง บวก 3 ลบ 4 กำลังสอง บวก 4 ลบ 4 กำลังสอง
ผมจะเลื่อนมาตรงนี้หน่อยนะ, บวก 4 ลบ 4 กำลังสอง. ตอนนี้เราเหลืออีกแค่สามตัวเท่านั้น
บวก 5 ลบ 4 กำลังสอง บวก 6 ลบ 4 กำลังสอง บวก 7 ลบ 4 กำลังสอง. แล้วนี่ได้เท่ากับอะไร?
บนนี้อันแรกจะเท่ากับ, 3 ลบ 4 ผลต่างคือ 1, คุณกำลังสองมัน,
คุณจะได้, เอ่อ, มันก็คือลบ 1, คุณกำลังสองมันได้ 1
บวก, คุณได้ ลบ 2 กำลังสอง เป็น 4 บวกลบ 3 กำลังสอง. ลบ 3 กำลังสองเป็น 9
แล้วเรามีตรงนี้สีบานเย็นคือ 5 ลบ 4 เป็น 1, กำลังสองก็ยังได้ 1. 3 ลบ 4 กำลังสองเป็น 1 คุณ
กำลังสองมันอีกที คุณก็ยังได้ 1 และ 4 ลบ 4 ก็แค่ 0. เราก็สามารถ -- ขอผมเขียน 0 ตรงนี้นะ
เพื่อให้คุณเห็นว่าเราคิดไปแล้ว. แล้วเรามีจุดข้อมูล 3 จุดสุดท้าย
5 ลบ 4 กำลังสอง, นั่นคือ 1. 6 ลบ 4 กำลังสอง, นั่นคือ 4, มันคือ 2 กำลังสอง. แล้ว บวก 7 ลบ 4 ได้ 3
กำลังสองเป็น 9. แล้วนี่จะเท่ากับอะไร. ผมก็ได้ 1 บวก 4 บวก 9
1 บวก 4 บวก 9 ตรงนี้, นั่นคือ 5 บวก 9. เจ้านี่ตรงนี้คือ 14, จริงไหม?
5 บวก -- ใช่แล้ว, 14. แล้วเรามี 14 อีกตัวตรงนี้เพราะเรามี 1 บวก 4 บวก 9
แล้วนั่นตรงนี้ก็คือ 14 ด้วย. แล้วเราได้ 2 ตรงนี้. มันจะ
เป็น 28, 14 คูณ 2, 14 บวก 14 ได้ 28, บวก 2 เป็น 30. เท่ากับ 30. ดังนั้นผลบวกกำลังสองรวม
และที่จริงถ้าเราอยากได้ความแปรปรวนตรงนี้ เราก็หารมันด้วยดีกรีอิสระ
และพวกนี้มีดีกรีอิสระหลายตัวอยู่. สมมุติ, สมมุติว่าเรามี
เรารู้ว่าเรามีกลุ่ม m กลุ่มตรงนี้, ขอผมเขียนนี่ว่า m นะ. และผมจะ
ไม่พิสูจน์มันอย่างรัดกุมตรงนี้ แต่ผมอยากแสดงให้คุณเห็น, ผมอยาก
แสดงให้คุณเห็นว่าสูตรประหลาดเหล่านี้ในสถิติ มันมาจากไหน
โดยไม่ได้พิสูจร์อย่างรัดกุม, ให้คุณได้สัญชาตญาณมากกว่า. เรามีกลุ่ม m กลุ่มตรงนี้
และแต่ละกลุ่มตรงนี้มีสมาชิก n ตัว. แล้วเรามีจำนวนสมาชิกทั้งหมดเท่าไหร่?
เรามี m คูณ n หรือ 9, จริงไหม? จำนวนสมาชิกเท่ากับ 3 คูณ 3. ดังนั้นดีกรีอิสระ, เราจำได้, คุณ
มีเท่านี้, ดีกรีอิสระคือจำนวนข้อมูลที่คุณมีลบ 1. เพราะถ้าคุณรู้
ถ้าคุณรู้ค่าเฉลี่ยของค่าเฉลี่ย, ถ้าคุณรู้ค่าเฉลี่ยของค่าเฉลี่ย, ถ้าคุณถือว่าคุณรู้ค่านั้น
คุณก็, คุณก็ใช้, n แค่นี้ เอ่อ. 9 ลบ 1, มีแค่ 8 ตัวนี้ที่ให้ข้อมูล
ใหม่คุณ เพราะถ้าคุณรู้แล้ว คุณสามารถหาตัวสุดท้ายได้, หรือมันไม่จำเป็นต้องเป็นตัวสุดท้ายก็ได้
ถ้าคุณมี 8 ตัวอยู๋แล้ว คุณสามารถหาอันนี้ได้. ถ้าคุณรู้ค่า 8 ค่า คุณสามารถคำนวณ
ตัวที่ 9 ได้โดยใช้ค่าเฉลี่ยของค่าเฉลี่ย. วิธีคิดอย่างหนึ่งคือว่า มันมีค่าที่วัดได้ซึ่งอิสระจากกัน
อยู่ 8 ค่าตรงนี้. หรือถ้าคุณอยากพูดถึงโดยทั่วไป, คุณอยากพูดถึงกรณีทั่วไป, มันมี
m คูณ n, นั่นคือจำนวนตัวอย่างทั้งหมด, ลบ 1 เป็นดีกรีอิสระ
แลถ้าคุณอยากคำนวณความแปรปรวนตรงนี้ เราก็แค่หาร 30 ด้วย m คูณ n ลบ 1
หรือนี่คือวิธีหนึ่งในการบอกว่าดีกรีอิสระของตัวอย่างนี่คือ 8 พอดี. คุณเอา 30
มาหารด้วย 8 แล้วคุณก็สามารถหาความแปรปรวนของกลุ่มทั้งหมดได้. กลุ่มขนาด 9
ผมจะปล่อยคุณไปในวิดีโอนี้แล้วกัน. ในวิดีโอหน้า เราจะพยายามหาความแปรผันรวมนี้มีเท่าไหร่
ผลบวกกำลังสองรวมนี้, ความแปรผันทั้งหมดนี้, มีเท่าไหร่ที่มาจากความแปรผัน
ภายในแต่ละกลุ่ม เทียบกับความแปรผันระหว่างกลุ่ม. และผมว่าคุณจะเริ่ม
เข้าใจแล้วว่าการวิเคราะห์ความแปรปรวนทั้งหมดนี่มาจากไหน. ลองดู มันมีความแปรปรวน
ของตัวอย่างขนาด 9 คือทั้งหมดนี้ แต่ความแปรปรวนบางตัว, ในแต่ละกลุ่มมันต่างกัน
มันอาจมากจากความแปรปรวนจากการอยู่ต่างกลุ่มกัน กับการแปรปรวนจาก
การอยู่ในกลุ่มเดียวกัน. เราจะคำนวณสองอย่างนั้น และเราจะเห็นว่ามัน
รวมกันได้เท่ากับความแปรผันรวมกำลังสองต่อไป