-
ในวิดีโอที่แล้ว เราสามารถ
-
คำนวณผลบวกกำลังสองรวม สำหรับจุดข้อมูล 9 ค่าตรงนี้,
-
จุดข้อมูล 9 จุดนี้ แบ่งออกเป็นสามกลุ่มต่างกัน
-
หรือถ้าคุณอยากพูดโดยทั่วไป มันแค่ออกมาเป็น "m" กลุ่มต่างๆ กัน
-
สิ่งที่ผมอยากทำในวิดีโอนี้ คือหาว่าผลบวกกำลังสองรวมนี้ มีอยู่เท่าไหร่
-
มีอยู่เท่าไหร่ที่มาจากความแปรผันภายในกลุ่ม
-
เทียบกับการแปรผันระหว่างกลุ่ม
-
นั้น, ลองหาความแปรผันรวมภายในกลุ่มก่อน
-
ลองดเรียมกันว่า ผลบวกกำลังสองภายในกลุ่ม, ผมจะใช้สีเหลืองนะ
-
ที่จริงผมใช้สีเหลืองอยู่แล้ว งั้นลองทำนี่ดู, ผมจะใช้สีฟ้านะ
-
ผลบวกกำลังสองภายในกลุ่ม
-
ขอผมบอกให้ชัดนะ, นี่แทนภายใน (within)
-
เราอยากรู้ว่าความแปรผัน
-
เนื่องจากจุดข้อมูลแต่ละจุดอยู่ห่างจากแนวโน้มของศูนย์กลางมัน
-
จากค่าเฉลี่ยของพวกมันไปเท่าไหร่
-
นี่จึงเท่ากับ -- ลองเริ่มด้วยเจ้านี่ก่อน
-
แทนที่จะเขียนระยะห่างระหว่างจุดข้อมูลแต่ละจุดกับค่าเฉลี่ยของค่าเฉลี่ย
-
ผมจะหาระยะห่างระหว่างจุดแต่ละจุดกับค่าเฉลี่ยของกลุ่ม
-
เพราะเราอยากยกกำลังสอง ผลบวกกำลังสองร่วม
-
ระหว่างจุดข้อมูลแต่ละจุด กับค่าเฉลี่ยของพวกมันเอง
-
3 ลบค่าเฉลี่ยตรงนี้, มันคือ 2. กำลังสอง
-
บกว 2 ลบ 2 กำลังสอง
-
บวก 1 ลบ 2 กำลังสอง
-
ผมจะทำอย่างนี้สำหรับทุกกลุ่ม
-
ในแต่ละกลุ่ม ระยะห่างระหว่างจุดข้อมูลกับค่าเฉลี่ยของกลุ่ม
-
จะได้ บวก ลบ 4 กำลังสอง, บวก 3 ลบ 4 กำลังสอง, บวก 4 ลบ 4 กำลังสอง
-
และสุดท้ายเรามีกลุ่มที่สาม
-
เาจะหาผลบวกกำลังสองทั้งหมดจากจุดแต่ละจุดไปยังแนวโน้มของศูนย์กลาง
-
ภายในกลุ่มนั้น, เราจะบวกมันเข้าด้วยกัน
-
แล้วเราจะหากลุ่มที่สาม, เราจะได้
-
5 ลบ 6 กำลังสอง, บวก 6 ลบ 6 กำลังสอง, บวก 7 ลบ 6 กำลังสอง
-
แล้วนี่จะเท่ากับอะไร?
-
นี่จะเท่ากับ, ตรงนี้, มันจะเท่ากับ 1+0+1
-
นั่นจะเท่ากับ 2
-
บวก นี่จะเท่ากับ 1+1+0, ได้ 2 อีกตัว
-
บวก นี่เท่ากับ 1+0+1, นั่นก็คือ 2 ตรงนี้
-
ดังนั้นผลบวกกำลังสองภายในกลุ่มรวมกันเป็น 6
-
วิธีคิดอย่างหนึ่งคือว่า, ความแปรปรวนรวมคือ 30
-
จากการคำนวณนั้น 6 จาก 30 นั่นมาจากการแปรผันภายในตัวอย่างเหล่านี้
-
ทีนี้สิ่งต่อไปที่ผมอยากคิด
-
คือดีกรีอิสระที่เรามีในการคำนวณนี้
-
มันมี, ประมาณว่า, จุดข้อมูลอิสระที่เรามี,
-
จากอันนี้, ตรงนี้, เรารู้ว่ามีจุดข้อมูล 'n' จุดในแต่ละกลุ่ม,
-
ในกรณีนี้ n เป็น 3, แต่ถ้าคุณรู้
-
n ลบ 1 ค่า, คุณสามารถหาตัวที่ n ได้ถ้าคุณรู้ค่าเฉลี่ยตัวอย่าง
-
ในกรณีนี้ สำหรับกลุ่มใดๆ ถ้าคุณรู้จุดข้อมูล 2 จุด,
-
คุณก็หาตัวที่สามได้เสมอ
-
ถ้าคุณรู้สองตัวนี้, คุณก็หา
-
ตัวที่สามได้ ถ้าคุณรู้ค่าเฉลี่ยตัวอย่าง
-
ดังนั้นลองหาดีกรีอิสระโดยทั่วไปกัน
-
คุณมี, ในแต่ละกลุ่ม, เวลาคุณทำอันนี้, คุณมีดีกรีอิสระเท่ากับ 'n' ลบ 1
-
จำไว้ 'n' เป็นจำนวนจุดข้อมูลที่คุณมีในแต่ละกลุ่ม
-
แล้วคุณมีดีกรีอิสระเป็น n-1 สำหรับแต่ละกลุ่มพกวนี้
-
มันก็คือ n-1, n-1, n-1
-
หรือคุณมี, ขอผมใส่มันแบบนี้นะ, คุณมี 'n-1' สำหรับแต่ละกลุ่มพวกนี้, และ
-
มันมีอยู่ m กลุ่ม
-
มันจึงมีดีกรีอิสระเป็น m คูณ n-1
-
ในกรณีเฉพาะนี้, แต่ละกลุ่ม n-1 เป็น 2
-
หรือในแต่ละกรณี, คุณมีดีกรีอิสระเป็น 2
-
และมันมีอยู่ 3 กลุ่ม เราจึงมีดีกรีอิสระเป็น 6
-
ในอนาคต เราอาจพูดคุยในรายละเอียดกันว่า ดีกรีอิสระหมายถึงอะไร
-
แล้วเราจะคิดในเชิงคณิตศาสตร์ว่าอย่างไร
-
แต่วิธีคิดที่ง่ายที่สุดคือว่า มันคือจำนวนจุดข้อมูลที่เป็นอิสระ
-
หากสมมุติว่าคุณรู้ค่ากลางทางสถิติในกรณีนี้
-
ที่เราใช้คำนวณกำลังสองของระยะห่างระหว่างจุดกับค่านั้นแต่ละตัว, ถ้าคุณรู้ค่าอยู่แล้ว
-
จุดข้อมูลที่สาม ก็สามารถหาได้จาก 2 ตัวที่เหลือ
-
คุณจึงมีดีกรีอิสระเป็น 6 ตรงนี้
-
ทีนี้ นั่นคือปริมาณของความแปรผันรวมที่มาจากความแปรผันในแต่ละตัวอย่าง
-
ทีนี้ ลองคิดดูว่ามีการแปรผันอยู่เท่าไหร่ที่มาจากการแปรผันระหว่างตัวอย่าง
-
และเวลาคิดค่านั้น, เราจะคำนรวณ -- เลือกสีสวยตรงนี้ --
-
ผมว่าผมใช้สีหมดแล้ว --
-
เราจะเรียกว่ามันว่าผลบวกกำลังสองระหว่างกลุ่ม, B แทนระหว่าง (between)
-
วิธีคิดอีกอย่างคือ, ความแปรผันรวมนี้มีอยู่เท่าไหร่
-
ที่มาจากการแปรผันระหว่างค่าเฉลี่ย, ระหว่างแนวโน้มของศูนย์กลาง
-
นั่นคือสิ่งที่เราจะคำนวณตรงนี้
-
มีเท่าไหร่ที่เกิดจากการแปรผันระหว่างจุดข้อมูลแต่ละจุดกับค่าเฉลี่ยของมัน
-
ลองหาดูว่ามีเท่าไหร่ ที่เกิดจากความแปรผันระหว่างเจ้าพวกนี่ตรงนี้
-
วิธีคิดอย่างหนึ่งคือว่า ในแต่ละจุดข้อมูล --
-
ลองคิดถึงกลุ่มแรกก่อน
-
สำหรับกลุ่มแรกนี้, มีความแปรผันเท่าไหร่ สำหรับแต่ละจุดนี้
-
ที่เกิดจากการแปรผันระหว่างค่าเฉลี่ยนี่ กับค่าเฉลี่ยของค่าเฉลี่ย
-
สำหรับตัวแรกบนนี้ -- ผมจะเขียนมันออกมาชัดๆ --
-
การแปรผันนั้น จะเท่ากับค่าเฉลี่ยตัวอย่าง, 2, ลบ ค่าเฉลี่ยของค่าเฉลี่ย, กำลังสอง
-
แล้วสำหรับเจ้านี่, มันก็เหมือนกัน.
-
ค่าเฉลี่ยตัวอย่างของมันคือ 2, ลบค่าเฉลี่ยของค่าเฉลี่ย, กำลังสอง
-
บวกเหมือนกับสำหรับเจ้านี่.
-
ค่าเฉลี่ยตัวอย่างของมันคอื 2, ลบค่าเฉลี่ยของค่าเฉลี่ย, กำลังสอง
-
หรือวิธีคิดอีกอย่างคือว่า, นี่เท่ากับ 3 คูณ 2-4 กำลังสอง,
-
ซึ่งก็เหมือนกับ 3 คูณ 4, นั่นเท่ากับ 12
-
ผมสามารถคิดแต่ละตัวได้. ผมอยากหาผลบวกทั้งหมด
-
ขอผมเขียนมันออกมาทั้งหมดนะ. ผมว่ามันเป็นสิ่งที่ง่ายที่สุดแล้ว
-
เจ้าพวกนี้ทั้งหมดรวมกัน
-
ผลบวกกำลังสอง เนื่องจากผลต่างระหว่างตัวอย่าง
-
นั่นก็มาจากตัวอย่างแรก, ผลมาจากตัวอย่างแรก
-
แล้วมาจากตัวอย่างที่สอง,
-
คุณมีเจ้านี่ตรงนี้ 5 - ขอโทษที, คุณต้องไม่คำนวณเจ้านี่
-
สำหรับจุดนี่ตรงนี้, ปริมาณการแปรผันเนื่องจากผลต่างระหว่างค่าเฉลี่ย
-
จะเท่ากับ 4 ลบ 4 กำลังสอง
-
เหมือนกันสำหรับเจ้านี่. มันคือ 4 ลบ 4 กำลังสอง
-
เราจะไม่เอาค่ามันมาคิด. เราเอาแค่ค่าเฉลี่ยตัวอย่างของมันมาคิดเฉยๆ
-
แล้วสุดท้าย บวก 4 ลบ 4 กำลังสอง
-
เราก็เอาอันนี้มา
-
ลบ เจ้านี่กำลังสอง สำหรับจุดข้อมูลพวกนี้แต่ละจุด
-
แล้วสุดท้าย เราก็ทำของกลุ่มสุดท้าย
-
ค่าเฉลี่ยตัวอย่าง คือ 6, มันจะเท่ากับ 6 ลบ 4 กำลังสอง, บวก 6 ลบ 4 กำลังสอง, บวก 6 ลบ 4 กำลังสอง
-
ทีนี้, ลองคิดถึง
-
ดีกรีอิสระที่เรามี ในการคำนวณค่านี่ตรงนี้กัน
-
ทีนี้, โดยทั่วไปแล้ว, ผมว่าวิธีคิดที่ง่ายที่สุดคือว่า
-
เรามีข้อมูลเท่าไหร่, หากสมมุติว่าเรารู้ค่าเฉลี่ยของค่าเฉลี่ย?
-
ถ้าเรารู้ค่าเฉลี่ยของค่าเฉลี่ย, มันมีข้อมูลใหม่อยู่กี่อัน?
-
ถ้าคุณรู้ 2 ค่านีี้ ถ้าคุณรู้ค่าเฉลี่ยของค่าเฉลี่ย คุณรู้ค่าเฉลี่ยตัวอย่าง 2 ค่า,
-
คุณก็หาตัวที่สามได้เสมอ
-
ถ้าคุณรู้อันนี้กับอันนี้, คุณก็หาอันนั้นได้
-
ถ้าคุณรู้อันนั้นกับอันนั้น, คุณก็สามารถหาอันนั้นได้
-
นั่นเป็นเพราะนี่คือค่าเฉลี่ยของค่าเฉลี่ยพวกนี่ตรงงนี้
-
โดยทั่วไปแล้ว, ถ้าคุณมี m กลุ่ม หรือคุณมีค่าเฉลี่ย m ค่า
-
มันจะมีดีกรีอิสระเป็น m-1 ตรงนี้
-
เมื่อรู้แล้ว, ในกรณีนี้ m เป็น 3
-
เราก็บอกว่า, มันมีดีกรีอิสรเป็น 2 สำหรับตัวอย่างนี้
-
งั้นลองคำนวณผลบวกกำลังสองระหว่างกลุ่มดู. นี่จะเป็นเท่าไหร่?
-
นี่จะเท่ากับ, เจ้านี่ตรงนี้คือ, 2 ลบ 4 เป็น ลบ 2, กำลังสองเป็น 4
-
แล้วเรามี 4 สามตัวตรงนี้, จึงได้ 3 คูณ 4
-
บวก 3 คูณ 0, บวก 3 คูณ 6 ลบ 4 กำลังสอง, ซึ่งก็คือ 3 คูณ 4. ได้ บวก 3 คูณ 4
-
แลเราได้ 3 คูณ 4 เป็น 12 บวก 0 บวก 12, เท่ากับ 24
-
ดังนั้นผลบวกกำลังสอง, หรือการแปรผันเนื่องจาก
-
ความแตกต่างระหว่างกลุ่ม, ระหว่างค่าเฉลี่ยเป็น 24
-
ที่ลองรวมพวกนี้เข้าด้วยกัน. เราบอกว่า
-
ความแปรผันรรวม เวลาคุณดูจุดข้อมูล 9 จุดรวมกัน คือ 30
-
ขอผมเขียนมันลงไปนะ
-
ผลบวกกำลังสองรวม เท่ากับ 30
-
เราหาผลรวมของกำลังสอง ระหว่างจุดข้อมูลกับแนวโน้มสู่ศูนย์กลาง, คือค่าเฉลี่ยตัวอย่าง
-
เราหาออกมา แล้วเรารวมทั้งหมดเข้า, เราได้ 6 เป็นผลบวกกำลังสองภายในกลุ่ม
-
ผลบวกของกำลังสองภายในกลุ่มเท่ากับ 6. ในกรณีนี้, มันมีดีกรีอิสระเป็น 6
-
ถ้าเราเขียนโดยทั่วไป, มันมีดีกรีอิสระเท่ากับ m คูณ n-1
-
ที่จริง คือทั้งหมดนั้น, เราหาได้ว่าดีกรีอิสระเป็น m คูณ n-1
-
ขอผมเขียนดีกรีอิสระในคอลัมน์นี่ตรงนี้นะ
-
ในกรณ๊นี้, เลขนี่กลายเป็น 8
-
แล้วตอนนี้, เราคำนวณผลบวกของกำลังสองระหว่างกลุ่มตัวอย่าง
-
ผลบวกกำลังสองระหว่างกลุ่มตัวอย่าง เท่ากับ 24
-
และเราหาแล้วว่ามันมีดีกรีอิสระเท่ากับ m-1 แล้วกลายเป็น 2
-
ทีนี้สิ่งที่น่าสนใจตรงนี้ -- นี่คือสาเหตุที่การวิเคราะห์ความแปรปรวนเข้ากันอย่างสวยงาม
-
ในวิดีโอหน้า เราจะคิดถึงวิธีที่เราสามารถทดสอบสมมติฐานได้
-
โดยใช้เครื่องมือที่เราคิดตรงนี้ --
-
มันคือว่า ผลบวกกำลังสองภายในกลุ่ม กับผลบวกกำลังสองระหว่างกลุ่ม
-
เท่ากับผลบวกกำลังสองรวม
-
วิธีคิดคือว่า การแปรผันรวมของข้อมูลนี่ตรงนี้
-
สามารถบรรยายได้ด้วยผลบวกของการแปรผันภายในกลุ่มแต่ละกลุ่ม
-
เมื่อคุณหาผลรวม
-
บวกผลบวกของการแปรผันระหว่างกลุ่มเข้าไป
-
และแม้แต่ดีกรีอิสระก็เป็น้ด้วย
-
ผลบวกกำลังสองระหว่างกลุ่มมีดีกรีอิสระเป็น 2
-
ผลบวกกำลังสองภายในกลุ่มแต่ละกลุ่ม มีดีกรีอิสระเป็น 6
-
2+6 ได้ 8
-
นั่นคือดีกรีอิสระรวมสำหรับข้อมูลที่เรามีทั้งหมด
-
มันใช้ได้ ถ้าคุณดูสูตรทั่วไป
-
ผลบวกกำลังสองระหว่างกลุ่มมีดีกรีอิสระเป็น m-1
-
ผลบวกกำลังสองภายในกลุ่า มีดีกรีอิสระ m(n-1)
-
นี่เท่ากับ m -1 + mn - m
-
เจ้าพวกนี้ตัดกัน. นี่เท่ากับดีกรีอิสระ mn-1
-
ซึ่งเท่ากับดีกรีอิสระรวม ที่เรามีสำหรับผลบวกกำลังสองรวม
-
ประเด็นของการคำนวณที่เราทำในวิดีโอที่แล้ว กับวิดีโอนี้
-
คือเพื่อซาบซึ้งว่า การแปรผันรวมตรงนี้
-
สามารถมองเป็นผลรวมของการแปรผันสองส่วนนี้,
-
ปริมาณการแปรผันภายในกลุ่มตัวอย่างแต่ละกลุ่ม
-
บวกปริมาณการแปรผันที่มีระหว่างค่าเฉลี่ยของตัวอย่าง
-
หวังว่ามันคงไม่งงเกินไปนะ