ลองทำโจทย์อีกข้อจากเรื่องการกระจายตัว
แบบปกติในหนังสือสถิติ AP ของ ck12.org
และผมใช้อันนี้เพราะมันฟรี และ
เป็นหนังสือที่ดีทีเดียว
ปัญหาคือว่า, ผมว่า, เป็นแบบฝึกหัดที่ดีสำหรับเรา
ลองดูกัน, ข้อ 3
คุณสามารถไปที่เว็บไซต์ และผมว่า
คุณสามารถดาวน์โหลดหนังสือได้
สมมุติว่าค่าเฉลี่ยน้ำหนักของเด็กหญิงอายุ 1 ขวบ ในอเมริกา
กระจายตัวแบบปกติ -- หรือกระจายตัว
แบบปกติด้วยค่าเฉลี่ยประมาณ 9.5 กรัม
มันน่าจะเป็นกิโลกรัมนะ
ผมมีลูกชายอายุ 10 เดือน และเขาหนัก 20 ปอนด์
ซึ่งประมาณ 9 กิโลกรัม ไม่ใช่ 9.5 กรัม
9.5 กรัมนี่ไม่ใช่แล้ว
นี่น่าจะเป็นน้ำหนักหนูหรืออะไรสักอย่าง
นี่ต้องเป็นกิโลกรัม
แต่ช่างเถอะ, มันคือประมาณ 9.5 กิโลกรัม
โดยค่าเบี่ยงเบนมาตรฐานมีค่าประมาณ 1.1 กรัม
แล้วค่าเฉลี่ยเท่ากับ 9.5 กิโลกรัม ผมว่านะ และ
ค่าเบี่ยงเบนมาตรฐานเท่ากับ 1.1 กรัม
ถ้าไม่ใช่เครื่องคิดเลข -- นี่เป็นคำใบ้ที่น่าสนใจ --
จงประมาณจำนวนของเด็กหญิงอายุ 1 ขวบในอเมริกาเป็นเปอร์เซ็นต์
ที่ตรงตามเงื่อนไขต่อไปนี้
เวลาเขาบอกว่า ให้กะค่าโดยไม่ต้องใช้เครื่องคิดเลข นั่นเป็น
คำใบ้ หรือวิธีการที่บอกเราให้ใช้
กฏเชิงประจักษ์ (empirical rule)
กฎเชิงประจักษ์บางครั้งเรียกว่ากฎ 68-95-99.7
และถ้าคุณจำนี่เป็นชื่อกฎ
คุณก็ต้องจำกฎได้
สิ่งที่มันบอกเราว่าคือว่า ถ้าเรามีการกระจายตัวแบบปกติ --
ผมจะทบทวนตรงนี้ก่อนที่เราจะไป
ยังปัญหานี้
ถ้าเรามีการกระจายตัวแบบปกติ -- ขอผมเขียน
การกระจายตัวแบบปกตินะ
มันจะเป็นแบบนั้น
นั่นคือการกระจายตัวแบบปกติ
ผมไม่ได้วาดแบบโดยสมบูรณ์แบบ แต่คุณคงเข้าใจ
มันควรสมมาตร
นี่คือค่าเฉลี่ยของเราตรงนี้
นั่นคือค่าเฉลี่ยของเรา
ถ้าเราอยู่เหนือค่าเฉลี่่ย 1 ส่วนเบี่ยงเบนมาตรฐาน และ
ต่ำกว่าค่าเฉลี่ย 1 หน่วยส่วนเบี่ยงบนมาตรฐาน, นี่ก็คือ ค่าเฉลี่ย บวก 1
ส่วนเบี่ยงเบนมาตรฐาน
นี่คือค่าเฉลี่ยนเรา ลบ 1 ส่วนเบี่ยงเบนมาตรฐาน
ความน่าจะเป็นที่จะได้ผล ถ้าเรายุ่งกับการกระจายตัว
แบบปกติโดยสมบูรณ์, ค่านั้นอยู่ระหว่าง ค่าเฉลี่ยลบ
1 ส่วนเบี่ยงเบนมาตรฐาน และค่าเฉลี่ยบวก 1 ส่วนเบี่ยงเบน
มาตรฐาน -- นั่นก็คือพื้นที่นี้ -- มันจะเป็น,
คุณคงเดาได้, คือ 68%
มีโอกาส 68% ที่คุณจะได้ค่าอยู่ภายใน 1 ส่วนเบี่ยงเบน
มาตรฐานวัดจากค่าเฉลี่ย
ไม่ว่าจะอยู่เหนือหรือใต้หรือระหว่าง
หนึ่งช่วงเบี่ยงเบนมาตรฐาน
ทีนี้, ถ้าเราพูดถึง 2 ช่วงเบี่ยงเบนมาตรฐานรอบ
ค่าเฉลี่ย -- ถ้าเราลองไปอีก 1 ส่วนเบี่ยงเบนมาตรฐาน, เราลงไป
ยังอีก 1 ส่วนเบี่ยงเบนมาตรฐาน ในทิศนั้นและ
เหนือค่าเฉลี่ยไปอีก 1 ส่วนเบี่ยงเบนมาตรฐาน -- และเราถาม
ตัวเองว่าความน่าจะเป็นในการพบ
ค่าอยู่ระหว่างสองช่วงนั้น, มัน
ก็คือ, คุณคงเดาได้ว่า, คือ 95%
แลนั่นรวมพื้นที่ตรงกลางนี้ด้วย
68% นี้คือส่วนหนึ่งของ 95% นี้
ผมว่าคุณคงรู้ว่าจะเป็นอย่างไรต่อ
ถ้าคุณไปที่ 3 ช่วงเบี่ยงเบนมาตรฐานใต้ค่าเฉลี่ย และ
เหนือค่าเฉลี่ย, นั่นคือกฎเชิงประจักษ์หรือกฎ 68-95-99.7
มันบอกเราว่ามีโอกาส 99.7% ที่ได้จะผลจาก
กระจายตัวแบบปกติที่อยู่ในช่วง 3 เท่าของค่าเบี่ยงเบน
มาตรฐานวัดจากค่าเฉลี่ย
คือมากกว่า ค่าเฉลี่ยลบ 3 ส่วนเบี่ยงเบนมาตรฐาน
และน้อยกว่า ค่าเฉลี่ยบวก 3 ส่วนเบี่ยงเบนมาตรฐาน
นั่นคือสิ่งที่กฎเชิงประจักษ์บอกเรา
ทีนี้ลองดูว่าเราจะใช้กับปัญหานี้ได้หรือไม่
เขาบอกค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานมาให้เรา
ขอผมวาดมันนะ
ขอผมวาดแกนก่อนให้ดีที่สุด
นั่นคือแกนของผม
ขอผมวาดเส้นโค้งระฆัง
นั่นคือเส้นโค้งระฆังที่ดีที่สุด ที่คุณคาดว่า
จะได้จากคนวาดมือเปล่าแล้ว
ค่าเฉลี่ยตรงนี้คือ 9 -- และนี่ควรสมมาตร
ความสูงนี่ควรเท่ากับความสูงตรงนี้
ผมว่าคุณคงเข้าใจ
ผมไม่ใช่คอมพิวเตอร์
9.5 คือค่าเฉลี่ย
ผมจะไม่เขียนหน่วยนะ
มันเป็นกิโลกรัมหมด
1 ค่าเบี่ยงเบนมาตรฐานเหนือค่าเฉลี่ย เราก็บวก 1.1 เข้าไป
เพราะเขาบอกเราว่าค่าเบี่ยงเบนมาตรฐานคือ 1.1
มันจะเป็น 10.6
ถ้าเราไป -- ขอผมวาดเส้นประเล็กๆ ตรงนี้นะ -- 1
ช่วงเบี่ยงเบนมาตรฐานใต้ค่าเฉลี่ย เราก็ลบ 1.1
จาก 9.5 แล้วมันจะเป็น 8.4
ถ้าเราไปยัง 2 ช่วงเบี่ยงเบนมาตรฐานเหนือค่าเฉลี่ย
เราก็บวกค่าเบี่ยงเบนมาตรฐานไปอีกทีตรงนี้
จริงไหม?
เราไปอีก 1 ค่าเบี่ยงเบนมาตรฐาน, 2
ค่าเบี่ยงเบนมาตรฐาน
นั่นพาเรามาที่ 11.7
และถ้าเราไปที่ 3 ช่วงเบี่ยงเบนมาตรฐาน
เราก็บวก 1.1 อีกที
นั่นพาเรามาที่ 12.8
ทำแบบเดียวกันอีกด้านหนึ่ง, 1 ช่วงเบี่ยงเบนมาตรฐาน
ใต้ค่าเฉลี่ยคือ 8.4
2 ช่วงเบี่ยงเบนมาตรฐานใต้ค่าเฉลี่ย -- ลบ 1.1
อีกที -- กลายเป็น 7.3
แล้ว 3 ช่วงเบี่ยงเบนมาตรฐานใต้ค่าเฉลี่ย --
เราก็เขียนไว้ตรงนี้ -- มันคือ 6.2 กิโลกรัม
นั่นก็คือการตั้งโจทย์ตรงนี้
แล้วความน่าจะเป็นที่เราพบเด็กหญิงอายุ 1 ขวบ
ในอเมริกา ที่หนักน้อยกว่า 8.4 กิโลกรัม
หรือบางทีผมควรใช้คำว่ามวลน้อยกว่า
8.4 กิโลกรัม
ถ้าเราดูตรงนี้, ความน่าจะเป็นที่จะพบเด็ก
หรือเด็กผู้หญิงอายุ 1 ขวบ ที่มีมวลหรือน้ำหนัก
น้อยกว่า 8.4 นั่นคือพื้นที่
ตรงนี้
ผมบอกว่า มวล เพราะกิโลกรัมคือหน่วยของมวล
หลายคนใช้มันกับน้ำหนักเช่นกัน
นั่นก็คือพื้นที่นั่นตรงนั้น
แล้วเราจะหาพื้นที่ใต้เส้นโค้งนี้
โดยใช้กฎเชิงประจักษ์ได้อย่างไร?
ทีนี้, เรารู้ว่าพื้นที่นี้คืออะไร
เรารู้ว่าพื้นที่ระหว่างลบ 1 ส่วนเบี่ยงเบนมาตรฐาน
กับบวก 1 ส่วนเบี่ยงเบนมาตรฐานเป็นเท่าไหร่
เรารู้ว่ามันคือ 68%
และถ้ามันคือ 68% นั่นหมายความว่า
ส่วนที่ไม่ได้อยู่ตรงกลางคือ 32%
เพราะพื้นทีใต้การกระจายตัวแบบปกติทั้งหมด
คือ 100 หรือ 100% หรือ 1, ขึ้นอยู่กับวิธีที่คุณคิด
เพราะคุณไม่มีทาง -- ความเป็นไปได้ทั้งหมด
รวมกันได้แค่ 1 เท่านั้น
คุณไม่มีทางได้มากกว่า 100% ตรงนี้
ดังนั้นถ้าคุณรวมขานี้กับขานี้ -- แล้วนี่บวกค่านั้น
จะเท่ากับส่วนที่เลหือ
งั้น 100 ลบ 68 นั่นคือ 32
32%
32% คือถ้าคุณบวกขาซ้ายนี่กับ
ขาขวานี่ตรงนี้
และนี่คือการกระจายตัวแบบปกติโดยสมบูรณ์
เขาบอกเราว่ามันกระจายตัวแบบปกติ
มันจะสมมาตรพอดี
แล้วถ้าด้านนี่ กับด้านนั้นรวมกันได้ 32 แต่ทั้งคู่
สมมาตร, หมายความว่าพวกมันมีพื้นที่เท่ากันเป๊ะ, แล้ว
ด้านนี่ตรงนี้ -- ผมจะใช้สีชมพูนะ -- ด้านนี่ตรงนี้ --
มันออกมาเป็นสีม่วงมากกว่า -- จะเป็น 16%
แล้วด้านนี่ตรงนี้จะเป็น 16%
ดังนั้นความน่าจะเป็นที่ได้ผลมากกว่า 1 ส่วนเบี่ยงเบน
มาตรฐานเหนือค่เาฉลี่ย -- นั่นคือด้านขวามือนี่
, จะเป็น 16%
หรือความน่าจะเป็นที่ได้ผลน้อยกว่า 1 ส่วนเบี่ยงเบน
มาตรฐานใต้ค่าเฉลี่ย, นั่นคือตรงนี้, 16%
แล้วเขาอยากรู้ความน่าจะเป็นที่ได้
เด็กอายุ 1 ปีหนักน้อยว่า 8.4 กิโลกรัม
น้อยกว่า 8.4 กิโลกรัม คือพื้นที่นี่ตรงนี้
และนั่นคือ 16%
มันก็คือ 16% จากข้อ a
ลองดูข้อ b กัน: ระหว่าง 7.9 กับ 11.7 จุด 7 กิโลกรัม
ระหว่าง 7.3 -- นั่นคือตรงนั้น
มันคือ 2 ส่วนเบี่ยงเบนมาตรฐานใต้ค่าเฉลี่ย -- และ 11.7, หนึ่ง,
สองส่วนเบี่ยงเบนมาตรฐานเหนือค่าเฉลี่ย
มันก็เหมือนถามเราว่า ความน่าจะเป็นที่ได้ผล
อยู่ระหว่าง 2 ช่วงเบี่ยงเบนมาตรฐานวัดจาก
ค่เาฉลี่ยเป็นเท่าไหร่, จริงไหม?
นี่คือค่าเฉลี่ยตรงนี้
นี่คืออยู่ใต้ 2 ช่วงเบี่ยงเบนมาตรฐาน
นี่คืออยู่เหนือ 2 ช่วงเบี่ยงเบนมาตรฐาน
ทีนี้ มันก็ตรงไปตรงมา
กฎเชิงประจักษ์บอกเราว่า ระหว่าง 2 ช่วงเบี่ยงเบนมาตรฐาน
คุณมีโอกาส 95% ที่จะได้ผลอยู่ภายใน
2 ช่วงเบี่ยงเบนมาตรฐาน
กฎเชิงประจักษ์ให้คำตอบเราได้เลย
แล้วสุดท้าย, ข้อ c: ความน่าจะเป็นที่ได้
เด็กผู้หญิงอเมริกัน 1 ขวบ หนักกว่า 12.8 กิลโลกรัม
12.8 กิโลกรัม คือมากกว่าค่าเฉลี่ยอยู่
3 ส่วนเบี่ยงเบนมาตรฐาน
เราอยากรู้ว่าความน่าจะเป็นที่จะได้ผล
เหนือค่าเฉลี่ยอยู่ 3 ส่วนเบี่ยงเบนมาตรฐาน
นั่นก็คือพื้นที่นี่ตรงนี้ ที่ผมวาดด้วยสีส้ม
บางทีผมควรใช้สีอื่น เพื่อให้มัน
ต่างกันหน่อย
มันเป็นหางยาวมากตรงนี้, เป็นพื้นที่เล็กๆ นี่
แล้วความน่าจะเป็นนั้นเป็นเท่าไหร่?
ลองกลับมาดูที่กฎเชิงประจักษ์ของเรา
เรารู้ว่า ความน่าจะเป็น -- เรารู้พื้นที่นี้
เรารู้พื้นที่ระวห่าง ลบ 3 ส่วนเบี่ยงเบนมาตรฐาน กับ
บวก 3 ส่วนเบี่ยงเบนมาตรฐาน
เรารู้ค่านี้ - เนื่องจากนี่คือส่วนสุดท้าย ข้อสุดท้าย
ผมสามารถระบายสีทั้งหมดนี่ได้ -- เรารู้ว่าพื้นที่นี่ตรงนี้
ระหว่างลบ 3 กับ บวก 3, นี่คือ 99.7%
ผลส่วนใหญ่อยู่ตรงนี้
ผมหมายความว่า, เกือบทั้งหมดเลย
แล้วเราเหลืออะไรไว้ให้หางสองอันบ้าง?
จำไว้, มันมีหาง 2 อัน
นี่คืออันหนึ่ง
แล้วคุณได้ผลที่น้อยกว่า ค่าเฉลี่ยลบ 3
ส่วนเบี่ยงเบนมาตรฐาน
หางนี่ตรงนี้
นั่นบอกเราว่านี่, น้อยกว่าค่าเฉลี่ยลบ 3
ส่วนเบี่ยงเบนมาตรฐาน และมากกว่า ค่าเฉลี่ยบวก
3 ส่วนเบี่ยงเบนมาตรฐาน รวมกันต้องเท่ากับที่เหลือ
ทีนี้ที่เหลือ, มันเหลืออยู่แค่ 0.3%
แล้วสองอันนี้ต้องสมมาตร
พวกมันจะต้องเท่ากัน
ดังนั้นเจ้านี่ตรงนี้ ต้องเป็นครึ่งหนึ่งของอันนี้ หรือ 0.15% และ
เจ้านี่ตรงนี้ต้องเป็น 0.15%
ดังนั้นความน่าจะเป็นที่ได้เด็กหญิงอายุ 1 ขวบในอเมริกา
ที่หนักกว่า 12.8 เปอร์เซ็นต์ ถ้าคุณสมมุติว่า
การกระจายตัวแบบปกติโดยสมบูรณ์คือพื้นที่ใต้โค้งนี้
พื้นที่ใต้โค้งที่มากกว่าค่าเฉลี่ยบวก 3 ส่วน
เบี่ยงเบนมาตรฐาน
มันคือ 0.15%
เอาล่ะ, หวังว่าคุณคงได้ประโยชน์ไปนะ