-
-
-
ความดันโลหิตของคนไข้ 7 คนถูกวัดหลังจาก
-
ได้รับยาใหม่ไป 3 เดือน
-
พวกเขามีความดันโลหิตเพิ่มขึ้น, เขาให้จุด
-
ข้อมูลมา 7 จุดตรงนี้, มันเป็นหน่วย
-
ความดันโลหิตหน่วยหนึ่ง
-
จงสร้างช่วงความมั่นใจ 95% ของความดันโลหิต
-
คาดหวังที่เพิ่มขึ้นจริงสำหรับผู้ป่วยทุกคนในประชากร
-
มีการกระจายตัวประชากรค่าหนึ่งตรงนี้
-
และมันสมเหตุสมผลที่จะสมมุติว่ามันเป็นแบบปกติ
-
มันเป็นกระบวนการทางชีววิทยา
-
ถ้าคุณให้ยานี้กับคนทุกคนที่
-
มีชีวิตอยู่, มันจะทำให้ความโลหิตเพิ่มขึ้น
-
ด้วยวิธีใดวิธีหนึ่ง, หรือใครจะรู้, บางทีมันอาจลดลงก็ได้
-
มันจึงมีค่าเบี่ยงเบนมาตรฐานค่าหนึ่งตรงนี้
-
-
-
มันคือการกระจายตัวแบบปกติ
-
และสาเหตุที่มันสมเหตุสมผล ในการสมมุติว่า
-
มันเป็นการกระจายตัวแบบปกติ เพราะ
-
มันเป็นกระบวนการทางชีววิทยา
-
มันจะเป็นผลรวมจากเหตุการณ์สุ่มนับพัน
-
นับล้าน
-
และสิ่งที่เป็นผลรวมของเหตุการณ์สุ่มนับพัน นับล้าน
-
มักจะกระจายตัวแบบปกติ
-
นี่คือการกระจายตัวประชากร
-
-
-
และเราไม่รู้อะไรนอกเหนือ
-
ตัวอย่างที่เรามีตรงนี้
-
ทีนี้, สิ่งที่เราทำได้คือ, และนี่มักเป็นสิ่งที่ดี
-
ที่ควรทำ, เวลาคุณมีตัวอย่าง เวลาหา
-
ทุกอย่างที่คุณอยากหา เกี่ยว
-
ตัวอย่างจากจุดแรกเริ่ม
-
เรามีจุดข้อมูลอยู่ 7 จุด
-
แล้วคุณก็บวกมันเข้าแล้วหารด้วย 7 เราก็จะได้
-
ค่าเฉลี่ยตัวอย่างมา
-
ค่าเฉลี่ยตัวอย่างของเราตรงนี้คือ 2.34
-
แล้วคุณก็สามารถคำนวณ
-
ค่าเบี่ยงเบนมาตรฐานตัวอย่างได้
-
หาระยะกำลังสองจากจุดพวกนี้แต่ละจุดไปยัง
-
ค่าเฉลี่ยตัวอย่าง, บวกพวกมันเข้า, หารด้วย n ลบ 1, เพราะ
-
มันคือตัวอย่าง, หาสแควร์รูท แล้วคุณจะได้
-
ค่าเบี่ยงเบนมาตรฐานตัวอย่างมา
-
ผมทำมาก่อนแล้วเพื่อประหยัดเวลา
-
ค่าเบี่ยงเบนมาตรฐานตัวอย่าง เท่ากับ 1.04
-
และเมื่อคุณไม่รู้อะไรอื่นเกี่ยวกับประชากร
-
สิ่งที่เราจะทำจากที่เรารู้
-
คือประมาณค่านั้น ด้วยค่าเบี่ยงเบน
-
มาตรฐานตัวอย่าง
-
เราเคยประมาณค่าเบี่ยงเบนมาตรฐานของประชากรจริง
-
ด้วยค่าเบี่ยงเบนมาตรฐานของตัวอย่างมาแล้ว
-
-
-
ทีนี้ ในข้อนี้, ในปัญหานี้เลย, เรา
-
เจอปัญหาอย่างหนึ่ง
-
เรากำลังประมาณค่าเบี่ยงเบนมาตรฐาน ด้วย n เท่ากับ 7 แค่นั้น
-
นี่จะเป็นค่าประมาณที่ไม่ดีนัก
-
เพราะ -- ขอผมเขียนลงไปนะ -- เพราะ n มันน้อย
-
โดยทั่วไป, มันนับว่าเป็นการประมาณที่แย่ หาก n
-
น้อยกว่า 30
-
ถ้ามากกว่า 30 คุณก็อยู่ในช่วง
-
ที่ประมาณได้ดีแล้ว
-
ประเด็นของวิดีโอนี้ คือ เมื่อเราคิดถึง
-
การกระจายตัวตัวอย่าง, ซึ่งคือสิ่งที่เราจะใช้
-
สร้างช่วงของเรา, แทนที่จะ
-
สมมุติว่าการกระจายตัวตัวอย่าง เป็นแบบปกติอย่างที่เราทำ
-
มาหลายวิดีโอ โดยใช้ทฤษฎีบทเข้าสู่ศูนย์กลาง อะไรทั้งหมดนั่น,
-
เราจะเปลี่ยนการกระจายตัวตัวอย่าง
-
เราจะไม่สมมุติว่ามันกระจายตัวแบบปกติ เพราะ
-
มันเป็นการประมาณที่แย่
-
เราจะสมมุติว่ามันกระจายตัวแบบ
-
ที่เรียกว่า t
-
และการกระจายตัวแบบ t ก็คือ, วิธีที่
-
คิดที่ดีที่สุด คือมันถูกสร้างให้
-
ค่าประมาณช่วงความมั่นใจที่ดีขึ้น
-
เมื่อคุณมีขนาดตัวอย่างเล็กๆ
-
มันจะดูเหมือนการกระจายตัวแบบปกติมาก
-
-
-
มันมีค่าเฉลี่ย, นี่ก็คือค่าเฉลี่ยของการกระจาย
-
ตัวตัวอย่างเหมือนเดิม
-
แต่มันจะมีหางอ้วนขึ้น
-
-
-
และวิธีที่ผมคิดว่าทำไมมันถึงหางอ้วนขึ้น คือเมื่อ
-
คุณสมมุติว่านี่คือค่าเบี่ยงเบนมาตรฐาน
-
-- ขอผมไปอีกขั้นนะ
-
โดยทั่วไป สิ่งที่เราทำ คือเราหาค่าประมาณของค่าเบี่ยงเบน
-
มาตรฐานจริง, แล้วเราบอกว่า ค่าเบี่ยงเบนมาตรฐาน
-
ของการกระจายตัวตัวอย่าง เท่ากับ
-
ค่าเบี่ยงเบนมาตรฐานจริง ของประชากรเรา หารด้วย
-
สแควร์รูทของ n
-
ในกรณีนี้, n เท่ากับ 7
-
แล้วเราบอกว่า โอเค, เราไม่รู้ค่ามาตรฐานจริง, หรือ
-
เรามักไม่รู้ -- บางครั้งก็รู้ -- แต่เรามักไม่รู้
-
ค่าเบี่ยงเบนมาตรฐานจริง
-
แล้วถ้าเราไม่รู้มัน สิ่งที่ดีที่สุดเราจะใส่ลงไปตรงนี้
-
คือค่าเบี่ยงเบนมาตรฐานตัวอย่างของเรา
-
-
-
และนี่ตรงนี้, นี่คือสาเหตุที่เราไม่บอกว่า
-
นี่คือช่วงที่มีโอกาสเกิดขึ้น 95%
-
นี่คือสาเหตุที่เรามันเรียกว่าช่วงความมั่นใจ
-
เพราะเราใช้ข้อสมมุติอย่างนั้น
-
เจ้านี่จะเปลี่ยนไปจากตัวอย่างหนึ่งถึงตัวอย่างหนึ่ง
-
และค่านี้, นี่จะเป็นค่าประมาณที่แย่มาก
-
เมื่อเรามีขนาดตัวอย่างที่เล็ก,
-
ขนาดน้อยกว่า 30
-
แล้วเวลาคุณประมาณค่าเบี่ยงเบนมาตรฐาน โดยคุณ
-
ไม่รู้มัน, คุณก็กะค่ามันด้วยค่าเบี่ยงเบนมาตรฐาน
-
ของตัวอย่าง, และขนาดตัวอย่างคุณเล็ก, แล้ว
-
คุณจะใช้นี่เพื่อประมาณค่าเบี่ยงเบน
-
มาตรฐานของการกระจายตัวตัวอย่าง, คุณไม่ได้สมมุติ
-
ว่าการกระจายตัวตัวอย่างเป็นการกระจายตัวแบบปกติอีกต่ไป
-
คุณจะสมมุติว่ามันมีหางอ้วนขึ้น
-
และมันมีหางอ้วนขึ้น เพราะคุณ
-
เดาค่าต่ำไป -- คุณกำลังเดาค่าเบี่ยงเบนมาตรฐาน
-
ต่ำไปตรงนี้
-
เอาล่ะ, เมื่อรู้แล้ว, ลองดูโจทย์นี้
-
โดยละเอียดกัน
-
เราต้องคิดถึงช่วงความมั่นใจ 95%
-
รอบค่าเฉลี่ยนี่ตรงนี้
-
แล้วช่วงความมั่นใจ 95%, ถ้านี่คือการกระจายตัว
-
แบบปกติ คุณก็หาค่ามันที่ตาราง z
-
แต่มันไม่ใช่, นี่คือการกระจายตัวแบบ t
-
-
-
เราจะมองหาช่วงความมั่นใจ 95%
-
ช่วงรอบค่าเฉลี่ยที่
-
ครอบคลุมพื้นที่ 95%
-
สำหรับการกระจายตัวแบบ t คุณก็ใช้ตาราง t, และผมมีตาราง t
-
เตรียมไว้ก่อนตรงนี้แล้ว
-
และสิ่งที่คุณอยากทำ คือใช้แถว สองด้าน (two-sided)
-
สำหรับสิ่งที่เรากำลังทำตรงนี้
-
วิธีที่คิดที่ดีที่สุดคือว่า เรา
-
สมมาตรรอบค่าเฉลี่ย
-
นั่นคือสาเหตุที่มันเรียกว่าสองด้าน
-
มันจะเป็นด้านเดียว ถ้ามันเป็นเปอร์เซ็นต์
-
สะสมถึงค่าวิกฤตค่าหนึ่ง
-
แต่ในกรณีนี้, มันมีสองด้าน, เราได้รูปสมมาตร
-
หรือวิธีคิดอีกอย่างคือว่า เรา
-
หักสองด้านนี้ออก
-
เราอยากได้ 95% ตรงกลาง
-
และนี่คือการกระจายตัวตัวอย่างของ
-
ค่าเฉลี่ยตัวอย่าง สำหรับ n เท่ากับ 7
-
และผมจะไม่ลงรายละเอียดตรงนี้, แต่เมื่อ n
-
เท่ากับ 7, คุณมีดีกรีความอิสระเป็น 6, หรือ n ลบ 1
-
และวิธีที่เขาสร้างตาราง t, คุณก็หา
-
ดีกรีความอิสระ
-
คุณไม่ได้ไปที่ n, แต่คุณไปที่ n ลบ 1
-
คุณก็ไปที่ 6 ตรงนี้
-
แล้วถ้าคุณอยากครอบคลุม 95% ของเจ้านี่ตรงนี้,
-
แล้วคุณได้ n เท่ากับ 6, คุณต้องไปที่ 2.447 ค่าเบี่ยงเบน
-
มาตรฐานในแต่ละทิศ
-
และตาราง t นี่สมมุติว่า คุณกำลังประมาณ
-
ค่าเบี่ยงเบนมาตรฐานนั้น โดยใช้ค่าเบี่ยงเบนมาตรฐานตัวอย่าง
-
วิธีคิดอีกอย่างคือว่า คุณต้องไป 2.447 เท่าของ
-
ค่าเบี่ยงเบนมาตรฐานประมาณนี้
-
ขอผมใส่มันตรงนี้นะ
-
คุณต้องไป 2.447 -- ระยะนี่ตรงนี้คือ 2.447
-
คูณค่าเบี่ยงเบนมาตรฐานประมาณนี่
-
-
-
และบางครั้งคุณจะเห็นนี่ในหนังสือสถิติ
-
เจ้านี่ตรงนี้, เลขเป๊ะๆ นี่,
-
แสดงไว้แบบนี้
-
เขาใส่หมวกเล็กๆ ข้างบนค่าเบี่ยงเบนมาตรฐาน
-
เพื่อแสดงว่ามันประมาณโดยใช้ค่าเบี่ยงเบน
-
มาตรฐานตัวอย่าง
-
เราจะใส่หมวกเล็กๆ ตรงนี้, เพราะว่ากันตามตรง, นี่คือ
-
สิ่งเดียวที่เราสามารถคำนวณได้
-
นี่ก็คือระยะที่คุณไปได้แต่ละทิศ
-
และเรารู้ว่าค่านี้เป็นเท่าไหร่
-
เรารู้ว่าการกระจายตัวตัวอย่างเป็นอะไร
-
ลองเอาเครื่องคิดเลขออกมากัน
-
-
-
เรารู้ว่าค่าเบี่ยงเบนมาตรฐานตัวอย่างเป็น 1.04
-
และเราอยากหารมันด้วยสแควร์รูทของ 7
-
-
-
เราก็ได้ 0.39
-
เจ้านี่ตรงนี้คือ 0.39
-
แล้วถ้าเราอยากหาระยะรอบค่าเฉลี่ย
-
ประชากรนี่ ที่ครอบคลุม 95%
-
ของประชากร หรือการกระจายตัวตัวอย่าง, เราต้อง
-
คูณ 0.39 ด้วย 2.447, งั้นลองทำดู
-
คูณ 2.447 ได้เท่ากับ 0.96
-
นี่จึงเท่ากับ -- ระยะนี่ตรงนี้คือ 0.96,
-
แล้วระยะนี่ตรงนี้คือ 0.96
-
นั่นคือถ้าคุณเลือกสุ่มตัวอย่างค่าหนึ่ง, และนั่นคือ
-
สิ่งที่เราทำ ตอนเราหาตัวอย่าง 7 ค่าพวกนี้
-
เมื่อเราเลือกค่าตัวอย่าง 7 ค่าขึ้นมา เราหาค่าเฉลี่ย, ค่าเฉลี่ย
-
นี้สามารถมองว่าเป็นตัวอย่างสุ่มจุดหนึ่ง ในการกระจายตัว
-
ตัวอย่าง
-
แล้วความน่าจะเป็น, เราสามารถมองมัน, เราบอกได้ว่า
-
มีโอกาส 95% -- และเราต้องระบุ
-
ทุกอย่างด้วยความมั่นใจระดับหนึ่ง, เพราะเราทำ
-
ทุกอย่างด้วยการประมาณตรงนี้
-
มันไม่ใช่ค่าเป๊ะ โอกาส 95%
-
เราแค่มั่นใจว่ามันมีโอกาส 95% ที่
-
ประชากรสุ่ม, ค่าเฉลี่ยตัวอย่างสุ่มตรงนี้,
-
2.34, ซึ่งเราใช้ -- เราเลือก
-
2.34 จากการกระจายตัวนี่ตรงนี้
-
มันมีโอกาส 95% ที่ 2.34 จะอยู่ในช่วง 0.96
-
ของค่าเฉลี่ยการกระจายตัวตัวอย่างจริง. ซึ่งเรารู้ว่า
-
มันเหมือนกับค่าเฉลี่ยตัวอย่าง
-
-
-
หรือสามารถเรียงประโยคใหม่ แล้วบอกว่า มันมีโอกาส
-
95% ที่ค่าเฉลี่ย, ค่าเฉลี่ยจริง,
-
ซึ่งก็เหมือนกับค่าเฉลี่ยการกระจายตัวตัวอย่าง, นั้นอยู่
-
ในช่วง 0.96 ของค่าเฉลี่ยตัวอย่าง, นั่นคือ 2.34
-
ที่ขอบล่าง, ถ้าเราไปที่ 2.36 ลบ -- ถ้าคุณไปที่ 2.34
-
ลบ 0.96 -- นั่นคือขอบล่างของช่วง
-
ความมั่นใจ, ได้ 1.38
-
และขอบบนของช่วงความมั่นใจ, 2.34 บวก
-
0.96 เท่ากับ 3.3
-
ดังนั้นช่วงความมั่นใจ 95% ของเรา คือ จาก 1.38 ถึง 3.3
-
-