< Return to Video

Small Sample Size Confidence Intervals

  • 0:00 - 0:01
    -
  • 0:01 - 0:03
    ความดันโลหิตของคนไข้ 7 คนถูกวัดหลังจาก
  • 0:03 - 0:06
    ได้รับยาใหม่ไป 3 เดือน
  • 0:06 - 0:08
    พวกเขามีความดันโลหิตเพิ่มขึ้น, เขาให้จุด
  • 0:08 - 0:11
    ข้อมูลมา 7 จุดตรงนี้, มันเป็นหน่วย
  • 0:11 - 0:12
    ความดันโลหิตหน่วยหนึ่ง
  • 0:12 - 0:17
    จงสร้างช่วงความมั่นใจ 95% ของความดันโลหิต
  • 0:17 - 0:22
    คาดหวังที่เพิ่มขึ้นจริงสำหรับผู้ป่วยทุกคนในประชากร
  • 0:22 - 0:25
    มีการกระจายตัวประชากรค่าหนึ่งตรงนี้
  • 0:25 - 0:27
    และมันสมเหตุสมผลที่จะสมมุติว่ามันเป็นแบบปกติ
  • 0:27 - 0:29
    มันเป็นกระบวนการทางชีววิทยา
  • 0:29 - 0:33
    ถ้าคุณให้ยานี้กับคนทุกคนที่
  • 0:33 - 0:39
    มีชีวิตอยู่, มันจะทำให้ความโลหิตเพิ่มขึ้น
  • 0:39 - 0:41
    ด้วยวิธีใดวิธีหนึ่ง, หรือใครจะรู้, บางทีมันอาจลดลงก็ได้
  • 0:41 - 0:43
    มันจึงมีค่าเบี่ยงเบนมาตรฐานค่าหนึ่งตรงนี้
  • 0:43 - 0:46
    -
  • 0:46 - 0:47
    มันคือการกระจายตัวแบบปกติ
  • 0:47 - 0:50
    และสาเหตุที่มันสมเหตุสมผล ในการสมมุติว่า
  • 0:50 - 0:52
    มันเป็นการกระจายตัวแบบปกติ เพราะ
  • 0:52 - 0:53
    มันเป็นกระบวนการทางชีววิทยา
  • 0:53 - 0:55
    มันจะเป็นผลรวมจากเหตุการณ์สุ่มนับพัน
  • 0:55 - 0:56
    นับล้าน
  • 0:56 - 0:59
    และสิ่งที่เป็นผลรวมของเหตุการณ์สุ่มนับพัน นับล้าน
  • 0:59 - 1:02
    มักจะกระจายตัวแบบปกติ
  • 1:02 - 1:03
    นี่คือการกระจายตัวประชากร
  • 1:03 - 1:08
    -
  • 1:08 - 1:11
    และเราไม่รู้อะไรนอกเหนือ
  • 1:11 - 1:13
    ตัวอย่างที่เรามีตรงนี้
  • 1:13 - 1:17
    ทีนี้, สิ่งที่เราทำได้คือ, และนี่มักเป็นสิ่งที่ดี
  • 1:17 - 1:19
    ที่ควรทำ, เวลาคุณมีตัวอย่าง เวลาหา
  • 1:19 - 1:21
    ทุกอย่างที่คุณอยากหา เกี่ยว
  • 1:21 - 1:22
    ตัวอย่างจากจุดแรกเริ่ม
  • 1:22 - 1:24
    เรามีจุดข้อมูลอยู่ 7 จุด
  • 1:24 - 1:27
    แล้วคุณก็บวกมันเข้าแล้วหารด้วย 7 เราก็จะได้
  • 1:27 - 1:28
    ค่าเฉลี่ยตัวอย่างมา
  • 1:28 - 1:34
    ค่าเฉลี่ยตัวอย่างของเราตรงนี้คือ 2.34
  • 1:34 - 1:35
    แล้วคุณก็สามารถคำนวณ
  • 1:35 - 1:37
    ค่าเบี่ยงเบนมาตรฐานตัวอย่างได้
  • 1:37 - 1:39
    หาระยะกำลังสองจากจุดพวกนี้แต่ละจุดไปยัง
  • 1:39 - 1:43
    ค่าเฉลี่ยตัวอย่าง, บวกพวกมันเข้า, หารด้วย n ลบ 1, เพราะ
  • 1:43 - 1:46
    มันคือตัวอย่าง, หาสแควร์รูท แล้วคุณจะได้
  • 1:46 - 1:47
    ค่าเบี่ยงเบนมาตรฐานตัวอย่างมา
  • 1:47 - 1:50
    ผมทำมาก่อนแล้วเพื่อประหยัดเวลา
  • 1:50 - 1:53
    ค่าเบี่ยงเบนมาตรฐานตัวอย่าง เท่ากับ 1.04
  • 1:53 - 1:55
    และเมื่อคุณไม่รู้อะไรอื่นเกี่ยวกับประชากร
  • 1:55 - 1:57
    สิ่งที่เราจะทำจากที่เรารู้
  • 1:57 - 2:03
    คือประมาณค่านั้น ด้วยค่าเบี่ยงเบน
  • 2:03 - 2:05
    มาตรฐานตัวอย่าง
  • 2:05 - 2:08
    เราเคยประมาณค่าเบี่ยงเบนมาตรฐานของประชากรจริง
  • 2:08 - 2:12
    ด้วยค่าเบี่ยงเบนมาตรฐานของตัวอย่างมาแล้ว
  • 2:12 - 2:16
    -
  • 2:16 - 2:19
    ทีนี้ ในข้อนี้, ในปัญหานี้เลย, เรา
  • 2:19 - 2:20
    เจอปัญหาอย่างหนึ่ง
  • 2:20 - 2:25
    เรากำลังประมาณค่าเบี่ยงเบนมาตรฐาน ด้วย n เท่ากับ 7 แค่นั้น
  • 2:25 - 2:31
    นี่จะเป็นค่าประมาณที่ไม่ดีนัก
  • 2:31 - 2:41
    เพราะ -- ขอผมเขียนลงไปนะ -- เพราะ n มันน้อย
  • 2:41 - 2:44
    โดยทั่วไป, มันนับว่าเป็นการประมาณที่แย่ หาก n
  • 2:44 - 2:46
    น้อยกว่า 30
  • 2:46 - 2:48
    ถ้ามากกว่า 30 คุณก็อยู่ในช่วง
  • 2:48 - 2:50
    ที่ประมาณได้ดีแล้ว
  • 2:50 - 2:53
    ประเด็นของวิดีโอนี้ คือ เมื่อเราคิดถึง
  • 2:53 - 2:55
    การกระจายตัวตัวอย่าง, ซึ่งคือสิ่งที่เราจะใช้
  • 2:55 - 2:59
    สร้างช่วงของเรา, แทนที่จะ
  • 2:59 - 3:02
    สมมุติว่าการกระจายตัวตัวอย่าง เป็นแบบปกติอย่างที่เราทำ
  • 3:02 - 3:05
    มาหลายวิดีโอ โดยใช้ทฤษฎีบทเข้าสู่ศูนย์กลาง อะไรทั้งหมดนั่น,
  • 3:05 - 3:08
    เราจะเปลี่ยนการกระจายตัวตัวอย่าง
  • 3:08 - 3:11
    เราจะไม่สมมุติว่ามันกระจายตัวแบบปกติ เพราะ
  • 3:11 - 3:12
    มันเป็นการประมาณที่แย่
  • 3:12 - 3:14
    เราจะสมมุติว่ามันกระจายตัวแบบ
  • 3:14 - 3:16
    ที่เรียกว่า t
  • 3:16 - 3:18
    และการกระจายตัวแบบ t ก็คือ, วิธีที่
  • 3:18 - 3:23
    คิดที่ดีที่สุด คือมันถูกสร้างให้
  • 3:23 - 3:25
    ค่าประมาณช่วงความมั่นใจที่ดีขึ้น
  • 3:25 - 3:29
    เมื่อคุณมีขนาดตัวอย่างเล็กๆ
  • 3:29 - 3:31
    มันจะดูเหมือนการกระจายตัวแบบปกติมาก
  • 3:31 - 3:35
    -
  • 3:35 - 3:39
    มันมีค่าเฉลี่ย, นี่ก็คือค่าเฉลี่ยของการกระจาย
  • 3:39 - 3:40
    ตัวตัวอย่างเหมือนเดิม
  • 3:40 - 3:41
    แต่มันจะมีหางอ้วนขึ้น
  • 3:41 - 3:46
    -
  • 3:46 - 3:50
    และวิธีที่ผมคิดว่าทำไมมันถึงหางอ้วนขึ้น คือเมื่อ
  • 3:50 - 3:53
    คุณสมมุติว่านี่คือค่าเบี่ยงเบนมาตรฐาน
  • 3:53 - 3:56
    -- ขอผมไปอีกขั้นนะ
  • 3:56 - 3:59
    โดยทั่วไป สิ่งที่เราทำ คือเราหาค่าประมาณของค่าเบี่ยงเบน
  • 3:59 - 4:02
    มาตรฐานจริง, แล้วเราบอกว่า ค่าเบี่ยงเบนมาตรฐาน
  • 4:02 - 4:08
    ของการกระจายตัวตัวอย่าง เท่ากับ
  • 4:08 - 4:11
    ค่าเบี่ยงเบนมาตรฐานจริง ของประชากรเรา หารด้วย
  • 4:11 - 4:13
    สแควร์รูทของ n
  • 4:13 - 4:16
    ในกรณีนี้, n เท่ากับ 7
  • 4:16 - 4:18
    แล้วเราบอกว่า โอเค, เราไม่รู้ค่ามาตรฐานจริง, หรือ
  • 4:18 - 4:22
    เรามักไม่รู้ -- บางครั้งก็รู้ -- แต่เรามักไม่รู้
  • 4:22 - 4:22
    ค่าเบี่ยงเบนมาตรฐานจริง
  • 4:22 - 4:25
    แล้วถ้าเราไม่รู้มัน สิ่งที่ดีที่สุดเราจะใส่ลงไปตรงนี้
  • 4:25 - 4:27
    คือค่าเบี่ยงเบนมาตรฐานตัวอย่างของเรา
  • 4:27 - 4:32
    -
  • 4:32 - 4:36
    และนี่ตรงนี้, นี่คือสาเหตุที่เราไม่บอกว่า
  • 4:36 - 4:39
    นี่คือช่วงที่มีโอกาสเกิดขึ้น 95%
  • 4:39 - 4:41
    นี่คือสาเหตุที่เรามันเรียกว่าช่วงความมั่นใจ
  • 4:41 - 4:43
    เพราะเราใช้ข้อสมมุติอย่างนั้น
  • 4:43 - 4:47
    เจ้านี่จะเปลี่ยนไปจากตัวอย่างหนึ่งถึงตัวอย่างหนึ่ง
  • 4:47 - 4:50
    และค่านี้, นี่จะเป็นค่าประมาณที่แย่มาก
  • 4:50 - 4:53
    เมื่อเรามีขนาดตัวอย่างที่เล็ก,
  • 4:53 - 4:55
    ขนาดน้อยกว่า 30
  • 4:55 - 4:59
    แล้วเวลาคุณประมาณค่าเบี่ยงเบนมาตรฐาน โดยคุณ
  • 4:59 - 5:01
    ไม่รู้มัน, คุณก็กะค่ามันด้วยค่าเบี่ยงเบนมาตรฐาน
  • 5:01 - 5:04
    ของตัวอย่าง, และขนาดตัวอย่างคุณเล็ก, แล้ว
  • 5:04 - 5:07
    คุณจะใช้นี่เพื่อประมาณค่าเบี่ยงเบน
  • 5:07 - 5:11
    มาตรฐานของการกระจายตัวตัวอย่าง, คุณไม่ได้สมมุติ
  • 5:11 - 5:14
    ว่าการกระจายตัวตัวอย่างเป็นการกระจายตัวแบบปกติอีกต่ไป
  • 5:14 - 5:17
    คุณจะสมมุติว่ามันมีหางอ้วนขึ้น
  • 5:17 - 5:20
    และมันมีหางอ้วนขึ้น เพราะคุณ
  • 5:20 - 5:22
    เดาค่าต่ำไป -- คุณกำลังเดาค่าเบี่ยงเบนมาตรฐาน
  • 5:22 - 5:24
    ต่ำไปตรงนี้
  • 5:24 - 5:26
    เอาล่ะ, เมื่อรู้แล้ว, ลองดูโจทย์นี้
  • 5:26 - 5:27
    โดยละเอียดกัน
  • 5:27 - 5:31
    เราต้องคิดถึงช่วงความมั่นใจ 95%
  • 5:31 - 5:33
    รอบค่าเฉลี่ยนี่ตรงนี้
  • 5:33 - 5:37
    แล้วช่วงความมั่นใจ 95%, ถ้านี่คือการกระจายตัว
  • 5:37 - 5:39
    แบบปกติ คุณก็หาค่ามันที่ตาราง z
  • 5:39 - 5:40
    แต่มันไม่ใช่, นี่คือการกระจายตัวแบบ t
  • 5:40 - 5:45
    -
  • 5:45 - 5:48
    เราจะมองหาช่วงความมั่นใจ 95%
  • 5:48 - 5:51
    ช่วงรอบค่าเฉลี่ยที่
  • 5:51 - 5:54
    ครอบคลุมพื้นที่ 95%
  • 5:54 - 5:58
    สำหรับการกระจายตัวแบบ t คุณก็ใช้ตาราง t, และผมมีตาราง t
  • 5:58 - 5:59
    เตรียมไว้ก่อนตรงนี้แล้ว
  • 5:59 - 6:03
    และสิ่งที่คุณอยากทำ คือใช้แถว สองด้าน (two-sided)
  • 6:03 - 6:04
    สำหรับสิ่งที่เรากำลังทำตรงนี้
  • 6:04 - 6:06
    วิธีที่คิดที่ดีที่สุดคือว่า เรา
  • 6:06 - 6:10
    สมมาตรรอบค่าเฉลี่ย
  • 6:10 - 6:11
    นั่นคือสาเหตุที่มันเรียกว่าสองด้าน
  • 6:11 - 6:13
    มันจะเป็นด้านเดียว ถ้ามันเป็นเปอร์เซ็นต์
  • 6:13 - 6:16
    สะสมถึงค่าวิกฤตค่าหนึ่ง
  • 6:16 - 6:19
    แต่ในกรณีนี้, มันมีสองด้าน, เราได้รูปสมมาตร
  • 6:19 - 6:20
    หรือวิธีคิดอีกอย่างคือว่า เรา
  • 6:20 - 6:22
    หักสองด้านนี้ออก
  • 6:22 - 6:25
    เราอยากได้ 95% ตรงกลาง
  • 6:25 - 6:33
    และนี่คือการกระจายตัวตัวอย่างของ
  • 6:33 - 6:37
    ค่าเฉลี่ยตัวอย่าง สำหรับ n เท่ากับ 7
  • 6:37 - 6:39
    และผมจะไม่ลงรายละเอียดตรงนี้, แต่เมื่อ n
  • 6:39 - 6:45
    เท่ากับ 7, คุณมีดีกรีความอิสระเป็น 6, หรือ n ลบ 1
  • 6:45 - 6:49
    และวิธีที่เขาสร้างตาราง t, คุณก็หา
  • 6:49 - 6:50
    ดีกรีความอิสระ
  • 6:50 - 6:53
    คุณไม่ได้ไปที่ n, แต่คุณไปที่ n ลบ 1
  • 6:53 - 6:55
    คุณก็ไปที่ 6 ตรงนี้
  • 6:55 - 6:59
    แล้วถ้าคุณอยากครอบคลุม 95% ของเจ้านี่ตรงนี้,
  • 6:59 - 7:04
    แล้วคุณได้ n เท่ากับ 6, คุณต้องไปที่ 2.447 ค่าเบี่ยงเบน
  • 7:04 - 7:06
    มาตรฐานในแต่ละทิศ
  • 7:06 - 7:11
    และตาราง t นี่สมมุติว่า คุณกำลังประมาณ
  • 7:11 - 7:14
    ค่าเบี่ยงเบนมาตรฐานนั้น โดยใช้ค่าเบี่ยงเบนมาตรฐานตัวอย่าง
  • 7:14 - 7:18
    วิธีคิดอีกอย่างคือว่า คุณต้องไป 2.447 เท่าของ
  • 7:18 - 7:21
    ค่าเบี่ยงเบนมาตรฐานประมาณนี้
  • 7:21 - 7:22
    ขอผมใส่มันตรงนี้นะ
  • 7:22 - 7:28
    คุณต้องไป 2.447 -- ระยะนี่ตรงนี้คือ 2.447
  • 7:28 - 7:34
    คูณค่าเบี่ยงเบนมาตรฐานประมาณนี่
  • 7:34 - 7:38
    -
  • 7:38 - 7:40
    และบางครั้งคุณจะเห็นนี่ในหนังสือสถิติ
  • 7:40 - 7:42
    เจ้านี่ตรงนี้, เลขเป๊ะๆ นี่,
  • 7:42 - 7:44
    แสดงไว้แบบนี้
  • 7:44 - 7:47
    เขาใส่หมวกเล็กๆ ข้างบนค่าเบี่ยงเบนมาตรฐาน
  • 7:47 - 7:50
    เพื่อแสดงว่ามันประมาณโดยใช้ค่าเบี่ยงเบน
  • 7:50 - 7:51
    มาตรฐานตัวอย่าง
  • 7:51 - 7:53
    เราจะใส่หมวกเล็กๆ ตรงนี้, เพราะว่ากันตามตรง, นี่คือ
  • 7:53 - 7:56
    สิ่งเดียวที่เราสามารถคำนวณได้
  • 7:56 - 7:59
    นี่ก็คือระยะที่คุณไปได้แต่ละทิศ
  • 7:59 - 8:00
    และเรารู้ว่าค่านี้เป็นเท่าไหร่
  • 8:00 - 8:02
    เรารู้ว่าการกระจายตัวตัวอย่างเป็นอะไร
  • 8:02 - 8:03
    ลองเอาเครื่องคิดเลขออกมากัน
  • 8:03 - 8:11
    -
  • 8:11 - 8:17
    เรารู้ว่าค่าเบี่ยงเบนมาตรฐานตัวอย่างเป็น 1.04
  • 8:17 - 8:19
    และเราอยากหารมันด้วยสแควร์รูทของ 7
  • 8:19 - 8:24
    -
  • 8:24 - 8:29
    เราก็ได้ 0.39
  • 8:29 - 8:36
    เจ้านี่ตรงนี้คือ 0.39
  • 8:36 - 8:40
    แล้วถ้าเราอยากหาระยะรอบค่าเฉลี่ย
  • 8:40 - 8:43
    ประชากรนี่ ที่ครอบคลุม 95%
  • 8:43 - 8:46
    ของประชากร หรือการกระจายตัวตัวอย่าง, เราต้อง
  • 8:46 - 8:51
    คูณ 0.39 ด้วย 2.447, งั้นลองทำดู
  • 8:51 - 9:01
    คูณ 2.447 ได้เท่ากับ 0.96
  • 9:01 - 9:10
    นี่จึงเท่ากับ -- ระยะนี่ตรงนี้คือ 0.96,
  • 9:10 - 9:14
    แล้วระยะนี่ตรงนี้คือ 0.96
  • 9:14 - 9:16
    นั่นคือถ้าคุณเลือกสุ่มตัวอย่างค่าหนึ่ง, และนั่นคือ
  • 9:16 - 9:20
    สิ่งที่เราทำ ตอนเราหาตัวอย่าง 7 ค่าพวกนี้
  • 9:20 - 9:23
    เมื่อเราเลือกค่าตัวอย่าง 7 ค่าขึ้นมา เราหาค่าเฉลี่ย, ค่าเฉลี่ย
  • 9:23 - 9:26
    นี้สามารถมองว่าเป็นตัวอย่างสุ่มจุดหนึ่ง ในการกระจายตัว
  • 9:26 - 9:27
    ตัวอย่าง
  • 9:27 - 9:31
    แล้วความน่าจะเป็น, เราสามารถมองมัน, เราบอกได้ว่า
  • 9:31 - 9:36
    มีโอกาส 95% -- และเราต้องระบุ
  • 9:36 - 9:39
    ทุกอย่างด้วยความมั่นใจระดับหนึ่ง, เพราะเราทำ
  • 9:39 - 9:41
    ทุกอย่างด้วยการประมาณตรงนี้
  • 9:41 - 9:44
    มันไม่ใช่ค่าเป๊ะ โอกาส 95%
  • 9:44 - 9:48
    เราแค่มั่นใจว่ามันมีโอกาส 95% ที่
  • 9:48 - 9:52
    ประชากรสุ่ม, ค่าเฉลี่ยตัวอย่างสุ่มตรงนี้,
  • 9:52 - 9:56
    2.34, ซึ่งเราใช้ -- เราเลือก
  • 9:56 - 10:00
    2.34 จากการกระจายตัวนี่ตรงนี้
  • 10:00 - 10:12
    มันมีโอกาส 95% ที่ 2.34 จะอยู่ในช่วง 0.96
  • 10:12 - 10:16
    ของค่าเฉลี่ยการกระจายตัวตัวอย่างจริง. ซึ่งเรารู้ว่า
  • 10:16 - 10:18
    มันเหมือนกับค่าเฉลี่ยตัวอย่าง
  • 10:18 - 10:22
    -
  • 10:22 - 10:25
    หรือสามารถเรียงประโยคใหม่ แล้วบอกว่า มันมีโอกาส
  • 10:25 - 10:33
    95% ที่ค่าเฉลี่ย, ค่าเฉลี่ยจริง,
  • 10:33 - 10:40
    ซึ่งก็เหมือนกับค่าเฉลี่ยการกระจายตัวตัวอย่าง, นั้นอยู่
  • 10:40 - 10:45
    ในช่วง 0.96 ของค่าเฉลี่ยตัวอย่าง, นั่นคือ 2.34
  • 10:45 - 10:52
    ที่ขอบล่าง, ถ้าเราไปที่ 2.36 ลบ -- ถ้าคุณไปที่ 2.34
  • 10:52 - 10:56
    ลบ 0.96 -- นั่นคือขอบล่างของช่วง
  • 10:56 - 10:58
    ความมั่นใจ, ได้ 1.38
  • 10:58 - 11:02
    และขอบบนของช่วงความมั่นใจ, 2.34 บวก
  • 11:02 - 11:05
    0.96 เท่ากับ 3.3
  • 11:05 - 11:11
    ดังนั้นช่วงความมั่นใจ 95% ของเรา คือ จาก 1.38 ถึง 3.3
  • 11:11 - 11:11
    -
Title:
Small Sample Size Confidence Intervals
Description:

more » « less
Video Language:
English
Team:
Khan Academy
Duration:
11:11

Thai subtitles

Revisions