0:00:00.000,0:00:00.000 เราจะเริ่มเดินทางเข้าสู่โลกของสถิติ, ซึ่งก็คือวิธี 0:00:00.000,0:00:00.000 เข้าใจ, หรือรู้เรื่อง, ของข้อมูล 0:00:00.000,0:00:00.000 สถิติคือเรื่องของข้อมูล 0:00:00.000,0:00:00.000 และเมื่อเราเดินทางเข้าสู่โลกของสถิติ 0:00:00.000,0:00:00.000 เรากำลังทำสิ่งที่เราเรียกว่า "สถิติเชิงพรรรณนา (descriptive statistics" เป็นส่วนใหญ่ 0:00:00.000,0:00:00.000 ถ้าเรามีข้อมูล แล้วเราอยาบอกคุณมีอะไรเกี่ยวกับข้อมูลบ้าง, โดยไม่ต้องแสดงข้อมูลทั้งหมด -- 0:00:00.000,0:00:00.000 เราจะบรรยายมันอย่างไรโดยใช้ตัวเลขแค่ไม่กี่ตัว? 0:00:00.000,0:00:00.000 นั่นคือสิ่งที่เราสนใจ 0:00:00.000,0:00:00.000 แล้วเมื่อเราสร้างเครื่องมือในวิชาสถิติแบบพรรณนาแล้ว, 0:00:00.000,0:00:00.000 เราก็เริ่มทำการตีความข้อมูล, เริ่มทำการสรุป หรือตัดสินใจ และเราจะเริ่มทำ "สถิติแบบอนุมาน (inferential statistics)" มากขึ้น -- คือการอนุมานนั่นเอง 0:00:00.000,0:00:00.000 เมื่อรู้แล้ว, ลองคิดถึงวิธีบรรยายข้อมูลกัน 0:00:00.000,0:00:00.000 สมมุติว่าเรามีชุดตัวเลข, และเราพิจารณามันเป็น "ข้อมูล" 0:00:00.000,0:00:00.000 บางทีเราอาจวัดความสูงของพืชในสวนเรา 0:00:00.000,0:00:00.000 สมมุติเรามีต้นไม้ 6 ต้น และความสูงเป็น 0:00:00.000,0:00:00.000 4 นิ้ว, 3 นิ้ว, 1 นิ้ว, 6 นิ้ว, แล้วก็ 1 นิ้ว อีกต้นสูง 7นิ้ว 0:00:00.000,0:00:00.000 สมมุติว่ามีคนอยู่ในอีกห้องหนึ่ง, ไม่ได้ดูต้นไม้คุณ แล้วถามว่า 0:00:00.000,0:00:00.000 "ต้นไม้คุณสูงเท่าไหร่" แล้วเขาอยากได้ให้ตัวเลขแค่ตัวเดียวที่แทนความสูงต่างๆ ทั้งหมดของต้นไม้ 0:00:00.000,0:00:00.000 คุณจะทำอย่างไร? 0:00:00.000,0:00:00.000 ทีนี้, คุณบอกว่า ฉันจะหาได้อย่างไร? บางทีเลือกเลขที่พบบ่อยที่สุด? บางทีฉันอยากใช้เลขที่แทนตรงกลาง? 0:00:00.000,0:00:00.000 บางทีฉันอยากได้เลขที่พบบ่อยที่สุด? บางทีฉันอยากได้เลขที่เป็นตรงกลางของเลขทุกตัว? 0:00:00.000,0:00:00.000 ถ้าคุณพูดอะไรพวกนี้, คุณก็เริ่มทำเหมือนกับ 0:00:00.000,0:00:00.000 สิ่งที่คนสร้างสถิติเชิงพรรณนาขึ้นมาแล้ว 0:00:00.000,0:00:00.000 เขาบอกว่า "โอ้... เราจะหามันได้อย่างไร?" 0:00:00.000,0:00:00.000 เราจะเริ่มต้นด้วยแนวคิดเรื่อง ค่าเฉลี่ย. ในชีวิตประจำวัน "ค่าเฉลี่ย" มีความหมายหลายอย่าง อย่างที่เราเห็น. เวลาหลายคนพูดว่า โดยเฉลี่ย เขามักหมายถึง "ค่าเฉลี่ยเลขคณิต" อย่างที่เราเห็นในไม่ช้า 0:00:00.000,0:00:00.000 แต่ในสถิติ, ค่าเฉลี่ยนหมายถึงอบางอื่นที่ทั่วไปกว่า 0:00:00.000,0:00:00.000 มันหมายความว่า "ให้ค่าทั่วไป" หรือจำนวน "ตรงกลาง" หรือ... พวกนี้คือ "หรือ". มันคือความพยายามวัด "แนวโน้มเข้าสู่ศูนย์กลาง" 0:00:00.000,0:00:00.000 บางครั้ง, คุณมีตัวเลขหลายตัว, คุณพยายามแสดงตัวเลข (ค่าเฉลี่ย) ที่อยู่ตรงกลาง หรือเป็นศูนย์กลางของค่าเหล่านี้ 0:00:00.000,0:00:00.000 แล้วอย่างที่เราเห็น, มันมีค่าเฉลี่ยหลายแบบ 0:00:00.000,0:00:00.000 อย่างแรกคืออันนี้, คุณอาจคุ้นคยมันมากที่สุด, มันคืออันที่คนพูดถึงในข้อสอบ หรือความสูงเฉลี่ย มันคือค่าเฉลี่ยเลขคณิต 0:00:00.000,0:00:00.000 ผมจะเขียนมันด้วยสีเหลืองนะ "ค่าเฉลี่ยเลขคณิต" 0:00:00.000,0:00:00.000 เมื่อ Arithmetic เป้นคำนาม เราเรียก (อ่าน) มันว่า อู-ริด-เม-ทิก. เวลาเป็นคุณศัพท์อย่างนี้ เราเรียก (อ่าน) มันว่า เอ-ริด-เม-ทิก 0:00:00.000,0:00:00.000 นี่ก็แค่ผลบวกของจำนวนทั้งหมดหารด้วย... 0:00:00.000,0:00:00.000 นี่คือนิยามที่มนุษย์สร้างขึ้น, ซึ่งเราพบว่ามีประโยชน์ -- 0:00:00.000,0:00:00.000 ผลบวกของจำนวนทั้งหมดหารด้วยจำนวนของตัวเลขที่เรามี 0:00:00.000,0:00:00.000 แล้วค่าเฉลี่ยเลขคณิตของข้อมูลชุดนี้เป็นเท่าไหร่? 0:00:00.000,0:00:00.000 ทีนี้, ลองคำนวณดู. มันจะเป็น 4+3+1+6+1+7 ส่วนจำนวนข้อมูลที่เรามี. เรามีข้อมูล 6 จุด, เราจึงหารด้วย 4 0:00:00.000,0:00:00.000 และเราได้ 4+3 =7 + 1 =8 +6 = 14 + 1 = 15 + 7 =22. ขอผมทำอีกทีนะ.. เรามี 7, 8, 14, 15, 22. ทั้งหมดหารด้วย 6 0:00:00.000,0:00:00.000 แล้วเราก็เขียนมันเป็นเศษส่วนคละ. 6 หาร 22 ได้ 3 เหลือเศษ 4. มันจึงเป็น 3 เศษ 4 ส่ว 6 ซึ่งเท่ากับ 3 กับ 2 ส่วน 3. เราเขียนมันเป็นทศนิยามได้: 3.6 ซ้ำ 0:00:00.000,0:00:00.000 เราสามารถเขียนมันแบบไหนก็ได้ แต่่นี่คือเลขตัวแทน, นี่คือการพยายามหา "แนวโน้มสู่ศูนย์กลาง" 0:00:00.000,0:00:00.000 เหมือนเดิม, นี่คือสิ่งที่มนุษย์สร้างขึ้น มันไม่ใช่ว่ามีคนพบใน 0:00:00.000,0:00:00.000 ตำราศาสนาบอกว่า "นี่คือวิธีที่ค่าเฉลี่ยเลขคณิตต้องนิยาม" 0:00:00.000,0:00:00.000 มันไม่ได้บริสุทธิ์เหมือนการคำนวณ, อย่างเช่นการค้นพบวงกลมเนื่องจากการสังเกตจักรวลา 0:00:00.000,0:00:00.000 มันคือสิ่งที่มนุษย์สร้างขึ้น โดยเราเห็นว่ามันมีประโยชน์ 0:00:00.000,0:00:00.000 ทีนี้, มันมีวิธีวัดค่าเฉลี่ย หรือค่า "ทั่วไป" หรือค่ากลางอื่นๆ อีก 0:00:00.000,0:00:00.000 วิธีอย่างอื่น ที่ทั่วไปคือ ค่ามัธยฐาน (median value) ผมจะเขียนมัธยฐานด้วยสีชมพูนะ 0:00:00.000,0:00:00.000 มัธยฐานหมายถึงค่ากลาง 0:00:00.000,0:00:00.000 ถ้าคุณเรียงจำนวนทั้งหมดแล้วหาค่าตรงกลาง, มันก็คือมัธยฐาน 0:00:00.000,0:00:00.000 แล้วค่ามัธยฐานของข้อมูลชัดนี้คืออะไร? 0:00:00.000,0:00:00.000 มัธยฐานของข้อมูลชุดนี้คืออะไร? 0:00:00.000,0:00:00.000 เรามี 1, 1, 3, 4, 6, 7 ค่ากลางคืออะไร? 0:00:00.000,0:00:00.000 เราเห็นว่าเรามีจำนวนเป็นเลขคู่, เนื่องจากไม่มีตรงกลาง, เราจึงมีเลขกลางสองตัว 0:00:00.000,0:00:00.000 3 กับ 4 0:00:00.000,0:00:00.000 และในกรณีที่คุณมีเลขกลางสองตัว, คุณก็หาค่ากลางระหว่างสองตัวนั้น 0:00:00.000,0:00:00.000 นั่นคือค่าเฉลี่ยเลขคณิตสองตัวระหว่างจำนวนทั้งสอง, เพื่อหาค่ามัธยฐาน 0:00:00.000,0:00:00.000 มัธยฐาน ที่ค่ากลางระหว่าง 3 กับ 4, นั่นคือ 3.5. ในกรณีมัธยฐานจึงเป็น 3.5 0:00:00.000,0:00:00.000 แล้วถ้าคุณมีจำนวนข้อมูลเป็นจำนวนคู่, ค่ามัธยฐานคือ ค่าเฉลี่ยเลขคณิตระหว่างจำนวนกลาง 2 ตัว 0:00:00.000,0:00:00.000 ถ้าคุณมีจำนวนข้อมูลเป็นจำนวนคี่, มันก็หาได้ง่ายกว่า 0:00:00.000,0:00:00.000 อันนี้ผมให้ข้อมูลคุณที่มีปริมาณต่างกัน 0:00:00.000,0:00:00.000 นี่คือปริมาณข้อมูลที่ผมได้เรียงไว้แล้ว 0:00:00.000,0:00:00.000 ข้อมูลตรงนี้คือ 0, 0, 7 , 50, 10,000 และ 1,000,000 0:00:00.000,0:00:00.000 ข้อมูลที่บ้ามาก, ในกรณีนี้, ค่ามัธยฐานคืออะไร? 0:00:00.000,0:00:00.000 เรามีเลข 5 ตัว, เป็นจำนวนคี่, วิธีหาง่ายๆ คือ เรามีเลข 5 ตัว, จำนวนคี่. เราหาเลขกลางได้ง่ายๆ 0:00:00.000,0:00:00.000 ค่ากลางคือจำนวนที่มากกว่าเลขอื่น 2 ตัว และน้อยกว่าเลขอื่น 2 ตัว 0:00:00.000,0:00:00.000 นี่ก็คือค่ากลางพอดี. ในกรณีนี้มัธยฐานเราคือ 50 0:00:00.000,0:00:00.000 ทีนี้, การวัดค่ากลางอันที่สาม คืออันที่ใช้น้อยที่สุด: ฐานนิยม (mode) 0:00:00.000,0:00:00.000 มันฟังดูซับซ้อน. แต่ปรากฏว่ามันคือแนวคิดที่พื้นฐานที่สุด: ฐานนิยมที่เลขที่ปรากฎบ่อยที่สุดในชุดข้อมูล 0:00:00.000,0:00:00.000 แล้วฐานนิยมคืออะไร? ถ้าค่าทั้งหมดปรากฏเพียงครั้งเดียว, มันก็ไม่มีฐานนิยม 0:00:00.000,0:00:00.000 แต่ฐานนิยมในข้อมูลเราคืออะไร? เรามี 4, 3 แค่ตัวเดียว, แต่เรามี 2 สองตัว, เรามี 6 กับ 7 อย่างละตัว 0:00:00.000,0:00:00.000 เลขที่ปรากฏบ่อยที่สุดคือ อันแรก ดังนั้นฐานนิยมคืออันแรก 0:00:00.000,0:00:00.000 เราเห็นวิธีการหาค่ากลางแบบต่างๆ แล้ว และเราจะเรียนในวิชาสถิติ 0:00:00.000,0:00:00.000 ว่าแต่ละอย่างดีต่างกันไป 0:00:00.000,0:00:00.000 นี่คืออันที่ใช้มากที่สุดในหลายๆ อย่าง 0:00:00.000,0:00:00.000 มัธยฐานสำคัญเวลาคุณมีเลขเพี้ยนๆ มากมายที่กวนค่าเฉลี่ยเลขคณิต 0:00:00.000,0:00:00.000 ฐานนนิยมมีประโยชน์ในกรณีที่มีค่าปรากฏมากกว่า 1 ครั้ง 0:00:00.000,0:00:00.000 โอเค, เวลาหมดแล้ว. ในวิดีโอนห้า เราจะสำรวจสถิติให้ลึกกว่านี้กัน