สถิติพื้นฐาน: ค่าเฉลี่ย มัธยฐาน ฐานนิยม ต่างกันอย่างไรและใช้เมื่อไร
1. ค่าเฉลี่ย (Mean หรือ Arithmetic Mean)
ค่าเฉลี่ย หรือที่น้องๆ คุ้นเคยกันในชื่อ (อ่านว่า x-bar) นี่แหละครับ คือตัวแทนของข้อมูลที่ได้มาจากการรวมค่าของข้อมูลทุกตัวแล้วหารด้วยจำนวนข้อมูลทั้งหมด เป็นวิธีที่ใช้บ่อยที่สุด เพราะเข้าใจง่ายและคำนวณไม่ยากครับ
สูตรการคำนวณค่าเฉลี่ย:
- คือ ค่าเฉลี่ย
- (อ่านว่า ซิกม่า เอ็กซ์) คือ ผลรวมของข้อมูลทุกตัว
- คือ จำนวนข้อมูลทั้งหมด
ตัวอย่าง: สมมติน้องๆ สอบวิชาคณิตศาสตร์ได้คะแนนดังนี้: 70, 85, 60, 90, 75 คะแนน ค่าเฉลี่ยของคะแนนสอบจะเป็นเท่าไรครับ
วิธีทำ:
รวมคะแนนทั้งหมด
จำนวนข้อมูล
ค่าเฉลี่ย คะแนน
ดังนั้น คะแนนเฉลี่ยสอบคือ 76 คะแนนครับ
เมื่อไรควรใช้ค่าเฉลี่ย:
- เมื่อข้อมูลมีการกระจายตัวแบบสมมาตร (Symmetric Distribution) หรือใกล้เคียงกับการแจกแจงแบบปกติ (Normal Distribution) ครับ
- เมื่อต้องการรวมอิทธิพลของข้อมูลทุกตัวเข้าด้วยกัน
- ในการคำนวณทางสถิติที่ซับซ้อนขึ้น เช่น การทดสอบสมมติฐานต่างๆ ก็มักจะอ้างอิงถึงค่าเฉลี่ยครับ
ข้อควรระวัง: ค่าเฉลี่ยมีจุดอ่อนตรงที่มันอ่อนไหวต่อค่าผิดปกติ (Outliers) หรือค่าที่โดดไปจากข้อมูลส่วนใหญ่มากๆ ครับ เพราะมันเอาข้อมูลทุกตัวมารวมกัน ถ้ามีค่าผิดปกติ ค่าเฉลี่ยก็จะถูกดึงให้เอียงไปทางนั้นทันทีครับ
2. มัธยฐาน (Median)
มัธยฐานคือค่ากลางของข้อมูลที่จัดเรียงลำดับแล้วครับ พูดง่ายๆ คือเป็นค่าที่แบ่งข้อมูลออกเป็นสองส่วนเท่าๆ กัน คือมีข้อมูลที่น้อยกว่าค่านี้อยู่ครึ่งหนึ่ง และมากกว่าค่านี้อยู่ครึ่งหนึ่งครับ
วิธีการหามัธยฐาน:
- จัดเรียงข้อมูล: อันดับแรกเลย น้องๆ ต้องเรียงข้อมูลจากน้อยไปมาก หรือจากมากไปน้อยก่อนเสมอครับ
- หาตำแหน่ง: ตำแหน่งของมัธยฐานจะอยู่ที่ เมื่อ คือจำนวนข้อมูลครับ
- หาค่า:
- ถ้า เป็นเลขคี่: มัธยฐานคือข้อมูลที่ตำแหน่งตรงกลางนั้นเลยครับ
- ถ้า เป็นเลขคู่: มัธยฐานคือค่าเฉลี่ยของข้อมูล 2 ตัวที่อยู่ตรงกลางครับ (ตัวที่ตำแหน่ง และ )
ตัวอย่างที่ 1 (ข้อมูลเป็นเลขคี่): คะแนนสอบชุดเดิม: 70, 85, 60, 90, 75
วิธีทำ:
- เรียงข้อมูล: 60, 70, 75, 85, 90
- หาตำแหน่ง: ตำแหน่งที่ 3 คือ 75
ดังนั้น มัธยฐานคือ 75 คะแนน
ตัวอย่างที่ 2 (ข้อมูลเป็นเลขคู่): มีคะแนนสอบเพิ่มมา 1 ตัวเป็น 65: 70, 85, 60, 90, 75, 65
วิธีทำ:
- เรียงข้อมูล: 60, 65, 70, 75, 85, 90
- หาตำแหน่ง: (อยู่ระหว่างตำแหน่งที่ 3 กับ 4)
- หาค่า: ข้อมูลตัวที่ 3 คือ 70, ข้อมูลตัวที่ 4 คือ 75
มัธยฐานคือ คะแนน
เมื่อไรควรใช้มัธยฐาน:
- เมื่อข้อมูลมีการแจกแจงแบบเบ้ (Skewed Distribution) เช่น ข้อมูลรายได้ของประชากร ที่มักจะมีคนรวยมากๆ ไม่กี่คนดึงค่าเฉลี่ยให้สูงขึ้น มัธยฐานจะเป็นตัวแทนที่ดีกว่าครับ
- เมื่อมีค่าผิดปกติ (Outliers) ในข้อมูล มัธยฐานจะไม่ได้รับผลกระทบจากค่าผิดปกติมากเท่าค่าเฉลี่ย เพราะมันสนใจแค่ตำแหน่งตรงกลาง ไม่ได้นำค่าทั้งหมดมารวมกันครับ
- เมื่อข้อมูลเป็นเชิงอันดับ (Ordinal Data) ที่ไม่สามารถนำมาบวกหรือลบกันได้โดยตรงครับ
3. ฐานนิยม (Mode)
ฐานนิยมคือค่าของข้อมูลที่ปรากฏบ่อยที่สุด หรือมีความถี่สูงสุดในชุดข้อมูลนั้นๆ ครับ เป็นค่าที่บอกว่าข้อมูลส่วนใหญ่มีแนวโน้มไปทางไหน
วิธีการหาฐานนิยม:
นับความถี่ของข้อมูลแต่ละตัว ค่าไหนซ้ำกันมากที่สุด ค่านั้นคือฐานนิยมครับ
ข้อควรรู้เกี่ยวกับฐานนิยม:
- ชุดข้อมูลอาจมีฐานนิยมมากกว่า 1 ค่าก็ได้ (เช่น Bimodal ถ้ามี 2 ค่า, Multimodal ถ้ามีหลายค่า) ครับ
- ชุดข้อมูลอาจจะไม่มีฐานนิยมเลยก็ได้ ถ้าข้อมูลทุกตัวมีความถี่เท่ากันหมดครับ
ตัวอย่างที่ 1 (Unimodal): คะแนนสอบ: 70, 85, 60, 90, 75, 70
วิธีทำ:
จะเห็นว่า 70 ปรากฏ 2 ครั้ง ส่วนค่าอื่นๆ ปรากฏแค่ครั้งเดียว
ดังนั้น ฐานนิยมคือ 70 คะแนน
ตัวอย่างที่ 2 (Bimodal): ผลสำรวจจำนวนพี่น้องของนักเรียน: 1, 2, 0, 1, 3, 2, 4
วิธีทำ:
จะเห็นว่า 1 ปรากฏ 2 ครั้ง และ 2 ก็ปรากฏ 2 ครั้งเช่นกัน ส่วนค่าอื่นปรากฏ 1 ครั้ง
ดังนั้น ฐานนิยมคือ 1 และ 2 ครับ (Bimodal)
ตัวอย่างที่ 3 (No Mode): คะแนนสอบ: 70, 85, 60, 90, 75
วิธีทำ:
ข้อมูลทุกตัวปรากฏเพียงครั้งเดียว
ดังนั้น ชุดข้อมูลนี้ไม่มีฐานนิยมครับ
เมื่อไรควรใช้ฐานนิยม:
- เมื่อต้องการทราบว่าค่าใดเป็นค่าที่นิยมมากที่สุด หรือเป็นค่าที่เกิดขึ้นบ่อยที่สุดครับ
- เมื่อข้อมูลเป็นข้อมูลเชิงคุณภาพ (Qualitative Data) หรือข้อมูลเชิงกลุ่ม (Categorical Data) ที่ไม่สามารถหาค่าเฉลี่ยหรือมัธยฐานได้ เช่น สีที่ชอบมากที่สุด, ยี่ห้อรถยนต์ที่ขายดีที่สุด, สาขาอาชีพที่นักเรียนส่วนใหญ่สนใจครับ
- เมื่อข้อมูลมีการแจกแจงแบบหลายยอด (Multimodal Distribution) เพื่อระบุจุดยอดแต่ละจุด
4. สรุปความแตกต่างและข้อควรพิจารณาในการเลือกใช้
น้องๆ คงเห็นแล้วนะครับว่าทั้งสามค่านี้มีบทบาทและลักษณะเฉพาะที่ต่างกันไป การเลือกใช้ตัวแทนข้อมูลที่เหมาะสมเป็นสิ่งสำคัญมากครับ
- ค่าเฉลี่ย: เหมาะกับข้อมูลเชิงปริมาณที่ไม่มีค่าผิดปกติ และมีการกระจายตัวแบบสมมาตรครับ ให้ข้อมูลที่แม่นยำที่สุดเมื่อเงื่อนไขเหล่านี้เป็นจริง แต่จะถูกบิดเบือนได้ง่ายด้วย Outliers ครับ
- มัธยฐาน: เหมาะกับข้อมูลเชิงปริมาณที่มีค่าผิดปกติ หรือมีการแจกแจงแบบเบ้ครับ ให้ภาพของ “ค่ากลางที่แท้จริง” ได้ดีกว่าเมื่อข้อมูลไม่สมมาตร เพราะไม่ได้รับผลกระทบจากค่าสุดโต่งครับ
- ฐานนิยม: เหมาะกับข้อมูลเชิงคุณภาพ หรือข้อมูลเชิงปริมาณที่ต้องการทราบค่าที่นิยมมากที่สุดครับ เป็นตัวแทนที่เข้าใจง่ายที่สุดสำหรับข้อมูลประเภทกลุ่มครับ
พี่กฤษณ์มีภาพรวมง่ายๆ ให้น้องๆ ลองนึกตามแบบนี้นะครับ
- ถ้าถามว่า “โดยเฉลี่ยแล้วนักเรียนทำข้อสอบได้กี่คะแนน?” เรามักจะใช้ ค่าเฉลี่ย ครับ
- ถ้าถามว่า “ครึ่งหนึ่งของนักเรียนสอบได้คะแนนเท่าไรเป็นอย่างน้อย?” หรือ “คะแนนกลางๆ ของห้องจริงๆ แล้วคือเท่าไร ถ้าไม่นับคนที่ได้สูงโด่งหรือต่ำเตี้ยผิดปกติ?” เราจะใช้ มัธยฐาน ครับ
- ถ้าถามว่า “นักเรียนส่วนใหญ่ได้คะแนนเท่าไร?” หรือ “คะแนนไหนที่มีคนได้เยอะที่สุด?” เราจะใช้ ฐานนิยม ครับ
ความสัมพันธ์กับรูปร่างการแจกแจงข้อมูล (Skewness)
น้องๆ ครับ การทำความเข้าใจว่าชุดข้อมูลมีรูปร่างการแจกแจงแบบไหน เป็นสิ่งสำคัญที่จะช่วยให้น้องๆ เลือกใช้ค่าเฉลี่ย มัธยฐาน และฐานนิยมได้อย่างเหมาะสมที่สุดครับ
- การแจกแจงแบบสมมาตร (Symmetric Distribution): ถ้าข้อมูลมีการแจกแจงแบบสมมาตร (รูประฆังคว่ำ หรือ Normal Distribution) ค่าเฉลี่ย มัธยฐาน และฐานนิยม มักจะมีค่าเท่ากันหรือใกล้เคียงกันมากครับ เช่น ข้อมูลความสูงของผู้ชายในประเทศหนึ่ง
- การแจกแจงแบบเบ้ขวา (Right-Skewed Distribution หรือ Positive Skew): ข้อมูลจะกองอยู่ทางซ้ายและมีหางยาวไปทางขวา ซึ่งมักจะมีค่าผิดปกติที่สูงมากๆ ดึงค่าเฉลี่ยให้สูงกว่ามัธยฐานครับ
- โดยทั่วไป: ฐานนิยม < มัธยฐาน < ค่าเฉลี่ย
- ตัวอย่าง: รายได้ต่อเดือนของคนส่วนใหญ่ในสังคม, ราคาบ้านในพื้นที่ที่บ้านราคาแพงไม่กี่หลัง
- ในกรณีนี้ มัธยฐาน มักจะเป็นตัวแทนที่ดีที่สุดครับ
- การแจกแจงแบบเบ้ซ้าย (Left-Skewed Distribution หรือ Negative Skew): ข้อมูลจะกองอยู่ทางขวาและมีหางยาวไปทางซ้าย ซึ่งมักจะมีค่าผิดปกติที่ต่ำมากๆ ดึงค่าเฉลี่ยให้ต่ำกว่ามัธยฐานครับ
- โดยทั่วไป: ค่าเฉลี่ย < มัธยฐาน < ฐานนิยม
- ตัวอย่าง: คะแนนสอบที่ยากมากๆ จนคนส่วนใหญ่ได้คะแนนสูงๆ แต่มีบางคนได้คะแนนต่ำมากๆ
- ในกรณีนี้ มัธยฐาน ก็ยังคงเป็นตัวเลือกที่ดีครับ
ดังนั้น ก่อนจะตัดสินใจเลือกใช้ น้องๆ ลองพิจารณากราฟการกระจายตัวของข้อมูลดูก่อนนะครับ จะช่วยให้ตัดสินใจได้ดีขึ้นเยอะเลยครับ
5. ข้อผิดพลาดที่พบบ่อยและเทคนิคทำข้อสอบ
จากการสอนมานาน พี่กฤษณ์เจอข้อผิดพลาดที่น้องๆ มักจะทำบ่อยๆ เกี่ยวกับสามค่านี้ครับ
- ลืมเรียงข้อมูลก่อนหามัธยฐาน: นี่คือกับดักคลาสสิกเลยครับ! จำไว้ว่ามัธยฐานต้องเรียงข้อมูลก่อนเสมอครับ ไม่ว่าจะจากน้อยไปมาก หรือมากไปน้อยก็ได้ครับ
- คำนวณมัธยฐานสำหรับข้อมูลคู่ผิด: ถ้าน้องๆ มีข้อมูลเป็นเลขคู่ ต้องหาค่าเฉลี่ยของข้อมูลสองตัวตรงกลางนะครับ ไม่ใช่เอาแค่ตัวใดตัวหนึ่ง
- เข้าใจผิดว่าฐานนิยมมีได้แค่ค่าเดียว: ชุดข้อมูลสามารถมีฐานนิยมได้มากกว่าหนึ่งค่า หรือไม่มีเลยก็ได้ครับ
- เลือกใช้ผิดสถานการณ์: บางทีน้องๆ อาจจะใช้ค่าเฉลี่ยกับข้อมูลที่มี Outlier เยอะๆ ทำให้ได้ข้อสรุปที่ผิดพลาดไปจากความเป็นจริงครับ ลองพิจารณารูปร่างการแจกแจงข้อมูล (Skewness) อย่างที่พี่กฤษณ์บอกไปแล้วนะครับ
เทคนิคทำข้อสอบ:
- อ่านโจทย์ให้ละเอียด: ดูว่าโจทย์ต้องการ “ค่ากลาง” แบบไหน หรือข้อมูลมีลักษณะพิเศษอะไรไหม เช่น มีค่าผิดปกติหรือไม่
- ถ้ามี Outlier ให้ระวังค่าเฉลี่ย: ถ้าโจทย์มีข้อมูลที่ดูโดดๆ ไปจากเพื่อน ให้คิดถึงมัธยฐานไว้ก่อนเลยครับ
- ถ้าเป็นข้อมูลเชิงคุณภาพ (ชื่อ สี ยี่ห้อ): ฐานนิยมคือคำตอบเดียวที่ทำได้ครับ
- ทำซ้ำ: การคำนวณสถิติพื้นฐานพวกนี้ สิ่งที่สำคัญคือความแม่นยำครับ ลองทำซ้ำๆ หลายๆ ข้อ จะช่วยให้คำนวณได้เร็วและถูกต้องมากขึ้นครับ
6. ตัวอย่างโจทย์แบบจัดเต็ม
ลองมาดูตัวอย่างสถานการณ์จริงที่ต้องใช้ทั้งสามค่ากันครับ
โจทย์: บริษัทแห่งหนึ่งสำรวจเงินเดือน (หน่วยเป็นพันบาท) ของพนักงาน 10 คน ดังนี้: 15, 18, 20, 22, 25, 25, 28, 30, 32, 150
จงหาค่าเฉลี่ย มัธยฐาน และฐานนิยมของเงินเดือนพนักงานชุดนี้ และอธิบายว่าค่าใดเหมาะสมที่จะเป็นตัวแทนของข้อมูลนี้มากที่สุดครับ
วิธีทำ:
ก่อนอื่น สังเกตว่ามีค่า 150 ซึ่งเป็นค่าที่โดดมากๆ (Outlier) ครับ
1. หาค่าเฉลี่ย:
ผลรวมเงินเดือน
จำนวนพนักงาน
ค่าเฉลี่ย (พันบาท)
2. หามัธยฐาน:
เรียงข้อมูล: 15, 18, 20, 22, 25, 25, 28, 30, 32, 150
จำนวนข้อมูล (เป็นเลขคู่)
ตำแหน่งมัธยฐาน (อยู่ระหว่างตัวที่ 5 กับตัวที่ 6)
ข้อมูลตัวที่ 5 คือ 25
ข้อมูลตัวที่ 6 คือ 25
มัธยฐาน (พันบาท)
3. หาฐานนิยม:
ข้อมูลที่ปรากฏบ่อยที่สุดคือ 25 (ปรากฏ 2 ครั้ง)
ฐานนิยม คือ 25 (พันบาท)
สรุปและข้อเสนอแนะ:
- ค่าเฉลี่ย: 36.5 พันบาท
- มัธยฐาน: 25 พันบาท
- ฐานนิยม: 25 พันบาท
จะเห็นว่าค่าเฉลี่ย (36.5) สูงกว่ามัธยฐาน (25) และฐานนิยม (25) อย่างชัดเจนเลยครับ นี่เป็นผลมาจากพนักงานคนหนึ่งที่มีเงินเดือนสูงถึง 150,000 บาท ซึ่งเป็นค่าผิดปกติที่ดึงค่าเฉลี่ยให้สูงขึ้นครับ
ในกรณีนี้ มัธยฐานและฐานนิยม จะเป็นตัวแทนของเงินเดือนพนักงาน “ส่วนใหญ่” ได้ดีกว่าค่าเฉลี่ยครับ เพราะเงินเดือน 25,000 บาท แสดงให้เห็นว่าพนักงานส่วนใหญ่มีเงินเดือนอยู่ในระดับนี้ การบอกว่าเงินเดือนเฉลี่ย 36,500 บาท อาจทำให้เข้าใจผิดว่าพนักงานส่วนใหญ่ได้เงินเดือนเยอะกว่าความเป็นจริงครับ
นี่แหละครับ คือเหตุผลว่าทำไมเราถึงต้องเรียนรู้ความแตกต่างและเลือกใช้ค่ากลางที่เหมาะสมกับข้อมูลของเราครับ
สรุปแนวคิดสำคัญ
น้องๆ ครับ การทำความเข้าใจค่าเฉลี่ย มัธยฐาน และฐานนิยม เป็นพื้นฐานสำคัญในการวิเคราะห์ข้อมูลเลยนะครับ แต่ละค่ามีจุดแข็งจุดอ่อนและบริบทการใช้งานที่แตกต่างกันไป
- ค่าเฉลี่ย (Mean): รวมข้อมูลทุกตัว เหมาะกับข้อมูลที่ไม่มีค่าผิดปกติ และมีการกระจายตัวแบบสมมาตร
- มัธยฐาน (Median): ค่ากลางที่แบ่งข้อมูลออกเป็นครึ่งๆ เหมาะกับข้อมูลที่มีค่าผิดปกติ หรือมีการกระจายตัวแบบเบ้
- ฐานนิยม (Mode): ค่าที่ปรากฏบ่อยที่สุด เหมาะกับข้อมูลเชิงคุณภาพ หรือเมื่อต้องการทราบความนิยมสูงสุด
พี่กฤษณ์หวังว่าบทความนี้จะช่วยให้น้องๆ เข้าใจความแตกต่างของค่าสถิติพื้นฐานทั้งสามนี้ได้ชัดเจนมากขึ้น และรู้ว่าเมื่อไรควรเลือกใช้ตัวไหนให้เหมาะสมกับข้อมูลแต่ละชุดนะครับ สถิติไม่ได้ยากอย่างที่คิดครับ ถ้าเราเข้าใจหลักการและนำไปประยุกต์ใช้เป็น
ถ้าหากน้องๆ คนไหนสนใจอยากเจาะลึกเนื้อหาสถิติ หรือหัวข้อคณิตศาสตร์อื่นๆ เพิ่มเติม ไม่ว่าจะเป็นเรื่องความน่าจะเป็น การวิเคราะห์ข้อมูลขั้นสูง หรือเตรียมสอบเข้ามหาวิทยาลัย พี่กฤษณ์ก็มีคอร์สดีๆ มาให้เลือกมากมายเลยนะครับ มีทั้งคอร์สสด คอร์สออนไลน์ และคอร์สตัวต่อตัว ที่จะช่วยให้น้องๆ เข้าใจคณิตศาสตร์ได้สนุกและเก่งขึ้นแน่นอนครับ สามารถดูรายละเอียดและสมัครเรียนได้ในเว็บไซต์นี้เลยนะครับ พี่กฤษณ์รอเจอน้องๆ ทุกคนนะครับ!