Skip to content
Home » บทความ » สถิติพื้นฐาน ค่าเฉลี่ย มัธยฐาน ฐานนิยม ต่างกันอย่างไรและใช้เมื่อไร

สถิติพื้นฐาน ค่าเฉลี่ย มัธยฐาน ฐานนิยม ต่างกันอย่างไรและใช้เมื่อไร

สถิติพื้นฐาน: ค่าเฉลี่ย มัธยฐาน ฐานนิยม ต่างกันอย่างไรและใช้เมื่อไร

1. ค่าเฉลี่ย (Mean หรือ Arithmetic Mean)

ค่าเฉลี่ย หรือที่น้องๆ คุ้นเคยกันในชื่อ x ¯ bar{x} (อ่านว่า x-bar) นี่แหละครับ คือตัวแทนของข้อมูลที่ได้มาจากการรวมค่าของข้อมูลทุกตัวแล้วหารด้วยจำนวนข้อมูลทั้งหมด เป็นวิธีที่ใช้บ่อยที่สุด เพราะเข้าใจง่ายและคำนวณไม่ยากครับ

สูตรการคำนวณค่าเฉลี่ย:

x ¯ = x n bar{x} = frac{sum x}{n}

  • x ¯ bar{x} คือ ค่าเฉลี่ย
  • x sum x (อ่านว่า ซิกม่า เอ็กซ์) คือ ผลรวมของข้อมูลทุกตัว
  • n n คือ จำนวนข้อมูลทั้งหมด

ตัวอย่าง: สมมติน้องๆ สอบวิชาคณิตศาสตร์ได้คะแนนดังนี้: 70, 85, 60, 90, 75 คะแนน ค่าเฉลี่ยของคะแนนสอบจะเป็นเท่าไรครับ

วิธีทำ:

รวมคะแนนทั้งหมด x = 70 + 85 + 60 + 90 + 75 = 380 sum x = 70 + 85 + 60 + 90 + 75 = 380

จำนวนข้อมูล n = 5 n = 5

ค่าเฉลี่ย x ¯ = 380 5 = 76 bar{x} = frac{380}{5} = 76 คะแนน

ดังนั้น คะแนนเฉลี่ยสอบคือ 76 คะแนนครับ

เมื่อไรควรใช้ค่าเฉลี่ย:

  • เมื่อข้อมูลมีการกระจายตัวแบบสมมาตร (Symmetric Distribution) หรือใกล้เคียงกับการแจกแจงแบบปกติ (Normal Distribution) ครับ
  • เมื่อต้องการรวมอิทธิพลของข้อมูลทุกตัวเข้าด้วยกัน
  • ในการคำนวณทางสถิติที่ซับซ้อนขึ้น เช่น การทดสอบสมมติฐานต่างๆ ก็มักจะอ้างอิงถึงค่าเฉลี่ยครับ

ข้อควรระวัง: ค่าเฉลี่ยมีจุดอ่อนตรงที่มันอ่อนไหวต่อค่าผิดปกติ (Outliers) หรือค่าที่โดดไปจากข้อมูลส่วนใหญ่มากๆ ครับ เพราะมันเอาข้อมูลทุกตัวมารวมกัน ถ้ามีค่าผิดปกติ ค่าเฉลี่ยก็จะถูกดึงให้เอียงไปทางนั้นทันทีครับ

2. มัธยฐาน (Median)

มัธยฐานคือค่ากลางของข้อมูลที่จัดเรียงลำดับแล้วครับ พูดง่ายๆ คือเป็นค่าที่แบ่งข้อมูลออกเป็นสองส่วนเท่าๆ กัน คือมีข้อมูลที่น้อยกว่าค่านี้อยู่ครึ่งหนึ่ง และมากกว่าค่านี้อยู่ครึ่งหนึ่งครับ

วิธีการหามัธยฐาน:

  1. จัดเรียงข้อมูล: อันดับแรกเลย น้องๆ ต้องเรียงข้อมูลจากน้อยไปมาก หรือจากมากไปน้อยก่อนเสมอครับ
  2. หาตำแหน่ง: ตำแหน่งของมัธยฐานจะอยู่ที่ n + 1 2 frac{n+1}{2} เมื่อ n n คือจำนวนข้อมูลครับ
  3. หาค่า:
    • ถ้า n n เป็นเลขคี่: มัธยฐานคือข้อมูลที่ตำแหน่งตรงกลางนั้นเลยครับ
    • ถ้า n n เป็นเลขคู่: มัธยฐานคือค่าเฉลี่ยของข้อมูล 2 ตัวที่อยู่ตรงกลางครับ (ตัวที่ตำแหน่ง n 2 frac{n}{2} และ n 2 + 1 frac{n}{2}+1 )

ตัวอย่างที่ 1 (ข้อมูลเป็นเลขคี่): คะแนนสอบชุดเดิม: 70, 85, 60, 90, 75

วิธีทำ:

  1. เรียงข้อมูล: 60, 70, 75, 85, 90
  2. หาตำแหน่ง: 5 + 1 2 = 3 frac{5+1}{2} = 3 ตำแหน่งที่ 3 คือ 75

ดังนั้น มัธยฐานคือ 75 คะแนน

ตัวอย่างที่ 2 (ข้อมูลเป็นเลขคู่): มีคะแนนสอบเพิ่มมา 1 ตัวเป็น 65: 70, 85, 60, 90, 75, 65

วิธีทำ:

  1. เรียงข้อมูล: 60, 65, 70, 75, 85, 90
  2. หาตำแหน่ง: 6 + 1 2 = 3.5 frac{6+1}{2} = 3.5 (อยู่ระหว่างตำแหน่งที่ 3 กับ 4)
  3. หาค่า: ข้อมูลตัวที่ 3 คือ 70, ข้อมูลตัวที่ 4 คือ 75

มัธยฐานคือ 70 + 75 2 = 145 2 = 72.5 frac{70+75}{2} = frac{145}{2} = 72.5 คะแนน

เมื่อไรควรใช้มัธยฐาน:

  • เมื่อข้อมูลมีการแจกแจงแบบเบ้ (Skewed Distribution) เช่น ข้อมูลรายได้ของประชากร ที่มักจะมีคนรวยมากๆ ไม่กี่คนดึงค่าเฉลี่ยให้สูงขึ้น มัธยฐานจะเป็นตัวแทนที่ดีกว่าครับ
  • เมื่อมีค่าผิดปกติ (Outliers) ในข้อมูล มัธยฐานจะไม่ได้รับผลกระทบจากค่าผิดปกติมากเท่าค่าเฉลี่ย เพราะมันสนใจแค่ตำแหน่งตรงกลาง ไม่ได้นำค่าทั้งหมดมารวมกันครับ
  • เมื่อข้อมูลเป็นเชิงอันดับ (Ordinal Data) ที่ไม่สามารถนำมาบวกหรือลบกันได้โดยตรงครับ

3. ฐานนิยม (Mode)

ฐานนิยมคือค่าของข้อมูลที่ปรากฏบ่อยที่สุด หรือมีความถี่สูงสุดในชุดข้อมูลนั้นๆ ครับ เป็นค่าที่บอกว่าข้อมูลส่วนใหญ่มีแนวโน้มไปทางไหน

วิธีการหาฐานนิยม:

นับความถี่ของข้อมูลแต่ละตัว ค่าไหนซ้ำกันมากที่สุด ค่านั้นคือฐานนิยมครับ

ข้อควรรู้เกี่ยวกับฐานนิยม:

  • ชุดข้อมูลอาจมีฐานนิยมมากกว่า 1 ค่าก็ได้ (เช่น Bimodal ถ้ามี 2 ค่า, Multimodal ถ้ามีหลายค่า) ครับ
  • ชุดข้อมูลอาจจะไม่มีฐานนิยมเลยก็ได้ ถ้าข้อมูลทุกตัวมีความถี่เท่ากันหมดครับ

ตัวอย่างที่ 1 (Unimodal): คะแนนสอบ: 70, 85, 60, 90, 75, 70

วิธีทำ:

จะเห็นว่า 70 ปรากฏ 2 ครั้ง ส่วนค่าอื่นๆ ปรากฏแค่ครั้งเดียว

ดังนั้น ฐานนิยมคือ 70 คะแนน

ตัวอย่างที่ 2 (Bimodal): ผลสำรวจจำนวนพี่น้องของนักเรียน: 1, 2, 0, 1, 3, 2, 4

วิธีทำ:

จะเห็นว่า 1 ปรากฏ 2 ครั้ง และ 2 ก็ปรากฏ 2 ครั้งเช่นกัน ส่วนค่าอื่นปรากฏ 1 ครั้ง

ดังนั้น ฐานนิยมคือ 1 และ 2 ครับ (Bimodal)

ตัวอย่างที่ 3 (No Mode): คะแนนสอบ: 70, 85, 60, 90, 75

วิธีทำ:

ข้อมูลทุกตัวปรากฏเพียงครั้งเดียว

ดังนั้น ชุดข้อมูลนี้ไม่มีฐานนิยมครับ

เมื่อไรควรใช้ฐานนิยม:

  • เมื่อต้องการทราบว่าค่าใดเป็นค่าที่นิยมมากที่สุด หรือเป็นค่าที่เกิดขึ้นบ่อยที่สุดครับ
  • เมื่อข้อมูลเป็นข้อมูลเชิงคุณภาพ (Qualitative Data) หรือข้อมูลเชิงกลุ่ม (Categorical Data) ที่ไม่สามารถหาค่าเฉลี่ยหรือมัธยฐานได้ เช่น สีที่ชอบมากที่สุด, ยี่ห้อรถยนต์ที่ขายดีที่สุด, สาขาอาชีพที่นักเรียนส่วนใหญ่สนใจครับ
  • เมื่อข้อมูลมีการแจกแจงแบบหลายยอด (Multimodal Distribution) เพื่อระบุจุดยอดแต่ละจุด

4. สรุปความแตกต่างและข้อควรพิจารณาในการเลือกใช้

น้องๆ คงเห็นแล้วนะครับว่าทั้งสามค่านี้มีบทบาทและลักษณะเฉพาะที่ต่างกันไป การเลือกใช้ตัวแทนข้อมูลที่เหมาะสมเป็นสิ่งสำคัญมากครับ

  • ค่าเฉลี่ย: เหมาะกับข้อมูลเชิงปริมาณที่ไม่มีค่าผิดปกติ และมีการกระจายตัวแบบสมมาตรครับ ให้ข้อมูลที่แม่นยำที่สุดเมื่อเงื่อนไขเหล่านี้เป็นจริง แต่จะถูกบิดเบือนได้ง่ายด้วย Outliers ครับ
  • มัธยฐาน: เหมาะกับข้อมูลเชิงปริมาณที่มีค่าผิดปกติ หรือมีการแจกแจงแบบเบ้ครับ ให้ภาพของ “ค่ากลางที่แท้จริง” ได้ดีกว่าเมื่อข้อมูลไม่สมมาตร เพราะไม่ได้รับผลกระทบจากค่าสุดโต่งครับ
  • ฐานนิยม: เหมาะกับข้อมูลเชิงคุณภาพ หรือข้อมูลเชิงปริมาณที่ต้องการทราบค่าที่นิยมมากที่สุดครับ เป็นตัวแทนที่เข้าใจง่ายที่สุดสำหรับข้อมูลประเภทกลุ่มครับ

พี่กฤษณ์มีภาพรวมง่ายๆ ให้น้องๆ ลองนึกตามแบบนี้นะครับ

  • ถ้าถามว่า “โดยเฉลี่ยแล้วนักเรียนทำข้อสอบได้กี่คะแนน?” เรามักจะใช้ ค่าเฉลี่ย ครับ
  • ถ้าถามว่า “ครึ่งหนึ่งของนักเรียนสอบได้คะแนนเท่าไรเป็นอย่างน้อย?” หรือ “คะแนนกลางๆ ของห้องจริงๆ แล้วคือเท่าไร ถ้าไม่นับคนที่ได้สูงโด่งหรือต่ำเตี้ยผิดปกติ?” เราจะใช้ มัธยฐาน ครับ
  • ถ้าถามว่า “นักเรียนส่วนใหญ่ได้คะแนนเท่าไร?” หรือ “คะแนนไหนที่มีคนได้เยอะที่สุด?” เราจะใช้ ฐานนิยม ครับ

ความสัมพันธ์กับรูปร่างการแจกแจงข้อมูล (Skewness)

น้องๆ ครับ การทำความเข้าใจว่าชุดข้อมูลมีรูปร่างการแจกแจงแบบไหน เป็นสิ่งสำคัญที่จะช่วยให้น้องๆ เลือกใช้ค่าเฉลี่ย มัธยฐาน และฐานนิยมได้อย่างเหมาะสมที่สุดครับ

  • การแจกแจงแบบสมมาตร (Symmetric Distribution): ถ้าข้อมูลมีการแจกแจงแบบสมมาตร (รูประฆังคว่ำ หรือ Normal Distribution) ค่าเฉลี่ย มัธยฐาน และฐานนิยม มักจะมีค่าเท่ากันหรือใกล้เคียงกันมากครับ เช่น ข้อมูลความสูงของผู้ชายในประเทศหนึ่ง
  • การแจกแจงแบบเบ้ขวา (Right-Skewed Distribution หรือ Positive Skew): ข้อมูลจะกองอยู่ทางซ้ายและมีหางยาวไปทางขวา ซึ่งมักจะมีค่าผิดปกติที่สูงมากๆ ดึงค่าเฉลี่ยให้สูงกว่ามัธยฐานครับ
    • โดยทั่วไป: ฐานนิยม < มัธยฐาน < ค่าเฉลี่ย
    • ตัวอย่าง: รายได้ต่อเดือนของคนส่วนใหญ่ในสังคม, ราคาบ้านในพื้นที่ที่บ้านราคาแพงไม่กี่หลัง
    • ในกรณีนี้ มัธยฐาน มักจะเป็นตัวแทนที่ดีที่สุดครับ
  • การแจกแจงแบบเบ้ซ้าย (Left-Skewed Distribution หรือ Negative Skew): ข้อมูลจะกองอยู่ทางขวาและมีหางยาวไปทางซ้าย ซึ่งมักจะมีค่าผิดปกติที่ต่ำมากๆ ดึงค่าเฉลี่ยให้ต่ำกว่ามัธยฐานครับ
    • โดยทั่วไป: ค่าเฉลี่ย < มัธยฐาน < ฐานนิยม
    • ตัวอย่าง: คะแนนสอบที่ยากมากๆ จนคนส่วนใหญ่ได้คะแนนสูงๆ แต่มีบางคนได้คะแนนต่ำมากๆ
    • ในกรณีนี้ มัธยฐาน ก็ยังคงเป็นตัวเลือกที่ดีครับ

ดังนั้น ก่อนจะตัดสินใจเลือกใช้ น้องๆ ลองพิจารณากราฟการกระจายตัวของข้อมูลดูก่อนนะครับ จะช่วยให้ตัดสินใจได้ดีขึ้นเยอะเลยครับ

5. ข้อผิดพลาดที่พบบ่อยและเทคนิคทำข้อสอบ

จากการสอนมานาน พี่กฤษณ์เจอข้อผิดพลาดที่น้องๆ มักจะทำบ่อยๆ เกี่ยวกับสามค่านี้ครับ

  • ลืมเรียงข้อมูลก่อนหามัธยฐาน: นี่คือกับดักคลาสสิกเลยครับ! จำไว้ว่ามัธยฐานต้องเรียงข้อมูลก่อนเสมอครับ ไม่ว่าจะจากน้อยไปมาก หรือมากไปน้อยก็ได้ครับ
  • คำนวณมัธยฐานสำหรับข้อมูลคู่ผิด: ถ้าน้องๆ มีข้อมูลเป็นเลขคู่ ต้องหาค่าเฉลี่ยของข้อมูลสองตัวตรงกลางนะครับ ไม่ใช่เอาแค่ตัวใดตัวหนึ่ง
  • เข้าใจผิดว่าฐานนิยมมีได้แค่ค่าเดียว: ชุดข้อมูลสามารถมีฐานนิยมได้มากกว่าหนึ่งค่า หรือไม่มีเลยก็ได้ครับ
  • เลือกใช้ผิดสถานการณ์: บางทีน้องๆ อาจจะใช้ค่าเฉลี่ยกับข้อมูลที่มี Outlier เยอะๆ ทำให้ได้ข้อสรุปที่ผิดพลาดไปจากความเป็นจริงครับ ลองพิจารณารูปร่างการแจกแจงข้อมูล (Skewness) อย่างที่พี่กฤษณ์บอกไปแล้วนะครับ

เทคนิคทำข้อสอบ:

  • อ่านโจทย์ให้ละเอียด: ดูว่าโจทย์ต้องการ “ค่ากลาง” แบบไหน หรือข้อมูลมีลักษณะพิเศษอะไรไหม เช่น มีค่าผิดปกติหรือไม่
  • ถ้ามี Outlier ให้ระวังค่าเฉลี่ย: ถ้าโจทย์มีข้อมูลที่ดูโดดๆ ไปจากเพื่อน ให้คิดถึงมัธยฐานไว้ก่อนเลยครับ
  • ถ้าเป็นข้อมูลเชิงคุณภาพ (ชื่อ สี ยี่ห้อ): ฐานนิยมคือคำตอบเดียวที่ทำได้ครับ
  • ทำซ้ำ: การคำนวณสถิติพื้นฐานพวกนี้ สิ่งที่สำคัญคือความแม่นยำครับ ลองทำซ้ำๆ หลายๆ ข้อ จะช่วยให้คำนวณได้เร็วและถูกต้องมากขึ้นครับ

6. ตัวอย่างโจทย์แบบจัดเต็ม

ลองมาดูตัวอย่างสถานการณ์จริงที่ต้องใช้ทั้งสามค่ากันครับ

โจทย์: บริษัทแห่งหนึ่งสำรวจเงินเดือน (หน่วยเป็นพันบาท) ของพนักงาน 10 คน ดังนี้: 15, 18, 20, 22, 25, 25, 28, 30, 32, 150

จงหาค่าเฉลี่ย มัธยฐาน และฐานนิยมของเงินเดือนพนักงานชุดนี้ และอธิบายว่าค่าใดเหมาะสมที่จะเป็นตัวแทนของข้อมูลนี้มากที่สุดครับ

วิธีทำ:

ก่อนอื่น สังเกตว่ามีค่า 150 ซึ่งเป็นค่าที่โดดมากๆ (Outlier) ครับ

1. หาค่าเฉลี่ย:

ผลรวมเงินเดือน x = 15 + 18 + 20 + 22 + 25 + 25 + 28 + 30 + 32 + 150 = 365 sum x = 15+18+20+22+25+25+28+30+32+150 = 365

จำนวนพนักงาน n = 10 n = 10

ค่าเฉลี่ย x ¯ = 365 10 = 36.5 bar{x} = frac{365}{10} = 36.5 (พันบาท)

2. หามัธยฐาน:

เรียงข้อมูล: 15, 18, 20, 22, 25, 25, 28, 30, 32, 150

จำนวนข้อมูล n = 10 n = 10 (เป็นเลขคู่)

ตำแหน่งมัธยฐาน 10 + 1 2 = 5.5 frac{10+1}{2} = 5.5 (อยู่ระหว่างตัวที่ 5 กับตัวที่ 6)

ข้อมูลตัวที่ 5 คือ 25

ข้อมูลตัวที่ 6 คือ 25

มัธยฐาน = 25 + 25 2 = 25 = frac{25+25}{2} = 25 (พันบาท)

3. หาฐานนิยม:

ข้อมูลที่ปรากฏบ่อยที่สุดคือ 25 (ปรากฏ 2 ครั้ง)

ฐานนิยม คือ 25 (พันบาท)

สรุปและข้อเสนอแนะ:

  • ค่าเฉลี่ย: 36.5 พันบาท
  • มัธยฐาน: 25 พันบาท
  • ฐานนิยม: 25 พันบาท

จะเห็นว่าค่าเฉลี่ย (36.5) สูงกว่ามัธยฐาน (25) และฐานนิยม (25) อย่างชัดเจนเลยครับ นี่เป็นผลมาจากพนักงานคนหนึ่งที่มีเงินเดือนสูงถึง 150,000 บาท ซึ่งเป็นค่าผิดปกติที่ดึงค่าเฉลี่ยให้สูงขึ้นครับ

ในกรณีนี้ มัธยฐานและฐานนิยม จะเป็นตัวแทนของเงินเดือนพนักงาน “ส่วนใหญ่” ได้ดีกว่าค่าเฉลี่ยครับ เพราะเงินเดือน 25,000 บาท แสดงให้เห็นว่าพนักงานส่วนใหญ่มีเงินเดือนอยู่ในระดับนี้ การบอกว่าเงินเดือนเฉลี่ย 36,500 บาท อาจทำให้เข้าใจผิดว่าพนักงานส่วนใหญ่ได้เงินเดือนเยอะกว่าความเป็นจริงครับ

นี่แหละครับ คือเหตุผลว่าทำไมเราถึงต้องเรียนรู้ความแตกต่างและเลือกใช้ค่ากลางที่เหมาะสมกับข้อมูลของเราครับ

สรุปแนวคิดสำคัญ

น้องๆ ครับ การทำความเข้าใจค่าเฉลี่ย มัธยฐาน และฐานนิยม เป็นพื้นฐานสำคัญในการวิเคราะห์ข้อมูลเลยนะครับ แต่ละค่ามีจุดแข็งจุดอ่อนและบริบทการใช้งานที่แตกต่างกันไป

  • ค่าเฉลี่ย (Mean): รวมข้อมูลทุกตัว เหมาะกับข้อมูลที่ไม่มีค่าผิดปกติ และมีการกระจายตัวแบบสมมาตร
  • มัธยฐาน (Median): ค่ากลางที่แบ่งข้อมูลออกเป็นครึ่งๆ เหมาะกับข้อมูลที่มีค่าผิดปกติ หรือมีการกระจายตัวแบบเบ้
  • ฐานนิยม (Mode): ค่าที่ปรากฏบ่อยที่สุด เหมาะกับข้อมูลเชิงคุณภาพ หรือเมื่อต้องการทราบความนิยมสูงสุด

พี่กฤษณ์หวังว่าบทความนี้จะช่วยให้น้องๆ เข้าใจความแตกต่างของค่าสถิติพื้นฐานทั้งสามนี้ได้ชัดเจนมากขึ้น และรู้ว่าเมื่อไรควรเลือกใช้ตัวไหนให้เหมาะสมกับข้อมูลแต่ละชุดนะครับ สถิติไม่ได้ยากอย่างที่คิดครับ ถ้าเราเข้าใจหลักการและนำไปประยุกต์ใช้เป็น

ถ้าหากน้องๆ คนไหนสนใจอยากเจาะลึกเนื้อหาสถิติ หรือหัวข้อคณิตศาสตร์อื่นๆ เพิ่มเติม ไม่ว่าจะเป็นเรื่องความน่าจะเป็น การวิเคราะห์ข้อมูลขั้นสูง หรือเตรียมสอบเข้ามหาวิทยาลัย พี่กฤษณ์ก็มีคอร์สดีๆ มาให้เลือกมากมายเลยนะครับ มีทั้งคอร์สสด คอร์สออนไลน์ และคอร์สตัวต่อตัว ที่จะช่วยให้น้องๆ เข้าใจคณิตศาสตร์ได้สนุกและเก่งขึ้นแน่นอนครับ สามารถดูรายละเอียดและสมัครเรียนได้ในเว็บไซต์นี้เลยนะครับ พี่กฤษณ์รอเจอน้องๆ ทุกคนนะครับ!

Join the conversation

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *