มัชฌิมเลขคณิต (Arithmetic Mean)

หมายถึง ผลรวมของข้อมูลที่ได้จากการวัดหารด้วยจำนวนข้อมูลที่ได้จากการวัด สมมติข้อมูลที่ได้จากการวัดคือ 7, 13, 22, 9, 11, 4 ผลรวมของข้อมูลชุดนี้คือ 66 ค่าเฉลี่ยจึงมีค่าเท่ากับ 66 หาร 6 เท่ากับ 11
ในกรณีทั่วไป ถ้าข้อมูลที่ได้จากการวัด N จำนวนถูกนำเสนอโดยใช้สัญลักษณ์ X1, X2, ..., XN และการหาค่าเฉลี่ยสามารถเขียนได้เป็นสูตรดังนี้

สัญลักษณ์ อ่านว่า เอ็กซ์บาร์ ใช้แทนค่าเฉลี่ยของข้อมูล อักษรกรีซ อ่านว่า ซิกม่า, แทนผลรวมของข้อมูลที่ได้จากการวัด N จำนวน ผลรวมจาก i = 1 ถึง i = N รูปแบบง่าย ๆ ของค่าเฉลี่ยสามารถเขียนได้ดังนี้

การคำนวณค่าเฉลี่ยจากการแจกแจงความถี่
สมมติค่าของ X ในแต่ละค่ามีค่าซ้ำกัน สามารถหาค่าเฉลี่ยได้โดยการแจกแจงความถี่ จากนั้น คูณค่า X แต่ละค่ากับความถี่ แล้วนำมาบวกกันและหารด้วยจำนวนข้อมูลทั้งหมด
สมมติข้อมูลที่ได้จากการวัดคือ 11, 11, 12, 12, 12, 13, 13, 13, 13, 13, 14, 14, 15, 15, 15, 16, 16, 17, 17, 18 โอกาสในการเกิด 11 มี 2 ครั้ง โอกาสในการเกิด 12 มี 3 ครั้ง ฯ จากข้อมูลสามารถนำมาเขียนเป็นตารางได้ดังนี้

ตาราง 4 ตารางแจกแจงความถี่

นี่เป็นการแจกแจงความถี่ในแต่ละชั้นที่มีอันตรภาคชั้นเป็น 1 สัญลักษณ์ fi ใช้แทนความถี่ของโอกาสในการเกิดค่า Xi คูณแต่ละค่าของ Xi ด้วยความถี่ fi จะได้ค่าเป็น fiXi และบวกแต่ละค่าใน fiXi เราจะได้ผลรวม 280 ค่าเฉลี่ยจะเท่ากับ 280 หารด้วย 20 เท่ากับ 14.0
ในรูปทั่ว ๆ ไปเมื่อ X1, X2, ..., Xk กับค่าถี่ f1, f2, ..., fk เมื่อ k แทนค่าแต่ละค่าที่แตกต่างกัน ค่าเฉลี่ยคือ

สังเกตตัวที่อยู่เหนือซัมเมชั่นก็คือ k แทนจำนวนค่าที่แตกต่างกันของตัวแปร X
สังเกต
ต่อไปนี้เป็นตัวอย่างง่าย ๆ ของการคำนวณค่าเฉลี่ยจากกลุ่มข้อมูลในรูปของการแจกแจงความถี่ ซึ่งมีขนาดอันตรภาคชั้นในแต่ละชั้น การคำนวณค่าเฉลี่ยมีขั้นตอนดังนี้ ขั้นแรกคำนวณค่าจุดกึ่งกลางในทุก ๆ ชั้น ขั้นสองคูณค่ากึ่งกลางกับความถี่ ขั้นสามรวมผลที่ได้จากการคูณกันของจุดกี่งกลางกับความถี่ ขั้นสี่หารผลรวมทั้งหมดด้วยจำนวนข้อมูล (N) ตัวอย่างแสดงในตาราง 5

ตาราง 5 แสดงการคำนวณค่าเฉลี่ยสำหรับข้อมูลที่มีการแจกแจงความถี่เป็นอันตรภาคชั้น

จุดกึ่งกลางชั้น Xi แสดงในสดมภ์ 2 ความถี่ fi ปรากฏอยู่ในสดมภ์ที่ 3 ผลของการคูณจุดกึ่งกลางกับความถี่ fiXi แสดงในสดมภ์ 4 ผลรวมของผลคูณ คือ 1,612 , N คือ 76 และค่าเฉลี่ยคือหาร 1,612 ด้วย 76 เท่ากับ 21.21

ส่วนเบี่ยงเบนจากค่าเฉลี่ย
ในการทำงานทางสถิติบางครั้งจำเป็นต้องใช้ค่าความแตกต่างระหว่างคะแนน Xi กับค่าเฉลี่ยความแตกต่างที่เกิดขึ้นถูกเรียกว่า ส่วนเบี่ยงเบนจากค่าเฉลี่ย ดังนี้

ใชัสัญลักษณ์ xi แทนส่วนเบี่ยงเบน
คะแนนที่ได้แทนด้วย X บางครั้งเรียกว่าคะแนนดิบ คะแนนที่เบี่ยงเบนไปจากค่าเฉลี่ยถูกแทนด้วย x เรียกว่าคะแนนเบี่ยงเบน คะแนนดิบที่มีค่าเท่ากับค่าเฉลี่ย จะมีคะแนนเบี่ยงเบนเป็น 0

ในกรณีข้อมูลแต่ละค่ามีความสำคัญไม่เท่ากัน เช่นคะแนนที่เด็กชายฉัตรชัยได้รับจากการสอบด้วยแบบทดสอบ 4 ฉบับซึ่งมีความสำคัญไม่เท่ากัน ปรากฏดังตาราง

ตาราง 6 คะแนนแบบทดสอบ 4 ฉบับของเด็กชายฉัตรชัย

จะเห็นว่าแบบทดสอบแต่ละฉบับมีน้ำหนักความสำคัญไม่เท่ากัน ในสูตร นั้นใช้สำหรับข้อมูลที่แต่ละค่ามีความสำคัญเท่ากัน แต่ในที่นี้ข้อมูลแต่ละค่ามีความสำคัญไม่เท่ากันจึงประยุกต์สูตรมาเป็นสูตร

การคำนวณหาคะแนนเฉลี่ยของเด็กชายฉัตรชัยได้ดังนี้

คะแนนเฉลี่ยของเด็กชายฉัตรชัยคือ 79.49

จากตารางแสดงราคาของก๊าซโซลีน

ตาราง 7 ราคาของก๊าซโซลีน

ราคาเฉลี่ยต่อแกลอนของก๊าซโซลีนเป็นเท่าใด วิธีการคำนวณแสดงได้ดังนี้

ราคาของก๊าซโซลีนเฉลี่ยต่อแกลอนคือ 1.48

คุณสมบัติบางประการของมัชฌิมเลขคณิต

มัชฌิมเลขคณิตมีคุณสมบัติบางประการดังนี้
ประการแรก คุณสมบัติพื้นฐานก็คือ ผลบวกของความเบี่ยงเบนของคะแนนดิบกับคะแนนเฉลี่ยมีค่าเป็น 0
ค่ามัชฌิมเลขคณิตของคะแนน 7, 13, 22, 9, 11 และ 4 คือ 11 ส่วนเบี่ยงเบนจากคะแนนเฉลี่ยคือ -4, 2, 11, -2, 0 และ -7 ผลบวกของคะแนนเบี่ยงเบนคือ 0 ผลทั้งหมดเขียนเป็นสัญลักษณ์ได้ดังนี้

ประการสอง ผลรวมของกำลังสองของคะแนนเบี่ยงเบนจะมีค่าน้อยที่สุด
ความเบี่ยงเบนของค่าที่ได้จากการวัด 7, 13, 22, 9, 11, 4 กับค่าเฉลี่ย 11 คือ -4, 2, 11, -2, 0, -7 ค่ากำลังสองของความเบี่ยงเบนจะได้ 16, 4, 121, 4, 0, 49 ผลบวกของกำลังสองเท่ากับ 197 ถ้าหากเราใช้ค่าเฉลี่ยตัวอื่น ๆ ผลบวกของกำลังสองของความเบี่ยงเบนของค่าการวัดกับค่ากึ่งกลางใด ๆ จะได้ค่าสูงกว่าผลรวมของกำลังสองความเบี่ยงเบนของค่าการวัดกับมัชฌิมเลขคณิต สมมติให้ค่ากึ่งกลางของข้อมูลชุดนี้เป็น 13 ความเบี่ยงเบนจะได้ -6, 0, 9, 4, 2, -9 ยกกำลังสองได้ 36, 0, 81, 16, 4, 81 รวมผลทั้งหมดเท่ากับ 218 ซึ่งมากกว่าค่าที่ได้จากการใช้ค่าเฉลี่ย

ข้อดีข้อเสียของมัชฌิมเลขคณิต

ข้อดี
1. คำนวณได้ง่าย
2. ข้อมูลทุกตัวถูกนำมาใช้ในการคำนวณ
3. สามารถนำค่าเฉลี่ยที่ได้มาใช้ในการคำนวณอื่น ๆ
ข้อเสีย
1. เพราะข้อมูลทุกค่าถูกนำมาใช้ในการคำนวณ ถ้ามีข้อมูลบางค่าผิดปกติค่าเฉลี่ยก็จะผิดปกติไปด้วย
2. ในกรณีที่อันตรภาคชั้นแต่ละชั้นเป็นชั้นเปิด ไม่สามารถหามัชฌิมเลขคณิตได้

ความคลาดเคลื่อนของค่าเฉลี่ย (Standard error of the mean)

เป็นการประมาณค่าความคลาดเคลื่อนของค่าเฉลี่ย มีสมการว่า

ค่า SEM เป็นค่าที่บ่งบอกถึงความคลาดเคลื่อนในการประมาณค่าเฉลี่ยที่ได้จากกลุ่มตัวอย่างไปยังค่าเฉลี่ยของประชากร ถ้า SEM มีค่าน้อย การประมาณค่าเฉลี่ยที่ได้จากกลุ่มตัวอย่างไปยังค่าเฉลี่ยของประชากรจะมีโอกาสถูกต้องมากขึ้น ดังนั้นค่าเฉลี่ยของประชากรจะมีค่าอยู่ระหว่าง - SEM จนถึง + SEM
ค่า SEM นี้จะมีค่าสวนทางกับจำนวนของกลุ่มตัวอย่าง ถ้า n มีจำนวนมาก ค่า SEM จะมีค่าลดน้อยลง ดังนั้นจำนวนกลุ่มตัวอย่างยิ่งมาก การประมาณค่าเฉลี่ยที่ได้จากกลุ่มตัวอย่างไปยังค่าเฉลี่ยของประชากรยิ่งมีโอกาสถูกต้องมากขึ้น

เอกสารชุดนี้จัดทำโดย : ฉัตรศิริ ปิยะพิมลสิทธิ์. เมษายน ๒๕๔๔