วันศุกร์ที่ 17 พฤศจิกายน พ.ศ. 2560

การวิเคราะห์เชิงสถิติ : การหาค่าเฉลี่ยของอัตราการเติบโต

หัวเรื่องดูเหมือนจะเป็นของง่าย ไม่ซับซ้อนอะไรเลย แต่เชื่อไหมผมเคยเจองานวิเคราะห์ที่คำนวณค่าเฉลี่ยของอัตราการเติบโต (เช่น การเติบโตของประชากร การเติบโตทางเศรษฐกิจ ฯลฯ) แบบผิดๆ เยอะมาก ส่วนใหญ่เกิดจากการเข้าใจผิดว่าค่าเฉลี่ยของอัตราการเติบโตสามารถหาได้จากการคำนวณค่าเฉลี่ยของการเติบโตแต่ละปีนั่นเอง ซึ่งไม่ถูกต้อง

สมมติกรณีง่าย ปีนี้เรามีเงินเดือน 10,000 บาท ปีต่อมาได้ขึ้นเงินเดือน 10% (หรือเติบโต 10% นั่นเอง) แล้วมาปีถัดไปโดนลดเงินเดือน 10% (หรือเติบโต -10%) เราลองเอาอัตราการเติบโตแต่ละปีมาหาค่าเฉลี่ยก็จะได้ = ( 10%+(-10%) ) / 2 = 0% หรือการเติบโตเป็นศูนย์ (เงินเดือนเท่าเดิมเหมือนปีแรกว่างั้น)

ที่นี้มาดูตัวเงินจริงๆ กันนะ ปีแรกเงินเดือน 10,000 บาท ได้ปรับเพิ่ม 10% ก็กลายเป็น 11,000 บาท ต่อมาโดนปรับลด 10% ก็จะเหลือเท่ากับ 9,900 บาท อ้าวเห็นไหมล่ะ เฉลี่ยแล้วอัตราเติบโตติดลบนั่นเอง

วิธีที่ถูกต้องของการหาค่าเฉลี่ยของอัตราการเติบโต จะต้องใช้ค่าเฉลี่ยเรขาคณิต (Geometric Mean) ซึ่งจะมีค่าน้อยกว่า (หรือเท่ากับ) ค่าเฉลี่ยเลขคณิตเสมอ ค่าเฉลี่ยเลขคณิตก็คือค่าเฉลี่ยที่เรารู้จักกันโดยทั่วไปนั่นแหล่ะครับ สำหรับวิธีการคำนวณค่าเฉลี่ยเรขาคณิตด้วย Excel ก็จะใช้สูตร GEOMEAN() ซึ่งจะต้องมีเทคนิคปรับแต่งตัวเลขที่จะนำมาคำนวณนิดหน่อย เพราะค่าเฉลี่ยเรขาคณิตจะใช้ข้อมูลที่มีค่าติดลบมาคำนวณไม่ได้ ฯลฯ รายละเอียดเหล่านี้ลองหาอ่านได้จากตำราคณิตศาสตร์ทั่วๆไปได้นะครับ จะขอผ่านจุดนี้ไปก่อน

ส่วนที่จะนำมาบอกเล่ากันก็คือ เราสามารถคำนวณอัตราการเติบโตเฉลี่ยโดยวิธีลัดจากตัวเลขข้อมูลปีแรกกับปีสุดท้ายโดยใช้สูตรง่ายๆ คือ










สมมติมีตัวเลขข้อมูลเรียงกัน 5 ปีดังนี้

1205   1256   1245   1360   1390

เราสามารถคำนวณอัตราการเติบโตเฉลี่ย คือ










ค่าที่ได้คือตัวคูณการเติบโตแต่ละปี หรือมีอัตราการเติบโตเฉลี่ยปีละ 3.6% นั่นเอง
จะเห็นว่าข้อมูลระหว่างกลางๆ ทั้งหลายไม่ต้องนำมาคิดให้เสียเวลา
จบครับ



วันเสาร์ที่ 4 พฤศจิกายน พ.ศ. 2560

การวิเคราะห์เชิงสถิติ : เทคนิคการวิเคราะห์สัดส่วน (ตัวอย่างการวิเคราะห์สัดส่วนความพึงพอใจ)

ช่วงนี้จะขอแว้บมาที่เรื่องการวิเคราะห์ทางสถิติกันบ้าง
เคยเจอปัญหานี้มั้ย สมมติเราทำการสำรวจความพึงพอใจด้วยแบบสอบถาม แล้วได้ข้อมูลระดับความพึงพอใจของกลุ่มเป้าหมายแต่ละรายเป็นตัวเลข เช่น
1 = ไม่พอใจมาก
2 = ไม่ค่อยพอใจ
3 = ไม่แน่ใจ เฉยๆ
4 = ค่อนข้างพอใจ
5 = พอใจมาก

ถ้าเราเก็บข้อมูลมาจำนวนหนึ่ง เช่น 200 ราย แล้วเราจะวิเคราะห์เพื่อสรุปว่ามีจำนวนผู้ที่พึงพอใจอยู่เท่าไหร่ หรือกี่เปอร์เซ็น ?
จะตอบปัญหาข้างต้นได้ เราต้องมีข้อกำหนดที่ชัดเจนเสียก่อนว่า ผู้ที่พึงพอใจนั้นหมายถึงผู้ที่ให้คะแนนเท่าไหร่ ถ้าบอกว่าหมายถึงผู้ที่ให้คะแนน 4 กับ 5 เท่านั้น อย่างนี้ก็ง่ายมาก เราแค่นับจำนวนผู้ที่ตอบ 4 กับ 5 รวมกัน ก็จบ หรือถ้าหมายถึงผู้ที่ตอบ 3, 4 หรือ 5 เราก็แค่รวมจำนวนผู้ที่ตอบ 3, 4 หรือ 5 ก็จบเหมือนกัน
ทีนี้ ถ้าเรามีข้อกำหนดว่า กลุ่มผู้ที่ตอบ 3 (ไม่แน่ใจ เฉยๆ) นั้น สามารถแยกแยะออกมาได้ไหมว่าเป็นกลุ่มไหนแน่ (ต้องการให้เลือกฝั่งว่าอยู่ข้างพอใจ หรือไม่พอใจ ห้ามแทงกั๊ก ว่างั้น) ปัญหาตรงนี้สามารถใช้การวิเคราะห์ทางสถิติเข้ามาช่วยได้ ใช้แค่หลักสถิติพื้นฐานเท่านั้น (เดี๋ยวจะเรียบเรียงให้เข้าใจง่ายๆ สักนิด ติดตามต่อไปครับ)
(5 พ.ย. 2560)
----------------------------------------------
มาว่ากันต่อครับ
การสำรวจระดับความพึงพอใจนั้น เรามักกำหนดช่วงในการให้คะแนนสำหรับความพึงพอใจเป็น 5 ระดับ โดยแทนด้วยตัวเลขจำนวนเต็ม 1, 2, 3, 4 และ 5 ซึ่งแทนระดับความพึงพอใจตั้งแต่น้อยที่สุดไปจนมากที่สุด โดยที่ระดับคะแนน 1 กับ 2 นั้น จัดได้ว่าเป็นระดับคะแนนที่สะท้อนได้ชัดเจนว่าผู้ตอบไม่มีความพึงพอใจ ส่วนระดับคะแนน 4 กับ 5 นั้น จัดได้ว่าเป็นระดับคะแนนที่สะท้อนได้ชัดเจนว่าผู้ตอบมีความพึงพอใจ ส่วนระดับคะแนน 3 นั้น เป็นช่วงที่สะท้อนว่าผู้ตอบอาจมีความพึงพอใจหรือไม่พึงพอใจก็ได้เพียงแต่ยังไม่ชัดเจนจนยอมแสดงออกมาเท่านั้น

โดยทั่วไปแล้วการสำรวจระดับคะแนนความพึงพอใจของประชากรในด้านต่างๆ นั้น มักจะมีรูปแบบการแจงแจงความถี่เป็นลักษณะปกติ (Normal Distribution) ซึ่งเป็นลักษณะการแจงแจงข้อมูลโดยทั่วๆ ไป ข้อมูลที่อยู่ในช่วงค่ากลาง (หรือค่าเฉลี่ย) จะมีจำนวนหรือความถี่ที่มากที่สุดและจะค่อยๆ น้อยลงตามค่าที่แตกต่างจากค่ากลางออกไปทั้งทางด้านซ้ายและด้านขวา

รูปด้านล่าง แสดงการแจกแจงความถี่ของคะแนนระดับความพึงพอใจ จะเห็นว่าค่ากลางของระดับความพึงพอใจจะแทนด้วยคะแนนเท่ากับ 3 ซึ่งจะมีจำนวนมากที่สุดตามลักษณะการแจงของข้อมูลแบบปกติซึ่งอาจจะมีลักษณะข้อมูลสมมาตร เบ้ขวา หรือเบ้ซ้ายบ้างเล็กน้อยขึ้นอยู่กับลักษณะการแจกแจงของข้อมูลนั้นๆ 



การนับจำนวนผู้ที่มีความพึงพอใจให้ครอบคลุมระดับคะแนนในส่วนที่ตอบว่า “พอใจระดับปานกลาง” ได้ด้วยนั้น สามารถจำแนกโดยใช้คุณสมบัติทางสถิติของการแจกแจงข้อมูลแบบปกติโดยการแปลงค่าระดับคะแนนที่สำรวจให้เป็นค่าทางสถิติ ประกอบด้วยค่าเฉลี่ย และส่วนเบี่ยงเบนมาตรฐาน จากนั้นก็แปลงระดับคะแนนในช่วงที่ต้องการจำแนกว่าอยู่ในเขต “พึงพอใจ” หรือ “ไม่พึงพอใจ” ซึ่งในที่นี้หมายถึงมีระดับคะแนนสูงกว่า 3.0 หรือต่ำกว่า 3.0 ให้เป็นค่ามาตรฐานหรือค่า Z โดยใช้สูตร

   

ค่า Z ที่ได้นี้เป็นค่าเป้าหมายสำหรับเป็นเส้นเขตแบ่งระหว่าง "ผู้ที่พอใจ" กับ "ผู้ที่ไม่พอใจ" ผมขอเรียกเองว่า Z (Target) ก็แล้วกัน ซึ่งจะเป็นตัวชี้ว่าตำแหน่งคะแนนของ 3.0 ในกลุ่มตัวอย่างนั้นๆ อยู่ที่จุดใดภายใต้เส้นโค้งของการแจกแจงแบบปกติ (Normal Curve) และเมื่อได้แปลงคะแนนมาเป็นค่า Z แล้วก็สามารถคำนวณความถี่หรือร้อยละของข้อมูลที่ต้องการโดยพิจารณาจากพื้นที่ใต้เส้นโค้งของการแจกแจงปกติ (เทียบจากตารางค่า Z) ซึ่งเป็นค่าระดับความพึงพอใจของประชากรในพื้นที่ศึกษาที่อนุมานจากข้อมูลสถิติหรือจากข้อมูลตัวอย่างที่สำรวจ

ทีนี้ ถ้าเราต้องการแยกเอาเฉพาะจำนวนผู้ที่ตอบ 4 กับ 5 ล่ะ ทำอย่างไร ก็แค่เปลี่ยนค่า 3.0 ในสูตรข้างต้น เป็น 3.50 (เพราะว่า range ของคะแนน 4 หมายถึงค่าตั้งแต่ 3.5 ถึง 4.5 ยังไงล่ะ) อือ ๆ ๆ

(12 พ.ย. 2560)---------------------

การวิเคราะห์เชิงสถิติ : การหาค่าเฉลี่ยของอัตราการเติบโต

หัวเรื่องดูเหมือนจะเป็นของง่าย ไม่ซับซ้อนอะไรเลย แต่เชื่อไหมผมเคยเจองานวิเคราะห์ที่คำนวณค่าเฉลี่ยของอัตราการเติบโต (เช่น การเติบโตของประชากร...