สถิติและการวิจัย

สถิติและการวิจัย

    คำว่า สถิติ (Statistics) มาจากภาษาเยอรมันว่า Statistik มีรากศัพท์มาจาก Stat หมายถึงข้อมูล หรือสารสนเทศ ซึ่งจะอำนวยประโยชน์ต่อการบริหารประเทศในด้านต่าง ๆ เช่น การทำสำมะโนครัว เพื่อจะทราบจำนวนพลเมืองในประเทศทั้งหมด ในสมัยต่อมา คำว่า สถิติ ได้หมายถึง ตัวเลขหรือข้อมูลที่ได้จากการเก็บรวบรวม เช่น จำนวนผู้ประสบอุบัติเหตุบนท้องถนน อัตราการเกิดของเด็กทารก ปริมาณน้ำฝนในแต่ละปี เป็นต้น สถิติในความหมายที่กล่าวมานี้เรียกอีกอย่างหนึ่งว่า ข้อมูลทางสถิติ (Statistical data) อีกความหมายหนึ่ง สถิติหมายถึง วิธีการที่ว่าด้วยการเก็บรวบรวมข้อมูล การนำเสนอข้อมูล การวิเคราะห์ข้อมูล และการตีความหมายข้อมูล สถิติในความหมายนี้เป็นทั้งวิทยาศาสตร์และศิลปศาสตร์ เรียกว่า "สถิติศาสตร์" 

ประเภท สถิติแบ่งออกเป็น 2 ประเภทคือ 
สถิติพรรณนา (Descriptive Statistics) เป็นสถิติที่ใช้อธิบายคุณลักษณะต่าง ๆ ของสิ่งที่ต้องการศึกษาในกลุ่มใดกลุ่มหนึ่ง วิธีการทางสถิติที่อยู่ในประเภทนี้ เช่น 
การจัดกระทำกับข้อมูลโดยนำเสนอในรูปของตารางหรือรูปภาพ 
การแปลงคะแนนให้อยู่ในรูปแบบอื่น ๆ เช่น เปอร์เซ็นต์ไทล์ คะแนนมาตรฐาน ฯ 
การคำนวณหาค่าเฉลี่ยหรือการกระจายของข้อมูล เช่น มัชฌิมเลขคณิต มัธยฐาน ส่วนเบี่ยงเบนมาตรฐาน พิสัย ฯ 
สถิติอ้างอิง (Inferential Statistics) เป็นสถิติที่ใช้อธิบายคุณลักษณะของสิ่งที่ต้องการศึกษาในกลุ่มใดกลุ่มหนึ่ง แล้วสามารถอ้างอิงไปยังกลุ่มอื่น ๆ ได้ โดยกลุ่มที่นำมาศึกษาจะต้องเป็นตัวแทนที่ดีของประชากร ตัวแทนที่ดีของประชากรได้มาโดยวิธีการสุ่มตัวอย่าง และตัวแทนที่ดีของประชากรจะเรียกว่า "กลุ่มตัวอย่าง" สถิติอ้างอิงสามารถแบ่งออกได้เป็น 2 ประเภทย่อย คือ 
สถิติมีพารามิเตอร์ (Parametric Statistics) เป็นวิธีการทางสถิติที่จะต้องเป็นไปตามข้อตกลงเบื้องต้น 3 ประการ ดังนี้ 
ตัวแปรที่ต้องการวัดจะต้องอยู่ในมาตราการวัดระดับช่วงขึ้นไป (Interval Scale) 
ข้อมูลที่เก็บรวบรวมได้จากกลุ่มตัวอย่างจะต้องมีการแจกแจงเป็นโค้งปกติ 
กลุ่มประชากรแต่ละกลุ่มที่นำมาศึกษาจะต้องมีความแปรปรวนเท่ากัน สถิติมีพารามิเตอร์ เช่น t-test, ANOVA, Regression Analysis ฯลฯ 
สถิติไร้พารามิเตอร์ (Nonparametric Statistics) เป็นวิธีการทางสถิติที่ไม่มีข้อจำกัดใด ๆ นั่นก็คือ 
ตัวแปรที่ต้องการวัดอยู่ในมาตราการวัดระดับใดก็ได้ (Norminal Scale, Ordinal Scale, Interval Scale, Ratio Scale) 
ข้อมูลที่เก็บรวบรวมได้จากกลุ่มตัวอย่างมีการแจกแจงแบบใดก็ได้ (Free Distribution) 
กลุ่มประชากรแต่ละกลุ่มที่นำมาศึกษาไม่จำเป็นต้องมีความแปรปรวนเท่ากัน สถิติไร้พารามิเตอร์ เช่น ไคสแควร์, Median Test, Sign test ฯลฯ โดยปกติแล้วนักวิจัยมักนิยมใช้สถิติมีพารามิเตอร์ทั้งนี้เพราะผลลัพธ์ที่ได้จากการใช้สถิติมีพารามิเตอร์มีอำนาจการทดสอบ (Power of Test) สูงกว่าการใช้สถิติไร้พารามิเตอร์ ดังนั้นเมื่อข้อมูลมีคุณสมบัติที่สอดคล้องกับข้อตกลงเบื้องต้นสามประการในการใช้สถิติมีพารามิเตอร์ จึงไม่มีผู้ใดคิดที่จะใช้สถิติไร้พารามิเตอร์ในการทดสอบสมมติฐาน 

มาตราการวัด 

ความหมาย 
การวัดเป็นการกำหนดตัวเลขให้กับสิ่งที่ต้องการศึกษาภายใต้กฎเกณฑ์ที่แน่นอน ผู้วิจัยจำเป็นจะต้องทราบคุณลักษณะของข้อมูลที่ถูกวัด เพื่อใช้ในการพิจารณาว่าจะเลือกใช้วิธีการทางสถิติใดจึงจะเหมาะสม ดังนั้นจึงควรทราบว่าข้อมูลที่ถูกวัดมานั้นอยู่ในมาตราการวัดระดับใด ซึ่งมาตราการวัดแบ่งออกเป็น 4 ระดับคือ ระดับที่ 1 มาตราการวัดระดับนามบัญญัติ (Nominal Scale) เป็นระดับที่ใช้จำแนกความแตกต่างของสิ่งที่ต้องการวัดออกเป็นกลุ่ม ๆ โดยใช้ตัวเลข เช่น ตัวแปรเพศ แบ่งออกเป็นกลุ่มเพศชายและกลุ่มเพศหญิง ในการกำหนดตัวเลขอาจจะใช้เลข 1 แทนเพศชาย และเลข 2 แทนเพศหญิง ตัวแปรระดับการศึกษา แบ่งออกเป็นกลุ่มที่มีการศึกษาต่ำกว่าปริญญาตรี อาจจะแทนด้วยเลข 1 กลุ่มที่มีการศึกษาระดับปริญญาตรี อาจจะแทนด้วยเลข 2 และกลุ่มที่มีการศึกษาสูงกว่าระดับปริญญาตรี อาจจะแทนด้วยเลข 3 เป็นต้น ตัวเลข 1 หรือ 2 หรือ 3 ที่ใช้แทนกลุ่มต่าง ๆ นั้น ถือเป็นตัวเลขในระดับนามบัญญัติไม่สามารถนำมาบวก ลบ คูณ หาร หรือหาสัดส่วนได้ ระดับที่ 2 มาตราการวัดระดับเรียงอันดับ (Ordinal Scales) เป็นระดับที่ใช้สำหรับจัดอันดับที่หรือตำแหน่งของสิ่งที่ต้องการวัด ตัวเลขในมาตราการวัดระดับนี้เป็นตัวเลขที่บอกความหมายในลักษณะมาก-น้อย สูง-ต่ำ เก่ง-อ่อน กว่ากัน เช่น ด.ช.ดำสอบได้ที่ 1 ด.ช.แดงสอบได้ที่ 2 ด.ญ.เขียวสอบได้ที่ 3 หรือ การประกวดร้องเพลง นางสาวเขียวได้รางวัลที่ 1 นางสาวชมพูได้รางวัลที่ 2 นางสาวเหลืองได้รางวัลที่ 3 เป็นต้น ตัวเลขอันดับที่แตกต่างกันไม่สามารถบ่งบอกถึงปริมาณความแตกต่างได้ เช่น ไม่สามารถบอกได้ว่าผู้ที่ประกวดร้องเพลงได้รางวัลที่ 1 มีความเก่งมากกว่าผู้ที่ได้รางวัลที่ 2 ในปริมาณเท่าใด ตัวเลขในระดับนี้สามารถนำมาบวกหรือลบ กันได้ ระดับที่ 3 มาตราการวัดระดับช่วง (Interval Scale) เป็นระดับที่สามารถกำหนดค่าตัวเลขโดยมีช่วงห่างระหว่างตัวเลขเท่า ๆ กัน สามารถนำตัวเลขมาเปรียบเทียบกันได้ว่าว่ามีปริมาณมากน้อยเท่าใด แต่ไม่สามารถบอกได้ว่าเป็นกี่เท่าของกันและกัน เพราะมาตราการวัดระดับนี้ไม่มี 0 (ศูนย์) แท้ มีแต่ 0 (ศูนย์) สมมติ เช่น นายวิชัยสอบได้ 0 คะแนน มิได้หมายความว่าเขาไม่มีความรู้ เพียงแต่เขาไม่สามารถทำข้อสอบซึ่งเป็นตัวแทนของความรู้ทั้งหมดได้ หรือ อุณหภูมิ 0 องศา มิได้หมายความว่าจะไม่มีความร้อน เพียงแต่มีความร้อนเป็น 0 องศาเท่านั้น จุดที่ไม่มีความร้อนอยู่เลยก็คือที่ -273 องศา ดังนั้นอุณหภูมิ 40 องศาจึงไม่สามารถบอกได้ว่ามีความร้อนเป็น 2 เท่าของอุณหภูมิ 20 องศา เป็นต้น ตัวเลขในระดับนี้สามารถนำมาบวก ลบ คูณ หรือหารกันได้ ระดับที่ 4 มาตราการวัดระดับอัตราส่วน (Ratio Scale) เป็นระดับที่สามารถกำหนดค่าตัวเลขให้กับสิ่งที่ต้องการวัด มี 0 (ศูนย์) แท้ เช่น น้ำหนัก ความสูง อายุ เป็นต้น ระดับนี้สามารถนำตัวเลขมาบวก ลบ คูณ หาร หรือหาอัตราส่วนกันได้ คือสามารถบอกได้ว่า ถนนสายหนึ่งยาว 50 กิโลเมตร ยาวเป็น 2 เท่าของถนนอีกสายหนึ่งที่ยาวเพียง 25 กิโลเมตร ดังนั้น ผู้วิจัยจึงต้องมีความรู้ในเรื่องของมาตราการวัดระดับต่าง ๆ เป็นอย่างดี เพื่อใช้ในการวินิจฉัยตัวแปรในงานวิจัยว่าอยู่ในมาตราการวัดระดับใด เพื่อประโยชน์ในการเลือกใช้วิธีการทางสถิติให้มีความถูกต้องเหมาะสม 



การวัดแนวโน้มเข้าสู่ส่วนกลาง การวัดแนวโน้มเข้าสู่ส่วนกลางเป็นการคำนวณหาค่าเฉลี่ยหรือค่ากึ่งกลางของข้อมูล โดยปกติจะใช้ฐานนิยม (Mode) มัธยฐาน (Median) และ มัชฌิมเลขคณิต (Arithmetic Mean) แต่มีการแจกแจงความถี่บางอย่างซึ่งมีอยู่น้อยมากที่ใช้มัชฌิมเรขาคณิต (Geometric Mean) และมัชฌิมฮาร์โมนิก (Harmonic Mean) แต่การหาตำแหน่งกึ่งกลางที่เป็นที่นิยมใช้กันอย่างกว้างขวางที่สุดก็คือ มัชฌิมเลขคณิต ซึ่งเป็นค่าเฉลี่ยที่ใช้ได้กับข้อมูลที่อยู่มาตรวัดระดับช่วงและอัตราส่วน นอกจากนี้ยังมี Trimmed Means เป็นสถิติปรับแก้ค่ามัชฌิมเลขคณิตกรณีที่มีข้อมูลสุดโต่ง (Extreme Value) ส่วนฐานนิยมและมัธยฐานนั้นบางครั้งใช้กับข้อมูลที่อยู่ในมาตราวัดระดับนามบัญญัติและจัดอันดับ แต่ก็สามารถใช้ได้กับระดับช่วงและอัตราส่วน ส่วนมัชฌิมเรขาคณิตและมัชฌิมฮาร์โมนิค จะใช้เฉพาะข้อมูลที่มีคุณลักษณะพิเศษบางอย่างเท่านั้น การคำนวณหาค่าเฉลี่ยหรือค่ากึ่งกลางของข้อมูลนั้นจะนำเสนอวิธีการดังนี้ 1. มัชฌิมเลขคณิต 2. Trimmed Means 3. มัธยฐาน 4. ฐานนิยม 5. มัชฌิมเรขาคณิต 6. มัชฌิมฮาร์โมนิค 

เปรียบเทียบมัชฌิมเลขคณิต, มัธยฐานและฐานนิยม มัชฌิมเลขคณิตเป็นการหาค่าเฉลี่ยที่ใช้กับตัวแปรระดับช่วงขึ้นไป โดยจะต้องนำข้อมูลทั้งหมดมาใช้ในการคำนวณ ค่ามัธยฐานเป็นสถิติในการจัดอันดับข้อมูล การคำนวณอยู่บนพื้นฐานของข้อมูลที่อยู่ในมาตราจัดอันดับ ถ้าค่าที่ได้จากการวัดถูกเรียงจากน้อยไปหามากหรือจากมากไปหาน้อยแล้ว ค่ามัธยฐานคือค่าที่อยู่ตรงกลาง ซึ่งในการคำนวณไม่ต้องใช้ข้อมูลทั้งหมด แต่เป็นการละเลยค่าที่อยู่เหนือและต่ำกว่ามัธยฐาน เช่นข้อมูล 2 ชุดมีค่า 5, 7, 20, 24, 25 และ 10, 15, 20, 52, 63 มีมัธยฐานเหมือนกันคือ 20 แต่ค่าเฉลี่ยตัวอื่นแตกต่างกัน สำหรับฐานนิยมเป็นค่าหรือชั้นที่มีความถี่สูงที่สุดเป็นสถิติระดับนามบัญญัติ การคำนวณไม่ได้ขึ้นอยู่กับค่าต่าง ๆ หรือการจัดอันดับแต่ดูที่ความถี่ การเปรียบเทียบค่าเฉลี่ย มัธยฐานและฐานนิยม สามารถทำได้โดยการคำนวณทั้ง 3 วิธีกับข้อมูลที่มีการแจกแจงถี่ที่เหมือนกัน ถ้านำการแจกแจงความถี่มานำเสนอด้วยกราฟ มัชฌิมเลขคณิตก็คือจุดบนแกนนอนที่อยู่ตรงกึ่งกลางของแกน ถ้าจุดตัดบนการแจกแจงทำให้เกิดความสมดุล จุดนั้นก็คือค่าเฉลี่ย ค่ามัธยฐานคือจุดบนแกนนอน ที่แบ่งพื้นที่ใต้โค้งทั้งหมดออกเป็น 2 ส่วนเท่ากัน พื้นที่ครึ่งหนึ่งจะอยู่ทางซ้ายอีกครึ่งหนึ่งจะอยู่ทางขวา ฐานนิยมคือจุดบนแกนนอนที่อยู่ตรงกับจุดที่สูงที่สุดของกราฟ ถ้าการแจกแจงความถี่เป็นแบบสมมาตร จุดมัชฌิมเลขคณิต มัธยฐานและฐานนิยมจะอยู่ที่จุดเดียวกัน ถ้าการแจกแจงเป็นแบบเบ้ จุดทั้ง 3 จุดจะไม่ใช่จุดเดียวกัน ดังรูปภาพ 5 แสดงค่ามัชฌิมเลขคณิต มัธยฐานและฐานนิยม สำหรับการแจกแจงความถี่แบบเบ้บวก เราจะพบว่าค่ามัชฌิมเลขคณิตจะมากกว่ามัธยฐานและมากกว่าฐานนิยม ถ้าการแจกแจงเป็นเบ้ลบ ค่าที่ได้จะตรงกันข้าม 

คลิกอ่านรายละเอียดตามเว็ปไซต์ข้างล่างนี้ค่ะ ดีมากๆ

Comments