ดาวน์โหลด ข้อมูลวัวป่าและม้าลาย
เป็นรูปแบบพื้นฐานของการวิเคราะห์ข้อมูล เพื่ออธิบายลักษณะของข้อมูลที่เก็บรวบรวม โดยใช้การคำนวณทางคณิตศาสตร์และสถิติพื้นฐาน เช่น การหาสัดส่วนหรือร้อยละ การวัดค่ากลางของข้อมูล การวัดการกระจายของข้อมูล และการหาความสัมพันธ์ของชุดข้อมูล ซึ่งนำมาใช้งานเพื่อดูภาพรวมของข้อมูลที่สนใจ
การหาสัดส่วนหรือร้อยละ
เป็นการจัดการข้อมูลที่ซ้ำกันให้เป็นระเบียบและเป็นหมวดหมู่ ทำให้สะดวกในการนำข้อมูลไปใช้และง่ายต่อการสังเกตการเปลี่ยนแปลงต่างๆ นำไปแสดงในรูปของเศษส่วน ทศนิยม หรือร้อยละ และนำเสนอข้อมูลในรูปแบบของแผนภูมิหรือแผนภาพ เพื่ออธิบายความหมายของข้อมูลชุดนั้น เช่น จำนวนนักเรียนชาย-หญิง ในห้องเรียน แสดงผลเป็นร้อยละต่อจำนวนนักเรียนทั้งห้อง
การวัดค่ากลางของข้อมูล
ใช้เพื่อหาค่าที่เป็นตัวแทนของข้อมูลทั้งหมด ทำให้สะดวกในการจดจำ หรือสรุปเรื่องราวเกี่ยวกับข้อมูลชุดนั้น ค่ากลางของข้อมูลที่นิยมใช้ได้แก่ ค่าเฉลี่ย (Mean) มัธยฐาน (Median) และฐานนิยม (Mode)
ค่าเฉลี่ยอาจเป็นค่ากลางที่ดี แต่อาจไม่เหมาะสำหรับเป็นค่ากลางของชุดข้อมูลที่มีค่าแตกต่างกันมากๆ (มีค่าสูงมากๆ หรือต่ำมากๆ) ดังนั้นการพิจารณาค่าเฉลี่ยจึงควรพิจารณาการกระจายขอข้อมูลด้วย ซึ่งสามารถดูได้จากค่าส่วนเบี่ยงเบนมาตรฐาน (Standard Deviation)
การหาความสัมพันธ์ของชุดข้อมูล
การวิเคราะห์ความสัมพันธ์เชิงเส้นระหว่างข้อมูล 2 ชุด (pairwise) บ่งบอกถึงทิศทาง (direction) ของความสัมพันธ์ และระดับ (degree) ของความสัมพันธ์
ทิศทางของความสัมพันธ์ มี 2 กรณี
ความสัมพันธ์เชิงบวก – สิ่งที่สนใจทั้งสองสิ่งมีการเพิ่มขึ้นหรือลดลงไปในทิศทางเดียวกัน เช่น ค่าของ X เพิ่มขึ้น ค่าของ Y จะเพิ่มขึ้นด้วย
ความสัมพันธ์เชิงลบ – สิ่งที่สนใจทั้งสองสิ่งมีการเพิ่มขึ้นหรือลดลงไปในทิศทางตรงกันข้าม เช่น ค่าของ X เพิ่มขึ้น แต่ค่าของ Y กลับลดลง
ระดับของความสัมพันธ์ แบ่งเป็นระดับมาก (strong) ปานกลาง (moderate) หรือน้อย (weak)
การวิเคราะห์ความสัมพันธ์เบื้องต้นสามารถทำได้โดยการนำค่าของข้อมูลทั้ง 2 ชุดมาสร้างแผนภาพการกระจาย ทำให้เห็นทิศทางของความสัมพันธ์ได้ชัดเจน และสามารถประมาณระดับของความสัมพันธ์ได้
แผนภาพการกระจายแสดงความสัมพันธ์ของข้อมูล
(จากหนังสือเรียนเทคโนโลยี วิทยาการคำนวณ ม.5)
การดูแผนภาพการกระจาย สามารถดูลักษณะความสัมพันธ์ของจุดต่างๆ หรือกลุ่มของจุด ว่าสัมพันธ์กันมาก ปานกลาง หรือน้อย โดยจะพิจารณาความสัมพันธ์ของข้อมูลในรูปแบบของเส้นตรง
จากแผนภาพการกระจาย จะเห็นแนวโน้มการกระจายของวัวป่าและม้าลายมีความสัมพันธ์เชิงบวก นั่นคืนเมื่อจำนวนวัวป่าเพิ่มขึ้น จำนวนม้าลายก็จะเพิ่มขึ้นเช่นกัน และมีระดับของความสัมพันธ์เชิงเส้นค่อนข้างสูง เนื่องจากจุดมีการเกาะกลุ่มในลักษณะเป็นแนวเส้นตรง
ข้อควรระวังในการอภิปรายผลของการวิเคราะห์ความสัมพันธ์ คือ ค่าความสัมพันธ์บอกได้เพียงว่า ข้อมูลทั้งสองชุดมีความสัมพันธ์กันหรือไม่ มีทิศทางสัมพันธ์เป็นแบบใด และมีระดับความสัมพันธ์มากหรือน้อยเพียงใด แต่ไม่สามารถสรุปว่าข้อมูลชุดหนึ่งส่งผลต่อการเปลี่ยนแปลงค่าของข้อมูลอีกชุดหนึ่ง
ตัวอย่างเช่น หากเกิดภัยแล้งแล้วทำให้จำนวนวัวป่าและม้าลายลดลงพร้อมกัน จึงสรุปไม่ได้ว่าการลดลงของจำนวนวัวป่าส่งผลต่อการลดลงของจำนวนม้าลาย เนื่องจากอาจมีปัจจัยอื่นเข้ามาเกี่ยวข้อง