3.1 การวิเคราะห์ข้อมูลเชิงพรรณนา
การวิเคราะห์เชิงพรรณนา (descriptive analytics) เป็นการวิเคราะห์ขั้นพื้นฐาน ที่ทำให้เห็นภาพรวมของข้อมูล และความสัมพันธ์ระหว่างข้อมูล ช่วยอธิบายว่าเกิดอะไรขึ้นบ้างในช่วงที่ผ่านมา และอาจนำ มาช่วยในการตัดสินใจ โดยอาจใช้สถิติ เช่น การหาสัดส่วนหรือร้อยละ การวัดค่ากลางของข้อมูล (centraltendency) การหาความสัมพันธ์ของชุดข้อมูล (correlation)
3.1.1 การหาสัดส่วนหรือร้อยละ เป็นการจัดการข้อมูลที่ซ้ำกันให้เป็นระเบียบและเป็นหมวดหมู่ ทำให้สะดวกในการนำข้อมูลไปใช้และง่ายต่อการสังเกตการเปลี่ยนแปลงต่างๆ นำไปแสดงในรูปของเศษส่วน ทศนิยม หรือร้อยละ และนำเสนอข้อมูลในรูปแบบของแผนภูมิหรือแผนภาพ เพื่ออธิบายความหมายของข้อมูลชุดนั้น เช่น จำนวนนักเรียนชาย-หญิง ในห้องเรียน แสดงผลเป็นร้อยละต่อจำนวนนักเรียนทั้งห้อง
3.1.2 การวัดค่ากลางของข้อมูล การหาค่ากลางของข้อมูลที่เป็นตัวแทนของข้อมูลทั้งหมดเพื่อความสะดวกในการสรุปเรื่องราวเกี่ยวกับข้อมูลนั้นๆ จะช่วยทำให้เกิดการวิเคราะห์ข้อมูลถูกต้องดีขึ้นการหาค่ากลางของข้อมูลมีวิธีหาหลายวิธี แต่ละวิธีมีข้อดีและข้อเสีย และมีความเหมาะสมในการนำไปใช้ไม่เหมือนกัน ขึ้นอยู่กับลักษณะข้อมูลและวัตถุประสงค์ของผู้ใช้ข้อมูลนั้นๆ
ค่ากลางของข้อมูลที่สำคัญ มี 3 ชนิด คือ
1. ค่าเฉลี่ยเลขคณิต (Arithmetic mean)
2. มัธยฐาน (Median)
3. ฐานนิยม (Mode)
3.1.3 การหาความสัมพันธ์ของชุดข้อมูล การวิเคราะห์ความสัมพันธ์เชิงเส้นระหว่างข้อมูล 2 ชุด (pairwise) บ่งบอกถึงทิศทาง (direction) ของความสัมพันธ์ และระดับ (degree) ของความสัมพันธ์
ทิศทางของความสัมพันธ์ มี 2 กรณี
ความสัมพันธ์เชิงบวก – สิ่งที่สนใจทั้งสองสิ่งมีการเพิ่มขึ้นหรือลดลงไปในทิศทางเดียวกัน เช่น ค่าของ X เพิ่มขึ้น ค่าของ Y จะเพิ่มขึ้นด้วย
ความสัมพันธ์เชิงลบ – สิ่งที่สนใจทั้งสองสิ่งมีการเพิ่มขึ้นหรือลดลงไปในทิศทางตรงกันข้าม เช่น ค่าของ X เพิ่มขึ้น แต่ค่าของ Y กลับลดลง
ระดับของความสัมพันธ์ แบ่งเป็นระดับมาก (strong) ปานกลาง (moderate) หรือน้อย (weak)
การวิเคราะห์ความสัมพันธ์เบื้องต้นสามารถทำได้โดยการนำค่าของข้อมูลทั้ง 2 ชุดมาสร้างแผนภาพการกระจาย ทำให้เห็นทิศทางของความสัมพันธ์ได้ชัดเจน และสามารถประมาณระดับของความสัมพันธ์ได้
แผนภาพการกระจายแสดงความสัมพันธ์ของข้อมูล (จากหนังสือเรียนเทคโนโลยี วิทยาการคำนวณ ม.5)