หลังจากที่นักเรียนได้รวบรวมข้อมูล และเตรียมข้อมูลมาแล้ว ขั้นตอนต่อไป คือ การวิเคราะห์ข้อมูลซึ่งช่วยให้นักเรียนมีความเข้าใจเชิงลึกเกี่ยวกับข้อมูล เช่น ความสัมพันธ์ รูปแบบ และแนวโน้ม ที่จะสามารถนำไปประกอบการตัดสินใจ ตอบคำถาม หรือตอบสมมติฐานที่ตั้งไว้ จึงกล่าวได้ว่าการวิเคราะห์ของมูลเป็นการเปลี่ยนของมูลให้มีคุณค่า
การวิเคราะห์ข้อมูลมี 3 ประเภท ดังนี้
1. การวิเคราะห์เชิงพรรณนา
2.การวิเคราะห์เชิงทำนาย
3.การวิเคราะห์เชิงแนะนำ
การวิเคราะห์เชิงพรรณนาเป็นรูปแบบพื้นฐานของการวิเคราะห์ข้อมูลเพื่ออธิบายลักษณะของข้อมูลที่เก็บรวบรวมโดยใช้งานคำนวณทางคณิตศาสตร์และสถิติพื้นฐาน
1.1 การหาสัดส่วนหรือร้อยละ
ในการหาความสัมพันธ์ระหว่างข้อมูลต่าง ๆ หรือการจัดกระทำกับข้อมูลต่าง ๆ ที่รวบรวมได้อยู่ในลักษณะที่เป็นค่าของอัตราส่วน สัดส่วน และเปอร์เซ็นต์ เพื่อที่จะใช้ในการเปรียบเทียบและสรุปผลทางสถิติได้ง่ายและสะดวกที่จะนำไปใช้ต่อไป
สัดส่วน (Proportion)
คือ ความสัมพันธ์ของจำนวนย่อยกับจำนวนรวมทั้งหมด กล่าวคือ ให้ถือจำนวนรวมทั้งหมดเป็น 1 ส่วน เช่น ในการสำรวจคนในหมู่บ้านหนึ่งจำนวน 800 คน เป็นหญิง 300 คน ดังนั้นสัดส่วนของผู้หญิงในหมู่บ้านคือ 300/800= 0.37
และสัดส่วนของผู้ชายคือ 500/800หรือ 1 - 0.37 = 0.63 เป็นต้น
อัตราร้อยละหรือเปอร์เซนต์ (Percentage or Percent) คือ สัดส่วน เมื่อเทียบต่อ 100 การคำนวณก็ทำได้ง่าย โดยเอา 100 ไปคูณสัดส่วนที่ต้องการหาผลลัพธ์ก็จะออกมาเป็นร้อยละ หรือเปอร์เซนต์
ตัวอย่าง ในโรงพยาบาลแห่งหนึ่ง มีคนไข้อยู่ 750 คน แยกเป็นคนไข้ประเภทต่าง ๆ ดังนี้ คนไข้ โรคทรวงอก 180 คน คนไข้ระบบทางเดินอาหาร 154 คน คนไข้ระบบประสาท 145 คน คนไข้ โรคตา หู คอ จมูก 112 คน ที่เหลือเป็นคนไข้โรคอื่น ๆ 159 คน เราจะหาร้อยละหรือเปอร์เซนต์ของคนไข้ประเภทต่าง ๆ ได้ดังนี้
1.2.การวัดค่ากลางของข้อมูล
ใช้เพื่อหาค่าที่เป็นตัวแทนของข้อมูลทั้งหมด เช่น ค่าเฉลี่ย ค่ามัธยฐาน ค่าฐานนิยม
1.2.1 ค่าเฉลี่ย (Average, Mean) หมายถึง ค่าเฉลี่ยซึ่งเกิดจากข้อมูลของผลรวมทั้งหมดหารด้วยจำนวนรายการของข้อมูล เช่น การวัดส่วนสูงของผู้เข้ารับการอบรมสถิติ จำนวน 20 คน สำหรับส่วนสูงของผู้เข้ารับการอบรม 20 คน ที่วัดได้เป็นเซ็นติเมตร มีดังนี
1.2.2 ค่ามัธยฐาน
มัธยฐาน (Median) มัธยฐาน คือ ค่าที่มีตำแหน่งอยู่กึ่งกลางของข้อมูลทั้งหมด เมื่อเรียบเรียงข้อมูลจากต่าน้อยที่สุดไปหาค่าที่มากที่สุด หรือจากค่าที่มากที่สุดไปหาค่าที่น้อยที่สุด เราอาจใช้ตัวย่อ "Med" แทนค่ามัธยฐานของข้อมูล
1.2.3 ค่าฐานนิยม
ฐานนิยม คือ ค่ากลางที่มีจำนวนมากที่สุด
หลักการในการหาฐานนิยม คือ หาตัวที่ซ้ำกันมากที่สุด และมีเงื่อนไขว่าในข้อมูลแต่ละชุดจะมีฐานนิยมได้อย่างมาก
2
ตัวเท่านั้น ถ้ามีมากกว่านั้นให้ถือว่าไม่มีฐานนิยม
ให้มองหาข้อมูลที่มีการซ้ำกันมากที่สุด เช่น ข้อมูลไม่แจกแจงความถี่ คือ
2,3,4,5,6,4,7,6,6
จะเห็นว่าในข้อมูลชุดนี้มี 6อยู่ 3 ตัว ซึ่งเป็นจำนวนตัวที่มากที่สุดแล้วเมื่อเทียบกับตัวเลขอื่น ๆ ดังนั้น ฐานนิยมของข้อมูลชุดนี้คือ 6
ข้อมูลชุดที่ 1คือ
3,5,6,6,6,7,10,2
จะได้ว่าฐานนิยมคือ 6
ข้อมูลชุดที่ 2 คือ
2,5,5,8,9,10,11,8
จะได้ว่าฐานนิยมของข้อมูลชุดนี้มี 2 ค่า คือ และ 5 และ 8
เนื่องจากข้อมูลทั้งสองค่ามีจำนวน 2 ตัวเท่ากันและข้อมูลค่าอื่น ๆ มีเพียงตัวเดียว
ข้อมูลชุดที่ 3 คือ
1,1,1,2,3,3,3,5,6,6,6,7
จะได้ว่าข้อมูลชุดนี้จำนวนตัวที่ซ้ำมากที่สุดคือ 3 ตัว ซึ่งมีข้อมูลถึงสามค่าในชุดนี้ที่ซ้ำกัน 3 ตัว นั้นคือ 1,3 และ 6 ดังนั้นข้อมูลชุดนี้ถือว่าไม่มีฐานนิยม
1.3.การหารความสัมพันธ์ของข้อมูล การวิเคราะห์ความสัมพันธ์เชิงเส้นระหว่างข้อมูล 2 ชุดซึ่งบ่งบอกถึงทิศทางและความสัมพันธ์
เครื่องมือที่ช่วยวิเคราะห์ความสัมพันธ์ของข้อมูล เช่น
โปรแกรม excel
ภาษา R
ภาษาไพธอน
วิดีโอ เกี่ยวกับ การวิเคราะห์ข้อมูล ตอนที่ 1