เก็บรวบรวมข้อมูลทุติยภูมิตามวัตถุประสงค์
เลือกแหล่งข้อมูลสาธารณะที่เชื่อถือได้
จัดเตรียมข้อมูลก่อนการประมวลผล
สำรวจข้อมูลเพื่อทำความเข้าใจรูปแบบ ความสัมพันธ์ และผลลัพธ์เชิงพรรณนาเบื้องต้น
ตระหนักถึงการนำข้อมูลส่วนบุคคลมาใช้งาน
3. การเชื่อมโยงข้อมูล (combining data) การเชื่อมโยงข้อมูลจากหลายแหล่งโดยใช้แอตทริบิวต์เดียวกันในการเชื่อม
ข้อมูลเป็นสิ่งที่มีมูลค่ามหาศาล ในยุคปัจจุบันจึงการนำข้อมูลมาวิเคราะห์หรือประมวลผลให้เกิดประโยชน์กับบุคคลหรือองค์กร แต่การให้ได้มาซึ่งข้อมูลที่เป็นประโยชน์นั้น กระบวนการในการเก็บรวบรวมข้อมูล และจัดการกับข้อมูลนับว่ามีความสำคัญ ผู้เรียนต้องกำหนดเป้าหมายให้ชัดเจนว่า จะนำข้อมูลที่รวบรวมได้ไปใช้ในเรื่องใด ใช้วิธีการใดในการจัดการข้อมูลเพื่อให้ได้ผลลัพธ์ตามที่ต้องการ โดยกระบวนการเก็บรวบรวมและจัดการกับข้อมูล ได้แก่
ขั้นตอนที่หนึ่ง ตั้งคำถามในสิ่งที่สนใจที่ต้องการตรวจสอบ
ขั้นตอนที่สอง ดำเนินการเก็บรวบรวมข้อมูล
ขั้นตอนที่สาม การจัดการกับข้อมูลให้อยู่ในรูปแบบที่พร้อมสำหรับการประมวลผล
ขั้นตอนที่หนึ่ง ก่อนที่จะรวบรวมข้อมูลต้องมีการคั้งคำถามที่มีความหมาย คำถามนี้จะเป็นตัวขับเคลื่อน แสวงหาคำตอบ ตรวจสอบ เช่ย รายได้จากการท่องเที่ยวเดือนใดมีรายได้มากที่สุด
ข้อมูลแบ่งตามประเภท
ข้อมูลเชิงคุณภาพ เช่น เพศ วันเดือนปีเกิด ชชนิดสินค้า หมายเลขโทรศัพท์
ข้อมูลเชิงปริมาณ หมายถึง ข้อมูลที่แสดงปริมาณ เช่น จำนวนหนังสือในห้องสมุด จำนวนนักเรียน
ข้อมูลแบ่งตามลักษณะแหล่งที่มา
1. ข้อมูลปฐมภูมิ (primary data) คือ ข้อมูลที่ได้จากแหล่งกำเนิดข้อมูลหรือจุดเริ่มต้นของข้อมูล เช่น ข้อมูลที่ได้จากการทดลอง การค้นพบทางวิทยาศาสตร์ ข้อมูลความสำเร็จ เหตุการณ์ทางประวัติศาสตร์ ภูมิปัญญา ข้อมูลสถานการณ์ทางการเมือง ความคิดเห็นของผู้เชี่ยวชาญ ข้อมูลปฐมภูมิเป็นข้อมูลที่เกิดขึ้นจากการกระทำหรือการจดบันทึกของผู้มีส่วนร่วมในเรื่องราวหรือเหตุการณ์เหล่านั้น ข้อมูลปฐมภูมินำเสนอรายละเอียดที่เป็นมุมมองของเหตุการณ์ที่เกิดขึ้น สาระสำคัญ บุคคล และสถานที่
2. ข้อมูลทุติยภูมิ (secondary data) คือ ข้อมูลที่ไม่ได้มาจากแหล่งกำเนิดโดยตรง แต่ได้มาจากการอ้างอิงถึงข้อมูลปฐมภูมิ หรือนำข้อมูลปฐมภูมิมาวิเคราะห์ ประมวลผล
ซึ่งอาจอยู่ในรูปสถิติ บทวิจารณ์ บทความ เอกสารต่าง ๆ เป็นต้น
ขั้นตอนที่สอง การเก็บรวบรวมข้อมูล
💗 ไฟล์ นามสกุล xls, xlsx, odp เป็นไฟล์ที่ได้จากโปรแกรมตารางการทำงาน (เช่น microsoft excel , google sheets เป็นต้น ) หรือ นามสกุล csv เป็นไฟล์แบบข้อความ ไฟล์เหล่านี้สามารถ download มาใช้ได้โดยไม่ต้องเขียนโปรแกรมเพิ่มเติม ส่วนไฟล์ pdf จะนำข้อมูลมาใช้ต่อยาก
💗 รายงาน หรือ การบนเว็บไซต์ จะเป็นข้อมูลที่ผ่านการสรุปมาแล้ว ไม่มีข้อมูลดิบ ทำให้ยากในการนำข้อมูลไปวิเคราะห์ในประเด็นอื่น
เพิ่มเติ่ม แหล่งข้อมูลทุติยภูมิ สามารถค้นหาข้อมูลเกี่ยวกับรายได้ประชากรของประเทศไทย อาจเริ่มจากการค้นข้อมูลดิบจาก data.go.th ไฟล์ที่ download มีทั้งรูปแบบ xls และ csv
ความเหมาะสมของแหล่งข้อมูล
Ⅰ ความทันสมัยของข้อมูล (currency) ตรวจสอบว่า ข้อมูล ✔เผยแพร่เมื่อใด ✔มีการแก้ไขปรับปรุงเมื่อใด
Ⅱ ความสอดคล้องกับการใช้งาน (relevance) ✔เกี่ยวข้องกับปัญหาที่ต้องการหรือไม่
Ⅲ ความน่าเชื่อถือของแหล่งข้อมูล (authority) ✔พิจารณาความน่าเชื่อถือแหล่งข้อมูล ✔มีหน่วยงาน/ชื่อคนที่สามารถอ้างอิงได้ ✔ใช้งานข้อมูลเชื่อถือได้หรือไม่
Ⅳ ความถูกต้องแม่นยำ (accuracy) ✔ความถูกต้องพื้นฐานของข้อมูล ✔สักแต่หาข้อมูลไปอ้างอิงทั่วไปหรือไม่
Ⅴ จุดมุ่งหมายของแหล่งข้อมูล (purpose) ✔ข้อมูลถูกใช้เพาะเจาะเพื่อเป้าหมายใด
ขั้นตอนที่สาม การเตรียมข้อมูล
เมื่อเลือกแหล่งข้อมูลและรวบรวมข้อมูลได้แล้ว ก็จะเริ่มการเตรีมข้อมูล คือ เตรียมความพร้อมของข้อมูลก่อนจะไปประมวลผล ทำได้โดย
การทำความสะอาดข้อมูล (data cleansing) บางครั้งข้อมูลที่รวบรวมมาไม่สมบูรณ์ต้องพิจารณาสิ่งเหล่านี้
🔹 ค่าว่าง – ข้อมูลที่ไม่มีการกรอกค่าใด ๆ หรือช่องข้อมูลว่างเปล่า อาจเกิดจากการละเลยหรือข้อมูลไม่พร้อมใช้งาน
🔹 คำอยู่นอกขอบเขต – ข้อมูลที่ไม่อยู่ในช่วงหรือรูปแบบที่กำหนดไว้ เช่น ระดับคะแนนเกินช่วงที่กำหนด
🔹 หน่วยนับผิด – ใช้หน่วยนับไม่ตรงกัน เช่น กิโลกรัม กับ กรัม หรือ บาท กับ ดอลลาร์
🔹 ค่าผิดปกติ – ข้อมูลที่เบี่ยงเบนจากค่าปกติมากเกินไป เช่น อายุ 200 ปี หรือรายได้ 0.01 บาท
🔹 พิมพ์ผิด – การสะกดคำผิด ตัวอักษรตกหล่น หรือการใส่อักขระไม่เหมาะสม เช่น “นครราชสีม่า” แทน “นครราชสีมา”
การแปลงข้อมูล (data transformation) เตรียมข้อมูลให้อยู่ในรูปแบบที่พร้อมสำหรับการประมวลผล ทำได้โดย
🔹 ลดจำนวนข้อมูล - เลือกเฉพาะข้อมูลที่สนใจ
🔹 เพิ่มจำนวนข้อมุล - จัดระเบียบข้อมูลให้ง่ายต่อการนำไปใช้
🔹 รวมข้อมูล - จัดกลุ่มข้อมูลที่มีความสอดคล้องกัน
เพิ่มเติม แอตทริบิวต์ (ATTRIBUTE) คือ คุณลักษณะเฉพาะที่ระบุคุณสมบุติ เช่น
3. การเชื่อมโยงข้อมูล (combining data) การเชื่อมโยงข้อมูลจากหลายแหล่งโดยใช้แอตทริบิวต์เดียวกันในการเชื่อม
ใบกิจกรรรมที่ 3 สำรวจข้อมูล
ครูผู้สอน : นายวงศ์สถิตย์ พริกสี
กลุ่มสาระการเรียนรู้วิทยาศาสตร์และเทคโนโลยี
โรงเรียนหนองกรดพิทยาคม