"การวิเคราะห์ข้อมูลที่รวบรวมได้นั้นจำเป็นอย่างยิ่งที่ต้องอยู่บนพื้นฐานของจริยธรรม เพื่อความถูกต้องและเกิดประโยชน์กับทุกฝ่ายที่เกี่ยวข้อง"
"การวิเคราะห์ข้อมูลที่รวบรวมได้นั้นจำเป็นอย่างยิ่งที่ต้องอยู่บนพื้นฐานของจริยธรรม เพื่อความถูกต้องและเกิดประโยชน์กับทุกฝ่ายที่เกี่ยวข้อง"
การนำข้อมูลมาใช้ในการแก้ปัญหา
1. การนิยามปัญหา (problem definition) หมายถึง การตั้งคำถามที่สนใจและต้องการหาคำตอบ
2. การวิเคราะห์ปัญหา (problem analysis) หมายถึง การทำความเข้าใจปัญหาเพื่อกำหนดสาระสำคัญของปัญหาและข้อมูลที่เกี่ยวข้อง
2.1 กำหนดข้อมูลหลักที่ใช้ในการประมวลผลเพื่อหาคำตอบ
2.2 กำหนดปริมาณข้อมูลที่ต้องรวบรวม ให้มีปริมาณที่เพียงพอและเหมาะสมกับการนำไปหาข้อสรุป
2.3 กำหนดกรอบเวลาในการรวบรวมข้อมูล
2.4 กำหนดชนิดของข้อมูล รูปแบบข้อมูล หน่วยของข้อมูล
3. การรวบรวมข้อมูล (data collection) หมายถึง การได้มาซึ่งข้อมูลที่ถูกต้อง ครบถ้วน และจำเป็นต่อการแก้ปัญหา
3.1 ขั้นตอนในการรวบรวมข้อมูล
1) กำหนดแหล่งข้อมูล
2) กำหนดวิธีการรวบรวมข้อมูล
3) กำหนดวิธีการจัดเก็บข้อมูลที่รวบรวมได้
3.2 วิธีการรวบรวมข้อมูล
1) การสังเกต
2) การสำรวจ/สอบถาม
3) การสัมภาษณ์
4) การสนทนากลุ่ม
4. การเตรียมข้อมูล (data preparation) หมายถึง การดำเนินการกับข้อมูลที่รวบรวมมา เพื่อให้เป็นข้อมูลที่มีคุณภาพ พร้อมนำไปประมวลผล
ข้อมูลบางส่วนที่ได้จากการรวบรวมอาจยังไม่สามารถนำไปประมวลผลได้ในทันทีจำเป็นต้องทำความสะอาดข้อมูล (data cleansing) ก่อน เช่น ข้อมูลมีความซ้ำซ้อน มีค่าหรือลักษณะที่ผิดปกติจากข้อมูลอื่น หรือมีรายการข้อมูลที่ขาดหายไปการทำความสะอาดข้อมูลเป็นกระบวนการปรับปรุง/แก้ไขข้อมูล โดยคำนึงถึงลักษณะของข้อมูลและวิธีการประมวลผล
แนวทางการตรวจสอบความผิดปกติของข้อมูลเพื่อทำความสะอาดข้อมูล มีดังนี้
1. ความสมบูรณ์ (validity) ข้อมูลที่รวบรวมมีความถูกต้องตามข้อกำหนด
2. รูปแบบเดียวกัน (uniformity) ข้อมูลเรื่องเดียวกันต้องเก็บอยู่ในรูปแบบเดียวกัน
3. ความครบถ้วน (completeness) ข้อมูลที่เกี่ยวข้องต้องถูกรวบรวมอย่างครบถ้วน
4. ความทันสมัย (timeliness) ข้อมูลมีค่าที่สอดคล้องกับเวลา และ/หรือสถานการณ์
5. การประมวลผลข้อมูล (data processing) หมายถึง การดำเนินการกับข้อมูลเพื่อให้ได้สารสนเทศตามวัตถุประสงค์ โดยอาจได้ข้อค้นพบอื่นที่มีความหมายซ่อนอยู่ นำไปสู่ข้อสรุปที่สอดคล้องกับปัญหาที่กำหนด หรือนำไปใช้ประโยชน์ได้
5.1 การวิเคราะห์เชิงพรรณนา (descriptive analysis) เป็นการวิเคราะห์ข้อมูลเพื่ออธิบายคุณลักษณะของชุดข้อมูลที่สนใจ โดยใช้ค่าสถิติ เช่น
1) ค่าเฉลี่ย (mean) คือ ค่าเฉลี่ยเลขคณิตของชุดข้อมูล
2) มัธยฐาน (median) คือ ค่าที่อยู่ตรงกึ่งกลางของชุดข้อมูล ซึ่งแบ่งชุดข้อมูลออกเป็นสองส่วน แต่ละส่วนมีจำนวนเท่า ๆ กัน
3) ฐานนิยม (mode) คือ ค่าที่มีความถี่สูงสุดของชุดข้อมูล
4) ร้อยละ (percentage) คือ ค่าของข้อมูลเมื่อคิดเป็นสัดส่วนจากทั้งหมด จำนวนข้อมูลที่สนใจ สัดส่วนของความถี่ข้อมูลที่สนใจ ปริมาณของข้อมูลที่สนใจเมื่อเทียบกับปริมาณข้อมูลทั้งหมดที่คิดเป็น 100%
5) ความถี่ (frequency) คือ จำนวนซ้ำของแต่ละข้อมูลในชุดข้อมูล
6) พิสัย (range) คือ ความแตกต่างระหว่างค่าขอบเขตบน (ค่าสูงสุด) และค่าขอบเขตล่าง (ค่าต่ำสุด) ของชุดข้อมูล
5.2 การวิเคราะห์ข้อมูลเชิงอนุมาน (inferential analysis) ตัวอย่างการนำไปใช้ เช่น ต้องการรู้จำนวนเงินที่นักเรียนแต่ละคนได้รับจากผู้ปกครองในแต่ละวัน โดยสุ่มตัวอย่างจากนักเรียนบางส่วน เพื่อนำไปอนุมานเป็นข้อมูลของนักเรียนทั้งโรงเรียน
5.3 การวิเคราะห์เชิงทำนาย (predictive analysis) ตัวอย่างการนำไปใช้ เช่น วิเคราะห์พฤติกรรมการซื้อสินค้าเพื่อแนะนำสินค้าที่คาดว่าลูกค้าจะซื้อ วิเคราะห์เพื่อจัดนักเรียนออกเป็นกลุ่มที่เหมาะสมเพื่อเลือกสถานที่ทัศนศึกษาให้เหมาะกับนักเรียนแต่ละกลุ่ม วิเคราะห์พฤติกรรมการใช้งาน
สมาร์ตโฟนเพื่อแนะนำโปรโมชันที่เหมาะสม
5.4 การวิเคราะห์เชิงปัญญา (cognitive analysis) นำไปใช้เพื่อวิเคราะห์ข้อมูลขนาดใหญ่ และหลากหลายรูปแบบเพื่อนำมาใช้ออกแบบให้คอมพิวเตอร์สามารถช่วยมนุษย์ในการทำงานและตัดสินใจได้อย่างถูกต้องแม่นยำและมีประสิทธิภาพ เช่น การพัฒนารถยนต์ไร้คนขับการวิเคราะห์ข้อมูลสุขภาพเพื่อช่วยแพทย์ในการหาสาเหตุและวิธีการรักษา รวมถึงแนวโน้มในการเกิดโรคร้ายที่จะเกิดขึ้นในอนาคต ช่วยนักกฎหมายในการพิจารณาคดีความต่าง ๆ
6. การนำเสนอข้อมูล (data presentation) หมายถึง การนำเสนอข้อสรุปจากการประมวลผลในรูปแบบที่สื่อความหมายอย่างชัดเจน
สรุป
ปัญหาหรือสิ่งที่สนใจล้วนมีข้อมูลเป็นองค์ประกอบสำคัญ เมื่อได้มีการนิยามปัญหาและวิเคราะห์ปัญหาเรียบร้อยแล้ว การนำข้อมูลมาช่วยแก้ปัญหาจะเริ่มต้นจากการรวบรวมข้อมูลให้ได้ข้อมูลที่ถูกต้อง ครบถ้วนการเตรียมข้อมูลให้เป็นข้อมูลที่มีคุณภาพอยู่ในรูปแบบที่สอดคล้องกับวิธีการประมวลผลข้อมูล โดยเลือกวิธีการวิเคราะห์ข้อมูลที่จะนำไปสู่คำตอบของปัญหาหรือเป็นประโยชน์ในการแก้ปัญหา และการนำเสนอข้อมูลในรูปแบบที่น่าสนใจ สื่อความหมายชัดเจนเข้าใจง่าย จะเห็นได้ว่าข้อมูลเป็นสิ่งที่มีคุณค่ามีความหมายซ่อนอยู่ภายในด้วยตัวข้อมูลเอง หรือเมื่อมีการสร้างความสัมพันธ์กับข้อมูลอื่น ๆ ข้อมูลเป็นพื้นฐานสำคัญในการตัดสินใจของบุคคล สังคมองค์กรและประเทศโดยคำนึงถึงจริยธรรม และประโยชน์ที่จะเกิดขึ้นกับทุกฝ่ายที่เกี่ยวข้อง