วิทยาการข้อมูล (Data Science) เป็นการศึกษาถึงกระบวนการ วิธีการ หรือเทคนิค ที่นำข้อมูลจำนวนมหาศาล มาประมวลผล เพื่อให้ได้องค์ความรู้ เข้าใจปรากฏการณ์ สามารถตีความ ทำนายหรือพยากรณ์หารูปแบบหรือแนวโน้มจากข้อมูล เพื่อนำมาวิเคราะห์ต่อยอดและแนะนำทางเลือกที่เหมาะสมในการตัดสินใจ กระบวนการวิทยาการข้อมูลประกอบด้วย การตั้งคำถาม การเก็บรวบรวมข้อมูล การสำรวจข้อมูลการวิเคราะห์ข้อมูล การสื่อสารและเผยแพร่ข้อมูลสู่ผู้ใช้กลุ่มเป้าหมาย
การวิเคราะห์ข้อมูล เป็นการดำเนินการกับข้อมูล เพื่อให้เกิดความเข้าใจข้อมูลเชิงลึกในสิ่งที่สนใจศึกษา โดยผลลัพธ์ของการวิเคราะห์ข้อมูลสามารถนำไปประกอบการตัดสินใจเพื่อให้เกิดประโยชน์สูงสุดต่อการดำเนินการของบุคคลหรือองค์กร
การค้นหาข้อมูลการค้นคำ เราสามารถใช้ Google Trends ในการกรอกข้อมูลเพื่อค้นหาและแสดงผลลัพธ์ของข้อมูลเป็นแผนภาพ หรือกราฟ ที่แสดงการเปรียบเทียบในด้านที่เราสนใจ
กิจกรรมสำรวจรอยเท้าหมี กิจกรรมส่งเสริมให้เข้าใจวิธีการเก็บข้อมูล การทำความสะอาดข้อมูล และการนำข้อมูลไปกำหนดจุดในรูปแบบของกราฟ
การวิเคราะห์เชิงทํานาย ดําเนินการต่อจากการวิเคราะห์เชิงพรรณนา หลังจากที่พบว่าข้อมูลมีความสัมพันธ์กัน โดยนําข้อมูลที่สัมพันธ์กันนั้น มาสร้างเป็นรูปแบบเพื่อการทํานาย หรือคาดการณ์สิ่งที่น่าจะเกิดขึ้นในอนาคต
การทำนายข้อมูลเชิงตัวเลข (numeric prediction) เป็นการใช้ข้อมูลในอดีตมาวิเคราะห์หาความสัมพันธ์ระหว่างชุดข้อมูลและสร้างแบบจำลองในการทำนายที่ให้ผลลัพธ์เป็นตัวเลข โดยทั่วไปมีวิธีการทำนาย 2 วิธีคือ การทำนายโดยใช้กราฟและการทำนายโดยใช้สมการเชิงเส้น
การนำข้อมูลที่ได้จากการกำหนดจุดลงบนกราฟ วิเคราะห์หาความสัมพันธ์ของข้อมูลสองชนิด แล้วสร้างเส้นแนวโน้ม เพื่อหาสมการเชิงเส้น ช่วยในการทำนายข้อมูล
การวิเคราะห์ความสัมพันธ์โดยการใช้โปรแกรม Microsoft Excel นั้น จำเป็นต้องนำข้อมูลที่เก็บรวบรวมได้ในรูปแบบของตาราง Microsoft Excel เพื่อนำไปวิเคราะห์โดยใช้เครื่องมือที่มีอยู่ในโปรแกรม
การทำนายเชิงหมวดหมู่ เป็นการทำนายข้อมูลที่สนใจที่ไม่ใช่ข้อมูลตัวเลข ซึ่งจะใช้ข้อมูลในอดีตที่มีการระบุหมวดหมู่มาแล้ว มาวิเคราะห์เพื่อทำนายข้อมูลชุดใหม่ที่ยังไม่ทราบหมวดหมู่ หนึ่งในเทคนิคที่ใช้ในการจัดหมวดหมู่ที่เป็นที่รู้จักกันดี คือวิธีการค้นหาเพื่อนบ้านใกล้เคียงที่สุด K ตัว (K-Nearest Neighbors: K-NN)
ตัวอย่างการจำแนกกลุ่มข้อมูล โดยใช้ Excel ด้วยวิธีการ K-NN (K- Nearest Neighbor) และการประเมินความถูกต้องในการจําแนกกลุ่มข้อมูลเพื่อทํานายผลในอนาคต เนื่องจากเป็นสิ่งสําคัญมาก เพราะหากผลการทํานายผิดพลาดอาจเกิดความเสียหายเมื่อนํา ไปใช้จริง ซึ่งการประเมินความถูกต้องควรนําไปทดสอบกับชุดข้อมูลที่ทราบคําตอบอยู่แล้ว ซึ่งมักเป็นข้อมูลชุดเดียวกันกับข้อมูลตั้งต้น แต่ถูกแยกไว้เฉพาะเพื่อการประเมิน
ข้อมูลสภาพอากาศ เพื่อใช้ในการพยากรณ์ด้วย K-NN ทดลองทำนายข้อมูลด้วย K-NN และประเมินความถูกต้องในการจำแนกข้อมูล โดยฝึกปฏิบัติด้วยโปรแกรม Microsoft Excel
การทำข้อมูลให้เป็นภาพ (Data Visualization) เป็นการนำข้อมูลมาจัดทำเป็นแผนภาพ แผนภูมิ หรือกราฟ เพื่อช่วยในการตอบคำถาม ช่วยในการตัดสินใจ ช่วยให้มองเห็นบริบทของข้อมูล รวมทั้งช่วยเล่าเรื่องที่อยู่ในข้อมูลชุดนั้น
กิจกรรมการทำข้อมูลให้เป็นภาพ โดยการใช้ข้อมูล Covid-19 จากแหล่งข้อมูลทุติยภูมิ มาทำการสำรวจข้อมูล ทำความสะอาดข้อมูล และจัดทำเป็นภาพ เพื่อนำเสนอข้อมูลผู้ติดเชื้อ Covid-19 ในประเทศไทยตามบริบทของข้อมูล ด้วยโปรแกรม Microsoft Excel
ทดลองฝึกปฏิบัติการทำข้อมูลให้เป็นภาพ โดยดาวน์โหลดไฟล์ ข้อมูล covid-19 จากเว็บไซต์ data.go.th