1.3 กระบวนการวิทยาการข้อมูล (DATA SCIENCE PROCESS)
ใช้เวลาเรียน 1 คาบเรียน
ใช้เวลาเรียน 1 คาบเรียน
คำถาม
วันนี้ขอหนึ่งคำถาม ถามอะไรก็ได้ที่คิด วิเคราะห์แล้ว เป็นสิ่งที่เป็นประโยชน์ต่อตนเองหรือสังคม ลองพูดดูซิ
อาชีพที่เราคิดจะทำในอนาคตคืออะไร อาชีพนั้นมีภาระหน้าที่อะไรบ้าง แล้วทำอาชีพนั้นทำไม
เรามีจุดเด่นอะไร และจุดด้อยของเราคืออะไร
เราจะทำอย่างไรให้ครอบครัวของเราดีกว่าปัจจุบันนี้
ปัจจุบันนี้ เวลานี้ ขณะนี้เราทำดีที่สุดหรือยัง
สาระสำคัญ
การเพิ่มมูลค่าให้กับผลิตภัณฑ์หรือบริการด้วยข้อมูลนั้น นอกจากจะต้องมีความเข้าใจเกี่ยวกับผลิตภัณฑ์หรือบริการแล้ว นักเรียนยังต้องเข้าใจกิจกรรมต่าง ๆ ที่เกี่ยวกับการจัดหาและประมวลผลข้อมูลอีกด้วย เนื่องจากกิจกรรมที่ต้องทำค่อนข้างหลากหลาย เพื่อไม่ให้สับสนหรือพลาดประเด็นใดไป นักเรียนสามารถดำเนินการตามกระบวนการของวิทยากรข้อมูลที่ระบุขั้นตอนสำคัญต่างๆ ที่ประกอบด้วย การตั้งคำถาม การเก็บรวบรวมข้อมูล การสำรวจข้อมูล การวิเคราะห์ข้อมูล การสื่อสารและการทำผลลัพธ์ให้เป็นภาพสู่ผู้ใช้กลุ่มเป้าหมาย
กระบวนการวิทยาการข้อมูล (data science process) คือขั้นตอนหรือวิธีการที่ผู้ปฏิบัติงานวิทยาการข้อมูล (data scientist) ใช้ในการดำเนินงานจากข้อมูลดิบ (raw data) ไปจนถึงการนำเสนอผลลัพธ์หรือข้อมูลเชิงลึก (insight) ที่มีคุณค่าและสามารถนำไปใช้ประโยชน์ได้จริง
จุดประสงค์
1. อธิบายกระบวนการวิทยาการข้อมูล
2. ตระหนักถึงความสำคัญของข้อมูล ประโยชน์หรือคุณค่าของข้อมูล
ตั้งคำถามที่ตนเองสนใจ ? อะไร(What) ที่ไหน(Where) เมื่อไร(When) ทำไม(Why) ใคร(Who) อย่างไร(How) เป็นต้น
ต้องคำนึงถึงว่าจะเก็บข้อมูลเรื่องอะไร จากที่ไหน จำนวนเท่าใด และความน่าเชื่อถือของแหล่งข้อมูล ข้อมูลที่เก็บรวบรวมได้จะต้องทำการตรวจสอบ ขจัดข้อมูลที่ผิด หรือข้อมูลที่ไม่สมบูรณ์ เพื่อให้ได้ข้อมูลนำเข้าที่ดี ไปสู่ผลลัพธ์ที่ดี เหมือนกับประโยคที่ว่า "garbage in garbage out"
เป็นการทำความเข้าใจรูปแบบ และค่าของข้อมูล ในขั้นตอนนี้เราจะต้องรวบรวมข้อมูล แล้วนำข้อมูลที่รวบรวมมาพล็อต (plot) ทำให้เป็นภาพ (visualizations) หรือแผนภูมิ (charts) เพื่อให้มองเห็นความหมายที่ซ่อนเร้นอยู่ของข้อมูลผ่านกราฟ ซึ่งอาจพบความผิดปกติของข้อมูลได้
การวิเคราะห์ข้อมูล เป็นการดำเนินการกับข้อมูล เพื่อให้เกิดความเข้าใจข้อมูลเชิงลึกในสิ่งที่สนใจศึกษา โดยผลลัพธ์ของการวิเคราะห์ข้อมูลสามารถนำไปประกอบการตัดสินใจเพื่อให้เกิดประโยชน์สูงสุดต่อการดำเนินการของบุคคลหรือองค์กร
เป็นการสื่อสารผลลัพธ์ของข้อมูล โดยการถ่ายทอดเป็นเรื่องราว หรือเป็นภาพให้ผู้อื่นเข้าใจว่าเราได้เรียนรู้อะไรจากข้อมูล
ทดลองเข้าเว็บไซต์ http://agri-map-online.moac.go.th เพื่อสำรวจบริเวณพื้นที่ที่เป็นภูมิลำเนาของนักเรียน หรือเลือกพื้นที่ที่สนใจว่าเหมาะสำหรับทำการเกษตร เพาะปลูก หรือเลี้ยงสัตว์ชนิดใด พร้อมทั้งอธิบายเหตุผลประกอบ
ทดลองเข้าเว็บไซต์ https://resourcetrade.earth/ เพื่อหาความสัมพันธ์ของการค้าระหว่างประเทศในโลก ให้ตั้งคำถามและหาคำตอบจากข้อมูลบนเว็บไซต์ และอธิบายให้เพื่อนฟังจากข้อมูลที่ค้นพบ เช่น ประเทศไทยส่งสินค้าออกไปประเทศใดบ้าง เป็นต้น
กิจกรรมที่ 1.3 กระบวนการวิทยาการข้อมูล
เมื่อนักเรียนศึกษาจบเนื้อหาในหัวข้อที่ 1.3 กระบวนการวิทยาการข้อมูล แล้วให้ตอบคำถาม
1. กระบวนการวิทยาการข้อมูล มีศัพท์ภาษาอังกฤษว่าอย่างไร
2. กระบวนการวิทยาการข้อมูล มีขั้นตอนที่สำคัญอยู่กี่ขั้นตอน อะไรบ้าง
3. "เป็นการทำความเข้าใจรูปแบบ และค่าของข้อมูล" ข้อความนี้อยู่ขั้นตอนใดของกระบวนการวิทยาการข้อมูล
4. เมื่อเราทำการสำรวจข้อมูลเรียบร้อยแล้ว ขั้นตอนต่อไปเป็นขั้นตอนใดของกระบวนการวิทยาการข้อมูล
5. "เพื่อให้เกิดความเข้าใจข้อมูลเชิงลึกในสิ่งที่สนใจศึกษา" ข้อความนี้อยู่ขั้นตอนใดของกระบวนการวิทยาการข้อมูล
“โรงเรียนแห่งหนึ่งต้องการศึกษาพฤติกรรมของนักเรียนในแต่ละวัน โดยเก็บข้อมูลการทำกิจกรรมต่าง ๆ ได้แก่จำนวนข้อความที่ส่งหาเพื่อน เวลาที่ใช้ในการทำกิจกรรมกับเพื่อน เวลาการทำการบ้าน จำนวนข้อความที่ได้รับจากเพื่อน เป็นเวลา 1 สัปดาห์” จากสถานการณ์นี้ให้ตอบคำถามข้อที่ 6 - 9
ตารางการใช้เวลาของนักเรียน
6. นักเรียนสามารถตั้งคำถามหรือสมมติฐานอะไรได้บ้าง จากข้อมูลที่มีอยู่ (เช่น เวลาที่ใช้ในการทำกิจกรรมกับเพื่อนในแต่ละวัน ทำให้จำนวนข้อความที่ส่งหาเพื่อนเพิ่มขึ้นหรือลดลงหรือไม่)
ตอบ ....
7. จากตารางการใช้เวลาของนักเรียน นักเรียนพบสิ่งที่ผิดปกติในชุดข้อมูลดังกล่าวหรือไม่ อย่างไร
ตอบ ....
8. นักเรียนคิดว่าเวลาที่ใช้ในการทำการบ้านของนักเรียนสัมพันธ์กับข้อมูลใด อย่างไร
ตอบ ....
9. เพื่อตรวจสอบความสัมพันธ์ของข้อมูลทั้ง 2 ชุดในข้อ 8 ให้นักเรียนพล็อตจุด (x,y) ลงในตารางกราฟ โดยใช้แกน y แทนเวลาที่ใช้ในการทำการบ้าน และแกน x แทนข้อมูลที่นักเรียนเลือกในข้อ 8
ตอบ ....
10. ข้อใด ไม่ใช่ ประเด็นที่ใช้พิจารณาเพื่อออกแบบการเก็บรวบรวมข้อมูลในการตัดสินใจให้มีประสิทธิภาพ
(วิธีเก็บข้อมูล แหล่งข้อมูล งบประมาณที่ใช้ เครื่องมือเก็บข้อมูล)