ห้องเรียนวิชา วิทยาการคำนวณ ม.5
ห้องเรียนวิชา วิทยาการคำนวณ ม.5
หน่วยการเรียนรู้ที่ 1 วิทยาการข้อมูลในยุคสารสนเทศ
ยุคของข้อมูลสารสนเทศ
ข้อมูลที่เกิดขึ้นมีจำนวนมากมาย มนุษย์มีความพยายามในการเก็บข้อมูลเพื่อสื่อความหมายเล่าเรื่องราวที่ได้เกิดในอดีต เพื่อให้คนรุ่นหลังได้รับรู้เรื่องราวที่สำคัญ โดยคิดค้นเทคโนโลยีในการบันทึกข้อมูลในแต่ละยุค การบันทึกด้วยการสลักบนแผ่นหินทราย บนแผ่นดินเหนียว บันทึกบนหลักศิลาจารึก แม้แต่การคิดค้นดินสี เพื่อบันทึกข้อมูลโดยการใช้วิธีเขียนสีเล่าเรื่องราวผ่านผนังถ้ำเพื่อความคงทน จวบจนปัจจุบันอายุหลายร้อยปี โดยที่การเก็บข้อมูลดังกล่าวเป็นความพยายามในการบันทึกข้อมูลในยุคนั้น ๆ
1. การกำเนิดยุคของข้อมูลสารสนเทศ (Origin of the Information Age)
ยุคของข้อมูลสารสนเทศจึงเป็นช่วงเวลาในประวัติศาสตร์ของมนุษย์ที่มีแนวคิดในการเข้าถึงและต้องการควบคุมข้อมูลสารสนเทศด้วยการใช้เทคโนโลยีดิจิทัลอย่างกว้างขวางในการจัดเก็บ ประมวลผล และส่งข้อมูลสื่อสารแลกเปลี่ยนกัน
ถึงแม้เครื่องคอมพิวเตอร์ในยุคที่ 1 ได้ถูกพัฒนาในช่วง พ.ศ. 1946-1959 เครื่องคอมพิวเตอร์ยุคที่ 1 ยังใช้หลอดสุญญากาศเป็นวงจรอิเล็กทรอนิกส์ แต่ยังไม่สามารถขับเคลื่อนให้เกิดยุคของข้อมูลสารสนเทศได้ด้วยองค์ประกอบด้านความเร็ว ต้นทุนงบประมาณที่สูง จำเป็นต้องใช้ผู้เชี่ยวชาญเฉพาะทางในการใช้งานคอมพิวเตอร์ของยุคเริ่มต้น และจำนวนของเครื่องคอมพิวเตอร์ก็ไม่แพร่หลายมากเพียงพอที่จะเอื้อในการเก็บบันทึกข้อมูลสารสนเทศของแต่ละองค์กร
การถือกำเนิดยุคของข้อมูลสารสนเทศ หรือที่เรียกว่า ยุคคอมพิวเตอร์ ยุคดิจิทัล และยุคสื่อใหม่ เกิดขึ้นควบคู่กับการกำเนิดของคอมพิวเตอร์ส่วนบุคคลที่ใช้อย่างแพร่หลาย ในช่วงคอมพิวเตอร์ยุคที่ 5 ของ ค.ศ. 1981 ผนวกรวมกับนักวิจัยของ Nokia Bell Laboratories ได้นำเสนอบทความเผยแพร่ถึง การนำข้อมูลมาเข้ารหัสในเชิงปริมาณ เปลี่ยนเป็นชุดของค่าหนึ่งและศูนย์ได้ ซึ่งเป็นรูปแบบของสัญญาณดิจิทัล และยังแสดงให้เห็นว่าสื่อข้อมูลภาพ ข้อความ ข้อมูลเสียง สัญญาณโทรศัพท์ คลื่นวิทยุ ไปจนถึงโทรทัศน์ สามารถรับและส่งสัญญาณผ่านไปมาได้ โดยที่ไม่เกิดข้อผิดพลาดของการเข้ารหัสสัญญาณ ในรูปแบบดิจิทัลนี้ จึงถือเป็นจุดเริ่มต้นยุคของข้อมูลสารสนเทศ ที่เป็นยุคที่ทำให้เกิดการเปลี่ยนแปลงเทคโนโลยีในทุก ๆ ด้าน ในลำดับต่อมา
วิวัฒนาการของยุคของข้อมูลสารสนเทศ (The Evolution of the Information Age)
ใน ค.ศ. 1970 การพัฒนาระบบเครือข่ายอินเทอร์เน็ตเพื่อเชื่อมต่อสื่อสารระหว่างเครื่องคอมพิวเตอร์
ในระยะไกล โดยกระทรวงกลาโหมของสหรัฐอเมริกา และการนำคอมพิวเตอร์ส่วนบุคคลมาใช้อย่างแพร่หลายในเวลาต่อมา ทำให้เกิดการเปลี่ยนแปลงครั้งใหญ่ของเทคโนโลยีการสื่อสารและการปรับเปลี่ยนการบริหารจัดการของการจัดเก็บข้อมูลให้อยู่ในรูปแบบดิจิทัลในทุกองค์กร
การเปลี่ยนแปลงทางเทคโนโลยีของระบบการสื่อสารมีการพัฒนาสายใยแก้วนำแสง (Fiber Optic) การพัฒนาไมโครโพรเซสเซอร์ทดแทนหลอดสุญญากาศ และพัฒนาไมโครโพรเซสเซอร์ให้มีขนาดเล็กลงแต่ทำงานได้รวดเร็วขึ้น ส่งผลให้การจัดเก็บ ส่งผ่านข้อมูลและการประมวลผลของข้อมูลมีความเสถียรมากขึ้น
ใน ค.ศ. 1971 มีการทดสอบการใช้จดหมายอิเล็กทรอนิกส์ (e-mail) ที่สื่อสารข้อความจากเครื่องคอมพิวเตอร์เครื่องหนึ่งส่งข้อความไปยังเครื่องคอมพิวเตอร์อีกเครื่อง ซึ่งสามารถรับข้อความที่ส่งและแสดงผลได้อย่างรวดเร็วแทบจะทันทีที่ส่งข้อความ จากนั้นการส่งข้อความในรูปจดหมายอิเล็กทรอนิกส์ ได้พัฒนาและถูกนำมาใช้กันอย่างแพร่หลายเพื่อตอบสนองการสื่อสารส่วนบุคคลและยอมรับเป็นการสื่อสารระหว่างองค์กร
ใน ค.ศ. 1982 มีแนวคิดการลดข้อจำกัดของข้อมูลแอนะล็อกของเครือข่ายโทรศัพท์ที่เป็นคลื่นสัญญาณแบบเดิมให้สามารถเปลี่ยนเป็นข้อมูลรูปแบบดิจิทัลผ่านอุปกรณ์แปลงสัญญาณ ที่เรียกว่า โมเด็ม (Modem : Modulate/Demodulate) ซึ่งสามารถแปลงข้อมูลสัญญาณคลื่นแบบแอนะล็อก กลับไปกลับมาระหว่างสัญญาณแอนะล็อกกับสัญญาณดิจิทัลได้
ใน ค.ศ. 1991 มีการพัฒนาเว็บไซต์ โดยเริ่มจากการแสดงผลเป็นป้ายโฆษณาอิเล็กทรอนิกส์สำหรับผลิตภัณฑ์ของบริษัท องค์กร ในยุค web 1.0 ที่เป็นการสื่อสารทางเดียว (One Way Communication) ในเริ่มแรก และค่อยพัฒนาให้มีการโต้ตอบซึ่งกันและกัน (Two Way Communication) ที่เน้นการแบ่งปันข้อมูล ภาพ สื่อต่าง ๆ บุคคลทั่วไปสามารถมีส่วนร่วมในการสร้างเนื้อหา (Share Contents) การแสดง
ความคิดเห็น (Comment) โดยช่วงเวลานี้ข้อมูลยังมีการบริหารจัดการจากที่เก็บส่วนกลาง (Centralized) การเพิ่มขึ้นของการตลาดดิจิทัล การเพิ่มประสิทธิภาพกลไกค้นหา (Search Engine Optimization: SEO) เพื่อเข้าถึงข้อมูลพฤติกรรมลูกค้า และต่อมาพัฒนาการจัดการการวิเคราะห์จำแนก จัดแบ่งข้อมูลได้ อย่างเป็นลำดับ โดยจัดการให้ข้อมูลที่มีอยู่จำนวนมากเชื่อมต่อถึงกันในลักษณะการกระจาย (Metadata) โดยไม่จำเป็นต้องเก็บข้อมูลไว้ที่ส่วนกลาง (Decentralized) มีการพัฒนาเครื่องมือเพื่อสร้างความปลอดภัยและข้อมูลยังมีความเป็นส่วนตัว มีการใช้เทคโนโลยีบล็อกเชน (Blockchain) จนข้อมูลสารสนเทศได้ ถูกพัฒนาเป็นสินทรัพย์ดิจิทัล (Non-Fungible Token) ที่ไม่มีตัวตน แต่สามารถซื้อขายแลกเปลี่ยน และครอบครอง มีมูลค่าทางการตลาด การนำเทคโนโลยี AI (Artificial Intelligence) มาวิเคราะห์พฤติกรรมแล้วคาดการณ์ได้อย่างแม่นยำ นำมาใช้ประกอบธุรกรรมต่าง ๆ ที่ต้องใช้การระบุตัวตนที่มีความปลอดภัยสูง การใช้ AI ในรูป Chatbot นำเสนอสินค้าตามความต้องการ ประกอบการซื้อขายสินค้า การบริการตอบคำถาม การแก้ปัญหา การพยากรณ์ การหาแนวโน้มที่สามารถทำงานได้เหมือนมนุษย์จนแทบไม่สามารถจำแนกความแตกต่างได้
ยุคของข้อมูลสารสนเทศสร้างสาขาอาชีพใหม่และแนวโน้มการตกงานของสาขาอาชีพดั้งเดิม การเสื่อมสลายของเทคโนโลยีเดิม และถูกทดแทนด้วยเทคโนโลยีใหม่ที่ใช้ข้อมูลรูปแบบดิจิทัลที่ใกล้ตัวเรา เช่น การพัฒนาปัญญาประดิษฐ์ (Artificial Intelligence) สภาพแวดล้อมของโลกเสมือนจริง (Metaverse) ความเป็นจริงเสมือน (VR: Virtual Reality) การผสานความจริงเสมือนกับโลกความเป็นจริง (AR: Augmented Reality) อินเทอร์เน็ตของสรรพสิ่ง (IoT: Internet of Things) การสื่อสารยุค 5G ไร้สายที่มีความเร็วในการส่งข้อมูล (Peak Data Rates) ในอัตรา 20 Gbps มีช่วงคลื่นความถี่ (Available Spectrum) สามารถใช้ได้ถึง 30 GHz และสามารถรองรับความหนาแน่นในการเชื่อมต่อ (Connection Density) รองรับได้มากถึง 1 ล้านคนต่อตารางกิโลเมตร ซึ่งเทคโนโลยีทั้งหมดนี้ ล้วนเป็นเทคโนโลยีที่ต้องอาศัยและเอื้อต่อข้อมูลสารสนเทศจำนวนมาก หากไม่ใช่ยุคของข้อมูลสารสนเทศ เทคโนโลยีที่กล่าวมาและเทคโนโลยีที่มีความสัมพันธ์กันคงไม่สามารถพัฒนาขึ้นและต่อยอดในอนาคตได้
วิทยาการข้อมูล
ในยุคข้อมูลสารสนเทศ มีการพัฒนาการเข้าถึงข้อมูล เครื่องมือเก็บรวบรวมการวิเคราะห์ข้อมูลเพื่อหาคำตอบจากข้อมูลที่ใช้ในขอบเขตขององค์กร โดยที่บุคลากรที่ใช้ประโยชน์จากข้อมูลจะมีมิติมุมมองในสาขาของผู้วิเคราะห์ข้อมูลในวงแคบ เฉพาะมุมมองของตนเองหรือวิเคราะห์เพียงในองค์กรที่ตนสังกัดเท่านั้น และข้อมูลส่วนใหญ่จะอยู่ในรูปแบบจำกัดที่กำหนดให้เป็นชนิดเดียวกัน โลกความเป็นจริงในยุคของข้อมูลสารสนเทศที่มีข้อมูลที่หลากหลายถึงแม้จะเป็นเรื่องราวเดียวกัน แต่การจัดเก็บ วิเคราะห์แสดงผลสารสนเทศของข้อมูล เพื่อเผยแพร่และแบ่งปันนั้นมีแตกต่างกัน ซึ่งเป็นข้อด้อยของนักวิเคราะห์ข้อมูล ที่การวิเคราะห์ข้อมูลส่วนใหญ่จะเกี่ยวข้องกับด้านสถิติ คณิตศาสตร์ และการวิเคราะห์เชิงสถิติซึ่งเป็นข้อมูลเพียงส่วนหนึ่งจากแหล่งข้อมูลขนาดใหญ่เท่านั้น
วิทยาการข้อมูล (Data Science) คือ การศึกษาการใช้วิธีการทางวิทยาศาสตร์ เพื่อทำความเข้าใจเกี่ยวกับธรรมชาติของข้อมูลรูปแบบต่าง ๆ ศึกษาการจัดการ จัดเก็บ รวบรวม ตรวจสอบ กรองข้อมูล วิเคราะห์ วิจัยข้อมูล จากข้อมูลจำนวนมาก โดยใช้กระบวนการและอัลกอริทึมทางวิทยาศาสตร์ที่หลากหลาย เพื่อค้นหาข้อมูลที่เกี่ยวข้อง โดยใช้ทักษะความรู้คณิตศาสตร์สถิติ การเขียนโปรแกรมเฉพาะทาง
การวิเคราะห์ขั้นสูง ใช้เครื่องมือปัญญาประดิษฐ์ (AI) และเครื่องมือการเรียนรู้ ผนวกรวมเข้ากับความเชี่ยวชาญเฉพาะด้านเพื่อออกแบบ ระบุรูปแบบของข้อมูล นำเสนอผลการวิเคราะห์ข้อมูลเชิงลึกที่สามารถใช้เป็นแนวทางในการระบุเป้าหมาย วัตถุประสงค์ ใช้ตัดสินใจและการวางแผนเชิงกลยุทธ์ได้
>> กิจกรรมขอข้อมูล << >> ตอบคำถาม << >> กิจกรรมขอข้อมูล2 <<
กระบวนการวิทยาการข้อมูล
หน่วยการเรียนรู้ที่ 2 การเตรียมพร้อมข้อมูลเพื่อสำรวจ
แหล่งที่มาของข้อมูล
ที่มาของข้อมูลที่เกิดขึ้นจะมาจากสถานที่แตกต่างกัน ซึ่งสามารถจัดแหล่งที่มาของข้อมูลได้ 2 แหล่ง คือ
แหล่งข้อมูลหลัก (Primary Sources)
แหล่งข้อมูลหลัก คือ ข้อเท็จจริง เรื่องราวโดยตรงของหัวข้อใดหัวข้อหนึ่งจากบุคคลที่มีความสัมพันธ์โดยตรงกับข้อมูลนั้นหรืออาจจะเป็นประจักษ์พยาน บุคคลที่พบเห็นข้อเท็จจริงพบเห็นเหตุการณ์จากแหล่งที่เกิดข้อมูล โดยแหล่งข้อมูลหลักจะให้ข้อมูลในมิติที่ใคร ทำอะไร ที่ไหน อย่างไร แหล่งข้อมูลหลักอาจรวมถึงหลักฐาน เช่น ตำรากฎหมายและเอกสารต้นฉบับ จดหมายเหตุ รายงานของหนังสือพิมพ์โดยนักข่าวที่เห็นเหตุการณ์หรืออ้างอิงถึงบุคคลที่ทำให้เกิดเหตุการณ์ งานวิจัยต้นฉบับชุดข้อมูล ข้อมูลการสำรวจ เช่น การสำรวจสำมะโนประชากร หรือสถิติทางเศรษฐกิจ ภาพถ่าย วิดีโอหรือเสียงที่บันทึกเหตุการณ์
แหล่งข้อมูลรอง (Secondary Sources)
แหล่งข้อมูลรอง จะมีข้อมูลข้อเท็จจริงเหมือนกับแหล่งข้อมูลหลัก แต่ที่แตกต่างกัน คือ จะต้องมีการอ้างอิงแหล่งข้อมูลหลักเสมอ เนื่องจากข้อมูลรองเหล่านั้นถูกนำมาจากแหล่งข้อมูลหลักนั่นเอง โดยแหล่งข้อมูลรองนอกจากมีเนื้อหาข้อเท็จจริง ข้อมูลเหมือนข้อมูลจากแหล่งข้อมูลหลักแล้วก็สามารถเพิ่มการวิเคราะห์ตีความ การแสดงความคิดเห็นเพิ่มเติมได้ โดยแหล่งข้อมูลรองที่พบบ่อยเช่น การวิเคราะห์ข้อมูลหรือการตีความข้อมูล บทความทางวิชาการหรืออื่น ๆ เกี่ยวกับหัวข้อใดหัวข้อหนึ่งโดยเฉพาะ จากบุคคลที่ไม่เกี่ยวข้องโดยตรงกับเหตุการณ์หรือแหล่งข้อมูลหลัก สารคดีถึงแม้ว่าจะรวมภาพถ่ายหรือส่วนวิดีโอที่ถือเป็นแหล่งข้อมูลหลัก แต่สารคดีก็ถูกนำมาตัดต่อ คัดสรรเพิ่มเติมเพื่อนำเสนอในมุมมองของผู้ผลิตสารคดี >> ใบงานเรื่อง แหล่งที่มาของข้อมูล <<
ลำดับชั้นของข้อมูล
เปรียบเทียบความแตกต่างของข้อมูลปฐมภูมิและข้อมูลทุติยภูมิ
>>> ใบงานเรื่อง ลำดับชั้นของข้อมูล <<<
วิธีการได้มาของข้อมูล
ให้นักเรียนจัดทำพรีเซ็นต์เทชั่นนำเสนอข้อมูลในหัวข้อ "วิธีการได้มาของข้อมูล " ใน Canva
(จะต้องมีองค์ประกอบ 6 ข้อ โดยนำเสนอลักษณะของวิธีการในแต่ละหัวข้อใน พร้อมภาพประกอบ จัดส่งเป็น ไฟล์ .mp4)
จัดส่งในโฟเดอร์ "2.3 วิธีการได้มาของข้อมูล"
การเตรียมข้อมูล
การเตรียมข้อมูลที่เกิดจากการเก็บด้วยตนเองเป็นข้อมูลปฐมภูมิจะเกิดปัญหาน้อยมาก เนื่องจากเป็นข้อมูลที่ได้วางแผนจัดการอย่างเป็นระบบเพื่อจัดเก็บและรวบรวม แต่ข้อมูลที่มาจากแหล่งข้อมูลทุติยภูมิ จะเป็นข้อมูลที่ได้มาง่าย มีจำนวนมาก ในระบบสารสนเทศในฐานข้อมูลขององค์กรที่เคยเก็บไว้ ข้อมูลเหล่านี้ต้องนำมาวิเคราะห์เพื่อจัดการใหม่ให้มีลักษณะข้อมูลตรงกัน รูปแบบเดียวกัน สามารถนำมาประมวลผล ให้เป็นสารสนเทศที่ต้องการได้โดยไม่ผิดพลาด ซึ่งมีกระบวนการที่จัดการเตรียมข้อมูลเป็นไปตามกรณีของข้อมูล
1. การทำความสะอาดข้อมูล
1.1 ตรวจจับค่าเท็จ
เป็นการหาค่าที่ผิดปกติ (Outlier) อาจจะมากกว่าหรือน้อยกว่าที่ควรจะเป็น เช่น ส่วนสูงและน้ำหนัก ควรจะมีค่าที่เป็นไปได้ ซึ่งหากส่วนสูงเกิน 200 เซนติเมตร หรือน้อยกว่า 100 เซนติเมตรก็เป็นค่าที่ต้องตรวจจับ เช่นเดียวกันกับน้ำหนักนักเรียนหากน้อยเกินไปหรือมากเกินไปก็ต้องตรวจจับเช่นเดียวกัน
>>ข้อมูลสำหรับฝึกปฏิบัติ<< >>>แบบฝึกหัด 2.4 การตรวจจับค่าเท็จน้ำหนัก<<<
1.2 การแทน
ด้วยคอมพิวเตอร์ไม่สามารถจำแนกข้อมูลที่สื่อความหมายเดียวกัน แต่มีค่าที่ประมวลผล แบบดิจิทัลที่แตกต่างกัน เช่น การเก็บข้อมูลนักเรียน คำนำหน้า แหล่งข้อมูลใช้คำย่อ ด.ช. ด.ญ. แต่หากแหล่งข้อมูลแหล่งอื่นใช้ข้อมูลคำนำหน้าบันทึกเป็น เด็กหญิง เด็กชาย และอาจจะพบว่ามีการนำเข้าข้อมูลผิดพลาด แต่ข้อมูลยังสามารถหาแนวโน้มของข้อมูลได้ การทำความสะอาดด้วยการลบออก ก็อาจจะทำให้ข้อมูลที่สำคัญในระเบียนเดียวกันสูญเสียไปด้วย ซึ่งข้อมูลทุกข้อมูลก็มีคุณค่าในตัวข้อมูลเอง จึงเป็นหน้าที่ของผู้ทำความสะอาดข้อมูลที่ต้องหาแนวโน้มเหล่านี้เพื่อจัดกลุ่มให้ได้ว่าข้อมูลที่แตกต่างกัน จะสามารถจัดกลุ่มอยู่ด้วยกันได้อย่างไร
2. การแปลงข้อมูล
การแปลงข้อมูลเป็นการนำข้อมูลที่ได้รับหรือเก็บมาจากแหล่งอื่นซึ่งมีหน่วยไม่สอดคล้องกัน ข้อมูลไม่ใช่ประเภทเดียว หรืออาจจำเป็นต้องแปลงข้อมูลเป็นกลุ่มหรือช่วง ซึ่งเป็นชนิดข้อมูลรูปแบบใหม่แตกต่างจากข้อมูลเดิม
2.1 การแปลงหน่วยเชิงปริมาณ เป็นการแปลงหน่วยให้มีค่าตัวเลขที่เป็นหน่วยเดียวกัน เนื่องจากข้อมูลจากแหล่งที่แตกต่างกันจะใช้หน่วยข้อมูลแตกต่างกัน เมื่อนักวิทยาการข้อมูลประสงค์นำข้อมูลมาประมวลผล จึงต้องจัดการให้ข้อมูลมีหน่วยเท่ากันหรือกลายเป็นหน่วยเดียวกัน ก่อนที่จะนำค่าตัวเลข ชนิดเดียวมาคำนวณและประมวลผลในลำดับต่อไป
2.2 การแปลงข้อมูลเชิงปริมาณให้เป็นข้อมูลเชิงคุณภาพ เป็นการแปลงข้อมูลที่มีค่าเชิงปริมาณ ที่เรียงลำดับได้ให้เป็นข้อมูลเชิงคุณภาพ เพื่อบรรยาย พรรณนา แปลความหมายได้ดีกว่าข้อมูลที่เป็นค่าตัวเลข
2.3 การแปลงข้อมูลเป็นอันตรภาคชั้น เป็นการแปลงข้อมูลเชิงปริมาณให้เป็นข้อมูลใหม่ โดยมีการกำหนดช่วงของข้อมูลที่นำเข้าเป็นระยะตามช่วงที่กำหนดไว้
ข้อมูลส่วนบุคคล
การบริหารจัดการข้อมูลในบางครั้งนักวิทยาการข้อมูลจำเป็นจะต้องใช้ข้อมูลจากแหล่งต่าง ๆ ซึ่งอาจจะมีข้อมูลที่ละเอียดอ่อน ข้อมูลส่วนบุคคล ดังนั้น จึงมีความจำเป็นที่จะต้องใช้ข้อมูลด้วยความระมัดระวัง ให้เป็นไปตามจริยธรรมและกฎหมายที่ได้กำหนดการคุ้มครองข้อมูลไว้
พระราชบัญญัติคุ้มครองข้อมูลส่วนบุคคล พ.ศ. 2562 (Personal Data Protection Act: PDPA) จะมุ่งเน้นคุ้มครองข้อมูลส่วนบุคคล เพื่อไม่ให้บุคคลอื่นนำข้อมูลส่วนบุคคลของบุคคลหนึ่งที่ไม่ใช่ของตนเองไปใช้ในทางที่มิชอบ สร้างความเสียหายให้กับเจ้าของข้อมูล
ข้อมูลส่วนบุคคล เป็นข้อมูลที่สามารถระบุตัวตนของเจ้าของข้อมูลได้
ข้อมูลส่วนบุคคลแบ่งออกเป็น 2 กลุ่ม ได้แก่ กลุ่มข้อมูลส่วนบุคคลพื้นฐาน และกลุ่มข้อมูลชีวมิติ
ชิ้นงาน ให้นักเรียนศึกษาค้นคว้าหาข้อมูลที่เกี่ยวกับข้อมูลส่วนบุคคล จากนั้นร่วมกันจำแนกกลุ่มข้อมูล
ส่วนบุคคลให้ถูกต้องจากข้อมูลที่กำหนดให้ >>แบบฝึกหัด<<
หน่วยการเรียนรู้ที่ 3 สารสนเทศเพื่อการวิเคราะห์
การวิเคราะห์เชิงพรรณนา
การวิเคราะห์ข้อมูล (Data Analysis) คือ กระบวนการนำข้อมูลมาจัดการ จัดกลุ่ม จำแนกชุดข้อมูล หาความสัมพันธ์ของชุดข้อมูล และหารูปแบบ เพื่อใช้เป็นตัวแทนที่เหมาะสมกับข้อมูล ซึ่งจะทำให้ค้นพบกับความหมาย คำตอบตามเป้าหมาย หรือวัตถุประสงค์ และได้ข้อมูลเชิงลึก (Insight) และข้อสรุป (Conclusion) ที่ช่วยให้เข้าใจและกำหนดทิศทาง เพื่อตัดสินใจได้อย่างถูกต้อง
การวิเคราะห์เชิงพรรณนาเป็นการใช้สถิติพื้นฐานมาดำเนินการคำนวณทางคณิตศาสตร์กับข้อมูลที่ได้ เก็บรวบรวมไว้ เพื่อให้ได้ข้อสรุปที่เป็นตัวเลขใหม่ ใช้เป็นตัวแทนของกลุ่มข้อมูล สำหรับใช้ในการอธิบาย บอกเล่าหรือทำให้เห็นเป็นภาพ สามารถมองเห็นทิศทางหรือแนวโน้มของกลุ่มข้อมูลที่มีความสัมพันธ์กัน
1.การหาสัดส่วนและร้อยละ
ค่าร้อยละจะมีค่าเป็นตัวเลขหรือตัวเลขที่มีทศนิยม ใช้ในการเปรียบเทียบกลุ่มของข้อมูลที่มีลักษณะซํ้ากันให้อยู่ในกลุ่มเดียวกัน เพื่อเปรียบเทียบกับข้อมูลทั้งหมด ซึ่งได้แบ่งข้อมูลทั้งหมดออกเป็น 100 ส่วน เท่า ๆ กัน เพื่อให้ง่ายต่อการอธิบายข้อมูล และมองเห็นภาพของปริมาณข้อมูลจากข้อมูลทั้งหมด เช่น จากการเข้าสอบแข่งขันเข้ารับราชการตำรวจของสนามสอบโรงเรียนวัดละเมียด มีบุคคลที่สอบผ่านภาคข้อเขียน ร้อยละ 1.35 ของผู้เข้าสอบทั้งหมด จากการประมวลผลเป็นค่าร้อยละนี้จะอธิบายได้ว่าหากมีผู้สอบภาคข้อเขียน 100 ราย จะมีผู้ทำข้อสอบผ่านประมาณ 1 ราย
>>แบบฝึกหัด<< >>ส่งการประมวลผลข้อมูล<<
หน่วยการเรียนรู้ที่ 4 เรียงร้อยข้อมูลสื่อสารเป็นรูปธรรม
การสื่อสารด้วยข้อมูล
ปัจจุบันในยุคข่าวสาร ข้อมูลมีการนำเสนอจำนวนมากและหลากหลายช่องทาง บางข่าวสารเป็นที่สนใจแต่หากวิเคราะห์ดูอาจจะเป็นข่าวที่ไม่น่าส่งผลกระทบแต่ด้วยอิทธิพลของสื่อสารมวลชนเป็นผู้นำเสนอจึงทำให้เป็นประเด็นที่น่าสนใจได้ ด้วยข้อมูลที่จัดเก็บมีจำนวนมากและมีกระบวนการในการวิเคราะห์ที่ยุ่งยากสลับซับซ้อน กว่าจะได้ข้อมูลเชิงลึกที่สำคัญ น่าสนใจ ข้อมูลสารสนเทศที่ค้นพบเหล่านี้หากขาดซึ่งการนำเสนอ เพื่อเผยแพร่ให้ผู้ที่เกี่ยวข้องได้รับรู้ก็ถือเป็นการสูญเปล่าตั้งแต่เริ่มรวบรวมข้อมูลแล้ว การนำเสนอข้อมูล
ในเรื่องเดียวกันแต่สามารถเป็นปัจจัยในการตัดสิน กำหนดทิศทางได้ทั้งด้านบวกและด้านลบ
สามารถทำให้เกิดข้อตกลงหรือล้มเลิกข้อตกลงก็ได้ ถึงแม้จะเป็นการนำเสนอข้อมูลเรื่องเดียวกันก็จริง
การสร้างภาพข้อมูล
การสร้างภาพข้อมูล (Data Visualization) คือ การใช้ภาพสื่อสารแทนข้อมูลสารสนเทศ
ที่ต้องการนำเสนอ เพื่อให้เกิดความเข้าใจข้อมูลด้วยความรวดเร็ว มองเห็นจุดเด่น จุดด้อย ค่าผิดปกติ เปรียบเทียบข้อมูล และแนวโน้มด้วยภาพที่กะทัดรัด ดึงดูดความสนใจ น่าจดจำ ในการสร้างภาพข้อมูล
จึงจำเป็นต้องมีเครื่องมือในการนำเสนอข้อมูล เพื่อสื่อสารข้อมูลในมุมมองที่ต้องการนำเสนอไปสู่ผู้รับข้อมูลได้อย่างมีประสิทธิภาพ เครื่องมือที่ใช้ในการสร้างภาพข้อมูลพอสังเขป มีดังนี้
1. แผนภูมิแท่ง (Bar Graph)
แผนภูมิแท่งเหมาะสำหรับใช้ในการเปรียบเทียบข้อมูลระหว่างหมวดหมู่ หรือแสดงข้อมูล
ที่มีแนวโน้มในช่วงของเวลา ข้อมูลที่ใช้สำหรับแผนภูมิแท่งควรเป็นข้อมูลที่จัดเป็นหมวดหมู่ในแกน x
และข้อมูลที่อยู่ในแกน y จะเป็นข้อมูลที่เป็นเชิงปริมาณตัวเลข ซึ่งจะทำให้การนำเสนอด้วยแผนภูมิแท่ง
เห็นภาพได้ชัดเจน เช่น การเปรียบเทียบยอดขายเป็นรายเดือนโดยให้เดือนอยู่ในแนวแกน x
ส่วนยอดขายอยู่ในแนวแกน y
นอกจากแผนภูมิแท่งปกติแล้ว ยังมีแผนภูมิแท่งแบบเรียงซ้อน (Stacked Bar Charts)
ที่สามารถนำเสนอข้อมูล การจำแนกกลุ่มเหมือนกัน แต่อยู่คนละส่วน ทำงานเหมือนเขียนแผนภูมิแท่ง
ข้อมูลแต่ละชุดบนแผ่นสไลด์หรือแผ่นใส แล้วนำข้อมูลมาประกบกันเพื่อให้เห็นการเปรียบเทียบได้ชัดเจน
ครบทุกมิติมากขึ้น
2. กราฟเส้น (Line Graph)
กราฟเส้นเป็นเครื่องมือนำเสนอข้อมูลที่เหมาะสำหรับข้อมูลเชิงปริมาณที่มีความต่อเนื่อง
เพราะกราฟเส้นสามารถแสดงแนวโน้มการแปรผันของจุดข้อมูลในช่วงเวลาหนึ่งไปหาอีกเวลาหนึ่งได้ดี
และสามารถมองแนวเส้นคาดการณ์ไปในอนาคตได้ดี เช่น การแสดงยอดการส่งออกของ 3 ปีที่ผ่านมา
และมองแนวโน้มในปีปัจจุบัน ปีถัดไป ว่ามีแนวโน้มมูลค่าการส่งออกทิศทางใด
แนวทางการใช้กราฟเส้นให้น่าสนใจ คือ ทำเส้นให้เล็กและคมที่สุด เพื่อไม่ให้เกิดความหนาแน่น แย่งพื้นที่ในการมองเห็นจนเกินไป และในส่วนข้อมูลใดที่ต้องการให้น่าสนใจจะใช้ป้ายกำกับโดดเด่น หรือจุดสี เพื่อให้เห็นจุดเด่นนั้น ในบางครั้งกราฟเส้นอาจไม่โดดเด่น จึงมีความจำเป็นที่จะต้องเพิ่มความสูงของแกน y เพื่อให้กราฟที่ไม่แตกต่างเกิดความแตกต่างกันมากขึ้น และน่าสนใจในที่สุด
3. แผนภูมิวงกลม (Pie Chart)
แผนภูมิวงกลมเหมาะสำหรับใช้ในการนำเสนอข้อมูลโดยรวมทั้งหมด ที่แสดงให้เห็นว่าข้อมูลทั้งหมดถูกแบ่งออกเป็นส่วน ๆ แล้วเปรียบเทียบส่วนต่าง ๆ ว่ามีสัดส่วนอย่างไร เป็นเปอร์เซ็นต์ตามสัดส่วน
แต่ละชิ้น
แผนภูมิวงกลมจะนำเสนอข้อมูลที่แสดงสัดส่วนได้ง่ายและรวดเร็ว แต่แผนภูมิวงกลมมีข้อด้อย
คือ ไม่เหมาะสำหรับการนำเสนอข้อมูลที่มีหมวดหมู่มากเกินไป หรือสัดส่วนแต่ละชิ้นมีความแตกต่าง
ที่ใกล้เคียงกันจนทำให้ไม่สามารถเปรียบเทียบความแตกต่างกันได้ กรณีแบบนี้อาจจำเป็นต้องใช้ป้ายกำกับ เพื่อให้ข้อมูลที่ใกล้เคียงกันนั้นมีความแตกต่างกันมากขึ้น
4. แผนภาพการกระจาย (Scatter Plot)
แผนภาพการกระจายเป็นเครื่องมือที่มีประสิทธิภาพอย่างยิ่งในการสื่อสารข้อมูล
ที่แสดงความสัมพันธ์ระหว่างตัวแปร 2 ตัว ที่อยู่ในแนวแกน x และแกน y ทำให้เห็นแนวโน้มว่าสัมพันธ์กันแบบทิศทางเดียวกันหรือแบบทิศทางที่ขัดแย้งกัน หรืออาจจะไม่มีความสัมพันธ์กันเลย
ในกรณีที่แผนภาพการกระจายนำเสนอแล้วมีความสัมพันธ์กัน การทำให้แผนภาพการกระจายน่าสนใจ คือ การเพิ่มเส้นแนวโน้มหรือการวิเคราะห์ถดถอย (Regression Analysis) ตามความเหมาะสม แล้วติดป้ายกำกับถึงเหตุผลว่าทำไมถึงวิเคราะห์ด้วยสมการหรือสถิตินี้ เพื่อให้ผู้ได้รับการนำเสนอเข้าใจ
อย่างละเอียด
5. ฮิสโทแกรม (Histogram)
ฮิสโทแกรมเหมาะสำหรับการนำเสนอข้อมูลเพื่อแสดงความถี่ของตัวแปรตัวเดียว โดยนำเสนอข้อมูลในแกน x ที่ถูกแบ่งเป็นช่วงเป็นกลุ่ม และแกน y จะแสดงความถี่ ทำให้เห็นการเปรียบเทียบความสูงของแต่ละช่วง หรือแต่ละกลุ่ม
ฮิสโทแกรมและแผนภูมิแท่งอาจจะดูคล้าย ๆ กัน แต่ฮิสโทแกรมมีจุดเด่นตรงที่สามารถ
ระบุแนวโน้มในการกระจายของข้อมูล จุดสูงสุด ตํ่าสุด ช่องว่างหรือการบิดเบือน เพราะข้อมูลในแกน x
ของฮิสโทแกรมเป็นข้อมูลเชิงปริมาณไม่ใช่ข้อมูลที่ถูกจัดเป็นกลุ่มเหมือนแผนภูมิแท่ง
6. แผนภูมิพื้นที่ (Area Chart)
การนำเสนอด้วยแผนภูมิพื้นที่จะมีความแตกต่างจากกราฟเส้น เนื่องจากแผนภูมิพื้นที่
จะมีการแสดงพื้นที่ด้านล่างเพื่อให้เห็นการสะสมของข้อมูล หากสังเกตให้ดีพื้นที่ทางด้านแกน x
จะมองเห็นเป็นพื้นที่ของข้อมูลที่ถูกสะสมมาตั้งแต่จุดแรกจนถึงจุดสิ้นสุดของแกน x ซึ่งจะแสดงมวลรวม
ของข้อมูลทั้งหมด
จุดเด่นของแผนภูมิพื้นที่อีกด้านหนึ่ง คือ สามารถนำเสนอข้อมูลหลาย ๆ ชุดทับซ้อนกัน
ทำให้ผู้เห็นข้อมูลในแผนภูมิพื้นที่สามารถเปรียบเทียบและติดตามแนวโน้มของข้อมูลได้ภายในแผนภูมิ
ชุดเดียวกัน การนำเสนอด้วยแผนภูมิพื้นที่ควรมีความระมัดระวัง ไม่นำเสนอแผนภูมิพื้นที่ที่หนาแน่นจนเกินไปและตรวจสอบจุดสูงสุด-ตํ่าสุดของข้อมูลแต่ละชุดไม่ให้อยู่ใกล้เคียงกันหรือทับซ้อนกับพื้นที่ในชุดอื่นเพราะจะทำให้เกิดการสับสนได้ และควรมีป้ายกำกับแบ่งสีที่ดึงดูดสายตา
7. ตารางข้อมูล (Tabular)
การนำเสนอข้อมูลด้วยตารางข้อมูลเป็นการนำเสนอที่ง่าย โดยนำข้อมูลใส่ในแถวและคอลัมน์
การนำเสนอรูปแบบนี้ต้องการให้เห็นค่าของตัวเลขและมีการเปรียบเทียบที่แม่นยำ การนำเสนอด้วยตารางจะเห็นและใช้บ่อยในการนำเสนอทางวิชาการ จุดเด่นของการนำเสนอด้วยตารางจะมีโครงสร้าง
ที่เป็นหัวตาราง และสามารถสรุปข้อมูลในตารางไว้ด้านล่างของตาราง หรืออาจจะแบ่งส่วนการสรุป
เป็นส่วน ๆ เช่น การนำเสนอรายได้แต่ละเดือนและสรุปในแต่ละไตรมาสในรอบปี ทำให้เห็นมิติการสรุป
ได้มากกว่าการนำเสนอในรูปแบบอื่น ๆ
8. แผนภาพรูปภาพ (Pictogram)
แผนภาพรูปภาพเป็นการนำเสนอข้อมูลโดยใช้สัญรูป (Icon) ภาพ (Image) หรือสัญลักษณ์
เพื่อแสดงแทนกลุ่มข้อมูล โดยเป็นรูปสัญลักษณ์ที่เกี่ยวข้องกับข้อมูลที่กำลังนำเสนอ มีมาตราส่วน หน่วย
และคำอธิบายที่สอดคล้องกัน เพื่ออธิบายความหมายของสัญลักษณ์ให้เข้าใจได้ตรงกัน สัญลักษณ์ภาพ
หรือสัญลักษณ์ที่ใช้แปลความหมายได้ง่าย เช่น ใช้เพื่อแสดงระดับการถีบจักรยานของผู้คน
โดยที่สัญรูปผู้ชายและผู้หญิงแสดงถึงจำนวนของผู้ถีบจักรยาน
นอกจากนี้การใช้มาตราส่วนและป้ายคำอธิบายที่สอดคล้องกันเพื่ออธิบายความหมาย
ของสัญลักษณ์ เพื่อให้มั่นใจในความชัดเจนในการนำเสนอ เช่น ใช้ แทนหน่วย 1,000 ตัว
เพื่อไม่ให้เข้าใจคลาดเคลื่อนว่า 1 ภาพต่อ 1 ตัว
9. แผนที่ (Maps)
แผนที่ (Maps) เป็นการนำเสนอข้อมูลโดยใช้แผนที่เพื่อสื่อให้เห็นเป็นภาพ 2 มิติ ซึ่งมีรูปร่าง
ของพื้นที่ตามพิกัดภูมิศาสตร์ที่เกี่ยวข้องกับข้อมูลที่ต้องการนำเสนอ ซึ่งสามารถใส่ข้อมูลเชิงปริมาณ
ชี้ไปยังตำแหน่งของแผนที่ แล้วใช้มิติของสี ความเข้ม เพื่ออธิบายช่วงปริมาณหรือความหนาแน่นของข้อมูลที่ต้องการนำเสนอได้อีกด้วย
10. แดชบอร์ด (Dashboards)
แดชบอร์ด (Dashboards) คือ การนำข้อมูลเชิงปริมาณที่มีการเคลื่อนไหว หรือข้อมูลที่มีค่าต่อเนื่องมาแสดงเป็นภาพรวม โดยใช้แผนภูมิและกราฟต่าง ๆ ที่แสดงค่าเป็นปัจจุบันแบบ Realtime
เพื่อแสดงให้เห็นการเคลื่อนไหวและมีการประมวลเพื่อแสดงสัดส่วนร้อยละ โดยแสดงเป็นกราฟ ไอคอน ภาพ ตัวเลข และข้อความ เพื่อสื่อถึงข้อมูล