BIG DATA
ในยุคของข้อมูลและสารสนเทศ มีปริมาณข้อมูลเพิ่มมากขึ้นทุกวัน จากผู้ใช้ทั่วโลก ทำให้ข้อมูลกลายเป็นสิ่งที่มีมูลค่ามหาศาล มีการใช้ศาสตร์ที่เรียกว่า "วิทยาการข้อมูล (data science)" ช่วยให้ผู้ใช้เข้าใจความหมายของข้อมูล และได้รับความรู้จากข้อมูลที่ผ่านกระบวนการวิทยาการข้อมูลด้วย
องค์กรทั้งภาครัฐและภาคธุรกิจ ล้วนใช้ประโยชน์จากข้อมูลเพื่อนำไปสู่การตัดสินใจในการแก้ปัญหาที่อาจไม่สามารถแก้ไขได้ในอดีต กระบวนการวิทยาการข้อมูล มีการนำข้อมูลที่เกี่ยวข้องมาวิเคราะห์ (data analytics) เพื่ออธิบาย ค้นหาคำตอบหรือทำนายปรากฎการณ์ที่เกิดขึ้น การทำข้อมูลให้เป็นภาพ (data visualization) หรือการเล่าเรื่องราวที่เกิดจากข้อมูล (data story telling) ทำให้ผู้ใช้ได้รับความรู้และเข้าใจข้อมูลได้ง่าย ดังนั้น การเรียนรู้เกี่ยวกับการใช้ประโยชน์และการนำเสนอข้อมูลที่เกิดขึ้น จึงเป็นสิ่งสำคัญและจำเป็นสำหรับนักเรียนในยุคนี้
1.1 ยุคของข้อมูลและสารสนเทศ (information age)
ข้อมูล (data) หมายถึง ข้อเท็จจริงหรือเรื่องราวที่เกี่ยวข้องกับสิ่งต่าง ๆ เช่น คน สัตว์ สิ่งของ สถานที่ ฯลฯ โดยอยู่ในรูปแบบที่เหมาะสมต่อการสื่อสาร การแปลความหมายและการประมวลผล ซึ่งข้อมูลอาจได้มาจากการสังเกต เก็บรวบรวมและการวัด ข้อมูลอาจเป็นตัวเลข ตัวอักขระ หรือสัญลักษณ์ต่าง ๆ ต้องมีความเป็นจริงและต่อเนื่อง มีการเก็บรวบรวมข้อมูลอย่างเป็นระบบ เช่น ชื่อ สกุล ที่อยู่ อายุ เพศ คะแนนสอบ ส่วนสูง น้ำหนัก ฯลฯ
ชนิดของข้อมูล
1) ข้อมูลตัวเลข ได้แก่ ข้อมูลที่ใช้แทนจำนวนซึ่งจะนำไปใช้ในการคำนวณ เช่น ปริมาณน้ำฝน อุณหภูมิ จำนวนนักเรียน ความสูง น้ำหนัก เกรดเฉลี่ย ราคาสินค้า จำนวนสินค้า เป็นต้น
2) ข้อมูลอักขระ ได้แก่ ข้อมูลที่เป็นตัวอักษร ตัวเลขที่ไม่ใช้ในการคำนวณ หรือสัญลักษณ์ต่าง ๆ เพียงอย่างใดอย่างหนึ่ง หรืออาจเป็นตัวอักษร ตัวเลข หรือสัญลักษณ์ผสมกัน เช่น ชื่อโรงเรียน เบียนรถยนต์ สห 191 หมายเลขโทรศัพท์ 08-21860207 เลขที่บ้าน 70/3 ซึ่งเป็นตัวเลขและสัญลักษณ์ เป็นต้น
3) ข้อมูลรูปภาพ ได้แก่ ข้อมูลที่เป็นภาพถ่ายหรือภาพลายเส้น เช่น ภาพถ่าย แบบก่อสร้างอาคาร ภายลายเซ็น
4) ข้อมูลเสียง ได้แก่ เสียงที่บันทึกไว้ด้วยแถบเสียง หรือบันทึกเป็นข้อมูลไว้ในคอมพิวเตอร์และใช้คอมพิวเตอร์ในการประมวลผล เช่น การบริการสารสนเทศผ่านทางโทรศัพท์ของธนาคารต่าง ๆ ซึ่งการบริการนี้ได้ใช้คอมพิวเตอร์ช่วยในการประมวลผลและให้ผลลัพธ์เป็นเสียงตอบกลับมาทางโทรศัพท์
ดังนั้น ข้อมูลจึงเป็นสิ่งจำเป็นที่มีความสำคัญอย่างยิ่งและถูกนำมาใช้ประโยชน์ในด้านต่าง ๆ เช่น ด้านเศรษฐกิจ การศึกษา สาธารณสุข สิ่งแวดล้อม การเกษตรและการคมนาคม ฯลฯ
สารสนเทศ (Information) หมายถึง ข้อมูลที่เป็นเรื่องเกี่ยวกับความจริงของคน สัตว์ สิ่งของ ทั้งที่เป็นรูปธรรม นามธรรม ที่ได้เก็บรวบรวม ประมวลผล เรียกค้น และสื่อสารระหว่างกันนำมาใช้ให้เกิดประโยชน์
ข้อมูลในอดีด มักมาจากการบอกเล่าต่อกันมา หรือมีการจารึกไว้ในหิน ผังถ้ำ หรือหลักศิลา แล้วพัฒนามาเป็นการบันทึกบนใบลาน ไม้ไผ่ ผ้าที่ทำจากเยื่อไม้ไผ่ของชาวจีน หรือกระดาษที่ทำจากต้นกก (Papyrus) ของขาวอียิป เมื่อเทคโนโลยีด้านการพิมพ์พัฒนาขึ้น จึงเปลี่ยนเป็นการจัดพิมพ์เป็นรูปเล่ม เช่น หนังสือ วารสาร ตำราเรียน แผ่นพับ ฯลฯ การจัดเก็บข้อมูลในรูปแบบเดิมทำให้การนำข้อมูลมาใช้ไม่สะดวก ไม่ทันกาล สุญหายง่าย ปัจจุบันจึงเปลี่ยนมาเป็นการจัดเก็บในรูปแบบดิจิทัล (digitization) และพัฒนาการของการสื่อสารบนอินเทอร์เน็ต ทำให้ผู้ใช้สามารถเข้าถึงข้อมูลสารสนเทศได้ทุกที่ทุกเวลา เช่น รูปเล่มหนังสือเรียน เปลี่ยนมาเป็น หนังสืออิเล็กทรอนิกส์ (E-books) แผนที่การเดินทางเดิมเป็นกระดาษแผ่นใหญ่ ๆ พับเก็บให้เล็กและเมื่อต้องการใช้งานถึงถูกคลี่ออกที่ยุ่งยากในการจัดเก็บและนำมาใช้ ก็ถูกเปลี่ยนมาเป็นระบบแผนที่นำทางบนอินเทอร์เน็ต (Global Positioning System : GPS) ซึ่งมีความสะดวก รวดเร็ว แม่นยำมากกว่า
ป้จจุบันเราไม่เป็นเพียงผู้ใช้ประโยชน์ข้อมูลดิจิทัลเท่านั้น แต่เรายังเป็นหนึ่งในผู้ร่วมสร้างข้อมูลดิจิทัลนั้นด้วย เช่น การอัพโหลดรูปภาพ การส่งอีเมล การโพสต์ข้อความในสื่อสังคมออนไลน์ การส่งต่อข้อความผ่านอุปกรณ์อิเล็กทรอนิกส์ต่าง ๆ เช่น คอมพิวเตอร์ โทรศัพท์มือถือ หรือเซ็นเซอร์ที่ติดกับอุปกรณ์ต่าง ๆ ซึ่งผู้อื่นสามารถนำข้อมูลดิจิทัลเหล่านี้ไปใช้ประโยชน์ได้ ข้อมูลเหล่านี้ถือว่าเป็น "สินทรัพย์ (asset) ที่มีความสำคัญ แต่ข้อมูลที่มีอยู่ไม่ได้ถูกนำมาประมวลผลก็จะไม่เกิดคุณค่าใด ๆ ดังเช่นคำกล่าวที่ว่า "ข้อมูลนั้นมีค่าดั่งน้ำมันดิบ"
บริษัทต่าง ๆ ได้มีการนำข้อมูลดิจิทัลมาใช้ประโยชน์ทำให้เกิดมูลค่ามหาศาล เช่น บริการจองโรงแรมที่พัก รถแท็กซี่ ขายสินค้าออนไลน์และบริการสื่อสังคม (social media) เช่น เฟซบุ๊ก (Facebook) เป็นบริษัทให้บริการสื่อสังคมที่มีผู้ใช้หลายล้านคนทั่วโลก โดยไม่คิดค่าใช้จ่ายแต่สามารถสร้างรายได้จากการขายโฆษณาที่ตรงกับกลุ่มเป้าหมาย (user-targeted advertisements) ของสินค้าและบริการ โดยรวบรวมข้อมูลจากผู้ใช้ เช่น เพศ อายุ ที่อยู่ อาชีพ รวมถึงพฤติกรรมการใช้งานผ่านเฟซบุ๊ก ไม่ว่าจะเป็นการกดไลค์ (like) กรดแชร์ (share) ข้อความ ภาพ หรือ วิดีโอ บริษัทเจ้าของสินค้าหรือผลิตภัณฑ์จึงยอมจ่ายค่าโฆษณาให้กับเฟซบุ๊ก
จากการนำข้อมูลดิจิทัลที่มีอยู่มหาศาล มาใช้ประโยชน์ในด้านต่าง ๆ ความรู้ด้านวิทยาการข้อมูลจึงมีบทบาทสำคัญ และอาชีพ "นักวิทยาศาสตร์ข้อมูล" จึงเป็นอาชีพที่น่าสนใจและได้รับความนิยมเป็นอย่างมากในยุกของข้อมูลและสารสนเทศนี้
นักวิทยาศาสตร์ข้อมูล (data scientist)
นักวิทยาศาสตร์ข้อมูล คือ ผู้ที่มีความสามารถในการค้นหา วิเคราะห์ ค้นพบสิ่งที่น่าในใจ น่าสงสัย และเป็นประโยชน์ จากข้อมูลขนาดใหญ่จำนวนมหาศาล (big data) นักวิทยาศาสตร์ข้อมูล ทำหน้าที่จัดการข้อมูลที่มีปริมาณมาก ยุ่งยาก หลากหลาย ทำการวิเคราะห์ ค้นหารูปแบบความสัมพันธ์ของข้อมูล และนำเสนอข้อมูลออกมาในรูปแบบที่เข้าใจง่าย ทำให้เกิดองค์ความรู้และสามารถนำไปใช้ในการตัดสินใจได้ ดังนั้น คุณลักษณะของนักวิทยาศาสตร์ข้อมูล ต้องเป็นผู้ที่มีความสามารถทั้งการเป็นนักสืบค้น นักเจาะหาข้อมูล นักวิเคราะห์ นักสื่อสารและเป็นผู้ให้คำปรึกษาที่เชื่อถือได้
1.2 วิทยาการข้อมูล (data science)
วิทยาการข้อมูล (data science) คือ การศึกษาถึงกระบวนการ วิธีการ หรือเทคนิค ในการนำข้อมูลจำนวนมาหาศาล มาประมวลผลเพื่อให้ได้องค์ความรู้ เข้าใจปรากฎการณ์หรือตีความ ทำนายหรือพยากรณ์ ค้นหารูปแบบหรือแนวโน้มจากข้อมูล และสามารถนำมาวิเคราะห์ต่อยอดเพื่อแนะนำทางเลือกที่เหมาะสม หรือใช้ในการตัดสินใจเพื่อประโยชน์สูงสุด ตัวอย่างเช่น
1.1 ข้อมูลช่วยอธิบายปรากฎการณ์ที่เกิดขึ้น เรื่องของฝุ่นละอองที่มีขนาดเล็กกว่า 2.5 ไมโครเมตร์ มีค่าเกินมาตรฐาน คือ มากกว่า 2.5 ไมโครกรัมต่อลุกบาศก์เมตร เหตุการณ์ดังกล่าวจะเกิดขึ้นซ้ำในช่วงเวลาเดียวกันหลาย ๆ วัน บางช่วงเวลาของวันปริมาณฝุ่นก็ลดลงจนอยู่ในระดับต่ำมาก จากการเก็บข้อมูลในแต่ละช่วงเวลาอย่างต่อเนื่องด้วยเทคโนโลยีอินเทอร์เน็ตของสรรพสิ่ง (Internet of things: IoTs) เข้ามาประยุกต์ใช้ ทำให้หน่วยงานที่เกี่ยวข้องสามารถหาวิธีการแก้ปัญหาฝุ่นควันได้อย่างเป็นระบบต่อไป
1.2 ข้อมูลช่วยเปลี่ยนมุมมองของสิ่งต่าง ๆ บนโลกได้ เรื่องของการแบ่งกลุ่มประเทศพัฒนาแล้วน่าจะมีเศรษฐกิจที่พึ่งพาการผลิตที่ทันสมัยกว่า มีรายได้และคุณภาพชีวิตดีกว่า และกลุ่มประเทศกำลังพัฒนา โดยใช้เกณฑ์เศรษฐกิจและคุณภาพชีวิชิต แต่เมื่อค้นหาข้อมูลด้านเศรษฐกิจแทนด้วยข้อมูลรายได้และเกณฑ์คุณภาพชีวิตแทนด้วยข้อมูลอายุขัยเฉลี่ย จากข้อมูลที่ได้กลับไม่มีการกระจายที่แยกกลุ่มประเทศที่พัฒนาออกจากประเทศกลุ่มอื่น ๆ ได้อย่างชัดเจน
1.3 ข้อมูลช่วยในการตัดสินใจ เรื่องของการระบาดของอหิวตกโรค จากการเก็บข้อมูลทำให้หมอจอห์น สโนว์ (Dr.john Snow) จัดทำแผนที่การกระจายของผู้ป่วยจากจำนวนและตำแหน่งที่พบผู้ป่วยจำนวนมาก และตั้งสมมติฐานว่าการระบาดเกิดจากแหล่งน้ำที่ปนเปื้อนเชื้อโรค ที่พบผู้ป่วยตายจำนวนมาก เมื่อเทียบกับแหล่งน้ำอื่น ๆ ทำให้หมอตัดสินใจยกเลิกการใช้แหล่งน้ำนั้น ทำให้การแพร่ระบาดของโรคหยุดลง
1.4 ข้อมูลช่วยเพิ่มมูลค่าให้กับบริการหรือผลิตภัณฑ์ เรื่องของข้อมูลที่ดินที่เหมาะก้บการปลูกพืชชนิดใด จากการเก็บข้อมูลและประมวลผลผ่านระบบแผนที่เกษตรเพื่อการบริหารจุดการเชิงรุกออนไลน์ (Agri-Map online) ของสำนักงานเศรษฐกิจการเกษตร (สศก.) กระทรวงเกษตรและสหกรณ์ ทำให้สามารถเสนอทางเลือกในการปลูกพืชทดแทนที่เหมาะสมกับสภาพพื้นที่ ทางภูมิศาสตร์ แหล่งจำหน่ายและการตลาด ช่วยเกษตรกรเพิ่มมูลค่าให้กับผลิตภัณฑ์การเกษตรของตนเองได้
1.3 กระบวนการวิทยาการข้อมูล (data science process)
กระบวนการวิทยาการข้อมูล คือ ขั้นตอนในการดำเนินกิจกรรมเพื่อไม่ให้สับสนหรือพลาดประเด็นใดไป นักเรียนสามารถดำเนินการตามกระบวนการของวิทยาการข้อมูลที่ระบุขั้นตอนสำคัญต่าง ๆ ที่ประกอบด้วย การตั้งคำถาม การเก็บรวบรวมข้อมูล การสำรวจข้อมูล การวิเคราะห์ข้อมูล การสื่อสารและการทำผลลัพธ์ให้เป็นภาพสู้ผู้ใช้กลุ่มเป้าหมาย มีรายละเอียด ดังนี้
1.4 การคิดเชิงออกแบบ (design thinking) สำหรับวิทยาการข้อมูล
การคิดเชิงออกแบบ (design thinking) เป็นกระบวนการทำความเข้าใจปัญหาของผู้ใช้งานหรือกลุ่มเป้าหมาย จากมุมมองของหลาย ๆ คนเพื่อนำเสนอแนวทางแก้ไขปัญหาแบบใหม่ที่อาจไม่เคยคิดมาก่อน ผ่าน 5 ขั้นตอน ได้แก่ การเข้าใจ (Empathize) กำหนดปัญหา (Define) ระดมความคิด (Ideate) สร้างต้นแบบ (Prototype) และ ทดสอบ (Test) โดย Design Thinking ถือว่าเป็นกระบวนการสร้างนวัตกรรม หรือพัฒนาผลิตภัณฑ์ด้วยอย่างหนึ่ง
หลักการพื้นฐานของการคิดเชิงออกแบบ คือ
1) การมองในมุมมองของผู้ใช้ เอาใจเขามาใส่ใจเรา เพื่อสร้างความเข้าใจต่อผู้ใช้อย่างลึกซึ้ง และคิดต่อว่าต่องการทราบข้อมูลนี้ไปทำไม เพื่ออะไร
2) การลองผิดลองถูกและเรียนรู้ผ่านการทดลองกับกลุ่มผู้ใช้จริง เพื่อระดมความคิดจากมุมมองของหลาย ๆ คน สร้างเป็นแบบจำลองการใช้งาน สำหรับสือสารหรือพูดคุยกับผู้ใช้ ทำให้เห็นภาพสิ่งที่คิดนั้นชัดเจน
3) การทำซ้ำและปรับปรุง การออกแบบที่ดีมักผ่านการปรับปรุงแก้ไขหลายครั้ง ข้อคิดเห็นจากผู้ใช้เป็นสิ่งที่นักออกแบบคาดไม่ถึง การนำข้อมูลดังกล่าวมาปรับปรุงงานออกแบบจึงเป็นสิ่งที่สำคัญมาก และควรกล้าที่จะทดสอบ ลองผิดลองถูก
สรุปท้ายบท
จากการเปลี่ยนแปลงอย่างรวดเร็วของเทคโนโลยี จนเข้าสู่ยุคของข้อมูลและสารสนเทศที่มีข้อมูลเพิ่มมากขึ้นทุกวัน ทุกภาคส่วนมีการนำข้อมูลเหล่านี้มาใช้ประโยชน์ ทำให้ข้อมูลกลายเป็นสิ่งที่มีมูลค่ามหาศาล การดำเนินการกับข้อมูลเหล่านี้ผ่านกระบวนการวิทยาการข้อมูล ซึ่งประกอบด้วย การตั้งคำถาม การเก็บรวบรวมข้อมูล การสำรวจข้อมูล การวิเคราะห์ข้อมูล และสื่อสารและเผยแพร่ข้อมูลสู่ผู้ใช้กลุ่มเป้าหมาย ร่วมกับการคิดเชิงออกแบบนั้น สามารถก่อให้เกิดประโยชน์ทั้งในด้านการใช้ข้อมูลเพื่อช่วยเพิ่มมูลค่าให้กับบริการ หรือผลิตภัณฑ์ และในด้านการวิเคราะห์ปัญหาที่เกิดขึ้นในอดีต เพื่อนำไปสู่การตัดสินใจในการแก้ปัญหาที่เกิดขึ้น
เกร็ดน่ารู้