🥳 การวิเคราะห์ข้อมูล เป็นการดำเนินการกับข้อมูล เพื่อให้เกิดความเข้าใจข้อมูลเชิงลึกในสิ่งที่สนใจศึกษา โดยผลลัพธ์ของการวิเคราะห์ข้อมูลสามารถนำไปประกอบการตัดสินใจ เพื่อให้เกิดประโยชน์สูงสุดต่อการดำเนินการของบุคคล หรือองค์กร
"หลังจากที่นักเรียนได้รวบรวมข้อมูล และเตรียมข้อมูลมาแล้ว ขั้นต่อไป คือ การวิเคราะห์ข้อมูล ซึ่งจะช่วยให้นักเรียนมีความเข้าใจเชิงลึกเกี่ยวกับข้อมูล เช่น ความสัมพันธ์ รูปแบบ และแนวโน้ม ที่จะสามารถนำไปประกอบการตัดสินใจ ตอบคำถาม หรือตอบสมมติฐานที่ตั้งไว้ จึงกล่าวได้ว่า การวิเคราะห์ข้อมูล เป็นการเปลี่ยนข้อมูลให้มีคุณค่า โดยนำผลลัพธ์ที่ได้จากการวิเคราะห์มาใช้ประโยชน์"
ในยุคปัจจุบันมีข้อมูลเกิดขึ้นจำนวนมหาศาลทั้งจากภายในและภายนอกองค์กร ทั้งภาครัฐและเอกชน เช่น กระทรวง กรม กอง มหาวิทยาลัย โรงเรียน โรงพยาบาล ธนาคาร บริษัทประกันภัย และร้านค้า ข้อมูลจำนวนมากเหล่านั้นสามารถนำมาวิเคราะห์เพื่อให้เกิดประโยชน์สูงสุดได้ ความรู้ความเข้าใจเกี่ยวกับการวิเคราะห์ข้อมูลจึงเป็นสิ่งสำคัญ เพื่อความเข้าใจแนวคิดของการวิเคราะห์ข้อมูลเบื้องต้น ให้ศึกษาเหตุการณ์ตัวอย่างการดำรงชีวิตของสิงโตเจ้าป่าดังต่อไปนี้
สิงโตเจ้าปัญญาเป็นหัวหน้าฝูงสิงโตในป่าแห่งหนึ่งในแอฟริกาต้องการวางแผนการใช้ชีวิตในอีก 3 ปีข้างหน้าให้กับฝูงของตนเอง
สิงโตได้ติดต่อสุนัขจิ้งจอกที่ทำงานเป็นนักวิทยาศาสตร์ข้อมูล เพื่อวางแผนการต่าง ๆ ที่เกี่ยวข้องกับการดำรงชีวิตให้กับฝูงของตน ภายหลังจากที่ได้สอบถามสิงโตแล้ว ว่าคำถามที่ต้องการทราบเกี่ยวกับการดำรงชีวิตมีอะไรบ้าง งานแรกของสุนัขจิ้งจอกคือ การรวบรวมข้อมูลที่เกี่ยวข้องเพื่อจะตอบคำถามตามที่สิงโตต้องการ
สุนัขจิ้งจอก รวบรวมข้อมูล จากแหล่งที่มีการเผยแพร่ต่อสาธารณะ เช่น จำนวนวัวป่า (wildebeest) และจำนวนมาลาย (zebra) โดยสำนักงานสถิติป่า ข้อมูลอุณหภูมิของป่า ใช้ข้อมูลกรมอุตุนิยมวิทยาป่า
เมื่อได้ข้อมูลมาแล้ว ก่อนที่จะตอบคำถามใด ๆ สุนัขจิ้งจอกต้องทำความสะอาดข้อมูล เพื่อตรวจสอบก่อนว่ามีความผิดพลาดในข้อมูลหรือไม่ และข้อมูลมีความสมบูรณ์เพียงใด
ในกรณที่สุนัขจิ้งจอกต้องการวิเคราะห์ข้อมูลหลายประเภทจากหลายแหล่งพร้อมกัน สุนัขจิ้งจอกก็ต้องนำข้อมูลมาเชื่อมโยงให้ถูกต้องตรงกัน
หลังจากนั้นสุนัขจิ้งจอกต้องสำรวจข้อมูล เพื่อทำความเข้าใจกับรูปแบบลักษณะการกระจายและภาพรวมของข้อมูล
จากตัวอย่างดังกล่าว จะเห็นได้ว่าสุนัขจิ้งจอกช่วยสิงโตหาคำตอบโดยการวิเคราะห์ข้อมูลเพื่อดูสภาพรวมของป่าที่สิงโตอาศัยอยู่ และใช้ข้อมูลในการทำนายจำนวนเหยื่อ และการเกิดไฟป่าในอนาคต ซึ่งถ้าพิจารณาแล้วจะเห็นว่าสิงโตเจ้าปัญญามีคำถามอยู่ 3 แบบ คือ "เกิดอะไรขึ้น" "จะเกิดอะไรขึ้น" และ "ควรจะทำอะไร"
"สภาพป่าที่เราอาศัยอยู่เป็นอย่างไรบ้าง ยังอุดมสมบูรณ์ดีอยู่ไหม"
การวิเคราะห์เชิงพรรณา (descriptive analytics) เป็นการวิเคราะห์ขั้นพื้นฐาน ที่ทำให้เห็นภาพรวมของข้อมูลและความสัมพันธ์ระหว่างข้อมูล ช่วยอธิบายว่าเกิดอะไรขึ้นบางในช่วงที่ผ่านมา เพื่อช่วยในการตัดสินใจ เช่น การทำรายงานสรุปยอดขายรายเดือนของร้านสะดวกซื้อ ความสัมพันธ์ระหว่างยอดขายกับเทศกาลหรือฤดูกาล
"ฝูงของเราจะมีอาหารเพียงพอที่จะดำรงชีวิตอยู่ต่อไปได้อีกนานไหม และจะเกิดไฟป่าขึ้นเมื่อใด"
การวิเคราะห์เชิงทำนาย (predictive analytics) เป็นการวิเคราะห์ที่ช่วยในการคาดการณ์ หรือทำนายสิ่งที่น่าจะเกิดขึ้นในอนาคต โดยใช้ข้อมูลในอดีตมาช่วยในการทำนาย การทราบถึงความเป็นไปได้ของเกตุการณ์ที่จะเกิดขึ้นในอนาคต ทำให้บุคคลหรือองค์กรสามารถวางแผนการดำเนินงานที่มีประสิทธิภาพได้ เช่น การคาดการณ์ยอดขายในเทศกาลต่าง ๆ ทำให้ร้านค้าทราบถึงปริมาณสินค้าที่ควรจะสั่งซื้อ หรือจัดเก็บให้เพียงพอต่อความต้องการของลูกค้า
"เราควรจะทำอย่างไร ให้ดำรงชีวิตอยู่ได้อย่างยั่งยืน"
การวิเคราะห์เชิงแนะนำ (prescriptive analytics) เป็นการวิเคราะห์ต่อยอดจากการทำนายผลที่น่าจะเกิดขึ้น โดยการจำลองทางเลือกที่เป็นไปได้ของสถานการณ์ (simulation) และคาดการณ์ผลที่ได้ของแต่ละสถานการณ์ เพื่อแนะนำทางเลือกที่เหมาะสมที่สุดกับสถานการณ์ที่จะเป็นไปได้ เช่น การเลือกวิธีการโฆษณาสินค้าที่จะทำให้ได้ยอดขายสูงที่สุด
โดยสรุป การวิเคราะห์ข้อมูลนอกจากจะทำให้เห็นภาพรวมของข้อมูลแล้ว ยังช่วยในการคาดการณ์ผลในอนาคตและแนะนำทางเลือกที่เหมาะสมที่สุดสำหรับการตัดสินใจของบุคคลหรือองค์กร
โดย การวิเคราะห์เชิงพรรณนา เป็นการวิเคราะห์ขั้นพื้นฐาน การวิเคราะห์เชิงทำนาย เป็นการวิเคราะห์เพื่อทำนายสิ่งที่อาจจะเกิดขึ้นในอนาคต ส่วน การวิเคราะห์เชิงแนะนำ เป็นการวิเคราะห์ที่ต่อยอดมาจากการวิเคราะห์เชิงพรรณนาและเชิงทำนาย โดยใช้ทักษะการแก้ปัญหาและวางแผน
การวิเคราะห์ของคอมพิวเตอร์ที่เลียนแบบกระบวนการคิดและการรู้จำของมนุษย์ โดยผสมศาสตร์ต่าง ๆ เช่น ปัญญาประดิษฐ์ (Artificial Intelligence: AI) และการประมวลผลภาษาธรรมชาติ (Natural Language Processing: NLP) ทำให้สามารถประมวลผลและวิเคราะห์ข้อมูลจำนวนมหาศาล และหลากหลายรูปแบบ ได้อย่างรวดเร็ว เช่น เอกสาร รายงาน รูปภาพ ไฟล์เสียง วิดีโอ อาจกล่าวได้ว่า การวิเคราะห์เชิงปัญญานี้ เป็นการเพิ่มศักยภาพของคอมพิวเตอร์ให้สามารถทำการวิเคราะห์ข้อมูลทั้งสามระดับได้อย่างมีประสิทธิภาพ ซึ่งทำให้องค์กรธุรกิจสามารถใช้ข้อมูลในการตัดสินใจได้อย่างถูกต้องและแม่นยำมากขึ้น
เป็นระบบคอมพิวเตอร์ที่สามารถวิเคราะห์ข้อมูลทางการแพทย์ของผู้ป่วยมะเร็ง โดยใช้ข้อมูลผู้ป่วยมะเร็งในอดีตหลายพันคน เอกสารทางวิชาการกว่า 15 ล้านรายการ ตำราแพทย์กว่า 300 เล่ม เพื่อระบุทางเลือกในการรักษาที่เหมาะสมให้กับผู้ป่วยแต่ละรายได้