ข้อมูลมีคุณค่า
ข้อมูลมีคุณค่า
Big Data คืออะไร
Big Data คือ การนำข้อมูลที่มีปริมาณมาก ๆ มาผ่านการประมวลผล การวิเคราะห์ และแสดงผลด้วยวิธีที่เหมาะสม ไม่ว่าจะเป็นข้อมูลด้านการเงิน ข้อมูลการดำเนินงาน ข้อมูลเกี่ยวกับผู้รับบริการข้อมูลเกี๋ยวกับบุคลากร รวมไปถึงข้อมูลที่ได้มีการจัดเก็บในระบบฐานข้อมูลซึ่งจะมีปริมาณที่เพิ่ม
มากขึ้นเรื่อย ๆ จนมากมายมหาศาล ทำให้ไม่สามารถใช้วิธีการจัดการทั่วไปได้อย่างมีคุณภาพจึงต้องใช้แนวคิด Big Data ในการจัดการแทน
ในปัจจุบันขนาดข้อมูลที่ถือว่ามีขนาดใหญ่มาก เริ่มต้นที่ขนาดมากกว่า Terabyte ขึ้นไป (เท่ากับ 1,024 Gigabyte) ถัดขึ้นไปก็เป็น Petabyte (เท่ากับ 1,024 Terabyte) และ Exabyte (เท่ากับ 1,024 Petabyte) โดยการจัดเก็บข้อมูลทั้งที่เป็นแบบ Structured หรือUnstructured ก็ได้
คุณลักษณะของ Big Data
Big Data จะมีคุณลักษณะสำคัญ 3 ประการ หรือ เรียก 3Vs Model
1. ปริมาตร (Volume) : ข้อมูลที่มีปริมาณมหาศาล
2. อัตราเพิ่มขึ้นของข้อมูล (Velocit) : จะมีการเปลี่ยนแปลงตลอดเวลาและรวดเร็ว มักเป็น
แบบ Real-time เช่น ข้อมูลจาก Social Media ข้อมูลการทำธุรกรรมการทางเงิน เป็นต้น
3. รูปแบบที่หลากหลาย (Variet) : ข้อมูลมีรูปแบบที่หลากหลายทั้งที่เป็นรูปแบบมีโครงสร้าง
(จัดเก็บในระบบฐานข้อมูล) ไม่มีโครงสร้าง (เช่น ไฟล์รูปภาพ วิดีโอ เป็นต้น) หรือกึ่งโครงสร้าง
ประโยชน์ของ Big Data
Big Data มีประโยชน์มากมายหลายประการแต่ที่เห็นได้ชัดเจนมีอยู่ 2 ประการ คือ
1. การวิเคราะห์ข้อมูลที่ทำให้เห็นความรู้ที่ซ่อนอยู่ เช่น ข้อมูลสภาพอากาศจากเครื่องมือตรวจวัดจำนวนมาก ทั้งดาวเทียม เรดาร์ทุ่นในมหาสมุทร ทำให้สามารถพยากรณ์อากาศได้อย่างแม่นยำ
2. การเกิดผลิตภัณฑ์หรือบริการใหม่ ๆ ที่เหมาะสมตามความต้องการของผู้ใช้ ทำให้เกิดความพึงพอใจและประทับใจในบริการจะเห็นได้ว่าข้อมูลด้านต่าง ๆ ที่กระจัดกระจายซึ่งมีอยู่มากมายมหาศาล เมื่อนำเอาแนวคิดBig Data มาวิเคราะห์ประมวลผลทำให้เกิดประโยชน์อย่างมากต่อองค์กรและผู้รับบริการ
“องค์กรทั้งภาครัฐ และภาคธุรกิจ ล้วนแล้วแต่ใช้ประโยชน์จากข้อมูล เพื่อนำไปสู่การตัดสินใจในการแก้ปัญหาที่อาจไม่สามารถแก้ไขได้ในอดีต กระบวนการวิทยาการข้อมูลมีการนำข้อมูลที่เกี่ยวข้องมาวิเคราะห์ (data analytics) เพื่ออธิบายค้นหาคำตอบ หรือทำนายปรากฏการณ์ที่เกิดขึ้น การทำข้อมูลให้เป็นภาพ (data visualization) หรือการเล่าเรื่องราวที่เกิดจากข้อมูล(data story telling) ทำให้ผู้ใช้ได้รับความรู้และเข้าใจข้อมูลได้ง่าย ดังนั้น การเรียนรู้เกี่ยวกับการใช้ประโยชน์และการนำเสนอข้อมูลที่เกิดขึ้น จึงเป็นสิ่งสำคัญและจำเป็นสำหรับนักเรียนในยุคนี้”
Data Analytics คือ การวิเคราะห์ข้อมูลต่างๆ เพื่อช่วยให้ธุรกิจสามารถบรรลุวัตถุประสงค์ โดยข้อมูลที่นำมาใช้มีทั้งข้อมูลในอดีต ปัจจุบัน รวมไปถึงการพยากรณ์ข้อมูลในอนาคต เพื่อใช้ในการกำหนดกลยุทธ์ต่างๆ ข้อมูลเหล่านี้ถือว่าเป็นข้อมูลที่สำคัญของธุรกิจ เพราะสามารถใช้สร้างศักยภาพให้กับธุรกิจได้
ประเภทของ Data Analytics
Descriptive analytics คือ การพรรณาข้อมูลจากอดีต เพื่อให้เห็นว่าเกิดอะไรขึ้นบ้างในอดีตในรูปแบบที่ง่ายที่สุด และคาดการณ์ถึงเหตุการณ์ที่จะเกิดขึ้นในอนาคต เช่น รายงานการขาย และรายงานผลการดำเนินการ เป็นต้น
Diagnostic analytics คือ การวิเคราะห์เหตุผลว่าทำไมเหตุการณ์ต่างๆจึงเกิดขึ้นจากปัจจัยต่างๆ และความสัมพันธ์ของปัจจัย หรือตัวแปรต่างๆ เช่น ความสัมพันธ์ของยอดขาย และแคมเปญต่างๆ
Predictive analytics คือ การทำนายสิ่งที่จะเกิดขึ้นในอนาคต โดยใช้ข้อมูลที่รวบรวมมาแล้วนำมาสร้างแบบจำลองทางสถิติ หรือเทคโนโลยีปัญญาประดิษฐ์ (AI) เช่น พยากรณ์ยอดขาย การพยากรณ์ผลประชามติ เป็นต้น
Prescriptive analytics คือ การสรุปข้อมูลเพื่อนำไปใช้ปรับปรุง สร้างการตอบสนองต่อความต้องการของกลุ่มเป้าหมาย หรือหลีกเลี่ยงปัญหาเดิมที่อาจะเกิดซ้ำๆ และเป็นการวางแผนการทำงานในอนาคตไว้ โดยมีการคาดการณ์ผลลัพธ์ไว้ล่วงหน้า
ประโยชน์ของ Data Analytics
ช่วยในการตัดสินใจจากการใช้ข้อมูลเชิงลึก นำมาคาดเดาการวางแผนแคมเปญการตลาด และเลือกสร้างคอนเทนต์ที่เหมาะสม อีกทั้งยังช่วยพัฒนาผลิตภัณฑ์ในตอบสนองความต้องการของกลุ่มเป้าหมายมากยิ่งขึ้น
สร้างแคมเปญการตลาดมีประสิทธิภาพมากยิ่งขึ้น เพราะสามารถเข้าใจกลุ่มเป้าหมายได้มากขึ้น รวมไปถึงเข้าใจแนวโน้มพฤติกรรมของกลุ่มเป้าหมาย ทำให้สามารถสร้างแคมเปญมารองรับพฤติกรรมเหล่านั้นได้
ช่วยสร้างบริการ และสร้างความสัมพันธ์กับลูกค้าได้ดีมากยิ่งขึ้น
ช่วยปรับปรุงกระบวนการทำงาน ต้นทุนต่ำลง แต่เพิ่มผลกำไรได้มากขึ้น เพราะเข้าใจถึงสิ่งที่ลูกค้าต้องการ ทำให้ไม่ต้องเสียเวลาในการค้นคว้าหากลยุทธ์ที่เหมาะสม
ลดกระบวนการทำงานที่ซับซ้อน ทุก ๆ ฝ่ายสามารถทำงานร่วมกันได้อย่างรวดเร็ว และสร้างผลงานที่มีประสิทธิภาพได้มากขึ้น
สามารถใช้ตรวจสอบความผิดปกติในการทำงาน และแก้ไขได้อย่างทันท่วงที เพราะข้อมูลต่าๆสามารถช่วยวิเคราะห์ คัดกรอง และสรุปได้แบบเรียลไทม์
ในยุคของข้อมูลและสารสนเทศ ข้อมูลเป็นสิ่งที่มีความสำคัญอย่างยิ่ง และถูกนำมาใช้ประโยชน์ในด้านต่าง ๆ เช่น ด้านเศรษฐกิจ การศึกษา สาธารณสุข สิ่งแวดล้อม การเกษตรและการคมนาคม การจัดเก็บข้อมูลในรูปแบบเดิมทำให้การนำข้อมูลมาใช้ไม่สะดวก ไม่ทันกาล สูญหายง่าย แต่การจัดเก็บข้อมูลในรูปแบบดิจิทัล (digitization) และพัฒนาการของการสื่อสารบนอินเทอร์เน็ต ช่วยแก้ปัญหาเหล่านี้ ทำให้ผู้ใช้สามารถเข้าถึงข้อมูลและสารสนเทศได้ทุกที่ทุกเวลา ตัวอย่างเช่น การใช้แผนที่กระดาษในรูปแบบเดิม จะแสดงตำแหน่งของสถานที่ต่าง ๆ แต่จะไม่แสดงข้อมูลการจราจรที่เป็นปัจจุบันทำให้ผู้ใช้ไม่สามารถวางแผนการเดินทางได้ แต่ระบบแผนที่นำทาง (Global Positioning System: GPS) นอกจากจะแสดงตำแหน่งของสถานที่ต่าง ๆ แล้ว ยังมีข้อมูลเกี่ยวกับสภาพการจราจร ระยะเวลาที่ต้องใช้ในการเดินทางถึงจุดหมาย ช่วยทำให้ผู้ใช้วางแผนการเดินทางได้อย่างแม่นยำเป็นการประหยัดทั้งเวลาและค่าใช้จ่าย
ทั้งนี้ ในปัจจุบันเราไม่เป็นเพียงผู้ใช้ประโยชน์ข้อมูลดิจิทัลเท่านั้น แต่ยังเป็นหนึ่งในผู้ร่วมสร้างข้อมูลดิจิทัลด้วยเช่นกัน ตัวอย่างเช่น การอัพโหลดรูปภาพส่วนตัว การส่งอีเมลในแต่ละวัน การโพสต์ข้อความในสื่อสังคมออนไลน์ การส่งต่อข้อความ โดยผ่านการใช้อุปกรณ์อิเล็กทรอนิกส์ต่าง ๆ เช่น คอมพิวเตอร์ โน้ตบุ๊กโทรศัพท์มือถือ หรือแม้กระทั่งเซ็นเซอร์ที่ติดกับอุปกรณ์ต่าง ๆ ซึ่งผู้ใช้คนอื่นสามารถนำข้อมูลดิจิทัลเหล่านี้ไปใช้ประโยชน์ต่อได้อาจจัดได้ว่าข้อมูลเหล่านี้เป็นสินทรัพย์ (asset) ที่มีความสำคัญ แต่ถ้าข้อมูลที่มีอยู่ไม่ได้ถูกนำมาประมวลผลก็จะไม่เกิดคุณค่าใด ๆ ดังเช่นคำกล่าวว่า “ข้อมูลนั้นมีค่าดั่งน้ำมันดิบ”
ข้อมูลเปรียบเสมือนน้ำมันดิบ ถึงจะมีค่าแต่ก็ใช้ประโยชน์ไม่ได้ ถ้ายังไม่ได้กลั่น Data is just like crude. It’s valuable, but if unrefined it cannot really be used – Clive Humby (2006)
ในแต่ละวันประชากรกว่าร้อยล้านคนบนโลกถ่ายภาพจากโทรศัพท์มือถือ ส่งอีเมล ส่งข้อความ สร้างวิดีโอ และข้อมูลที่เกี่ยวข้องกับการดำเนินธุรกิจ โดยปริมาณข้อมูลที่สร้างขึ้นในแต่ละวันนั้นคิดเป็น 2.5 เอกซะไบต์ (Exabyte-1018) ขนาดของข้อมูลนี้เทียบเท่ากับจำนวนเพลง 530 ล้านเพลง หรือไฟล์วิดีโอความละเอียดคมชัด (HighDefinition) ความยาว 90 ปี หรือถ้านำข้อมูลนี้บันทึกลงแผ่นบลูเรย์ (blu-ray) ต้องใช้แผ่นบลูเรย์ประมาณ 10 ล้านแผ่น ซึ่งถ้านำแผ่นทั้งหมดนี้มาเรียงซ้อนกันจะมีความสูงเท่ากับ 4 เท่าของหอไอเฟล
ด้วยปริมาณข้อมูลที่สร้างขึ้นในปัจจุบัน มีการคาดการณ์ว่าในปี พ.ศ. 2563 ปริมาณข้อมูลบนโลกจะมีขนาดประมาณ 44 เซททะไบต์ (Zetabyte)
บริษัทต่าง ๆ ได้มีการนำข้อมูลดิจิทัลมาใช้ประโยชน์ทำให้เกิดมูลค่ามหาศาล เช่น บริษัทที่ให้บริการจองโรงแรมที่พัก รถแท็กซี่ ขายสินค้าออนไลน์ และบริการสื่อสังคม (social media)
เฟซบุ๊ก (Facebook) เป็นบริษัทที่เปิดให้บริการสื่อสังคม ที่มีผู้ใช้หลายล้านคนทั่วโลกโดยไม่คิดค่าใช้จ่าย แต่สามารถสร้างรายได้จากการขายโฆษณาที่ตรงกับกลุ่มเป้าหมาย (user-targeted advertisements) ของสินค้าและบริการ โดยรวบรวมข้อมูลจากผู้ใช้ เช่น เพศ อายุ ที่อยู่ อาชีพ รวมถึงพฤติกรรมการใช้งานที่ผู้ใช้กระทำผ่านเฟซบุ๊ก ไม่ว่าจะเป็นการกดไลค์ (like) กดแชร์ (share) ข้อความ ภาพ หรือวิดีโอ เฟซบุ๊กจะนำข้อมูลเหล่านี้มาประมวลผลเป็นสารสนเทศที่บอกคุณลักษณะของผู้ใช้ และใช้สารสนเทศนี้ในการนำเสนอหรือโฆษณา สินค้าหรือสิ่งของที่ผู้ใช้สนใจ บริษัทที่เป็นเจ้าของสินค้าหรือผลิตภัณฑ์นั้นจะจ่ายค่าโฆษณาให้กับเฟซบุ๊ก เช่น บริษัทในกลุ่มธุรกิจรถยนต์ ธนาคาร อาหาร-เครื่องดื่ม โทรศัพท์มือถือ ซูเปอร์มาร์เก็ต และเกมออนไลน์
จากที่มีการนำข้อมูลดิจิทัล ซึ่งมีอยู่มหาศาล ณ ขณะนี้ มาใช้ประโยชน์ในด้านต่าง ๆ ความรู้ด้านวิทยาการข้อมูลจึงมีบทบาทสำคัญ และอาชีพนักวิทยากาศาสตร์ข้อมูลก็เป็นอาชีพที่น่าสนใจ และได้รับความนิยมเป็นอย่างมากในยุคของข้อมูลและสารสนเทศนี้
นักวิทยาศาสตร์ข้อมูล คือ ผู้ที่มีความสามารถในการค้นหา วิเคราะห์ ค้นพบสิ่งที่น่าสนใจ น่สงสัย และเป็นประโยชน์ในโลกที่เต็มไปด้วยข้อมูลขนาดใหญ่จำนวนมหาศาล (Big data) นักวิทยาศาสตร์ข้อมูลมีหน้าที่ในการจัดการกับข้อมูลที่มีปริมาณมาก ยุ่งยาก และหลากหลาย โดยทำการวิเคราะห์ ค้นหารูปแบบความสัมพันธ์ของข้อมูล และนำเสนอข้อมูลเหล่านั้นออกมาในรูปแบบที่ผู้อื่นเข้าใจง่าย ทำให้เกิดเป็นองค์ความรู้ และสามารถนำไปใช้ในการตัดสินใจได้
วิทยาการข้อมูล (Data Science) เป็นศาสตร์ที่เกี่ยวกับการจัดการ จัดเก็บ รวบรวม ตรวจสอบ วิเคราะห์ วิจัย และนำเสนอผลการวิเคราะห์ข้อมูลเพื่อนำไปสู่ความรู้ที่สามารถนำไปใช้งานได้จริง อย่างเช่น การปรับปรุงผลิตภัณฑ์ กระบวนการดำเนินงาน ประกอบการตัดสินใจทางธุรกิจ การวางแผนการตลาด และทิศทางขององค์กรในอนาคตโดยหลักการแล้ววิทยาการข้อมูล ประกอบขึ้นจากองค์ความรู้หลัก ๆ คือ ทักษะด้านวิทยาการคอมพิวเตอร์ เช่น การเขียนโปรแกรมคอมพิวเตอร์ การจัดการฐานข้อมูล เทคโนโลยี Big Data ทักษะทางด้านคณิตศาสตร์และสถิติศาสตร์ และทักษะการนำเสนอข้อมูล วิทยาการข้อมูลเป็นการค้นพบสิ่งที่ไม่เคยรู้มาก่อนจากข้อมูลที่ได้ เช่น รูปแบบการทำนาย (Predictive Model) เพื่อนำไปปฏิบัติจริง การสร้างผลิตภัณฑ์ทางข้อมูล (Data Product) ที่จะส่งผลต่อธุรกิจ
นักวิทยาศาสตร์ข้อมูล จึงเป็นอาชีพเกิดใหม่ในโลกแห่งการจัดการข้อมูล ที่มาของ นักวิทยาศาสตร์ข้อมูล (Data Scientist) ตำแหน่งงานด้านนี้ถูกตั้งขึ้นโดย DJ Patil และ Jeff Hammerbacher ในปี 2008 โดยทั้งคู่เป็น ผู้บุกเบิกการสร้างทีมวิทยาการข้อมูลที่ LinkedIn และ Facebook และตอนนี้ DJ Patil ได้รับแต่งตั้งให้เป็น Chief Data Scientist of the United States ในปัจจุบัน ในปี 2012 วารสาร Harward Business Review ตีพิมพ์บทความชื่อ Data Scientist: The Sexiest Job of the 21st Century ทำให้อาชีพนี้กลายเป็นที่กล่าวถึงในวงการธุรกิจและวงการสื่อ และทำให้เกิดความต้องการจ้างงานจากวงการธุรกิจสูง จนขาดแคลนบุคลากรทางด้านนี้เป็นอย่างมาก ถือเป็นอาชีพที่เกิดขึ้นอย่างฉับพลันในวงการธุรกิจ โดยทักษะที่จำเป็นสำหรับนักวิทยาศาสตร์ข้อมูล มีทักษะดังนี้
ทักษะการเรียนรู้ภาษาของเครื่อง (Machine Learning) คือระบบที่สามารถเรียนรู้ได้จากตัวอย่างด้วยตนเองโดยปราศจากการป้อนคำสั่งของโปรแกรมเมอร์ ความก้าวหน้าในครั้งนี้มาพร้อมกับความคิดที่ว่าเครื่องคอมพิวเตอร์สามารถเรียนรู้เพียงแค่จากข้อมูลอย่างเดียวเพื่อที่จะผลิตผลลัพธ์ที่แม่นยำออกมาได้ โดยการทำให้ระบบคอมพิวเตอร์เรียนรู้ได้ด้วยตนเอง โดยใช้ข้อมูล ซึ่งมันแตกต่างกับการเขียนโปรแกรมทั่วไป เพราะการเขียนโปรแกรมจะใส่ ข้อมูล (Data) และโปรแกรมเข้าไปเพื่อให้ได้ผลลัพธ์แต่ การเรียนรู้ภาษาของเครื่อง เราไม่ได้โปรแกรมคำตอบ เราใส่ข้อมูล และ ผลลัพธ์ เข้าไป เพื่อให้หาโปรแกรมที่จะนำไปตอบในอนาคตได้ว่าหากป้อนข้อมูลแบบนี้ผลลัพธ์ในอนาคตจะเป็นอะไร
ทักษะด้านวิทยาการคอมพิวเตอร์ หรือ วิทยาศาสตร์คอมพิวเตอร์ (Computer science) เป็นศาสตร์เกี่ยวกับการศึกษาค้นคว้าทฤษฎีการคำนวณสำหรับคอมพิวเตอร์ และทฤษฎีการประมวลผลสารสนเทศ ทั้งด้านซอฟต์แวร์ ฮาร์ดแวร์ และ เครือข่าย ซึ่งวิทยาการคอมพิวเตอร์นั้นประกอบด้วยหลายหัวข้อที่เกี่ยวข้องกับคอมพิวเตอร์ ตั้งแต่ระดับนามธรรม หรือความคิดเชิงทฤษฎี เช่น การวิเคราะห์และสังเคราะห์ขั้นตอนวิธี ไปจนถึงระดับรูปธรรม เช่น ทฤษฎีภาษาโปรแกรม ทฤษฎีการพัฒนาซอฟต์แวร์ ทฤษฎีฮาร์ดแวร์คอมพิวเตอร์ และ ทฤษฎีเครือข่าย ในแง่ของศาสตร์เกี่ยวกับคอมพิวเตอร์นั้น วิทยาการคอมพิวเตอร์เป็นหนึ่งในห้าสาขาที่เกี่ยวกับคอมพิวเตอร์ ซึ่งประกอบด้วย วิทยาการคอมพิวเตอร์ เทคโนโลยีสารสนเทศ ระบบสารสนเทศ วิศวกรรมซอฟต์แวร์ และวิศวกรรมคอมพิวเตอร์
ทักษะด้านคณิตศาสตร์และสถิติ ทักษะที่ความรู้ศาสตร์ด้านคณิตศาสตร์และสถิติมาวิเคราะห์ คำนวณ อาจจะเป็นข้อมูลเชิงปริมาณหรือเชิงคุณภาพ โดยมีการเก็บรวบรวมข้อมูล การนำเสนอข้อมูล การวิเคราะห์โดยใช้หลักการทางคณิตศาสตร์ และการนำผลการวิเคราะห์มาสรุปทางสถิติอย่างถูกต้องและลึกซึ้งทั้งทางด้านทฤษฎีและการนำไปประยุกต์ใช้ โดยเน้นการคำนวณและทฤษฎีเป็นหลัก ทฤษฎีสถิติ แคลคูลัส ทฤษฎีการตัดสินใจ คณิตศาสตร์การเงิน แนวคิดหลักมูลทางคณิตศาสตร์ การวิเคราะห์เชิงตัวเลข สถิติประชากรเบื้องต้น ความรู้เบื้องต้นเกี่ยวกับสถิติที่ไม่ใช้พารามิเตอร์ การวิจัยดำเนินงาน เป็นต้น
ทักษะเฉพาะสาขา (Domain Knowledge) เป็นความรู้ในงานเฉพาะด้าน เช่นการจัดการข้อมูลด้านสาธารณสุข มีความจำเป็นต้องมีความรู้เรื่องของข้อมูลสารสนเทศด้านสาธารณสุข หรือลักษณะงานที่ต้องดำเนินการเช่น ข้อมูลด้านระบาดวิทยา ข้อมูลด้านสาธารณสุขมูลฐาน ข้อมูลด้านอัตรากำลังสาธารณสุข เป็นต้น หรือเเม้กระทั่งด้านการเงินธนาคาร การประกันภัยที่นักวิทยาศาสตร์ข้อมูลจำปฏิบัติงานจำเป็นที่จำต้องมีองค์ความรู้ด้านการเงินการธนาคารในระดับพื้นฐาน ตามหน่วยงานหรือองค์กรต้องการองค์ความรู้ หรือแม้แต่หากจะทำงานในหน่วยงานองค์กรด้านการศึกษาก็มีความจำเป็นที่จะต้องมีองค์ความรู้ด้านการศึกษา เพื่อเป็นพื้นฐานในการจัดการข้อมูล วิเคราะห์ปัญหา และพัฒนาองค์ความรู้ของหน่วยงานที่นักวิทยาศาสตร์ข้อมูลทำงานอยู่
ทักษะความคิดสร้างสรรค์ เป็นทักษะที่เป็นที่มาของวิธีการใหม่ ๆ นวัตกรรมหรือสินค้าใหม่ ๆ ที่ผู้อื่นหรือที่อื่นไม่มี ทำให้องค์กรนั้นประสบความสำเร็จมากกว่า เช่น องค์กรมีข้อมูลที่เยอะและหลากหลาย นักวิทยาศาสตร์ข้อมูล จะต้องเอาข้อมูลนั้นมาสร้างผลิตภัณฑ์ใหม่ ๆ ลูกค้า พัฒนาแอปพลิเคชันที่สนองตอบต่อด้านข้อมูลขอลูกค้า เป็นต้น ความคิดสร้างสรรค์เป็นความสามารถของมนุษย์ที่คิดได้กว้างไกลหลายแง่มุมหลายทิศทาง นำไปสู่การคิดประดิษฐ์สิ่งของและเกิดแนวทางการแก้ปัญหาต่าง ๆ ซึ่งเป็นผลจากการทำงานของสมอง ในส่วนที่เกี่ยวกับอารมณ์ความรู้สึกหรือสมองซีกขวา ซึ่งสามารถเกิดขึ้นได้จากการไม่ยึดติดกับกรอบความคิดเดิม กฎเกณฑ์เดิม ความคิดสร้างสรรค์คิดได้หลายแง่มุม คิดได้มากที่สุดเท่าที่จะคิดได้ ความคิดสร้างสรรค์จึงเป็นการมองปัญหาในแนวกว้างผู้ที่มีความคิดสร้างสรรค์จะมีลักษณะสำคัญ 4 ประการ ได้แก่ ความคิดริเริ่ม ความยืดหยุ่นในการคิด ความคิดคล่องแคล่ว ความคิดละเอียดลออ
นักวิทยาศาสตร์ข้อมูลจึงเป็นอาชีพเกี่ยวกับการจัดการ จัดเก็บ รวบรวม ตรวจสอบ วิเคราะห์ วิจัย และนำเสนอผลการวิเคราะห์ข้อมูลเพื่อนำไปสู่ความรู้ที่สามารถนำไปใช้งานได้จริง โดยอาศัยทักษะที่มีความจำเป็นต่ออาชีพ ได้แก่ ทักษะการเรียนรู้ภาษาของเครื่อง ทักษะด้านวิทยาการคอมพิวเตอร์ ทักษะด้านคณิตศาสตร์และสถิติ ทักษะเฉพาะสาขา ทักษะความคิดสร้างสรรค์ ที่จะทำให้นักวิทยาศาสตร์ข้อมูลพัฒนางานและองค์ความรู้ด้านวิทยาการข้อมูลออกมาอย่างหลากหลาย สร้างนวัตกรรมด้านวิทยาการข้อมูลให้กับหน่วยงานและองค์กรไปใช้ประโยชน์ได้ โดยอาศัยข้อมูลที่องค์กรรวบรวมจัดเก็บ และสามารถนำมาพัฒนานาต่อยอดสร้างนวัตกรรมได้
วิทยาการข้อมูล (Data Science) เป็นสหสาขาวิชาที่ใช้วิธีการ กระบวนการ อัลกอริทึม และระบบทางวิทยาศาสตร์มาใช้เพื่อหาความรู้จากข้อมูลหลากหลายรูปแบบ ทั้งจัดเก็บเป็นระเบียบและไม่เป็นระเบียบ เป็นสาขาที่เกี่ยวข้องกับการทำเหมืองข้อมูล (Data Mining) การเรียนรู้เชิงลึก (Deep Learning) และข้อมูลมหัต (Big Data) โดยเป็นการบูรณาการสถิติศาสตร์ การวิเคราะห์ข้อมูล และการเรียนรู้ของเครื่องเข้าด้วยกันเพื่อให้สามารถเข้าใจและวิเคราะห์ปรากฏการณ์ที่เกิดขึ้นจริงในข้อมูลได้ โดยใช้เทคนิคและทฤษฎีที่ได้มาจากคณิตศาสตร์ สถิติศาสตร์ วิทยาการคอมพิวเตอร์ และวิทยาการสารสนเทศ
วิทยากรข้อมูลนำข้อมูลมาการจัดการ จัดเก็บ รวบรวม ตรวจสอบ วิเคราะห์ วิจัย และนำเสนอผลการวิเคราะห์ข้อมูลเพื่อนำไปสู่ความรู้ที่สามารถนำไปใช้งานได้จริง อย่างเช่น การปรับปรุงผลิตภัณฑ์ กระบวนการดำเนินงาน ประกอบการตัดสินใจทางธุรกิจ การวางแผนการตลาด และทิศทางขององค์กรในอนาคต วิทยาการข้อมูลเป็นการค้นพบสิ่งที่ไม่เคยรู้มาก่อนจากข้อมูลที่ได้ เช่น รูปแบบการทำนาย (Predictive Model) เพื่อนำไปปฏิบัติจริง การสร้างผลิตภัณฑ์ทางข้อมูล (Data Product) ศึกษาถึงกระบวนการ วิธีการ หรือเทคนิค ในการนำข้อมูลจำนวนมหาศาลมาประมวลผล เพื่อให้ได้องค์ความรู้ เข้าใจ ปรากฏการณ์หรือตีความ ทำนายพยากรณ์ ค้นหารูปแบบหรือแนวโน้มจากข้อมูล และสามารถนำมาวิเคราะห์ต่อยอดเพื่อแนะนำทางเลือกที่เหมาะสม หรือใช้ในการตัดสินใจเพื่อประโยชน์สูงสุดที่จะส่งผลต่อธุรกิจ
จากที่กล่าวมาข้างต้นวิทยาการข้อมูล เป็นสาขาที่เกี่ยวข้องกับการทำเหมืองข้อมูล การเรียนรู้เชิงลึก และข้อมูลขนาดใหญ่ จึงขอกล่าวอธิบายพอสังเขป เพื่อขยายภาพวิทยาการข้อมูล ให้ชัดเจนยิ่งขึ้น ดังนี้
1. การทำเหมืองข้อมูล (Data Mining)
การทำเหมืองข้อมูล คือกระบวนการค้นหาสารสนเทศหรือข้อความรู้ที่อยู่ในฐานข้อมูลขนาดใหญ่ที่ซับซ้อน เพื่อนำข้อความรู้ที่ได้ไปใช้ประโยชน์ในการตัดสินใจ สารสนเทศที่ได้อาจนำมาสร้างการพยากรณ์หรือ สร้างตัวแบบสำหรับการจำแนกหน่วยหรือกลุ่ม หรือแสดงความสัมพันธ์ระหว่างหน่วยต่าง ๆ หรือให้ข้อสรุปของสาระในฐานข้อมูล การทำเหมืองข้อมูลประกอบขึ้นด้วยการนำกระบวนการทางสถิติและการเรียนรู้ผ่านระบบคอมพิวเตอร์ เพื่อสร้างตัวแบบ กฎเกณฑ์ รูปแบบ การพยากรณ์และข้อความรู้จากฐานข้อมูลขนาดใหญ่ โดยการทำเหมืองข้อมูลมีขั้นตอนการดำเนินงานหลายขั้นตอนซึ่งต้องอาศัยเทคนิคหรือวิธีการต่าง ๆ เช่น วิธีการจัดกลุ่ม การค้นหาความสัมพันธ์ การพยากรณ์ เป็นต้น การดำเนินงานมักอยู่ในลักษณะของการสร้างตัวแบบ (modeling) ที่อธิบายความเป็นไปหรือสภาพการณ์หนึ่งที่เกิดขึ้นแล้ว หรือที่เราทราบคำตอบ แล้วนำตัวแบบนี้มาใช้อธิบายสถานการณ์ที่ยังไม่เกิดขึ้น หรือที่ไม่ทราบคำตอบ ตัวแบบเหล่านี้อาจเป็นตัวแบบที่เรียบง่ายไปจน ถึงตัวแบบที่ยุ่งยากซับซ้อน และอาจใช้การผสมผสานแนวคิดหรือเครื่องมือต่าง ๆ เข้าด้วยกันเพื่อที่จะสามารถ สกัดข้อความรู้ที่อยู่ในข้อมูลขนาดใหญ่ได้ โดยใช้เทคโนโลยีคลังข้อมูล (Data Warehouse) เข้ามาช่วยในการจัดการข้อมูลเพื่อเพิ่มประสิทธิภาพของการทำเหมืองข้อมูล ดังนั้น ถ้ามีฐานข้อมูลขนาดใหญ่ที่มีข้อมูลคุณภาพดี เทคโนโลยีการทำเหมืองข้อมูลจะช่วยในการค้นหรือแสวงหาโอกาสทางธุรกิจใหม่ โดยการทำเหมืองข้อมูลจะก่อให้เกิดกระบวนการอัตโนมัติในการค้นพบสารสนเทศหรือข้อความรู้ในฐานข้อมูลขนาดใหญ่ ด้วยการใช้วิธีการเช่นการพยากรณ์แนวโน้มและพฤติกรรมการบริโภคแบบอัตโนมัติ หรือเกิดกระบวนการอัตโนมัติในการค้นพบรูปแบบที่ไม่เคยรู้จักมาก่อน ด้วยการใช้วิธีการค้นหาเข้าไปในรายละเอียดของฐานข้อมูลเพื่อหารูปแบบที่ ซ่อนอยู่ในฐานข้อมูลนั้น
2. การเรียนรู้เชิงลึก (Deep Learning)
การเรียนรู้เชิงลึก เป็นสาขาหนึ่งของ การเรียนรู้ภาษาของเครื่อง ที่พัฒนาอัลกอริทึมขึ้นมาเพื่อการเรียนรู้ของเครื่อง โดยโครงข่ายใยประสาทเสมือน (Artificial Neuron Networks) นั้นอาศัยแนวคิดและเทคนิคจากการทำงานของระบบโครงข่ายใยประสาทในระบบประสาทของมนุษย์ โดยจำลองการทำงานเหมือนกับกลุ่มเซลล์ประสาทที่เชื่อมโยงกันเป็นระบบประสาทที่สามารถรับรู้หลายๆ สิ่งในเวลาเดียวกัน ด้วยการประมวลผลแบบขนาน (Parallel Network) ทำให้ระบบสามารถตัดสินใจได้ใกล้เคียงกับมนุษย์ การเรียนรู้เชิงลึก ถูกนำมาประยุกต์ใช้ในงานต่างๆ มากมาย เช่น การแยกแยะใบหน้าแต่ละคน ตัวอย่างเช่นในการติดแท็กรูปภาพเพื่อนใน Facebook หรือการแยกวัตถุที่ไม่ใช่คน หรือใช้เป็นส่วนหนึ่งในระบบรถยนต์ไร้คนขับ เป็นต้น
3. ข้อมูลมหัต (Big Data)
ข้อมูลมหัต เป็นการใช้ข้อมูลที่มีขนาดใหญ่ทุกชนิดที่อยู่ในองค์กรของเราไม่ว่าจะเป็น ข้อมูลบริษัท ข้อมูลลูกค้า พฤติกรรมผู้บริโภค การเข้าออกของธุรกรรมการเงิน ไฟล์เอกสารต่าง ๆ ที่เกี่ยวข้องทั้งหมด ข้อมูลมหัตถูกนำมาประมวลผล จับสาระ วิเคราะห์ถึงความต้องการของผู้บริโภคเพื่อสร้างสินค้าและบริการที่สามารถตอบสนองโจทย์ของลูกค้าได้ สามารถนำมาต่อยอดโดยการคิดค้น เลือกหา และประยุกต์ใช้ข้อมูลนั้น พัฒนาเป็นแอปพลิเคชัน (Application) ที่ให้ความสะดวกสบายแก่ผู้บริโภค
ในการทำโครงการวิทยาการข้อมูลมีขั้นตอนการทำโครงการวิทยาการข้อมูล อาจเเบ่งเป็น 4 ส่วน ดังนี้
การวางแผน ในส่วนนี้เราจะกำหนดเป้าหมายและวิธีการในการดำเนินงาน ประการที่สองคือการจัดระเบียบทรัพยากร ตัวอย่างเช่นเรามีข้อมูลใดบ้างและมีทรัพยากรบุคคลเท่าใด คอมพิวเตอร์ ขนาดไหน และเวลามากน้อยเพียงใด ประการที่สามคือการ ประสานความพยายามระหว่างผู้คนเหล่านั้น มันเป็นภารกิจทางสังคม แต่สำคัญต่อความสำเร็จของโครงการ และในที่สุดในแง่ของการวางแผนมีผลกระทบของการจัดตารางเวลาโครงการ เนื่องจากโครงการวิทยาการข้อมูลมักจะทำงานร่วมกันและทำเพื่อลูกค้าสิ่งนี้อาจเป็นสิ่งสำคัญที่จำเป็นต้องได้รับความสนใจอย่างรอบคอบ
การเตรียมข้อมูล ในขั้นตอนนี้สิ่งเเรกคือจัดหาข้อมูลจากแหล่งต่าง ๆ ถัดไปคือการทำความสะอาดข้อมูล นั่นคือทำให้ข้อมูลเหมาะสมกับโครงการของเราและตรวจสอบข้อผิดพลาดตรวจสอบความผิดปกติและตรวจสอบให้แน่ใจว่าสิ่งที่เรากำลังทำงานนั้นถูกต้องและเชื่อถือได้ แล้วสำรวจข้อมูล ดูว่าการกระจายเป็นอย่างไร ดูว่าข้อมูลมีลักษณะอย่างไร แล้วจึงปรับแต่งข้อมูล เราเลือกกรณีที่จะรวมข้อมูล เลือกตัวแปรที่จะใช้ สร้างคุณสมบัติใหม่ที่ต้องการและให้เนื้อหาจริงที่จะใช้งานในส่วนถัดไปของขั้นตอนการคำนวณข้อมูล
การวิเคราะห์ข้อมูล คือการสร้างรูปแบบหรือรูปแบบ; ทำหลายอย่าง เมื่อคุณสร้างแบบจำลองหรือหลายแบบคุณจะต้องตรวจสอบความถูกต้องของแบบจำลอง นั่นคือเราต้องตรวจสอบให้แน่ใจว่าแบบจำลองนั้นมีความถูกต้องและเป็นไปในทิศทางที่ดี เเละประเมินโมเดล พยายามที่จะดูว่ามันแม่นยำแค่ไหนและมันบอกเราเกี่ยวกับคำถามที่เราพยายามหาคำตอบมากแค่ไหน สุดท้ายคือปรับแต่งโมเดลจากการประเมินผลเราอาจจะต้องการปรับแต่งเพื่อให้ง่ายต่อการใช้งานและให้ข้อมูลเท่าที่จะทำได้
การประเมินโครงงาน เรื่องนี้เกี่ยวข้องกับการนำเสนอรูปแบบ เรามักจะมีลูกค้าและเราจะต้องนำเสนอผลการวิเคราะห์ของเราให้กับพวกเขาในลักษณะที่เหมาะสมกับพวกเขาและพวกเขารู้ว่าจะทำอย่างไรกับมัน การติดตามที่ปรับใช้โมเดล หากคุณกำลังพัฒนารูปแบบการคาดการณ์ที่จะใช้ตัวอย่างเช่นสำหรับเว็บไซต์อีคอมเมิร์ซคุณจะต้องติดตั้งบนเซิร์ฟเวอร์และคุณต้องรับมันเพื่อให้ข้อมูลลูกค้าใหม่เข้ามาและทำการคาดการณ์
วิทยาการข้อมูลจึงเป็นการนำข้อมูลมาการจัดการ จัดเก็บ รวบรวม ตรวจสอบ วิเคราะห์ วิจัย และนำเสนอผลการวิเคราะห์ข้อมูลเพื่อนำไปสู่ความรู้ที่สามารถนำไปใช้งานได้จริงเกี่ยวข้องกับการทำเหมืองข้อมูล การเรียนรู้เชิงลึก และข้อมูลมหัต โดยขั้นตอนการทำโครงการวิทยาการข้อมูล 4 ขั้นตอน ได้แก่ การวางแผน การเตรียมข้อมูล การวิเคราะห์ข้อมูล และการประเมินโครงงาน เป็นต้น
การเพิ่มมูลค่าให้กับผลิตภัณฑ์หรือบริการด้วยข้อมูลนั้น นอกจากจะต้องมีความเข้าใจเกี่ยวกับผลิตภัณฑ์หรือบริการแล้ว นักเรียนยังต้องเข้าใจกิจกรรมต่าง ๆ ที่เกี่ยวกับการจัดหาและประมวลผลข้อมูลอีกด้วย เนื่องจากกิจกรรมที่ต้องทำค่อนข้างหลากหลาย เพื่อไม่ให้สับสนหรือพลาดประเด็นใดไปนักเรียนสามารถดำเนินการตามกระบวนการของวิทยาการข้อมูลที่ระบุขั้นตอนสำคัญต่าง ๆ ที่ประกอบด้วย การตั้งคำถาม การเก็บรวบรวมข้อมูลการสำรวจข้อมูล การวิเคราะห์ข้อมูล การสื่อสารและการทำผลลัพธ์ให้เป็นภาพสู่ผู้ใช้กลุ่มเป้าหมาย
กระบวนการวิทยาการข้อมูล (data science process) เป็นขั้นตอนในการดำเนินกิจกรรมเพื่อไม่ให้สับสนหรือพลาดประเด็น นักเรียนสามารถดำเนินการตามกระบวนการของวิทยาการข้อมูลที่ระบุขั้นตอนสำคัญต่าง ๆ ที่ประกอบด้วย การตั้งคำถาม การเก็บรวบรวมข้อมูล การสำรวจข้อมูล การวิเคราะห์ข้อมูล การสื่อสารและการทำผลลัพธ์ให้เป็นภาพ นักเรียนสามารถดำเนินการตามกระบวนการได้ ดังนี้
ขั้นตอนที่ 1 การตั้งคำถาม (ask an interesting question)
ขั้นตอนที่ 1 การตั้งคำถาม (ask an interesting question) คือ ตั้งคำถามที่ตนเองสนใจเป็นกระบวนการวิทยาการข้อมูลขั้นตอนแรกในการดำเนินกิจกรรม การตั้งคำถาม เช่น กรมควบคุมโรคต้องการวางแผนเกี่ยวกับการรับมือโรคไข้หวัดใหญ่ ในปีถัดไปเพื่อเป็นการสำรองยาและเวชภัณฑ์ อีกทั้งเป็นการบริหารจัดการวัคซีนของกรมควบคุมโรค เป็นต้น
ขั้นตอนที่ 2 การเก็บรวบรวมข้อมูล (get the data)
ขั้นตอนที่ 2 การเก็บรวบรวมข้อมูล (get the data) คือ ต้องคำนึกถึงว่าจะเก็บข้อมูลเรื่องอะไร จากที่ไหนจำนวนเท่าใด และความน่าเชื่อถือของแหล่งข้อมูล ข้อมูลที่เก็บรวบรวมได้จะต้องทำการตรวจสอบ ขจัดข้อมูลที่ผิด หรือข้อมูลที่ไม่สมบูรณ์ เพื่อให้ได้ข้อมูลนำเข้าที่ดี ไปสู่ผลที่ดี เหมือนกับประโยคที่ว่า “garbage in garbage out” เช่น จากข้อมูลของกรมควบคุมโรคในทุกปีในช่วงฤดูฝนตั้งแต่เดือนมิถุนายนถึงกันยายนของทุกปี ซึ่งจะมีผู้ติดเชื้อสูงมากในทุกภาคของประเทศ
ขั้นตอนที่ 3 การสำรวจข้อมูล (explore the date)
ขั้นตอนที่ 3 การสำรวจข้อมูล (explore the date) คือ เป็นการทำความเข้าใจรูปแบบ และค่าของข้อมูล ในขึ้นตอนนี้เราจะต้องรวบรวมข้อมูล แล้วนำข้อมูลที่รวบรวมมาพล็อต (plot) ทำให้เป็นภาพ (visualizations) หรือแผนภูมิ (charts) เพื่อให้มองเห็นความหมายที่ซ่อนเร้นอยู่ของข้อมูลผ่านกราฟ ซึ่งอาจพบความผิดปกติของข้อมูลได้ โดยนำเสนอในรูปแบบเส้นกราฟแนวโน้ม หรือ แผนภูมิแท่งในการนำเสนอข้อมูลผู้ติดเชื้อไข้หวัดใหญ่ในทุก ๆ ของปีก่อน
ขั้นตอนที่ 4 การวิเคราะห์ข้อมูล (analyze the data)
ขั้นตอนที่ 4 การวิเคราะห์ข้อมูล (analyze the data) คือ เพื่ออธิบายความหมาย ความสัมพันธ์ของข้อมูล และทำนายเหตุการณ์ที่จะเกิดขึ้นในอนาคต โดยต้องการทำนายว่าในอนาคตหากเข้าสู่ช่วงฤดูฝน ควรสำรองยาและเวชภัณฑ์ รวมถึงเตียงเพื่อรองรับผู้ป่วยไข้หวัดใหญ่ ให้เพียงพอในช่วงเวลานั้น
การวิเคราะห์ข้อมูลจึงเป็นการเปลี่ยนข้อมูลให้มีคุณค่า โดยนำผลลัพธ์ที่ได้จากการวิเคราะห์มาใช้ประโยชน์ โดยสามารถหาได้จากการวิเคราะห์ข้อมูล 3 ประเภท ดังนี้
การวิเคราะห์เชิงพรรณนา (Descriptive Analysis) เป็นการวิเคราะห์ขั้นพื้นฐาน ที่ทำให้เห็นภาพรวมของข้อมูลและความสัมพันธ์ระหว่างข้อมูล ช่วยอธิบายว่าเกิดอะไรขึ้นบ้างในช่วงที่ผ่านมา เพื่อช่วยในการตัดสินใจ เช่น การทำรายงานยอดขายรายเดือนของห้างสรรพสินค้า ปัจจัยในการซื้อซ้ำของลูกค้าต่อผลิตภัณฑ์ เป็นต้น
การวิเคราะห์เชิงทำนาย (Predictive Analysis) เป็นการวิเคราะห์ที่ช่วยในการคาดการณ์ หรือทำนายสิ่งที่น่าจะเกิดขึ้นในอนาคต โดยใช้ข้อมูลในอดีตมาช่วยในการทำนาย การทราบถึงความเป็นไปได้ของเหตุการณ์ที่จะเกิดขึ้นในอนาคต ทำให้บุคคลหรือองค์กรสามารถวางแผนการดำเนินงานที่มีประสิทธิภาพได้ เช่น การคาดการณ์ยอดขายในเทศกาลต่าง ๆ ทำให้ร้านค้าทราบถึงปริมาณสินค้าที่ควรจะสั่งซื้อ หรือจัดเก็บให้เพียงพอต่อความต้องการของลูกค้า
การวิเคราะห์เชิงแนะนำ (Prescriptive Analysis) เป็นการวิเคราะห์ต่อยอดจากการทำนายผลที่น่าจะเกิดขึ้น โดยการจำลองทางเลือกที่เป็นไปได้ของสถานการณ์ (Simulation) และคาดการณ์ผลที่ได้ของแต่ละสถานการณ์ เพื่อแนะนำทางเลือกที่เหมาะสมที่สุดกับสถานการณ์ที่จะเป็นไปได้ เช่น การเลือกวิธีโฆษณาสินค้าที่จะทำให้ยอดขายสูงที่สุด
กล่าวคือ การวิเคราะห์ข้อมูลนอกจากจะทำให้เห็นภาพรวมของข้อมูลแล้ว ยังช่วยในการคาดการณ์ผลในอนาคตและแนะนำทางเลือกที่เหมาะสมที่สุดสำหรับการตัดสินใจของบุคคลหรือองค์กร โดยการวิเคราะห์เชิงพรรณนาเป็นการวิเคราะห์ขั้นพื้นฐาน การวิเคราะห์เชิงทำนายเป็นการวิเคราะห์เพื่อทำนายสิ่งที่อาจจะเกิดขึ้นในอนาคต ส่วนการวิเคราะห์เชิงแนะนำเป็นการวิเคราะห์ที่ต่อยอดมาจากการวิเคราะห์เชิงพรรณนาและการวิเคราะห์เชิงทำนาย โดยใช้ทักษะการแก้ปัญหาและวางแผน
ขั้นตอนที่ 5 การสื่อสารและการทำผลลัพธ์ให้เป็นภาพ (communicate and visualize the results)
ขั้นตอนที่ 5 การสื่อสารและการทำผลลัพธ์ให้เป็นภาพ (communicate and visualize the results) คือ เป็นการสื่อสารผลลัพธ์ของข้อมูลโดยการถ่ายทอดเป็นเรื่องราวหรือเป็นภาพให้ผู้อื่นเข้าใจว่าเราได้เรียนรู้อะไรจากข้อมูล โดยข้อมูลที่จะนำไปประชาสัมพันธ์หรือเผยแพร่ให้แก่ผู้รับสารได้รับรู้ถึงสิ่งที่ผู้สร้างต้องการสื่อสาร ให้เข้าใจตรงกัน เป็นเรื่องที่ทำได้ยาก เพราะผู้สร้างจะต้องพยายามศึกษาว่า ข้อมูลส่วนไหนสำคัญ ข้อมูลส่วนไหนมีรูปแบบที่น่าสนใจ หากเป็นตัวเลขจำนวนมาก ผู้ที่พยายามจะทำความเข้าใจข้อมูลนั้น ๆ อาจต้องใช้เวลานาน หรืออาจทำให้ไม่สามารถมองเห็นความรู้ หรือประเด็นสำคัญที่อยู่ภายใต้ข้อมูลนั้น ๆ ได้ แต่วิธีหนึ่งที่จะทำให้ผู้รับสารรับรู้สิ่งที่ผู้สร้างต้องการสื่อสารคือการใช้ภาพ
การสื่อสารด้วยข้อมูล เป็นการถ่ายทอดข้อมูลหรือการสื่อสารจากแหล่งข้อมูลไปยังผู้รับสารนั้น บางครั้งเป็นเรื่องที่ทำได้ยาก จำเป็นที่จะต้องจัดรูปแบบของข้อมูล และนำเสนอข้อมูลไปแสดงในรูปแบบที่เหมาะสม เพื่อให้ผู้รับสารเข้าใจ หรือมองเห็นประเด็นสำคัญ
การทำข้อมูลให้เป็นภาพ ข้อมูลที่เราได้มานั้น ส่วนใหญ่จะอยู่ในรูปของจำนวน และมีเป็นจำนวนมาก แม้ว่าการตอบคำถามที่เราสนใจ หรือสิ่งที่เราอยากจะนำเสนอ จะมีอยู่แล้วในข้อมูลเหล่านั้น แต่ก็ยากที่จะทำความเข้าใจ หรืออาจสื่อสารได้โดยง่าย เช่น ข้อมูลที่อยู่ในรูปแบบตารางถึงแม้จะจัดการนำเสนอข้อมูลแล้ว แต่ตัวเลขที่มีปริมาณมาก เราไม่สามารถเห็นเป็นภาพที่แสดงปริมาณมากน้อยได้ จึงมีความจำเป็นที่จะต้องทำข้อมูลที่อยู่ในตารางเหล่านั้นทำให้เป็นภาพ โดยอาจจะใช้แผนภูมิวงกลม แผนภูมิแท่ง กราฟเส้น หรือในรูปอินโฟกราฟิกอื่น เป็นต้น
กระบวนการวิทยาการข้อมูลจึงประกอบด้วย 5 ขั้น ได้แก่ การตั้งคำถาม การเก็บรวบรวมข้อมูล การสำรวจข้อมูล การวิเคราะห์ข้อมูล การสื่อสารและการทำผลลัพธ์ให้เป็นภาพ จึงทำให้การดำเนินกิจกรรมประสบความสำเร็จและเกิดประสิทธิภาพ
แหล่งที่มา
สถาบันส่งเสริมการสอนวิทยาศาสตร์และเทคโนโลยี. (2561). เทคโนโลยี(วิทยาการคำนวณ) ชั้นมัธยมศึกษาปีที่ 5 กรุงเทพฯ : โรงพิมพ์แห่งจุฬาลงกรณ์มหาวิทยาลัย.
การสำรวจข้อมูล (explore the date) เป็นการทำความเข้าใจรูปแบบ และค่าของข้อมูล โดยเราจะต้องรวบรวมข้อมูล แล้วนำข้อมูลที่รวบรวมมาพล็อต (plot) ทำให้เป็นภาพ (visualizations) หรือแผนภูมิ (charts) เพื่อให้มองเห็นความหมายที่ซ่อนเร้นอยู่ของข้อมูลผ่านกราฟ ซึ่งอาจพบความผิดปกติของข้อมูลได้ โดยนำเสนอในรูปแบบเส้นกราฟแนวโน้ม หรือ แผนภูมิแท่งในการนำเสนอข้อมูล เครื่องมือพื้นฐานในการสำรวจข้อมูล เช่น กราฟเส้น ฮิสโทแกรม แผนภาพกล่อง หรือแผนภาพกระจาย โดยสามารถอธิบายรายละเอียดได้ดังต่อไปนี้
ภาพที่ 1 กราฟเส้น
ที่มา, https://unsplash.com/photos/5gGcn2PRrtc/, Markus Spiske
กราฟเส้น (Line Graphs) คือ การนำเสนอโดยกราฟเส้นจะเป็นที่นิยมใช้กันมากใช้กับข้อมูลอนุกรมเวลา (Time Series Data) ซึ่งแสดงการเปลี่ยนแปลงลำดับก่อนหลังของเวลาที่ข้อมูลนั้นเกิดขึ้นและมีจำนวนมาก เป็นการสร้างที่ง่าย อาจเป็นเส้นตรงหรือเส้นโค้งก็ได้ ขึ้นอยู่กับลักษณะข้อมูลที่มีอยู่ ใช้เปรียบเทียบระหว่างหลายรายการในระยะยาว
ฮิสโทแกรม (Histogram) คือกราฟแท่งแบบเฉพาะที่แสดงความสัมพันธ์ระหว่างข้อมูลเป็นหมวดหมู่ที่เรียกว่าชั้นข้อมูลกับความถี่ของข้อมูล เพื่อดูการกระจายของข้อมูล ลักษณะของข้อมูลที่เป็นหมวดหมู่จะเรียงลำดับจากน้อยไปหามากโดยจำนวนหมวดหมู่ของข้อมูลจะจัดตามความเหมาะสม โดยแกนตั้งจะเป็นตัวเลขแสดง “ความถี่” และแกนนอนจะเป็นข้อมูลคุณสมบัติของสิ่งที่เราสนใจ แท่งกราฟแต่ละแท่งจะมีความกว้างเท่ากันซึ่งเท่ากับกว้างของชั้นข้อมูล ส่วนความสูงของกราฟแต่ละแท่งนั้นจะสูงเท่ากับจำนวนความถี่ของแต่ละชั้นข้อมูล
ประโยชน์สำคัญของการใช้ฮิสโทแกรมคือการใช้เพื่อวิเคราะห์ความถี่ของข้อมูลแล้วตัดสินใจว่าการแจกแจงหรือการกระจายข้อมูลแบบใดมีผลต่อผลิตภัณฑ์ไปในทิศทางที่ดีหรือไม่และยังสามารถใช้ในการเปรียบเทียบข้อมูลจากการผลิตก่อนและหลังการปรับปรุงและนำมาใช้วิเคราะห์หาความสามารถของกระบวนการผลิต (Process capability) ได้อีกด้วย
ลักษณะของฮิสโตแกรม (Histogram) ที่พบและการแปลผลที่ได้ดังนี้
1). ฮิสโทแกรมรูปธรรมชาติ (Natural histogram) ถือว่าเป็นลักษณะของข้อมูลดีที่สุด คือเป็นระฆังคว่ำ มีลักษณะสมมาตร มีค่าเฉลี่ยอยู่ตรงกลางและอยู่ภายในขีดจำกัดข้อกำหนดเฉพาะด้านบนและขีดจำกัดข้อกำหนดด้านล่าง
2). ฮิสโทแกรมที่มีลักษณะเบ้ซ้าย (Negativity skewed histogram) คือยอดกราฟไม่ได้อยู่ตรงกลาง แต่จะเอนไปทางขวามือค่าเฉลี่ยของข้อมูลมีค่าค่อนข้างสูง ในกรณีนี้ตั้งข้อสังเกตได้ว่าอาจเกิดจากการปรับตั้งเครื่องจักรไม่ถูกต้อง
3). ฮิสโทแกรมที่มีลักษณะเบ้ขวา (Positively skewed histogram) คือยอดกราฟไม่ได้อยู่ตรงกลาง แต่จะเอนไปทางซ้ายมือค่าเฉลี่ยของข้อมูลมีค่าค่อนข้างต่ำ
4). ฮิสโทแกรมที่มีลักษณะเบ้ซ้าย (Plateau histogram) ข้อมูลที่ค่าใกล้เคียงกันเป็นจำนวนมากอยู่บริเวณตรงกลาง
ฮิสโทแกรมที่มีลักษณะเป็นภูเขา 2 ยอด (Twin peak histogram) ข้อมูลที่เกิดจากการปะปนกันของ 2 การแจกแจงที่มีค่าเฉลี่ยต่างกัน ซึ่งสามารถตั้งข้อสังเกตได้ว่าอาจเกิดจากเครื่องจักร 2 เครื่องที่มีการปรับตั้งค่าการผลิตแตกต่างกัน
แผนภาพกล่อง (Box-and-whisker plot หรือ Box plot) เป็นแผนภาพง่าย ๆ แต่มีประโยชน์ในการสำรวจและสรุปลักษณะของข้อมูล แผนภาพกล่องจะแสดงลักษณะที่สำคัญของข้อมูลชุดนั้น ๆ ได้แก่ ค่ากลาง การกระจาย ลักษณะสมมาตรของข้อมูล และข้อมูลผิดปกติ (outliers) แผนภาพกล่อง ประกอบด้วย ค่าควอร์ไทล์ทั้งสามค่าต่ำสุดและค่าสูงสุดในข้อมูลชุดนั้น โดยสร้างเป็นภาพกล่องสี่เหลี่ยมผืนผ้าที่อาจจัดวางตามแนวนอนหรือแนวตั้งก็ได้ ด้านหัวและท้ายของกล่องเป็นค่าควอร์ไทล์ที่ 1 กับค่าควอร์ไทล์ที่ 3 ความยาวของกล่องนี้จึงคลุมข้อมูลกึ่งกลางจำนวนร้อยละ 50 ของทั้งหมด
ภาพที่ 2 แผนภาพกล่อง (box plot)
แผนภาพการกระจาย (Scatter plot) เป็นเครื่องมือที่ช่วยแสดงความสัมพันธ์ระหว่าง 2 แอททริบิวต์ คือผังที่ใช้แสดงว่าข้อมูล 2 ชุดหรือตัวแปร 2 ตัว มีความสัมพันธ์ซึ่งกันและกัน หรือไม่ และระดับความสัมพันธ์นั้นมีมากน้อยเพียงใด โดยจะทำการหาค่าสหสัมพันธ์ (r) ของทั้ง 2 ตัวแปรที่ แสดงด้วยแกน x และแกน y ของกราฟว่าค่าสหพันธ์เป็นบวกหรือเป็นลบ ซึ่งค่าสหสัมพันธ์เป็นบวกนั่นแสดงว่า ตัวแปรทั้ง 2 ตัวมีแปรตามกัน แต่หากเป็นลบก็แสดงว่า ตัวแปรทั้ง 2 ตัวแปรผกผันต่อกัน โดยที่ ตัวแปร X คือ ตัวแปรอิสระ หรือค่าที่ปรับเปลี่ยนไป ตัวแปร Y คือ ตัวแปรตาม หรือผลที่เกิดขึ้นในแต่ละค่าที่เปลี่ยนแปลงไปของตัวแปร X เช่น เรา อยากทราบว่าขนาดความยาวปีกของคอปเตอร์กระดาษมีผลต่อระยะเวลาที่ลอยอยู่ในอากาศโดยตรงหรือไม่ เรา สามารถใช้แผนภูมิการกระจายเพื่อหาความสัมพันธ์ หรือ รายได้เฉลี่ยต่อครัวเรือน และรายจ่ายเฉลี่ยต่อครัวเรือน ถ้าต้องการสำรวจว่าทั้ง 2 แอททริบิวต์นี้มความสัมพันธ์กันหรือไม่ เป็นต้น
ภาพที่ 3 แผนภาพการกระจาย (scatter plot)
การสำรวจข้อมูลโดยการเขียนโปรแกรม การสำรวจข้อมูลโดยการเขียนโปรแกรม จะต้องนำเข้าข้อมูลสู่โปรแกรมที่ใช้สำหรับการประมวลผล โดยถ้าข้อมูลมีปริมาณไม่มากในขั้นตอนการเตรียมข้อมูล สามารถเตรียมข้อมูลจากไฟล์ที่อยู่ในรูปแบบ xls หรือ csv ก่อนเริ่มการนำเข้าข้อมูล จากนั้นจึงเลือกใช้การประมวลผลด้วยโปรแกรมสำเร็จรูป หรือการเขียนโปรแกรม แต่หากมีข้อมูลมากกว่าที่โปรแกรมสำเร็จรูปจะสามารถจัดเก็บหรือประมวลผลได้ จำเป็นต้องใช้วิธีการนำเข้าข้อมูลและประมวลผลด้วยโปรแกรมภาษา หรือใช้โปรแกรมสำเร็จรูปเฉพาะงานด้านวิทยาการข้อมูล ซึ่งในกรณีนี้ไม่จำเป็นต้องดำเนินการจัดเตรียมข้อมูลตามขั้นตอนที่กล่าวมาแล้วข้างต้น
การสำรวจข้อมูล เป็นการทำความเข้าใจรูปแบบ และค่าของข้อมูล โดยเราจะต้องรวบรวมข้อมูล แล้วนำข้อมูลที่รวบรวมมาพล็อตทำให้เป็นภาพ หรือแผนภูมิ โดยใช้เครื่องมือในการสำรวจข้อมูล เช่น กราฟเส้น ฮิสโทแกรม แผนภาพกล่อง แผนภาพการกระจาย การสำรวจข้อมูลโดยการเขียนโปรแกรม เป็นต้น
การคิดเชิงออกแบบ (Design Thinking) เป็นกระบวนการคิดที่ใช้การทำความเข้าใจในปัญหาต่าง ๆ อย่าง ลึกซึ้ง โดยมีผู้ใช้เป็นศูนย์กลาง และนำเอาความคิดสร้างสรรค์และมุมมองที่หลากหลายมาพัฒนาเป็นแนวในการแก้ไข ปัญหา แนวคิดนี้กำลังได้รับความสนใจและถูกนำไปใช้ในหลายบริบท ไม่ว่าเป็นภาคธุรกิจ การศึกษา เศรษฐกิจ และ สังคม อย่างกว้างขวาง ถึงจะดูเหมือนว่าเป็นสิ่งใหม่ แต่อันจริงแล้ว การคิดเชิงออกแบบมีจุดเริ่มต้นอย่างชัดเจนตั้งแต่ ในทศวรรษที่ 1960 ผ่านพัฒนาการมาอย่างต่อเนื่องจนกระทั่งเปลี่ยนแปลงแนวคิดและเครื่องมือที่ได้รับการใช้อย่าง แพร่หลายในปัจจุบัน การคิดเชิงออกแบบ ถูกนำมาประยุกต์ใช้ใน ฐานะ “เครื่องมือ” “วิธีการ” หรือ “วิธีคิด”
การคิดเชิงออกแบบสำหรับวิทยาการข้อมูล เป็นการนำข้อมูลมาใช้เพื่อสื่อสารถึงแม้จะทำให้เข้าใจปัญหาหรือสถานการณ์มากยิ่งขึ้น แต่ถ้าไม่เข้าใจถึงความต้องการที่แท้จริงของผู้ใช้ ก็จะทำให้การนำเสนอข้อมูลผลลัพธ์ไม่ประสบผลสำเร็จ เนื่องจากผู้ใช้ไม่สามารถใช้ประโยชน์จากข้อมูลที่นำเสนอนั้นได้ เช่น ข้อมูลหนึ่งมีปริมาณมากหรือละเอียดเกินความต้องการ เมื่อผู้ใช้พิจารณาข้อมูลแล้วคิดว่าไม่จำเป็นสำหรับตนเอง ข้อบกพร่องนี้อาจทำให้การพัฒนาสินค้าหรือผลิตภัณฑ์นั้นไม่สามารถเข้าถึงความต้องการของผู้ใช้ได้อย่างแท้จริง
กระบวนการคิดเชิงออกแบบสำหรับวิทยาการข้อมูล เป็นกระบวนการที่ให้ความสำคัญต่อผู้ใช้ข้อมูลเป็นหลัก (Human-Centric Design) โดยแบ่งออกเป็น 5 ขั้นตอน ดังนี้
1. การสร้างความเข้าใจถึงปัญหา และความต้องการของผู้ใช้อย่างลึกซึ้ง (Empathize)
ในขั้นตอนนี้สิ่งสำคัญที่สุดในขั้นแรกคือ การระบุกลุ่มผู้ใช้งานที่เราต้องเข้าไปทำความเข้าใจ และถึงแม้ว่าเราจะคาดหวังว่าผลงานออกแบบของเราจะสามารถ ตอบโจทย์ของผู้ใช้งานทุกคนได้ การสร้างความเข้าใจผู้ใช้งานกลุ่มต่าง ๆ อย่าง ลึกซึ้ง โดยจะต้องทำความเข้าใจถึงปัจจัยพื้นฐานต่าง ๆ ของผู้ใช้งาน หรือที่เรียกว่าการศึกษาเชิงชาติพันธุ์วรรณนา (Ethnographic Study) ไม่ว่าจะเป็นจากการสังเกตอากัปกิริยา พฤติกรรม และกิจกรรมต่าง ๆ ในชีวิตความเป็นอยู่ และชีวิตการทำงานของผู้ใช้ หรือการสัมภาษณ์เพื่อดึงเอาข้อมูลในเชิงลึกเกี่ยวกับโจทย์ปัญหาหรือวัตถุประสงค์ของ การออกแบบ โดยเป้าหมายสุดท้ายของการสร้างความเข้าใจอย่างลึกซึ้ง คือการทำความเข้าใจปัญหา อุปสรรค ความเจ็บปวด (Pain) ของผู้ใช้งาน รวมถึงสิ่งที่ผู้ใช้งานต้องการ (Need) และสิ่งที่ผู้ใช้งานคาดหวังว่าจะได้รับ (Gain)
2. การนิยามหรือการตีกรอบปัญหา (Define)
เป็นขั้นตอนที่สองของกระบวนการในการคิดเชิงออกแบบสำหรับวิทยาการข้อมูล โดยในขั้นตอนนี้ จะเป็นการดึงข้อมูลเชิงลึก (insight) จากการทำความเข้าใจอย่างลึกซึ้ง (Empathize) และทำการจับกลุ่มรูปแบบปัญหา (pattern grouping) เพื่อตีกรอบปัญหาหลักของผู้ใช้งานที่จะต้องทำ การแก้ไขด้วยการออกแบบ โดยการจับกลุ่มรูปแบบปัญหาจะเป็นการหาจุดเชื่อมโยงของแต่ละคนเพื่อทำการแบ่งกลุ่ม รูปแบบปัญหาที่ได้พบจากทุก ๆ กลุ่มผู้ใช้งาน ได้แก่
จับกลุ่มตามประเภทของปัญหาที่ได้พบ
การวิเคราะห์จุดเชื่อมโยงและความสัมพันธ์ต่าง ๆ ของข้อมูลจากความคล้ายคลึงกันของข้อมูล(Similarities) ข้อมูลซ้ำ (Repetition) หรือความพึ่งพากันของข้อมูล (Dependencies)
ทำการดึงข้อมูลเชิงลึก (Insight) ของปัญหาที่สามารถทำการแก้ไขได้ออกมา
3. การระดมความคิด (Ideate)
การระดมความคิด เพื่อหาทางออกให้กับปัญหาของผู้ใช้งาน (User) ในขั้นตอนนี้ เป้าหมายคือการค้นหาความคิดสร้างสรรค์ที่จะ สามารถตอบโจทย์ปัญหาและความต้องการของผู้ใช้งานได้มากที่สุด ดังนั้นสิ่งสำคัญคือการส่งเสริมให้สมาชิกในทีมนักวิทยาศาสตร์ข้อมูล หรือนักออกแบบสามารถใช้พลังแห่งความสร้างสรรค์และจินตนาการได้อย่างเต็มที่ผ่านการระดมสมองในทีม (Group Brainstorm) และในขั้นตอนนี้ สิ่งสำคัญที่สุดคือการระดมความคิดเพื่อให้ได้ความคิดที่มีความหลากหลายและมีปริมาณ มากที่สุด ทั้งนี้ก็เพื่อที่จะเพิ่มโอกาสในการค้นพบความคิดที่ดีที่สุดที่จะสามารถตอบโจทย์ปัญหาของผู้ใช้งานได้ โดยความคิดที่ดีจะต้องสามารถที่จะลดความรู้สึกทางด้านลบของผู้ใช้งาน และ เพิ่มความรู้สึกทางด้านบวกของผู้ใช้งานใน ประสบการณ์นั้น ๆ โดยทีมนักออกแบบจะมีกรอบแนวคิดและทักษะที่จำเป็นสำหรับการระดมความคิดได้อย่างอิสระ เพื่อที่จะ สามารถระดมความคิดหรือความคิดออกมาให้ได้มากที่สุด ในส่วนของวิธีการหรือเทคนิคที่ใช้เพื่อระดมสมองหรือระดม ความคิดนั้นสามารถทำได้หลากหลายรูปแบบ โดยจะมุ่งเน้นถึงการทำงานร่วมกันเป็นทีม เพื่อต่อยอดความคิดของ สมาชิกในทีม เพื่อให้ได้ซึ่งความคิดที่นับเป็นความคิดที่ดีที่สุดที่จะสามารถตอบโจทย์ปัญหาได้ หลังจากที่ได้ระดมความคิดจนได้ปริมาณที่มากพอสมควรแล้ว ขั้นตอนต่อไปในการระดมความคิดคือการ ประเมินความคิดที่ได้ แล้วทำการคัดเลือกความคิดที่คาดว่าจะสามารถตอบโจทย์ปัญหาและความต้องการของผู้ใช้งานได้ดี ที่สุด โดยจะเป็นการประเมินจากความยากง่ายในการดำเนินการและความสามารถในการตอบโจทย์ปัญหาของผู้ใช้งาน
4. การสร้างต้นแบบ (Prototype)
การสร้างต้นแบบวัตถุประสงค์ของการสร้างต้นแบบ คือ การทดสอบสมมติฐานที่ว่าความคิดที่ได้คิดค้นขึ้นนั้นจะสามารถ ตอบโจทย์ปัญหาและความต้องการของผู้ใช้งานได้จริงหรือไม่ โดยการสร้างต้นแบบจะต้องเป็นการสร้างการจำลอง สถานการณ์นั้น ๆ หรือสร้างต้นแบบผลิตภัณฑ์ที่สามารถทำได้เร็วและทดสอบได้เร็วที่สุด ทั้งนี้ก็เพื่อที่จะให้ทีมงาน สามารถกลับไปปรับปรุงแก้ไขรายละเอียดของต้นแบบได้อย่างรวดเร็ว แล้วทำการทดสอบซ้ำเพื่อให้มั่นใจได้ว่าผลงาน ออกแบบที่คิดขึ้นจะสามารถตอบโจทย์ความต้องการของผู้ใช้งานได้อย่างถูกต้องครบถ้วนที่สุด
คุณลักษณะของต้นแบบที่ดีควรจะต้องสามารถที่จะสื่อสารความคิดของผลิตภัณฑ์หรือข้อมูลออกมาได้อย่างแม่นยำ เพื่อให้ผู้ใช้งานสามารถทำความเข้าใจความคิดนั้นๆ ได้อย่างถูกต้องและให้คำเสนอแนะเพื่อให้ทีมงานกลับไป แก้ไขปรับปรุงได้ดียิ่งขึ้น นอกจากนี้แล้ว ลักษณะของต้นแบบควรจะเป็นการออกแบบเพื่อตอบโจทย์บริบทของผู้ใช้งาน ได้ใกล้เคียงที่สุด เช่นการสร้างต้นแบบและทำการทดสอบในห้องแลบ อาจจะยังไม่สามารถสะท้อนถึงการใช้งาน ต้นแบบนั้นๆได้ในสภาพแวดล้อมจริง สำหรับการสร้างต้นแบบในขั้นต้น เนื่องจากตัวต้นแบบเองควรจะเป็นการสร้าง ขึ้นแบบหยาบ ๆ ด้วยต้นทุนการสร้างที่ต่ำที่สุดและสร้างได้เร็วที่สุดเท่าที่จะทำได้ ต้นแบบแรก ๆ อาจจะมีความแม่นยำที่ต่ำและอาจเป็นการทดสอบในบริบทที่ไม่ใกล้เคียงกับสภาวะจริงมากนัก แต่ในการพัฒนาต้นแบบในครั้งต่อ ๆ ไป ควรจะต้องพัฒนาระดับความแม่นยำและความใกล้เคียงในเชิงบริบทให้ได้มากขึ้น
คุณลักษณะของต้นแบบที่ดีจะคำนึงถึง 2 สิ่งเป็นหลักได้แก่
1) ความถูกต้องหรือความแม่นยำ (Fidelity) ที่จะสามารถสะท้อนถึงความคิดที่จะสื่อออกไปได้อย่างถูกต้อง และครบถ้วนที่สุด โดยในขั้นแรกอาจจะยังไม่ได้มีความแม่นยำสูงนัก แต่จะเป็นการพัฒนาให้มีความแม่นยำและ ใกล้เคียงกับความเป็นจริงมากที่สุดจากการดัดแปลงในแต่ละครั้งหลังทำการทดสอบ
2) บริบทของผู้ใช้งาน (Context) เพราะการทำการทดสอบต้นแบบในบริบทที่แตกต่างกันจะช่วยให้เราสามารถ รวบรวมข้อมูลความคิดเห็นจากบุคคลที่ 3 ในแต่ละบริบทเพื่อนำมาปรับแก้ต้นแบบได้ดียิ่งขึ้น
5. การทดสอบ (Test)
เป็นขั้นตอนสุดท้ายในกระบวนการคิดเชิงออกแบบ (Design Thinking) และถือเป็น ขั้นตอนสำคัญในการสร้างความมั่นใจว่าผลิตภัณฑ์ หรือ บริการที่พัฒนาขึ้น จะสามารถตอบโจทย์ปัญหาและความ ต้องการของผู้ใช้งานได้อย่างตรงจุดการทำการทดสอบต้นแบบ คือการประเมินผล เพื่อที่จะทำให้มั่นใจได้ว่าผลงาน สุดท้ายที่ถูกพัฒนาขึ้นจะเป็นผลงานที่สามารถตอบโจทย์ปัญหาและความต้องการของผู้ใช้งานได้อย่างถูกต้อง หลักการ ของการทำการทดสอบคือทีมนักออกแบบจะต้องเปิดใจกับการยอมรับฟังความคิดเห็นของผู้ใช้งาน โดยผู้ใช้งานที่จะทำการทดสอบด้วยนั้น ควรเป็นผู้ใช้งานที่มีคุณลักษณะที่ตรงกับตัวละครสมมติ หรือ กลุ่มเป้าหมายที่เราตั้งไว้ ขั้นตอน การทำการทดสอบประสบการณ์ของผู้ใช้งานสามารถสรุปได้เป็น 5 ขั้นตอนดังนี้:
การนิยามวัตถุประสงค์ของโครงการและลักษณะของผู้ใช้งานไว้อย่างชัดเจน
การระดมผู้ใช้งานที่จะมาทำการทดสอบ
การทำการทดลองประสบการณ์
การวิเคราะห์และให้คำแนะนำ
การนำเสนอบทเรียนที่ได้รับ
หลังจากการทำการทดสอบต้นแบบในแต่ละครั้ง สิ่งสำคัญที่จะต้องทำก็คือการทำการประเมินผลของการ ทดสอบต้นแบบ เพื่อปรับแก้และปรับปรุงต้นแบบให้มีคุณภาพที่ดีขึ้น และสามารถตอบโจทย์ความต้องการและปัญหา ของผู้ใช้งานได้ดียิ่งขึ้น โดยจะเป็นการประเมินจากการทำงาน (Functionality) ราคาต้นทุน (Cost) ความสวยงาม (Aesthetics) การใช้งาน (Usability) การบำรุงรักษา (Maintenance) ซึ่งจะต้องทำการประเมินในทุก ๆ รุ่น การพัฒนาของต้นแบบ
การคิดเชิงออกแบบสำหรับวิทยาการข้อมูล เป็นการนำข้อมูลมาใช้เพื่อสื่อสาร การนำเสนอเพื่อให้ผู้ใช้ใช้ประโยชน์จากข้อมูลที่นำเสนอนั้นได้ โดยมี 5 ขั้นตอน ได้แก่ การสร้างความเข้าใจถึงปัญหา และความต้องการของผู้ใช้อย่างลึกซึ้ง การนิยามหรือการตีกรอบปัญหา การระดมความคิด การสร้างต้นแบบ และการทดสอบ ทำให้การคิดเชิงออกแบบสำหรับวิทยาการข้อมูล ประสบความสำเร็จในการพัฒนากิจกรรมวิทยาการข้อมูล โดยอาศัยการคิดเชิงออกแบบ
อ้างอิงที่ มา https://www.teachernu.com/computerscience5/