ข้อมูลสารสนเทศและความรู้
2.1 ข้อมูล สารสนเทศ และความรู้
ความก้าวหน้าของเทคโนโลยีสารสนเทศในปัจจุบัน ทำให้ในแต่ละวันมีการผลิตข้อมูลขึ้นมาจำนวนมาก ข้อมูลบางส่วนจะถูกนำมาประมวลผลเพื่อนำไปประยุกต์ใช้ในด้านต่างๆ ตัวอย่างเช่นข้อมูลจากเว็บไซต์ที่มีจำนวนเพิ่มขึ้นอย่างรวดเร็วในแต่ละวัน ซึ่งสามารถใช้ประโยชน์จากข้อมูลเหล่านี้ได้เพียงค้นหาข้อความ รูปภาพ หรือวีดิทัศน์ ที่ตรงกับความสนใจเท่านั้น แต่ไม่สามารถนำข้อมูลเหล่านี้มาประมวลผลและแสดงความรู้ที่แฝงอยู่ได้อย่างมีประสิทธิผล
ข้อมูล (data) คือ สิ่งที่ใช้อธิบายคุณลักษณะของวัตถุ เหตุการณ์ กิจกรรม โดยบันทึกจากการสังเกต การทดลอง หรือการสำรวจด้วยการแทนรูปแบบใดรูปแบบหนึ่ง เช่น บันทึกไว้เป็นตัวเลข ข้อสารสนเทศ (information) คือ ผลลัพธ์ที่ได้จากการนำข้อมูลมาประมวลผล เพื่อให้ได้สิ่งที่เป็นประโยชน์ในการนำไปใช้งานมากขึ้น เช่น ส่วนสูงของนักเรียนหญิงและนักเรียนชายแต่ละคนในชั้นเรียนเป็นข้อมูล จะสามารถสร้างสารสนเทศจากข้อมูลเหล่านี้ได้หลายแบบ เพื่อนำไปใช้ในจุดประสงค์ที่แตกต่างกัน ตัวอย่างเช่น การนำข้อมูลเหล่านี้มาเรียงตามลำดับจากมากไปน้อย หรือ การหาค่าเฉลี่ยของส่วนสูงของนักเรียน เพื่อให้นักเรียนได้เห็นความแตกต่างของข้อมูลและสารสนเทศอย่างชัดเจนมากขึ้นความ รูปภาพ และสัญลักษณ์ ความรู้ (knowledge) เป็นคำที่มีความหมายกว้าง และใช้กันโดยทั่วไป ในด้านวิทยาการคอมพิวเตอร์หรือวิศวกรรมคอมพิวเตอร์กล่าวถึงความรู้ไว้ในหลายแง่มุม แต่ความหมายในแง่มุมหนึ่งที่สอดคล้องกับข้อมูลและสารสนเทศ ความรู้ คือ สิ่งที่ประกอบด้วยข้อมูลและสารสนเทศที่ถูกจัดรูปแบบและประมวลผลเพื่อนำไปประยุกต์ใช้ในปัญหาที่ต้องการนำข้อมูลและสารสนเทศเหล่านี้ไปแก้ไข
นอกจากนี้ยังมีนิยามของความรู้อีกด้านหนึ่งที่เกี่ยวข้องกับเรื่องของข้อมูลและสารสนเทศ คือ ความรู้ที่แฝงอยู่ในข้อมูล เป็นสิ่งที่สามารถสกัดจากสารสนเทศที่มีรูปแบบน่าสนใจ เป็นจริงสำหรับข้อมูลใหม่หรือข้อมูลที่ไม่เคยเห็นมาก่อน เป็นรูปแบบใหม่ที่มนุษย์ไม่เคยเห็นมาก่อน ซึ่งผลลัพธ์สุดท้ายจากการวิเคราะห์สารสนเทศจะได้เป็นความรู้ที่เป็นประโยชน์ต่อผู้ใช้ เราเรียกกระบวนการที่สามารถสกัดความรู้จากข้อมูลที่ถูกเก็บรวบรวมไว้เป็นอย่างดีในฐานข้อมูลว่า การค้นพบความรู้ในฐานข้อมูล (Knowledge discovery in databases)
2.2 การจัดองค์ความรู้ (knowledge management)
ในการบริหารองค์กร สิ่งหนึ่งที่เกิดขึ้นแต่ไม่สามารถประเมินคุณค่าเป็นตัวเงินได้ คือ ความรู้ที่ได้จากการปฏิบัติงาน เนื่องจากในการทำงาน การแก้ปัญหา การแสวงหาความรู้ การนำความรู้มาปรับใช้ โดยพนักงานในระดับต่างๆ เกิดขึ้นอยู่ตลอดเวลาในการทำงาน พนักงานที่ปฏิบัติงานหนึ่งคน จะต้องใช้ความรู้และทักษะเฉพาะอย่าง เพื่อทำงานให้ลุล่วงไปได้ ซึ่งการจะทำให้คนหนึ่งสามารถปฏิบัติงานได้อย่างราบรื่นนั้น จะต้องใช้การอบรมเพื่อสร้างความรู้รวมถึงทักษะให้พนักงานเหล่านี้ ซึ่งความรู้ที่ถ่ายทอดให้แก่พนักงานนี้ จัดว่าเป็นทุนทางปัญญา ( Intellectual capital) ซึ่งเป็นสิ่งที่มีคุณค่าอย่างสูงกับองค์กร เพราะความรู้บางอย่างต้องใช้งบประมาณและเวลาในการสร้างขึ้น ทำอย่างไรจึงจะสามารถจัดการความรู้ในองค์กรเหล่านี้ให้เกิดประสิทธิภาพสูงสุด
ระบบสารสนเทศเพื่อการจัดการความรู้ สามารถช่วยองค์กรในการจัดการความรู้เหล่านี้ได้โดยระบบนี้จะทำงานแตกต่างกันไปตามจุดมุ่งหมายขององค์กร ซึ่งผู้ใช้ในองค์กรที่อาจประกอบด้วย พนักงานทั่วไป ผู้บริหาร หรือบุคคลภายนอก จะเป็นผู้สร้างสารสนเทศเพื่อเก็บไว้ในระบบนี้ โดยระบบจะต้องสามารถจัดหมวดหมู่ ค้นหา รวมถึงกระจายสารสนเทศเหล่านี้ให้กับผู้ใช้คนอื่นเพื่อให้ผู้ใช้แต่ละคนสามารถนำสารสนเทศไปใช้ได้ตามสิทธิ์ของตนเอง ตัวอย่างระบบสารสนเทศเพื่อการจัดการ
นอกจากนี้ยังมีศาสตร์ที่เกี่ยวข้องกับการจัดการความรู้ที่น่าสนใจอีกด้านหนึ่ง คือ ความฉลาดร่วม ( collective intelligence ) ซึ่งเป็นการสร้างความฉลาดหรือสร้างความรู้ร่วมกันระหว่างผู้ใช้ ตัวอย่างของการสร้างความรู้ในลักษณะนี้ เช่น วิกิพีเดีย ( Wikipedia ) ซึ่งผู้ใช้แต่ละคนสามารถเพิ่มเติม แก้ไข ข้อมูลร่วมกัน โดยผู้ใช้คนอื่นๆที่ไม่ได้มีส่วนร่วมในการเพิ่มเติมหรือแก้ไขข้อมูล ก็สามารถเข้าถึงและใช้ข้อมูลหรือความรู้เหล่านั้นได้ เป็นต้น ตัวอย่างการสร้างความรู้ร่วมกัน
2.3 ลักษณะข้อมูลที่ดี
มีคำกล่าวเกี่ยวกับการประมวลผลข้อมูลไว้อย่างน่าฟังว่า ถ้าข้อมูลเข้าเป็นขยะ สิ่งที่ออกมาก็จะเป็นขยะด้วยGarbage In, Garbage Out ) ซึ่งหมายความว่า ถ้าข้อมูลที่นำไปประมวลผลเป็นข้อมูลที่ด้อยคุณภาพ ผลลัพธ์ที่ออกมาก็ย่อมด้อยคุณภาพไปด้วย ดังนั้นเราจึงควรตระหนักถึงความสำคัญของการเก็บข้อมูล รวมถึงการประมวลผลข้อมูลเบื้องต้นด้วย โดยข้อมูลที่ดีควรมีลักษณะดังนี้
1.) ความถูกต้องของข้อมูล เป็นลักษณะสำคัญยิ่งของข้อมูล ถ้าข้อมูลไม่ถูกต้องแล้ว เราจะไม่สามารถได้ผลลัพธ์ที่ถูกต้องได้เลย ซึ่งประเด็นนี้เป็นเรื่องสำคัญที่เกิดขึ้นโดยเฉพาะอย่างยิ่งกับข้อมูลที่มีขนาดใหญ่ และไม่มีการตรวจสอบ เช่น ข้อมูลในโลกอินเทอร์เน็ต ซึ่งจำเป็นต้องได้รับการตรวจสอบก่อนจะนำมาใช้เสมอนอกจากนี้ข้อมูลบางประเภท เช่น ข้อมูลที่เก็บเสียงจากไมโครโฟน
2.) ความสมบูรณ์ครบถ้วนในการนำไปใช้งาน ข้อมูลบางประเภทหากไม่ครบถ้วน จัดเป็นข้อมูลที่ด้อยคุณภาพได้เช่นกัน เช่น ข้อมูลประวัติคนไข้ หากไม่มีหมู่เลือดของคนไข้ จะไม่สามารถใช้ได้ในกรณีผู้ร้องขอข้อมูลต้องการข้อมูลหมู่เลือดของคนไข้ หรือข้อมูลที่อยู่ของลูกค้า ที่กรอกผ่านแบบฟอร์ม ถ้ามีแต่ชื่อและนามสกุลโดยไม่มีข้อมูลบ้านเลขที่ ถนน แขวง/ตำบล เขต/อำเภอ หรือจังหวัด ข้อมูลเหล่านั้นก็ไม่สามารถนำมาใช้ได้เช่นกัน ตัวอย่างข้อมูลที่ไม่ครบถ้วน
3.) ความถูกต้องตามเวลา ในบางกรณีข้อมูลผูกอยู่กับเงื่อนไขของเวลา ซึ่งถ้าผิดจากเงื่อนไขของเวลาไปแล้ว ข้อมูลนั้นอาจลดคุณภาพลงไป หรือแม้กระทั่งอาจไม่สามารถใช้ได้ เช่น ข้อมูลการให้ยาของคนไข้ในโรงพยาบาล ดังรูปที่ 2.11 ในทางการแพทย์แล้ว ข้อมูลนี้จะต้องถูกใส่เข้าไปในฐานข้อมูลที่คนไข้ได้รับยา เพื่อให้แพทย์คนอื่นๆ ได้ทราบว่า คนไข้ได้รับยาชนิดนี้เข้าไปแล้ว แต่ข้อมูลเรื่องการให้ยาของคนไข้นี้ อาจไม่จำเป็นต้องได้รับการปรับเปลี่ยนทันทีสำหรับแผนกการเงิน เพราะทางแผนกการเงินจะคิดเงินก็ต่อเมื่อญาติของคนไข้มาตรวจสอบ หรือคนไข้กำลังจะออกจากโรงพยาบาล
4.) ความสอดคล้องกันของข้อมูล ในกรณีที่ข้อมูลมาจากหลายแหล่ง จะเกิดปัญหาขึ้นในเรื่องของความสอดคล้องกันของข้อมูล เช่น บริษัทแห่งหนึ่งซึ่งเก็บข้อมูลที่อยู่ลูกค้า หากต้องการนำข้อมูลไปควบรวมกับบริษัทอีกแห่งหนึ่งซึ่งมีข้อมูลของลูกค้าอยู่เช่นกัน แต่ข้อมูลในการจัดส่งเอกสารของบริษัทแห่งแรก เป็นที่พักอาศัยของลูกค้า ในขณะที่ข้อมูลในบริษัทที่สองเป็นที่อยู่ของสถานที่ทำงานของลูกค้า ข้อมูลจากทั้งสองบริษัทเป็นข้อมูลที่ถูกต้อง สอดคล้องตามเวลาทั้งคู่ แต่ถ้าต้องการเก็บข้อมูลที่อยู่ลูกค้าเพียงที่อยู่เดียว ก็จะเกิดปัญหาขึ้นได้ ตัวอย่างของการไม่สอดคล้องกันของข้อมูล
2.4 การจัดเก็บข้อมูล
เมื่อเห็นความสำคัญของข้อมูลแล้ว ทำอย่างไรจึงจะเก็บรักษาข้อมูลเหล่านั้นให้คงอยู่รวมถึงทำให้สามารถประมวลผลข้อมูลนั้นได้อย่างรวดเร็ว โดยมากแล้วจะรวมไว้ในระบบฐานข้อมูล ซึ่งนำมาใช้ในการจัดเก็บ การเข้าถึง และประมวลผลข้อมูล ข้อดีในการนำฐานข้อมูลไปใช้องค์กรหรือหน่วยงาน เช่น การจัดเก็บอย่างมรประสิทธิภาพ สามารถลดถาระการเก็บเอกสารเป็นกระดาษได้รวมถึงการทำซ้ำเพื่อสำรองข้อมูล สามารถทำได้สะดวกและรวดเร็ว
การตอบสนองต่อความต้องการได้อย่างรวดเร็ว เช่น ข้อมูลประวัติการบำรุงรักษารถยนต์ และข้อมูลประวัติคนไข้ ผู้ใช้ที่ต้องการนำข้อมูลเหล่านี้ไปใช้งาน สามารถเข้าถึงระบบฐานข้อมูลและนำข้อมูลที่ต้องการไปใช้ได้การจำกัดสิทธิ์ในการเข้าถึงข้อมูลให้แก่ผู้ใช้ในแต่ละระดับขององค์กร เช่น ผู้บริหารสามารถเข้าถึงข้อมูลของทุกหน่วยงานได้ แต่ผู้ใช้ทั่วไปในแผนกการเงิน ไม่สามารถเข้าถึงข้อมูลประวัติของฝ่ายบุคคลได้ เป็นต้น
2.4.1 ลำดับชั้นของข้อมูลในฐานข้อมูล ก่อนจะกล่าวถึงลำดับชั้นของข้อมูลในฐานข้อมูลสิ่งแรกที่ต้องกล่าวถึงก่อน คือ ลำดับชั้นล่างสุดของการแทนข้อมูล นั่นคือ การแทนข้อมูลด้วยตัวเลขฐานสอง ซึ่งประกอบด้วยตัวเลขสองตัวคือ ‘0’ และ ‘1’ ในทางคอมพิวเตอร์ จะเรียกเลขฐานสองหนึ่งหลักนี้ว่า 1 บิต (bit) ซึ่งถือว่าเป็นหน่วยเล็กที่สุดของข้อมูล และหากนำบิตมาต่อกันเป็นจำนวน 8 บิต จะเรียกว่า 1 ไบต์ (byte) ตัวอย่างการแทนข้อมูลทางคอมพิวเตอร์ ดังรูป
1) เขตข้อมูล (field) เมื่อนำข้อมูลระดับบิตมาเรียงต่อกันเพื่อแทนข้อมูลใดๆ ที่ต้องการเก็บในฐานข้อมูล เราจะจัดข้อมูลที่เป็นบิตนี้มารวมกันเพื่อแทนความหมายบางอย่าง หน่วยย่อยที่สุดที่มีความหมายในฐานข้อมูลนี้เรียกว่า เขตข้อมูล โดยเขตข้อมูลอาจจะแทนข้อมูลดังตัวอย่างต่อไปนี้
-จำนวนเต็ม (integer) คอมพิวเตอร์ส่วนใหญ่จะเก็บตัวเลขขนาด 32 บิต ซึ่งขนาดของตัวเลขนี้อาจเปลี่ยนแปลงไปตามเทคโนโลยีของเครื่องคอมพิวเตอร์ ตัวเลขฐานสองขนาด 32 บิต สามารถแทนตัวเลขจำนวนเต็มได้ตั้งแต่ -2,147,483,648 ถึง 2,147,483,647 (-231 ถึง 231 -1) แต่ถ้าเป็นเขตข้อมูลที่ระบุไว้ว่า เป็นตัวเลขที่ระบุเครื่องหมาย (unsigned integer) เท่านั้น จะสามารถแทนตัวเลขจำนวนเต็มได้ตั้งแต่ 0 ถึง 4,294,967,295 (232 -1)
-จำนวนทศนิยม (decimal number) ในคอมพิวเตอร์ จะเก็บตัวเลขทศนิยม โดยใช้ระบบโฟลททิงพอยต์ (floating point) ซึ่งในการเก็บลักษณะนี้ ไม่มีการกำหนดตำแหน่งตายตัวสำหรับตำแหน่งของจุด โดยทั่วไปการเก็บข้อมูลตัวเลขจะมีสองขนาดคือ 32 บิต หรือ 64 บิตข้อความ (text) ในการแทนข้อความนั้น จะต้องเปลี่ยนข้อความให้เป็นตัวอักขระแต่ละตัวเสียก่อน ตามมาตรฐานโดยทั่วไปจะใช้เป็นรหัสแอสกี (ASCII code) ซึ่งต่อมามีการใช้รหัสแบบยูนิโคด (Unicode) ที่สามารถแทนภาษาได้หลายภาษามากกว่าแอสกี ความยาวของเขตข้อมูลประเภทนี้ ขึ้นอยู่กับจำนวนตัวอักขระในข้อความวันเวลา (date/time) ข้อมูลที่เป็นวันเวลา เช่น วันที่เริ่มใช้งาน วันลงทะเบียน และวันที่ซื้อสินค้า มีความแตกต่างจากข้อมูลประเภทอื่นๆ ดังนั้นจึงต้องมีชนิดของข้อมูลเป็นวันเวลา เพื่อรองรับเขตข้อมูลที่ต้องการเก็บข้อมูลเป็นวันเวลาไฟล์ (file) เขตข้อมูลบางประเภทใช้เก็บไฟล์รูปภาพหรือไฟล์อื่นๆ ซึ่งเขตข้อมูลประเภทนี้จะเป็นเขตข้อมูลขนาดใหญ่ โดยปกติแล้วจะมีความยาวมากกว่าเขตข้อมูลประเภทอื่นๆ โดยเขตข้อมูลนี้จะเก็บข้อมูลในลักษณะเป็นบิตเรียงต่อกัน
2) ระเบียน (record) คือ กลุ่มของเขตข้อมูลที่มีความสัมพันธ์กัน โดยเขตข้อมูลแต่ละส่วนอาจจะเป็นข้อมูลต่างชนิดกัน ระเบียนแต่ละระเบียนจะประกอบด้วยโครงสร้างเขตข้อมูลที่เหมือนกัน
3) ตาราง (table) คือ กลุ่มของระเบียน ซึ่งเขตข้อมูลในแต่ละระเบียนจะเก็บข้อมูลที่มีความสัมพันธ์กัน ในตารางจะเก็บข้อมูลหลายๆระเบียน แต่ละระเบียนจะมีโครงสร้างเหมือนกันในตาราง นอกจากจะเก็บข้อมูลหลายระเบียนแล้ว ยังสามารถอ้างถึงระเบียนแต่ละระเบียนได้อีกด้วย
4) ฐานข้อมูล (database) เป็นที่รวมของตารางหลายๆตารางเข้าไว้ด้วยกัน ตารางแต่ละตารางจะมีความสัมพันธ์กันโดยใช้เขตข้อมูลที่เก็บข้อมูลซึ่งเหมือนกันเป็นตัวเชื่อมโยงระหว่างกันบางตารางอาจเป็นตารางที่เก็บข้อมูลไว้เฉพาะของตนเองโดยไม่เกี่ยวข้องกับตารางอื่น ในขณะที่บางตาราง อาจต้องเชื่อมโยงกับเขตข้อมูลของตารางอื่นๆ