เรื่องข้อมูลใกล้ตัว
เรื่องข้อมูลใกล้ตัว
ยุคของข้อมูลและสารสนเทศ เป็นยุคของการใช้ข้อมูล ทีี่มีอยู่จำนวนมหาศาล มาสร้างมูลค่าให้เกิดประโยชน์กับบุคคล หรือองค์กร การจะใช้ประโยชน์จากข้อมูลเพื่อเพิ่มประสิทธิภาพการทำงาน หรือการใช้ชีวิตของตนเอง จะต้องนำข้อมูลที่เก็บรวบรวมด้วยตนเอง หรืออาจนำข้อมูลทุติยภูมิที่มีผู้รวบรวมหรือสรุปไว้แล้ว มาผ่านกระบวนการประมวลผลข้อมูลให้เป็นสารสนเทศ นอกจากนี้การนำเสนอข้อมูลด้วยภาพ และเรื่องราวบนพื้นฐานของข้อมูล จะทำให้ผู้อื่นเข้าใจ เห็นความสำคัญและคุณค่าขอข้อมูล
1.1 วิวัฒนาการของสารสนเทศ
ในระบบสารสนเทศนั้นจะมีการนำข้อมูลต่างๆ มาประมวลผลให้ข้อมูลนั้นเป็นประโยชน์ต่อการนำไปใช้งาน ในอดีตที่ยังไม่มีคอมพิวเตอร์ก็ยังมีเครื่องมืออื่น มาช่วยในการประมวลผลข้อมูลและช่วยในการสร้างผลผลิตได้ จนถึงปัจจุบันได้มีการนำคอมพิวเตอร์มาช่วยประมวลผลข้อมูล ก็ทำให้ระบบสารสนเทศนี้พัฒนาไปได้มากขึ้นช่วยให้การดำเนินชีวิตของมนุษย์ดีขึ้น
ในโลกของเราได้มีการนำเครื่องมือมาช่วยในการดำรงชีวิตมากมาย จนในปัจจุบันถือได้ว่าเป็นยุคของเทคโนโลยีสารสนเทศ หากแบ่งวิวัฒนาการของยุคสารสนเทศจะแบ่งได้ดังนี้
>>> โลกยุคกสิกรรม (Agriculture Age)
ยุคนี้นับตั้งแต่ก่อนปี ค.ศ.1800 ถือว่าเป็นยุคที่การดำเนินชีวิตของมนุษย์ขึ้นอยู่กับการทำนา ทำสวน ทำไร่ โลกในยุคนี้ยังมีการซื้อขายสินค้าระหว่างกัน แต่ก็เป็นสินค้าเกษตรเป็นหลัก มีการนำเครื่องมือเครื่องทุ่นแรงมาใช้งานให้ได้ผลผลิตดีขึ้น ในระบบหนึ่งๆ จะมีผู้ร่วมงานเป็นชาวนา ชาวไร่ เป็นหลัก
>>> ยุคอุตสาหกรรม (Industrial Age)
ยุคนี้จะนับตั้งแต่ปี ค.ศ.1800 เป็นต้นมา โดยในประเทศอังกฤษได้นำเครื่องจักรกลมาช่วยงานทางด้านเกษตร ทำให้มีผลผลิตมากขึ้น และมีผู้ร่วมงานในระบบมากขึ้น เริ่มมีโรงงานอุตสาหกรรม เริ่มมีคนงานในโรงงาน ต่อมาการนำเครื่องจักรกลมาใช้งานนี้ได้ขยายไปสู่ประเทศต่างๆ และได้มีการแปรรูปผลิตผลทางด้านการเกษตรออกมามากขึ้น และเครื่องจักรกลก็เป็นเครื่องมือที่ทำงานร่วมกับมนุษย์ และเริ่มมีโรงงานอุตสาหกรรมมากขึ้น ซึ่งทำให้โลกของเรามีทั้งภาคอุตสาหกรรมและภาคเกษตรกรรมควบคู่กันไป
>>> ยุคสารสนเทศ (information Age)
ยุคนี้จะนับตั้งแต่ประมาณปี ค.ศ.1957 จากที่การทำงานของมนุษย์มีทั้งด้านเกษตรและด้านอุตสาหกรรม ทำให้คนงานต้องมีการสื่อสารกันมากขึ้น ต้องมีความรู้ ในการใช้เครื่องจักรกล ต้องมีการจัดการข้อมูลเอกสาร ข้อมูลสำนักงาน งานด้านบัญชี จึงทำให้มีคนงานส่วนหนึ่งมาทำงานในสำนักงาน คนงานเหล่านี้ถือว่าเป็นผู้ที่มีความรู้และต้องทำหน้าที่ประสานงานระหว่างฝ่ายผลิตและลูกค้า ทำให้มีการพัฒนาเครื่องมือต่างๆ มาช่วยในการประมวลผล จัดการให้ระบบงานมีประสิทธิภาพดีขึ้น ทำให้เกิดการใช้เครื่องมือทางด้านสารสนเทศขึ้นมา ซึ่งถือว่าเป็นจุดเริ่มต้นของเทคโนโลยีสารสนเทศ เมื่อเข้าสู่ยุคสารสนเทศ องค์กรต่างๆ ที่นำเทคโนโลยีสารสนเทศมาใช้ในการจัดการงานประจำวัน จะทำงานได้สำเร็จเร็วขึ้น การผลิดทำได้รวดเร็วขึ้น เนื่องจากผู้ผลิตสามารถประมวลผลข้อมูลต่างๆ ได้เร็วขึ้น มีการนำระบบอัตโนมัติด้านการผลิตมาใช้ มีระบบบัญชี และมีโปรแกรมที่ทำงานเฉพาะด้านมากขึ้น
1.2 ข้อมูลและรูปแบบของข้อมูล
ข้อมูล (data) เป็นข้อมูลต่างๆ หรือข้อเท็จจริงที่ยังไม่ได้ผ่านการประมวลผล เช่น ระบบการตัดเกรดของนักศึกษา ข้อมูลจะเป็นคะแนนต่างๆ ของนักเรียนแต่ละคน จากนั้นระบบจะนำคะแนนไปหาคะแนนรวมและตัดเกรดตามเงื่อนไขที่กำหนด แล้วให้เอาต์พุตออกมาเป็นข้อมูลที่ประมวลผลแล้ว เรียกว่าสารสนเทศ ถ้าพิจารณาการประมวลผลข้อมูลในองค์กร เราอาจจะแบ่งแหล่งที่มาของข้อมูลได้ 2 ประเภท คือ
1. ข้อมูลภายใน เป็นข้อเท็จจริงต่างๆ ที่เกิดขึ้นภายในองค์กรนั้น ซึ่งอาจเป็นสิ่งที่เกิดจากการปฏิบัติงานของสมาชิกในองค์กร เช่น ข้อมูลบุคลากร ข้อมูลกิจกรรมต่างๆ ข้อมูลธุรการ ข้อมูลการเงินต่างๆ
2. ข้อมูลภายนอก เป็นข้อมูลหรือข้อเท็จจริงที่เกิดขึ้นจากหน่วยงานอื่นๆ นอกองค์กรที่เกี่ยวข้องสำหรับข้อมูลที่เก็บรวบรวมได้ในครั้งแรก ยังไม่ได้ตัดเลือกหรือกลั่นกรองข้อมูลจะเรียกว่า ข้อมูลปฐมภูมิ (Primary Data) ส่วนข้อมูลที่ผ่านการคัดเลือกหรือกลั่นกรองมาแล้ว ซึ่งไม่ใช่ข้อมูลที่ได้มาครั้งแรกจะเรียกว่า ข้อมูลทุติยภูมิ (Secondary Data)
1.3 ระดับของข้อมูล
ข้อมูลสามารถแบ่งระัดับได้ดังนี้
1. บิต (Bit : Binary Digit) เป็นหน่วยที่เล็กที่สุดของข้อมูล จะแทนด้วยสัญญาณ "0" หรือ "1" โดยระบบจะนำบิตต่างๆ มาต่อกันจึงสามารถประมวลผลได้ดีขึ้น
2. ตัวอักขระ (Characters) เป็นกลุ่มของบิตข้อมูลที่ใช้แทนตัวอักขระที่คอมพิวเตอร์สามารถเข้าใจได้โดยนำบิตมาอ่านรวมกันเป็นไบต์ให้อยู่ในรูปของรหัส ASCII รหัส EBCDIC หรือรหัส Unicode ที่มีขนาดสองไบต์
3. ฟิลด์ (Field) เป็นกลุ่มของไบต์ข้อมูลที่นำมาเรียงต่อกันให้มีความหมายเป็นอย่างใดอย่างหนึ่งตามที่ระบบต้องการ โดยมีชื่อเรียกฟิลด์ (field name) กำกับอยู่ ในการใช้งานผู้ใช้จะต้องกำหนดชนิดของข้อมูลที่อยู่ในฟิลด์ด้วย ฟิลด์แต่ละฟิลด์อาจใช้ประเภทของข้อมูลที่ต่างกัน มีขนาดต่างกัน เช่น ฟิลด์ที่เก็บชื่อข้อมูลประเภทตัวอักษร ฟิลด์ที่เก็บเงินเดือนจะเป็นข้อมูลที่เป็นเลขจำนวนเต็ม เป็นต้น
4. เรคคอร์ด (Record) เป็นกลุ่มของฟิลด์ข้อมูลที่มีความสัมพันธ์กันมารวมกัน เพื่อแทนข้อมูลสำหรับสิ่งใดสิ่งหนึ่ง โดยแต่ละเรคอร์ดต้องมีอย่างน้อยหนึ่งฟิลด์ที่บอกความแตกต่างระหว่างเรคคอร์ดนั้น เรียกว่า กุญแจหลัก หรือ คีย์หลัก (primary key) ตัวอย่างเช่น เรคคอร์ดที่เก็บข้อมูลพนักงานแต่ละบุคคล โดยแต่ละเรคคอร์ดประกอบด้วยฟิลด์ที่เป็นชื่อ รหัสประจำตัว เงินเดือน อายุ ทีอยู่ ซึ่งอาจใช้ฟิลด์ที่เป็นรหัสประจำตัวเป็นคีย์หลักก็ได้
5. ไฟล์ (File) หรือแฟ้มข้อมูล เป็นกลุ่มของเรคคอร์ดที่นำมารวมกันให้อยู่ในโครงสร้างเดียวกันสามารถค้นหาข้อมูลได้ง่าย และเก็บไว้ในหน่วยความจำหรือสื่อบันทึกต่างๆ
1.4 พื้นฐานเกี่ยวกับคอมพิวเตอร์
การประมวลผลข้อมูลเป็นการจัดการกระทำกับข้อมุลในลักษณะใดลักษณะหนึ่งเพื่อให้ได้ข้อมูลในรูปแบบที่ต้องการ กระบวนการประมวลผลข้อมูลประกอบด้วย 3 ส่วนคือ
1. ข้อมูลเข้า (Input Data)
2. การประมวลผลข้อมูล (Data Processing)
3. ข้อมูลออก (Output Data)
ข้อมูลนำเข้า มีได้หลายประเภท ตามลักษณะของการใช้งาน ข้อมูลเข้ามีลักษณะดังต่อไปนี้
1. ข้อมูลจำนวน หมายถึง ข้อมูลที่อยู่ในรูปแบบของตัวเลขที่สามารถนำมาคำนวณได้ เช่น อายุ เงินเดือน อุณหภูมิอากาศ
2. ข้อมูลตัวอักษร หมายถึง ข้อมูลที่เป็นตัวอักษรเดี่ยวๆ หรือเป็นข้อความก็ได้ ข้อมูลชนิดนี้จะนำไปคำนวนไม่ได้ แต่สามารถนำไปเรียงลำดับได้ เช่น รหัสพนักงาน ชื่อ-นามสกุล อาชีพ เพศ
3. ข้อมูลภาพลักษณ์ หมายถึง ข้อมูลที่อยู่ในลักษณะของการแทนรูปภาพ สามารถนำมาแสดงทางจอภาพได้ แต่ไม่สามารถนำมาคำนวณได้
4. ข้อมูลเสียง หมายถึง ข้อมูลเสียงที่อยู่ในรูปแบบของไฟล์คอมพิวเตอร์
การจัดการข้อมูลและความรู้
2.1 แฟ้มข้อมูล
แฟ้มข้อมูลหรือไฟล์จะเกิดขึ้นจากการนำเรคอร์ดของข้อมูลหลายๆ เรคคอร์ดมาเก็บรวมกัน ข้อมูลในแต่ละเรคคอร์ดจะถูกแยกแยะด้วย ฟิลด์หลัก (key field) ซึ่งเป็นตัวที่ใช้บอกความแตกต่างของเรคคอร์ด สำหรับแฟ้มข้อมูลแบ่งออกเป็นสองประเภทใหญ่ๆ คือ แฟ้มหลัก (Master Files) และ แฟ้มที่มีการเปลี่ยนแปลง (Transaction Files) โดยแฟ้มหลักเป็นแฟ้มข้อมูลที่ไม่าีการเปลี่ยนแปลงข้อมูลมากนัก โดยทั้วไปแฟ้มหลักนี้มักจะทำงานร่วมกับแฟ้มที่มีการเปลี่ยนแปลงด้วย ในระบบคอมพิวเตอร์แฟ้มข้อมูลจะถูกเก็บเอาไว้ในหน่วยความจำสำรองเช่น ฮาร์ดดิสก์ ซีดี เป็นต้น โดยโครงสร้างของแฟ้มข้อมูลที่นิยมใช้จะแบ่งออกเป็น 3 ประเภท ดังนี้
1. แฟ้มข้อมูลแบบลำดับ (Sequential File)
แฟ้มข้อมูลแบบนี้เหมาะสำหรับข้อมูลที่ไม่มีการแก้ไขบ่อยๆ โดยการเก็บข้อมูลจะเก็บเรียงกันไปตั้งแต่เรคอร์ดแรกจนถึงเรคคอร์ดสุดท้าย การอ่านข้อมูลที่เรคคอร์ดใดๆ จะต้องเริ่มตั้งแต่เรคคอร์ดแรกไปจนถึงเรคคอร์ดที่ต้องการ หากมีการเพิ่มเติมข้อมูลมักจะเป็นการเติมข้อมูลต่อท้ายแฟ้มข้อมูลที่มีอยู่เดิม การประมวลผลกับข้อมูลที่เก็บเป็นแฟ้มข้อมูลลักษณะนี้ เหมาะสำหนับงานที่สะสมข้อมูลไว้ช่วงเวลาหนึ่ง เมื่อถึงเวลาที่กำหนดจึงประมวลผลข้อมูล
ข้อเสียของแฟ้มข้อมูลลักษณะนี้ก็คือ การเข้าถึงข้อมูลต้องเข้าถึงแบบลำดับ ซึ่งจะทำให้เวลาในการเข้าถึงข้อมูลเรคคอร์ดที่ต้องการทำได้ช้า
2. แฟ้มข้อมูลแบบสุ่ม (Random File)
เป็นลักษณะของแฟ้มข้อมูลที่แก้ไขความล่าช้าของแฟ้มข้อมูลที่ใช้ในการเข้าถึงข้อมูลแบบลำดับ แฟ้มแบบนี้สามารถเข้าถึงเรคคอร์ดของข้อมูลได้โดยตรง โดยไม่ต้องเป็นไปตามลำดับที่เรคคอร์ดนั้นเรียงกันอยู่ ซึ่งทำให้เกิดความรวดเร็วในการเข้าถึงข้อมูล
การเข้าถึงเรคคอร์ดข้อมูลของแฟ้มที่เก็บข้อมูลลักษณะนี้จะใช้อัลกอริทึมที่ชื่อว่า แฮชชิ่ง (hashing) โดยจะนำค่าคีย์ฟิลด์ไปคำนวณหาตำแหน่งของเรคคอร์ดที่เก็บข้อมูล จากนั้นจึงไปอ่านข้อมูลจากตำแหน่งของเรคคอร์ดที่เก็บข้อมูลจริงๆ ออกมา
หากมีการเพิ่มเรคคอร์ดของข้อมูลหรือเปลี่ยนแปลงข้อมูลในเรคคอร์ดใดๆ ข้อมูลของเรคคอร์ดนั้นไม่จำเป็นต้องเก็บอยู่ในตำแหน่งของหน่วยความจำที่เก็บ เนื่องจากฟังก์ชัันแอช สามารถที่จะคำนวณหาตำแหน่งที่เก็บข้อมูลนั้นออกมาได้ ทำให้การอ่านเขียนข้อมูลของแฟ้มข้อมูลลักษณะนี้สามารถทำได้เร็วหากข้อมูลนั้นมีการเปลี่ยนแปลงบ่อยๆ
2.2 ความรู้เบื้องต้นด้านฐานข้อมูล
ฐานข้อมูล เป็นวิธีการจัดเก็บข้อมูลที่มีอยู่อย่างเป็นระบบ รวมถึงสามารถควบคุมการเปลี่ยนแปลงของข้อมูลนั้นได้ การนำระบบฐานข้อมูลมาใช้งานนั้นจะช่วยลดความซ้ำซ้อนในฐานข้อมูล ข้อมูลมีมาตรฐาน สามารถทำงานร่วมกันได้อย่างมีประสิทธิภาพ
สำหรับฐานข้อมูลที่คนส่วนใหญ่รู้จัก คือ ฐานข้อมูลเชิงสัมพันธ์ (Relation Database) โดยมองเป็นข้อมูลที่เก็บอยู่ในรูปตาราง (Table) ข้อมูลแต่ละส่วนจะมีความสัมพันธ์กัน ตัวอย่างเช่น ตารางเก็บข้อมูลนักเรียนในลักษณะต่อไปนี้
รหัสนักเรียน ชื่อนักเรียน ที่อยู่นักเรียน
001 วิชัย 64 หมู่ 3 ต.จอมพระ อ.อำเภอจอมพระ จ.สุรินทร์ 31280
050 สุรินทร์ 226 หมู่ 4 ต.จอมพระ อ.อำเภอจอมพระ จ.สุรินทร์ 31280
088 เพ็ญศรี 1 หมู่ ต.จอมพระ อ.อำเภอจอมพระ จ.สุรินทร์ 31280
102 สุภา 234 หมู่ 3 ต.จอมพระ อ.อำเภอจอมพระ จ.สุรินทร์ 31280
022 สมพร 1/22 หมู่ 2 ต.จอมพระ อ.อำเภอจอมพระ จ.สุรินทร์ 31280
จากตัวอย่างจะพบว่า ตารางจะเป็นตัวสร้างความสัมพันธ์ของข้อมูล ถ้าหากมองในตารางในแนวตั้ง(column) เช่น รหัสนักเรียน ชื่อนักเรียน หน่วยข้อมูลหน่วยนี้ เรียกว่า เขตข้อมูล หรือ ฟิลด์ (field) หรือ แอทริบิวต์ (attribute) แต่ถ้าหากมองตารางในแนวนอนจะเห็นการนำฟิลด์หลายๆ ฟิลด์มารวมกัน เรียกว่า ระเบียน หรือ เรคคอร์ด (record) ซึ่งจะแทนข้อมูลทั้งหมดของนักเรียนแต่ละคน ดังนั้นเราอาจมองตาราง (table) ว่าเป็นการนำเรคคอร์ดหลายๆ เรคคอร์ดมารวมกันก็ได้
คำศัพท์ที่เกี่ยวกับฐานข้อมูลดังนี้
เอนทิตี้ (Entity)
เป็นคำที่ใช้อ้างอิงบุคคล สถานที่ และสิ่งของต่างๆ เช่น นักเรียน ลูกค้า ใบลงทะเบียนเรียน ใบสั่งซื้อสินค้า ตัวอย่างเช่น ถ้าเป็นระบบการลงทะเบียนเรียน เอนทิตี้ประกอบด้วย เอนทิตี้สักเรียน ใบลงทะเบียน
แอททริบิวต์ (Attribute)
เป็นข้อมูลที่แสดงถึงลักษณะของเอนทิตี้ เช่น แอทริบิวต์ของเอนทิตี้นักเีรียน ประกอบด้วย รหัสนักเรียน ชื่อนักเรียน ที่อยู่ ส่วนแอททริบิวต์ของเอนทิตี้ในลงทะเบียน ประกอบด้วย รหัสวิชา ชื่อวิชา หน่วยกิต
ความสัมพันธ์ (Relationships)
หมายถึง ความสัมพันธ์ระหว่างเอนทิตี้ต่างๆ ในระบบ เช่น ในระบบการลงทะเบียนจะประกอบด้วย เอนทิตี้นักเรียน และเอนทิตี้ใบลงทะเบียน ซึ่งมีความสัมพันธ์จากนักเรียนไปยังใบลงทะเบียนแบบหนึ่งกลุ่มต่อกลุ่ม (One-to-many) หมายความว่า นักเรียนสามารถลงทะเบียนได้หลายๆ ครั้ง ซึ่งมีหลายรายวิชา นั่นเอง แต่ใบลงทะเบียนแต่ละใบจะมาจากนักเรียนได้คนเดียวเท่านั้น