โครงการระบบสืบค้นและทำเหมืองข้อความสำหรับคลังเว็บไทย (Thai Web Archive Search Engine and Text Mining System)

Post date: Jun 15, 2009 4:29:00 PM

รหัสโครงการ HT5205

สถานะโครงการ : ต่อเนื่อง

เริ่มโครงการ 1 เมษายน 2552

สิ้นสุดโครงการ 30 กันยายน 2553

หัวหน้าโครงการ ดร.ชูชาติ หฤไชยะศักดิ์, NECTEC

ระบบสืบค้นและทำเหมืองข้อความสำหรับคลังเว็บไทยจะทำให้ข้อมูลและสารสนเทศของ ประเทศไทยซึ่งนำเสนอผ่านเครือข่ายอินเตอร์เน็ตและเว็บไม่สูญหายไปกับกาลเวลา ผู้ใช้สามารถมองประเทศไทยในอดีตที่ผ่านมาจากข้อมูลที่เกิดจากคนรุ่นหลายรุ่น สร้างสรรค์ขึ้นมา ไม่ว่าจะเป็นข่าวและเหตุการณ์สำคัญของประเทศ รวมถึงกระแสที่ประชาชนในประเทศให้ความสนใจในช่วงเวลาที่ผ่านมา นอกจากนั้นในเชิงของภาษาศาสตร์ จะทำให้เห็นรูปแบบของคำที่เกิดขึ้นใหม่และตายไปรวมทั้งการใช้ภาษาและ ไวยากรณ์ที่เปลี่ยนแปลงไปตามกาลเวลา นอกจากนั้นยังเป็นการใช้ประโยชน์และเพิ่มมูลค่าให้กับสารสนเทศที่เก็บไว้ เป็นจำนวนมากโดยอาศัยเทคนิคการทำเหมืองข้อความซึ่งเป็นเทคนิคที่ใหม่และถูก นำไปประยุกต์ใช้กันอย่างมากในต่างประเทศ