โครงการระบบสืบค้นและทำเหมืองข้อความสำหรับคลังเว็บไทย (Thai Web Archive Search Engine and Text Mining System)
Post date: Jun 15, 2009 4:29:00 PM
รหัสโครงการ HT5205
สถานะโครงการ : ต่อเนื่อง
เริ่มโครงการ 1 เมษายน 2552
สิ้นสุดโครงการ 30 กันยายน 2553
หัวหน้าโครงการ ดร.ชูชาติ หฤไชยะศักดิ์, NECTEC
ระบบสืบค้นและทำเหมืองข้อความสำหรับคลังเว็บไทยจะทำให้ข้อมูลและสารสนเทศของ ประเทศไทยซึ่งนำเสนอผ่านเครือข่ายอินเตอร์เน็ตและเว็บไม่สูญหายไปกับกาลเวลา ผู้ใช้สามารถมองประเทศไทยในอดีตที่ผ่านมาจากข้อมูลที่เกิดจากคนรุ่นหลายรุ่น สร้างสรรค์ขึ้นมา ไม่ว่าจะเป็นข่าวและเหตุการณ์สำคัญของประเทศ รวมถึงกระแสที่ประชาชนในประเทศให้ความสนใจในช่วงเวลาที่ผ่านมา นอกจากนั้นในเชิงของภาษาศาสตร์ จะทำให้เห็นรูปแบบของคำที่เกิดขึ้นใหม่และตายไปรวมทั้งการใช้ภาษาและ ไวยากรณ์ที่เปลี่ยนแปลงไปตามกาลเวลา นอกจากนั้นยังเป็นการใช้ประโยชน์และเพิ่มมูลค่าให้กับสารสนเทศที่เก็บไว้ เป็นจำนวนมากโดยอาศัยเทคนิคการทำเหมืองข้อความซึ่งเป็นเทคนิคที่ใหม่และถูก นำไปประยุกต์ใช้กันอย่างมากในต่างประเทศ