โครงการการประมวลผลภาษาในภูมิภาคเอเซียสำหรับการพัฒนาคลังข้อมูลและองค์ความรู้ทางด้านภาษา (Asian Applied Natural Language Processing for Linguistics Diversity and Language Resource Development (ADD))

Post date: Jun 15, 2009 4:24:55 PM

รหัสโครงการ HT5003

สถานะโครงการ : ต่อเนื่อง

เริ่มโครงการ 6 กุมภาพันธ์ 2550

สิ้นสุดโครงการ 30 กันยายน 2552

หัวหน้าโครงการ ดร.อลิสา คงทน, NECTEC

ในปัจจุบัน การขาดทักษะในการใช้งานคอมพิวเตอร์เพื่อเข้าถึงข้อมูลนับเป็นปัญหาสำคัญ ในสังคมข้อมูลข่าวสาร โอกาสการรับรู้ข้อมูลข่าวสารขึ้นอยู่กับความสามารถในการเข้าถึงและการแสดง องค์ความรู้ของตนเอง มีประเทศที่พัฒนานาแล้วจำนวนมากทุ่มเทงบประมาณและความพยายามอย่างมากในการ วิจัยและพัฒนาระบบอำนวยความสะดวกต่างๆ ที่ช่วยให้ประชากรในประเทศสามารถใช้งานคอมพิวเตอร์ได้ด้วยภาษาแม่ซึ่งจะช่วย ให้ใช้งานได้อย่างสะดวกสบาย ในการจัดการภาษาที่หลากหลายนี้ เทคโนโลยีในการแปลงข้อมูลเป็นดิจิตอลและการประมวลผลภาษานับเป็นเทคโนโลยีหลัก เนคเทคในฐานะที่เป็นองค์กรหนึ่งที่ดำเนินการวิจัยและพัฒนาการประมวลผลภาษา ธรรมชาติมาอย่างต่อเนื่อง จึงมีบทบาทสำคัญในการกระจายความรู้และขยายกลุ่มผู้เชี่ยวชาญไปยังนานาประเทศ

วัตถุประสงค์ของโครงการคือการรวบรวมและส่งผ่าน นักวิจัยผู้เชี่ยวชาญ แหล่งข้อมูลและเครื่องมือพื้นฐาน รวมทั้งฐานความรู้ในการประมวลผลภาษาธรรมชาติจากประเทศที่มีการวิจัยและพัฒนา อย่างกว้างขวาง ไปยังประเทศที่เริ่มดำเนินการหรือมีแผนในการดำเนินการวิจัยและพัฒนา ในปี 2549 ได้มีการดำเนินกิจกรรมเบื้องต้นภายใต้โครงการนี้ ซึ่งเป็นความร่วมมือกันระหว่างเนคเทค ห้องปฏิบัติการวิจัย Thai Computational Linguistics (TCL) เครือข่าย Asian Language Resource of NUT และสถาบันเทคโนโลยีนานาชาติสิรินธร (SIIT) โครงการ ADD นี้จะขยายต่อไปอีก 3 ปีโดยมีกิจกรรมใน 3 ส่วนหลักคือ การจัดอบรมเนื้อหาในภาพกว้างของการประมวลผลภาษาธรรมชาติโดยเน้นที่การนำไป ใช้ริเริ่มโครงการ การจัดการประชุมเชิงปฏิบัติการและการให้คำแนะนำภาคสนามในการวิจัยและพัฒนา เทคโนโลยีเฉพาะด้านที่เป็นที่ต้องการของสมาชิก และการจัดทำระบบส่วนกลางเพื่อเก็บรวบรวมข้อมูลและเครื่องมือทางภาษาที่หลากหลาย