โครงการระบบแปลงภาพเอกสารเป็นข้อความที่เรียนรู้เอกสารได้ (Adaptive Thai Optical Character Recognition System)

Post date: Jun 16, 2009 6:10:15 AM

รหัสโครงการ VG5201

สถานะโครงการ : ต่อเนื่อง

เริ่มโครงการ 1 มีนาคม 2552

สิ้นสุดโครงการ 30 กันยายน 2553

หัวหน้าโครงการ นายวศิน สินธุภิญโญ, NECTEC

ออกแบบและพัฒนาระบบแปลงภาพเอกสารเป็นข้อความที่สามารถเรียนรู้เอกสารได้ โดยจะมีโปรแกรมรู้จำตัวอักษรภาษาไทยที่ได้รับการฝึกฝนกับฟอนต์พื้นฐานไว้ ก่อน หลังจากนั้นเมื่อนำไปใช้งานจริง ผู้ใช้งานสามารถนำภาพเอกสารของจริงและข้อความที่แก้ไขให้ตรงกับภาพเอกสาร นั้น มาฝึกฝนโปรแกรมรู้จำตัวอักษรนั้นใหม่ เพื่อปรับตัวเข้ากับเอกสารของผู้ใช้งานได้ดีขึ้น โดยมีผลการรู้จำไม่ต่ำกว่า 95%