โครงการระบบแปลงภาพเอกสารเป็นข้อความที่เรียนรู้เอกสารได้ (Adaptive Thai Optical Character Recognition System)
Post date: Jun 16, 2009 6:10:15 AM
รหัสโครงการ VG5201
สถานะโครงการ : ต่อเนื่อง
เริ่มโครงการ 1 มีนาคม 2552
สิ้นสุดโครงการ 30 กันยายน 2553
หัวหน้าโครงการ นายวศิน สินธุภิญโญ, NECTEC
ออกแบบและพัฒนาระบบแปลงภาพเอกสารเป็นข้อความที่สามารถเรียนรู้เอกสารได้ โดยจะมีโปรแกรมรู้จำตัวอักษรภาษาไทยที่ได้รับการฝึกฝนกับฟอนต์พื้นฐานไว้ ก่อน หลังจากนั้นเมื่อนำไปใช้งานจริง ผู้ใช้งานสามารถนำภาพเอกสารของจริงและข้อความที่แก้ไขให้ตรงกับภาพเอกสาร นั้น มาฝึกฝนโปรแกรมรู้จำตัวอักษรนั้นใหม่ เพื่อปรับตัวเข้ากับเอกสารของผู้ใช้งานได้ดีขึ้น โดยมีผลการรู้จำไม่ต่ำกว่า 95%