OCR-технології для розпізнавання паперових документів

Відео - матеріал

Теоретична частина

OCR-технології для розпізнавання паперових документів.pptx

Оптичне розпізнавання тексту (англ. optical character recognition, OCR) — це механічне або електронне переведення зображень рукописного, машинописного або друкованого тексту в послідовність кодів, що використовуються для представлення в текстовому редакторі.

Принцип роботи OCR

Фотографія з текстом, отримана зі сканера, розбивається на безліч фрагментів.
Для кожного з них програма створює кілька припущень.
Вибираючи найбільшу з них, програма «бачить» символ і виводить його в полі вбудованого текстового редактора.
Перевіряючи і порівнюючи їх з еталонами кожного фрагменту дає оцінку, відповідну до ступеня збігу.

Методи розпізнавання тексту-символів різних зображень забезпечують вирішення ряду наукових та прикладних задач при ідентифікації об'єктів різного типу. Сучасні методи розпізнавання символів використовуються для вирішення як типових задач, наприклад, розпізнавання тексту, так і спеціалізованих задач, орієнтованих на розпізнавання символьної інформації, нанесеної на поверхню різних об'єктів. Існує достатньо велика кількість програм, призначених для розпізнавання тексту (наприклад, FineReader, Readiris, ScanSoft OmniPage та ін.). Кожна з цих програм пропонує свою реалізацію вирішення задачі обробки та розпізнавання зображень.

Шаблонний метод

Шаблонні методи перетворюють зображення окремого символу в растрове, порівнюють його зі всіма шаблонами, наявними в базі і вибирають шаблон з найменшою кількістю крапок, відмінних від вхідного зображення.

Структурний метод

Структурні методи розпізнавання зберігають інформацію не про поточкове написання символу, а про його топологію. Еталон містить інформацію про взаємне розташування окремих складових частин символу.

Ознаковий метод

Ознакові методи базуються на тому, що зображенню ставиться у відповідність N-мірний вектор ознак. Розпізнавання полягає в порівнянні вектора ознак з набором еталонних векторів тієї ж розмірності. Переваги методу – простота реалізації, хороша узагальнююча здатність, висока швидкість розпізнавання. Недолік методу – висока чутливість до дефектів зображення. Крім того, ознакові методи мають інший недолік — на етапі виділяння ознак відбувається незворотня втрата частини інформації про символ. Виділяння ознак проходить незалежно, тому інформація про взаємне розташування елементів символів втрачається.

Сучасні програми з OCR вміють:

розпізнавати тексти, набрані не лише різними шрифтами, але й написані екзотичними, у тому числі і рукописними;
коректно працювати з текстами, які містять слова на декількох мовах;
розпізнавати таблиці;

розпізнавати нечітко набрані чи написані тексти

Процес уведення документа в комп'ютер можна розділити на етапи:

1. Сканування. На першому етапі сканер відіграє роль «ока» Вашого комп'ютера: «переглядає» зображення і передає його комп'ютеру. При цьому отримане зображення є не чим іншим, як набором чорних, білих чи кольорових крапок, картинкою, що неможливо відредагувати в жодному текстовому редакторі.

2. Розпізнавання. Обробка зображення OCR-системою.

3. Перевірка орфографії.

4. Збереження .

FineReader - це універсальна програма для оптичного розпізнавання тексту, що дозволяє підвищити продуктивність бізнесу при роботі з документами. Він надає потужні, але водночас прості у використанні інструменти для отримання доступу до інформації, що міститься у паперових документах і PDF-файлах.

OmniPage Professional 15 – це найбільш точний механізм конвертації документів і форм у ваші улюблені програми на PC включаючи документи формату PDF.

Чудова точність і форматування в поєднанні з просунутими технологіями з автоматизації процесу конвертації. Все, що потрібно для конвертації, редагування і архівування та обміну документами - це OmniPage Pro 15.

Readiris

Це функціональний інструмент для розпізнавання тексту, як зі сканера, так і зі збережених файлів різних форматів (PDF, PNG, JPG і ін.). Хоча по функціоналу дана програма дещо поступається ABBYY FineReader, але значно перевершує більшість інших конкурентів. Головною ж фішкою Readiris є можливість інтеграції з цілою низкою хмарних сервісів для зберігання файлів.

FineReader Online

Сьогодні цей додаток можна вважати одним із найкращих варіантів OCR. Причин успішного просування цієї програми дуже багато. Перш за все, це відшліфований алгоритм ідентифікації друкованих символів. Рушій самої популярної системи оптичного розпізнавання тексту, FineReader, удосконалювався роками, механізм аналізу зображення поліпшувався від версії до версії. У програму вносилися різні зміни та покращення, які зменшували кількість нерозпізнаних або некоректно розпізнаних певних символів при обробці сканованого зображення. FineReader включає в себе безліч способів і допоміжних інструментів, які дають можливість виконати тонку настройку програми, поліпшити якість вихідного зображення, визначити тип розпізнавання символів, встановити області для обробки і т.д.

OnlineOCR Сервіс пропонує дуже зручне завантаження файлів – на сервер можна завантажувати одночасно кілька зображень, запакувавши їх в ZIP-архів. Максимальний розмір файлу – 20 Мб, але можна використовувати і файли більшого розміру, однак для отримання такої можливості необхідно зв’язатися з адміністрацією сервісу. В якості вихідного формату графічного файлу можна використовувати TIFF (підтримуються в тому числі і багатосторінкові документи), JPEG / JPG, BMP, PCX, PNG, GIF, PDF.

img2txt

Сервіс пропонує зручне завантаження файлів, швидкий процес розпізнавання. Результат розпізнавання можна скопіювати, поділитися, надіслати, опублікувати або завантажити в Google Docs.

практична частина

Page updated

Google Sites

Report abuse