Урок OCR-технології для розпізнавання паперових документів.

НМК

OCR-технології для розпізнавання паперових документів.pptx

Завдання для перевірки домашньої роботи, актуалізації знань та мотивації навчальної діяльності

Виконати тестування:

Опорний конспект

Тексти документів рукописного, машинописного, друкованого виду не обов'язково передруковувати, щоб перетворити в електронний документ, існують сучасні технології розпізнавання, що спрощують переведення документа в електронний вигляд. Саме вони є темою уроку.

OCR-технології для розпізнавання паперових документів.

Оптичне розпізнавання тексту (англ. optical character recognition, OCR) — це механічне або електронне переведення зображень рукописного, машинописного або друкованого тексту в послідовність кодів, що використовуються для представлення в текстовому редакторі. Розпізнавання широко використовується для конвертації книг і документів в електронний вигляд, для автоматизації систем обліку в бізнесі або для публікації тексту на веб-сторінці. Оптичне розпізнавання тексту дозволяє редагувати текст, здійснювати пошук слова або фрази, зберігати його в компактнішій формі, демонструвати або роздруковувати матеріал, не втрачаючи якості, аналізувати інформацію, а також застосовувати до тексту електронний переклад, форматування або перетворення в мовлення. Оптичне розпізнавання тексту є досліджуваною проблемою в галузях розпізнавання образів, штучного інтелекту і комп'ютерного зору.

Системи оптичного розпізнавання тексту вимагають калібрування для роботи з конкретним шрифтом; у ранніх версіях, для програмування було необхідно зображення кожного символу, програма одночасно могла працювати тільки з одним шрифтом. Зараз найпоширеніші так звані «інтелектуальні» системи, що розпізнають більшість шрифтів із високим ступенем точності. Деякі системи оптичного розпізнавання тексту здатні відновлювати вихідне форматування тексту, включаючи зображення, колонки й інші нетекстові компоненти.

Принцип роботи OCR

- Фотографія з текстом, отримана зі сканера, розбивається на безліч фрагментів.

- Для кожного з них програма створює кілька припущень.

- Вибираючи найбільшу з них, програма «бачить» символ і виводить його в полі вбудованого текстового редактора.

- Перевіряючи і порівнюючи їх з еталонами кожного фрагменту дає оцінку, відповідну до ступеня збігу.

Методи розпізнавання тексту-символів різних зображень забезпечують вирішення ряду наукових та прикладних задач при ідентифікації об'єктів різного типу. Сучасні методи розпізнавання символів використовуються для вирішення як типових задач, наприклад, розпізнавання тексту, так і спеціалізованих задач, орієнтованих на розпізнавання символьної інформації, нанесеної на поверхню різних об'єктів. Існує достатньо велика кількість програм, призначених для розпізнавання тексту (наприклад, FineReader, Readiris, ScanSoft OmniPage та ін.). Кожна з цих програм пропонує свою реалізацію вирішення задачі обробки та розпізнавання зображень.

Шаблонний метод

Шаблонні методи перетворюють зображення окремого символу в растрове, порівнюють його зі всіма шаблонами, наявними в базі і вибирають шаблон з найменшою кількістю крапок, відмінних від вхідного зображення. Шаблонні методи досить стійкі до дефектів зображення і мають високу швидкість обробки вхідних даних, але надійно розпізнають тільки ті шрифти, шаблони яких їм «відомі». І якщо розпізнаний шрифт хоч трохи відрізняється від еталонного, шаблонні методи можуть робити помилки навіть при обробці дуже якісних зображень.

Структурний метод

Структурні методи розпізнавання зберігають інформацію не про поточкове написання символу, а про його топологію. Еталон містить інформацію про взаємне розташування окремих складових частин символу. Перевага методу – стійкість до зсуву і повороту символу на невеликий кут, до різних стильових варіацій шрифтів. Однак, при повороті на кут, більший десяти градусів, даний метод не може бути використаний для розпізнавання символів. При застосуванні цього методу неважливими стають такі ознаки, як розмір букви, що розпізнається і навіть шрифт, яким вона надрукована. Проте, основною проблемою цього методу є ідентифікація знаків, які містять певні дефекти (наприклад, розрив ліній або з'єднання сусідніх ліній).

Ознаковий метод

Ознакові методи базуються на тому, що зображенню ставиться у відповідність N-мірний вектор ознак. Розпізнавання полягає в порівнянні вектора ознак з набором еталонних векторів тієї ж розмірності. Переваги методу – простота реалізації, хороша узагальнююча здатність, висока швидкість розпізнавання. Недолік методу – висока чутливість до дефектів зображення. Крім того, ознакові методи мають інший недолік — на етапі виділяння ознак відбувається незворотня втрата частини інформації про символ. Виділяння ознак проходить незалежно, тому інформація про взаємне розташування елементів символів втрачається.

Перетворенням графічного зображення в текст займаються програми, які використовують принцип оптичного розпізнавання.

Сучасні програми з OCR вміють:

· розпізнавати тексти, набрані не лише різними шрифтами, але й написані екзотичними, у тому числі і рукописними;

· коректно працювати з текстами, які містять слова на декількох мовах;

· розпізнавати таблиці;

· розпізнавати нечітко набрані чи написані тексти.

Процес уведення документа в комп'ютер можна розділити на етапи:

1. Сканування. На першому етапі сканер відіграє роль «ока» Вашого комп'ютера: «переглядає» зображення і передає його комп'ютеру. При цьому отримане зображення є не чим іншим, як набором чорних, білих чи кольорових крапок, картинкою, що неможливо відредагувати в жодному текстовому редакторі.

2. Розпізнавання. Обробка зображення OCR-системою.

3. Перевірка орфографії.

4. Збереження .

FineReader - це універсальна програма для оптичного розпізнавання тексту, що дозволяє підвищити продуктивність бізнесу при роботі з документами. Він надає потужні, але водночас прості у використанні інструменти для отримання доступу до інформації, що міститься у паперових документах і PDF-файлах.

OmniPage Professional 15 – це найбільш точний механізм конвертації документів і форм у ваші улюблені програми на PC включаючи документи формату PDF.

Чудова точність і форматування в поєднанні з просунутими технологіями з автоматизації процесу конвертації. Все, що потрібно для конвертації, редагування і архівування та обміну документами - це OmniPage Pro 15.

Readiris

Це функціональний інструмент для розпізнавання тексту, як зі сканера, так і зі збережених файлів різних форматів (PDF, PNG, JPG і ін.). Хоча по функціоналу дана програма дещо поступається ABBYY FineReader, але значно перевершує більшість інших конкурентів. Головною ж фішкою Readiris є можливість інтеграції з цілою низкою хмарних сервісів для зберігання файлів.

FineReader Online

Сьогодні цей додаток можна вважати одним із найкращих варіантів OCR. Причин успішного просування цієї програми дуже багато. Перш за все, це відшліфований алгоритм ідентифікації друкованих символів. Рушій самої популярної системи оптичного розпізнавання тексту, FineReader, удосконалювався роками, механізм аналізу зображення поліпшувався від версії до версії. У програму вносилися різні зміни та покращення, які зменшували кількість нерозпізнаних або некоректно розпізнаних певних символів при обробці сканованого зображення. FineReader включає в себе безліч способів і допоміжних інструментів, які дають можливість виконати тонку настройку програми, поліпшити якість вихідного зображення, визначити тип розпізнавання символів, встановити області для обробки і т.д.

OnlineOCR Сервіс пропонує дуже зручне завантаження файлів – на сервер можна завантажувати одночасно кілька зображень, запакувавши їх в ZIP-архів. Максимальний розмір файлу – 20 Мб, але можна використовувати і файли більшого розміру, однак для отримання такої можливості необхідно зв’язатися з адміністрацією сервісу. В якості вихідного формату графічного файлу можна використовувати TIFF (підтримуються в тому числі і багатосторінкові документи), JPEG / JPG, BMP, PCX, PNG, GIF, PDF.

img2txt

Сервіс пропонує зручне завантаження файлів, швидкий процес розпізнавання. Результат розпізнавання можна скопіювати, поділитися, надіслати, опублікувати або завантажити в Google Docs.

Питання і вправи на закріплення вивченого

Дайте відповідь на питання або завершіть речення :

1. Що означає абревіатура OCR?

2. Технологія для розпізнавання паперових докмуентів - це…

3. Які є етапи розпізнавання документів?

4. Який принцип роботи OCR?

5. Які модулі OCR?

6. Яке ПЗ використовується для OCR?

Практичне завдання до уроку

1 . Повторіть правила техніки безпеки

2. Практичне завдання.

Виконати розпізнання документів за допомогою різних програм для розпізнавання. Зробити порівняння цих програм на основі отриманих результатів.

Алгоритм роботи

1. Відкрити сервіс для онлайн розпізнавання документів ABBYY FineReader-online. Перейти за посиланням https://finereaderonline.com

2. Відкрийте зображення для сканування за посиланням https://drive.google.com/file/d/1YEd-XIpB2hix74csmmH0Z890Z2TjjEr1/view?usp=sharing

3. Відредагуйте текст за потреби.

4. Використовуючи відповідний сервіс, розпізнайте текст та збережіть його в текстовому редакторі під назвою «Сервіс Abbyy Fine Reader».

1. Відкрийте сервіс для онлайн розпізнавання документів ONLINEOCR https://www.onlineocr.net/

2. Відкрийте зображення для сканування за посиланням https://drive.google.com/file/d/1YEd-XIpB2hix74csmmH0Z890Z2TjjEr1/view?usp=sharing

3. Відредагуйте текст за потреби.

4. Використовуючи відповідний сервіс, розпізнайте текст та збережіть його в текстовому редакторі під назвою «Сервіс ONLINEOCR».

1. Відкрийте сервіс для онлайн розпізнавання документів IMG2TXT https://img2txt.com

2. Відкрийте зображення для сканування за посиланням https://drive.google.com/file/d/1YEd-XIpB2hix74csmmH0Z890Z2TjjEr1/view?usp=sharing

3. Відредагуйте текст за потреби.

4. Використовуючи відповідний сервіс, розпізнайте текст та збережіть його в текстовому редакторі під назвою «IMG2TXT».

1. Відкрийте сервіс для онлайн розпізнавання документів NEWOCR https://www.newocr.com/

2. Відкрийте зображення для сканування за посиланням https://drive.google.com/file/d/1YEd-XIpB2hix74csmmH0Z890Z2TjjEr1/view?usp=sharing

3. Редагувати текст за потреби.

4. Використовуючи відповідний сервіс, розпізнайте текст та збережіть його в текстовому редакторі під назвою «NEWOCR».

Домашнє завдання

1. Опрацювати конспект.

2. Завантажити один із запропонованих додатків для розпізнавання тексту.

Розпізнати текст будь-якого підручника (1 сторінка).

Результат розпізнавання оцінити на наявність посилань.

Зробити скріншоти етапів розпізнавання.

Визначити переваги та недоліки.

Урок OCR-технології для розпізнавання паперових документів.

Презентація до уроку

НМК