Тема урока "Инструменты распознавания текстов и системы компьютерного перевода"
Сегодня на уроке вы:
узнаете как происходит распознавание и перевод текста;
научитесь использовать возможности систем распознавания и перевода.
Современный мир меняется и улучшается каждую минуту. Ещё недавно для того чтобы почитать мы были вынуждены покупать книги или ходить в библиотеку и брать книги там. А сейчас достаточно зайти в интернет, найти интересную книгу и читать её с компьютера, телефона или специального устройства – электронной книги.
А задумывались вы, как в Интернет попали все эти книги. Можно предположить, что какой-то ответственный человек сидел и набирал тексты книг на компьютере.
Как вы думаете, сколько он потратил на это времени?
Попробуем посчитать.
Предположим, что наш человек очень опытный наборщик текстов и его скорость набора 180 знаков в минуту. Ему нужно ввести в компьютер текст романа «Война и мир».
Как вы уже догадались, данный способ перевода печатного текста на компьютер не эффективен и не практичен.
Гораздо быстрее и удобнее использовать специальный инструмент, такой как например сканер, который за считанные секунды переведёт любую бумажную информации в цифровую.
Итак, сканированный снимок попал в компьютер. Но дальше эту информацию нужно распознать, отредактировать и изменить. Для этого нам нужно воспользоваться специальными программами: CuneiForm или ABBYY FineReader .
Остановимся подробнее на работе таких программ:
1) В начале, вам необходимо сканировать текст с помощью сканера. Для этого вы помещаете текст под крышку сканера, и в программе отдаёте команду Сканировать и распознать. Тем самым мы создаём цифровую копию исходного документа в формате графического изображения.
2) Затем программа анализирует структуру документа, выделяя на его страницах блоки текста, таблицы и картинки. Строки разбиваются на слова, а слова на буквы. Затем программа сравнивает найденные символы с шаблонами из своей памяти. Кроме того, в программу встроены словари, которые позволяют производить более точный анализ и распознавание и проверку распознанного текста. Проанализировав огромное количество вариантов, программа выдаёт окончательное решение пользователю распознанного текста.
3) И наконец, распознанный текст переносится в окно текстового редактора, например, Microsoft Word.
Возможности современных компьютеров по хранению больших массивов информации и осуществлению в них быстрого поиска положены в основу разработки компьютерных словарей и программ-переводчиков.
Компьютерные словари выполняют перевод отдельных слов и словосочетаний. Для перевода текстовых документов применяются программы-переводчики.
Посмотрите видеоролик
Тренировка
Выполни задания
Изучи § 4.5.
Выполненные задания присылать tasha-nataly@mail.ru или https://vk.com/id59850110).
Если нет компьютера
Ответь письменно на вопросы в своей тетради № 2, 4, 5, 6 стр. 177 учебника.
Если есть компьютер
Скачай файл-заготовку "Отсканированный текст" и программу распознавания сканированного текста CuneiForm
Выполни задание
Самое главное.
Для ввода текстов в память компьютера с бумажных носителей используют сканеры и программы распознавания символов.
Возможности современных компьютеров по хранению больших массивов информации и осуществлению в них быстрого поиска положены в основу разработки компьютерных словарей и программ-переводчиков.
Компьютерные словари выполняют перевод отдельных слов и словосочетаний. Для перевода текстовых документов применяются программы-переводчики.