Урок 15

Декодирование сообщений. Информационный объём текста

Вы знаете, что в технических средах информация храниться, передается и обрабатывается в виде двоичного кода. Так же из предыдущих уроков вы могли узнать, что кодирование текста можно выполнять с помощью равномерного кода (все буквы имеют код одинаковой длины, зависящей от мощности алфавита) и неравномерного кода (коды букв могут иметь разную длину), код такого текста будет короче и передать его можно быстрее.

С равномерными кодами работает текстовые процессоры. С помощью кодовых таблиц разных кодировок символы преобразуются в десятичное число, а за тем и в двоичное. При декодировании происходит обратный процесс. Выполните интерактивное упражнение и попробуйте декодировать небольшие сообщения.

Сообщения закодированные с помощью неравномерного кода декодировать сложнее. Так как «буквы» имеют код разной длины их при передаче разделяют молчанием (т.е., фактически, добавляют еще один третий знак). Так передают сообщения «азбукой Морзе». Декодируйте сообщение, если заранее известно какие в нем были буквы и их коды.

Представленный двоичным кодом текст хранится в памяти компьютера в виде файла. Объем файла зависит от количества символов в нем и от кодировки. Один и тот же текст сохраненный в кодировках ASCII и UNICODE, будет иметь разный информационный объем. А как его найти?

Например, файл содержащий текст «Уметь работать на компьютере, важно так же, как и уметь читать!», содержит 64 символа (включая пробелы и знаки препинания) в кодировке ASCII будет иметь объем 64*1=64 байта, а в кодировке UNICODE 64*2=128 байт.

Если текст сохранен с помощью нестандартного алфавита, то значение i- информационный вес символа алфавита можно найти из формулы:

При передаче текста сведения о кодировке файла могут потеряться, и тогда наш компьютер не сможет корректно декодировать файл. Мы получим искаженный текст. Потеря информации при передаче происходить при недостаточной защищенности каналов связи. Чтобы такого не происходило, ученые трудятся над разработкой методов и средств защиты, позволяющих блокировать возможные угрозы безопасности информации. Наиболее надёжным и универсальным методом защиты информации в каналах связи является шифрование.

Домашнее задание