Сегодня на уроке вы:
вспомните, какие параметры текстового документа необходимо учитывать при его создании;
закрепите умения вычислять информационный объём фрагментов текста.
Текст состоит из символов – цифр, букв, знаков препинания и так далее. Человек различает их по начертанию, а компьютер по их двоичному коду.
Мы уже знаем, что разрядность двоичного кода i и количество возможных кодовых комбинаций N связаны соотношением: 2i = N.
Восьмиразрядный двоичный код позволяет получить 256 разных кодовых комбинаций: 28 = 256.
С помощью такого количества кодовых комбинаций можно закодировать все символы, расположенные на клавиатуре компьютера, – строчные и прописные русские и латинские буквы, цифры, знаки препинания, знаки арифметических операций, скобки, ряд управляющих символов, без которых невозможно создание текстового документа (т.е. удаление предыдущего символа, перевод строки, пробел и др.).
Соответствие между изображениями символов и кодами символов устанавливается с помощью кодовых таблиц.
Существуют международные стандарты кодирования символов. Кодовая таблица содержит коды для 256 различных символов, пронумерованных от 0 до 255. Первые 128 кодов во всех кодовых таблицах соответствуют одним и тем же символам:
Данные коды разработали в США и получили название ASCII – American Standart Code for Information Interchange, что в переводе означает – Американский стандартный код для обмена информацией.
Более того, для многих языков существует несколько вариантов кодовых таблиц (например, коды русских букв представляют в кодировках Windows, КОИ-8)
Однако, восьмиразрядные кодировки обладают одним серьёзным ограничением: их количество различных кодов символов не хватает, для того чтобы можно было одновременно пользоваться более чем двумя языками. Для того чтобы на компьютере можно было устанавливать больше языков был разработан новый стандарт кодирования символов, получивший название Unicode (Юникод).
С помощью этого стандарта можно закодировать очень большое число символов из разных письменностей: в документах Unicode могут соседствовать китайские иероглифы, математические символы, буквы греческого алфавита, латиницы и кириллицы, при этом становится ненужным переключение кодовых страниц. В Юникод каждый символ кодируется шестнадцатиразрядным двоичным кодом. Такое количество разрядов позволяет закодировать 216 = 65536 различных символов.
Информационный объём фрагмента текста
Равен произведению количества K символов в сообщении на информационный вес i символа алфавита:
В зависимости от разрядности используемой кодировки, информационный вес символа текста, создаваемого на компьютере, может быть равен:
• 8 битам (1 байтам) — восьмиразрядная кодировка;
• 16 битам (2 байтам) — шестнадцатиразрядная кодировка.
Информационный объём фрагмента текста - это количество битов, байтов (килобайтов, мегабайтов), необходимых для записи фрагмента оговорённым способом кодирования.
Внимательно посмотри видеоролик
(рассматривается пример решения задач )
Изучи примеры решения задач