Тема урока "Оценка количественных параметров текстовых документов"
Сегодня на уроке вы:
узнаете какие параметры текстового документа необходимо учитывать при его создании, какая таблица называется кодовой, какой код называется восьмиразрядным и что такое информационный объем текста;
научитесь вычислять информационный объём фрагментов текста.
Как известно, вся информация, независимо от того, какая она: графическая, видео или звуковая – представляется в компьютере с помощью чисел, это всего два символа двоичного кода, 0 и 1, которые легко перевести в сигналы.
Более 60% информации, представленной в компьютере, является текстовой информацией. В компьютерном алфавите 256 символов. Сюда входят заглавные и прописные буквы латинского и русского алфавитов, знаки препинания, печатные и непечатные символы, а также комбинации клавиш. человек различает текст по начертанию символов.
А вот компьютер различает символы, которые вводят в компьютер, по их двоичному коду. Вы нажимаете на клавиатуре символьную клавишу, в компьютер мгновенно поступает определённая последовательность электрических импульсов разной силы, которую можно представить в виде цепочки из восьми нулей и единиц (двоичного кода).
Вы уже знаете, что разрядность двоичного кода i и количество возможных кодовых комбинаций N связаны соотношением: 2i = N.
Восьмиразрядный двоичный код позволяет получить 256 разных кодовых комбинаций: 28 = 256.
С помощью 256 кодовых комбинаций можно закодировать все символы, расположенные на клавиатуре компьютера, — строчные и прописные русские и латинские буквы, цифры, знаки препинания, знаки арифметических операций, скобки и т. д., а также ряд управляющих символов, без которых невозможно создание текстового документа (удаление предыдущего символа, переход на новую строку строки, пробел и др.).
Чтобы информация на всех компьютерах читалась одинаково, были созданы различные таблицы кодов. В СССР – это КОИ7 и КОИ8, в Америке –ASCII. Для кодирования информации в Windows используют таблицу ANSI.
С помощью кодовых таблиц устанавливается соответствие между изображениями и кодами символов.
Однако, восьмиразрядные кодировки обладают одним серьёзным ограничением: их количество различных кодов символов не хватает, для того чтобы можно было одновременно пользоваться более чем двумя языками. Для того чтобы на компьютере можно было устанавливать больше языков был разработан новый стандарт кодирования символов, получивший название Unicode (Юникод).
В Юникод каждый символ кодируется шестнадцатиразрядным двоичным кодом. Такое количество разрядов позволяет закодировать 216 = 65536 различных символов.
Внимательно посмотри видеоролик
(рассматривается пример решения задач )
Информационный объём фрагмента текста
Выполни задания
Изучи § 4.6.
Выполненные задания присылать tasha-nataly@mail.ru или https://vk.com/id59850110).
Выполни задания в своей тетради:
Самое главное.
Текст состоит из символов — букв, цифр, знаков препинания и т. д., которые человек различает по начертанию. Компьютер различает вводимые символы по их двоичному коду.
Соответствие между изображениями и кодами символов устанавливается с помощью кодовых таблиц.
В зависимости от разрядности используемой кодировки информационный вес символа текста, создаваемого на компьютере, может
быть равен:
• 8 бит (1 байт) — если используется восьмиразрядная кодировка;
• 16 бит (2 байта) — если используется шестнадцатиразрядная кодировка.
Информационный объём фрагмента текста — это количество битов, байтов (килобайтов, мегабайтов), необходимых для записи фрагмента оговорённым способом кодирования.