Оценка количественных параметров текстовых документов
Цель:
Научиться пользоваться кодовыми таблицами, повторить задачи на вычисление информационного объема текста;
Ключевые слова:
• кодовая таблица
• восьмиразрядный двоичный код
• информационный объём текста
Вспомним основные понятия учебник п. 4.6.1 с. 190
НОВАЯ ТЕМА
Ежедневно каждый человек сталкивается с разными видами информации. Увидев важную информацию, можно записать её в компьютер, чтобы затем воспользоваться ей. В компьютер можно поместить фотографию своего друга или видеосъёмку о том, как вы провели каникулы. Но ввести в компьютер вкус мороженого или мягкость пледа никак нельзя.
Компьютер - это электронная машина, которая работает с сигналами. То есть он работать только информацией, которую можно превратить в сигналы. Если бы люди умели превращать в сигналы вкус или запах, то компьютер мог бы работать и с такой информацией.
Как вы уже знаете, вся информация, независимо от того, какая она графическая, видео или звуковая, представляется в компьютере с помощью чисел, это всего два символа двоичного кода, 0 и 1, которые легко перевести в сигналы.
Более 60% информации, представленной в компьютере, является текстовой информацией. В компьютерном алфавите 256 символов. Сюда входят заглавные и прописные буквы латинского и русского алфавитов, знаки препинания, печатные и непечатные символы, а также комбинации клавиш. человек различает текст по начертанию символов.
Посмотри видеоурок по ссылке
Выполни зарядку
РЕШЕНИЕ ЗАДАЧ
Мы уже говорили о том, что разрядность двоичного кода i и количество возможных кодовых комбинаций N связаны соотношением:
Вам известно, что информационный объём сообщения
В зависимости от разрядности используемой кодировки информационный вес символа текста, создаваемого на компьютере, может быть равен:
• 8 битов или 1 байт — если используется восьмиразрядная кодировка;
• 16 битов или 2 байта — если используется шестнадцатиразрядная кодировка.
Задача 1.
Книга содержит 150 страниц. На каждой странице - 40 строк. В каждой строке 60 символов (включая пробелы). Нужно найти информационный объем текста, если используется восьмиразрядная кодировка.
Решение_____________ Ответ_________
Задача 2.
Статья, набранная на компьютере, содержит 64 страницы, на каждой странице 40 строк, в каждой строке 40 символов. Определите размер статьи в кодировке КОИ-8, в которой каждый символ кодируется 8 битами.
Решение.
Найдем количество символов в статье: ___________________
Найдем объем ___________________
Задача 3.
В одной из кодировок Unicode каждый символ кодируется 16 битами. Определите размер следующего предложения в данной кодировке: Я памятник себе воздвиг нерукотворный.
Решение
Каждый символ кодируется 16 битами или двумя байтами. Всего символов ?????, включая пробелы. Следовательно, ответ ??????? бит.
Домашнее задание п. 4.5 Выполни тест по ссылке (внимательно выполняем тест, ответы есть в учебнике
Текст состоит из символов — букв, цифр, знаков препинания и т. д., которые человек различает по начертанию. Компьютер различает вводимые символы по их двоичному коду.
Соответствие между изображениями и кодами символов устанавливается с помощью кодовых таблиц.
В зависимости от разрядности используемой кодировки информационный вес символа текста, создаваемого на компьютере, может
быть равен:
• 8 бит (1 байт) — если используется восьмиразрядная кодировка;
• или 16 бит (2 байта) — если используется шестнадцатиразрядная кодировка.
Информационный объём фрагмента текста — это количество битов, байтов (килобайтов, мегабайтов), необходимых для записи фрагмента оговорённым способом кодирования.