Урок №3
Единицы измерения количества информации.
1 бит – количество информации, содержащееся в сообщении, уменьшающем неопределённость знаний в два раза (орёл-решка).
1 байт = 8 битов = 23 бит
Один килобайт
1 Кбайт = 1024 байт = 210 байт = 213 бит
Один мегабайт
1 Мбайт = 1024 Кбайт = 210 Кбайт = 220 байт = 223 бит
Один гигабайт
1 Гбайт = 1024 Мбайт = 210 Мбайт = 220 Кбайт = 230 байт = 233 бит
Пример:
5 Гбайт = 5 · 230 байт = 5 · 233 бит
Формула, которая связывает количество возможных событий N и количество информации.
N=2i
При игре:
«орёл–решка». Число возможных событий N=2. Подставляем в формулу и получаем равенство: 2 = 2i → I = 1 бит.
Если известно количество событий, можно определить количество информации.
И если известно количество информации, можно узнать количество событий.
Формула Шеннона подходит только для равновероятностных событий.
Задача:
Перед игрой «крестики-нолики» на поле 8х8 перед первым ходом первого игрока существует 64 возможных событий. Какое количество информации получит второй игрок после первого хода первого игрока.
N = 2i
64 = 2i
64 = 26
2i = 26
i = 6 бит
Алфавит можно рассматривать, как различные, возможные события.
Так можно рассчитать какое количество информации несёт каждый символ.
В русском языке 33 символа, если ё не использовать, то 32.
N = 2i
32 = 2i
i = 5 бит
Каждый символ несёт 5 бит информации.
Кодирование – преобразование знаков или группы знаков одной знаковой системы в знаки или группу знаков другой знаковой системы.
Традиционно для кодирования одного символа используется количество информации равное I = 1 байту = 8 бит.
N = 2i = 28 = 256 бит.
Если рассматривать символы как возможные события, то можно вычислить число возможных символов которое можно закодировать.
Кодирование заключается в том, что каждому символу присваивается уникальный десятичный код от 0 до 255 или двоичный код
от 0000 0000 до 1111 1111.
Поэтому человек различает символы по их начертанию, а компьютер по из коду.