Двоичное кодирование текстовой информации
Традиционно для кодирования одного символа используется количество информации, равное 1 байту, то есть I = 1 байт = 8 битов. Если рассматривать символы как возможные события, то можно вычислить какое количество символов можно закодировать: N = 2I = 28 = 256
Каждому символу ставится в соответствие уникальный десятичный код от 0 до 255 или соответствующий ему двоичный код от 00000000 до 11111111. Человек различает символы по их начертаниям, а компьютер – по их кодам.
Кодирование - декодирование При вводе в компьютер текстовой информации происходит ее двоичное кодирование. Код символа хранится в оперативной памяти и занимает 1 байт. В процессе вывода символа на экран компьютера происходит декодирование, т.е. преобразование кода символа в его изображение.
Кодовая таблица
Кодовые таблицы Кодовые таблицы для русских букв: КОИ-8, СР1251 (Windows), СР866, Mac, ISO.
Закодируем слово «ЛУНА» десятичными числами двоичной последовательностью
Попробуем расшифровать последовательность
Стандарт unicode Этот стандарт отводит на каждый символ 2 байта, поэтому можно закодировать N = 2I = 215 = 65 536 символов Эту кодировку поддерживают последние версии платформы Microsoft Windows&Office (начиная с 1997 года).