Кодирование текстовой информации
Информация, выраженная с помощью естественных и формальных языков в письменной форме, обычно называется текстовой информацией. Для обработки текстовой информации на компьютере необходимо представить ее в двоичной знаковой системе. Для кодирования каждого знака требуется количество информации равное 8 битам и каждому знаку необходимо поставить в соответствие уникальный двоичный код из интервала 00000000 до 11111111 ( в десятичном коде от 0 до 255).
Присваивание знаку конкретного двоичного кода – это вопрос соглашения, который фиксируется в кодовой таблице.Структура существующих кодовых таблиц:Десятичные коды с 0 до 33 – соответствуют операциям;С 33 до 127 – являются интернациональными и соответствуют знакам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания;С 128 до 255 – являются национальными.
В настоящее время существуют пять различных кодировочных таблиц для русских букв :Windows, MS-DOS, Mac, ISO, КОИ-8Тексты, созданные в одной кодировке не будут правильно отображаться в другой. За перекодировку текста отвечают специальные программы – конверторы.
Сейчас широкое распространение получил международный стандарт кодирования текстовых символов Unicode, который отводит на каждый символ 2 байта (16 битов).Согласно этому стандарту можно закодировать 65 536 символов. Такого количества достаточно для кодирования русского и латинского алфавита, цифр, знаков и математических символов и других алфавитов.
Задание: Закодируйте фразуЯ изучаю информатику успешно.Одним из первых стандартов кодирования русских букв на компьютерах был КОИ8 ("Код обмена информацией, 8-битный").