Кодирование текстовой информации
Текст на внешних носителях сохраняется в виде файла. Преимущества компьютерного документа:Компактное размещениеЛегко удалитьЛегко размножитьМожно быстро переслать на большое расстояние Недостаток:Прочитать файл можно только с помощью компьютера
Любая информация кодируется в компьютере с помощью последовательностей двух цифр - 0 и 1. Он хранит и обрабатывает информацию в виде комбинации электрических сигналов: напряжение 0.4В-0.6В соответствует логическому нулю, напряжение 2.4В-2.7В - логической единице. Последовательности из 0 и 1 называются двоичными кодами, а цифры 0 и 1 - двоичными разрядами (битами) . Такое кодирование информации на компьютере называется двоичным кодированием.
Обработкой текстовой информации на компьютере начали заниматься с 60 – х годов 20 века. Первоначально в ЭВМ использовался лишь латинский алфавит (26 букв). Для обозначения каждого символа хватило бы пяти разрядов (битов). Но в тексте есть знаки препинания, десятичные цифры и др. Поэтому в первых англоязычных компьютерах байт - машинный слог - включал шесть битов. Затем семь - не только для того, чтобы отличать большие буквы от малых, но и для увеличения числа кодов управления принтерами, сигнальными лампочками и прочим оборудованием.
В 1964 году появились мощные ЭВМ IBM-360, в которых окончательно байт стал равен восьми битам, так как для представления текстовой информации в компьютере начал использоваться алфавит мощностью 256 символов.
Международная кодировка ASCII
Коды со 128 по 255 являются национальными, т. е. в национальных кодировках одному и тому же коду соответствуют различные символы.В настоящее время существует пять различных кодовых таблиц для кодирования русских букв: KOI8-R, CP1251, Mac, ISO, UnicodeПримеры кодовых таблиц для кодирования русских букв:
Это интересно: Слово «ЭВМ» записано в форме десятичного кода во всех пяти кодировках на основе кодировочных таблиц: KOI8-R: 252 247 237 CP1251: 221 194 204 Mac: 157 130 140 ISO: 205 178 188Если перевести коды в двоичную систему счисления, то слово «ЭВМ» будет в различных кодировках иметь вид:KOI8-R: 11111100 11110111 11101101 CP1251: 11011101 11000010 11001100Mac: 10011101 10000010 10001100ISO: 11001101 10110010 10111100