Обработка и хранение текстов Ручная запись текста (печать на пишущей машинке) Хранение на бумажном носителе Создание текстов на компьютере Хранение текстов на магнитном носителе в виде файлов Недостатки бумажной технологии Проблемы редактирования (зачеркивание, стирание, заклеивание, переписывание заново) Книги, документы на бумажном носителе занимают много места Одноразовое использование, перерасход бумаги Трудности копирования текстовых документов Трудности передачи информации на большие расстояния Преимущества компьютерной технологии Внесение любых изменений непосредственно в файле, не расходуя при этом бумагу Компактность хранения текстовой информации Возможность многократного использования магнитного носителя Легкость копирования файлов с помощью компьютера Оперативная связь (пересылка текстовых файлов по электронной почте через компьютерные сети)
Компьютерный алфавит Компьютерный алфавит состоит из 256 символов Информационный вес символа 8 бит (1 байт) Таблица кодировки Таблица кодировки – это стандарт, ставящий в соответствие каждому символу алфавита свой порядковый номер. Номер символа является его числовым кодом. В памяти компьютера коды символов представляются восьмиразрядным двоичным кодом Каждый символ занимает 1 байт памяти символ № двоичный код А … 65 … 01000001 …
Кодирование символов ASCII – международный стандарт Принцип последовательного кодирования алфавитов Прописные и строчные буквы располагаются в алфавитном порядке Цифры располагаются по возрастанию значений Кодирование кириллицы: Windows CP1251 Кодировка KOI8-R лПДЙТПЧЛБ MS-DOS CP866 Љ®¤Ёа®ўЄ Mac ЉодироЮка ISO 8859-5 єЮФШаЮТЪР N Символ Двоичный код … 82 R 0 1 0 1 0 0 1 0 83 S 0 1 0 1 0 0 1 1 … 127 0 1 1 1 1 1 1 1 128 Ђ 1 0 0 0 0 0 0 0 … 254 Ю 1 1 1 1 1 1 1 0 255 Я 1 1 1 1 1 1 1 1 ASCII – Американский стандартный код информационного обмена Стандартная часть таблицы: 0 (00000000) … 127 (01111111) 0 … 31 – управляющие символы; 32…127 – буквы латинского алфавита, десятичные цифры, другие символы Вариативная часть таблицы: (Кодовая страница) 128 (10000000) … 255 (11111111)