Кодирование и обработка текстовой информации
* Информация, выраженная с помощью естественных и формальных языков в письменной форме, называется текстовой информацией Кодирование информации – это преобразование информации в символьную форму, удобную для хранения, передачи и обработки. Обратное преобразование называется декодированием.
Способ кодирования зависит от цели, ради которой оно осуществляется: сокращение записи; засекречивание (шифровка) информации; удобства обработки (например, в компьютере вся информация кодируется двоичными кодами); удобства передачи информации (например, Азбука Морзе)
Историческая справка Криптография – это тайнопись, система изменения письма с целью сделать текст непонятным для непосвященных лиц Азбука Морзе или неравномерный телеграфный код, в котором каждая буква или знак представлены своей комбинацией коротких элементарных посылок электрического тока (точек) и элементарных посылок утроенной продолжительности (тире) Сурдожесты - язык жестов, используемый людьми с нарушениями слуха
Способы кодирования текста Графический – с помощью специальных рисунков и символов; Числовой – с помощью чисел; Символьный – с помощью символов того же алфавита, что и исходный текст.
Пример 1. Можно каждую букву заменить её порядковым номером в алфавите: Зашифруйте фразу: Я УМЕЮ КОДИРОВАТЬ ИНФОРМАЦИЮ. 1 А 2 Б 3 В 4 Г 5 Д 6 Е 7 Ё 8 Ж 9 З 10 И 11 Й 12 К 13 Л 14 М 15 Н 16 О 17 П 18 Р 19 С 20 Т 21 У 22 Ф 23 Х 24 Ц 25 Ч 26 Ш 27 Щ 28 Ъ 29 Ы 30 Ь 31 Э 32 Ю 33 Я
Ответ: 33211463212165101816312030 1015221618141241032
Пример 2. Дана кодировочная таблица(первая цифра кода – номер строки, вторая – номер столбца): С помощью этой кодировочной таблицы: а) зашифруйте фразу: Я_УМЕЮ_РАБОТАТЬ_С_ИНФОРМАЦИЕЙ!_А_ТЫ? б) расшифруйте текст: 25201538350304053835111503040038 0 1 2 3 4 5 6 7 8 0 А Б В Г Д Е Ё Ж З 1 И К Л М Н О П Р С 2 Т У Ф Х Ц Ч Ш Щ Ъ 3 Ы Ь Э Ю Я _ . , ? 4 : ; - ! « Й
Ответ: а) 34352113053335 1700011520002031351835 10142215171300241005454335 0035203038 б) ЧТО?_ГДЕ?_КОГДА?
А Б В Г Д Е Ё Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я Пример 3. Шифр «Цезаря» Этот шифр реализует следующие преобразования текста: каждая буква исходного текста заменяется третьей после неё буквой в алфавите, который считается написанным по кругу. Используя этот шифр: - зашифруйте слова: ИНФОРМАЦИЯ КОМПЬЮТЕР ЧЕЛОВЕК - расшифруйте слово НУЛТХСЁУГЧЛВ. Символьный способ кодирования
Ответ: ИНФОРМАЦИЯ – ЛРЧСУПГЩЛВ КОМПЬЮТЕР – НСПТЯБХЗУ ЧЕЛОВЕК - ЪЗОСЕЗН НУЛТХСЁУГЧЛВ - КРИПТОГРАФИЯ
Двоичное кодирование текстовой информации Для кодирования 1 символа используется 1 байт информации. 1 байт 256 символов 66 букв русского алфавита 52 буквы английского алфавита 0-9 цифры Знаки препинания
Символьная информация внутри компьютера кодируется двоичными числами (двоичный алфавит - 0 и 1) Последовательностью из одного знака можно закодировать всего две буквы: 0 – А 1 - Б
Последовательностью из двух знаков можно закодировать четыре буквы: 00 – А 01 – Б 10 – В 11 – Г
Трехзнаковой последовательностью можно закодировать уже восемь букв: 000 – А 001 – Б 010 – В 011 – Г 100 – Д 101 – Е 110 – Ж 111 – З ДЕДВЕЗЕЖА – 100 101 100 010 101 111 101 110 000 ГДЕВАЗА
При обработке текстовой информации в компьютере каждый символ представляется двоичным кодом 1 символ 8 битов От 00000000 до 11111111 Присвоение знаку конкретного двоичного кода – это вопрос соглашения, которое фиксируется в кодовой таблице
Кодовая таблица ASCII American Standard Code for Information Interchange коды от 0 до 32 функциональные клавиши коды от 33 до 127 буквы английского алфавита, знаки математических операций, знаки препинаний
Таблица стандартной части кода ASCII 32 00100000 56 8 00111000 80 P 01010000 104 h 01101000 33 ! 00100001 57 9 00111001 81 Q 01010001 105 i 01101001 34 “ 00100010 58 : 00111010 82 R 01010010 106 j 01101010 35 # 00100011 59 ; 00111011 83 S 01010011 107 k 01101011 36 $ 00100100 60 < 00111100 84 T 01010100 108 l 01101100 37 % 00100101 61 = 00111101 85 U 01010101 109 m 01101101 38 & 00100110 62 > 00111110 86 V 01010110 110 n 01101110 39 ‘ 00100111 63 ? 00111111 87 W 01010111 111 o 01101111 40 ( 00101000 64 @ 01000000 88 X 01011000 112 p 01110000 41 ) 00101001 65 A 01000001 89 Y 01011001 113 q 01110001 42 * 00101010 66 B 01000010 90 Z 01011010 114 r 01110010 43 + 00101011 67 C 01000011 91 [ 01011011 115 s 01110011 44 , 00101100 68 D 01000100 92 \ 01011100 116 t 01110100 45 - 00101101 69 E 01000101 93 ] 01011101 117 u 01110101 46 . 00101110 70 F 01000110 94 ^ 01011110 118 v 01110110 47 / 00101111 71 G 01000111 95 _ 01011111 119 w 01110111 48 0 00110000 72 H 01001000 96 ` 01100000 120 x 01111000 49 1 00110001 73 I 01001001 97 a 01100001 121 y 01111001 50 2 00110010 74 J 01001010 98 b 01100010 122 z 01111010 51 3 00110011 75 K 01001011 99 c 01100011 123 { 01111011 52 4 00110100 76 L 01001100 100 d 01100100 124 | 01111100 53 5 00110101 77 M 01001101 101 e 01100101 125 } 01111101 54 6 00110110 78 N 01001110 102 f 01100110 126 ~ 01111110 55 7 00110111 79 O 01001111 103 g 01100111 127 . 01111111
Таблица альтернативной части кода ASCII 128 А 10000000 129 Б 10000001 130 В 10000010 131 Г 10000011 132 Д 10000100 133 Е 10000101 134 Ж 10000110 135 З 10000111 136 И 10001000 137 Й 10001001 138 К 10001010 139 Л 10001011 140 М 10001100 141 Н 10001101 1142 О 10001110 143 П 10001111 144 Р 10010000 145 С 10010001 146 Т 10010010 147 У 10010011 148 Ф 10010100 149 Х 10010101 150 Ц 10010110 151 Ч 10010111 152 Ш 10011000 153 Щ 10011001 154 Ъ 10011010 155 Ы 10011011 156 Ь 10011100 157 Э 10011101 158 Ю 10011110 159 Я 10011111
Таблицы кодировки русскоязычных символов КОИ-8 MAC ISO
Кодировка Unicode 1 символ - 2 байта (16 бит), которыми можно закодировать 65 536 символов
Создание документов в текстовых редакторах Ввод и редактирование документа
Текстовые редакторы Для обработки текстовой информации на компьютере используются текстовые редакторы такие как; Блокнот Microsoft Word StarOffice Writer Adobe PageMaker Microsoft Office Publisher Microsoft FrontPage
Текстовые редакторы Текстовые редакторы — это программы для создания, редактирования, форматирования, сохранения и печати документов. Современный документ может содержать, кроме текста, и другие объекты (таблицы, диаграммы, рисунки и т. д.).
Редактирование и форматирование Редактирование- преобразование, обеспечивающее добавление, удаление, перемещение или исправление содержания документа. Форматирование — это оформление текста ( шрифт, начертание и размер символов, оформление абзацев и заголовков и т.д.
Выбор параметров страницы Формат А4, Книжная ориентация страницы Формат А4, Альбомная ориентация страницы
Вставка символов В документах часто применяются знаки, для ввода которых не существует клавиш на клавиатуре. Word позволяет вводить многие из специальных символов либо нажатием комбинации клавиш, либо с помощью команды Вставка→Символ
Вставка номером страниц Очень часто при создании документов появляется необходимость пронумеровать страницы. Делать это вручную – бесполезное занятие, ведь в Word есть простой способ сделать это автоматически – вставить нумерацию страниц. Вставка номеров страниц выполняется командой Вставка→Номера страниц.
Предварительный просмотр Режим предварительного просмотра документа дает возможность перед печатью увидеть, как текст разбивается на страницы, и выявить возможные проблемы, связанные с разметкой. Для открытия окна предварительного просмотра щелкните на кнопке Предварительный просмотр на Стандартной панели или выберите команду Файл→Предварительный просмотр.
Некоторые полезные горячие клавиши MS Word Расположение текста: CTRL + R – по правому краю; CTRL + L – по левому краю; CTRL + E – по центру; CTRL + J – по ширине страницы. Тип начертания текста: CTRL + B – жирный; CTRL + U – подчёркнутый; CTRL + I – курсив. Другие: CTRL + D – диалоговое окно «Шрифт»; CTRL + H – диалоговое окно «Поиск и замена». CTRL + Scroll мыши – изменение масштаба.
Домашнее задание Выучить конспект Создать кроссворд из 10 вопросов по теме «Кодирование и обработка текстовой информации»