КОДИРОВАНИЕ ИНФОРМАЦИИ
ПЛАН УРОКА: Кодирование – обработка информации Три способа кодирования текста Кодирование символьной информации в ЭВМ Кодирование числовой информации в ЭВМ Представление графической информации в ЭВМ Представление звука в ЭВМ
Кодирование информации Кодирование информации – это преобразование информации в символьную форму, удобную для хранения, передачи и обработки. Обратное преобразование называется Декодированием.
Способ кодирования зависит от цели, ради которой оно осуществляется: сокращение записи; засекречивание (шифровка) информации; удобства обработки (например, в компьютере вся информация кодируется двоичными кодами); удобства передачи информации (например, Азбука Морзе)
Азбука МОРЗЕ А • - Л • - • • Ц - • - • Б - • • • М - - Ч - - - • В • - - Н - • Ш - - - - Г - - • О - - - Щ - - • - Д - • • П • - - • Ъ • - - • - • Е • Р • - • Ы - • - - Ж • • • - С • • • Ь - • • - З - - • • Т - Э • • - • • И • • У • • - Ю • • - - Й • - - - Ф • • - • Я • - • - К - • - Х • • • •
Способы кодирования текста Графический – с помощью специальных рисунков и символов; Числовой – с помощью чисел; Символьный – с помощью символов того же алфавита, что и исходный текст.
Числовой способ кодирования Пример 2. Зашифрованная пословица. Чтобы рубить дрова нужен а чтобы полить огород – Рыбаки сделали во льду и стали ловить рыбу. Самый колючий зверь в лесу – это А теперь прочитайте пословицу: 14, 2, 3, 2, 7 10, 4, 5, 1, 6 3, 7, 2, 7, 8, 9, 11 12, 13 1, 2, 3, 4, 5, 1, 6 7, 8, 9, 10, 11 9, 4, 7, 4, 13, 12, 14
Ответ: КОПЕЙКА РУБЛЬ БЕРЕЖЁТ
Пример 3. Можно каждую букву заменить её порядковым номером в алфавите: Зашифруйте фразу: Я УМЕЮ КОДИРОВАТЬ ИНФОРМАЦИЮ. 1 А 2 Б 3 В 4 Г 5 Д 6 Е 7 Ё 8 Ж 9 З 10 И 11 Й 12 К 13 Л 14 М 15 Н 16 О 17 П 18 Р 19 С 20 Т 21 У 22 Ф 23 Х 24 Ц 25 Ч 26 Ш 27 Щ 28 Ъ 29 Ы 30 Ь 31 Э 32 Ю 33 Я
Ответ: 33211463212165101816312030 1015221618141241032
Пример 4. Дана кодировочная таблица(первая цифра кода – номер строки, вторая – номер столбца): С помощью этой кодировочной таблицы: а) зашифруйте фразу: Я_УМЕЮ_РАБОТАТЬ_С_ИНФОРМАЦИЕЙ!_А_ТЫ? б) расшифруйте текст: 25201538350304053835111503040038 0 1 2 3 4 5 6 7 8 0 А Б В Г Д Е Ё Ж З 1 И К Л М Н О П Р С 2 Т У Ф Х Ц Ч Ш Щ Ъ 3 Ы Ь Э Ю Я _ . , ? 4 : ; - ! « Й
Ответ: а) 34352113053335 1700011520002031351835 10142215171300241005454335 0035203038
Ответ: б) ЧТО?_ГДЕ?_КОГДА?
Символьный способ кодирования А Б В Г Д Е Ё Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я Пример 5. Шифр «Цезаря» Этот шифр реализует следующие преобразование текста: каждая буква исходного текста заменяется третьей после неё буквой в алфавите, который считается написанным по кругу. Используя этот шифр: - зашифруйте слова: ИНФОРМАЦИЯ, КОМПЬЮТЕР, ЧЕЛОВЕК. - расшифруйте слово НУЛТХСЁУГЧЛВ.
Пример 6. Шифр «Перестановки». Кодирование осуществляется перестановкой букв в слове по одному и тому же общему правилу. Восстановите слова и определите правило перестановки: ЛБКО ЕРАВШН УМЫЗАК АШНРРИ РКДЕТИ
Ответ: ИНФОРМАЦИЯ – ЛРЧСУПГЩЛВ КОМПЬЮТЕР – НСПТЯБХЗУ ЧЕЛОВЕК - ЪЗОСЕЗН
Ответ: НУЛТХСЁУГЧЛВ - КРИПТОГРАФИЯ
ПРЕДСТАВЛЕНИЕ СИМВОЛЬНОЙ ИНФОРМАЦИИ В ЭВМ «Текстовая информация»=«Символьная информация» Текст – любая последовательность символов. Символьный алфавит компьютера – множество символов, используемых на ЭВМ для внешнего представления текстов (буквы латинского и русского алфавитов, десятичные цифры, знаки препинания, специальные символы %, &, $, #, @ и др.)
Символьная информация внутри компьютера кодируется двоичными числами (двоичный алфавит - 0 и 1) Последовательностью из одного знака можно закодировать всего две буквы: 0 – А 1 - Б
Последовательностью из двух знаков можно закодировать четыре буквы: 00 – А 01 – Б 10 – В 11 – Г
Трехзнаковой последовательностью можно закодировать уже восемь букв: 000 – А 001 – Б 010 – В 011 – Г 100 – Д 101 – Е 110 – Ж 111 – З ДЕДВЕЗЕЖА – 100 101 100 010 101 111 101 110 000 ГДЕВАЗА
0000000 ………………………….. ………………………….. ………………………….. 1111111 Семизначной последовательностью можно закодировать 27=128 символов. Этого хватает, чтобы закодировать сообщение на хорошем русском языке. Именно таков отечественный код КОИ-7 (Код Обмена Информацией) Появление одного знака 0 или 1 в последовательности будем называть словом БИТ (от английского BInary digiT – двоичная цифра)
Используя восьмибитный код можно закодировать 28=256 символов. Символьный алфавит компьютера состоит именно из 256 символов. Восьмибитный код называется ASCII (American Standard Code for Information Intercherge – Американский Стандартный Код Обмена Информацией) Благодаря восьмибитному кодированию можно использовать в тексте и прописные и строчные буквы как русского так и латинского алфавитов, знаки препинания, цифры и специальные символы &, $, #, @, % и др.
Существует 256 всевозможных 8-разрядных комбинаций, составленных из 0 и 1: от 00000000 до 11111111, которые представлены в таблице кодировок. Таблица кодировок – это стандарт, ставящий в соответствие каждому символу алфавита свой порядковый номер от 0 до 255, двоичный код символа – это его порядковый номер в двоичной системе счисления. Т.е. таблица кодировок устанавливает связь между внешним символьным алфавитом компьютера и внутренним двоичным представлением.
Таблица стандартной части кода ASCII 32 00100000 56 8 00111000 80 P 01010000 104 h 01101000 33 ! 00100001 57 9 00111001 81 Q 01010001 105 i 01101001 34 “ 00100010 58 : 00111010 82 R 01010010 106 j 01101010 35 # 00100011 59 ; 00111011 83 S 01010011 107 k 01101011 36 $ 00100100 60 < 00111100 84 T 01010100 108 l 01101100 37 % 00100101 61 = 00111101 85 U 01010101 109 m 01101101 38 & 00100110 62 > 00111110 86 V 01010110 110 n 01101110 39 ‘ 00100111 63 ? 00111111 87 W 01010111 111 o 01101111 40 ( 00101000 64 @ 01000000 88 X 01011000 112 p 01110000 41 ) 00101001 65 A 01000001 89 Y 01011001 113 q 01110001 42 * 00101010 66 B 01000010 90 Z 01011010 114 r 01110010 43 + 00101011 67 C 01000011 91 [ 01011011 115 s 01110011 44 , 00101100 68 D 01000100 92 \ 01011100 116 t 01110100 45 - 00101101 69 E 01000101 93 ] 01011101 117 u 01110101 46 . 00101110 70 F 01000110 94 ^ 01011110 118 v 01110110 47 / 00101111 71 G 01000111 95 _ 01011111 119 w 01110111 48 0 00110000 72 H 01001000 96 ` 01100000 120 x 01111000 49 1 00110001 73 I 01001001 97 a 01100001 121 y 01111001 50 2 00110010 74 J 01001010 98 b 01100010 122 z 01111010 51 3 00110011 75 K 01001011 99 c 01100011 123 { 01111011 52 4 00110100 76 L 01001100 100 d 01100100 124 | 01111100 53 5 00110101 77 M 01001101 101 e 01100101 125 } 01111101 54 6 00110110 78 N 01001110 102 f 01100110 126 ~ 01111110 55 7 00110111 79 O 01001111 103 g 01100111 127 . 01111111
Таблица альтернативной части кода ASCII 128 А 10000000 129 Б 10000001 130 В 10000010 131 Г 10000011 132 Д 10000100 133 Е 10000101 134 Ж 10000110 135 З 10000111 136 И 10001000 137 Й 10001001 138 К 10001010 139 Л 10001011 140 М 10001100 141 Н 10001101 1142 О 10001110 143 П 10001111 144 Р 10010000 145 С 10010001 146 Т 10010010 147 У 10010011 148 Ф 10010100 149 Х 10010101 150 Ц 10010110 151 Ч 10010111 152 Ш 10011000 153 Щ 10011001 154 Ъ 10011010 155 Ы 10011011 156 Ь 10011100 157 Э 10011101 158 Ю 10011110 159 Я 10011111
UNICODE – новый международный стандарт символьного кодирования. Это 16-битное кодирование, т.е. на каждый символ отводится 16 бит (2 байта) памяти. Сколько символов можно закодировать, используя UNICODE?
ПРЕДСТАВЛЕНИЕ ЧИСЛОВОЙ ИНФОРМАЦИИ Числа в памяти ЭВМ хранятся в двух форматах: формат с фиксированной точкой (целые числа); формат с плавающей точкой (десятичные дроби). Под точкой понимается знак разделения целой и дробной части числа.
Чтобы получить внутреннее представление целого положительного числа N в формате с фиксированной точкой нужно: Перевести число N в двоичную систему счисления; Полученный результат дополнить слева незначащими нулями до 16 разрядов. Пример 7. Получить внутреннее представление числа N=1607
Для записи внутреннего представления целого отрицательного числа (-N) нужно: Получить внутреннее представление положительного числа N; Получить обратный код этого числа заменой 0 на 1 и 1 на 0; К полученному числу прибавить 1. Пример 8. Определим по этим правилам внутреннее представление числа –1607.
Решение: 160710 = 110010001112 Внутреннее представление этого числа в машинном слове будет следующим: 0000 0110 0100 0111 в сжатой шестнадцатеричной форме этот код запишется так: 0647
Решение: 160710 = 110010001112 0000 0110 0100 0111 1111 1001 1011 1000 +1 ____________________________________________________ 1111 1001 1011 1001
ПРЕДСТАВЛЕНИЕ ГРАФИЧЕСКОЙ ИНФОРМАЦИИ Существует два подхода к решению проблемы представления изображения на компьютере: РАСТРОВЫЙ подход предполагает разбиение изображения на маленькие одноцветные элементы – видеопиксели, которые, сливаясь, дают общую картинку. ВЕКТОРНЫЙ подход разбивает всякое изображение на геометрические элементы: отрезки прямой, эллиптические дуги, фрагменты прямоугольников, окружностей и пр. При таком подходе видеоинформация – это математическое описание перечисленных элементов в системе координат, связанной с экраном монитора.
Растровый подход универсальный, т.е. он применим всегда, независимо от характера изображения. На современных ПК используется только растровые дисплеи, работающие по принципу построчной развертки изображения. Все разнообразие цветов, которое мы видим на экране компьютера достигается смешиванием всего лишь трёх основных цветов: красного, зеленого и синего, так называемая RGB-цветовая модель (Red, Green, Blue). Любой другой цвет характеризуется тем, какая в нем доля красного, зеленого и синего цветов
Восьмицветная палитра Пример 9. Смешиванием каких цветов получается розовый цвет? Пример 10. Известно, что коричневый цвет получается смешиванием красного и зеленого цветов. Какой код у коричневого цвета? К З С Цвет 0 0 0 Черный 0 0 1 Синий 0 1 0 Зеленый 0 1 1 Голубой 1 0 0 Красный 1 0 1 Розовый 1 1 0 Коричневый 1 1 1 Белый
Шестнадцатицветная палитра кодируется 4 битами по принципу «ИКЗС», где И – бит интенсивности, дополнительный бит, управляющий яркостью цвета. Это те же 8 цветов, но имеющие два уровня яркости. Например, если в 8-цветной палитре код 100 обозначает красный цвет, то в 16-цветной палитре: 0100 – красный, 1100 – ярко красный цвет; 0110 – коричневый, 1110 – ярко-коричневый (желтый)
Палитры большего размера получаются путем раздельного управления интенсивностью каждого из трёх базовых цветов. Для этого в коде цвета под каждый базовый цвет цвет выделяется более одного бита. Например, структура восьмибтного кода для палитры из 256 цветов такая: «КККЗЗЗСС» Связь между разрядностью кода цвета – b и количеством цветов – К (размером палитры) выражается формулой К=2b. Разрядность кода цвета – b принято называть битовой глубиной цвета. Так называемая естественная палитра цветов получается при b=24, для такой битовой глубины палитра включает более 16 миллионов цветов (224 = 16 777 216)
ПРЕДСТАВЛЕНИЕ ЗВУКА Основной принцип кодирования звука, как и кодирование изображения, выражается словом «дискретизация» Физическая природа звука – это колебания в определенном диапазоне частот, передаваемые звуковой волной через воздух (или другую упругую среду)
Процесс преобразования звуковых волн в двоичный код в памяти компьютера Звуковая волна МИКРОФОН ПАМЯТЬ ЭВМ Двоичный код АУДИОАДАПТЕР Переменный электрический ток
Процесс воспроизведения звуковой информации, сохраненной в памяти компьютера ПАМЯТЬ ЭВМ Двоичный код Звуковая волна АКУСТИЧЕСКАЯ СИСТЕМА АУДИОАДАПТЕР Электрический сигнал
АУДИОАДАПТЕР (Звуковая плата) – специальное устройство, подключаемое к компьютеру, предназначенное для преобразования электрических колебаний звуковой частоты в числовой двоичный код при выводе звука и для обратного преобразования (из числового кода в электрические колебания) при воспроизведении звука.
В процессе записи звука аудиоадаптер с определенным периодом измеряет амплитуду электрического тока и заносит в регистр двоичный код полученной величины. Затем двоичный код из регистра переписывается в оперативную память компьютера. Качество компьютерного звука определяется характеристиками аудиоадаптера: частотой дискретизации и разрядностью.
Частота дискретизации – это количество измерений входного сигнала за 1 секунду. Частота измеряется в Герцах (Гц). Одно измерение за 1 секунду соответствует частоте 1Гц. 1000 измерений за 1 секунду – 1 килогерц (1кГц). Характерные дискретизации аудиоадаптеров: 11кГц, 22 кГц, 44,1 кГц и др. Разрядность регистра – число бит в регистре аудиоадаптера. Разрядность определяет точность измерения входного сигнала. Чем больше разрядность, тем меньше погрешность каждого отдельного преобразования величины электрического сигнала в двоичное число и обратно.