Кодирование текстовой (символьной) информации
Рассматриваемые вопросы: - исторический экскурс; - двоичное кодирование текстовой информации; - расчет количества текстовой информации.
Историческая справка Криптография - это тайнопись, система изменения письма с целью сделать текст непонятным для непосвященных лиц Азбука Морзе или неравномерный телеграфный код, в котором каждая буква или знак представлены своей комбинацией коротких элементарных посылок электрического тока (точек) и элементарных посылок утроенной продолжительности (тире) Сурдожесты - язык жестов, используемый людьми с нарушениями слуха Вопрос: Какие примеры кодирования текстовой информации можно привести еще?
Примеры кодирования «Здравствуй, Саша!» Русский текст –латинскими буквами «Zdravstvuy, Sasha!» Семафор (положение) Наскальный рисунок – БИЗОН Иероглиф «Торговец рыбой» (Китай)
Код Цезаря Замени каждую букву шифруемого текста на другую путем смещения в алфавите от исходной буквы на фиксированное количество символов! А Б В Г Д Е Ё Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я1 Юлий Цезарь (I век до н.э.)
Задание: Расшифруйте фразу персидского поэта Джалаледдина Руми «кгнусм ёогкг фесл тцфхя фзужщз фхгрзх ёогксп», закодированную с помощью шифра Цезаря. Известно, что каждая буква исходного текста заменяется третьей после нее буквой. А Б В Г Д Е Ё Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я Ответ: Закрой глаза свои пусть сердце станет глазом
Двоичное кодирование текстовой информации Для представления текстовой информации в компьютере используется алфавит мощностью 256 символов. Один символ такого алфавита несет 8 бит информации: 28=256, 8 бит=1 байту, следовательно, двоичный код каждого символа в компьютерном тексте занимает 1 байт памяти
Кодовая таблица ASCII American Standard Code for Information Interchange функциональные клавиши буквы английского алфавита, знаки математических операций и т.д.
Таблицы кодировки русскоязычных символов КОИ8-Р CP1251 CP866
Mac ISO
Работа в текстовом редакторе MS Word Запустите текстовый редактор MS Word. Удерживая клавишу «ALT», наберите коды на дополнительной цифровой клавиатуре: 161 168 226 Какое слово получили?
Кодировка Unicode 1 символ - 2 байта (16 бит), которыми можно закодировать символов
Количество информации в сообщении Iсообщения=Iсимвола* K Iсообщения- информационный объем сообщения Iсимвола- информационный объем символа (мощность алфавита) К – количество символов
Расчет количества текстовой информации Создайте текстовый документ в редакторе MS Word и напечатайте в нём пословицу: Ученье – атаман, а неученье – комар. Вопрос: Сколько символов? Вопрос: Каков информационный объем файла?
Задачи Какова мощность алфавита, с помощью которого записано сообщение, содержащее 2048 символов, если его объем составляет 1,25 Кбайта. Арифметически перевести информационный объем сообщения в биты: I = 10 240 бит Определить количество бит, приходящееся на один символ: 10 240 бит : 2 048 = 5 бит По формуле N = 2I определить количество символов в алфавите: N = 2I = 25 = 32
Задачи В фразе 108 символов, учитывая знаки препинания, кавычки и пробелы. Сколько бит информации несет эта фраза? Лазерный принтер Canon LBP печатает со скоростью в среднем 6,3 Кбит в секунду. Сколько времени понадобится для распечатки 8-ми страниц документа, если известно, что на одной странице в среднем по 45 строк, в строке 70 символов (1 символ – 1 байт).
Задачи Какова мощность алфавита, с помощью которого записано сообщение, содержащее 2048 символов, если его объем составляет 1/512 часть одного мегабайта. Пользователь компьютера, хорошо владеющий навыками ввода информации с клавиатуры, может вводить в минуту 100 знаков. Мощность алфавита, используемого в компьютере равна 256. Какое количество информации в байтах может ввести пользователь в компьютер за 1 минуту.
Вопросы: 1. Какой принцип кодирования текстовой информации используется в компьютере? 2. Как называется международная таблица кодировки символов? 3. Перечислите названия таблиц кодировок для русскоязычных символов.