Кодирование текста
Цели урока: Познакомиться с методом измерения информации в символьном сообщении. Рассмотреть понятие - Таблица кодировки. Научиться вычислять количество информации, заключенное в тексте, составленном из символов определенного алфавита
В традиционных кодировках для кодирования одного символа используется 8 бит. Легко подсчитать по формуле : N=2i где i – количество информации; N – количество возможных событий; что такой 8-разрядный код позволяет закодировать 256 различных символов.
Присвоение символу определенного числового кода - это вопрос соглашения. В качестве международного стандарта принята кодовая таблица ASCII , кодирующая первую половину символов с числовыми кодами от 0 до 127 (коды от 0 до 32 отведены не символам, а функциональным клавишам).
Коовая таблица ASCII (American Standart Code for Information Interchang)
Национальные стандарты кодировочных таблиц включают международную часть кодовой таблицы без изменений, а во второй половине содержат коды национальных алфавитов, символы псевдографики и некоторые математические знаки. К сожалению, в настоящее время существуют пять различных кодировок кириллицы (КОИ8-Р, Windows, MSDOS, Macintocs и ISO), что вызывает дополнительные трудности при работе с рускоязычными документами.
Хронологически одним из первых стандартов кодирования русских букв на компьютерах был КОИ8 («Код обмена информацией, 8-битный»). Эта кодировка применялась еще в 70-ые годы прошлого века на компьютерах серии ЕС ЭВМ, а с середине 80-х стала использоваться в первых русифицированных версиях операционной системы UNIX.
Наиболее распространенной в настоящее время является кодировка Windows, обозначаемая сокращением СР1251 («СР» означает «кодовая страница»). От начала 90-х годов, времени господства операционной системы MSDOS, остается кодировка СР866. Компьютеры фирмы Аррlе, работающие под управлением операционной системы Мac OS, используют свою собственную кодировку Мac. Кроме того, Международная организация по стандартизации утвердила в качестве стандарта для русского языка еще одну кодировку под названием ISO.
В конце 90-х годов появился новый международный стандарт Unicode, который отводит под один символ не один байт, а два, и поэтому с его помощью можно закодировать не 256, а 65536 различных символов. Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и прочих символов. .
Пример . Представьте в форме шестнадцатеричного кода слово «ЭВМ» в 4-х кодировках. Последовательности десятичных кодов слова «ЭВМ» в различных кодировках составляем на основе кодировочных таблиц: КОИ8-Р: 252 247 237 СР1251: 221 194 204 Mac: 157 130 140 ISO: 205 178 188
Пример . Представьте в форме шестнадцатеричного кода слово «ЭВМ» в 4-х кодировках. Последовательности десятичных кодов слова «ЭВМ» в различных кодировках составляем на основе кодировочных таблиц: КОИ8-Р: 252 247 237 СР1251: 221 194 204 Mac: 157 130 140 ISO: 205 178 188
Пример . Представьте в форме шестнадцатеричного кода слово «ЭВМ» » в 4-х кодировках. Переводим с помощью калькулятора последовательности кодов из десятичной системы в шестнадцатеричную: КОИ8-Р: FС F7 ЕD СР1251: DD С2 СС Maс: 9В 82 8С ISO: СD В2 ВС
Пример . Представьте в форме шестнадцатеричного кода слово «ЭВМ» » в 4-х кодировках. Переводим с помощью калькулятора последовательности кодов из десятичной системы в шестнадцатеричную: КОИ8-Р: FС F7 ЕD СР1251: DD С2 СС Maс: 9В 82 8С ISO: СD В2 ВС
Спасибо за внимание!
Автор презентации: Ширяева Ольга Мухадинновна, Муниципальное Общеобразовательное Учреждение «Средняя общеобразовательная школа №2», учитель информатики, 1 квалификационной категории. http://www.shiryaeva.86sch2-nyagan.edusite.ru
В презентации использованы материалы учебного пособия: «ПРАКТИКУМ поинформатике и информационнымтехнологиям», Н. Угринович, Л. Босова,Н. Михайлова - М.: БИНОМ. Лаборатория знаний, 2004.