Тема 1.4 Кодирование данных в ЭВМ
Кодирование данных Прием кодирования, то есть выражение данных одного типа через данные другого типа.
Кодирование данных в двоичной форме Двоичные цифры (англ. – binary digit или, сокращенно, bit (бит)). Одним битом могут быть выражены два понятия: 0 или 1 (да или нет) Двумя битами уже можно выразить четыре различных понятия: 00 01 10 11 Тремя битами можно закодировать восемь различных значений: 000 001 010 011 100 101 110 111 Вывод: Увеличивая на единицу количество разрядов в системе двоичного кодирования, мы увеличиваем в два раза количество значений, которое может быть выражено в данной системе: N=2m, N – количество независимых кодируемых значений; т – разрядность двоичного кодирования, принятая в данной системе.
Формы представления чисел С целью упрощения схем вычитание в ЭВМ заменяется сложением специально построенных кодов чисел. Применяются прямой, обратный и дополнительный коды чисел
Формы представления чисел 1.1 Двоично-десятичное представление целых чисел: (123)10 = (0001.0010.0011)2-10 1.2 Прямой код: число переводится в двоичную систему счисления; двоичную запись слева дополняют необходимым числом незначащих нулей. (37)10 = (100101)2 = (0000000000100101)прямой код 1) Целые числа
Формы представления чисел Замечание: В случае представления величины со знаком самый левый (старший) разряд указывает: на положительное число, если содержит нуль, и на отрицательное число, если – единицу.
Формы представления чисел 1.3 Дополнительный код: для положительного числа совпадает с его прямым кодом; для отрицательных чисел: записывают прямой код модуля числа; инвертируют его; прибавляют к инверсному коду 1. (-37)10 (0000000000100101)прямой код (1111111111011010)инверсия (1111111111011011)дополнительный код
Формы представления чисел Замечание: При получении числа по его дополнительному коду, сначала определяют знак числа: если число положительное просто переводят его в десятичную систему счисления; если число отрицательное: вычитают из кода 1; инвертируют код; переводят в десятичную систему счисления. (1111111111000000)дополнительный код (1111111110111111) (0000000001000000) (1000000)2 = (64)10 ответ: -64
Формы представления чисел Недостатками представления чисел с фиксированной запятой являются: необходимость предшествующего расчета и введения масштабных коэффициентов для исключения возможности переполнения разрядной сетки(когда число по модулю превышает единицу), а также потери младших разрядов (число по модулю меньше единицы младшего разряда); зависимость относительной точности от значения поступающих чисел. Максимальная относительная точность достигается при выполнении действий над максимально возможными числами. Преимуществом является простота и высокое быстродействие выполнения операций. 2) Натуральная с фиксированным положением запятой
Формы представления чисел 3) Полулогарифмическая с плавающей запятой A = m·qn, где q – основание СС; n – целое число, называемое порядком числа A; m – мантисса числа A (1< |m| < 10). 31,415926 = = 3,1415926·101 0,00125 = = 1,25·10-3
Способ хранения мантиссы с плавающей точкой подразумевает, что двоичная запятая находится на фиксированном месте, а именно следует после первой двоичной цифры. Смещение выбирается так, чтобы минимальному значению порядка соответствовал нуль. Бит S указывает на знак числа.
Алгоритм для получения представления действительного числа в памяти ЭВМ: перевести модуль числа в двоичную систему счисления; нормализовать двоичное число; прибавить к порядку смещение и перевести смещенный порядок в двоичную систему счисления; учитывая знак заданного числа (0 – положительное; 1 – отрицательное) записать его представление в памяти ЭВМ.
Пример: Найти код числа: -312,3125. 1. (312,3125)10 = (100111000,0101)2 (100111000,0101)2 = (1,001110000101·28)2 смещенный порядок: 8+1023 = (1031)10 = (10000000111)2 Ответ:
Кодирование текстовых данных Кодировка Windows 1251
Кодирование текстовых данных Кодировка КОИ-8
Кодирование текстовых данных Кодировка ISO
Кодирование текстовых данных ГОСТ-альтернативая кодировка
Кодирование текстовых данных Универсальная система кодирования текстовых данных UNICODE (Юникод) основана на 16-разрядном кодировании символов, что позволяют обеспечить уникальные коды для 65 536 различных символов
Кодирование графических данных 1) Ч/Б изображения - 256 градаций серого (8 бит) 2) Цветные изображения а) RGB (Red, Green, Blue) – 24 бит (16.5 млн. цв.) режим полноцветный True Color б) CMYK (Cyan, Yellow, Magenta, Black) – 32 бит режим полноцветный True Color в) 16 бит - режим высококачественный High Color
Кодирование звуковой информации 1) FM (Frequency Modulation – Частотная модуляция) Кодирование на основе АЦП (Аналогово-цифрового преобразования) 2) Wave-Table (Таблично-волновой синтез) Кодирование на основе таблиц, содержащих образцы звука (сэмплы) 3) Для хранения 5-минутной аудиозаписи CD-качества необходимый объем памяти составит: 48.000 Гц 16 бит 2 канала 300 с = = 57.600.000 байт = 56.250 Кбайт = 55 Мбайт