Кодирование звуковой информации Презентация 10-19
С начала 90-х годов персональные компьютеры получили возможность работать со звуковой информацией. Каждый компьютер, имеющий звуковую плату, микрофон и колонки, может записывать, сохранять и воспроизводить звуковую информацию. С помощью специальных программных средств (редакторов аудиофайлов) открываются широкие возможности по созданию, редактированию и прослушиванию звуковых файлов. Создаются программы распознавания речи и появляется возможность управления компьютером при помощи голоса.
У всех источников звука имеются колеблющиеся части, которые приводят в колебательное движение частицы окружающей среды (воздуха) → распространяющаяся звуковая волна вызывает колебательное движение барабанной перепонки уха человека, которое воспринимается мозгом как звук → не все источники колебаний являются источниками звука → звук – механические колебания в частотном диапазоне от 16 Гц до 22000 Гц
Упругие волны в воздухе с частотой от 16 до 20000 Гц вызывают у человека звуковые ощущения. Волны с частотой меньше 16 Гц называют инфразвуковыми, а с частотой больше 20 000 Гц - ультразвуковыми.
Частота 22000 Гц 16 Гц Источники звука Источники колебаний
Звук представляет собой звуковую волну с непрерывно меняющейся амплитудой и частотой. Чем больше амплитуда сигнала, тем он громче для человека, чем больше частота сигнала, тем выше тон.
Звуки различной громкости Громкий звук Тихий звук
Звуки различной высоты Низкий звук Высокий звук
Для того чтобы компьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть превращен в последовательность электрических импульсов (двоичных нулей и единиц).
Схема преобразования звуковой волны в двоичный код Звуковая волна Двоичный код Микрофон Звуковая плата (аудиоадаптер) Память ЭВМ Электрический ток
Схема воспроизведения звука, сохранённого в памяти ЭВМ Звуковая волна Звуковая плата (аудиоадаптер) Память ЭВМ Электрический ток Двоичный код Динамик
Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, причем для каждого такого участка устанавливается определенная величина амплитуды. Таким образом, непрерывная зависимость амплитуды сигнала от времени А(t) заменяется на дискретную последовательность уровней громкости. На графике это выглядит как замена гладкой кривой на последовательность “ступенек”.
Процесс преобразования непрерывного аналогового сигнала в дискретный (прерывистый) называется временной дискретизацей.
Временная дискретизация Т 2Т Время Громкость
Временная дискретизация Т 2Т Громкость Время
Временная дискретизация Т Время Громкость
Временная дискретизация Т Время Громкость
Временная дискретизация Т Время Громкость
Количество измерений уровня звукового сигнала за 1 секунду называют частотой дискретизации.
Зависимость качества звука от частоты дискретизации ν ν ν ν
Т N →∞ Количество уровней громкости при дискретизации по времени Время Громкость
N →∞ Изменение качества звука при дискретизации по уровню Т N = 4 Время Громкость
N = 4 N = 8 Изменение качества звука при дискретизации по уровню Т Время Громкость
Количество информации, которое необходимо для кодирования дискретных уровней громкости цифрового звука называют глубиной кодирования звука.
Зависимость качества звука от глубины кодирования Глубина кодирования
Соответствие звуков различных характеристик некоторым источникам звука 8 кГц 44,1 кГц Радиотрансляция AudioCD 192 кГц DVD-Audio 8 бит 16 бит 24 бит
Расчёт объёма звукового файла I=k·ν·i·t Где I – размер (объём) звукового файла k – количество дорожек в записи (k=1 – моно, k=2 – стерео) ν – частота дискретизации (в Герцах) i – глубина кодирования (в битах) t – время звучания (в секундах)
Оценка объёма звукового файла Ю. Антонов «Белый теплоход», время звучания 3 мин 18 сек, качество аудио-CD диска, стерео Дано: ν = 44,1 кГц I = 16 бит t = 3 мин 18 с k = 2 Найти: V Решение: 44,1 кГц = 44100 Гц 3 мин 18 с = 198 с V = k ν I t = 2·44100 Гц·16 бит·198 с = = 279417600 бит = 34927200 байт ≈ ≈ 34108,6 Кб ≈ 33,3 Мб Ответ: V = 33,3 Мб
Изменение качества при сжатии звуковых файлов Частота звука, кГц 10 5 22,5 18 14 8 6 4 16 12 Спектрограмма несжатого звука (формат WAV) Спектрограмма сжатого звука (формат mp3, битрейт 128 кбит/с) Спектрограмма сжатого звука (формат WMA, битрейт 128 кбит/с)
Звук «живой» и оцифрованный
Задачи 1. Оцените информационный объем моноаудиофайла длительностью звучания 20 с, если \"глубина\" кодирования и частота дискретизации звукового сигнала равны соответственно 8 бит и 8 кГц.
Задачи 2. Рассчитайте время звучания моноаудиофайла, если при 16-битном кодировании и частоте дискретизации 32 кГц его объем равен 700 Кбайт.