Кодирование звуковой информации
Наша жизнь полна звуков
Звук – это звуковая волна с непрерывно меняющийся амплитудой и частотой Чем больше амплитуда, тем громче звук Чем больше частота сигнала, тем выше тон звука
Звук в природе имеет непрерывную (аналоговую) форму. При аналоговом представлении физическая величина принимает бесконечное множество значений, причём её значения изменяются непрерывно.
Дискретное представление звука При дискретном представлении физическая величина принимает конечное множество значений, причём её значения изменяются скачкообразно.
При движении тела по наклонной плоскости его координаты могут принимать бесконечное множество непрерывно изменяющихся значений из определённого диапазона Аналоговый сигнал можно сравнить с телом, движущимся по наклонной плоскости
Дискретный сигнал можно сравнить с телом, движущимся по лестнице при движении тела по лестнице – его координаты могут принимать только определённый набор значений, меняющихся скачкообразно
Цифровой сигнал — это всегда некоторое приближенное и упрощенное представление аналогового. Звук разбивается на составляющие, каждой из которых присваивается числовой код - происходит оцифровка звука. Дискретизация – это преобразование непрерывных изображений и звука в набор дискретных значений в форме кода.
Дискретизацией звукового сигнала занимаются звуковые карты наших компьютеров. Точнее, их аналого-цифровые преобразователи (АЦП). Звуковая карта (чаще ее называют Sound Blaster) представляет собой небольшую плату с набором микросхем с специальными разъемами для подключения микрофона, динамиков, клавиатуры и других подобных устройств. Карты Sound Blaster бывают различных типов и предоставляют широчайший спектр возможностей работы со звуком, начиная от записи с микрофона и кончая сложнейшим конструированием современных мелодий для большого оркестра. АЦП через определенные интервалы времени измеряет уровень сигнала на входе и записывает полученное число на диск. Последовательность этих чисел и составляет звуковой файл
Понятно, что чем чаще измеряется уровень на входе (то есть чем чаще идут вертикальные линии на рисунке), тем точнее цифровой сигнал воспроизводит форму аналогового. Этот параметр и есть частота дискретизации или частота семплирования частота дискретизации
Такая же ситуация и с уровнями сигналов — чем чаще идут горизонтальные линии, тем точнее узелки попадают на кривую. Компьютер может записать напряжение на входе звуковой карты только с определенной точностью, зависящей от размеров числа, которым может быть представлена громкость. 4 байта (64 бита)-18446744073709551616 горизонтальных линий 2 байта (16 бит)-65 536 линий, 1 байт (8 бит)-256 линий, Этот параметр называется глубиной или разрядностью звука (bit rate). Глубина (разрядность) звука
На аудиодисках частота дискретизации всегда 44,1 кГц (вдвое выше того, что может слышать человеческое ухо), а глубина звука 16 бит (на DVD может быть другое качество). Профессиональные и даже полупрофессиональные карты нового стандарта могут писать и с частотой 96 кГц, глубину звука иметь 4-байтную и даже выше, что обеспечивает супервысокое качество сигнала. Но, наверное, один человек из тысячи способен на слух определить, где «44 х 16», а где «96х32». Все остальные замечают только большую разницу в размерах файлов
Размер файла при изменении качества звука растёт очень быстро Дискретиза-ция Раз-ряд-ность Число каналов Размер записи в 1 секунду 11 кГц 8 бит 1 канал - моно 11 КБ 44,1 кГц 16 бит 2 канала - стерео 172 КБ 96 кГц 24 бита 2 канала - стерео 4,5МБ альбом (50мин) 1,4 ГБ
Наиболее часто используемые форматы звуковых файлов 1. WAVE (.wav) - наиболее широко распространенный формат. Используется в ОС Windows для хранения звуковых файлов. Файлы в этом формате имеют большой размер, который зависит от: дискретизации (частоты семплирования ); разрядности звука; моно - или стереозвука; длительности. 2. MPEG-3 (.mp3) - наиболее популярный на сегодняшний день формат звуковых файлов. При кодировании применяется психоаккустическая компрессия: из мелодии удаляются звуки, не воспринимаемые человеческим ухом (воспринимаемый диапазон 20-20000 Гц). 3. MIDI (.mid) - содержат не сам звук, а только команды для воспроизведения звука. Звук синтезируется с помощью FM- или WT-синтеза. Если звуковая карта не содержит синтезатора, то такой звук воспроизводится не будет. 4. Real Audio (.ra, .ram) - разработан для воспроизведения звука в Internet в режиме реального времени. Полученное качество в лучшем случае соответствует плохонькой аудиокассете, для качественной записи музыкальных произведений применение формата MPEG-3 более предпочтительно. Низкий размер достигается применением методов сжатия. 5. MOD (.mod) - музыкальный формат, в нем хранятся образцы оцифрованного звука, которые можно затем использовать как шаблоны для индивидуальных нот. Файлы в этом формате начинаются с набора образцов звука, за которыми следуют ноты и информация о длительности. Каждая нота воспроизводится с помощью одного из приведенных в начале звуковых шаблонов. Такой файл, в отличие от MIDI-файла, полностью задает звук, что позволяет воспроизводить его на любой компьютерной платформе.
Писать музыку непосредственно в компьютере: в музыкальных программах (секвенсорах) удобно создавать музыку, переправляя в компьютер ноты с синтезатора или MIDI-клавиатуры; можно мышкой нарисовать все нужные ноты (занятие это очень трудоемкое); Записывать живой звук с микрофона или линейного входа звуковой карты, используя компьютер как компактную студию звукозаписи; После оцифровки используют программы редактирования звуковых файлов для монтажа музыки, разного рода коррекций и спецэффектов. Создавать музыку с помощью компьютера можно двумя основными способами:
На самом деле все три способа можно применять совместно: часть инструментов писать живьем (уж вокал-то точно!), часть играть по MIDI, отдельные партии формировать из фрагментов чужих композиций (например, использовать качественно записанные барабанные петли). Для того, чтобы музыка выглядела (точнее, звучала), как живая, нужно очень постараться, много знать и уметь! Но есть и третий способ, при котором вы вообще можете ничего не вводить в компьютер. Например, нарезать кусочки из чужих произведений, зациклить их (получаются так называемые петли- loop) и из этих петель монтировать свое произведение. Этот метод часто используется в современной танцевальной музыке.