Как качественно оцифровать звук

Часть 2


 

Прежде всего, позвольте мне поблагодарить всех читателей iXBT Hardware за проявленный интерес к моей статье "Как качественно оцифровать Звук", а также за все ваши отзывы. Затронутые в той статье вопросы о технике записи звука на PC — это лишь малая часть материала, который может помочь тем из наших читателей, кто захочет использовать звуковую карту не только для игр и прослушивания стянутых из Сети mp3-файлов, но и для других интересных и увлекательных вещей. Поэтому, если вопросы по этой теме будут в дальнейшем интересны читателям, мы будем освещать их более подробно. "За кадром" остались такие важные моменты, как, например, техника записи вокала. А так же, пригоден ли для этого микрофонный вход на звуковой карте, и что делать тем, кого гнездо "Mic In" никоим образом не устраивает… Тем не менее, высказанные в статье рекомендации тоже требуют, судя по вашим многочисленным отзывам, пояснений и уточнений.

Ниже я постараюсь ответить на наиболее типичные и часто задаваемые в переписке вопросы. Заранее благодарю за конструктивную критику, ценные замечания и поправки. Итак, начнем.

1. В своей статье Вы написали: "…магнитная лента на "железных" кассетах просто не пропустит частоты выше 14000 Гц, остальное будет жестоко ослаблено", тогда как ферромагнитная лента запросто фиксирует и более высокочастотные сигналы. Как это понимать?

Перед тем, как ответить на этот вопрос, я вкратце объясню сущность магнитной звукозаписи.

На рисунке 1 изображена схема процесса записи-воспроизведения. Упрощенно можно представить, что участки рабочего слоя, намагниченные в одном направлении, — это магнит со свойственным ему магнитным полем.


Cхема процесса записи-воспроизведения
Рис. 1. Упрощенно можно представить, что участки рабочего слоя, намагниченные в одном направлении, — это магнит со свойственным ему магнитным полем.

Конечно, расположение намагниченных частиц, изображенных на рисунке, представлено очень условно. Когда по обмотке сердечника головки записи пропускают переменный ток, сердечник намагничивается, и создаваемое им переменное магнитное полевоздействует на рабочий слой ленты. Участки последнего сначала намагничиваются до насыщения, а затем по мере удаления их от зазора головки полностью размагничиваются. Так как лента плотно прилегает к рабочему зазору головки записи, значительная часть магнитного потока головки записи проникает в рабочий слой ленты и определенным образом ориентирует самопроизвольно намагниченные области — магнитные домены. Как вы понимаете, число таких доменов, проходящих через рабочий зазор головки за единицу времени, не бесконечно, а поэтому есть все основания считать даже магнитную запись "цифровой", поскольку намагниченность домена имеет лишь два устойчивых состояния. Другое дело, что "разрядность" и полоса рабочих частот в такой "цифровой системе" заранее не известны из-за вмешательства многих факторов, таких как качество полива магнитной ленты, особенности системы сердечник_зазор_лента и т.д.

Однако если руководствоваться только этими принципами, качественная запись не получится. Открыто, что если помимо записываемого сигнала подвести к головке записи еще и ультразвуковой переменный ток (ток подмагничивания), то удается на порядки снизить искажения и шумы. Грубо это можно пояснить тем, что высокочастотное поле непрерывно как бы трясет внутреннюю структуру магнитных частиц, и их "перемагничивание" низкочастотным полем происходит точно в соответствии со значением напряженности этого поля.

При перемещении намагниченной ленты по головке воспроизведения в ее сердечник входит основная часть изменяющегося по величине и направлению магнитного потока ленты и в обмотке головки наводится переменная ЭДС, в соответствии с законом электромагнитной индукции. Эта самая ЭДС — недостаточна, и поэтому требуется усилитель воспроизведения, который индивидуален у каждой модели магнитофона, из-за различных свойств магнитных головок и применяемых методик усиления сигнала различными производителями аппаратуры. Именно поэтому и желательно знать особенности тракта запись-воспроизведение для аппарата, с которым ведется работа.

Теперь о частотах.

Чем выше частота записываемого сигнала, то есть чем короче длина волны записи (где v — скорость движения ленты и  f — частота записываемого сигнала), тем меньше продольный размер элементарного магнитного домена () и, следовательно, тем сильнее размагничивающее поле.

Таким образом, с повышением частоты записываемого сигнала и снижением скорости движения ленты магнитный поток в рабочем слое носителя ослабевает и ЭДС, наводимая в обмотке головки воспроизведения, уменьшается.

Вследствие этого, при скорости движения ленты 4,76 см/с крайне трудно обеспечить высокую линейность АЧХ тракта запись-воспроизведение магнитофона в полосе более широкой, нежели 30–14000 Гц для ферромагнитной ленты (у этого типа ленты магнитные домены, грубо говоря, самые крупные). Расширяя этот диапазон записываемых и воспроизводимых частот, производители сталкиваются с массой проблем, связанных с низкой скоростью движения ленты, трудоемкостью изготовления магнитных головок с весьма узким рабочим зазором (который должен быть постоянным) и т.д. Уменьшая рабочий зазор, мы уменьшаем соотношение сигнал/помеха. С другой стороны, при увеличении глубины коррекции в тракте записи повышаются нелинейные искажения, вызываемые перемодуляцией ленты, увеличивая глубину коррекции тракта воспроизведения — мы сталкиваемся с возросшим уровнем шумов. Отсюда ряд технологических решений для выжимания честного Hi-Fi-диапазона (20–20000 Гц) из нашей компакт-кассеты на скорости 4,76 см/с: системы динамического подмагничивания (например, Dolby HX Pro), компандерные системы шумопонижения (Dolby B, C и т.д.), применение сложных схем оптимизации, MPX-фильтры и многое другое. Особенно хочется упомянуть и про самую совершенную на сегодня систему адаптивного динамического подмагничивания, разработанную Николаем Суховым еще в 1983 г. Ну, а про дорогие кассеты с двойным поливом (TDK AR) я вообще деликатно умолчу. Не каждый может их себе позволить, да и категория продающихся кассет с записями значительно ближе к куда более низкому ценовому диапазону.

И все же читатели правы в том смысле, что не лента является сдерживающим фактором для широкого частотного диапазона записи, а само устройство. Но я об этом упомянул ровно абзацем ранее. Повышая диапазон частот при записи на ферромагнитной ленте, можно еще воспользоваться увеличением скорости движения ленты относительно головки записи и при помощи вращения последней, что с успехом используется в Hi-Fi видеомагнитофонах. Надеюсь, эта информация была полезной для читателя (несмотря на подобную наукоемкость :-)), и помогла разобраться в смысле моей фразы, прозвучавшей в вопросе. Знать об основах магнитной записи необходимо, хотя бы потому, что формат носителя на магнитной ленте будет существовать еще долго (вспомним о MiniDV, Digital8, D-VHS, все носители этих форматов — лента, и все вышесказанное относится и к ним).

2. Каким образом распаивается упомянутый в статье разъем Canon?

Поправку к моей статье прислал Дмитрий Климов. В письме он сообщил:

"…в разъемах Canon экран никогда не припаивается к центральному контакту, на этот контакт идет так называемый "холодный" провод при симметричном кабеле. В случае, когда требуется сделать переход на несимметрию, то "холодный" провод соединяется с экраном в разъеме. Но от этого суть стандарта не меняется — экран паяется к первому контакту (а он боковой), при этом, если внимательно посмотреть на разъем, то можно увидеть, что этот контакт чуть выдвинут вперед к торцу разъема (я о "мамах" говорю) для того, чтобы экран законтачить раньше сигнальных проводов при присоединении кабеля".

Абсолютно верное замечание, Дмитрий :).

Все дело в том, что я еще лет пять назад перепаял все свои XLR кабели с разъемом Canon по-своему, (я, если честно, приверженец этого профессионального разъема), в том числе и симметричные. К сожалению, на момент написания статьи под рукой не оказалось "заводского" кабеля с разъемом Canon и пришлось, раскрутив свой собственный, написать именно о нем, ну а про "честную" распайку я малость подзабыл, прошу великодушно извинить автора за эту оплошность :-(. Но теперь истина восторжествовала и давайте разберемся раз и навсегда, что это за зверь такой :-).

Гнездо разъема Canon (рисунок 2, а) представляет собой металлический конструктив с тремя контактами. Как было указано, контакт №1 — это "холодный" контакт, который практически во всех профессиональных микрофонных кабелях припаивается перемычкой к экрану в разъеме. Видно также, что сигнальные контакты №2 и №3 несколько углублены внутрь конструкции, тогда как №1 — действительно выдвинут чуток поближе к торцу.



а)


б)
Рис. 2. Разъем Canon

Экран в разъеме — это сама металлическая его часть, помимо контактов. На рисунке 2, б видно, что к этому самому экрану припаян оголенный провод. При защелкивании разъема экран соединен с экраном (металлическая часть "мамы" намертво присоединяется к металлу "папы"), и мы добиваемся очень качественного экранирования аппаратуры (а микрофон ох как в этом нуждается!). Про сигнальные контакты №2 и 3 беспокоиться не стоит, главное чтобы в кабеле №2 соединялся с №2, а №3, соответственно — с №3. Думаю не нужно объяснять, что качество соединения аппаратуры, обеспечиваемое разъемом Canon — очень высокого уровня.

3. Я попытался найти в файле cool.ini раздел [Filters96] и не нашел! Может это зависит от программы? У меня стоит Cool Edit Pro 1.1

Раздел [Filters96] в cool.ini версии Cool Edit Pro 1.1 и вправду отсутствует. Простите, не додумал :(. Однако есть довольно простой рецепт. Необходимо сделать следующую последовательность действий:

  • Открываем Cool Edit Pro 1.1 и какой-нибудь *.wav.
  • Открываем FFT-фильтр (он ведь есть в любой версии Cool Edit Pro, не так ли?).
  • Делаем какую-нибудь загогулину в окне графа. Сохраняем данный пресет (Add Preset) под ОЧЕНЬ оригинальным именем (скажем, "!!!!!!!!!!!").
  • Теперь в cool.ini ищем это ОЧЕНЬ оригинальное имя, например в редакторе FAR нажмите F7.
  • Нашли? А что за раздел? [****]? Замечательно! Именно сюда заливаем содержимое строчки.
  • Наслаждаемся :)

Подобные махинации частенько помогают. Кстати, в Cool Edit 2000 раздел [Filters96] имеется. В Cool Edit Pro 1.2 по сравнению с версией 1.1 увеличена скорость просчета большинства эффектов на 30…300%, появилась кнопка Preview для многих из них. Да и стабильность повыше. Не стоит этим пренебрегать.

Хочу сразу же предостеречь читателя от неправильного использования FFT-фильтра, которое может повлечь за собой ощутимое искажение сигнала.




Рис. 3. Окно FFT-filter в звуковом редакторе Cool Edit Pro
  • Во-первых, не стоит никогда использовать максимально возможный размер FFT-блока (FFT-size). Разрешение до 0,7 Гц при FFT Size=65536 — это, конечно, здорово, но временные искажения могут сказаться. Достаточно в большинстве случаев использовать значения от 1024 до 4096.
  • Во-вторых, не используйте первую попавшуюся оконную функцию (см. Рис. 3). Используйте только Blackman-Harris, в крайнем случае, Blackman.
  • Не работайте с этим фильтром на высоких частотах при экстремальных корректировках амплитуды. 10-15 дБ большой беды не наделают, а для "выреза верхов" лучше все-таки элементарный эквалайзер.
  • Не корректируйте один и тот же фрагмент много раз этим фильтром. Временные искажения могут дать о себе знать.
  • Наконец, используйте этот тип фильтра лишь для выреза узких полос (Notch Filtering) или тогда, когда вам важно сберечь фазовые параметры сигнала, к которым FFT-фильтрация очень аккуратно относится.

Сделаю еще одну "поправку на ветер". В руководстве пользователя программы Cool Edit Pro написано, что значение параметра Precision Factor при шумоподавлении не может превышать 14 единиц. Однако это не так. Наилучшие результаты достигаются при нечетных значениях 49-79. Мне также сообщили, что иногда и встроенный в Samplitude Studio шумоподавитель прекрасно справляется со своей прямой задачей и убирает шум очень корректно. Проверено ;-).

4. Внимательно прочитал Вашу статью "Как качественно оцифровать Звук". Согласен я не совсем. По поводу ресурса эксплуатации кассеты. Число 300 я не встречал ни разу. На отечественные носители по стандарту было 50 прогонов, на фирменные BASF обещали 2000 (BASF Chrome Extra, Chrome Maxima). Конечно, можно резиновые ролики протирать спиртом. Но от спирта резина сохнет и может потрескаться, поэтому рекомендуют другие средства.

Потом, Вы даете рекомендации по выравниванию характеристики тракта записи-воспроизведения конкретного аппарата. Во-первых, магнитные головки стареют и заметно меняют свои характеристики, и даже если запись сделана на том же аппарате два года назад, многое изменилось. Во-вторых, очевидно, что характеристика канала записи магнитофона, на котором произведена студийная запись, нам не известна. Т.е. то, что я получу, воспользовавшись Вашими рекомендациями, Вы предсказать не сможете.

Вопросы достаточно глубокие и важные. Начнем по порядку.

Ресурс эксплуатации ленты может варьироваться весьма значительно — в зависимости от большого количества факторов. Главный из них — это насколько правильно и бережно хранится лента. Ухудшение физико-механических и электроакустических свойств лент происходит из-за изменений свойств несущего слоя. Магнитные свойства лент даже при длительном хранении практически не изменяются, но неправильное хранение и эксплуатация делают их хрупкими, подверженными частым обрывам и вытягиванию, а в записях могут появиться участки с резкими провалами в громкости. Перепады температуры, воздействие тепла и прямого солнечного света тоже не пойдут вашим кассетам на пользу. Следует сразу же, в зародыше, устранять причину детонации и изменение скорости движение ленты (когда запись "тянет"). Не советую прикасаться к ленте без надобности. Все это, плюс особенности данной магнитной ленты и формирует тот самый ресурс. Критерии у всех разные, и поэтому можно говорить о цифрах, различающихся на порядок. Ну а цифра 300 — это среднее количество прогонов для TDK-D, после начинаются выпадения.

Резиновые ролики — это конечно вещь важная, жутко влияющая на детонацию. Но вот излишний ажиотаж вокруг губительного воздействия эфирных масел в одеколоне и растворителя (спирта) на резину прижимного ролика — по-моему, не нужен. Не следует протирать ролик слишком часто. От этого он твердеет и влияет на детонацию. Но ждать пока магнитные частицы начнут отваливаться кусками — не стоит. В экстремальной ситуации подойдет и одеколон. Автор вопроса рекомендует пользоваться мыльным раствором. Весьма дельный совет, но осторожно — не залейте им отсек кассетоприемника ;-).

Теперь самое важное: выравнивание АЧХ. Действительно, магнитные головки стареют. Но поэтому и нужно выяснить параметры тракта перед тем, как приступить к процессу реставрации. Есть вообще три выхода в этой ситуации.

  • Можно конечно скорректировать сигнал и на слух. Но, памятуя о том, как можно обмануть наше ухо тем же MP3, — это не самый лучший вариант. Многие могут так "выровнять", что запись будет искажена до неузнаваемости. Но если уж решите взяться за этот вариант: помните — лучше пользоваться ручками эквалайзера, как резцом скульптора, отсекая все лишнее и слушать музыку, а не аппарат.
  • Есть возможность скорректировать запись, пользуясь CD-треком, или MP3-композицией как эталоном спектра сигнала (сигнал имеет лишь спектр, АЧХ — термин, относящийся к устройству). Но если есть CD, то к чему вообще этот разговор? Есть DirectX/VST-плагин, которым я иногда пользуюсь вот уже пару лет, и который советовали мне в письмах после выхода статьи. Называется он Steinberg FreeFilter. Плагин имеет алгоритм сличения спектра одной фонограммы с другой и корректирует спектр таким образом, чтобы спектры обоих фонограмм совпадали. Описать правила пользования FreeFilter'ом не представляется возможным в пределах этого материала. Попробуйте. Читайте Help.
  • Наконец, можно воспользоваться рекомендацией в моей статье. В этом случае вы, по крайней мере, избавлены от "неправильности" тракта воспроизведения, ну а запись… Можно пойти в студию, где записывали большинство кассет, спросить, что за магнитофон они используют. Взглянуть потом на его характеристику в публикациях. А я вам расскажу, как завладеть вниманием незнакомого человека и подчинить его вашей воле :-). К несчастью, на прилавках нет измерительных кассет с тестовыми сигналами и тут медицина бессильна :-(.

Так что дорогие друзья, я никому своих методов не навязываю. Скажу лишь, что иногда, когда отреставрированная фонограмма проигрывалась в том же WinAmp, я ее с большим трудом отличал от оригинала, чего не скажешь об mp3_128. Но, только на малых уровнях громкости, на большой выдает шумок. Очень такой ненавязчивый :-).

5. Зачем кодировать магнитофонные записи со столь высокими (192-256 кбит/c) битрейтами? Это же не CD!

Ну вот, появилась возможность поговорить о парадоксах :).

Когда я только начал всем этим заниматься, я подозревал, что запись с винила и катушек будет для кодера очень крепким орешком. Мои подозрения оправдались. И вот почему.

Сначала давайте представим, как работает кодер. В материалах нашего сайта, в разделе Мультимедиа, уже опубликовано много материалов об этом. Вкратце скажу, что сигналы с низкой амплитудой не кодируются, если они соседствуют с сигналом, имеющим более высокую амплитуду и если этот громкий сигнал ниже по частоте. "Ненужные" спектральные компоненты тоже попадают "под нож" кодера.

Когда мы кодируем CD-композицию, то имеем дело с рафинированными, если хотите, выхолощенными сигналами. Иными словами, в сигнале присутствует лишь звуковая информация того или иного музыкального инструмента и ничего более. На студии уже позаботились о том, чтобы никаких посторонних шумов и призвуков не было, если конечно эти призвуки не предполагаются звукорежиссером. Таким образом, кодер кодирует только скрипку или только голос, или только оркестр и сопутствующую акустическую атмосферу студии/зала. Отсюда вывод — качество звучания зависит почти наполовину не от битрейта, а от сложности музыкальной информации.

С компакт-кассетой или винилом не так все просто. Помимо той информации, которая присутствует на студийном мастере или, говоря приближенно, на CD, в игру вступают еще различные гармоники, обертоны куда более высокие по уровню, чем некоторые полезные сигналы на компакт-диске (Рис. 4). Уровень шума тоже относительно велик (даже после реставрации), и необходимо часть потока резервировать и для него. Прибавим сюда и статистическую "неравномерность", хаотичность для одних и тех же сигналов, поэтому алгоритмы Хафмана, призванные для архивации конечной закодированной информации, сжимают несжимаемое (попробуйте заархивировать *.wav-файл, сграбленный по CD, и записанный с кассеты). Все это и порождает тот самый феномен, который вынуждает кодировать аналоговые записи с "неприлично" высокими битрейтами. Слава Богу, CD-R диски не столь дороги :-).



Рис. 4. Спектрограмма чистого тона (1000 Гц, -6дБ), для эталонного wav-файла и записанного на магнитофоне

Получается так, что вместо простой и гладкой волны кодеру приходиться сжимать пилу, огибающую волну. Понятно, что второй вариант — более сложен для кодирования ввиду наличия массы высокочастотных составляющих. Рассмотрим, например, как изменилось звучание контрабаса после перезаписи звучания этого инструмента на обычный "бюджетный" магнитофон 2-го класса (Рис. 5, а и б).



а)

б)
Рис. 5. Масштабированное представление фрагмента записи контрабаса:
а — эталонный фрагмент DAT-качества (16 бит, 48 кГц);
б — тот же фрагмент, после перезаписи на магнитофон.

Невооруженным глазом заметна разница в представленных осциллограммах. Видно, что гладкая волна превратилась в хаотичное приближение к оригиналу. Заметим, что в данном случае в Sound Forge делалось максимальное масштабирование по горизонтали (пиксел = выборка), а по вертикали раза в четыре. То есть, налицо модуляция первоначальной низкочастотной волны случайными гармониками. Так что, кодировать аналоговый звук — это задача не из легких. Кроме того, с выходом кодека Ogg Vorbis beta 3, автор перешел с формата mp3 на формат ogg. Этот новый формат превосходно сохраняет детальность и высокочастотные нюансы после кодирования, что так необходимо для сжатия оцифрованных аналоговых фонограмм. Уже с потоком 192 кбит/с получаются вполне приемлемые результаты. Жду, не дождусь официальной версии.

6. Чем лучше всего отрезать инфразвук после оцифровки фонограмм с виниловых дисков?

На низких частотах вполне сгодится, скажем, Transform/Scientific Filter из редактора Cool Edit Pro. Тип — Чебышевский (Chebychev 1), High Pass, Order — не более 18 (фазу можно сильно перекорежить), CutOff — частота, с которой подрезаем инфраниз (см. иллюстрацию).



Рис. 6. Окно Scientific Filter в звуковом редакторе Cool Edit Pro

Настоятельно рекомендую почитать Cool Edit Pro Online Manual и раздел More Information About Filters by David Johnston.

7. Стоит ли нормализовать сигнал под 98-99% перед сжатием в mp3, или наоборот ослаблять его до 91-95%? Что такое вообще "нормализация", ограничение пикового уровня сигнала?

Ограничение пикового уровня фонограммы… Это определение больше смахивает на устройство Limiter, нежели на нормализацию. Вот вам мое определение: нормализация — это анализ каждой выборки сигнала и их последующее умножение на постоянный коэффициент, равный заданной амплитуде нормализации поделенной на амплитуду самого "громкого" отсчета. По крайней мере, в Sound Forge так все работает. Правда, перед нормализацией полезно проделать DC-offset, то есть избавиться от постоянной составляющей.

Ну, а что касается целесообразности нормализации сигнала перед сжатием, то про это было много песен сложено :-). Мое мнение — если кодер солидный, то он сожмет все корректно, даже при 99%. Я нередко наблюдаю за тем, как отмастерены CD разных исполнителей и частенько попадаются треки с 98-99% нормализацией и даже под 0 дБ нормализуют, причем от класса исполнителя это не зависит. Но ведь никто не нормализует сграбленные с CD фонограммы, все их так прямо и кодируют. А Ogg, например, вообще, малость приглушает громкость после кодирования, так что ИМХО криминала не будет в любом случае.

8. Существуют ли другие (альтернативные) методы выравнивания АЧХ, за исключением описанного в Вашей статье?

Вне всяких сомнений. Я предложил лишь один из них, с помощью которого можно не углубляться в изучение софта. Для того, чтобы упростить и ускорить процесс коррекции АЧХ, предложенный в статье, необходимо знание основ программы SpectraLab. Если Вас это не смущает, то можете воспользоваться следующей методикой.



Рис. 6. Окно Scientific Filter в звуковом редакторе Cool Edit Pro

В опциях программы SpectraLab (Рис. 6) имеется возможность работы с двумя каналами (Dual Channel Processing). Чтобы эта замечательная возможность появилась, необходимо поставить "Stereo" в строке состояния. В открывающемся списке Options/Dual Channel Processing выбираем режим Real Transfer Function (Left/Right) (переводится как передаточная характеристика между каналами). Этот режим был создан разработчиками Sound Technology для построения АЧХ аппаратуры, однако если этот режим использовать шиворот-навыворот, то есть наоборот, то можно построить кривую компенсации между каналами, то есть в точности повторяющую характеристику фильтра, которую мы ищем. Теперь для более ясного представления, как этим воспользоваться, поясню все на примере:

  1. Создаем стерео wav-файл, в одном канале которого записан фрагмент идеального белого шума, созданный, скажем, в Cool Edit или в Simple Synthesis программы Sound Forge, а во втором — белый шум, получившийся после перезаписи его на магнитофон и обратно в компьютер. То есть, делаем пока все, как и в статье.
  2. Теперь настраиваем SpectraLab так, как было описано выше, то есть, ставим в Options — Stereo, Dual Channel Processing/Real Transfer Function (Left/Right).
  3. Теперь в меню Mode проставляем Post Process (пост обработка), открываем созданный файл.
  4. Теперь ставим в открывающемся списке Average Settings (Avg) значение Infinite (бесконечно усредняем результаты), а в FFT-overlap — 75% (коэффициент перекрытия FFT-окон).
  5. Шкалу регулируем для начала так: Plot top=20-40, Plot Range=100. FFT Size=65536.
  6. Все готово. Теперь Run и наблюдаем за процессом. Если получается кривая, уходящая постепенно вверх от 0 дБ и выше, все нормально. Но если получается, напротив, спад на высоких частотах, то есть, наблюдаем АЧХ своего магнитофона на спектрограмме, то просто поменяйте в Settings/Dual Channel Processing режим Real Transfer Function (Left/Right) на Real Transfer Function (Right/ Left), и повторите все заново.
  7. Далее в режиме View/Time Series делаем Zoom Out Full, Select All и, нажимая правой кнопкой мыши в область волны нашего файла, выбираем: Compute and Display Average Spectrum (вычислить и построить усредненный спектр). Немного погодя, увидев результат — нажимайте Set (1 или 2…) в районе Overlays спектрограммы и можно с этой спектрограммой работать дальше.
  8. Теперь можно строить кривую FFT-фильтра в точном соответствии с полученной кривой.
  9. ВНИМАНИЕ! Все делаем, во-первых, на частоте 48 кГц (в том числе и в SpectraLab), во-вторых, нормализуем белый шум в обоих каналах под одно значение (например, -6 дБ). Это облегчит нам потом построение кривой фильтра. Для того, чтобы вы мало-мальски понимали, что делаете, прочтите документ "Измеряем с помощью программы SpectraLAB" Максима Лядова (84 Kb в формате RTF).

Можно скорректировать спектр сигнала и с помощью 30-полосного эквалайзера в Cool Edit. В этом случае мы имеем дело с FIR-фильтрами, и, подвергая сигнал фильтрации (пусть и не прецизионно-точной, но вполне приемлемой) мы его совершенно не искажаем, а лишь фильтруем. Вот как изящно проделал это читатель Andres Philippov:

"Я нашел достаточно эффективным следующий способ: получить результат Transfer Function (Compute and Display Average Spectrum), в Options/Scaling включить разбивку по 1/3 октавы, полученные значения для каждой полосы ввести в 30-полосном эквалайзере в Cool Edit. При Accuracy=5000 получаются вполне приемлемые результаты, а главное просто и быстро!"

9. Чем грабить CD-DA, чтобы получилось 1:1 с содержимым треков?

Любым, корректно грабящим граббером. Лично мне нравилось всегда грабить программой WinDAC32, потом перешел на Exact Audio Copy, по-моему, наиболее невозмутимый к царапинам граббер. Считаю чистейшим мифом невозможность снять аудио-CD на компьютер 1:1. Как-то ради эксперимента я сграбил Track08 с одного неидеального, так скажем, диска в WinDAC32 (Burst Copy), в EAC (Error Correction) и EAC (Burst Copy). В трех случаях скорость была ~11X. Потом попеременно сделал микширование файлов с инвертированием отсчетов одного из файлов в Sound Forge. Во всех случаях Statistics показывала сплошные нулики, а содержимое файлов было идентичным до последнего бита. Так что, считаю на этом вопрос исчерпанным. (Кстати, привод — Hitachi 24x).

10. Стоит ли вообще корректировать эту АЧХ, если на моей кассетной деке рабочий диапазон частот при неравномерности ±3 дБ составляет 20-19000 Гц?

Откровенно говоря, вопрос философский. Если Вам не лень, можете все же сделать "косметическую правку". Если Вы довольны Звуком, то я за Вас очень рад.

11. Подскажите, какой должен быть уровень записи при записи белого шума?

По всем мыслимым и немыслимым стандартам полагается вообще-то делать две тестовые записи с уровнями 0 дБ и -20дБ. Потом нужно смотреть на характер изменения характеристик. В любом случае уровень -20 дБ считается "более стандартным" в радиоизмерениях. Для себя я выбрал правило ставить -6 дБ. И шумов нет, и искажений.

Заключение

Ну вот, дорогие друзья, и все. Хочу пожелать вам всех благ в новом тысячелетии, и еще раз спасибо за все ваши отзывы! Если кому не ответил, то, пожалуйста, не обижайтесь — пишите еще, отвечу обязательно.

 

Дополнительно

Как качественно оцифровать звук - Часть 2

Как качественно оцифровать звук

Часть 2

 

Прежде всего, позвольте мне поблагодарить всех читателей iXBT Hardware за проявленный интерес к моей статье "Как качественно оцифровать Звук", а также за все ваши отзывы. Затронутые в той статье вопросы о технике записи звука на PC — это лишь малая часть материала, который может помочь тем из наших читателей, кто захочет использовать звуковую карту не только для игр и прослушивания стянутых из Сети mp3-файлов, но и для других интересных и увлекательных вещей. Поэтому, если вопросы по этой теме будут в дальнейшем интересны читателям, мы будем освещать их более подробно. "За кадром" остались такие важные моменты, как, например, техника записи вокала. А так же, пригоден ли для этого микрофонный вход на звуковой карте, и что делать тем, кого гнездо "Mic In" никоим образом не устраивает… Тем не менее, высказанные в статье рекомендации тоже требуют, судя по вашим многочисленным отзывам, пояснений и уточнений.

Ниже я постараюсь ответить на наиболее типичные и часто задаваемые в переписке вопросы. Заранее благодарю за конструктивную критику, ценные замечания и поправки. Итак, начнем.

1. В своей статье Вы написали: "…магнитная лента на "железных" кассетах просто не пропустит частоты выше 14000 Гц, остальное будет жестоко ослаблено", тогда как ферромагнитная лента запросто фиксирует и более высокочастотные сигналы. Как это понимать?

Перед тем, как ответить на этот вопрос, я вкратце объясню сущность магнитной звукозаписи.

На рисунке 1 изображена схема процесса записи-воспроизведения. Упрощенно можно представить, что участки рабочего слоя, намагниченные в одном направлении, — это магнит со свойственным ему магнитным полем.


Cхема процесса записи-воспроизведения
Рис. 1. Упрощенно можно представить, что участки рабочего слоя, намагниченные в одном направлении, — это магнит со свойственным ему магнитным полем.

Конечно, расположение намагниченных частиц, изображенных на рисунке, представлено очень условно. Когда по обмотке сердечника головки записи пропускают переменный ток, сердечник намагничивается, и создаваемое им переменное магнитное полевоздействует на рабочий слой ленты. Участки последнего сначала намагничиваются до насыщения, а затем по мере удаления их от зазора головки полностью размагничиваются. Так как лента плотно прилегает к рабочему зазору головки записи, значительная часть магнитного потока головки записи проникает в рабочий слой ленты и определенным образом ориентирует самопроизвольно намагниченные области — магнитные домены. Как вы понимаете, число таких доменов, проходящих через рабочий зазор головки за единицу времени, не бесконечно, а поэтому есть все основания считать даже магнитную запись "цифровой", поскольку намагниченность домена имеет лишь два устойчивых состояния. Другое дело, что "разрядность" и полоса рабочих частот в такой "цифровой системе" заранее не известны из-за вмешательства многих факторов, таких как качество полива магнитной ленты, особенности системы сердечник_зазор_лента и т.д.

Однако если руководствоваться только этими принципами, качественная запись не получится. Открыто, что если помимо записываемого сигнала подвести к головке записи еще и ультразвуковой переменный ток (ток подмагничивания), то удается на порядки снизить искажения и шумы. Грубо это можно пояснить тем, что высокочастотное поле непрерывно как бы трясет внутреннюю структуру магнитных частиц, и их "перемагничивание" низкочастотным полем происходит точно в соответствии со значением напряженности этого поля.

При перемещении намагниченной ленты по головке воспроизведения в ее сердечник входит основная часть изменяющегося по величине и направлению магнитного потока ленты и в обмотке головки наводится переменная ЭДС, в соответствии с законом электромагнитной индукции. Эта самая ЭДС — недостаточна, и поэтому требуется усилитель воспроизведения, который индивидуален у каждой модели магнитофона, из-за различных свойств магнитных головок и применяемых методик усиления сигнала различными производителями аппаратуры. Именно поэтому и желательно знать особенности тракта запись-воспроизведение для аппарата, с которым ведется работа.

Теперь о частотах.

Чем выше частота записываемого сигнала, то есть чем короче длина волны записи (где v — скорость движения ленты и  f — частота записываемого сигнала), тем меньше продольный размер элементарного магнитного домена () и, следовательно, тем сильнее размагничивающее поле.

Таким образом, с повышением частоты записываемого сигнала и снижением скорости движения ленты магнитный поток в рабочем слое носителя ослабевает и ЭДС, наводимая в обмотке головки воспроизведения, уменьшается.

Вследствие этого, при скорости движения ленты 4,76 см/с крайне трудно обеспечить высокую линейность АЧХ тракта запись-воспроизведение магнитофона в полосе более широкой, нежели 30–14000 Гц для ферромагнитной ленты (у этого типа ленты магнитные домены, грубо говоря, самые крупные). Расширяя этот диапазон записываемых и воспроизводимых частот, производители сталкиваются с массой проблем, связанных с низкой скоростью движения ленты, трудоемкостью изготовления магнитных головок с весьма узким рабочим зазором (который должен быть постоянным) и т.д. Уменьшая рабочий зазор, мы уменьшаем соотношение сигнал/помеха. С другой стороны, при увеличении глубины коррекции в тракте записи повышаются нелинейные искажения, вызываемые перемодуляцией ленты, увеличивая глубину коррекции тракта воспроизведения — мы сталкиваемся с возросшим уровнем шумов. Отсюда ряд технологических решений для выжимания честного Hi-Fi-диапазона (20–20000 Гц) из нашей компакт-кассеты на скорости 4,76 см/с: системы динамического подмагничивания (например, Dolby HX Pro), компандерные системы шумопонижения (Dolby B, C и т.д.), применение сложных схем оптимизации, MPX-фильтры и многое другое. Особенно хочется упомянуть и про самую совершенную на сегодня систему адаптивного динамического подмагничивания, разработанную Николаем Суховым еще в 1983 г. Ну, а про дорогие кассеты с двойным поливом (TDK AR) я вообще деликатно умолчу. Не каждый может их себе позволить, да и категория продающихся кассет с записями значительно ближе к куда более низкому ценовому диапазону.

И все же читатели правы в том смысле, что не лента является сдерживающим фактором для широкого частотного диапазона записи, а само устройство. Но я об этом упомянул ровно абзацем ранее. Повышая диапазон частот при записи на ферромагнитной ленте, можно еще воспользоваться увеличением скорости движения ленты относительно головки записи и при помощи вращения последней, что с успехом используется в Hi-Fi видеомагнитофонах. Надеюсь, эта информация была полезной для читателя (несмотря на подобную наукоемкость :-)), и помогла разобраться в смысле моей фразы, прозвучавшей в вопросе. Знать об основах магнитной записи необходимо, хотя бы потому, что формат носителя на магнитной ленте будет существовать еще долго (вспомним о MiniDV, Digital8, D-VHS, все носители этих форматов — лента, и все вышесказанное относится и к ним).

2. Каким образом распаивается упомянутый в статье разъем Canon?

Поправку к моей статье прислал Дмитрий Климов. В письме он сообщил:

"…в разъемах Canon экран никогда не припаивается к центральному контакту, на этот контакт идет так называемый "холодный" провод при симметричном кабеле. В случае, когда требуется сделать переход на несимметрию, то "холодный" провод соединяется с экраном в разъеме. Но от этого суть стандарта не меняется — экран паяется к первому контакту (а он боковой), при этом, если внимательно посмотреть на разъем, то можно увидеть, что этот контакт чуть выдвинут вперед к торцу разъема (я о "мамах" говорю) для того, чтобы экран законтачить раньше сигнальных проводов при присоединении кабеля".

Абсолютно верное замечание, Дмитрий :).

Все дело в том, что я еще лет пять назад перепаял все свои XLR кабели с разъемом Canon по-своему, (я, если честно, приверженец этого профессионального разъема), в том числе и симметричные. К сожалению, на момент написания статьи под рукой не оказалось "заводского" кабеля с разъемом Canon и пришлось, раскрутив свой собственный, написать именно о нем, ну а про "честную" распайку я малость подзабыл, прошу великодушно извинить автора за эту оплошность :-(. Но теперь истина восторжествовала и давайте разберемся раз и навсегда, что это за зверь такой :-).

Гнездо разъема Canon (рисунок 2, а) представляет собой металлический конструктив с тремя контактами. Как было указано, контакт №1 — это "холодный" контакт, который практически во всех профессиональных микрофонных кабелях припаивается перемычкой к экрану в разъеме. Видно также, что сигнальные контакты №2 и №3 несколько углублены внутрь конструкции, тогда как №1 — действительно выдвинут чуток поближе к торцу.



а)


б)
Рис. 2. Разъем Canon

Экран в разъеме — это сама металлическая его часть, помимо контактов. На рисунке 2, б видно, что к этому самому экрану припаян оголенный провод. При защелкивании разъема экран соединен с экраном (металлическая часть "мамы" намертво присоединяется к металлу "папы"), и мы добиваемся очень качественного экранирования аппаратуры (а микрофон ох как в этом нуждается!). Про сигнальные контакты №2 и 3 беспокоиться не стоит, главное чтобы в кабеле №2 соединялся с №2, а №3, соответственно — с №3. Думаю не нужно объяснять, что качество соединения аппаратуры, обеспечиваемое разъемом Canon — очень высокого уровня.

3. Я попытался найти в файле cool.ini раздел [Filters96] и не нашел! Может это зависит от программы? У меня стоит Cool Edit Pro 1.1

Раздел [Filters96] в cool.ini версии Cool Edit Pro 1.1 и вправду отсутствует. Простите, не додумал :(. Однако есть довольно простой рецепт. Необходимо сделать следующую последовательность действий:

  • Открываем Cool Edit Pro 1.1 и какой-нибудь *.wav.
  • Открываем FFT-фильтр (он ведь есть в любой версии Cool Edit Pro, не так ли?).
  • Делаем какую-нибудь загогулину в окне графа. Сохраняем данный пресет (Add Preset) под ОЧЕНЬ оригинальным именем (скажем, "!!!!!!!!!!!").
  • Теперь в cool.ini ищем это ОЧЕНЬ оригинальное имя, например в редакторе FAR нажмите F7.
  • Нашли? А что за раздел? [****]? Замечательно! Именно сюда заливаем содержимое строчки.
  • Наслаждаемся :)

Подобные махинации частенько помогают. Кстати, в Cool Edit 2000 раздел [Filters96] имеется. В Cool Edit Pro 1.2 по сравнению с версией 1.1 увеличена скорость просчета большинства эффектов на 30…300%, появилась кнопка Preview для многих из них. Да и стабильность повыше. Не стоит этим пренебрегать.

Хочу сразу же предостеречь читателя от неправильного использования FFT-фильтра, которое может повлечь за собой ощутимое искажение сигнала.




Рис. 3. Окно FFT-filter в звуковом редакторе Cool Edit Pro
  • Во-первых, не стоит никогда использовать максимально возможный размер FFT-блока (FFT-size). Разрешение до 0,7 Гц при FFT Size=65536 — это, конечно, здорово, но временные искажения могут сказаться. Достаточно в большинстве случаев использовать значения от 1024 до 4096.
  • Во-вторых, не используйте первую попавшуюся оконную функцию (см. Рис. 3). Используйте только Blackman-Harris, в крайнем случае, Blackman.
  • Не работайте с этим фильтром на высоких частотах при экстремальных корректировках амплитуды. 10-15 дБ большой беды не наделают, а для "выреза верхов" лучше все-таки элементарный эквалайзер.
  • Не корректируйте один и тот же фрагмент много раз этим фильтром. Временные искажения могут дать о себе знать.
  • Наконец, используйте этот тип фильтра лишь для выреза узких полос (Notch Filtering) или тогда, когда вам важно сберечь фазовые параметры сигнала, к которым FFT-фильтрация очень аккуратно относится.

Сделаю еще одну "поправку на ветер". В руководстве пользователя программы Cool Edit Pro написано, что значение параметра Precision Factor при шумоподавлении не может превышать 14 единиц. Однако это не так. Наилучшие результаты достигаются при нечетных значениях 49-79. Мне также сообщили, что иногда и встроенный в Samplitude Studio шумоподавитель прекрасно справляется со своей прямой задачей и убирает шум очень корректно. Проверено ;-).

4. Внимательно прочитал Вашу статью "Как качественно оцифровать Звук". Согласен я не совсем. По поводу ресурса эксплуатации кассеты. Число 300 я не встречал ни разу. На отечественные носители по стандарту было 50 прогонов, на фирменные BASF обещали 2000 (BASF Chrome Extra, Chrome Maxima). Конечно, можно резиновые ролики протирать спиртом. Но от спирта резина сохнет и может потрескаться, поэтому рекомендуют другие средства.

Потом, Вы даете рекомендации по выравниванию характеристики тракта записи-воспроизведения конкретного аппарата. Во-первых, магнитные головки стареют и заметно меняют свои характеристики, и даже если запись сделана на том же аппарате два года назад, многое изменилось. Во-вторых, очевидно, что характеристика канала записи магнитофона, на котором произведена студийная запись, нам не известна. Т.е. то, что я получу, воспользовавшись Вашими рекомендациями, Вы предсказать не сможете.

Вопросы достаточно глубокие и важные. Начнем по порядку.

Ресурс эксплуатации ленты может варьироваться весьма значительно — в зависимости от большого количества факторов. Главный из них — это насколько правильно и бережно хранится лента. Ухудшение физико-механических и электроакустических свойств лент происходит из-за изменений свойств несущего слоя. Магнитные свойства лент даже при длительном хранении практически не изменяются, но неправильное хранение и эксплуатация делают их хрупкими, подверженными частым обрывам и вытягиванию, а в записях могут появиться участки с резкими провалами в громкости. Перепады температуры, воздействие тепла и прямого солнечного света тоже не пойдут вашим кассетам на пользу. Следует сразу же, в зародыше, устранять причину детонации и изменение скорости движение ленты (когда запись "тянет"). Не советую прикасаться к ленте без надобности. Все это, плюс особенности данной магнитной ленты и формирует тот самый ресурс. Критерии у всех разные, и поэтому можно говорить о цифрах, различающихся на порядок. Ну а цифра 300 — это среднее количество прогонов для TDK-D, после начинаются выпадения.

Резиновые ролики — это конечно вещь важная, жутко влияющая на детонацию. Но вот излишний ажиотаж вокруг губительного воздействия эфирных масел в одеколоне и растворителя (спирта) на резину прижимного ролика — по-моему, не нужен. Не следует протирать ролик слишком часто. От этого он твердеет и влияет на детонацию. Но ждать пока магнитные частицы начнут отваливаться кусками — не стоит. В экстремальной ситуации подойдет и одеколон. Автор вопроса рекомендует пользоваться мыльным раствором. Весьма дельный совет, но осторожно — не залейте им отсек кассетоприемника ;-).

Теперь самое важное: выравнивание АЧХ. Действительно, магнитные головки стареют. Но поэтому и нужно выяснить параметры тракта перед тем, как приступить к процессу реставрации. Есть вообще три выхода в этой ситуации.

  • Можно конечно скорректировать сигнал и на слух. Но, памятуя о том, как можно обмануть наше ухо тем же MP3, — это не самый лучший вариант. Многие могут так "выровнять", что запись будет искажена до неузнаваемости. Но если уж решите взяться за этот вариант: помните — лучше пользоваться ручками эквалайзера, как резцом скульптора, отсекая все лишнее и слушать музыку, а не аппарат.
  • Есть возможность скорректировать запись, пользуясь CD-треком, или MP3-композицией как эталоном спектра сигнала (сигнал имеет лишь спектр, АЧХ — термин, относящийся к устройству). Но если есть CD, то к чему вообще этот разговор? Есть DirectX/VST-плагин, которым я иногда пользуюсь вот уже пару лет, и который советовали мне в письмах после выхода статьи. Называется он Steinberg FreeFilter. Плагин имеет алгоритм сличения спектра одной фонограммы с другой и корректирует спектр таким образом, чтобы спектры обоих фонограмм совпадали. Описать правила пользования FreeFilter'ом не представляется возможным в пределах этого материала. Попробуйте. Читайте Help.
  • Наконец, можно воспользоваться рекомендацией в моей статье. В этом случае вы, по крайней мере, избавлены от "неправильности" тракта воспроизведения, ну а запись… Можно пойти в студию, где записывали большинство кассет, спросить, что за магнитофон они используют. Взглянуть потом на его характеристику в публикациях. А я вам расскажу, как завладеть вниманием незнакомого человека и подчинить его вашей воле :-). К несчастью, на прилавках нет измерительных кассет с тестовыми сигналами и тут медицина бессильна :-(.

Так что дорогие друзья, я никому своих методов не навязываю. Скажу лишь, что иногда, когда отреставрированная фонограмма проигрывалась в том же WinAmp, я ее с большим трудом отличал от оригинала, чего не скажешь об mp3_128. Но, только на малых уровнях громкости, на большой выдает шумок. Очень такой ненавязчивый :-).

5. Зачем кодировать магнитофонные записи со столь высокими (192-256 кбит/c) битрейтами? Это же не CD!

Ну вот, появилась возможность поговорить о парадоксах :).

Когда я только начал всем этим заниматься, я подозревал, что запись с винила и катушек будет для кодера очень крепким орешком. Мои подозрения оправдались. И вот почему.

Сначала давайте представим, как работает кодер. В материалах нашего сайта, в разделе Мультимедиа, уже опубликовано много материалов об этом. Вкратце скажу, что сигналы с низкой амплитудой не кодируются, если они соседствуют с сигналом, имеющим более высокую амплитуду и если этот громкий сигнал ниже по частоте. "Ненужные" спектральные компоненты тоже попадают "под нож" кодера.

Когда мы кодируем CD-композицию, то имеем дело с рафинированными, если хотите, выхолощенными сигналами. Иными словами, в сигнале присутствует лишь звуковая информация того или иного музыкального инструмента и ничего более. На студии уже позаботились о том, чтобы никаких посторонних шумов и призвуков не было, если конечно эти призвуки не предполагаются звукорежиссером. Таким образом, кодер кодирует только скрипку или только голос, или только оркестр и сопутствующую акустическую атмосферу студии/зала. Отсюда вывод — качество звучания зависит почти наполовину не от битрейта, а от сложности музыкальной информации.

С компакт-кассетой или винилом не так все просто. Помимо той информации, которая присутствует на студийном мастере или, говоря приближенно, на CD, в игру вступают еще различные гармоники, обертоны куда более высокие по уровню, чем некоторые полезные сигналы на компакт-диске (Рис. 4). Уровень шума тоже относительно велик (даже после реставрации), и необходимо часть потока резервировать и для него. Прибавим сюда и статистическую "неравномерность", хаотичность для одних и тех же сигналов, поэтому алгоритмы Хафмана, призванные для архивации конечной закодированной информации, сжимают несжимаемое (попробуйте заархивировать *.wav-файл, сграбленный по CD, и записанный с кассеты). Все это и порождает тот самый феномен, который вынуждает кодировать аналоговые записи с "неприлично" высокими битрейтами. Слава Богу, CD-R диски не столь дороги :-).



Рис. 4. Спектрограмма чистого тона (1000 Гц, -6дБ), для эталонного wav-файла и записанного на магнитофоне

Получается так, что вместо простой и гладкой волны кодеру приходиться сжимать пилу, огибающую волну. Понятно, что второй вариант — более сложен для кодирования ввиду наличия массы высокочастотных составляющих. Рассмотрим, например, как изменилось звучание контрабаса после перезаписи звучания этого инструмента на обычный "бюджетный" магнитофон 2-го класса (Рис. 5, а и б).



а)

б)
Рис. 5. Масштабированное представление фрагмента записи контрабаса:
а — эталонный фрагмент DAT-качества (16 бит, 48 кГц);
б — тот же фрагмент, после перезаписи на магнитофон.

Невооруженным глазом заметна разница в представленных осциллограммах. Видно, что гладкая волна превратилась в хаотичное приближение к оригиналу. Заметим, что в данном случае в Sound Forge делалось максимальное масштабирование по горизонтали (пиксел = выборка), а по вертикали раза в четыре. То есть, налицо модуляция первоначальной низкочастотной волны случайными гармониками. Так что, кодировать аналоговый звук — это задача не из легких. Кроме того, с выходом кодека Ogg Vorbis beta 3, автор перешел с формата mp3 на формат ogg. Этот новый формат превосходно сохраняет детальность и высокочастотные нюансы после кодирования, что так необходимо для сжатия оцифрованных аналоговых фонограмм. Уже с потоком 192 кбит/с получаются вполне приемлемые результаты. Жду, не дождусь официальной версии.

6. Чем лучше всего отрезать инфразвук после оцифровки фонограмм с виниловых дисков?

На низких частотах вполне сгодится, скажем, Transform/Scientific Filter из редактора Cool Edit Pro. Тип — Чебышевский (Chebychev 1), High Pass, Order — не более 18 (фазу можно сильно перекорежить), CutOff — частота, с которой подрезаем инфраниз (см. иллюстрацию).



Рис. 6. Окно Scientific Filter в звуковом редакторе Cool Edit Pro

Настоятельно рекомендую почитать Cool Edit Pro Online Manual и раздел More Information About Filters by David Johnston.

7. Стоит ли нормализовать сигнал под 98-99% перед сжатием в mp3, или наоборот ослаблять его до 91-95%? Что такое вообще "нормализация", ограничение пикового уровня сигнала?

Ограничение пикового уровня фонограммы… Это определение больше смахивает на устройство Limiter, нежели на нормализацию. Вот вам мое определение: нормализация — это анализ каждой выборки сигнала и их последующее умножение на постоянный коэффициент, равный заданной амплитуде нормализации поделенной на амплитуду самого "громкого" отсчета. По крайней мере, в Sound Forge так все работает. Правда, перед нормализацией полезно проделать DC-offset, то есть избавиться от постоянной составляющей.

Ну, а что касается целесообразности нормализации сигнала перед сжатием, то про это было много песен сложено :-). Мое мнение — если кодер солидный, то он сожмет все корректно, даже при 99%. Я нередко наблюдаю за тем, как отмастерены CD разных исполнителей и частенько попадаются треки с 98-99% нормализацией и даже под 0 дБ нормализуют, причем от класса исполнителя это не зависит. Но ведь никто не нормализует сграбленные с CD фонограммы, все их так прямо и кодируют. А Ogg, например, вообще, малость приглушает громкость после кодирования, так что ИМХО криминала не будет в любом случае.

8. Существуют ли другие (альтернативные) методы выравнивания АЧХ, за исключением описанного в Вашей статье?

Вне всяких сомнений. Я предложил лишь один из них, с помощью которого можно не углубляться в изучение софта. Для того, чтобы упростить и ускорить процесс коррекции АЧХ, предложенный в статье, необходимо знание основ программы SpectraLab. Если Вас это не смущает, то можете воспользоваться следующей методикой.



Рис. 6. Окно Scientific Filter в звуковом редакторе Cool Edit Pro

В опциях программы SpectraLab (Рис. 6) имеется возможность работы с двумя каналами (Dual Channel Processing). Чтобы эта замечательная возможность появилась, необходимо поставить "Stereo" в строке состояния. В открывающемся списке Options/Dual Channel Processing выбираем режим Real Transfer Function (Left/Right) (переводится как передаточная характеристика между каналами). Этот режим был создан разработчиками Sound Technology для построения АЧХ аппаратуры, однако если этот режим использовать шиворот-навыворот, то есть наоборот, то можно построить кривую компенсации между каналами, то есть в точности повторяющую характеристику фильтра, которую мы ищем. Теперь для более ясного представления, как этим воспользоваться, поясню все на примере:

  1. Создаем стерео wav-файл, в одном канале которого записан фрагмент идеального белого шума, созданный, скажем, в Cool Edit или в Simple Synthesis программы Sound Forge, а во втором — белый шум, получившийся после перезаписи его на магнитофон и обратно в компьютер. То есть, делаем пока все, как и в статье.
  2. Теперь настраиваем SpectraLab так, как было описано выше, то есть, ставим в Options — Stereo, Dual Channel Processing/Real Transfer Function (Left/Right).
  3. Теперь в меню Mode проставляем Post Process (пост обработка), открываем созданный файл.
  4. Теперь ставим в открывающемся списке Average Settings (Avg) значение Infinite (бесконечно усредняем результаты), а в FFT-overlap — 75% (коэффициент перекрытия FFT-окон).
  5. Шкалу регулируем для начала так: Plot top=20-40, Plot Range=100. FFT Size=65536.
  6. Все готово. Теперь Run и наблюдаем за процессом. Если получается кривая, уходящая постепенно вверх от 0 дБ и выше, все нормально. Но если получается, напротив, спад на высоких частотах, то есть, наблюдаем АЧХ своего магнитофона на спектрограмме, то просто поменяйте в Settings/Dual Channel Processing режим Real Transfer Function (Left/Right) на Real Transfer Function (Right/ Left), и повторите все заново.
  7. Далее в режиме View/Time Series делаем Zoom Out Full, Select All и, нажимая правой кнопкой мыши в область волны нашего файла, выбираем: Compute and Display Average Spectrum (вычислить и построить усредненный спектр). Немного погодя, увидев результат — нажимайте Set (1 или 2…) в районе Overlays спектрограммы и можно с этой спектрограммой работать дальше.
  8. Теперь можно строить кривую FFT-фильтра в точном соответствии с полученной кривой.
  9. ВНИМАНИЕ! Все делаем, во-первых, на частоте 48 кГц (в том числе и в SpectraLab), во-вторых, нормализуем белый шум в обоих каналах под одно значение (например, -6 дБ). Это облегчит нам потом построение кривой фильтра. Для того, чтобы вы мало-мальски понимали, что делаете, прочтите документ "Измеряем с помощью программы SpectraLAB" Максима Лядова (84 Kb в формате RTF).

Можно скорректировать спектр сигнала и с помощью 30-полосного эквалайзера в Cool Edit. В этом случае мы имеем дело с FIR-фильтрами, и, подвергая сигнал фильтрации (пусть и не прецизионно-точной, но вполне приемлемой) мы его совершенно не искажаем, а лишь фильтруем. Вот как изящно проделал это читатель Andres Philippov:

"Я нашел достаточно эффективным следующий способ: получить результат Transfer Function (Compute and Display Average Spectrum), в Options/Scaling включить разбивку по 1/3 октавы, полученные значения для каждой полосы ввести в 30-полосном эквалайзере в Cool Edit. При Accuracy=5000 получаются вполне приемлемые результаты, а главное просто и быстро!"

9. Чем грабить CD-DA, чтобы получилось 1:1 с содержимым треков?

Любым, корректно грабящим граббером. Лично мне нравилось всегда грабить программой WinDAC32, потом перешел на Exact Audio Copy, по-моему, наиболее невозмутимый к царапинам граббер. Считаю чистейшим мифом невозможность снять аудио-CD на компьютер 1:1. Как-то ради эксперимента я сграбил Track08 с одного неидеального, так скажем, диска в WinDAC32 (Burst Copy), в EAC (Error Correction) и EAC (Burst Copy). В трех случаях скорость была ~11X. Потом попеременно сделал микширование файлов с инвертированием отсчетов одного из файлов в Sound Forge. Во всех случаях Statistics показывала сплошные нулики, а содержимое файлов было идентичным до последнего бита. Так что, считаю на этом вопрос исчерпанным. (Кстати, привод — Hitachi 24x).

10. Стоит ли вообще корректировать эту АЧХ, если на моей кассетной деке рабочий диапазон частот при неравномерности ±3 дБ составляет 20-19000 Гц?

Откровенно говоря, вопрос философский. Если Вам не лень, можете все же сделать "косметическую правку". Если Вы довольны Звуком, то я за Вас очень рад.

11. Подскажите, какой должен быть уровень записи при записи белого шума?

По всем мыслимым и немыслимым стандартам полагается вообще-то делать две тестовые записи с уровнями 0 дБ и -20дБ. Потом нужно смотреть на характер изменения характеристик. В любом случае уровень -20 дБ считается "более стандартным" в радиоизмерениях. Для себя я выбрал правило ставить -6 дБ. И шумов нет, и искажений.

Заключение

Ну вот, дорогие друзья, и все. Хочу пожелать вам всех благ в новом тысячелетии, и еще раз спасибо за все ваши отзывы! Если кому не ответил, то, пожалуйста, не обижайтесь — пишите еще, отвечу обязательно.