Как качественно оцифровать звук

Введение

О том, как пользоваться звуковой картой, написано множество книг и статей, в том числе и на нашем сайте. Однако, на этот раз речь пойдет не о том, что уже и без того известно каждому постоянному читателю раздела Мультимедиа, а о том, что называется практикой цифровой звукозаписи. Наверняка любой владелец мультимедийного компьютера рано или поздно приступает к этой увлекательной деятельности. Собственно, для этого (и не только) компьютер и приобретают. Тем не менее, процесс этот не столь прост, и нужно иметь некоторый навык для достижения максимального качества. Цель этой статьи — дать читателям сайта (и владельцам SB Live! среди них в частности) некоторые полезные рекомендации в этой области, которые по тем или иным причинам не освещены в прессе или Сети должным образом.

Начну с того, что в свое время передо мной встал вопрос сведения моей кассетной фонотеки в MP3 файлы, и я вынужден был потратить не одну ночь для того, чтобы сделать процесс перегона аудиоинформации в компьютер по возможности более качественным и более универсальным для большинства аудиозаписей. Скажу сразу, несмотря на солидный опыт звукозаписи (и аналоговой и цифровой), это, на первый взгляд, невинное занятие потребовало у меня мобилизации многих сил и знаний.

Однако, пользователь приличной звуковой карты совершенно не обязан (как я) иметь высшее радиотехническое образование, и все же, достойное качество полученной записи требовать вправе. Считаю своим долгом дать аудитории iXBT тот самый минимум информации, который, надеюсь, избавит многих от неприятностей, связанных с оцифровкой аудио (таких как помехи, наводки и т.д). Полагаю, что некоторые сведения в этом материале будут полезны и опытным пользователям. Для того чтобы не выйти за рамки приличия, скажу также, что все написанное ниже — результат обобщения опыта многих людей, но, конечно же, не претендует на истину в последней инстанции. Обоснованная критика от читателей — это всегда хорошо! (Свои отзывы на статьи можно писать и в нашу конференцию О материалах сайта).

Общие замечания

Наиболее часто пользователям мультимедиа приходится оцифровывать следующие источники:

Виниловые пластинки. Здесь главное — хороший проигрыватель и предусилитель-корректор (тот, что встраивается в дорогие усилители). Из отечественных проигрывателей порекомендую Феникс ЭП 009С (алмазный эллипс в качестве головки, автоматический тонарм). А дальше — записываем пластинку на компьютер, чистим от щелчков (Click Removal), фильтруем инфразвук ниже 16 Гц (для устранения рокота) и нарезаем запись на песни. Шум лучше не удалять, так как шум в 65-70 дБ на выходе проигрывателя (или корректора) не так уж и велик. Например, 65-70 дБ выдает аналоговый выход большинства CD-ROM и ведь ничего? А вот с фоном (неприятным низкочастотным тоном в 50, 100, 150 и так далее Гц) лучше разобраться до оцифровки — где-то висит земля, или перепутаны полюса внутри проигрывателя.

Микрофон. Я подразумеваю хороший микрофон и микрофонный усилитель. И про то, и про другое можно найти массу информации в печатных изданиях, да и в Сети тоже. Дам совет только в одном.

Дело в том, что в студийной практике применяется один очень умный принцип для соединительных кабелей. Про витую пару сигнальных линий все уже знают, но вот как припаивать провода на концах проводов — лишь посвященные, да и то не все.

На рисунке ниже показано, как правильно изготовить шнур, который не внесет никакого вклада в качество записи, если он состоит из качественных проводов. В качестве экрана — медная оплетка (желательно, чтобы везде применялась медь!). Сигнальные жилы внутри экрана — витая пара медных многожильных проводов. Подобный кабель лучше купить в каком-нибудь магазине, где продают профессиональные микрофоны, гитары, и т.п. (дешевле обойдется провод, чем помехи). Стоит отметить, что только с микрофоном необходимо столь щепетильно отнестись к кабелю, иначе будете менять микрофонные усилители и сами микрофоны до греческих календ.

Если картинка не очень понятна, знайте сам ПРИНЦИП:

Экран соединен с металлической основой капсюля (если она металлическая) или просто висит внутри корпуса микрофона, а на входе (только лишь на входе!!!) экран соединяется с землей. Тогда помехи и наводки, попав в экран, стекают в одну точку (как бы компенсируются), а не циркулируют по экрану. Экран не должен быть "антенной для помех"!

Я надеюсь, инженеры простят мне столь вольное толкование этой важной истины, а эстеты подобный эскиз :).

В случае с электрогитарой — руководствоваться тем же! Электрогитара — тот же микрофон, только менее чувствительный. Экран коммутационной схемы внутри гитары (если нет — сделайте из жести или шоколадной фольги) присоединяем к экрану, а потом, также соединяем на входе карты или приставки с землей. Не играйте на этом инструменте вблизи системного блока — изготовьте кабель подлиннее.

Вот только не стоит гробить студийную технику! Просто проверьте, как распаяны разъемы и все. Микрофон с профессиональным разъемом CANON (это такой здоровый, с защелкой) имеет обычно землю на штырьке номер 3 — тот, что посередине, если не так — уточните у продавца (не дарить же 100$ за новенький Shure SM58!?).

Шнуры от микрофонного усилителя/процессора/магнитофона и т.д. паяем по тому же принципу (экран соединяем с землей на входе), только здесь добавляется еще жила второго стереоканала. Не мешает заземлить и системный блок компьютера.

Надеюсь, вы согласны с тем, что грамотно созданный шнур не столь уж плох в сравнении с кабелем Monster Cable или Vampire, хотя если ваш шестиканальный DSP-усилитель стоит 1000$ — все же потратьтесь на приличный кабель.

Запись с микрофона нуждается лишь в частотной коррекции (если АЧХ у микрофона имеет ощутимую неравномерность и спад раньше 18-19 кГц). Кое-кто чистит и шум, но "правильный" тракт до оцифровки менее шумен, чем капли дождя, падающие на подоконник и безжалостно фиксируемые на Ваш микрофон.

А вот с компакт-кассетой² не так все просто. Тут запись и очистка от артефактов — самое настоящее искусство и подходы у опытных людей свои. Я же поделюсь моими методами, позволившими ИМХО³ выжать из кассеты все ценное.

²Ирония судьбы — компакт-кассета и компакт-диск сейчас уже не кажутся нам компактными. А уж их "некомпактных" собратьев из эпохи динозавров так вообще мало кто помнит. Так что, производителям надо было быть поосторожнее с выбором названий в своё время.

³ИМХО — сокращение от In My Humble Opinion, "по моему скромному мнению". Англоизм, стандартное слово в обиходе постоянных участников конференций. Обычно применяется пишущим сообщение перед каждой спорной фразой, чтобы указать, что это лишь ЕГО скромное мнение, не уводить тему в сторону, и не вызывать шквал протеста от оппонентов, которые забивают тем самым конференцию "мусором".

Вся штука в том, что у компакт-кассеты ограниченный ресурс эксплуатации (примерно 300 прогонов). Потом информация начинает теряться, звук становится рассыпчатым, глухим, прерывистым. Кроме того, более целесообразно гонять CD с отполированными MP3 файлами, чем вставлять кассету, крутить головку, чистить тракт спиртом и т.д. (хотя и у этого ритуала есть приверженцы!). К тому же, отреставрированная фонограмма с приличной по качеству кассеты ИМХО иногда даст фору по насыщенности деталями и аналоговой "теплоте" многим 128 Кбит MP3 — файлам. Я не распространитель мифов о дискретной и мертвой цифровой записи (хотя лет пять назад был другого мнения, да и АЦП/ЦАП были не те), но кассету хоронить рано, и владельцы хороших стационарных аппаратов меня поддержат!

Реставрация

Прежде всего, необходимо усвоить, что даже если Ваш аппарат выдает музыкальную информацию лишь 40-14000 Гц на Ferro-кассете, он все равно воспроизводит какие-то звуки и на более высоких частотах (вплоть до 20-21000 Гц), только они не вписались в нормы ГОСТа и МЭКа, то есть очень ослаблены и утоплены в шумах. Именно это нам и предстоит исправить.

1. Выравнивание АЧХ

Почти на любую стандартную кассету (TDK D, и т.д.), да и на кассеты подороже аудиозапись попадает практически одинаково. Если у вас не TEAC за 900$ или не Nakamichi Dragon, то разницы нет: AIWA или ВЕГА. На подобных "бюджетных" аппаратах воспроизводимый с кассеты сигнал больше зависит от свойств магнитной ленты, нежели от тракта воспроизведения. А магнитная лента на "железных" кассетах просто не пропустит частоты выше 14000 Гц, остальное будет жестоко ослаблено.

АЧХ тракта запись-воспроизведение для магнитофона ВЕГА-МП122С:

Конечно, тракт записи-воспроизведения у всех магнитофонов различен и особенно дотошным владельцам хороших стационарных магнитофонов исследования предстоит проделать самостоятельно. Для этого (а также для дальнейшего мастеринга) нам понадобятся последние версии знакомых программ (или хотя бы их демо-версии):

Cool Edit Pro 1.2, или 2000 для создания белого шума, синусов, фильтрации и очищения от шумов и т.д.
Sound Forge 4.5 для монтажа (оцифровка, нарезка материала)
SpectraLAB 4.32 для всестороннего анализа
Энтузиасты могут применять внешние денойзеры (удаление шума), типа Sonic Foundry Noise Reduction 2.0, Arboretum Restoration-NR и др., но я после многочисленных субъективных и объективных исследований остановился на встроенном средстве Cool Edit Pro (хотя долго не мог с этим смириться). Все же программисты Syntrillium Software свой хлеб едят не зря!⁴ То же касается и фильтрации.

⁴Cледует отметить, что коммерческая версия программы Cool Edit (Cool Edit Pro 1.2) существенно отличается от своего бесплатного собрата (Cool Edit 2000). Например, Cool Edit 2000 не имеет функции Preview (предварительного прослушивания) при обработке, Multitrack-режима и т.д. И тем не менее, все необходимое для наших задач имеется в обеих версиях программы Cool Edit.

Процедуру исследования тракта записи/воспроизведения магнитофона лучше проделать так:

Очистить воспроизводящую головку магнитофона и прижимной ролик с ведущим валом спиртом, затем, поместив чистую (с обеих сторон!) кассету в магнитофон, приготовить ее к записи.
Далее, подав белый шум⁵ (48 кГц) на вход (Generate/Noise…/White, mono, intensity = 12 в Cool Edit), добиться оптимального уровня записи на Вашем магнитофоне и записать около 3-х минут (если компьютер не ниже Celeron+64Mb) или 60 секунд этого шума (ежели машина слабее). Магнитная лента весьма неравномерно реагирует на последовательное изменение значения частоты (Frequency Sweep), поэтому, из соображений статистики лучше использовать белый или розовый шум. Это обеспечивает более точный и равномерный график АЧХ.
Далее, следует, не вынимая кассету и не подкручивая воспроизводящую головку, записать только что полученный белый шум — с кассеты на Line-In звуковой карты (частоту дискретизации ставим 48 кГц).⁶
Теперь нормализуем полученный сигнал под -1 дБ (Process/Normalize… в Sound Forge 4.5), и сохраняем.
В SpectraLAB выбираем Mode/Post Process, и открываем только что полученный файл. Делаем настройки (Settings): 48000, 16bit, FFT Size = 65536 (для слабой машины 16384), mono, Average = linear. Выделяем весь файл в режиме View/Time Series, жмем правую кнопку и приказываем: Compute and Display Average Spectrum.
Смотрим на спектр и кривимся неравномерности АЧХ нашего магнитофона J. В Cool Edit открываем этот же файл и поднимаем ослабленные частоты (FFT Filter etc.). Сохраняем (но не закрываем!!!) в другой файл и этот другой открываем в SpectraLAB (первый файл пригодится в случае порчи второго). Чтобы запомнить огибающие спектра в SpectraLAB для сравнения — жмите Set в районе Overlays.
Не красиво? Отменяйте в Cool Edit фильтрацию — и снова!

⁵Использовать розовый шум предпочтительнее, так как он ближе по свойствам к музыкальному сигналу.

⁶Почему это обязательное условие для получения налучшего качества записи, читайте статьи с измерениями тестовых параметров звуковых карт на нашем сайте.

Как видите, искусство и здесь требует жертв :(. Однако я повторяю — на хороших аппаратах тракты Record-Play очень схожи, и вы можете воспользоваться моими результатами исправления АЧХ для магнитофона МП ВЕГА-122С. Для этого в файле C:\Windows\cool.ini найдите раздел [Filters96] и в незанятой строке запишите (в одну линию!) следующее:

Item29=RESTORATION,3,19,0,20,426,5,845,0,1288,0,1986,0,2259,0,2855,6,3179,9,3444, 21,3583,28,3688,42,3773,48,3848,61,3925,76,3957,96,3998,100,4004,100,4012,5,4096,5, 19,0,20,426,5,845,0,1288,0,1986,0,2259,0,2855,6,3179,9,3444,21,3583,28,3688,42,3773, 48,3848,61,3925,76,3957,96,3998,100,4004,100,4012,5,4096,5,2,0,12000,1,2,0,0,1000, 100,5,-10,100,-0.5,12,24000,1,0,1,1,48000

Теперь в Transform/Filters…/FFT Filter (все в том же Cool Edit) ищем пресет RESTORATION и корректируем фонограмму. Все. Я убил 2 дня, чтобы выровнять АЧХ своей ВЕГИ до значения ±0,5 дБ от 10 до 19500 Гц! Наслаждайтесь. АЧХ ВЕГИ-МП122С до (зеленый график) и после (желтый график) частотной коррекции:

АЧХ ВЕГИ-МП122С до и после частотной коррекции

Кроме того, всем известно, что АЧХ самой звуковой карты, тем более — внешнего кольца Line-Out-Line-In тоже обладает характерным спадом в области высоких частот, и в этом обычно виновен АЦП, нежели более-менее линейный ЦАП. Оцифровка получается тусклой, лишенной прозрачности и воздушности в верхнем регистре. С этой проблемой желательно справиться перед обработкой записанного материала и об этом речь пойдет ниже.

2. Владельцам SB Live!

Многие владельцы SB Live!1024 Value знают, что АЧХ кодека SigmaTel STAC9721 совсем не идеальна и уже после 4,5 кГц начинается ступенчатый спад:

АЧХ LineOUT-LineIN для звуковой карты SBLive!/кодек STAC9721

Основной вклад в это вносит АЦП кодека, в чем можно убедиться, скажем, в этой статье. Сделано это, с одной стороны, для нашего же блага: таким образом предотвращается проникновение паразитных гармоник в слышимую область спектра. С другой стороны, подобное "подрезание" верхов имеет и негативное последствие: на достаточно серьезной Hi-Fi-аппаратуре этот ньюанс может быть вполне заметен.

Поэтому, всем владельцам SB Live! НАСТОЯТЕЛЬНО рекомендую каждую записанную фонограмму через Line-IN сначала, то есть до последующей обработки, пропустить через следующий фильтр (тот же cool.ini и тот же раздел):

Item36=CORRECtion,3,20,0,0,83,0,532,1,793,1,1003,2,1223,4,1713,5,2046,10,2391, 12,2569,15,2710,18,3066,24,3234,27,3398,35,3480,41,3546,47,3628,56,3726,70,3825, 89,4096,100,20,0,0,83,0,532,1,793,1,1003,2,1223,4,1713,5,2046,10,2391,12,2569,15, 2710,18,3066,24,3234,27,3398,35,3480,41,3546,47,3628,56,3726,70,3825,89,4096,100, 2,0,12000,1,2,0,0,1000,100,3,-10,100,0,14,24000,1,0,0,1,48000

Кстати, номер Item должен не совпадать ни с каким другим, ну а так — любой…

После подобной операции неравномерность АЧХ в кольце LineOUT — LineIN для звуковой карты SB Live! удалось уменьшить до ±0,1 дБ! В этом можно убедиться, взглянув на спектрограмму (мне это далось в свое время опять же ценой пары ночей).

АЧХ звуковой карты SBLive (кодек STAC9721) до и после частотной коррекции. Шкала графика 5 дБ!:

Теперь линейный вход у нас — референс! Enjoy…

Владельцам микрофона МД-52А (студийный, 20-16000Гц) посоветую следующую коррекционную фишку:

Item40=MIC_MD52A,3,8,0,0,1723,17,2158,37,2569,53,3176,89,3316,100,3480,100,4096, 100,11,0,50,4,51,5,60,6,73,8,81,10,85,14,87,17,79,19,60,24,51,4096,50,2,1,6000,1,4, 0,0,648,31,831,57,1000,100,3,0,100,0,16,24000,2,1,0,1,48000

Не забываем, что строка неразрывна во всю свою длину.

3. Шумоподавление

Теперь поговорим о шумоподавлении. Как я уже указал — Noise Reduction в Cool Edit — на мой взгляд — лучший. Звукорежиссеры хвалят Arboretum Ionizer, якобы из-за того, что он избавлен от внесения фазовых артефактов в обработанный материал (если знаете где взять — напишите!), знакомые советуют Sonic Foundry Noise Reduction. Но мои уши пока что влюблены в CoolEdit-овский шумодав. Кроме того, ни в каком другом нет столько настроек и опций, да и то, что он работает медленнее (читай добросовестнее) других — тоже говорит о многом. Существует также весьма неплохая программа реставрации DART Pro, однако детальное сравнение всех этих программных продуктов выходит за рамки данной статьи.

Итак, после многотрудной фильтрации необходимо взять 1,5-1,6 секунд шума перед каждой (для максималистов) или какой-нибудь средней фанерой (но только с той же кассеты и стороны, откуда взята фонограмма). Далее:

1. Сделать профиль этого 1,5 секундного шума (Get Profile from Selection) с параметрами:

Snapshots in profile = 1024…4096 (в зависимости от мощности компьютера).
FFT Size = 4096 (эту цифру я нашел оптимальной для подавления шума после многочисленных экспериментов); Не рекомендую ставить максимальный размер FFT, так как это повлечет в результате увеличение так называемого Hiss-шума сигнале.
2. Теперь, отфильтрованную фонограмму выделяем и уничтожаем шум тем же Noise Reduction в Cool Edit. Параметры могут быть разными (поэкспериментируйте с кнопкой Preview). Но я, после долгих опытов, могу для магнитофона порекомендовать следующие параметры:

Precision Factor = 12 (для максималистов — все 14, для Preview — 8). Параметр определяет точность вычислений;
Smoothing Amount = 0 (именно 0!). Параметр вносит допуск на погрешность вычитания спектра шума из спектра сигнала в дБ. Чем больше — тем хуже;
Transition Wide = 6 (для очень крутых аппаратов (400$) — 3, очень дешевых — 7…9). Параметр подобен предыдущему, только более гибко управляет процессом вычитания спектра (тоже в дБ);
Noise Reduction Level = 35…42 (при Transition Wide = 6, в зависимости от уровня записи сигнала на кассете. Если запись на ленте была точно под 0 дБ, ставьте 37). Параметр определяет уровень порога удаляемого спектра шума. Наиболее капризный параметр. Обратно зависит от величины Transition Wide.

Нередко приходиться повторно нормализовать фонограммы под -0,2 дБ (это стандарт для CD-Audio), так как шумоподавление может серьезно уменьшить энергию сигнала. Все готово к MP3-кодированию! Правда, бытует мнение, что нормализация перед сжатием в MP3 — это очень вредно, и Вы на это должны идти лишь в случае ощутимого различия между уровнями отдельных каналов или просто слабого (-3…-6 дБ) уровня фонограммы в конечном итоге. Это как раз тот случай, когда решать Вам.

4. Сжатие

Лично я пользуюсь кодером Fraunhofer IIS, встроенный в BPM Studio Pro 3.0. Остальные кодеры (ИМХО) от Fraunhofer IIS не могут преодолеть своеобразного шелеста в полученном файле, причем на всех битрейтах. А вот к LAME -f я отношусь настороженно, этот кодер, по-моему, только на АЧХ и хорош.

Теперь о битрейте. Честно говоря, все ньюансы сохраняются лишь при 256 Кбит/c, но и при 192 Кбит/c фонограмма почти неотличима от исходной. Для проверки того, какой битрейт наилучший для данной фонограммы, я применяю довольно жестокую методику субъективного сравнения. Сначала кодирую наиболее ответственный фрагмент (насыщенный высокими частотами или с какими-нибудь знакомыми ньюансами) во все битрейты: 128, 160, 192, 224, 256. Затем последовательно соединяю в Sound Forge оригинальный фрагмент с закодированным и слушаю. Обычно 128 и 160 Кбит/с выпадают из рассмотрения сразу, а настоящая борьба разворачивается между 192 и 256 Кбит/с (ну не люблю я поток в 224 Кбит/c, ибо кривой он какой-то :)).

Для отреставрированных фонограмм вполне хватает и 192 Кбит/с, но опять-таки некоторым и 256 Кбит/c подчас не хватает. Скажу также, что магнитофонные записи представляют собой весьма непростой для кодирования материал. Как-то раз я подверг, как теперь принято говорить, "зачистке" фонограмму с весьма посредственным качеством и закодировав потом все в 192 Кбит/c я был потрясен услышанным! Результат звучал словно джаз на 112 Кбит/c, то есть омерзительно. У этого феномена очень глубокая причина и я могу написать еще одну статью на эту тему, если желаете. Так что, доверяйте технике и спектрограммам, но контрольное прослушивание устроить не ленитесь. Тем не менее, по большей части эта информация относится к обладателям хорошего тракта усилитель-колонки (наушники).

Заключение

Вот так, проявив стремление получить максимум из возможного, можно добиться вполне пристойного качества записи с любого источника. Просто не нужно никогда довольствоваться тем, чем нас снабдили производители звуковых карт, а искать, изучать и требовать Звук. Надеюсь, вы со мной согласны, уважаемые читатели.

27 декабря 2000 г.

Игорь Бабайлов