Creative SoundBlaster X-Fi

Часть 2. Технология 24-bit Crystalizer


 

Как вы помните, технология Creative X-Fi по версии создателей основана на двух ключевых технологиях обработки звука: 24-bit Crystalizer и CMSS-3D. Суть в том, что в Creative сосредоточились на продвижении только двух основных свойств звуковых карт нового поколения, вместо перечисления большого списка возможностей и нововведений. Именно поэтому после публикации статьи Creative SoundBlaster X-Fi — новое поколение процессоров и звуковых карт Xtreme Fidelity, где новые технологии были подвергнуты достаточно критической оценке, бренд-менеджер Европейского офиса Дарра О'Тул конструктивно предложил мне направить критику, с возможностью задать любые вопросы, напрямую создателю технологии 24-bit Crystalizer, директору отдела звуковых исследований калифорнийского Advanced Technology Center, Марку Долсону.

Вопросы

Максим Лядов,
пишущий редактор,
руководитель разработки тестов RMAA, RM3DS,
iXBT.com, Audio.RightMark.Org, Россия

Прежде всего, я хочу сказать, что не имею ничего против средств для субъективного улучшения звука, таких как регуляторы тембра, эквалайзеры для компенсации несовершенств акустических систем, или каких-то алгоритмов псевдо-объемного звука для улучшения пространственности. Пользователи любят включать/выключать некие магические кнопки и двигать загадочные регуляторы. Но, на мой взгляд, лучше использовать правильные слова, без маркетинговых небылиц. Мы должны предоставить достоверную информацию как минимум для адекватных и квалифицированных людей. Не так ли?

Пожалуйста, посмотрите на отрывок о технологии Crystalizer из моего обзора X-Fi. Прокомментируйте, если хотите.

Мы бы хотели получить информацию о том, как работает Crystalizer, из компетентного, прямого источника. С техническими подробностями, если можно. Что это — многополосный компрессор, эквалайзер + компрессор, или какой-то другой мастеринговый максимайзер?

К слову, недорогие колонки имеют относительно небольшую линейную зону хода подвеса диффузора, так что их динамический диапазон также мал. Поэтому, если мы уменьшаем динамический диапазон звукозаписи, колонкам становится легче воспроизвести фонограмму.

Но если мы говорим о ремастеринге, это немного другое дело. Максимайзеры используются на FM-станциях, но фонограмма в таком случае должна быть смастерена в студии с запасом по динамике. Компрессия также обычно используется в Dolby Digital декодерах, где пользователь может выбрать разные режимы компрессии динамики. Например, при использовании колоночек ноутбука, или при просмотре ночью — один режим, набор компактных колонок, или, находясь в зашумленной комнате — другой. И, наконец, в случае дорогого домашнего кинотеатра и hi-fi/hi-end колонок используется режим с полным диапазоном по амплитуде и частоте. Но звуковая дорожка к фильму также имеет запас и не максимизирована до компрессора в декодере.

Так что будет, если мы сделаем ремастеринг треков CD-DA диска, которые уже были отмастерены на студии SONY Music? Как звуковая карта ценой $100 и с каким-то там автоматическим вычислением в реальном времени может тягаться с дорогостоящим мастеринговым оборудованием за $1 000 000 с возможностью мультипроходного анализа и сложными специальными 64-битными алгоритмами обработки, да ещё и с выставляемыми вручную параметрами опытным звукоинженером/звукорежиссером?

Сколько будет искажений после наложения друг за другом двух агрессивных мастеринговых обработок (под ноль дБ)? Будет ли фонограмма чище, если наложить ещё больше обработок или просто умножатся нелинейные искажения?

Реклама Creative говорит, что Crystalizer расширяет динамический диапазон 16-битных записей до 24 бит. Я провёл в RMAA 5.5 эксперимент — проигрывал 16-битные и 24-битные WAV файлы на X-Fi и записывал результат с аналогового и S/PDIF-выходов (результаты одинаковы) на профессиональном звуковом интерфейсе LynxTwo-B в 24-битном режиме, при включенном и выключенном Crystalizer. Результаты сравнивали с референсными WAV файлами 16 и 24 бит, которые используются в тесте и которые просто генерились программой без проигрывания через что-либо.

Test Reference 16/48 Reference 24/48 Crystalizer OFF Crystalizer ON
Dynamic range, dB (dBA): 97.2 (98.2) 133.9 (133.1) 96.4 (96.9) 94.1 (95.5)
IMD + Noise, %: 0.0034 0.0002 0.0038 0.892

Как мы видим, Crystalizer не только не расширяет динамический диапазон 16-битного сигнала, но даже уменьшает его. В положении по умолчанию (50%) Crystalizer усиливает сигнал так, что две синусоиды 60 Hz @ -5 dB и 7000 Hz @ -17 dB (стандартный сигнал теста SMPTE-IMD) вызывают около 1% искажений (IMD+Noise). Последнее никак не может сделать звук более чистым и кристальным. Как вы можете это прокомментировать?

Как лучше использовать технологию Crystalizer? Годится ли она для любой записи и для любых колонок? Планирует ли Creative улучшить Crystalizer в следующих версиях? Может быть, необходимо применить буфер для опережающего анализа, чтобы варьировать степень обработки с помощью Crystalizer для защиты звука от искажений при прослушивании на действительно высококачественных колонках?

Ответ

Mark Dolson,
Director of Audio Research,
Creative Advanced Technology Center,
Scotts Valley, CA, USA

Я пишу в ответ на обзор Sound Blaster X-Fi и, в частности, технологии Creative 24-Bit Crystalizer. Это ревью включает некоторое количество неточных утверждений об этой нашей технологии, так что я хотел бы внести поправки и разъяснения.

Насколько я вижу, есть два ключевых вопроса, которые необходимо прояснить:

1. В чём цель 24-bit Crystalizer?

2. Как технология 24-bit Crystalizer эту цель достигает?

Начнем с первого из двух вопросов, с цели.

Основная цель 24-bit Crystalizer — частично компенсировать неотъемлемые ограничения динамического диапазона 16-битного аудио контента с помощью подходящей обработки при воспроизведении. Это, надо сказать, весьма амбициозная задача с неизбежными субъективными составляющими. Однако, в любом случае, мы можем четко сформулировать проблему технически.

Проблема в том, что нам дается смесь отдельных звуковых дорожек, каждая из которых, возможно, перед микшированием в звуковой студии была подвергнута компрессии динамического диапазона.

Анализ финальной фонограммы выпущенного CD не даст ответа о сжатии каждой дорожки отдельного инструмента, а также его относительной громкости в момент микширования. Из-за отсутствия такой вспомогательной информации строго воссоздать процесс звукозаписи физически невозможно.

Тем не менее, всё ещё возможно создать такую пост-обработку, которая бы давала результат, качественно схожий с тем, что мы могли бы достичь в идеале. Эта пост-обработка должна выборочно увеличивать всплески в звуке независимо от их абсолютного уровня, и без ощутимого изменения остальных аспектов звука.

Исходя из такой формулировки проблемы, нужно сказать, что:

(a)   Многополосный компрессор не является приемлемым решением, поскольку его обработка строго зависит от уровня сигнала, а также из-за того, что нам требуется скорее расширение, чем сжатие динамического диапазона.

(b)  Улучшения должны проявляться на любой воспроизводящей системе, вне зависимости от ее стоимости. Ведь мы, главным образом, устраняем ограничения 16-битного формата звука, не зависящие от воспроизводящей системы.

Теперь перейдем к обсуждению нашего собственного варианта решения проблемы.

24-Bit Crystalizer можно представить себе, как динамический эквалайзер, зависимый от сигнала. Анализатор входных данных постоянно вычисляет динамически нормализованный независимо поток энергии сигналов отдельно для НЧ и ВЧ, на основе нелинейной обработки входящего потока. Пропорционально этим управляющим сигналам, низкие и высокие частоты кратковременно увеличиваются.

При этом, для обеспечения ощутимых на слух изменений сигнала без внесения нежелательных артефактов, важна как тщательность разработки анализатора данных, так и пропорциональная АЧХ динамического эквалайзера. В эквалайзере также есть дополнительная постоянная составляющая, влияющая на общее восприятие.

Из короткого описания в статье трудно точно определить, что вы пытались выяснить при помощи тестов. В одном тесте через 24-bit Crystalizer пропускалась стандартная синусоидальная волна, которая сравнивалась с обработкой Waves LinMB. Это в корне неверно, потому, что тестовый сигнал не давал возможности использовать большинство улучшений. По существу, в нем нет ни динамики, ни импульсов, которые можно было бы улучшить. Единственное, что показывает тест — это статическое увеличение НЧ и ВЧ.

В общем и целом, обработка с помощью 24-bit Crystalizer представляет собой избирательное увеличение всплесков независимо от их абсолютного уровня, при котором все остальное (то есть СЧ) остается нетронутым. В этом значительное отличие от результатов работы многополосного компрессора (который в буквальном смысле сжимает динамически диапазон) и от многополосного экспандера (работа которого, в отличие от 24-bit Crystalizer, все-таки зависит от уровня сигнала).

В конечном итоге, результат работы 24-bit Crystalizer (частичную компенсацию ограниченного 16-битного динамического диапазона музыкальных CD) можно оценить лишь субъективно. 

Безусловно, можно найти пример записи, обработанной неудовлетворительно, или слушателей, которым не понравится тот или иной результат. По данной причине мы внедрили эту технологию с некоторой степенью гибкости. Пользователям, которые слушают действительно высококачественные записи, мы даем возможность самостоятельно уменьшить или вовсе отключить воздействие данной технологии. А те люди, которые слушают музыку более низкого качества (или какой-то определенный стиль музыки, с которым 24-bit Crystalizer работает хорошо), могут по желанию увеличить уровень воздействия этой технологии.

Судя по данным, которые Creative имеет на сегодняшний день, реальные отзывы рядовых слушателей в подавляющем большинстве позитивны.

Это не означает, что 24-bit Crystalizer может буквально преобразовывать биты треков, записанных на CD (или, тем более, в MP3), в те, что находятся на соответствующих DVD-Audio дисках (и мы таких заявлений не делали). Однако, на наш взгляд, технология подтверждает наши заявления о "субъективном улучшении" старых записей за счет применения разработанных нами передовых алгоритмов обработки сигнала. В этом заключается основа наших утверждений, что 24-bit Crystalizer (в сочетании с технологией X-Fi CMSS-3D) может заставить MP3-записи звучать лучше, нежели музыка на CD.

Комментарии

Максим Лядов

Я не был удовлетворен таким ответом и продолжил исследования. Аристотель сказал: "Amicus Plato, sed magis amica veritas". Creative — держись!

Можно понять желание разрекламировать и внедрить в массовое сознание использование новой технологии, сделав упор на сенсационные заявления о превосходстве MP3 над CD. Для привлечения внимания широкой аудитории это может быть оправдано так же, как в своё время заявления Intel о том, что Pentuim-III ускоряет интернет. Но для технически подготовленной аудитории, на мой взгляд, нужны какие-то внятные аргументы не рекламного характера. Иначе реклама будет иметь прямо противоположный эффект.

Можно 1000 раз сказать, что динамический диапазон увеличивается, но по стандартным тестам, проведенным по методикам AES, и в утвержденном стандартами ANSI/IEC значении понятия "Dynamic Range" почему-то выходит, что с включением Crystalizer он уменьшается.

Далее, я категорически не согласен с различного рода запугиваниями пользователей в отношении качества записей на CD-DA и ответственно заявляю, что у 16-битного формата нет описанных Creative ужасающих проблем с динамическим диапазоном. После применения нойз-шейпинга в финальной стадии мастеринга психоакустически взвешенный динамический диапазон 16-битной записи в слышимом диапазоне частот может превысить 100 дБ (A-weighted, AES17 filtered) и даже достигнуть параметров 20-битного! Любые обработки и вмешательства в процесс побитной передачи финальной фонограммы от CD к ЦАПу как раз таки разрушают данные усилия.

С другой стороны, нужно ли упоминать, что динамический диапазон обычных акустических систем гораздо хуже даже 96 дБ (20 log 2^16), а шумы в комнате в обычных условиях составляют около 20-30 дБ. Поэтому вместо расширения динамического диапазона, именно компрессия динамики может дать звуку субъективную чистоту и детальность. Записи на CD ни в коей мере не используют даже имеющийся динамический диапазон! Применение экспандера после мастеринговой компрессии и максимизации не даст должного эффекта, так как детали были уже потеряны при сжатии динамики, а запись обогатилась значительным количеством искажений. Это нелинейный и необратимый процесс!

Несмотря на слова Марка о компенсации ограничений 16-битного формата, агрессивность записи после применении Crystalizer увеличивается, так как RMS мощность сигнала вырастает.

Марк делает упор на динамический подъем уровня записи, называя Crystalizer динамическим эквалайзером. Многополосный компрессор действует также динамически, имея настраиваемое по полосам время срабатывания и спада.

Я провел консультации с Алексеем Лукиным, одним из авторов мастерингового пакета iZotope Ozone 3. Он предположил, что в Crystalizer в качестве порога срабатывания в управляющей цепи используется не уровень сигнала, а скорость его изменения. Таким образом, предсказываются и усиливаются пики сигнала независимо от текущего уровня. Такое в числе прочего используют на студиях, отдельно на дорожках ударных инструментов для подчеркивания атаки. Например в комплекты плагинов Waves Transform или в Waves Diamond входит так называемый многополосный шейпер сигнала, плагин Trans-X Multi (multi-band trancient processor).

Слуховая проверка показала — действие Crystalizer при наличии в записи резких пиков, особенно на звуках ударных инструментов, действительно схоже с действием шейпера Trans-X Multi с определенными настройками, показанными на скриншоте.

Однако, даже на статическом синусоидальном мультитоновом сигнале продолжительностью несколько секунд Crystalizer значительно эквализует сигнал, увеличивая RMS громкость сигнала примерно на 3 дБ.

Растёт ли от этого динамический диапазон, то есть, увеличивается ли разница по громкости между пиками сигнала и нижним шумовым порогом (noise floor), куда входят различной природы шумы+искажения? Как видно на спектрах, как единичной синусоиды, так и мультитонового сигнала, вместе с амплитудой основного колебания растут и шумы+искажения, причем растут гораздо быстрее. Это связано с тем, что любая обработка вносит искажения, в той или иной степени. Тем более такая, как увеличение уровня сигнала, что грозит срезом пиков сигнала, если не использовать дополнительные средства (компрессор, лимитер).

В данном случае искажения имеются, но их нельзя назвать критическими, по крайней мере, для такого мультитонового сигнала, хорошо имитирующего среднюю по динамике запись. К сожалению, современные записи имеют тенденцию к снижению запаса динамического диапазона.

Вот что пишет известный специалист в области мастеринга Боб Кац:

В музыке и в индустрии радиовещания в настоящее время преобладает хаос. На рисунке приведена сигналограмма, полученная на компьютере цифровой звукозаписи, которая представляет три различных стиля записи музыки. Общая длительность сигналограммы приблизительно 10 минут, вертикальная шкала линейна, ±1 при полном уровне цифрового сигнала, 0,5 амплитуды соответствует –6 дБ полной шкалы. Плотность сигналограммы дает грубое представление о динамическом диапазоне музыки и пик-факторе. Левый фрагмент — сильно компрессированная псевдо-популярная музыка, которую я обработал для демонстрации на 107-ом съезде AES. В середине — четырехминутный популярный CD-сингл, произведенный в 1999 г. с миллионной продажей. Справа — четырехминутная запись популярного рок-н-ролла, сделанная в 1990 г. — весьма динамичное звучание для рок-н-ролла того периода.

Разница в восприятии громкости между компакт-дисками 1990 г. и 1999 г. более 6 дБ, хотя пики обеих записей имеют полную шкалу. Прослушивая компакт-диск 1999 года, один инженер мастеринга заметил, что "Этот компакт-диск как лампочка! Запускается музыка, все светодиоды индикатора загораются и остаются так все время". Про искажения сказать нечего. Неужели мы действительно заняты в бизнесе по созданию прямоугольных колебаний?

Средний уровень компакт-дисков с популярной музыкой продолжает расти. Компакт-диски с этой проблемой становятся все более распространенными, сосуществуя с дисками, которые имеют прекрасный динамический диапазон и звучание, но чьи громкость и уровень искажений намного ниже. Есть много технических, социологических и экономических причин этого хаоса.

Безумное увеличение уровней в самых популярных компакт-дисках: КРАСНЫЙ — средний уровень; БЕЛЫЙ — зона пиков. Высота красного столбца отражает восприятие громкости и потенциальную потерю качества и ясности.

Таким образом, если применить Crystalizer к современной, сильно максимизированной записи, получается многократный рост искажений, приводящий к треску и загрязнению записи паразитными гармониками.

Проследим это на примере стандартного теста IMD-SMPTE. Будем изменять амплитуды синусоид и смотреть на результат. -6/-18, -5/-17, -4/-16, -3/-14 — всё ещё не вызывают клиппинга и имеют пиковый уровень -4.05, -3.05, -2.05, -1.05 дБ соответственно. Максимально громкий сигнал имеет RMS уровень сигнала -4.5 дБ для имитации современной записи. Количество интермодуляционных искажений изменялось от 0,04% до 10%.

В положении по умолчанию (50%) Crystalizer приводит к клиппингу всех вариантов сигнала кроме -6/-18. Перед применением Crystalizer разумно было бы перевести сигнал в формат с плавающей точкой и уменьшить амплитуду в цифровом виде, чтобы избежать переполнения. Но тогда запись не будет звучать субъективно громче, что сильно ослабит позиции Crystalizer при прямом сравнении с неизмененной записью той же громкости.

Учитывая всё вышеизложенное, то есть, зная нехорошее свойство Crystalizer увеличения общей громкости в цифровом виде, я провел сравнения записей Crystalizer с оригиналом, усиленным на 3 дБ для выравнивания уровней.

Сравнение происходило на двух характерных записях — старой аналоговой записи с большим запасом по динамике и современной выжатой по спектру композиции. Использовалась звуковая карта X-Fi Elite Pro и активные студийные мониторы.



В обоих случаях мне намного больше понравилось звучание оригинала. Crystalizer сильно эквализовал запись, вызывая откровенный провал средних частот. Также все резкие звуки, такие как ударные, звук подцепляемой струны гитары, начало атаки звука саксофона, сильно подчеркивались, зачастую затмевая собой остальную фонограмму (автоматика не смогла определить, что, например, вокал в данной композиции важнее партии тарелок). Вероятно, подобная обработка звука пойдет на пользу лишь при прослушивании определенного рода фонограмм на компьютерных колоночках, обладающих не меньшими собственными искажениями, сквозь которые будет слышна эквализация и более резкая атака ударных инструментов. Уменьшение уровня воздействия Crystalizer сказывается положительно: это приводит к снижению эквализации, к снижению уровня подъема общей громкости и к большей устойчивости к перегрузке.

Выводы

Наконец, мы в достаточной степени знаем, что собой представляет технология 24-bit Crystalizer. Это довольно сложная комбинация статической и динамической обработки сигнала, для которой трудно подобрать один единый термин. Именно поэтому Creative запатентовал Crystalizer, как самостоятельную разработку. Однако, что бы Crystalizer там не представлял внутри, для нас интереснее результаты его работы и область применения.

Чуда не произошло, звуковая карта X-Fi в сочетании с Crystalizer не смогли автоматически сделать волшебный ремастеринг записи, кропотливо созданной профессионалами экстра-класса на мастеринговой студии. Даже если обратное и было доказано сотней домохозяек фокус-группы маркетингового исследования Creative, в моих тестах MP3 не победил CD-DA, и не догнал DVD-Audio.

Тем не менее, надо признать, что наличие аппаратного улучшайзера Crystalizer — это плюс для массового пользователя, как и наличие эквалайзера или регуляторов тембра. С помощью этих средств можно попытаться скомпенсировать недостатки имеющихся акустических систем или наушников. Но, в любом случае, не стоит надеяться, что MP3 128 кбит/с чудесным образом зазвучит лучше, чем оригинальный CD-DA, а оправданность применения — каждый решает для себя по итогам прослушивания именно тех записей, которые он предпочитает.

Меня берут сомнения, что современные массовые записи нуждаются в дополнительном насилии над динамикой. Вероятно, для них следует осторожно подбирать уровень воздействия Crystalizer до появления признаков перегрузки. Необходимо также учитывать, что Crystalizer сам по себе поднимает громкость записи на 3-4 дБ в цифровой форме. Так что, возможно, разумнее просто увеличить громкость на ту же величину, чтобы избежать перекоса в тональном балансе и прочих проблем.

 


Продолжение следует...

 

Дополнительно

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.