Creative SoundBlaster X-Fi

новое поколение процессоров и звуковых карт Xtreme Fidelity

Что такое Xtreme Fidelity?

2 августа 2005 года компания Creative провела в Германии конференцию, где европейской прессе были продемонстрированы звуковые карты нового поколения — SoundBlaster X-Fi.

Ранее, 13 мая 2005 года Creative анонсировала технологию Xtreme Fidelity, сокращенно X-Fi, и одноименный звуковой процессор.

Если с новым процессором более-менее понятно, то что же такое «технология Xtreme Fidelity»? По версии производителя, её суть заключается в обеспечении 24-битного качества, четкости звука как минимум с 110 дБ сигнал/шум и новой технологии CMSS (Creative Multi Speaker Surround) 3D-звука в наушниках и многоканальных колонках. Как заявил Сим Вонг Ху, основатель и исполнительный директор компании Creative — «Xtreme Fidelity — результат нашего видения нового аудио стандарта, который сможет привнести драматическое улучшение в воспроизведение MP3, в геймплей на PC-играх и в цифровые фильмы, таким образом закладывая основу целой новой платформы домашних цифровых развлечений».

Говоря о Xtreme Fidelity, производитель делает особенный упор на две новые технологии: 24-bit Crystalizer и CMSS-3D. По замыслу Creative, технологии предназначены для ремастеринга, улучшения и ремикширования в реальном времени существующего обычного и сжатого 16-битного стерео материала в 24-битное качество, с многоканальным звучанием в колонках любой конфигурации, а также в наушниках.

Для того чтобы обеспечить возможности нового стандарта, Creative создает процессор X-Fi под девизом «Xtreme Audio Needs An Xtreme Fidelity Processor!» («исключительному звуку требуется процессор высшего качества»).

Ретроспектива

Предыдущие звуковые карты, начиная с Live! образца 1998 года, основывались на модификациях процессора EMU10K. Этот процессор разрабатывался в основном для использования в синтезаторах и модулях производства E-MU как аппаратный MIDI-синтезатор со встроенным эффект-процессором. В то время, когда основным требованием к звуковой карте являлось наличие аппаратного MIDI с максимально большим банком памяти, широкими возможностями и качественными эффектами, EMU10K был прогрессивным чипом. Однако в настоящее время, как все понимают, он морально устарел. Несмотря на 32-битную обработку звука, программируемые качественные профессиональные эффекты, поддержку 8 цифровых I2S или SPDIF интерфейсов, недостатки (главный из которых — жесткая архитектура) сводили всё на нет.

С момента разработки EMU10K интересы пользователей звуковых карт существенно изменились. Фактически произошло разделение аудитории на три лагеря: 1) офисные и прочие пользователи, которых устраивает даже интегрированный звук; 2) геймеры, не особенно интересующиеся качеством, которые не против хорошего трехмерного звука в играх, если это не идет в ущерб производительности; 3) меломаны и аудиофилы, использующие компьютер под удобную музыкальную библиотеку, — им карта нужна исключительно для качественного воспроизведения музыки.

Однако любители качественного звука выражали недоверие изделиям Creative, даже несмотря на установленные в последних моделях качественные I2S ЦАПы Cirrus Logic. Главной "страшилкой", разрушающей имидж звуковых карт Live/Audigy, на долгие годы стало наличие неотключаемой посредственной аппаратной передискретизации (resampling) всех частот в опорную частоту 48 кГц. Для получения качественного воспроизведения формата 44,1 кГц, в котором существует большинство записей, пользователи карт в массовом порядке стали устанавливать DirectSound или ASIO плагины программного пересчета частоты семплирования (SSRC — software sample rate convertion) для популярных mp3-плееров Winamp и Foobar.

SRC Audigy vs. SSRC Winamp

Начиная с Audigy2, разработчики ввели в чип блок P16V, позволяющий картам напрямую проигрывать частоты 96 и 192 кГц для воспроизведения DVD-Audio. Но данный режим оказался доступен только для этих частот и лишь через DirectSound интерфейс. Эффект-процессор, работающий на 48 кГц, в таком случае должен был быть отключен. В противном случае в дело опять вступает передискретизация.

В low-end ниже Creative начинает катастрофически терять рынок звуковых карт за счет экспансии AC'97 и HDA кодеков, принудительно установленных на материнских платах. Это сильно снижает стимул пользователей тратиться на отдельную звуковую карту. Помимо этого, наступление интернет и файлообменных сетей делает компьютер средством накопления коллекции файлов в сжатых форматах. Так что для качественного прослушивания музыки многие предпочитают полупрофессиональные карты на Envy24, с минимумом аппаратных возможностей, но с выбором фиксированной частоты семплирования, честным 44,1 кГц по цифре и минимумом ненужных многим наворотам.

Очевидно, что Creative был нужен новый процессор, лишенный недостатков прежнего. X-Fi был в разработке последние 5 лет. Ещё с момента выпуска первой модели Audigy началась работа над процессором нового поколения. Место разработки — Creative Advanced Technology Center, Кремниевая долина, Калифорния.

Архитектура X-Fi

По заявлению производителя новый процессор Xtreme Fidelity имеет более 51 миллиона транзисторов и производительность более 10000 MIPS (миллионов инструкций в секунду). X-Fi также в 24 раз более мощный, чем предшественник.

Сердце процессора — DSP "Quartet", так как имеются 4 подпроцессора, работающие параллельно. Архитектура именуется TIMD (Thread Interleaved Multiple Data). Для достижения параллелизма используется архитектура процессора с командными словами очень большой длины (Very Large Instruction Word, VLIW).

В такой команде объединено несколько обычных команд, которые выполняются одновременно (параллельно) разными функциональными блоками процессора для повышения его быстродействия. Рост производительности достигается за счет того, что процессору не нужно тратить время на организацию параллелизма на уровне команд. Группировка параллельно исполняемых операций выполняется компилятором.)

Каждый подпроцессор имеет архитектуру 2xSIMD. 2x происходит от того, что обычно подпроцессор оперирует с двумя потоками данных — стерео данные, комплексные числа. Кстати, используется тип данных как с плавающей точкой, так и с фиксированной. Набор инструкций состоит из 235 кодов операций, и около 60 специализированных команд, часто встречающихся в алгоритмах частотной обработки звука, например, комплексное умножение данных из двух потоков, десятичный логарифм, экспонента.

Внутренняя частота процессора 400 МГц. Поддерживается внешняя синхронизация для S/PDIF и I2S. Приводится значение джиттера ФАПЧ (PLL) процессора <60 пс. Для сравнения, процессоры 10Kx имели джиттер 110 пс.

В алгоритмах обработки звука (реверберация, эквалайзер, эффекты моделирования распространения 3D-звука) используются 512 БИХ-фильтров (IIR, infinite impulse response = БИХ, бесконечная импульсная характеристика) второго порядка. Этим никого не удивишь в современных средствах обработки звука, но следует учесть, что здесь всё работает в реальном времени для десятков потоков одновременно. В число аппаратных фильтров, в том числе входят 4 и 5 полосные параметрические эквалайзеры, полосовые, режекторные и прочие специфические фильтры.

Также имеются богатые возможности по микшированию — до 4096 сигналов с аппаратной регулировкой громкости и объединения двух источников. Это может быть использовано как для построения микшера, гибко конфигурируемого в плане роутинга сигналов, а также используется в играх, так как требует регулировки уровня каждого наложенного эффекта.

Для соединения с цифровыми и аналоговыми интерфейсами процессор имеет 4 входных/выходных шины I2S, обеспечивая 8 входных и 8 выходных каналов. Помимо этого, имеется проприетарный протокол для передачи 8 каналов по одному проводу, таким образом получается 32 х 48 кГц, 16 х 96 кГц, 8 х 192 кГц каналов. Для внутренних нужд и роутинга имеется 4096 звуковых и 4096 параметрических каналов.

SRC

Преобразователи частоты семплирования (SRC, Sample Rate Convertors) задействуются в тех случаях, когда частота семпла не совпадает с опорной частотой текущего режима (иначе семпл проиграется с неправильной скоростью и изменит тон). Используется 256 интерполяторов, с качеством выше, чем у типичного полифазного КИХ-фильтра 100-го порядка (FIR, finite impulse response = КИХ, конечная импульсная характеристика). Диапазон сдвига тона от 0 до 8.

Схема работы SRC X-Fi

Картинка иллюстрирует работу SRC X-Fi по конвертации 44.1 кГц в 48 кГц. Сперва отсчеты сигнала удваиваются до 88.2 кГц. Полифазный КИХ фильтр конвертирует сигнал до 192 кГц с коэффициентом, равным удвоенному отношению 48/44.1. В финальной стадии частота уменьшается до 48 кГц. Такая схема более эффективна с точки зрения вычислительных затрат и даёт более качественный результат, так как на последнем этапе не образуется алиазинг из-за некратных частот.

При конвертации стандартного тона 997 Гц из 44.1 кГц в 48 кГц стандартный параметр, отвечающий за мощность шумов и искажений, THD+N равен -136 дБ, дрожание частоты в полосе пропускания ±0.00025 дБ. Проверять эти параметры Creative рекомендует как минимум с помощью измерительной станции AudioPrecision.

Учитывая запас по перегрузке (headroom) в 6 дБ и 32 стадии цикла обработки, THD+N может ухудшиться до –124 дБ, а неравномерность АЧХ возрастёт до ±0,01 дБ. Но параметры даже самых лучших на сегодня ЦАПов по шумам и искажениям уступают таким показателям.

Качество работы SRC X-Fi при конвертации 44,1->48 кГц

Следует лишь учесть, что параметры качества в частотной области не показывают работу фильтров во временн ом домене. Но, учитывая позиционирование карт в первую очередь на игры и фильмы, такую точность преобразования можно считать великолепной. В прошлых изделиях интермодуляционные искажения от SRC доходили до 0,1% в высокочастотной области, при этом на падение качества жаловались лишь единичные пользователи.

Имеется очень важный момент, который не сильно афишируется производителем — в отличие от звуковых процессоров предыдущего поколения, в X-Fi можно отключить передискретизацию вместе с остальными эффектами DSP! При этом, конечно, теряется уникальная возможность одновременного прослушивания нескольких сигналов разных частот дискретизации, с последующим наложением всяческих эффектов и улучшайзеров. Однако поклонникам максимально качественного саунда подобное нужно меньше всего.

Преобразователи SRC работают также в режиме DMA, позволяя производить преобразования прямо в ОЗУ компьютера без участия ЦПУ. Для исключения коллизий при загруженной шине PCI имеется настраиваемый кэш.

Возможности X-Fi

Обработка данных для передаточных функций головы и ушей человека (HRTF) и расчета звука для наушников базируется на нескольких технологиях. Это разработки UCDavis, Aureal и Sensaura. Используются патенты на MacroFX, бинауральный 3D паннинг. В реализации применены 48-tap КИХ(FIR) фильтры, обрабатывается до 128 источников 3D-звука.

Технология CMSS (Creative Multi Speaker Surround) обновлена до CMSS-3D. Производитель заявляет, что качество звукового поля выше, чем у Dolby Prologic II/IIx, а в наушниках пространственность и натуральность тембров на ВЧ превосходит Dolby Headphone.

В отличие от предыдущих поколений процессоров, теперь поддерживаются эффекты и для режимов 24/96 и 24/192. Для обработки сигналов повышенного разрешения, например, 192 кГц, используется технология Quadrature Mirror Filter — разбиение сигнала на 4 частотные полосы по 48 кГц, которые обрабатываются раздельно, а результаты складываются. Таким образом, при обработке 192 кГц возрастает скорость вычисления, по сравнению с обычными методами.

Архитектура чипа допускает переключение между режимами без перезагрузки, так что звуковые карты могут максимально задействовать ресурсы.

Поддерживается ASIO 2.0 со временем задержки <2 мс. При взаимодействии между драйвером и железом участие CPU не требуется, так что заявлено 0% загрузки.

Для WDM и OpenAL проведены оптимизации драйверов и железа для получения наименьшей latency, при более высоком качестве звука.

Сравнение

В таблице указаны приблизительные соотношения по производительности между различными поколениями карт Creative (по данным производителя).

	Произв. вычисл MIPs	Общая произв. MIPs	Внутр. каналов	MIPS vs Live!	Кол-во эффектов	Число транзисторов
Sound Blaster Pro	≈1	3+	-	0,0001x	-	100K
AWE 32 (EMU8000)	67	200+	-	0,2x	-	500K
Live! (10k1)	335	1000+	16 (эффекты)	1x	1	2M
Audigy (10k2)	424	1250+	64 (эффекты)	4x	4	4,6M
X-Fi	10340	30000+	4096 (всего)	67x	8	51,1M

X-Fi обладает архитектурой, полностью отличающейся от строения предыдущих поколений процессоров Creative, также как всех прочих процессоров, включая графические. Концепция представляет собой программируемую архитектуру на основе кольца. Это дает гибкость в роутинге сигналов, позволяя любому из 4096 звуковых каналов перенаправить сигнал к любому элементу процессора — Tank, SRC, Mixer, DSP.

	Распределение MIPS
SRC	7310
Filter	200
Mixer	1210
Tank	440
DSP	1180
Всего:	10340

Таким образом, новая архитектура X-Fi состоит из следующих основных инноваций:

Архитектура "Ring"
Новый DSP "Quartet"
Ультра-качественный SRC
Аппаратная акселерация Mixer, Tank Engine (эффекты), Filter Engine, DMA.
Одновременная разработка и взаимодействие аппаратной и программной частей

Огромное количество информации о процессоре X-Fi можно найти на специальном сайте www.soundblaster.com/products/x-fi/technology.

Звуковые карты Sound Blaster X-Fi

8 августа 2005 года Creative анонсировала новую линейку звуковых карт Sound Blaster X-Fi на базе одноименного процессора. Будут выпускаться 4 модели карт: Sound Blaster X-Fi Elite Pro, Sound Blaster X-Fi Fatal1ty FPS, Sound Blaster X-Fi Platinum, Sound Blaster X-Fi XtremeMusic.

Sound Blaster X-Fi Elite Pro оборудована ЦАП профессионального качества 116 дБ сигнал/шум, плюс внешний интерфейсный модуль с кнопками регулировки 24-bit Crystalizer, X-Fi CMSS-3D, 3DMIDI и EAX. Карта оснащена 64 Мб набортной X-RAM звуковой памятью, а также микрофонным и гитарным предусилителями. Ориентировочная стоимость US$399.99.

Sound Blaster X-Fi Fatal1ty FPS сконструирована, чтобы удовлетворить запросы знаменитого геймера Джонатана "Fatal1ty" Вендела. Карта имеет 109 дБ сигнал/шум, 64 Мб набортной X-RAM. В комплекте поставляется коммутационный блок под 5" отсек и ИК-пульт ДУ. PCI-карта с менее качественными ЦАП. Стоимость US$279.99.

Sound Blaster X-Fi Fatal1ty FPS

Sound Blaster X-Fi Platinum. То же самое, что и Fatal1ty, но PCI-карта без набортной памяти. US$199.99

Sound Blaster X-Fi XtremeMusic. Самый простой вариант платы. Platinum без коммутационного блока. US$129.99
Кстати, даже для этой карты есть упоминание о возможности заказа ИК-приемника на шине USB и пульт ДУ.

В данной статье мы рассмотрим самую интересную модель — Sound Blaster X-Fi Elite Pro. Отличительная черта карты — максимальное качество и производительность, плюс огромных размеров внешний коммутационный блок с пультом ДУ.

Sound Blaster X-Fi Elite Pro

Sound Blaster X-Fi Elite Pro

Сама карта, с маркировкой SB0550, имеет позолоченные разъемы и загадочную прямоугольную деталь в верхнем углу платы. На поверку оказалось, что это светодиод с надписью X-Fi, которая загорается синим цветом при включении и будет хорошо видна в полупрозрачных моддерских корпусах.

PCI-карта Sound Blaster X-Fi (SB0550) из комплекта Elite Pro

На плате установлены ЦАП Cirrus Logic CS4398, архитектура advanced multi-bit Delta-Sigma, с 120 дБ DR и -107 дБ THD+N. Тот же ЦАП стоит в картах E-MU 1212M/1820M, Creative Audigy4.

АЦП — также хорошо нам знакомый топовый преобразователь AKM, архитектура advanced multi-bit, 123 дБ DR, THD+N -110 дБ.

Многих читателей пугают незнакомые слова в строке "архитектура преобразователя". Существует мнение, что все качественные преобразователи (= "параллельные", "мультибитные") остались в далеком прошлом. К сожалению, такое мнение поддерживают даже весьма авторитетные и уважаемые специалисты.

В момент появления недорогих преобразователей с оверсемплингом, а также однобитных дельта-сигма модуляторов действительно, качество преобразователей оставляло желать лучшего и годилось только для low-end аппаратуры, куда первоначально и предназначалось. Однако впоследствии недостатки таких решений были всесторонне проанализированы и изучены. Были проведены новые исследования, развивались технологии, внедрялись новые разработки, и в данный момент современные дельта-сигма мультибитные ЦАПы имеют мало общего с 1-битными дельта-сигма модуляторами 15-летней давности. Более того, все ЦАПы имеют как различную схемотехнику, так и исполнение (качество элементов). Именно этим и ничем иным, определяется цена и качество ЦАПа.

Чип X-Fi CA20K1, ЦАПы CS4398, АЦП AK5394, ОЗУ Micron 64 Мбайт 7.5 нс

Задача ЦАПа — как можно точнее воссоздать по отсчётам аналоговый сигнал. Реализовать математическую абстракцию в реальном мире нельзя, поэтому проблема трансформируется в показатель цена/качество конкретного технического решения. Многоканальный параллельный ЦАП разрядностью 24 бит в серийном производстве технически реализуем лишь с высокой себестоимостью и чрезвычайно низким процентом годности выхода продукции (резисторы вырезаются лазером), плюс есть технические затруднения с реализацией фильтра. 1-битные модуляторы имеют непревзойденную линейность, но вместе с тем проблемы фильтрации шумов нойз-шейпинга.

Современные мультибитные дельта-сигма ЦАПы берут лучшее от обеих технологий и решают проблемы наилучшим образом.

Обратимся к работе "A Multibit Delta–Sigma Audio DAC with 120-dB Dynamic Range" Ichiro Fujimori, Member, IEEE, Akihiko Nogi, Member, IEEE, Tetsuro Sugimoto.

Вот вам архитектура типичного MULTIBIT DS DAC: 24-битный цифровой сигнал оверсемплируется с коэффициентом 128x, а затем подается на цифровой DS модулятор (DSM) работающий на частоте 6.144 МГц. По сравнению с 1-битным, 5-битный DSM 3-го порядка создает незначительный шум квантизации в общей мощности шума. Выход с 5-битный DSM конвертируется в 31-уровневый код, а затем в DEM, где решается проблема нелинейности квантования и температурной зависимости. С DEM данные идут на аналоговый блок восстановления, включая ЦАП на переключаемых конденсаторах (SC) и пост-фильтр на БИХ и КИХ фильтрах, повышающих устойчивость к джиттеру.

Даже считающийся многими чистым мультибитником высококлассный аудиофильский ЦАП BurrBrown PCM1704 на поверку работает по технологии sign-magnitude с 8X оверсемплингом для возможности цифровой фильтрации, где на выходе — активный low-pass фильтр второго порядка.

Задняя панель блока X-Fi Elite Pro

Режимы

Карты семейства X-Fi имеют три режима работы: развлекательный, игровой и создание музыки. Режимы переключаются в утилите Mode Switcher.

Помимо различий во внешнем виде, режимы отличаются оптимизацией под конкретные задачи. Это связано с оптимизацией использования ресурсов. Например, в игровом режиме эффект-процессор и аппаратные буферы используются для EAX5, в то время как в режиме Creation они освобождаются для поддержки аппаратного MIDI-синтезатора.

	Игровой (Gaming)	Развлекательный (Entertainment)	Создания музыки (Creation)
Video Game Frame-Rate	YES	NO	NO
Hardware 3D Audio Processing	YES	NO	OPTIONAL
Environmental Effects	YES	OPTIONAL	OPTIONAL
High-Resolution Audio Playback	NO	YES	YES
Audio Enhancement Processing	NO	YES	OPTIONAL
2-Channel to Multi-Channel Up-Mix	OPTIONAL	YES	NO
Multi-Channel Audio Recording	NO	NO	YES
Hardware MIDI Playback	NO	OPTIONAL	YES
Hardware Effects	YES	YES	OPTIONAL
Sample-Synchronized Record and Playback	NO	NO	YES
Low Audio-Streaming Latency	NO	NO	YES
Bit-Accurate Audio Capable	NO	OPTIONAL	YES

Развлекательный режим

В Entertainment Mode панель управления имитирует цифровой процессор или ресивер из мира бытовой аппаратуры. На экран можно вызывать настройки различных режимов.

В настройках S/PDIF отсутствует частота 44.1 кГц — досадный просчёт, наводящий на нехорошие мысли. Возможно, в будущем драйвера доработают и настройка появится.

Игровой режим

В игровом режиме — другой дизайн. Хотя опции — практически те же самые. Диагностика в RM3DS показывает, что в Game Mode имеется другое важное отличие. Именно в этом режиме появляются поддержка EAX5 и 128 звуковых буферов.

Диагностика RightMark 3DSound 2.0

Мы провели диагностику возможностей X-Fi в разработанной нашими усилиями программе RightMark 3DSound 2.0. Карта находилась в игровом режиме (Game Mode). Выяснилось, что именно в нём появляется поддержка EAX4, EAX5, а также 128 аппаратных буферов (1 primary, 127 secondary).

OpenAL:

Device: SB X-Fi Audio [E880]
Features:
Hardware 2D Buffers 127
Hardware 3D Buffers 127
EAX 1.0: Available
EAX 2.0: Available
EAX 3.0: Available
EAX 4.0: Available
EAX 5.0: Available

DirectSound:

Device: SB X-Fi Audio [EC00] (ctaud2k.sys)

Features:
DirectSound 3D Hardware: Yes
DirectSound 2D Hardware: Yes
EAX 1: Available
EAX 2: Available
EAX 3: Available
EAX 4 Advanced HD: Available

Rates:
dwMinSecondarySampleRate 1
dwMaxSecondarySampleRate 192000

Free buffers stats:
dwFreeHw3DAllBuffers 127
dwFreeHw3DStaticBuffers 127
dwFreeHw3DStreamingBuffers 127
dwFreeHwMixingAllBuffers 127
dwFreeHwMixingStaticBuffers 127
dwFreeHwMixingStreamingBuffers 127

Max buffers stats:
dwMaxHwMixingAllBuffers 128
dwMaxHwMixingStaticBuffers 128
dwMaxHwMixingStreamingBuffers 128
dwMaxHw3DAllBuffers 128
dwMaxHw3DStaticBuffers 128
dwMaxHw3DStreamingBuffers 128

Режим создания музыки

В режиме Audio Creation Mode вид меняется на микшерный пульт с вкладками. И самым интересным здесь является выбор опорной частоты семплирования.

Смотрим — есть 44,1 кГц!

Также есть долгожданная настройка Enable Bit-Matched Playback. Она отключает SRC и активирует автомат опорной частоты — таким образом, Master Sample Rate автоматически устанавливается равным частоте проигрываемого в данный момент файла (так, как это делалось, например, в звуковых картах на Envy24). Что интересно, 192 кГц в списке частот мастер-клока отсутствует.

Здесь же выбирается режим работы разъема FlexiJack, совмещающего линейный вход, микрофонный вход и цифровые интерфейсы при наличии опционального переходника.

24-bit Crystalizer

После справедливых упрёков в адрес рекламы 24-битных карт предыдущего поколения, касающихся ненужности 24 бит для прослушивания 16-битных CD и MP3 (обычно составляющих 99,9% среди цифровых записей современного меломана), маркетологи Creative в срочном порядке изобрели технологию, использующую 24 бит в реальной жизни. Встречайте 24-bit Crystalizer!

Прежде чем ознакомиться с технологией на деле, я прочитал и услышал рекордное число псевдонаучной белиберды и откровенных небылиц.

Самую забавную фразу я прочел на сайте Creative, где приписывали технологии воссоздание из MP3 фонограммы качеством выше, чем было в оригинале на CD, ещё до сжатия в MP3. Эта фраза воистину изобретение маркетологов, которые имеют какое-то своё, альтернативное представления о качестве.

Технология преподносится под соусом расширения динамического диапазона 16-битных записей до диапазона 24 бит, за счёт некоего интеллектуального анализа записи и возвращения ей утраченных в процессе преобразований детальности, и компенсации компромиссов, возникающих на стадии мастеринга.

На практике, менее чем через минуту после прослушивания мне стало ясно, что собой представляет Crystalizer. Технология сродни тому, что мы видели у Intel с HDA, в их комплектном софте Intel Audio Studio.

Действительно, с фонограммой производят ремастеринг с помощью "широко известного в узких кругах" мастерингового плагина, под названием "многополосный компрессор". Чтобы на 100% убедиться в своей правоте, я сравнил работу Crystalizer с тремя мастеринговыми многополосными компрессорами: Waves LinMB, iZotope Ozone, Steinberg MultiBand Compressor. При включении этих плагинов характер звука меняется аналогично включению Crystalizer.

Чтобы удостовериться на все 200%, я протестировал Crystalizer нашей программой RMAA и сопоставил с результатами Waves LinMB Linear Phase MultiBand compressor (со стандартным пресетом Low-Level Enhancer — сообщаю для тех, кто захочет повторить измерения). Тесты были проведены с настройкой Crystalizer по умолчанию, в среднем положении.

Обратите внимание на эквализацию АЧХ и большие интермодуляционные искажения — по измерениям характер воздействия плагинов аналогичен. Однако на слух ситуация намного лучше. Это связано с тем, что характер музыкального сигнала отличается от тестового. Согласно психоакустике, перегрузка менее 6 мс человеком не фиксируется, а качественный компрессор не допускает длительной перегрузки, оперативно снижая уровень сигнала, что регулируется временем атаки.

Можно найти аналогию технологии Crystalizer в мире цифровой фотографии. Предположим, появляется некий плагин, который переводит JPEG, полученный сжатием из некоего качественного TIF, в формат 16-бит на цвет, затем поджимает уровни (грубо говоря, повышает яркость/контрастность) и резкость на 10-20% в некой зависимости от исходника. Готово! Получаем новый гениальный "48-bit Picturelizer", который делает JPEG лучше исходных TIF. Внимание, вопрос: в каком случае качество будет лучше? Правильно, только в случае, если JPEG обладает запасом по качеству для подобных надругательств, а устройство отображение имеет проблемы с передачей самых светлых и самых темных полутонов исходного изображения.

В звуке ситуация с MP3 и WAV примерно такая же, однако есть и разница. В мастеринговых студиях применяется весьма дорогостоящее оборудование, анализирующее исходный файл не в реальном времени, а с некоторым забеганием вперёд или даже не в один проход, с применением точности вычислений не 24 бит, а 64 бит с плавающей запятой. Далее, параметры мастеринговой компрессии должны кропотливо подстраиваться индивидуально под каждую запись на высококачественных контрольных мониторах среднего и дальнего поля. Доверять аналогичную функцию автомату в реальном времени и говорить о превосходстве над студийным результатом — самонадеянно. В финальной же стадии мастеринга проходит этап формирования психоакустического распределения шумов дизеринга (нойз-шейпинг), что на слух превращает 16-битную запись в 20-битную, так что остаётся лишь побитно переслать запись на входной интерфейс ЦАПов. Любое вмешательство в этот процесс пагубно отражается на качестве, и уж из MP3-записи первоначальную фонограмму превзойти никак не удастся, а многополосная компрессия может до неузнаваемости исказить тональный баланс и привести к перераспределению энергетики сигнала, что вызовет перегрузку на высоких или низких частотах.

Другое дело, если мы ведём разговор о посредственной бытовой акустике с ограниченным динамическим диапазоном и ущербной АЧХ, так что даже самый примитивный регулятор тембра субъективно существенно повышает комфортность восприятия. В таком случае дополнительная полосовая компрессия высоких и низких частот облегчает восприятие фонограммы через данные конкретные колонки, особенно в сочетании с умеренно поджатой исходной фонограммой, с меньшей агрессивностью (соотношение пиковой мощности к среднему значению). В этом случае итоговые искажения от обработки не превзойдут искажения воспроизводящего тракта.

Так и обстояло дело на практике. На недорогих активных стереоколонках некоторые записи субъективно звучали разборчивее, хотя и c большей агрессией. На качественной акустике (студийных мониторах и Hi-Fi колонках среднего класса) я без труда нашел несколько MP3, а также оригинальных CD, качество которых Crystalizer существенно ухудшал, так что была слышна перегрузка, либо звук делался излишне агрессивным, что приводило к быстрому утомлению от прослушивания.

При измерениях выяснилось, что кроме многополосной компрессии сигнала осуществляется поднятие уровня примерно на 3 дБ. Так что любые тихие записи будут казаться субъективно лучше даже без действия компрессора.

Таким образом, 24-bit Crystalizer пойдет на пользу обладателям недорогой акустики или бюджетных наушников, что практически автоматом означает недостаток НЧ и ВЧ, а также проблемы с детальностью СЧ. Для обладателей качественной акустики хорошая новость в том, что данная технология легко отключается.

Технология 24-bit Crystalizer вполне имеет право на жизнь, однако сама подача, с выдачей желаемого за действительное, совершенно не радует. В реальности Crystalizer не расширяет, а сужает динамический диапазон, а 24 бита действительно используются, но только для того, чтобы не накапливалась ошибка округления (это нормальная практика, ни один современный DSP не работает в том же разрешении, что и исходные данные).

СMSS-3D

Технология CMSS-3D призвана решить основную проблему молодого поколения пользователей многоканальных звуковых карт: "У меня 5.1 набор колонок. В фильмах всё классно, но в MP3 играют только 2 фронтальные колонки! А я хочу, чтобы все!!!"

Как было сказано выше, технология CMSS (Creative Multi Speaker Surround) обновлена до CMSS-3D. Используются разработки и патенты IRCAM, UC Davis, Aureal, Sensaura и Creative's Advanced Technology Center.

CMSS-3D виртуализирует источник звука любой канальности на любое устройство, таким образом, обеспечивается:

CMSS-3DHeadphone: объемное звучание в наушниках;
CMSS-3DVirtual: объемное звучание в стереоколонках;
CMSS-3DSurround: конвертация стерео в многоканальный звук;
CMSS-3DInteractive: 3D-звук из нескольких источников.

Тестирование проводилось в наушниках Sennheiser HD600. Была выявлена проблема двойного наложения эффектов виртуализации, с ухудшением эффекта объемности. Дело в том, что все музыкальные записи последних лет уже содержат в той или иной мере расширение стереопанорамы, так что результат может оказаться неожиданным.

В то же время, демонстрационный файл "The Rising of the Sun" с CD "Essential Anuna", содержащий практически сырое стерео, показал хорошие результаты, и даже превосходство над технологией DolbyHeadphones.

Помимо музыки, технология CMSS-3D может использоваться и в играх. В этом случае игра рассчитывает трехмерный звук на 5.1 колонки, а CMSS-3DHeadphone преобразует многоканальный звук в объемное звучание в наушниках.

X-RAM

В отличие от карт прошлых десятилетий, набортная память X-Fi используется не для MIDI-семплов, а для хранения или кэширования звуков во время работы игровых приложений. Существует проблема с дефицитом оперативной памяти, так что разработчики либо снижают разрядность семплов до 8 бит 11 кГц, что на порядок ухудшает качество, либо сжимают в форматы с потерями, MP3 или OGG, что ведёт к загрузке процессора при распаковке на этапе проигрывания сэмпла.

Таким образом, введение набортной памяти на звуковой плате позволяет: сэкономить основную память, ускорить доступ к памяти, устранить необходимость в декомпрессии в реальном времени, устранить потерю качества сэмплов, увеличить производительность графической части и величину FPS.

На сегодня существует лишь одна игра с полноценной поддержкой X-RAM. Это недоступная пока для широкой аудитории UT2004 X-Fi Edition. Мы предлагаем ознакомиться с результатами, предоставленными Creative. Как видно, внедрение X-RAM может увеличить производительность до 20%, что эквивалентно апгрейду графического ускорителя, при этом ещё и вырастет качество звука! Однозначно полезное нововведение.

UT2004 X-Fi Edition

Тесты в RMAA 5.5

Мы не можем удержаться от публичного цитирования мануала Creative для журналистов, тестирующих X-Fi.

"Как уже было сказано, Creative разработал семейство Sound Blaster X-Fi, в первую очередь, заботясь о качестве звука. Для достижения этой цели, мы подошли к тестированию очень серьезно. Однако мы осознаем, что не все журналисты имеют доступ к аппаратуре “Audio Precision”, промышленному стандарту тестирования профессиональной аудиоаппаратуры. Мы видим, что многие используют для тестов качества аудиоаппаратуры “RightMark Audio Analyzer” из-за его доступности и симпатичного интерфейса. Однако из-за разницы в методиках между этими двумя платформами, их результаты будут различными. В прошлом, мы получали некоторые вопросы об этих различиях, так что мы хотим показать заготовленные результаты и тестовые методики как для Audio Precision, так и для RMAA. Мы надеемся, вы найдете в них для себя что-то полезное".

Инструкцию от Creative по установкам карт X-Fi для измерения в RMAA можно скачать на официальном сайте audio.rightmark.org.

Результаты тестов Audio Precision

		Sound Blaster X-Fi XtremeMusic/ Platinum/ Fatal1ty FPS	Remark
Digital Playback	Frequency Response	Lo –1dB <10 Hz Hi –1dB ≈ 45kHz	PCM: 24-bit/96kHz, 997Hz Output : 2Vrms N.B. "Digital Playback" refers to the fact that only the quality of the line-out is tested using a digital source file. It is not a test of the digital outputs
	Cross-talk	L-R: -105 dB R-L: -105dB
	Signal to Noise Ratio (SNR)	109 dB
	Total Harmonic Distortion + Noise (THD+N)	0.004 %
Line-IN / Line-OUT Record & Playback	Frequency Response	Lo –1dB ≈ ~17 Hz Hi –1dB ≈ 42 KHz	PCM: 24-bit/96kHz, 997 Hz Input : 2Vrms Output : 2Vrms
	Cross-talk	L-R: -86 dB R-L: -86 dB
	Signal to Noise Ratio (SNR)	98 dB
	Total Harmonic Distortion + Noise (THD+N)	0.004%

		Sound Blaster X-Fi Elite Pro	Remark
Digital Playback	Frequency Response	Lo –1dB <10 Hz Hi –1dB ≈ 46kHz	PCM: 24-bit/96kHz, 997Hz Output : 2Vrms N.B. "Digital Playback" refers to the fact that only the quality of the line-out is tested using a digital source file. It is not a test of the digital outputs.
	Cross-talk	L-R: -112 dB R-L: -112dB
	Signal to Noise Ratio (SNR)	116 dB
	Total Harmonic Distortion + Noise (THD+N)	0.0008 %
Line-IN / Line-OUT Record & Playback	Frequency Response	Lo –1dB < 10 Hz Hi –1dB ≈ 45 kHz	PCM: 24-bit/96kHz, 997 Hz Input : 2Vrms Output : 2Vrms
	Cross-talk	L-R: -106 dB R-L: -106 dB
	Signal to Noise Ratio (SNR)	112 dB
	Total Harmonic Distortion + Noise (THD+N)	0.001%

Результаты тестов RMAA 5.5

Sound Blaster X-Fi Elite Pro

	SB0550 [16/44.1]	SB0550 [16/48]	SB0550 [24/48]	SB0550 [24/96]
Frequency response (from 40 Hz to 15 kHz), dB:	+0.01, -0.07	+0.01, -0.07	+0.01, -0.07	+0.01, -0.07
Noise level, dB (A):	-94.8	-95.1	-113.0	-113.3
Dynamic range, dB (A):	94.7	95.1	112.8	112.5
THD, %:	0.0009	0.0009	0.0007	0.0007
IMD + Noise, %:	0.0051	0.0049	0.0010	0.0010
Stereo crosstalk, dB:	-95.1	-95.5	-102.7	-102.8

Sound Blaster X-Fi XtremeMusic
Sound Blaster X-Fi Platinum
Sound Blaster X-Fi Fatal1ty FPS

Test	SB0460 [16/44.1]	SB0460 [16/48]	SB0460 [24/48]	SB0460 [24/96]
Frequency response (from 40 Hz to 15 kHz), dB:	+0.02, -0.08	+0.01, -0.09	+0.01, -0.09	+0.02, -0.17
Noise level, dB (A):	-94.1	-94.5	-102.1	-102.2
Dynamic range, dB (A):	94.0	94.3	101.6	102.0
THD, %:	0.0009	0.0009	0.0008	0.0008
IMD + Noise, %:	0.0057	0.0054	0.0026	0.0025
Stereo crosstalk, dB:	-97.0	-94.5	-101.5	-98.6

Сравнивая результаты тестов RMAA loopback vs. AP loopback, хочется отметить, что расхождение составляет единицы процентов, что обусловлено различием алгоритмов подсчета. В последней версии 5.5 было соблюдено максимальное соответствие существующим международным стандартам (при этом в RMAA использует более точные вычисления, чем требуется по стандарту). Учитывая килобаксовую стоимость Audio Precision и бесплатность RMAA, можно вполне рекомендовать программу для проверки заявленных производителем паспортных данных. Значение THD+N следует брать из детального отчета RMAA.

Из тестов интерес представляют лишь графики искажений.

THD карты SB0550

IMD (DIN) карты SB0550

IMD (CCIF) от частоты SB0550
Spectrum graph

IMD (CCIF) от частоты SB0460

Судя по измерениям, проблема с большим количеством искажений — дело прошлого. Режим 44.1 кГц в картах X-Fi ничем не отличается от 48 кГц.

Тест качества аппаратного SRC

Интересно сравнить качество нового аппаратного SRC X-Fi против распространенного real-time SSRC плагина MP3-плеера WinAmp, отличающегося довольно высоким качеством и прилично нагружающего CPU.

IMD (CCIF) vs. frequency

IMD (DIN)

Reference 16/44 — анализ сгенерированного тестом файла исходных данных; показывает максимально достижимое качество для 16-битного формата.
X-Fi HW SRC OFF — отключение аппаратного SRC у X-Fi достигнуто путем установки опорного режима 44,1 кГц и опции Enable Bit-Matched Playback.
X-Fi HW SRC ON — включение аппаратного SRC у X-Fi получено путем проигрывания 44,1 кГц файла при установленном опорном режиме 48 кГц и отключении Enable Bit-Matched Playback.

WinAmp SSRC plug-in — проигрывание файла 44,1 кГц в WinAmp с установленным SSRC плагином, настроенным на пересчет в 48 кГц, при этом — у карты опорный режим 48 кГц и опция Enable Bit-Matched Playback.

Как мы видим, SRC карты превосходит SSRC плагина, а видимые по диаграмме искажения от его включения отсутствуют.

RightMark 3DSound

Специально для сравнения с производительностью OpenAL за несколько дней до анонса статьи мы разработали новую версию теста RM3DS 2.0. Спешим поделиться результатами:

Диаграмма умышленно построена в масштабе 100%, чтобы показать — разница, даже в несколько раз, при малом количестве буферов несущественна, а включение EAX в режиме 3D обходится практически бесплатно.

OpenAL API опережает DirectSound за счёт более прямого доступа к железу и оптимизации комплектной библиотечки CT_OAL.DLL (Creative OpenAL Driver, 5.12.1.1141) исключительно под X-Fi. Исключение составляет режим 2D. Но, в этом режиме OpenAL вероятнее всего использоваться не будет, да и скорость там непринципиальна. Скорее всего у OpenAL 2D — это 3D с фиксированными координатами. Загрузка одинакова:

Игры

Как уже упоминалось, Creative имел возможность протестировать X-Fi на специальной версии UT2004 с поддержкой 128 голосов. Не могу не привести результаты:

Realtek HD Audio: 7.1 Audio, EAX 2.0, 32 Voices
Sound Blaster Live!: 5.1 Audio, EAX 2.0, 32 Voices
Sound Blaster Audigy: 7.1 Audio. EAX 3.0, 32 & 64 Voices, CMSS-3D
Sound Blaster X-Fi: 7.1 Audio, EAX 3.0, 32, 64 &128 Voices, X-Fi CMSS-3D, X-Fi 24-bit Crystalizer

Итак, в UT2004 разница между HDAudio и X-Fi на 32 голосах достигает 17%, при лучшем качестве звука и включенных CMSS-3D и 24-bit Crystalizer. Конфигурация компьютера вполне средняя: P4-3.4, 1 Гб, GeForce 6600.

Из реальных игр, прямая поддержка X-Fi есть пока лишь в Battlefield2 (даже в демо-версии!), реализованная через OpenAL. При наличии карты, в звуковых опциях можно выбрать отдельный пункт Creative X-Fi, EAX и Ultra High настройку звука. В этом случае задействуется набортная память для кэширования семплов и ускорения обсчета звука. Надо сказать, что семплы в этой игре в основном среднего качества, многие 22 кГц, плюс пожаты в OGG с переменным битрейтом 100 кбит/с. Так что при выбранной опции X-Fi и активации EAX звук заслуживает оценку "Очень хорошо", но не "Отлично" из-за отвратительного качества семплов. Намного интереснее слушается звук в Doom3 с патчем 1.3, включающим EAX4.

Мы провели свои измерения в Battlefield2 с помощью хакерского мода. Использовалась система P4 3.4 ГГц, 1 Гб DDR400, ATI X800, настройки графики 800×600, Medium. Режим Creative X-Fi + EAX ON + Ultra High дал 52 FPS, по сравнению с режимом Hardware + EAX OFF + Medium, который показывает 55 FPS. Таким образом, различие в производительности между режимами с максимальными и средними настройками не превышает 5%, за что нужно сказать спасибо быстрому и мощному процессору карты. И это при таких настройках видео, когда производительность ещё не упирается в видеокарту. В игровых же разрешениях можно смело выставлять звук на максимум.

По результатам тестирования реального продукта новому процессору
Creative X-Fi присуждается награда iXBT.com Original Design

Продолжение следует…

Creative SoundBlaster X-Fi

новое поколение процессоров и звуковых карт Xtreme Fidelity

Что такое Xtreme Fidelity?

Ретроспектива

Архитектура X-Fi

SRC

Возможности X-Fi

Сравнение

Звуковые карты Sound Blaster X-Fi

Sound Blaster X-Fi Elite Pro

Режимы

Развлекательный режим

Игровой режим

Диагностика RightMark 3DSound 2.0

OpenAL:

DirectSound:

Режим создания музыки

24-bit Crystalizer

СMSS-3D

X-RAM

Тесты в RMAA 5.5

Результаты тестов Audio Precision

Результаты тестов RMAA 5.5

Sound Blaster X-Fi Elite Pro

Sound Blaster X-Fi XtremeMusic Sound Blaster X-Fi Platinum Sound Blaster X-Fi Fatal1ty FPS

Тест качества аппаратного SRC

RightMark 3DSound

Игры

Sound Blaster X-Fi XtremeMusic
Sound Blaster X-Fi Platinum
Sound Blaster X-Fi Fatal1ty FPS