Методика измерения аудиотрактов звуковых карт

 

В данном документе приводится методика измерения аудиотрактов звуковых карт, используемая в обзорах раздела Мультимедиа на сайте iXBT.com.

Некоторые общие пояснения технических терминов можно найти в нашем FAQ по звуку. Для более глубокого понимания нижеизложенного можно воспользоваться следующими документами: FAQ по цифровому представлению звуковых сигналов, Personal Computer Audio Quality Measurements.

Для количественной оценки технических параметров качества звучания используется программа SpectraLab 4.32.14 (www.soundtechnology.com). Спектрограммы тестов на нелинейные искажения и шумы получаются при подаче на вход эталонного синусоидального сигнала частотой 1 кГц. Тестовый синусоидальный сигнал с амплитудой -3 дБ был получен в wav-редакторе CoolEdit 2000 генератором синусоидального сигнала Generate/Tones.

Для измерений характеристик, получаемых при прохождении сигнала по внешнему пути аудиотракта карты — из линейного выхода в линейный вход (external loopback), был применён шнурок длиной 10 см из раздельно экранированных микрофонных проводов d=6 мм. На его концах были распаяны позолоченные разъемы миниджек производства Тайвань, немного расточенные с торца.

Немного теории

Действие программы SpectraLab основано на FFT (Fast Fourier Transform — быстром преобразовании Фурье). Вспомним формулу прямого преобразования Фурье:

              (1)

где — непрерывная функция на входе, например .

A — амплитуда сигнала, например 1 Vrms, — частота, например 1000 Гц.

На её основе вводится формула дискретного преобразования Фурье:

         (2)

где — дискретные значения непрерывной функции f (i) в точке i, N — количество точек, — частота.

При этом мы можем выбирать как узкий диапазон частот для более точного исследования, так и всю доступную полосу, которая, согласно теореме Котельникова, не может превышать половину частоты дискретизации. Для максимальной производительности выбирают N, являющееся степенью числа 2 (в программах обычно предлагается ряд от 28 до 216 ).

Какие методические погрешности мы получаем? Самая большая неприятность — это рассеяние. То есть при подаче синусоиды вместо такой картинки в идеале:

возникает немного другая:

Это "просачивание" сигнала на соседние частоты спектра в английской терминологии носит название leakage. Такова плата за realtime в измерениях, который мы имеем используя FFT. То есть искажению подвергается даже представление идеального файла с чистой синусоидой, что делает невозможным определение по графику истинного значения спектрального распределения шумов на реальном сигнале.

Методы представления результатов FFT (smoothing windows)

Но не всё так плохо. В зависимости от преследуемых целей результаты могут быть представлены в соответствии с одним из методов, указанных в таблице:

Метод представленияТочность передачи по частоте спектраТочность передачи амплитудыУменьшение размытияГде применяется
BartlettПлохоПлохоСредне 
BlackmanПлохоХорошоПревосходноИзмерение искажений (distortion)
FlattopОчень плохоПревосходноСреднеТочные измерения значений амплитуды
HammingПлохоПлохоПлохо 
HanningПлохоПревосходноПревосходноИзмерение искажений и шумов
KaiserПлохоПлохоОчень плохо 
ParzenПлохоПлохоОчень плохо 
TriangularПлохоПлохоОчень плохо 
Uniform(неизменённое представление)ПревосходноОчень плохоОчень плохоТочные измерения значений частоты пиков, анализ импульсов

Из приведённой таблицы видно, что в реальной жизни хватит всего 2-х методов: по Ханингу (Hanning) и обычного представления (Uniform). Принцип действия всех этих методов заключается в подборе такой сложной функции, которая бы дала нам оптимальный вид зависимости амплитуды от частоты.

Режимы работы с программой

Для переключения режимов работы служит меню Mode:

Real Time — измерения в реальном времени, Recorder — запись и обработка файлов, Post Process — постообработка, в которой имеется возможность использования перекрытий (FFT overlap) для более точного измерения.

Перейдём в режим Recorder и откроем тестовый файл — синусоиду с частотой 1 кГц. Нажав клавишу F4 или выбрав пункт меню Option/Settings, попадаем в настройки и устанавливаем необходимые параметры. Следует обратить внимание на частоту обработки. Если она отличается от частоты семплирования, неизбежны значительные нелинейные искажения от передискретизации.

ВНИМАНИЕ! Не рекомендуется использовать входящий в комплект SpectraLAB тестовый файл синусоиды 1 кГц 44100 Гц при измерении характеристик карт в режиме семплинга 48000 Гц.

Averaging Settings - округления по сериям измерений. FFT size — число N из формулы (2). Peak Hold — фиксировать пики — необходимо только для показа "потолка", так как измерения искажений и шумов в этом режиме получаются некорректными. Decimal Ratio — позволяет уменьшить выборку по частоте. Для исключения "пульсаций" АЧХ при максимальном FFT size следует уменьшить значение этого параметра до 32768 (можно предположить следующее: поскольку численное интегрирование очень чувствительно к шагу, деление на 216 в формуле (2) значительно ухудшает точность и устойчивость численного метода).

Особенности выбора тестового сигнала

Создадим стандартный синусоидальный сигнал 1 кГц амплитудой 0 dB (амплитуда считается относительно максимального сигнала без перегрузки для 16-битной разрядной сетки). Сигнал для тестов точно под "0" — не очень хороший выбор (исключая рекламные проспекты). Реально на студиях никто не нормализует музыкальный материал таким образом — всегда оставляют некоторый запас "сверху" (headover). Это происходит по разным причинам. И одна из них такова: старший бит несёт информацию о половине амплитуды сигнала, ошибки при считывании CD-DA интерполируются через двойной каскадный код Рида-Соломона, и при нормализованном под "ноль" сигнале щелчки со временем "эксплуатации" будут слышны все чаще и чаще. Для получения более реальных характеристик разумно использовать для измерений файл с уровнем -3dB.

Ровный спектр шумов при почти полном отсутствии гармоник идеально подходит в качестве эталонного сигнала.

Измеряемые параметры

Коэффициент нелинейных искажений (Total Harmonic Distortion, THD). Равен квадратному корню отношения суммы мощностей всех гармоник, кроме основной, к мощности основного колебания. Согласно установившейся практике подаётся сигнал частотой 1 кГц максимальной амплитуды. Характеризует нелинейность и обычно сильно зависит от частоты. Измеряется в процентах. Для цифровой техники при выходе цифрового сигнала за разрядность цифровой сетки (например, при высоких положениях регуляторов громкости в микшере или некорректных алгоритмах) характерно скачкообразное увеличение значения THD.

Отношение сигнал/шум (Signal to Noise Ratio, SNR). Показывает превышение амплитуды выходного сигнала над среднеквадратичным значением мощности шумов. Вычисляется вычитанием упомянутых величин в децибелах, поэтому является размерной величиной. Очень актуален для аналоговых устройств и АЦП/ЦАП. Так как уровень воздействия шумов на человека зависит от спектра самого шума, то для учёта субъективного восприятия (а иногда и в маркетинговых целях) применяют стандартную сетку А-взвешивания. При этом рядом с параметром должно быть указано А-weighting. Цифровые шумы не подчиняются закону геометрического сложения, как аналоговые.

Для совместной оценки шумов и искажений также измеряют полный коэффициент гармоник с учётом шумов (THD+N). Он объединяет в себе значения двух вышеописанных параметров.

Реальный сигнал включает в себя частоты, на порядок отличающиеся друг от друга по значению. Вследствие нелинейности звукового тракта могут образовываться паразитные модуляционные гармоники, делающие звук неестественным и неприятным. Для учёта такого влияния вводят коэффициент взаимной модуляции (InterModulation Distortion, IMD).

АЧХ, или амплитудно-частотная характеристика (AFC, amplitude-frequency characteristic). Представляет собой график в координатах амплитуды от частоты, построенный измерением амплитуды на выходе системы при подаче гармонического сигнала обычно представляющего собой "плавающий" синус (swept sine) с постоянной амплитудой. В идеале этот график должен быть прямой линией, при этом имеет значение не абсолютное соответствие референсному сигналу, а отклонение от наиболее ровного участка. Позволяет судить о том, насколько верно передаётся амлитуда сигнала на различных частотах спектра. При необходимости корректируется многополосным эквалайзером. К сожалению, аналоговые эквалайзеры привносят гораздо более неприятные на слух по сравнению с частотными фазовые искажения. Необходимо отметить, что цифровые эквалайзеры, работающие не в реальном времени, не вносят фазовых искажений в сигнал.

Мощность шумов квантования при оцифровке может быть уменьшена на несколько дБ за счёт оверсемплинга и последующей фильтрации неслышимых частот, что широко применяется в кодеках и ЦАП-ах. Упомянуто это для объяснения технологической необходимости установки фильтра высокого порядка (означающего спад АЧХ на высоких частотах). Однако создать идеальный фильтр (и дешевый, и эффективный) трудно, поэтому разработчики часто "залезают" даже в слышимую область спектра. Влияния подобного рода инженерных решений на качество звука нужно оценивать в каждом конкретном случае предельно аккуратно.

О применимости данной методики и корректности результатов измерений

В статье SB Live! и домашняя звуковая студия приводятся сравнение параметров аудиотракта звуковой карты SBLive!, полученных на измерительном комплексе Audio Precision, с таковыми у профессиональных и полупрофессиональных карточек. Данные, полученные нами с помощью программы SpectraLab 4.32.14, отличались от указанных в статье не более чем на 1,5%.

В любом случае наша цель состоит не в получении абсолютных значений, а в сравнении параметров звуковых карт между собой по одной и той же методике, в  одних и тех же условиях. И что самое важное — результаты измерений хорошо согласуются с независимыми слуховыми экспертными оценками на качественном аудио-оборудовании.

В наших планах стоит улучшение и развитие данной методики измерений. Комментарии и поправки от квалифицированных специалистов в данной области приветствуются.

 

24 декабря 1998 Г.