Преобразуем в формат MP3


 

Чтение

CD-драйвы, имеющие особенность читать поток аудио данных с CD (Reading raw audio stream), могут использоваться с различными программами для "сдирания" аудио-треков. Причем, процесс чтения трека будет работать на любой машине, вне зависимости от скорости чтения CD-драйва, скорости самой машины, скорости ее периферии и загруженности процессора. Это очень удобно и еще по одной причине, о которой будет рассказано ниже. Поэтому стоит при покупке CD драйва обратить внимание на наличие этой особенности. Причем совсем необязательно, чтобы CD-драйв был новейшей разработкой в своей области. Качественные драйвы (например TOSHIBA XM-3401) выпускались с этой особенностью и с 1992 года. Вот далеко не полный список CD драйвов, которые имеют эту особенность:

  • Apple 300,300i,300e(Sony CDU-8003,CDU-8003A,CDU-8012)
  • Apple CD300+
  • Chinon CDS-535
  • COMPAQ CR503/CDU561
  • DEC RRD42
  • Goldstar GCDR-540 IDE
  • HP 4020
  • Nakamichi MBR7
  • NEC CDR 200, 300, 400, 500, 600, 900 series
  • NEC CDR 84-1/74-1 (только со спец. BIOS)
  • Panasonic CR-562B/563B/572/574/581
  • Pinnacle RCD1000/5030 (у 5040 BIOS не поддерживает!)
  • Pioneer 124/624 Plextor 4Plex/6Plex
  • Sanyo C3G IDE
  • Sony CDU-561, CDU-31A, CDU-33A, CDU-55S, CDU-55E, 76E/76S
  • Toshiba XM3301 (Silicon Graphics)
  • Toshiba XM3401, XM4101, 3601, 5302
  • Hitachi
  • Matshita (Panasonic) 503
  • Yamaha CDR100/102
  • Kodak PCD225,6x/Philips CDD522/Plasmon RF4100/JVC XRW2001.

Существует много программ для "сдирания" аудио треков.

CDDA

работает только с CD-драйвами у которых есть способность Reading raw digital audio ('da2wav')

CDGRAB

до предела проста, и позволяет преобразовывать аудио-треки в WAV формат с CD-драйвов и не имеющих особенности чтения DA ('cdgrab'). Но здесь имеется "подводный камень" — если чтение будет производиться с CD драйва без поддержки digital audio, то в получившемся WAV-файле будут присутствовать специфические щелчки и качество будет заметно хуже. Это, к тому же будет зависеть от скорости машины, периферии и загруженности процессора, что не совсем удобно.

Кодирование

Следующим шагом к получению желаемого файла в формате mp3 будет обработка WAV программой l3enc. Так как преобразование может происходить с разным качеством — разумно выбрать соотношение качество/размер файла.

Достаточно хорошее качество при хорошем "сжатии" получается при параметрах: 128000 bit rate и ключом hq — high quality. В командной строке это будет выглядеть следующим образом:

l3enc -br 128000 -hq <input.wav> <output.mp3>

О том, почему были выбраны именно такие параметры, можно прочитать здесь.

Не лишним будет добавить о времени, необходимом на "свертывание". На P133 с 256kB кэша 65Mb преобразовывается с вышеуказанными параметрами около 55 минут (под ОС W95) в отсутствие других задач.

Вообще, существуют преобразователи и под Windows NT, 95. причем скорость преобразования на 2×PII (под Windows NT 4.0) приближается к реальному времени.

Так как сжатие при минимальной потере качества получается относительно хорошим — а это может быть от 1/11 и даже 1/13 — имеет смысл создавать собственные CD 'набитые' под завязку сжатыми треками. Если чистое audio занимает приблизительно 10Mb — 1 минута, то .mp3 в худшем случае (при хорошем качестве) занимает в 10-12 раз меньше, т.е. 1Mb — 1 мин. Таким образом на одном CD можно разместить 10 часов довольно качественного audio. Другими словами, как минимум 10-11 компакт дисков вмещаются в один.

Проигрывание

Так как не существует (пока) бытового "железа", способного на высокой скорости распаковывать (восстанавливать) mpeg, такие диски можно будет проигрывать только на компьютере. Причем не на самом плохом, так как скорость восстановления необходима высокая. Само-собой нужны "проигрыватели". (Минимальное требование — Pentium-75MHz).

… Я написал "бытового железа". А вот компания Audioactive представляет "Audioactive Internet Encoder". Дословно на их сайте написано так: "Устройство имеет 5 DSP (digital signal processor) для аудио. Улучшенное MPEG Layer 3 преобразование не занимает процессорного времени вашего компьютера, потому как он не нужен (компьютер). Профессиональные 18-битные АЦП гарантируют высочайшее качество звука при преобразовании." … ну, дальше там уже реклама..

Аудиовходы, как я понял там стандартные (линейные), а вот с выходами так: RS-232, X.25/V.35, или TCP/IP, через которые можно управлять параметрами оцифровки. И как я понял, готовый поток уже в MPEG может "вываливаться" наружу по вышеуказанным протоколам.

И их можно в стойку набирать, штук по пять.

Ну, а далее написано, что поток может декодироваться, всем, что декодирует MPEG Layer 3. Оно и понятно…

Программы проигрывания MP3

Постараюсь представить все проигрыватели, которые мне довелось поюзать. Конечно, все уже давно остановились на программе Winamp фирмы NullSoft. Все проигрыватели позволяют играть MPEG Layer 1,2,3.

museArc

по функция практически полностью аналогичен программе для проигрывания компакт-дисков. Но без искажений воспроизводит mp3 только на машинах класса Pentium. Может работать и на 486DX100, но только с потерей качества. Конечно, много зависит от операционной системы, скоростных показателей компьютера и загруженности процессора.

Winplay3

Очень"простой" проигрыватель файлов mp3 — широкоизвестный Winplay3 — минимально необходимый сервис, но он может играть без ощутимой потери качества и на машинах класса 486DX. И все равно, многое зависит от настроек компьютера и загруженности процессора.

WINAMP

Особенно "навороченный" новый проигрыватель файлов формата MP3 — WINAMP. Здесь есть даже графический эквалайзер!! Работа со списками и др. www.Nullsoft.com — там все есть, что надо и новые plug-in к этому чуду.

В любом случае, у формата mpeg Layer 1,2,3 для использования его вместо обычных Audio CD есть минус — воспроизведение пока "пожирает" довольно много процессорного времени. С другой стороны — огромная экономия объемов дискового пространства, а следовательно — денег. И не надо диски менять — зарядил один -и на весь день! :)

Выбор параметров для оцифровки и измерения

FIDOnet, эха RU.MPEG
From: Dmitry Kovalenko 2:5053/18.12 21 Jul 97 20:25:00
Subj : MP3 — измерения искажений. Так я вот тут померил, что смог и выдаю результаты на суд общественности:

Измерение уровня шума, вносимое компрессией MP3

Делалась контрольная WAV, длиной 20 секунд модулированной 100% сигналом частотой 0,1 Гц, стерео. Перегонялась в MP3 с качеством 64, 112, 128, 256 кбит, L3ENC -hq затем опять превращалась в WAV. Hовая WAV анализировалась путем сравнения с оригинальной. Тут даже пришлось новую методику сравнения изобретать, т.к. невозможно сделать разностную WAV из этих двух. MP3 оказывается немного сдвинута, относительно оригинальной WAV.

Странно, но факт, уровень шума почти не зависит от качества компрессии и составляет около -70 дб. Для примера замечу, что у подавляющего большинства звуковых карт уровень шума гораздо больше.

Сразу хочу заметить, это уровень шума присутствует на всем спектре частот, т.е. он не является частотно-зависимым. Этот одинакого влияет как на сигнал 440 гц, так и на 20 кгц.

Измерение частоты среза MP3

Делалась контрольная WAV, длиной 10 секунд модулированная 100% белым шумом. Для контроля был посчитан спектр этой WAV, это была прямая линия с отклонением не более ±1 дб. Запись делалась в стерео режиме. Первый раз в каждый их каналов (левый/правый) писался независимый от другого канала сигнал. Второй раз одинаковая информация писалась в оба канала. Анализ делался для 64, 112, 128 и 256 кбит.

После перегонок WAV -> MP3 -> WAV строился спектр полученной WAV. При любом уровне компрессии он имел вид ступенек. То есть, сначала шло ровное плато с отклонениями не более ±1 дб, а затем начиная с некоторой пороговой частоты происходило падения амплитуды. В приведенной ниже таблице показана частота среза и амплитуда падения сигнала на этой частоте относительно участка спектра, находящегося левее. В некоторых случаях замечено несколько ступенек. В таблице приведены цифры для каждой из ступенек.

кбит независимые каналы стерео моно сигнал в стерео режиме
256 21 кгц -22 дб 21 кгц -22 дб
128 16 кгц -2 дб, 20 кгц -28 дб 20 кгц -34 дб
115 15 кгц -33 дб 15 кгц -39 дб
64 9.5 кгц -45 дб,
ассимметрия каналов 3 дб
9.6 кгц более -30 дб,
ассимметрия каналов 3 дб

Выводы

  • уровень шума не зависит от уровня компрессии !!!
  • уровень шума MP3 можно не учитывать, так он лежит ниже уровня шума большинства звуковых карт. Основное искажение, вносимое MP3 — это подавление высоких частот
  • полоса частот, воспроизводимая MP3, сильно зависит от уровня компрессии
  • оптимальная уровнем компрессии можно признать 128 кбит, т.к. дальнейшее уменьшение уровня компрессии (256 кбит) практически не улучшает качество записи
  • замечено, что качество тем выше, чем более схожая информация находится в левом и правом каналах стерео записи. Однако, этот эффект весьма слаб. Услышать разницу в 2 дб на частоте выше 16 кгц не всякий сможет
  • при высоком уровне компрессии возникает перекос каналов. То есть, происходит изменение амплитуды одного канала относительно другого. Поэтому, уровень компрессии выше 115 кбит (то есть бит меньше, чем 115) можно использовать только в моно режиме

Приведенные результаты не претендуют на высокую точность. Частоты определялись с точностью до 0,5 кГц, а амплитуды до 1 дБ. Все WAV 44100, 16 бит, стерео.

Многие мне могут возразить, что отчетливо слышат разницу между оригиналом и MP3.

Сразу могу привести возможные ответы на данное высказывание:

  1. некорректно сравнивать звучание CD и запись сграбленную с него и сжатую в MP3. Сравнение можно производить только для сграбленной WAV и MP3, сжатой из этой WAV, прослушиваемой на одной и той-же звуковой карте не изменяя настроек звуковой карты
  2. слышать различие могут только люди, у который верхний порог чувствительности лежит выше 16 кгц. Большинство же не слышат такие частоты. Чтобы это проверить, следует сделать WAV частотой 16–20 кГц, и попробовать его услышать.
  3. не на любой фонограмме можно услышать различие 128 и 256 кбит. Значит, для большинства записей для уровня компрессии 128 кбит можно сказать, что он обеспечивает качество на уровне CD.

 

Дополнительно

iXBT BRAND 2016

«iXBT Brand 2016» — Выбор читателей в номинации «Процессоры (CPU)»:
Подробнее с условиями участия в розыгрыше можно ознакомиться здесь. Текущие результаты опроса доступны тут.

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.