Интервью Дейва Россума из Creative


 

Более чем миллион плат SB Live! продано за 4 месяца и, несомненно, это одна из лучших звуковых карт доступных сегодня на рынке. Недавно, наши партнеры с сайта ALive! взяли интервью у Дейва Россума (Dave Rossum), главной руководящей и направляющей силы стоящей за созданием этой карты. С любезного разрешения ALive! мы публикуем это интервью на русском языке, в котором Дейв Россум делится своими мыслями и отвечает на вопросы, которые волнуют всех владельцев SB Live!.

Вступительная часть: Разбивая лед…

1. Сначала немного о вас. Как глава научных разработок (Chief Scientist) Creative Labs, каковы ваши основные обязанности?

Прежде всего, я занимаюсь вопросами "интеллектуальной собственности", особенно теми, которые связаны со звуком. Мне приходится делать множество различных вещей — немного изобретать, немного помогать другим изобретателям, искать интересные технологии для дальнейшего приобретения, оценивать технологии и планировать технологические стратегии. Я занимаюсь интересными вещами и почти не волнуюсь о проблемах управления, бюджете и т.д. Также, я даю интервью и читаю доклады.

2. На ваш взгляд, внедрение какой технологической новинки принесло вам самое большое чувство удовлетворения за годы работы в Creative Labs?

С тех пор, как E-mu была куплена, я думаю, что реализация проекта процессора EMU10K1 в жизнь принесло мне наибольше удовлетворение. Может быть, это потому, что EMU10K1 был последней вещью, в которую я по-настоящему вложил свой труд в качестве разработчика. Тем не менее, я думаю, что некоторые вещи, которые сейчас за сценой (нет, я не могу сказать какие именно) могут в ближайшее время затмить собой реализацию EMU10K1.

3. Все мы слышали о существовании технологического центра Creative-Emu Tech Center. Расскажите о каком-нибудь самом интересном исследовании, которое проводит в настоящее время этот центр?

Одна из сложностей быть руководителем научных исследований заключается в том, что я не могу рассказывать о большинстве вещей, которыми я занимаюсь! Но среди некоторые проектов технологического центра, о которых публично заявлено я могу назвать технологию SoundFont, процессоры Emu8000 и EMU10K1, CQM, EAX и большая часть программ связанных с SB Live! и Live!Ware. У нас есть группы, которые работают по следующим направлениям: VLSI (СБИС, very large-scale integration), Advanced Music Synthesis (усовершенствованный музыкальный синтез) и 3D звук.

Звучание музыки… Музыка

1. Одна из самых ожидаемых модернизаций для музыкального сообщества это поддержка формата SF 2.1 (SoundFont 2.1). Можете ли вы назвать нам ориентировочную дату выхода этого обновления, и должны ли мы будем заплатить за это?

Среди разработчиков бытует шутка о том, что после завершения инженерной части продукта, все, что остается сделать, это "просто написать программное обеспечение". Конечно, программное обеспечение стало настолько сложным, что самая трудная часть буквально любой разработки это "просто написать программное обеспечение" и в данном случае все обстоит именно так. С другой стороны, для того чтобы эффективно реализовать поддержку SF2.1, нужно создать полностью новую структуру драйверов. Работающие над проектом инженеры могут сказать, что продукт будет в руках пользователей в третьем квартале 1999 года; более опытные менеджеры назовут срок более осторожно: вторая половина 1999 года. Так что я думаю, что вы можете рассчитывать увидеть готовый продукт в 99 году и, разумеется, мы будем стараться завершить все работы так быстро, как сможем.

Что касается того, надо будет платить за продукт или нет, мы называем это "деловым решением" ("business decision"), а это означает, что мы, как инженеры, не занимаемся такими вопросами. Поэтому я не могу ничего сказать по этому поводу.

2. Что будет после реализации SF2.1, что будет в новой версии формата SF? Многим музыкантам очень интересно узнать о планах Creative/Emu, как, впрочем, и принять участие в разработках.

В 1998 году, Creative принимала участие в общепромышленной инициативе по стандартизации формата файлов для загружаемых звуков. Конечным результатом стал новый стандарт называемый DLS-2, который был ратифицирован ассоциацией производителей (MIDI Manufacturers Association). Стандарт DLS-2 был также признан комитетом ISO в качестве части нового международного стандарта известного под именем MPEG-4. Microsoft также объявила о поддержке DLS-2, как части нового интерфейса интерактивной музыки DirectMusic.

Мы взяли лучшую часть SoundFont, творческую выразительность синтезатора E-mu и лучшую часть стандарта DLS, гибкий формат файлов для описания синтеза, а затем собрали отобранные части вместе и сделали один мощный стандарт. Самая приятная вещь для музыкантов заключается в том, что они теперь могут создавать свои произведения, используя один стандарт, который будет иметь широкую поддержку во всей индустрии. А в случае, если вас не устраивает наличие малого набора инструментария или приложений для DLS-2, вы можете создавать свои произведения, используя SoundFont, зная, что в будущем вы легко конвертируете их в формат DLS-2.

Внутри компании, мы называем DLS-2 именем "SoundFont 3", но будет ли это официальным названием или нет, я сказать не могу. Мы, несомненно довольны тем, что стандарт получил такое широкое признание, а также тем, что ключевая часть нашей оригинальной технологии SoundFont, позволяющая нам и в дальнейшем заниматься инновациями, остается в рамках стандарта.

3. Почти невероятно, чтобы Creative сделала публично доступными спецификации для программирования EMU10K1. Рассматривает ли Creative возможность предоставления этих спецификаций другим компаниям на условиях NDA (соглашение о неразглашении), с целью разработки для SB Live! дополнительных эффектов, механизмов синтеза и т.д.?

Конечно, для любой подобной договоренности потребуется принять во внимание множество факторов, но я могу сказать, что Creative будет продолжать начатые работы в этом направлении с другими компаниями. В настоящее время мы работаем с третьими фирмами с целью обеспечить поддержку продукта E-mu Audio Production Studio под операционными системами BeOS, MacOS и Solaris, так что такая возможность имеется. Но с другой стороны, поддержка третьей компании является тяжелой ношей. Это означает, что вы должны будете обеспечивать внешнюю поддержку для всего вашего инструментария разработчиков и, если вы хотите, чтобы их программное обеспечение работало с вашим программным обеспечением, вам придется написать стандарты, проводить тестирование и т.д. Словом, это не та вещь, на которую мы можем легко решиться. Тем не менее, если выгоды от принятия такого решения явно перевесят его цену, я уверен, что мы его примем.

4. Одной из функциональных возможностей, которая должна быть легко реализуема, является поддержка (возможно программная) второго wave-выхода. SB Live! уже имеет необходимый разъем (для тыловых колонок). Почему мы не можем использовать этот выход, чтобы получить четыре моно выходных канала (или два стерео)? Есть ли в планах Creative реализация такой возможности?

Мы получили такую просьбу от большого числа пользователей и рассмотрели возможность решения проблемы. Узкое место заключается внутри самой архитектуры DirectSound. В настоящее время, интерфейс DirectSound может единовременно адресовать лишь одно устройство вывода wave-out одной звуковой карте. В результате появляется необходимость в поддержке "виртуального" wave-out устройства. Мы будем и в дальнейшем продолжать совместные работы с Microsoft с целью исправить это положение, если структура DirectSound вообще может быть приспособлена для совместимости с таким методом.

DSP EMU10K1

1. Creative неоднократно подчеркивала, что EMU10K1 является очень гибким чипом с огромным неиспользованным потенциалом. Для некоторых это очень размытое понятие. Можете ли вы рассказать об этом "неиспользованном потенциале" чипа, за исключением того факта, что его легко перепрограммировать? С точки зрения текущего состояния дел, как много "потенциала" уже реализовано?

Так как мои основные знания и опыт относятся к аппаратной части, я часто поражаюсь невероятным вещам, которые программисты могут выжать из гибкой архитектуры. Поэтому в некотором роде, я не думаю, что можно сказать как много "потенциала" заложено в чип типа EMU10K1. Несомненно, возможность перепрограммировать чип является важным фактором; в любой момент вы можете изменить специализацию чипа, вы можете сделать массу невероятных вещей, о которых никогда и не помышляли. Другим фактором является тот факт, что существует множество функциональных возможностей, которые мы, разработчики аппаратной части, предусмотрели, но до которых еще не добрались программисты. Конечно, я не могу назвать эти функциональные возможности и тем самым помочь конкурентам. Тем не менее, если говорить откровенно, то я могу оценить текущее использование мощностей EMU10K1 программным обеспечением Live!Ware и EAX на уровне 50% от возможного.

2. Заявлено, что вычислительная мощность чипа EMU10K1 соответствует 1000 MIPS. С такой большой вычислительной мощностью, не должно быть никаких проблем с декодирование Dolby Digital звука с помощью карты SB Live!. Увидим ли мы реализацию этой возможности в ближайшем будущем или нет, потому что в результате могут снизиться продажи Desktop Theatre 5.1?

Вопреки разрекламированной гибкости EMU10K1 и его невероятной вычислительной мощности в значениях MIPS, аппаратное декодирования AC-3 звука не является тем, что наш чип может делать. Причина этого кроется в том, что мы разрабатывали EMU10K1 как "time domain" процессор, в то время, как декодирование Dolby Digital в наибольшей степени реализуется в виде "frequency domain". (Идея в том, что time domain процессор оперирует временными характеристиками сигнала, а frequency domain процессор оперирует частотными характеристиками сигнала). То есть, набор инструкций не подходит для такого типа операций.

3. Какое, по вашему мнению, положение занимает EMU10K1 при сравнении с Vortex2?

На самом деле Creative не считает возможным сравнивать эти два чипа, так как они базируются на двух совершенно различных философских принципах: модернизируемый, работающий под управлением инструкций звуковой DSP (EMU10K1) и специализированный звуковой ASIC (Vortex2) с жестко определенными функциями и с неизменяемым кодом. Creative потратила 10 лет на создание технологий, которые воплощены в EMU10K1 и, глядя в будущее, мы считаем, что выбрали верное направление развития. Используя EMU10K1, вы получаете такое же качество звука, как и у ASIC с жестко определенными функциями, но с гибкостью и возможностью модернизации, присущими DSP. Когда появляется потребность поддерживать новые технологии (такие, как EAX, WDM, DLS и т.д.) мы можем быстро добавить эту поддержку на аппаратном уровне без необходимости для конечного пользователя покупать новую плату. Таким образом, EMU10K1 обеспечивает все лучшее из обоих подходов.

3D звук: Кто это стоит у меня за спиной?

1. В январе в интервью журналу Maximum PC вы заявили, что Creative использует для воспроизведения 3D звука метод, основанный на восприятии человеком звука, в то время как Aureal предпочла использовать путь моделирования реальной физики пространства. Тем не менее, отзывы в сети и в журналах говорят о том, что технология A3D 2.0 от Aureal обеспечивает лучший позиционируемый звук, так чей же метод ошибочен?

Прежде всего, поймите, что "позиционируемый звук" (positional audio) является явлением, которое Aureal лишь совсем недавно сделала реальностью. Одним из главных преимуществ Environmental Audio является то, что в основе нашей технологии лежит опыт воспроизведения пространственного звучания, для создания которого недостаточно простого определения координат объектов. В частности, возможность использовать творческий подход при создании звука, вместо механического, была главным движущим фактором, который привел нас к выбору метода, основанного на восприятии слушателем звука. Наш метод отличается от подхода Aureal не только в том, что мы взяли за основу именно восприятие звука, но также в том, что мы решили уделить первостепенное внимание созданию звуковой среды, нежели совершенствованию нашей модели позиционирования, основанной на определении координат объектов. В результате, при сравнении "позиционируемого звука" без использования эффектов окружающей звуковой среды, наши ранние решения не всегда звучат так, как задумывалось. С помощью программы Live!Ware мы предлагаем улучшенные алгоритмы позиционирования звука, которые призваны решить эту проблему. К счастью интерфейс для создания позиционированного звука жестко связан с API DirectSound3D, поэтому пользователи SB Live! могут получить больше преимуществ от этих изменений, при использовании приложений, поддерживающих EAX 1.0 или даже просто DS3D.

Если же прямо отвечать на ваш вопрос, то ответ нет, мы совершенно уверены в том, что метод, основанный на восприятии, который мы выбрали, является лучшим, что полностью подтверждает ситуация на рынке. Тем не менее, очень важно понимать разницу между реализацией позиционируемого звука и теми выгодами, которые обеспечивает использование фундаментальных методов в интерфейсе звуковой среды окружения.

2. Объясняются ли недостатки воспроизведения 3D звука картой SB Live!, особенно его глубины, т.е. позиционирование по оси Z, недостатками DS3D или это проблема звукового движка? Услышим ли мы более качественный 3D звук в наушниках и через колонки в ближайшем будущем или мы ограничены возможностями DS3D?

У API DS3D нет проблем с позиционированием по оси Z, причиной всех недостатков является звуковой движок, конкретная конфигурация акустики или сам слушатель. Как я говорил ранее, нашим приоритетом было создание эффектов звуковой среды окружения, нежели совершенное позиционирование звука. Поэтому мы уже сделали массу улучшений в драйверах, и будем делать это и в будущем, с целью обеспечить правильное воспроизведение эффектов позиционирования звука, таких, как позиционирование источников звука в вертикальной плоскости (elevation). Но мне кажется, что всегда необходимо объяснять, чего стоит ожидать пользователям. Воспроизведение звука через колонки имеет существенные ограничения, и даже наушники, без контроля над положением головы, существенно ограничены в своих возможностях по воспроизведению позиционируемого звука. Поэтому, в то время как DS3D не ограничивает нас, некоторые пользователи могут быть разочарованы тем звучанием, которое воспроизводят их акустические колонки.

3. E-mu является известной музыкальной компанией, которая обеспечивает линию продуктов Sound Blaster своими чипами. В то же время, Aureal подчеркивает, что они имеют опыт 10 лет исследований и разработок в области 3D звука (NASA является самым часто используемым примером "ultra-high end" применения технологии Aureal). Вопрос следующий, имеет ли E-mu необходимый исследовательский и практический опыт, чтобы бросить вызов Aureal в области технологий 3D звук?

После того, как Aureal приобрела компанию Crystal River, она получила в свое распоряжение знания и опыт Скотта Фостера (Scott Foster), одного из пионеров в области 3D звука. Скотт многие годы является моим другом и NASA действительно спонсировала его разработку "Convolvotron", представлявшую собой первое поколение экспериментального движка виртуальной реальности, который поддерживал максимум четыре источника звука. В те времена эта разработка была верхом совершенства, сегодня она безнадежно устарела.

Я сомневаюсь, что между технологиями и алгоритмами Convolvotron и Vortex есть много общего, но думаю, что ранние разработки Скотта могли оказать слишком сильное влияние на точку зрения Aureal. Если судить по демонстрационным программам A3D 2.0, которые я видел и слышал, то, похоже, что при моделировании акустики всегда используются отдельные источники для каждого отражения звука. Это полностью перестает действовать при воспроизведении любого запаздывающего остаточного звучания при затухании звука, которое, как я считаю, является важнейшей частью для восприятия звука. Пытаясь использовать разработки Скотта в области позиционирования 3D звука для воспроизведения окружающей звуковой среды, они узнали, как мало они понимают в моделировании реальной акустики.

E-mu имеет 25 летний опыт создания оборудования для звуковых дизайнеров Голливуда, но в тоже время мы действительно по настоящему не занимались разработками классических технологий 3D звука. Вместо этого, мы прибегли к помощи опытных исследователей, таких, как Jean-Marc Jot (Жан-Марк Джот), который непосредственно занимался 3D звуком и собрал, как я считаю, отличную команду разработчиков с высоким потенциалом. А наши знания в разработке инструментария для звуковой индустрии помогают нам очень хорошо осуществлять интеграцию и поддержку этой команды.

Я гораздо менее озабочен нашим исследовательским опытом, чем текущим состоянием создания работающих стандартов, которые бы привлекали разработчиков для их поддержки (и хорошо их поддерживающих) и захватом выгодных позиций на рынке. Технология как таковая это самая легкая часть. Мы имеем массу предложений по приобретению дополнительных знаний и опыта в области 3D звука, но по моей оценке, главным ограничивающим фактором является внедрение.

4. Собирается ли в ближайшем будущем Creative внедрять алгоритмы HRTF для воспроизведения звука через множество (4/6/8) колонок?

Да. В следующих улучшениях драйверов, которые будут доступны через программу Live!Ware, мы собираемся обеспечить позиционирование звука в вертикальной плоскости и улучшить воспроизведение позиционируемого 3D звука через наушники, две колонки или несколько колонок. Эти улучшения будут включать бинауральные техники (основанные на алгоритмах HRTF) и других специализированных методах, разработанных в нашем Tech Center. Также в ближайшем будущем мы сделаем доступными для использования улучшенные драйверы, которые позволят использовать широкий набор конфигураций колонок, включая 8 выходных каналов.

5. DS3D моделирует все источники звуков в виде точечных источников, считая, что размер источника звука не имеет значения. Есть ли у вас какие-нибудь планы в связи с этим?

Это, несомненно, одна из нескольких проблем с моделью DS3D. Мы работаем с Microsoft над решением этой проблемы. Также мы работаем над тем, как реализовать звуковые эффекты, принимающие во внимание скорость звука (sonic effects). Сейчас слишком рано говорить о том, когда мы встроим решение этой специфичной проблемы в драйверы, но мы не оставим это без внимания. Для этого понадобится создать расширение для той части API, которая занимается позиционированием звука, а управление этим расширением можно возложить на EAX или на DS3D.

EAX: API, который мы выбираем

1. EAX 2.0 все еще не является полноценным звуковым API, так как он не обеспечивает позиционирование звука. Собирается ли Creative создать свой собственный звуковой API, который смог бы конкурировать с A3D 2.0?

Нет. По нашему мнению, DirectSound3D является правильным выбор в качестве API для позиционирования звука. Дублирование его функциональных возможностей в нашем собственном API было бы шагом назад с точки зрения стандартизации, без какой-либо выгоды. Хотя интерфейс DS3D несовершенен (см. ответы на вопросы выше), мы предпочитаем работать вместе с Microsoft над улучшением этого интерфейса, нежели чем над ослаблением стандарта. Тем не менее, мы уверены, что DS3D вместе с EAX 2.0 превзойдут по своим возможностям A3D 2.0.

2. Благодаря тому факту, что EAX является открытым API, становится возможным быстрый рост его поддержки промышленностью. Но это дает платам типа MX300 преимущества над SB Live!, так как последняя не может поддерживать специализированные интерфейсы, подобные A3D 2.0. Не думаете ли вы, что Creative сделала неверный ход в данном случае? Будут ли будущие версии EAX оставаться открытыми?

Я думаю, что продвижение EAX в качестве открытого API и работа по его промышленной стандартизации, без всяких вопросов является верным ходом Creative. В то время, как нашим недостатком считается, что мы не можем поддерживать A3D 2.0, на самом деле это недостаток Aureal, потому что ни не могут обещать разработчикам поддержку A3D на большинстве существующих платформ.

Результат использования стратегии открытого интерфейса вместо специализированного API очень сложно предсказать. Как вы можете помнить, специализированный стандарт Sound Blaster сослужил очень хорошую службу Creative, поэтому каждый понимает, что мы будем очень рады получить преимущества от использования специализированного интерфейса, если такая возможность представиться. Я ожидаю, что мы будем "скользить" на волне одобрения EAX, сохраняя определенные функциональные возможности закрытыми настолько долго, насколько нам это удастся, однако полное раскрытие всех возможностей интерфейса только увеличит движущую силу волны.

Aureal заявила о том, что они будут поддерживать EAX. Нам это льстит, но до сих пор нет никаких подтверждений тому, что они сдержат свое обещание. Не забывайте, что мы потребуем от них предоставить образцы для тестов на совместимость, и предполагаем, что они будут соответствовать всем необходимым заявленным требованиям для поддержки нашей технологии, поэтому мне представляется маловероятным, что мы увидим поддержку EAX от Aureal в ближайшее время.

3. Строго говоря, EAX 2.0 на самом деле не является интерфейсом, основанным на геометрии пространства. Если все обстоит именно так, каким образом производится динамический расчет окклюзии и обструкций в игровой среде?

Существуют функции интерфейса, которые сделаны для создания подобных эффектов. SDK, который мы предлагаем разработчикам, помогает им использовать эти эффекты естественным и простым способом. Слышимые эффекты предназначены непосредственно для создания интерактивности и динамики. Мы уверены, что наша роль, в качестве производителя Environmental Audio API, заключается в предоставлении тщательно сконструированных механизмов управления для манипулирования звуком напрямую (не через описание геометрии). Все остальное, — а именно, обнаружение наличия препятствий между источниками звука и слушателем или определение расположены ли они в одном помещении, — управляется более эффективно и более согласованно непосредственно геометрическим движком игры. Похоже, что разработчики согласны с нами в этом.

4. Существует недовольство тем, что переходы между различными установками EAX происходят слишком резко, следствием чего является ощущение неестественности. Ожидаются ли улучшения в этой области?

Это было тем, что больше всего мне не понравилось в ранних EAX играх. Это проблема будет решена с помощью выпуска улучшенных драйверов. Плюс к этому, разработчики становятся более умелыми при работе с EAX API и начинают использовать более продвинутые параметры для управления переходами между различными звуковыми средами. С помощью EAX 2.0 и будущих версий нашего интерфейса, реализация этих возможностей будет расширена введением дополнительными параметрами звуковой среды в API.

5. Будет ли EAX 2.0 иметь какие-нибудь новые функциональные возможности, кроме функций расчета окклюзии?

Кроме свойств окклюзии и обструкции (которые разработаны для воспроизведения эффектов препятствий или перегородок в помещении, расположенных между источником звука и слушателем), EAX 2.0 содержит несколько замечательных новшеств. Среди них более обширное управление реверберацией в помещении и параметрами отраженных звуков (включая размер помещения), а также улучшенная модель воспроизведения удаленных эффектов.

6. В играх, использующих EAX, на параметры реверберации влияет только окружающая среда, в которой находится слушатель, но не источники звука. Есть ли у вас какие-нибудь планы изменить такое положение дел в будущем?

На самом деле, в EAX 1.0, расстояние от источника звука до слушателя используется для автоматического регулирования интенсивности реверберации для каждого индивидуального источника звука. Без этого, воспроизведение звучания не было бы правдоподобным для более удаленных источников звука. В EAX 2.0 реализована более сложная дистанционная модель, которая также регулирует параметры ранних отраженных звуков для каждого источника звука индивидуально. В будущем, параметры ранних отраженных звуков для каждого индивидуального источника будут полностью доступны воздействию программистов.

7. Следующая информация извлечена из пресс-релиза от 17.11.97 — Creative представляет EMU10K1:

"EMU10K1 может обеспечить поддержку очень сложной технологии воспроизведения звука в реальном времени, аналогичную возможностям "ray-tracing" (расчет путей распространения световых лучей на основе геометрии пространства), которая реализована в профессиональных механизмах визуализации 3D графики…

EMU10K1 использует уникальную технологию E2M для разделения помещения, области или окружающей среды на математически представляемые части в виде размера, формы и свойств акустики. Кроме того, при разделении на части помещения или области, для находящихся в них объектов определяются X, Y и Z координаты. Далее происходит комбинирование свойств акустики и координат объектов, а затем для любого воспроизводимого звукового потока применяется серия цифровых алгоритмов, называемых фильтрами окружающей среды (environmental filters), в результате происходит точное воспроизведение реально существующей акустической окружающей среды с различными звуками и эффектами".

Можете ли вы разъяснить фразу о "возможностях ray-tracing" и то, каким способом используется E2M? Похоже, что обе эти технологии не вошли в EAX.

В то время, когда был написан этот пресс-релиз, мы все еще оценивали различные алгоритмы для поддержки в нашем интерфейсе звуковой среды окружения. Аналогия с "ray-tracing" была лучшим способом для описания результатов, которых мы хотели добиться, но в то же время эта аналогия совершенно неверно описывает то, как мы хотели добиться желаемых результатов. Так же, мы пришли к выводу, что ролью Environmental Audio API не может быть управление геометрией виртуального мира. Предложение использовать только модель, основанную на геометрии пространства, для создания звуковой окружающей среды возводит совершенно ненужные препятствия для звуковых дизайнеров. В EAX, мы выбрали метод управления отраженными звуками и параметрами реверберации в форме, которая очень подходит для звуковых дизайнеров, но все равно имеется возможность управления этими параметрами и через геометрический движок игры.

Раз уж вы затронули эту тему, дайте мне сказать немного умных слов. Aureal продвигает свою технологию "wave-tracing" проводя аналогию с графической технологией "ray-tracing". Проблема в том, что в отличие от света, звуковые волны не ведут себя как прямые лучи. Это просто: если вы поместите свою руку между вашими глазами и источником света, вы перестанете видеть свет, однако, если вы поместите свою руку между источником звука и ухом, вы все равно будете слышать большую часть звуков, распространяемых непосредственно (так же, как и отраженные звуки). Световые волны гораздо меньше, чем объекты окружающей среды и изменяются в пределах одного-двух диапазонов, в то же время, звуковые волны изменяют свою длину от нескольких дюймов до нескольких ярдов в пределах от одного до тысячи диапазонов. Действительно, в акустике используются некоторые техники распространения лучей, однако, когда размеры элементов концертного зала гораздо больше, чем длина большинства звуковых волн, эти принципы неприменимы. Вместо этого, для получения распространения истинного звучания в произвольном пространстве, вам необходимо разрешить выравнивание граничных условий. Такие задачи далеки от возможностей современных процессоров, но к счастью человеческое ухо может воспринимать только небольшую часть реального звука. Упрощенная реализация, базирующаяся на технике расчета распространения лучей имеет проблему, которая заключается в том, что реализация такой аналогии полностью неприменима для воспроизведения затухания запаздывающей реверберации, создавая вместо этого явно различимые артефакты, которые наносят больше вреда, чем пользы конечному выходному звуковому потоку!

Мы твердо уверены в том, что правильный метод моделирования звуковой окружающей среды для интерактивных звуковых развлечений требует двух уровней. На нижнем уровне должен располагаться полный и тщательно разработанный слой параметров звуковой окружающей среды, которые должны удовлетворять потребностям любого приложения. На верхнем уровне должен располагаться инструментарий, который позволяет графическому движку игры рассчитывать окклюзии и отраженные звуки, следовательно, эти явления могут интерактивно воспроизводиться через параметры звукового дизайна (для целого класса игр от первого лица, которые могут с пользой использовать такой метод). В результате, мы имеем все лучшее от двух миров — общий, дружественный интерфейс для дизайнеров звука, который применим для всех приложений и преимущества от использования динамичного расчета окклюзии и отраженных звуков способом, который не мешает полному контролю над конечным звучанием.

8. EAX часто попадает под критику Aureal за то, что обеспечивает воспроизведение лишь обыкновенной старой "консервативной" реверберации и "не является интерактивным". Как вы можете прокомментировать это?

Похоже, что это является наиболее обобщенной критической нападкой Aureal на нашу реализацию EAX. Исходя из того, что студийные устройства для создания высококачественной реверберации, могут стоить десятки тысяч долларов, я не совсем уверен в том, что означает фраза "обыкновенная старая консервативная реверберация". Я думаю, что лучшим ответом будет попросить людей послушать реализацию EAX и посмотреть, найдут ли они звучание окружающей среды содержательным и точным. В общем же, я согласен. Я должен признать, что уровень интерактивности при моделировании помещений был довольно скромным в EAX 1.0, но интерактивность будет существенно улучшаться с каждой новой версией.

SBLive!: Давайте вдохнем в него жизнь!

1. Насколько успешно идут продажи SB Live! с момента начала поставок?

С начала декабря 1998 года Creative продала более миллиона единиц Sound Blaster Live! и Sound Blaster Live! Value по всему миру. Внутри компании бытует мнение, что это были самые успешные поставки, со времен первой карты Sound Blaster. Также заслуживает внимания то, что эти поставки не включают ни одного OEM конструктива. Если же включить и их, то показатели взлетели бы до небес.

2. Что вы приготовили для SB Live! в 1999 году?

Первая область, в которой вы увидите улучшения, называется маркетологами "коробочным" событием для конечных пользователей. У нас есть большая команда, которая безостановочно работает над улучшением основного программного обеспечения , которое включает в себя вещи, типа реализации SF2.1, но и многое другое. Улучшениям подвергнутся и некоторые аспекты подключения внешних устройств. Ближе к концу года мы собираемся внести некоторые существенные изменения в само ядро звукового движка. Будьте наготове.

3. Слышали ли вы MX300 в действии? Что вы думаете об этой карте?

MX300 это звуковая карта с приемлемым качеством звучания, которая поставляется с несколькими хорошо сделанными демонстрационными программами. Тем не менее, недостаток реальных приложений, которые действительно могут использовать преимущества новых возможностей A3D 2.0, должно вызывать рост беспокойства у владельцев MX300. Я бы хотел также добавить, что по-моему, демонстрационные программы для Vortex 2, которые поставляются вместе с картой, на самом деле служат доказательством точки зрения Creative о том, что ощущения от окружающей звуковой среды не будет полным, если вы не воспроизводите остаточное затухание реверберации. Раздельные отраженные звуки сами по себе лишь в небольшой степени способствуют созданию впечатления реальности удаленных и окружающих источников звука.

В заключение, если вы хотите послушать голос Дейва Россума, то можете загрузить себе его 10 минутное интервью в формате mp3: dave.mp3 (2,4 МБ).

Замечание: Некоторые вопросы для этого интервью предложили парни с сайтов: 3D Sound Surge и HammerSound

Мы выражаем особую признательность Lee Ee Siang с сайта ALive! за оказанную помощь.

Оригинальную версию данного интервью. Вы можете найти на сайте ALive! (htgk.singnet.com.sg/alive/).

 

Дополнительно

Interview 2 with Dave Rossum from Creative Labs

Интервью Дейва Россума из Creative

 

Более чем миллион плат SB Live! продано за 4 месяца и, несомненно, это одна из лучших звуковых карт доступных сегодня на рынке. Недавно, наши партнеры с сайта ALive! взяли интервью у Дейва Россума (Dave Rossum), главной руководящей и направляющей силы стоящей за созданием этой карты. С любезного разрешения ALive! мы публикуем это интервью на русском языке, в котором Дейв Россум делится своими мыслями и отвечает на вопросы, которые волнуют всех владельцев SB Live!.

Вступительная часть: Разбивая лед…

1. Сначала немного о вас. Как глава научных разработок (Chief Scientist) Creative Labs, каковы ваши основные обязанности?

Прежде всего, я занимаюсь вопросами "интеллектуальной собственности", особенно теми, которые связаны со звуком. Мне приходится делать множество различных вещей — немного изобретать, немного помогать другим изобретателям, искать интересные технологии для дальнейшего приобретения, оценивать технологии и планировать технологические стратегии. Я занимаюсь интересными вещами и почти не волнуюсь о проблемах управления, бюджете и т.д. Также, я даю интервью и читаю доклады.

2. На ваш взгляд, внедрение какой технологической новинки принесло вам самое большое чувство удовлетворения за годы работы в Creative Labs?

С тех пор, как E-mu была куплена, я думаю, что реализация проекта процессора EMU10K1 в жизнь принесло мне наибольше удовлетворение. Может быть, это потому, что EMU10K1 был последней вещью, в которую я по-настоящему вложил свой труд в качестве разработчика. Тем не менее, я думаю, что некоторые вещи, которые сейчас за сценой (нет, я не могу сказать какие именно) могут в ближайшее время затмить собой реализацию EMU10K1.

3. Все мы слышали о существовании технологического центра Creative-Emu Tech Center. Расскажите о каком-нибудь самом интересном исследовании, которое проводит в настоящее время этот центр?

Одна из сложностей быть руководителем научных исследований заключается в том, что я не могу рассказывать о большинстве вещей, которыми я занимаюсь! Но среди некоторые проектов технологического центра, о которых публично заявлено я могу назвать технологию SoundFont, процессоры Emu8000 и EMU10K1, CQM, EAX и большая часть программ связанных с SB Live! и Live!Ware. У нас есть группы, которые работают по следующим направлениям: VLSI (СБИС, very large-scale integration), Advanced Music Synthesis (усовершенствованный музыкальный синтез) и 3D звук.

Звучание музыки… Музыка

1. Одна из самых ожидаемых модернизаций для музыкального сообщества это поддержка формата SF 2.1 (SoundFont 2.1). Можете ли вы назвать нам ориентировочную дату выхода этого обновления, и должны ли мы будем заплатить за это?

Среди разработчиков бытует шутка о том, что после завершения инженерной части продукта, все, что остается сделать, это "просто написать программное обеспечение". Конечно, программное обеспечение стало настолько сложным, что самая трудная часть буквально любой разработки это "просто написать программное обеспечение" и в данном случае все обстоит именно так. С другой стороны, для того чтобы эффективно реализовать поддержку SF2.1, нужно создать полностью новую структуру драйверов. Работающие над проектом инженеры могут сказать, что продукт будет в руках пользователей в третьем квартале 1999 года; более опытные менеджеры назовут срок более осторожно: вторая половина 1999 года. Так что я думаю, что вы можете рассчитывать увидеть готовый продукт в 99 году и, разумеется, мы будем стараться завершить все работы так быстро, как сможем.

Что касается того, надо будет платить за продукт или нет, мы называем это "деловым решением" ("business decision"), а это означает, что мы, как инженеры, не занимаемся такими вопросами. Поэтому я не могу ничего сказать по этому поводу.

2. Что будет после реализации SF2.1, что будет в новой версии формата SF? Многим музыкантам очень интересно узнать о планах Creative/Emu, как, впрочем, и принять участие в разработках.

В 1998 году, Creative принимала участие в общепромышленной инициативе по стандартизации формата файлов для загружаемых звуков. Конечным результатом стал новый стандарт называемый DLS-2, который был ратифицирован ассоциацией производителей (MIDI Manufacturers Association). Стандарт DLS-2 был также признан комитетом ISO в качестве части нового международного стандарта известного под именем MPEG-4. Microsoft также объявила о поддержке DLS-2, как части нового интерфейса интерактивной музыки DirectMusic.

Мы взяли лучшую часть SoundFont, творческую выразительность синтезатора E-mu и лучшую часть стандарта DLS, гибкий формат файлов для описания синтеза, а затем собрали отобранные части вместе и сделали один мощный стандарт. Самая приятная вещь для музыкантов заключается в том, что они теперь могут создавать свои произведения, используя один стандарт, который будет иметь широкую поддержку во всей индустрии. А в случае, если вас не устраивает наличие малого набора инструментария или приложений для DLS-2, вы можете создавать свои произведения, используя SoundFont, зная, что в будущем вы легко конвертируете их в формат DLS-2.

Внутри компании, мы называем DLS-2 именем "SoundFont 3", но будет ли это официальным названием или нет, я сказать не могу. Мы, несомненно довольны тем, что стандарт получил такое широкое признание, а также тем, что ключевая часть нашей оригинальной технологии SoundFont, позволяющая нам и в дальнейшем заниматься инновациями, остается в рамках стандарта.

3. Почти невероятно, чтобы Creative сделала публично доступными спецификации для программирования EMU10K1. Рассматривает ли Creative возможность предоставления этих спецификаций другим компаниям на условиях NDA (соглашение о неразглашении), с целью разработки для SB Live! дополнительных эффектов, механизмов синтеза и т.д.?

Конечно, для любой подобной договоренности потребуется принять во внимание множество факторов, но я могу сказать, что Creative будет продолжать начатые работы в этом направлении с другими компаниями. В настоящее время мы работаем с третьими фирмами с целью обеспечить поддержку продукта E-mu Audio Production Studio под операционными системами BeOS, MacOS и Solaris, так что такая возможность имеется. Но с другой стороны, поддержка третьей компании является тяжелой ношей. Это означает, что вы должны будете обеспечивать внешнюю поддержку для всего вашего инструментария разработчиков и, если вы хотите, чтобы их программное обеспечение работало с вашим программным обеспечением, вам придется написать стандарты, проводить тестирование и т.д. Словом, это не та вещь, на которую мы можем легко решиться. Тем не менее, если выгоды от принятия такого решения явно перевесят его цену, я уверен, что мы его примем.

4. Одной из функциональных возможностей, которая должна быть легко реализуема, является поддержка (возможно программная) второго wave-выхода. SB Live! уже имеет необходимый разъем (для тыловых колонок). Почему мы не можем использовать этот выход, чтобы получить четыре моно выходных канала (или два стерео)? Есть ли в планах Creative реализация такой возможности?

Мы получили такую просьбу от большого числа пользователей и рассмотрели возможность решения проблемы. Узкое место заключается внутри самой архитектуры DirectSound. В настоящее время, интерфейс DirectSound может единовременно адресовать лишь одно устройство вывода wave-out одной звуковой карте. В результате появляется необходимость в поддержке "виртуального" wave-out устройства. Мы будем и в дальнейшем продолжать совместные работы с Microsoft с целью исправить это положение, если структура DirectSound вообще может быть приспособлена для совместимости с таким методом.

DSP EMU10K1

1. Creative неоднократно подчеркивала, что EMU10K1 является очень гибким чипом с огромным неиспользованным потенциалом. Для некоторых это очень размытое понятие. Можете ли вы рассказать об этом "неиспользованном потенциале" чипа, за исключением того факта, что его легко перепрограммировать? С точки зрения текущего состояния дел, как много "потенциала" уже реализовано?

Так как мои основные знания и опыт относятся к аппаратной части, я часто поражаюсь невероятным вещам, которые программисты могут выжать из гибкой архитектуры. Поэтому в некотором роде, я не думаю, что можно сказать как много "потенциала" заложено в чип типа EMU10K1. Несомненно, возможность перепрограммировать чип является важным фактором; в любой момент вы можете изменить специализацию чипа, вы можете сделать массу невероятных вещей, о которых никогда и не помышляли. Другим фактором является тот факт, что существует множество функциональных возможностей, которые мы, разработчики аппаратной части, предусмотрели, но до которых еще не добрались программисты. Конечно, я не могу назвать эти функциональные возможности и тем самым помочь конкурентам. Тем не менее, если говорить откровенно, то я могу оценить текущее использование мощностей EMU10K1 программным обеспечением Live!Ware и EAX на уровне 50% от возможного.

2. Заявлено, что вычислительная мощность чипа EMU10K1 соответствует 1000 MIPS. С такой большой вычислительной мощностью, не должно быть никаких проблем с декодирование Dolby Digital звука с помощью карты SB Live!. Увидим ли мы реализацию этой возможности в ближайшем будущем или нет, потому что в результате могут снизиться продажи Desktop Theatre 5.1?

Вопреки разрекламированной гибкости EMU10K1 и его невероятной вычислительной мощности в значениях MIPS, аппаратное декодирования AC-3 звука не является тем, что наш чип может делать. Причина этого кроется в том, что мы разрабатывали EMU10K1 как "time domain" процессор, в то время, как декодирование Dolby Digital в наибольшей степени реализуется в виде "frequency domain". (Идея в том, что time domain процессор оперирует временными характеристиками сигнала, а frequency domain процессор оперирует частотными характеристиками сигнала). То есть, набор инструкций не подходит для такого типа операций.

3. Какое, по вашему мнению, положение занимает EMU10K1 при сравнении с Vortex2?

На самом деле Creative не считает возможным сравнивать эти два чипа, так как они базируются на двух совершенно различных философских принципах: модернизируемый, работающий под управлением инструкций звуковой DSP (EMU10K1) и специализированный звуковой ASIC (Vortex2) с жестко определенными функциями и с неизменяемым кодом. Creative потратила 10 лет на создание технологий, которые воплощены в EMU10K1 и, глядя в будущее, мы считаем, что выбрали верное направление развития. Используя EMU10K1, вы получаете такое же качество звука, как и у ASIC с жестко определенными функциями, но с гибкостью и возможностью модернизации, присущими DSP. Когда появляется потребность поддерживать новые технологии (такие, как EAX, WDM, DLS и т.д.) мы можем быстро добавить эту поддержку на аппаратном уровне без необходимости для конечного пользователя покупать новую плату. Таким образом, EMU10K1 обеспечивает все лучшее из обоих подходов.

3D звук: Кто это стоит у меня за спиной?

1. В январе в интервью журналу Maximum PC вы заявили, что Creative использует для воспроизведения 3D звука метод, основанный на восприятии человеком звука, в то время как Aureal предпочла использовать путь моделирования реальной физики пространства. Тем не менее, отзывы в сети и в журналах говорят о том, что технология A3D 2.0 от Aureal обеспечивает лучший позиционируемый звук, так чей же метод ошибочен?

Прежде всего, поймите, что "позиционируемый звук" (positional audio) является явлением, которое Aureal лишь совсем недавно сделала реальностью. Одним из главных преимуществ Environmental Audio является то, что в основе нашей технологии лежит опыт воспроизведения пространственного звучания, для создания которого недостаточно простого определения координат объектов. В частности, возможность использовать творческий подход при создании звука, вместо механического, была главным движущим фактором, который привел нас к выбору метода, основанного на восприятии слушателем звука. Наш метод отличается от подхода Aureal не только в том, что мы взяли за основу именно восприятие звука, но также в том, что мы решили уделить первостепенное внимание созданию звуковой среды, нежели совершенствованию нашей модели позиционирования, основанной на определении координат объектов. В результате, при сравнении "позиционируемого звука" без использования эффектов окружающей звуковой среды, наши ранние решения не всегда звучат так, как задумывалось. С помощью программы Live!Ware мы предлагаем улучшенные алгоритмы позиционирования звука, которые призваны решить эту проблему. К счастью интерфейс для создания позиционированного звука жестко связан с API DirectSound3D, поэтому пользователи SB Live! могут получить больше преимуществ от этих изменений, при использовании приложений, поддерживающих EAX 1.0 или даже просто DS3D.

Если же прямо отвечать на ваш вопрос, то ответ нет, мы совершенно уверены в том, что метод, основанный на восприятии, который мы выбрали, является лучшим, что полностью подтверждает ситуация на рынке. Тем не менее, очень важно понимать разницу между реализацией позиционируемого звука и теми выгодами, которые обеспечивает использование фундаментальных методов в интерфейсе звуковой среды окружения.

2. Объясняются ли недостатки воспроизведения 3D звука картой SB Live!, особенно его глубины, т.е. позиционирование по оси Z, недостатками DS3D или это проблема звукового движка? Услышим ли мы более качественный 3D звук в наушниках и через колонки в ближайшем будущем или мы ограничены возможностями DS3D?

У API DS3D нет проблем с позиционированием по оси Z, причиной всех недостатков является звуковой движок, конкретная конфигурация акустики или сам слушатель. Как я говорил ранее, нашим приоритетом было создание эффектов звуковой среды окружения, нежели совершенное позиционирование звука. Поэтому мы уже сделали массу улучшений в драйверах, и будем делать это и в будущем, с целью обеспечить правильное воспроизведение эффектов позиционирования звука, таких, как позиционирование источников звука в вертикальной плоскости (elevation). Но мне кажется, что всегда необходимо объяснять, чего стоит ожидать пользователям. Воспроизведение звука через колонки имеет существенные ограничения, и даже наушники, без контроля над положением головы, существенно ограничены в своих возможностях по воспроизведению позиционируемого звука. Поэтому, в то время как DS3D не ограничивает нас, некоторые пользователи могут быть разочарованы тем звучанием, которое воспроизводят их акустические колонки.

3. E-mu является известной музыкальной компанией, которая обеспечивает линию продуктов Sound Blaster своими чипами. В то же время, Aureal подчеркивает, что они имеют опыт 10 лет исследований и разработок в области 3D звука (NASA является самым часто используемым примером "ultra-high end" применения технологии Aureal). Вопрос следующий, имеет ли E-mu необходимый исследовательский и практический опыт, чтобы бросить вызов Aureal в области технологий 3D звук?

После того, как Aureal приобрела компанию Crystal River, она получила в свое распоряжение знания и опыт Скотта Фостера (Scott Foster), одного из пионеров в области 3D звука. Скотт многие годы является моим другом и NASA действительно спонсировала его разработку "Convolvotron", представлявшую собой первое поколение экспериментального движка виртуальной реальности, который поддерживал максимум четыре источника звука. В те времена эта разработка была верхом совершенства, сегодня она безнадежно устарела.

Я сомневаюсь, что между технологиями и алгоритмами Convolvotron и Vortex есть много общего, но думаю, что ранние разработки Скотта могли оказать слишком сильное влияние на точку зрения Aureal. Если судить по демонстрационным программам A3D 2.0, которые я видел и слышал, то, похоже, что при моделировании акустики всегда используются отдельные источники для каждого отражения звука. Это полностью перестает действовать при воспроизведении любого запаздывающего остаточного звучания при затухании звука, которое, как я считаю, является важнейшей частью для восприятия звука. Пытаясь использовать разработки Скотта в области позиционирования 3D звука для воспроизведения окружающей звуковой среды, они узнали, как мало они понимают в моделировании реальной акустики.

E-mu имеет 25 летний опыт создания оборудования для звуковых дизайнеров Голливуда, но в тоже время мы действительно по настоящему не занимались разработками классических технологий 3D звука. Вместо этого, мы прибегли к помощи опытных исследователей, таких, как Jean-Marc Jot (Жан-Марк Джот), который непосредственно занимался 3D звуком и собрал, как я считаю, отличную команду разработчиков с высоким потенциалом. А наши знания в разработке инструментария для звуковой индустрии помогают нам очень хорошо осуществлять интеграцию и поддержку этой команды.

Я гораздо менее озабочен нашим исследовательским опытом, чем текущим состоянием создания работающих стандартов, которые бы привлекали разработчиков для их поддержки (и хорошо их поддерживающих) и захватом выгодных позиций на рынке. Технология как таковая это самая легкая часть. Мы имеем массу предложений по приобретению дополнительных знаний и опыта в области 3D звука, но по моей оценке, главным ограничивающим фактором является внедрение.

4. Собирается ли в ближайшем будущем Creative внедрять алгоритмы HRTF для воспроизведения звука через множество (4/6/8) колонок?

Да. В следующих улучшениях драйверов, которые будут доступны через программу Live!Ware, мы собираемся обеспечить позиционирование звука в вертикальной плоскости и улучшить воспроизведение позиционируемого 3D звука через наушники, две колонки или несколько колонок. Эти улучшения будут включать бинауральные техники (основанные на алгоритмах HRTF) и других специализированных методах, разработанных в нашем Tech Center. Также в ближайшем будущем мы сделаем доступными для использования улучшенные драйверы, которые позволят использовать широкий набор конфигураций колонок, включая 8 выходных каналов.

5. DS3D моделирует все источники звуков в виде точечных источников, считая, что размер источника звука не имеет значения. Есть ли у вас какие-нибудь планы в связи с этим?

Это, несомненно, одна из нескольких проблем с моделью DS3D. Мы работаем с Microsoft над решением этой проблемы. Также мы работаем над тем, как реализовать звуковые эффекты, принимающие во внимание скорость звука (sonic effects). Сейчас слишком рано говорить о том, когда мы встроим решение этой специфичной проблемы в драйверы, но мы не оставим это без внимания. Для этого понадобится создать расширение для той части API, которая занимается позиционированием звука, а управление этим расширением можно возложить на EAX или на DS3D.

EAX: API, который мы выбираем

1. EAX 2.0 все еще не является полноценным звуковым API, так как он не обеспечивает позиционирование звука. Собирается ли Creative создать свой собственный звуковой API, который смог бы конкурировать с A3D 2.0?

Нет. По нашему мнению, DirectSound3D является правильным выбор в качестве API для позиционирования звука. Дублирование его функциональных возможностей в нашем собственном API было бы шагом назад с точки зрения стандартизации, без какой-либо выгоды. Хотя интерфейс DS3D несовершенен (см. ответы на вопросы выше), мы предпочитаем работать вместе с Microsoft над улучшением этого интерфейса, нежели чем над ослаблением стандарта. Тем не менее, мы уверены, что DS3D вместе с EAX 2.0 превзойдут по своим возможностям A3D 2.0.

2. Благодаря тому факту, что EAX является открытым API, становится возможным быстрый рост его поддержки промышленностью. Но это дает платам типа MX300 преимущества над SB Live!, так как последняя не может поддерживать специализированные интерфейсы, подобные A3D 2.0. Не думаете ли вы, что Creative сделала неверный ход в данном случае? Будут ли будущие версии EAX оставаться открытыми?

Я думаю, что продвижение EAX в качестве открытого API и работа по его промышленной стандартизации, без всяких вопросов является верным ходом Creative. В то время, как нашим недостатком считается, что мы не можем поддерживать A3D 2.0, на самом деле это недостаток Aureal, потому что ни не могут обещать разработчикам поддержку A3D на большинстве существующих платформ.

Результат использования стратегии открытого интерфейса вместо специализированного API очень сложно предсказать. Как вы можете помнить, специализированный стандарт Sound Blaster сослужил очень хорошую службу Creative, поэтому каждый понимает, что мы будем очень рады получить преимущества от использования специализированного интерфейса, если такая возможность представиться. Я ожидаю, что мы будем "скользить" на волне одобрения EAX, сохраняя определенные функциональные возможности закрытыми настолько долго, насколько нам это удастся, однако полное раскрытие всех возможностей интерфейса только увеличит движущую силу волны.

Aureal заявила о том, что они будут поддерживать EAX. Нам это льстит, но до сих пор нет никаких подтверждений тому, что они сдержат свое обещание. Не забывайте, что мы потребуем от них предоставить образцы для тестов на совместимость, и предполагаем, что они будут соответствовать всем необходимым заявленным требованиям для поддержки нашей технологии, поэтому мне представляется маловероятным, что мы увидим поддержку EAX от Aureal в ближайшее время.

3. Строго говоря, EAX 2.0 на самом деле не является интерфейсом, основанным на геометрии пространства. Если все обстоит именно так, каким образом производится динамический расчет окклюзии и обструкций в игровой среде?

Существуют функции интерфейса, которые сделаны для создания подобных эффектов. SDK, который мы предлагаем разработчикам, помогает им использовать эти эффекты естественным и простым способом. Слышимые эффекты предназначены непосредственно для создания интерактивности и динамики. Мы уверены, что наша роль, в качестве производителя Environmental Audio API, заключается в предоставлении тщательно сконструированных механизмов управления для манипулирования звуком напрямую (не через описание геометрии). Все остальное, — а именно, обнаружение наличия препятствий между источниками звука и слушателем или определение расположены ли они в одном помещении, — управляется более эффективно и более согласованно непосредственно геометрическим движком игры. Похоже, что разработчики согласны с нами в этом.

4. Существует недовольство тем, что переходы между различными установками EAX происходят слишком резко, следствием чего является ощущение неестественности. Ожидаются ли улучшения в этой области?

Это было тем, что больше всего мне не понравилось в ранних EAX играх. Это проблема будет решена с помощью выпуска улучшенных драйверов. Плюс к этому, разработчики становятся более умелыми при работе с EAX API и начинают использовать более продвинутые параметры для управления переходами между различными звуковыми средами. С помощью EAX 2.0 и будущих версий нашего интерфейса, реализация этих возможностей будет расширена введением дополнительными параметрами звуковой среды в API.

5. Будет ли EAX 2.0 иметь какие-нибудь новые функциональные возможности, кроме функций расчета окклюзии?

Кроме свойств окклюзии и обструкции (которые разработаны для воспроизведения эффектов препятствий или перегородок в помещении, расположенных между источником звука и слушателем), EAX 2.0 содержит несколько замечательных новшеств. Среди них более обширное управление реверберацией в помещении и параметрами отраженных звуков (включая размер помещения), а также улучшенная модель воспроизведения удаленных эффектов.

6. В играх, использующих EAX, на параметры реверберации влияет только окружающая среда, в которой находится слушатель, но не источники звука. Есть ли у вас какие-нибудь планы изменить такое положение дел в будущем?

На самом деле, в EAX 1.0, расстояние от источника звука до слушателя используется для автоматического регулирования интенсивности реверберации для каждого индивидуального источника звука. Без этого, воспроизведение звучания не было бы правдоподобным для более удаленных источников звука. В EAX 2.0 реализована более сложная дистанционная модель, которая также регулирует параметры ранних отраженных звуков для каждого источника звука индивидуально. В будущем, параметры ранних отраженных звуков для каждого индивидуального источника будут полностью доступны воздействию программистов.

7. Следующая информация извлечена из пресс-релиза от 17.11.97 — Creative представляет EMU10K1:

"EMU10K1 может обеспечить поддержку очень сложной технологии воспроизведения звука в реальном времени, аналогичную возможностям "ray-tracing" (расчет путей распространения световых лучей на основе геометрии пространства), которая реализована в профессиональных механизмах визуализации 3D графики…

EMU10K1 использует уникальную технологию E2M для разделения помещения, области или окружающей среды на математически представляемые части в виде размера, формы и свойств акустики. Кроме того, при разделении на части помещения или области, для находящихся в них объектов определяются X, Y и Z координаты. Далее происходит комбинирование свойств акустики и координат объектов, а затем для любого воспроизводимого звукового потока применяется серия цифровых алгоритмов, называемых фильтрами окружающей среды (environmental filters), в результате происходит точное воспроизведение реально существующей акустической окружающей среды с различными звуками и эффектами".

Можете ли вы разъяснить фразу о "возможностях ray-tracing" и то, каким способом используется E2M? Похоже, что обе эти технологии не вошли в EAX.

В то время, когда был написан этот пресс-релиз, мы все еще оценивали различные алгоритмы для поддержки в нашем интерфейсе звуковой среды окружения. Аналогия с "ray-tracing" была лучшим способом для описания результатов, которых мы хотели добиться, но в то же время эта аналогия совершенно неверно описывает то, как мы хотели добиться желаемых результатов. Так же, мы пришли к выводу, что ролью Environmental Audio API не может быть управление геометрией виртуального мира. Предложение использовать только модель, основанную на геометрии пространства, для создания звуковой окружающей среды возводит совершенно ненужные препятствия для звуковых дизайнеров. В EAX, мы выбрали метод управления отраженными звуками и параметрами реверберации в форме, которая очень подходит для звуковых дизайнеров, но все равно имеется возможность управления этими параметрами и через геометрический движок игры.

Раз уж вы затронули эту тему, дайте мне сказать немного умных слов. Aureal продвигает свою технологию "wave-tracing" проводя аналогию с графической технологией "ray-tracing". Проблема в том, что в отличие от света, звуковые волны не ведут себя как прямые лучи. Это просто: если вы поместите свою руку между вашими глазами и источником света, вы перестанете видеть свет, однако, если вы поместите свою руку между источником звука и ухом, вы все равно будете слышать большую часть звуков, распространяемых непосредственно (так же, как и отраженные звуки). Световые волны гораздо меньше, чем объекты окружающей среды и изменяются в пределах одного-двух диапазонов, в то же время, звуковые волны изменяют свою длину от нескольких дюймов до нескольких ярдов в пределах от одного до тысячи диапазонов. Действительно, в акустике используются некоторые техники распространения лучей, однако, когда размеры элементов концертного зала гораздо больше, чем длина большинства звуковых волн, эти принципы неприменимы. Вместо этого, для получения распространения истинного звучания в произвольном пространстве, вам необходимо разрешить выравнивание граничных условий. Такие задачи далеки от возможностей современных процессоров, но к счастью человеческое ухо может воспринимать только небольшую часть реального звука. Упрощенная реализация, базирующаяся на технике расчета распространения лучей имеет проблему, которая заключается в том, что реализация такой аналогии полностью неприменима для воспроизведения затухания запаздывающей реверберации, создавая вместо этого явно различимые артефакты, которые наносят больше вреда, чем пользы конечному выходному звуковому потоку!

Мы твердо уверены в том, что правильный метод моделирования звуковой окружающей среды для интерактивных звуковых развлечений требует двух уровней. На нижнем уровне должен располагаться полный и тщательно разработанный слой параметров звуковой окружающей среды, которые должны удовлетворять потребностям любого приложения. На верхнем уровне должен располагаться инструментарий, который позволяет графическому движку игры рассчитывать окклюзии и отраженные звуки, следовательно, эти явления могут интерактивно воспроизводиться через параметры звукового дизайна (для целого класса игр от первого лица, которые могут с пользой использовать такой метод). В результате, мы имеем все лучшее от двух миров — общий, дружественный интерфейс для дизайнеров звука, который применим для всех приложений и преимущества от использования динамичного расчета окклюзии и отраженных звуков способом, который не мешает полному контролю над конечным звучанием.

8. EAX часто попадает под критику Aureal за то, что обеспечивает воспроизведение лишь обыкновенной старой "консервативной" реверберации и "не является интерактивным". Как вы можете прокомментировать это?

Похоже, что это является наиболее обобщенной критической нападкой Aureal на нашу реализацию EAX. Исходя из того, что студийные устройства для создания высококачественной реверберации, могут стоить десятки тысяч долларов, я не совсем уверен в том, что означает фраза "обыкновенная старая консервативная реверберация". Я думаю, что лучшим ответом будет попросить людей послушать реализацию EAX и посмотреть, найдут ли они звучание окружающей среды содержательным и точным. В общем же, я согласен. Я должен признать, что уровень интерактивности при моделировании помещений был довольно скромным в EAX 1.0, но интерактивность будет существенно улучшаться с каждой новой версией.

SBLive!: Давайте вдохнем в него жизнь!

1. Насколько успешно идут продажи SB Live! с момента начала поставок?

С начала декабря 1998 года Creative продала более миллиона единиц Sound Blaster Live! и Sound Blaster Live! Value по всему миру. Внутри компании бытует мнение, что это были самые успешные поставки, со времен первой карты Sound Blaster. Также заслуживает внимания то, что эти поставки не включают ни одного OEM конструктива. Если же включить и их, то показатели взлетели бы до небес.

2. Что вы приготовили для SB Live! в 1999 году?

Первая область, в которой вы увидите улучшения, называется маркетологами "коробочным" событием для конечных пользователей. У нас есть большая команда, которая безостановочно работает над улучшением основного программного обеспечения , которое включает в себя вещи, типа реализации SF2.1, но и многое другое. Улучшениям подвергнутся и некоторые аспекты подключения внешних устройств. Ближе к концу года мы собираемся внести некоторые существенные изменения в само ядро звукового движка. Будьте наготове.

3. Слышали ли вы MX300 в действии? Что вы думаете об этой карте?

MX300 это звуковая карта с приемлемым качеством звучания, которая поставляется с несколькими хорошо сделанными демонстрационными программами. Тем не менее, недостаток реальных приложений, которые действительно могут использовать преимущества новых возможностей A3D 2.0, должно вызывать рост беспокойства у владельцев MX300. Я бы хотел также добавить, что по-моему, демонстрационные программы для Vortex 2, которые поставляются вместе с картой, на самом деле служат доказательством точки зрения Creative о том, что ощущения от окружающей звуковой среды не будет полным, если вы не воспроизводите остаточное затухание реверберации. Раздельные отраженные звуки сами по себе лишь в небольшой степени способствуют созданию впечатления реальности удаленных и окружающих источников звука.

В заключение, если вы хотите послушать голос Дейва Россума, то можете загрузить себе его 10 минутное интервью в формате mp3: dave.mp3 (2,4 МБ).

Замечание: Некоторые вопросы для этого интервью предложили парни с сайтов: 3D Sound Surge и HammerSound

Мы выражаем особую признательность Lee Ee Siang с сайта ALive! за оказанную помощь.

Оригинальную версию данного интервью. Вы можете найти на сайте ALive! (htgk.singnet.com.sg/alive/).