HIS Excalibur RADEON 9700 Pro и тестирование в DirectX 9.0 RC0



СОДЕРЖАНИЕ

  1. Общие сведения
  2. Особенности видеокарты
  3. Конфигурации тестовых стендов и особенности настроек драйверов
  4. Результаты тестов: коротко о 2D
  5. Результаты тестов: Синтетические тесты GPUSpeed и PixelShaderSpeed
  6. Результаты тестов: Игровые тесты 3DMark2001 SE
  7. Результаты тестов: Quake3 ARENA
  8. Результаты тестов: Serious Sam: The Second Encounter
  9. Результаты тестов: Return to Castle Wolfenstein
  10. Результаты тестов: Comanche4 DEMO
  11. Результаты тестов: Unreal Tournament 2003 DEMO
  12. Результаты тестов: AquaMark
  13. Результаты тестов: RightMark 3D
  14. Выводы

Компания Hightech Information System Ltd (HIS) была основана в Гонконге в 1987 году четырьмя, как сказано в информации о фирме, христианами с "целью прославления Бога". Я лично еще никогда не встречал подобных заявлений от основателей фирм.

Интересно отметить, что поначалу компания обходилась небольшими поточными линиями в самом Гонконге, затем руководство решило переместить производство в Китай, где был построен большой современный завод, на котором ныне и выпускается продукция HIS, которая состоит сейчас только из видеокарт.

Если посмотреть динамику развития линейки продуктов у HIS, то становится ясно, что до недавнего прошлого фирма ориентировалась на процессоры от NVIDIA, выпуская полноценные серии практически на всех чипах этой калифорнийской фирмы. Небольшими партиями параллельно выпускались продукты и на базе SIS 300-305-315 и Trident Blade3D, XP. Однако ныне основной ориентир фирмы — ATI, и в числе продуктов мы видим карты на базе RADEON 7500/8500/9000/9500/9700. Разумеется, как это уже стало традицией, развитие линейки ATI означает свертывание линейки NVIDIA. Последний продукт в этой линейке — GeForce3 Ti 500. Правда, в списке есть и GeForce4 MX 440, однако этот продукт является единственным, что наводит на мысли, что эта карта производится не на основании сотрудничества с NVIDIA, а на чипах, купленных на "сером рынке".

Что мы можем сказать о продуктах этой компании? Да почти ничего. Когда-то давно мы рассматривали в 3DGiтогах видеокарту от этой фирмы на базе Trident BladeXP, однако там чипсет был настолько "хорошего" качества и с "блестящими" драйверами, что впечатление о карте осталось не ахти какое. Хотя качество именно карты было на высоте. Интересно отметить, что для выпуска дешевых видеокарт компания использует дизайн собственной разработки, а не довольствуется референсным.

Однако надо все же отметить, что иногда продукты от HIS попадают на российский прилавок. И это вовсе не low-end, как уже успели подумать многие, который в реализации от малоизвестных гонконгских и китайских компаний ассоциируется с пониженными частотами работы карт и отвратным качеством пайки.

Нет, HIS выпускает и изделия high-end. В частности, вышеупомянутый GeForce3 Ti 500 когда-то относился к разряду high-end, а сейчас топовой картой является модель на ATI RADEON 9700 Pro. К слову, напомним, что в нашем багаже уже есть множество статей, посвященных подобным картам:

Теоретико-аналитические материалы и обзоры видеокарт, в которых рассматриваются функциональные особенности VPU ATI RADEON 9700 (Pro) / RADEON 9500 (Pro)

Сегодня в нашей лаборатории побывала HIS Excalibur RADEON 9700 Pro. Как вы увидите ниже, это копия эталонной карты, поэтому ничем особенным она не выделяется. Более того, предполагаю, что эта плата была произведена еще на фабрике PC Partner. Ведь уже ни для кого не секрет, что все первые карты RADEON 9700 Pro выпускались на одной фабрике, а затем партнеры уже ставили свои названия и номера и паковали в свои коробки. Разумеется, это сделано для того, чтобы дать партнерам время на подготовку к выпуску такой сложной по разводке карты и при этом не терять время на ожидание, продавая заранее произведенные по OEM-заказам карты. Поэтому только плата от Hercules имела отличие в цвете PCB, а все остальные представляли собой точные копии референс-дизайна.

Вот и ныне исследуемая нами плата, как я уже говорил, ничем не отличается от ранее рассмотренных. Ниже мы ее подробно рассмотрим, и вы сами в этом убедитесь.

Главное в нашей статье — тестирование RADEON 9700 Pro совместно с DirectX 9.0 RC0, благо не так давно вышел как сам API, так и драйверы от ATI под него и RADEON 9500/9700.

А сейчас не будем прерывать наших традиций и в начале анализа рассмотрим саму карту.

Плата

HIS Excalibur RADEON 9700 Pro


HIS Excalibur RADEON 9700 Pro
Карта имеет интерфейс AGP x4/x8, 128 МБ памяти DDR SDRAM, размещенной в 8-ми микросхемах на обеих сторонах PCB.

На карте установлены микросхемы памяти Samsung марки K4D26323RA-GC2A, форм-фактора BGA. Максимальная частота работы — 350 (700) МГц, поэтому можно сделать вывод, что время выборки — 2.8 нс. По умолчанию память работает на частоте 310 (620) МГц, а чип на 325 МГц.



Сравнение с эталонным дизайном, вид спереди
HIS Excalibur RADEON 9700 Pro Reference card ATI RADEON 9700 Pro 128MB


Сравнение с эталонным дизайном, вид сзади
HIS Excalibur RADEON 9700 Pro Reference card ATI RADEON 9700 Pro 128MB

Как и следовало ожидать, видеокарта полностью соответствует эталонному дизайну, да и по сути является копией референсной карты. Думаю, что и дальнейшие комментарии излишни. Даже кулер точно такой же, как на reference card.

А вот под кулером — сам VPU RADEON 9700 Pro.

Мы можем еще раз порассуждать о дороговизне чипа и поохать над размерами кристалла, по сравнению с которым AthlonXP 0.13 mkm выглядит просто скромной пигалицей :-). Однако не все так плохо, и усовершенствование производства даже такого сложного чипа ведется быстрыми темпами, и теперь его же можно видеть и на более дешевых картах класса RADEON 9700/9500.

На этом рассмотрение самой карты мы заканчиваем. Заглянем в коробку и оценим комплект поставки:

Мы видим, что компания HIS явно идет наперекор традициям канадского производителя (который считает наличие игр в комплекте поставки излишеством и ребячеством), поэтому в коробке мы найдем хоть старую, но все же игру :-). А также нам попадется Cyberlink PowerDirector, который вообще-то мы привыкли видеть в качестве программы, обслуживающей Video-In чего у RADEON 9700 Pro не наблюдается. Странная поставка, не правда ли? :-) Как плюс можно отметить наличие в коробке диска с PowerDVD XP.

Ну а сама коробка — обычных размеров, c несколько экзотическим натюрмортом из холодного оружия и рогов на лицевой стороне (хоть нет рож этих уже набивших оскомину чудовищ — и то хорошо)

Разгон

HIS Excalibur RADEON 9700 Pro 325/620 -> 355/698 MHz


Потенциал разгона — средний. Как и следовало ожидать, виной тому не "плохой" чип, а опять разница высот кристалла и окружающей его рамки, когда последняя заметно выше, и кулер даже при использовании термопрокладки не очень плотно прижимается к крышке чипа.

Напомним, что

  • при разгоне обязательным условием является наличие дополнительного охлаждения, в частности, обдувающего карту (прежде всего, ее память) вентилятора:

  • разгон любой карты зависит от конкретного экземпляра, и поэтому нельзя обобщать вышеприведенные возможности повышения частот на все видеокарты этой марки и даже серии. Показатели разгона мы приводим только как интересное явление; они ни в коей мере не входят в состав обязательных характеристик видеокарты.

Установка и драйверы

Рассмотрим конфигурацию тестового стенда, на котором проводились испытания карт:

  • Компьютер на базе Pentium 4 (Socket 478):
    • процессор Intel Pentium 4 2530 МГц;
    • системная плата ASUS P4T533 (i850E);
    • оперативная память 512 MB 32bit RDRAM PC4200;
    • жесткий диск Seagate Barracuda IV 40GB;
    • операционная система Windows XP.

На стенде использовались мониторы ViewSonic P810 (21") и ViewSonic P817 (21").

При тестировании применялись драйверы от ATI версии 6.200 (использовался DirectX 8.1), а также 6.228 (использовался DirectX 9.0 RC0). VSync отключен в драйверах, компрессия текстур отключена в приложениях. Детализация текстур — High Quality.

Для сравнительного анализа приведены результаты видеокарты:

  • Albatron Medusa GeForce4 Ti 4600 (300/325 (650) МГц, 128 МБ, driver 40.72);

Настройки драйверов

Отметим, что уже выпущены драйверы DirectX 9, которые пока находятся в стадии бета-тестирования, поэтому мы решили исследовать работу RADEON 9700 Pro в DX9 на примере синтетических тестов, которые написаны авторами ныне разрабатываемого большого тестового пакета RightMark 3D. А заодно и посмотреть разницу в производительности у RADEON 9700 Pro на разных драйверах и API.

Все настройки драйверов мы уже подробно рассматривали в обзорах из списка выше, поэтому сейчас не станем на этом останавливаться (драйверы 6.228 в этом плане ничем от предыдущих не отличаются).

Результаты тестов

2D-графика

Кратко расскажем о 2D. Думаю, что практически всем ясно, что качество 2D не будет отличаться от того, что мы видели ранее на примерах таких же карт, ибо подчеркну еще раз, перед нами просто копия эталонной карты. А ранее мы писали, что остались очень довольны качеством 2D.

Но все же оценка 2D-качества — вещь субъективная. Поэтому напомню, что качество зависит от конкретного экземпляра, кроме того, огромную роль может играть связка карта-монитор, прежде всего, надо обращать внимание на качество монитора и кабеля.

3D-графика, Синтетические тесты GPUSpeed и PixelShaderSpeed в DirectX 9.0

Мы конечно понимаем, что та спешка, с которой ATI выставила новые драйверы под еще не вышедшую окончательно версию DirectX, была затеяна ради демонстрации красивейших программ, иначе говоря, DEMO, рассчитанных показать все, на что способен RADEON 9700 Pro. Поэтому едва DirectX 9.0 RC0 был выложен для публичного скачивания и установки на свой страх и риск (все же бета-версия), как ATI публично выпускает также бета-версию 6.228 своих драйверов для RADEON 9500/9700 под Windows XP. Разумеется, перед выкачиванием этого пакета ПО пользователи раз 20 предупреждаются о том, что это бета-версия, и производитель не гарантирует стабильность работы системы, и в случае возникновения проблем с работой тех или иных игр он не несет ответственности за использование этого ПО конечным пользователем. Что логично. Однако как же утерпеть и не посмотреть на те красоты, которые мы ранее видели только в видеороликах?!

Здесь используется рендеринг с повышенной (плавающей) точностью и так называемым расширенным динамическим диапазоном. При выводе картинка подвергается гамма-коррекции. Кроме того, пиксельные шейдеры используются для описания материала на шариках, отражающего окружающую среду.


В этом демо работает много техник. Прежде всего, вершинные шейдеры для формирования шерсти и анимации медведя.


Здесь мы видим сложный металлический материал, сложные оптические свойства достаточно необычной окраски которого моделируются пиксельным шейдером, реализующим достаточно пространную формулу из курса оптики. Кроме того, перед нами наглядная демонстрация Displastment Mapping и неразлучных с ним n-патчей нового порядка :-), тонкий рельеф на машине формируется не на уровне модели, (то есть еще задолго до работы самого видеопроцессора), а уже самим VPU по заданной, разумеется, текстуре смещений.


Эта демонстрация, собственно, является неким общим знаменателем различных технологий, замечательно показывая, как изменились технологии за последние годы. Ведь совсем недавно этот ролик игры на ряде музыкальных инструментов производил фурор по точности и слаженности рендеринга и музыкальной темы, тогда требовался не один десяток компьютеров, рассчитывающих в программном режиме каждый кадр этого ролика. А теперь одна видеокарта способна в реальном времени воспроизвести не только ТО ЖЕ САМОЕ, но и гораздо более сложные и детальные сцены. Для передачи свойств материалов и анимации широко использованы различные шейдеры. Кроме того, уровень детализации геометрии, несомненно, рассчитан на производительность самых последних VPU.

Ну а теперь, от высоких материй красивых демонстраций вернемся к делам насущным и рассмотрим результаты работы наших синтетических программ, которые уже когда-то участвовали в обзоре RADEON 9700 Pro. Однако тогда не было DX9-драйвера, а теперь он есть. И нам интересно посмотреть разницу в работе шейдеров разных поколений.

GPUSpeed

Для начала сравним скорость ускорителей в режиме фиксированного T&L, вернее, его эмуляции. Итак, по порядку, от простого к сложному. Вариант номер 1 — в наличии только константное фоновое освещение. Фактически, проще не может быть — мы лишь присваиваем каждой вершине одно и тоже значение цвета. Этот режим позволит нам выявить пиковую пропускную способность ускорителя по треугольникам. Как и ожидалось, он упирается в GPU (или VPU, кому как больше нравится) и не зависит от версии API. Итак, в предельном варианте RADEON 9700 PRO обрабатывает порядка 106 миллионов треугольников в секунду, GeForce 4 Ti 4600 — заметно меньше (а кто сомневался) — около 70 миллионов. Однако по мере усложнения освещения картина начинает стремительно меняться в пользу GeForce 4! Что говорит либо о более совершенной эмуляции T&L, либо вообще о более производительном исполнении сложных вершинных шейдеров. Посмотрите сами, в последнем, 7 тесте (задействованы 3 диффузных + 2 спекулярных точечных источника света) NVIDIA становится лидером, несмотря на наличие только двух исполнительных вершинных блоков против четырех в RADEON. В будущем, по мере появления релиза DirectX 9 и соответствующих драйверов от обоих производителей, а также финальных карт на базе NV30 мы внимательно исследуем вопрос эффективности эмуляции T&L и выполнения вершинных шейдеров для всех чипов семейств NV25, NV30 и R300.

А теперь придирчиво исследуем зависимость производительности от версии вершинных шейдеров, версии API и типа используемого совместно с вершинными шейдерами метода закраски — пиксельные шейдеры или фиксированная закраска по старинке. Во-первых, сразу отметим аномальное поведение теста в варианте "вершинные шейдеры 2.0 + пиксельные шейдеры 2.0". Его причина — странное поведение бета-версии DirectX — есть подозрение, что при компиляции корректного кода шейдеров (исполняющегося без проблем на референсном имитаторе DX9-ускорителя) происходит ошибка. Возможно, виноваты сырые драйверы, возможно — неотлаженный API; как бы там ни было, будем ждать релизных версий. Отметим, что результаты схожих вторых и первых вершинных шейдеров должны быть практически одинаковы. Основная причина — совместимость сверху вниз. Однако вершинные шейдеры второй версии нашего теста содержат циклы, которые нам удалось заставить работать, несмотря на то, что в бета-версии DirectX циклы не всегда компилируются правильно (sic!).

В случае RADEON использование циклов вызывает очень заметное падение производительности — порядка 20 и более процентов. Что, мягко говоря, больше планируемой расплаты за одну дополнительную команду проверки и перехода на каждый источник света, которой шейдеры с циклом отличаются от развернутых вручную. Это особенно удивительно, если учесть, что R300 не выполняет динамических переходов в шейдерах и при загрузке в чип циклы должны были быть развернуты драйверами, совершенно так же, как мы сделали вручную в шейдерах версии 1.1. Возможно, это вопрос оптимизации драйверов и API, но, как минимум, разработчикам следует насторожиться и приготовиться к неожиданной расплате за использование удобных команд циклов и вызова подпрограмм даже в случае статического управления потоком команд.

Итак, при попытке реального применения новых возможностей сырость бета-тандема API и драйверов DX9 не вызывает сомнений.

Напоследок традиционно проверим зависимость теста от разрешения. Идеальный синтетический тест геометрической производительности чипа не должен зависеть от разрешения, и наблюдаемая нами картина близка к идеалу. В то же время, зависимость от сложности (номера) шейдера четко заметна, что и планировалось.

PixelShaderSpeed



Пока самый главный результат этого теста такой — пиксельные шейдеры второй версии есть, они доступны и функционируют без ошибок! Согласитесь, это уже немало. Интересно, что последний, 7 шейдер рисует сложную анимированную процедурную текстуру, и при этом выполняется заметно быстрее 5 шейдера, реализующего классическое попиксельное освещение. Процедурная текстура более ориентирована на вычисления, 5 шейдер — на выборку текстур. Налицо тот самый вычислительный баланс новых архитектур, о котором так много говорили теоретики от компьютерной графики! Возможно, в будущих приложениях мы, наконец, увидим процедурные текстуры, которые в ряде случаев смогут оказаться более удобными как с точки зрения использования, так и производительности.

Ну и напоследок проверим, есть ли разница между использованием пиксельных шейдеров с аппаратными вершинными или с их программной эмуляцией. Этот тест позволит нам проверить чистоту теста пиксельных шейдеров, насколько он зависит от окружения. Как мы видим, мало-мальски заметная зависимость есть только в случае процедурной текстуры, которая требует интенсивной подготовки начальных параметров.

Итак, в области пиксельных шейдеров все отлажено, и нам остается ждать финальных версий API, драйверов и карт на базе NV30, чтобы наконец-то выяснить, «кто есть кто» в вопросах пиковой производительности шейдерных блоков.

В области вершинных шейдеров — налицо несколько странностей и несоответствующего документации поведения. Ждем отладки.

3D-графика, 3DMark2001 — игровые тесты

3DMark2001, 3DMARKS

Есть ощущение, что с DX8.1-драйверами API DX9 принес RADEON 9700 Pro понижение скорости, новые DX9-драйверы эту ситуацию исправили.

3DMark2001, Game1 Low details

Примерно такая же картина, а также стало очевидным, что данный тест сильно зависит от CPU.

3DMark2001, Game2 Low details

А вот здесь работа RADEON 9700 Pro в DX9 дает неплохие дивиденды в плане производительности.

3DMark2001, Game3 Low details

И опять наблюдаем некоторое снижение скорости при переходе к DX9 на прежних драйверах и восстановление ее на версии 6.228.

3DMark2001, Game4

Интересно отметить, что для такого сложного и ориентированного только на DX8 теста установка DX9 принесла положительные результаты, особенно у RADEON 9700 Pro.

В целом, мы можем сказать, что в 3DMark2001 новый драйвер 6.228 под DX9 RC0 практически везде улучшил показатели RADEON 9700 Pro.

3D-графика, игровые тесты

Приступаем к оценке производительности видеокарты в 3D-играх. В качестве инструментария мы использовали:

  • Return to Castle Wolfenstein (MultiPlayer) (id Software/Activision) — OpenGL, мультитекстурирование, Checkpoint-demo, настройки тестирования — все на максимально возможном уровне, S3TC OFF, конфигурации можно скачать тут

  • Serious Sam: The Second Encounter v.1.05 (Croteam/GodGames) — OpenGL, мультитекстурирование, Grand Cathedral demo, настройки тестирования: quality, S3TC OFF

  • Quake3 Arena v.1.17 (id Software/Activision) — OpenGL, мультитекстурирование, Quaver, настройки тестирования все на максимальном уровне: уровень детализации — High, уровень детализации текстур — №4, S3TC OFF, плавность кривых поверхностей резко увеличена при помощи переменных r_subdivisions «1» и r_lodCurveError «30000» (подчеркну, что по умолчанию r_lodCurveError «250» !), конфигурации можно скачать тут

  • Comanche4 Benchmark Demo (NovaLogic) — Direct3D, Shaders, Hardware T&L, Dot3, cube texturing, максимально возможное качество

  • Unreal Tournament 2003 Demo v.1027 (Digital Extreme/Epic Games) — Direct3D, Vertex Shaders, Hardware T&L, Dot3, cube texturing, качество по умолчанию, ANTALUS

  • AquaMark v.2.3 (Massive Development) — игровой тест, демонстрирующий работу платы в DirectX 8.1, Shaders, HW T&L.

  • RightMark Video Analyzer v.0.4 (Philip Gerasimov) — DirectX 8.1, Dot3, cube texturing, shadow buffers, vertex and pixel shaders (1.1, 1.4).

Quake3 Arena, Quaver

Почему мы тестируем OpenGL-приложения в данном материале? Ну, ведь в состав DirectX входит не только Direct3D, но и много иных составляющих, которые активно используются и OpenGL-играми (DirectSound, DirectInput). Что касается RADEON 9700 Pro, то очевидно повторение ситуации с 3DMark2001. Но должен добавить, что эта игра нам показала, что DX9 еще достаточно сырой. Даже на DX8-драйверах (совместно с DX9) можно было наблюдать непонятные рывки и торможения игры, не говоря уж о DX9-драйверах.

Serious Sam: The Second Encounter, Grand Cathedral

А вот в этом тесте RADEON 9700 Pro на DX9-драйверах и в целом в DX9 ухудшил свою производительность, хотя нареканий на рывки и тормоза не было.

Return to Castle Wolfenstein (Multiplayer), Checkpoint

Любопытно, что Ti 4600 при переходе на DX9 (драйверы, естественно, под DX81) только выиграл, а у RADEON 9700 Pro сплошные поражения. ATI надо еще работать и работать над драйверами, кстати к MS это тоже относится в плане DX9.

Comanche4 DEMO

Игра настолько процессорозависима, что различия в производительности можно даже и не комментировать.

Unreal Tournament 2003 DEMO

А вот новая игра UT2003, наоборот, показала всем, что с DX9 она получает небольшое второе дыхание при совместной работе с RADEON 9700 Pro, и потому ATI и MS полагаются аплодисменты.

AquaMark

Если взять предыдущую фразу и применить к данной ситуации, то по идее аплодисменты должны уступить место гнилым яблокам :-). Но не будем все же забывать, что это пока бета-версия как самого DX9, так и драйверов под него.

RightMark 3D

На удивление ситуация почти ровная. Сразу видно, что работа шейдеров версий 1.1 и 1.3 мало волнует новое программное обеспечение от MS и ATI :-).

Выводы

  1. Перед нами рядовая, ничем особым не примечательная карта на базе RADEON 9700 Pro. Разумеется, пока она относится к числу самых мощных акселераторов среди игровых карт, поэтому тезис «ничем особым не примечательная» относится лишь к дизайну платы, а не ее принадлежности к high-end :-). Да уж, чего-чего, а цена у таких карт явно примечательная :-). Кстати, такие платы от HIS имеют стоимость на уровне аналогов от Sapphire (впрочем, при этом ничем и не отличаются от оных). Радует лишь то, что такие платы выпускает все больше и больше компаний, а значит, конкуренция уже есть между самими производителями этих карт, несмотря на то, что явного конкурента со стороны NVIDIA пока еще нет (GeForce FX пока еще в стадии тестирований и вылизываний).
  2. Что касается тестов в DirectX 9.0, то данное бета-тестирование (подчеркиваю, что релиза пока нет как со стороны Microsoft, так и со стороны ATI) показало нам то, что переход на DX9 пока не привел к фатальным снижениям скорости в играх (как иногда бывало ранее в прежних версиях DX), иногда скорость вырастала, иногда понижалась, но везде незначительно. Заработали шейдеры версий 2.0, как это уже можно было увидеть из демонстрационных программ и наших синтетических тестов. Пока нельзя сказать ничего однозначно — мы видим, что порой скорость исполнения шейдеров 2.0 оказывается заметно ниже, чем 1.*, в наличии даже откровенно ошибочное поведение API. Что ж, API DX9 пока только еще не вышел в окончательном варианте, да и драйверам предстоит долгий путь совершенствования и оптимизации.

Полагаю, что у RADEON 9700 Pro есть реальные шансы стать более привлекательной картой, чем NV30, хотя бы на ближайшую перспективу, учитывая сильно завышенные цены на GeForce FX сразу после выхода на рынок, снижение цен на RADEON 9700 Pro, а также вероятный выпуск более отлаженного DX9-драйвера со стороны ATI к моменту релиза DX9, ибо "железо" менять и подгонять уже нет нужды, а у NVIDIA пока еще нет окончательной ревизии чипа NV30, и требуется тщательное тестирование не только софта, но и "железа".

Выражаю искренную благодарность коллеге Александру Медведеву за помощь в исследовании бездонного мира шейдеров DirectX 9.0,
а также
Филиппу Герасимову за оперативное программирование синтетических тестов и отладку их под DirectX 9.0 RC0


Благодарим компанию Atlantic Computers за предоставленную видеокарту HIS Excalibur RADEON 9700 Pro




Дополнительно

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.