XGI Volari Duo V8 Ultra 256MB


«Паровоз одели в форму,
Очень модную везде!
Дали ему супер-норму,
Но ошиблись в КПДе…»


СОДЕРЖАНИЕ

  1. Общие сведения
  2. Особенности видеокарты XGI Volari Duo V8 Ultra 256MB
  3. Конфигурации тестовых стендов и особенности настроек драйверов
  4. Результаты тестов: коротко о 2D
  5. Результаты тестов: RightMark3D: Pixel Filling
  6. Результаты тестов: RightMark3D: Geometry Processing Speed
  7. Результаты тестов: RightMark3D: Hidden Surface Removal
  8. Результаты тестов: RightMark3D: Pixel Shading
  9. Результаты тестов: RightMark3D: Point Sprites
  10. Результаты тестов: Синтетические тесты 3DMark03
  11. Выводы из результатов синтетических тестов
  12. Результаты тестов: Игровые тесты 3DMark03: Game1
  13. Результаты тестов: Игровые тесты 3DMark03: Game2
  14. Результаты тестов: Игровые тесты 3DMark03: Game3
  15. Результаты тестов: Игровые тесты 3DMark03: Game4
  16. Результаты тестов: Quake3 ARENA
  17. Результаты тестов: Serious Sam: The Second Encounter
  18. Результаты тестов: Return to Castle Wolfenstein
  19. Результаты тестов: Code Creatures DEMO
  20. Результаты тестов: Unreal Tournament 2003
  21. Результаты тестов: AquaMark3
  22. Результаты тестов: RightMark 3D
  23. Результаты тестов: Tomb Raider: Angel of Darkness
  24. Результаты тестов: Half-Life2 (Beta)
  25. Результаты тестов: HALO
  26. Результаты тестов: Unreal II
  27. Выводы из результатов тестов
  28. Качество 3D: Анизотропная, билинейная и трилинейная фильтрации
  29. Качество 3D в целом
  30. Выводы

Общие сведения

Мы начинаем, пожалуй, один из самых сложных материалов, за все время существования раздела 3D-Video на нашем сайте. Почему мы так считаем? — Об этом чуть далее — ответ состоит более чем из двух слов.

Что такое компания XGI? Официально сказано, что фирма образована в 2003 году силами сотрудников купленного SIS графического подразделения Trident, а также графического сектора самой компании SIS. На деле это означает, что Trident продал свой бизнес компании SIS, а та, в свою очередь, вообще отказалась от этого бизнеса, отдав его вновь образованной XGI.

Да, можно считать, что фактически XGI создана силами SIS, однако, в отличие от S3 Graphics, которая не является независимой фирмой и принадлежит VIA, XGI — отдельная организация. Более того, SIS не передала даже торговые марки по графике (Xabre и др.). Но может ли это служить основанием для мысли, что все новые продукты XGI разработаны с нуля? Скорее всего, нет.

Посмотрите на коллаж выше. В нем недвусмысленный намек на то, что Volari — это фактически Xabre II. Мы помним, что во время активных попыток протолкнуть Xabre на рынок, roadmap фирмы SIS имел это кодовое название, намеченное к выпуску на 2003 год. Однако, практика показала, что выпуск Xabre ничего, кроме убытков, не принес, первоначально кинувшиеся к этому продукту производители постепенно стали отказываться от него, ибо Xabre имел много недостатков, сильно нивелирующих его. Компания Chaintech, выпустив довольно много карт, до сих пор пытается освободить склады от них. Многие компании пошли на убытки, желая продать их хоты бы за любую цену (отсюда появление Xabre400-карт по цене 35 долларов в розницу).

Понятно, что все это вынудило SIS принять решение: или закрыть подразделение по графике, либо, дав ему денег и свои наработки, а также «пинка под зад», пустить в свободное плавание. Второй вариант и был реализован. Сами посудите, нормальная разработка полноценного графического продукта требует минимум 1.5..2 года работы, и это с учетом наличия предыдущих поколений и наличия слаженной команды разработчиков с большим опытом (таких, как в компаниях ATI и NVIDIA). А тут, фирма через полгода после своего образования уже выносит на суд публики свое первое дитя. Да еще какой сложности — двухчиповый DirectX 9 продукт! Разумеется, для его реализации были использованы наработки предыдущей команды SIS. И, скорее всего, изменения (как в аппаратной так и в програмной части) были минимальными. Если посмотреть на скриншоты драйверов (приведены далее ниже в статье), то очевидны «уши программистов из команды SIS Xabre», которые не стали менять даже внешний облик панелей управления.

Назовем главную беду всех производителей второго эшелона (Trident, SIS, XGI): практическое отсутствие какой-либо эффективной работы с разработчиками игр до офицальной публикации оных! Ведь выпускаются продукты игрового класса, и вся их 3D-мощь должна раскрываться именно в играх! А разработчики подчас и не тестируют свои продукты на таких платах перед публикацией. Поэтому, залечивать ошибки и глюки вынуждены только лишь программисты упомянутых компаний-производителей, и уже постфактом, после выхода приложений. Они подчас идут по пути наименьшего сопротивления: понизить качество, какие-то функции отключить, лишь бы не глючило. Возможно в 1998 году это и устроило бы большинство пользователей, но только не в 2003-2004 годах! Сейчас эра детализаций, отменного качества отображения всех деталей сцен, и размазня не нужна даже непритязательным пользователям.

Вторая беда — это наивность в отношении к современным технологиям, в частности, эффективного доступа к памяти, экономии ПСП, кэширования и оптимизации вычислений. ATI и NVIDIA выпускают сложнейшие чипы содержащие 110-130 млн. транзисторов, в них широко используются упомянутые технологии, многие из которых отлаживались и совершенствовались в нескольких поколениях чипов подряд. К сожалению, лозунг Trident, после которого компания и рассталась с графическим подразделением «30 млн. транзисторов в наших продуктах дадут то же самое, что и 100 млн. у NVIDIA и ATI», не давал покоя не только самому Trident, но и SIS, и, по всей видимости, VIA. Но мы то знаем, что чудес не бывает. Мало запихнуть в ядро 4-8 конвейеров рендеринга, 8 текстурных блоков… Надо заставить работать их эффективно, без простоев, подумать о кэшировании, о тайловых технологиях оптимизации вычислений, создать драйверы и компиляторы шейдеров оптимально использующие возможности железа. А это требует времени и ресурсов, измеряемых не считанными годами сотни человек, а десятками лет труда тысяч специалистов.

Кроме того не забываем, что в случае использования шейдеров все 8 обещанных конвейеров рендеринга сводятся к фикции, поскольку шейдерных конвейеров в 2 (по официальным данным, забегая заранее, отметим, что может быть и в 4) раза меньше. Поэтому, скорость продуктов SIS, например, в шейдерных приложениях, не выдерживает никакой критики и сравнений — она просто никакая!

К сожалению, наследие SIS сыграло свою роль и здесь. Продукты XGI так-же имеют наполовину меньше шейдерных конвейеров, относительного их общего числа. Посмотрим на то, что предлагает XGI (от самого слабого решения до самого сильного):

  • Volari V3 (V3 Ultra) — DirectX 8.1, 2 пикселя за такт (2 пиксельных ковейера, но только один способен исполнять шейдеры), 2 выборки текстуры за такт, до 200 МГц частота ядра, 25 миллионов транзисторов, 0.13um CMOS технология, 128бит интерфейс памяти;
  • Volari V5 (V5 Ultra) — DirectX 9.0, 4 пикселя за такт (4 пиксельных конвейера, из них два исполняют шейдеры), максимум 4 выборки текстур за такт, до 250 МГц частота ядра, 75 миллионов транзисторов, 0.13um CMOS, 128бит шина памяти;
  • Volari V8 (V8 Ultra) — DirectX 9.0, 8 пикселей за такт максимум (8 конвейеров, 4 в случае пиксельных шейдеров), два вершинных процессора, 8 значений текстур за такт, до 350 МГц частота ядра, 110 миллионов транзисторов, 128бит интерфейс памяти;
  • Volari V8 Duo — два чипа V8 на одной карте. Виртуальные характеристики: DirectX 9.0, 16 пикселов за такт, (16 конвейеров, 8 пиксельных шейдеров), 4 вершинных конвейера, 16 текстур за такт, до 350 МГц ядро, 2 чипа V8 по 110 миллионов транзисторов (0.13um CMOS), 2x128бит шины памяти;

Что можно сказать относительно того — есть ли прогресс? Да, по сравнению с Xabre он явно есть. Взять хотя бы аппаратную поддержку вершинных шейдеров, чего не имел Xabre (в последних версиях драйверов была реализована программная поддержка этих функций). Но это все в спецификациях. А что на деле — покажут тесты.

Посмотрим на схему одиночного V8:

Обратим внимание на организацию шины памяти: 4-канальный (каждый по 32-бит) контроллер памяти. Это весьма положительный момент, хотя это и не 256 бит ставших стандартом для последних разработок ATI и NVIDIA. А теперь глянем на схему Duo:

Очевидно, что двухпроцессорность реализована по уже знакомому нам принципу: ведущий-ведомый процессоры. Между ними особая внутренняя шина, обозначенная как X-Link (она также имеет название BitFluent). Это по сути свой внутренний AGP2x, имеющий ширину в 32бита и работающий на 133 МГц. Процессоры работают также, как и у ATI RAGE MAXX — каждый отрисовывает свой кадр, однако, в отличие от продукта ATI, чипы не ждут друг друга для синхронизации после завершения отрисовки. Недостатком является малая пропускная способность внутренней шины, а ведь именно по ней идет обмен данными между приложением и ведомым процессором, который также должен постоянно сообщать ведущему о своих результатах. Кроме того, не забываем что при такой конфигурации большинство данных дублируются в обеих буферах памяти, а кэширование производится каждым чипом отдельно и, соответственно, менее эффективно чем в случае одного чипа с 256 битной шиной памяти. Мы уже не один раз рассматривали работу двухпроцессорных видеокарт и везде встречали свои нюансы и узкие места. У 3dfx Voodoo5 реализация совместной работы чипов была на высоте, однако она вызвала сильное увеличение себестоимости продукта. Легко предсказать, что в случае обычных игровых применений, не выходящих за рамки современных игр и топовых решений ATI или NVIDIA, конфигурация из двух чипов с 128бит шинами памяти ВСЕГДА будет менее эффективна (особенно с точки зрения соотношения цена-производительность) чем передовое одночиповое решение с 256 бит шиной памяти и более сложным и высокочастотным ядром. Поэтому, выбор двух процессорной конфигурации может быть объяснен только невозможностью создать чип по эффективности и/или сложности адекватный лучшим продуктам ATI и NVIDIA.

Ниже мы рассмотрим сравнительные характеристики XGI Volari Duo V8 Ultra. Для сравнения выбраны NVIDIA GeForce FX 5900 Ultra и ATI RADEON 9800 PRO 128MB как продукты, имеющие сходную цену примерно в 400 долларов США (в московской рознице на середину февраля). Как известно, RADEON 9800 PRO начал свое падение по цене, и сейчас можно найти эти карты и за 320-330 долларов, но иных продуктов от этой компании по цене в 400 долларов на рынке сейчас просто нет.


  GeForce FX 5900 Ultra RADEON 9800 PRO Volari Duo V8 Ultra
Технология, нм. 130 150 130
Транзисторов, млн. 135 110 110
Пиксельных конвейеров 4 (8-только Z) 8 2x8
Вершинных конвейеров 3 4 2x2
Текстурных блоков 8 8 2x8
Частота ядра, Мегагерц 450 380 350 (330-у Club3D)
Шина памяти, бит 256 256 2x128 (DDR2)
Частота шины памяти (эфф.) Mегагерц 850 680 900
Пиксельные шейдеры 2.0+ 2.0 2.0
Вершинные шейдеры 2.0+ 2.0 2.0
ПСП, гигабайт в сек. 27.2 21,8 2x14,4 (28,8)
HSR Да Да Да
Ранний Z тест Да Да Да
Сжатие Z Да Да Нет
Сжатие цвета в MSAA режимах До 1:4 До 1:4 Нет
Аппаратный геометрический блок Есть Есть Есть
RAMDAC, Мегагерц 2х400 2х400 2х400
TV-out Встроен Встроен Внешний
DVI Встроен Встроен Встроен
Корпус FCPGA FCPGA FCPGA
Внешнее питание Желательно (Ultra) Обязательно Обязательно (два коннектора)

Более подробный список поддерживаемых DirectX драйверами чипа возможностей вы можете скачать тут:

Volari Duo D3D CAPS Report

Плата



В качестве образца мы рассматриваем серийно выпускаемую карту от компании Club3D. Она снабжена интерфейсом AGP x2/x4/x8, 2x128 МБ локальной памяти GDDR-II SDRAM (16 микросхем, размещенных на лицевой и оборотной сторонах PCB).


На карте установлены микросхемы памяти Samsung марки K4N26323AE-GC20, форм-фактора BGA. Максимальная частота работы — 500 (1000) МГц, время выборки — 2 нс. По умолчанию память работает на частоте 450 (900) МГц, ядро — 330 МГц. (обратим внимание, что серийные карты от Club3D имеют пониженные частоты по ядру 330 МГц вместо обещанных 350 МГц



XGI Volari Duo V8 Ultra 256MB

Очевидно, что сама PCB очень сложна. Несмотря на поддержку только 128-битной шины обмена с памятью для каждого чипа, в сумме, разведена 256-битная шина с поддержкой DDR-II, что потребовало 10-слойного дизайна:

Рассмотрим процессоры ближе:



Они изготовлены по 0.13 мкм техпроцессу на мощностях UMC. Упаковка дорогая — FCBGA, однако столь сложные кристаллы имеющие очень высокий нагрев в другой упаковке выпустить нереально. Согласно официальныи данным, каждый чип потребляет около 20Вт, но главным пожирателем электричества является конечно сильногреющаяся DDR-II память. В целом можно ожидать, что карта потребляет около 120Вт(!), что превышает потребление самых быстрых продуктов ATI и NVIDIA. Поэтому, она требует дополнительного питания, да еще и через два коннектора (блок питания карты весьма сложен).

Кстати, кулеры имеют приятную подсветку. Ну если уж заговорили о системе охлаждения, то рассмотрим ее подробнее.

Устройство охлаждения представляет собой два больших медных радиатора (то, что они медные, даже доказывать не надо, достаточно попробовать их на вес :) ).

Лицевой радиатор призван охлаждать как два чипа, так и 8 микросхем памяти. Представляет собой единую пластину, на которую приклеены термоэлементы для прижима к микросхемам памяти. На нем установлены два вентилятора. Шум от вентиляторов очень высок! Прежде всего в высокочастотном диапазоне, поскольку у вентиляторов очень большие обороты.

Оборотный радиатор призван охлаждать вторые 8 микросхем памяти и представляет собой также единую пластину.

Надо отметить, что при работе без дополнительного охлаждения заметного перегрева карты не было зафиксировано. Все радиаторы имели температуру ниже болевого порога, и их можно спокойно трогать.

Но охладители не только на микросхемах и ядрах. Отдельные элементы блока питания, отвечающие за преобразования токов, требуют также тщательного охлаждения, поэтому также имеют свои радиаторы.

Интересно сравнить длину этой карты с широкоизвестной двухпроцессорной Voodoo5 5500:

Как мы видим, новый продукт все же покороче, чем прошлый :).

И еще: Volari Duo V8 Ultra обладает VIVO. Если TV-out исполнен с помощью извечного партнера всех процессоров от SIS: SIS 301,

то Video-In реализован при помощи процессора от Conexant BT835:

Наш сотрудник Алексей Самсонов, который исследует VIVO и ТВ-тюнеры, уже увидел этот кодек, ждет-не дождется протестировать его :)

В заключении рассмотрения работы этой карты надо отметить, что по своей казалось бы громоздкости, она не занимает лишнего PCI-слота.

Комплект поставки:

Внутри коробки можно найти руководство пользователя, диски с ПО и PowerDVD, а также ПО для VIVO. Плюс переходник-разветвитель VIVO, DVI-to-d-Sub, удлинители TV и фирменную наклейку на корпус.


Ретейл-упаковка:

Коробка из толстого картона, без супер-обложки. Дизайн темных тонов.


Разгон

Оверклокинг такого сложного и сильногреющегося устройства — вещь тяжкая, но все же карта смогла работать на частотах 370/1000 МГц.

Установка и драйверы

Рассмотрим конфигурацию тестового стенда, на котором проводились испытания карт:

  • Компьютер на базе Pentium 4 3200 MHz:
    • процессор Intel Pentium 4 3200 МГц;
    • системная плата DFI LANParty Pro875 (i875P);
    • оперативная память 1024 MB DDR400 SDRAM;
    • жесткий диск Seagate Barracuda IV 40GB;
    • операционная система Windows XP SP1; DirectX 9.0b;
    • мониторы ViewSonic P810 (21") и ViewSonic P817 (21").
    • драйверы XGI версии 1.50.01. VSync отключен.

На стенде использовались мониторы ViewSonic P810 (21") и ViewSonic P817 (21").

Для сравнительного анализа приведены результаты уже знакомых читателям видеокарт:

  • ASUS V9950 Ultra (GeForce FX 5900 Ultra, 450/425 (850) МГц, 256 МБ, driver 53.03);
  • HIS Excalibur RADEON 9800 PRO IceQ (380/340 (680) МГц, 128 МБ, driver 6.414);
  • Inno3D Tornado GeForce FX 5700 Ultra (475/450 (900) МГц, 128 МБ, driver 53.03);
  • Sapphire Atlantis RADEON 9600 XT (500/300 (600) МГц, 128 МБ, driver 6.414);

Настройки драйверов

















Как я уже ранее говорил, настройки драйверов даже внешне имеют тот же облик, что было у Xabre. Полагаю, что все говорят скриншоты, пояснять чего-либо нет нужды.

Результаты тестов

2D-графика

Традиционно начнем с 2D. Отметим, что вплоть до 1600х1200 при 75Гц включительно нареканий на качество нет.

Если кандидаты в президенты России будут вам вещать, что оценка 2D-качества есть вещь объективная, то не верьте им, и не голосуйте за них,ибо «правильный» кандидат считает, что оценить объективно сие невозможно, и он прав! Поэтому напомню, что качество зависит от конкретного экземпляра, да и связка карта-монитор может по-прежнему играть огромную роль. Прежде всего, надо обращать внимание на качество монитора и кабеля. Я напомню, что тестирование 2D у нас происходит на мониторе ViewSonic P817-E совместно с BNC-кабелем Barсo.

Синтетические тесты D3D RightMark (DirectX 9)

В этой статье мы представим вам подробные описания и результаты тестирования, полученные с помощью разрабатываемого нами набора гибко-конфигурируемых синтетических тестов для API DX9.

Набор синтетических тестов из разрабатываемого нами тестового пакета RightMark 3D включает в себя (на данный момент) следующие тесты:

  1. Тест на закраску и фильтрацию текстур (Pixel Filling Test);
  2. Тест на производительность обработки геометрии (Geometry Processing Speed Test);
  3. Тест на производительность работы с отсечением невидимых точек и примитивов (Hidden Surface Removal Test);
  4. Тест на производительность сложных пиксельных шейдеров (Pixel Shader Test);
  5. Тест на производительность отрисовки, освещения и анимации спрайтов (Point Sprites Test).

Полагаем, что нет смысл повторять здесь освещение идеологических вопросов тестирования, поэтому еще раз просим желающих узнать по-подробнее об идеологии синтетических тестов прочитать внимательно материал по NV30. Там же можно найти и их описание.

Для тех, кто горит желанием экспериментировать с синтетическими тестами RightMark 3D, или измерить производительность собственных ускорителей, мы предлагаем скачать и опробовать последний вариант нашего теста, доступный на его сайте D3D RightMark Beta 3. Тесты снабжены удобной общей оболочкой и гибким экспортом результатов. Кроме того, вы можете скачать все использованные в данном обзоре настройки тестов.

Мы будем благодарны любым откликам, как в плане пожеланий и идей, так и информации об ошибках или странном поведении тестов.

Пишите по адресу: unclesam@ixbt.com.

Pixel Filling

  1. Для начала измерим максимальный пиксельный fillrate для различного числа текстур. Это позволит нам определить реальное (эффективное) число и конфигурацию пиксельных конвейеров. Для исключения влияния прочих факторов, в этом тесте мы используем текстуры минимального размера и отключим какую либо фильтрацию. Итак:

    В случае 0 и 1 текстуры мы получаем практически одинаковые результаты. Это значит что тест идет хорошо, и выборка текстур не влияет на процесс — мы измеряем только скорость закраски и заполнения буфера кадров. Хорошо заметно, что NVIDIA имеет конфигурацию с 2 текстурными блоками на один пиксельный конвейер, а ATI — с одним, но большее число конвейеров. Но с Volari происходит что-то странное. Некий фактор (предположительно скорость записи в память?) существенно ограничивает его эффективную скорость закраски. Фактически, пока число текстур не достигает 4 на один пиксель, fillrate не начинает падать. Это возможно в двух случаях — реальная конфигурация чипа V8 не 8х1 а 4х2, или (а может быть и И), эффективная полоса пропускания памяти каждого из чипов при работе с буфером кадров не достаточна для записи информации всех конвейеров без снижения скорости. И тот и другой сценарий печальны, т.к. можно легко представить себе реальные приложения, на производительности которых эти факты скажутся отрицательно. Например закраска неба в симуляторах или предварительная отрисовка данных (глубины) для построения теней в Doom III.

    Возможно, что реально чип представляет собою некий суперконвейер с 8 текстурными блоками и неким набором параллельных ALU, которые обрабатывают разное число пикселов за такт в зависимости от сложности алгоритма обработки (отсюда меньшее число конвейеров, указанное в спецификации для пиксельных шейдеров). Впрочем это теоретический аспект, а главное, что даже с этой, простейшей, задачей чип справился столь неэффективно, если не считать случая с 4 текстурами, где Volari cумел обогнать конкурентов за счет наличия в сумме 16 текстурных блоков. Вывод: работа с буфером кадра реализована не столь эффективно как хотелось бы, заявленная конфигурация 16х1 в большинстве случаев проигрывает 8х1 и 4х2 в исполнении конкурентов. До 5600 миллионов пикселей теоретического предела двух V8 далеко как до небес, и вину за это следует возлагать на неэффективную архитектуру чипа и подсистемы памяти.

    Ранее мы производили закраску с использование фиксированных функций (доступных еще со времен DirectX 7). Посмотрим как изменится картина для различных версий шейдеров:



    Разгром просто ужасающий! Если конкуренты исполняют простые шейдеры без потери производительности (небольшое исключение — 2.0 на NVIDIA в случае 2х текстур, скорее полезная для реальных приложений аномалия оптимизирующего компилятора, чем недостаток архитектуры), то XGI стремительно проигрывает, делая эту функцию чипа строчкой в спецификации, а не реально функционирующей возмножностью. Позор.

    Заметьте, что падение скорости закраски происходит теперь при задействовании каждой дополнительной текстуры. Видимо, вычислительные ресурсы текстурных блоков и шейдерных конвейеров используются совместно (т.е. один и тот же массив ALU служит как для интерполяции координат, так и для шейдерных вычислений). Вот вам и экономия транзисторов.

  2. Тест на скорость выборки текстур, в зависимости от их числа и размера позволит нам определить эффективность. Приведены результаты в миллионах текселов в секунду, для 1, 2 и 4 текстур накладываемых на один пиксель и для разных разрешений текстур:

    Если в случае маленьких размеров текстур результаты Volari порой выглядят вполне конкурентноспособными, то по мере роста размеров текстур, видимо, сказывается низкая эффективность их кэширования и работы с памятью — результаты вновь становятся настолько низкими, что никакой речи о конкуренции с продуктами ATI или NVIDIA быть не может. Причем, это заметно уже на текстурах размером 128х128, не говоря уже о 256х256 — а ведь эти размеры наиболее популярны в реальных приложениях! Работать с памятью надо уметь. Число конвейеров остается только цифрой, если вы не способны своевременно накормить все эти конвейеры данными.

  3. Теперь, для полноты картины, проведем тест на скорость выборки текстур, в зависимости от их формата и размера. Приведены результаты в миллионах текселов в секунду, для различных форматов текстур двух размеров — 256х256 и 2048х2048:

    Что еще можно сказать? Там где Volari co скрипом справляется с текстурой размером 256х256, NVIDIA и ATI спокойно могут позволить себе прекрасное качество и детализацию 2048х2048(!) на равной скорости. И это при более низкой физической пропускной полосе памяти. Знания — сила, а кое-какерам — позор.

  4. Посмотрим, как меняется скорость выборки текстур в зависимости от типа фильтрации. Для этого возмем распространенный размер текстуры 128х128 и проверим результаты для 1,2 и 4 текстур на пиксель:

    Билинейная фильтрация не стоит для Volari практически ничего (как и должно быть у любого современного чипа), использование mip-уровней заметно повышает эффективность кэширования и как следствие особенно хорошо сказывается на большом числе текстур, а вот трилинейная фильтрация дается не бесплатно, очевидно, что текстурные блоки объединяются парами — на 4 текстурах скорость упала сильнее всего, а ранее, отличия нивелировала низкая эффективность работы с буфером кадров, которую мы наблюдали в первых тестах.

  5. Напоследок, посмотрим, насколько эффективно по сравнению с конкурентами выполняется трилинейная фильтрация, как известно, еще более требовательная к кэшированию и доступу к памяти, чем билинейная:

    Ужас.

Geometry Processing Speed

Займемся исследованием геометрической производительности ускорителя.

  1. Производительность фиксированного TCL (или производительность эмулирующего его шейдера):

    Пока все не так уж плохо. По мере роста сложности задания, ATI (не имеющая специальной аппаратной поддержки для быстрой эмуляции старого фиксированного T&L) начинает проигрывать Volari. Но, пиковая пропускная способность продукта XGI не соответствует сегодняшнему дню и смотрелась бы лучше в сравнении с картами предыдущих поколений. NVIDIA остается лидиром во всех тестах, фиксированный T&L традиционно является ее сильной стороной, благодаря наличию специальных аппаратных блоков (можно сказать — специальной дополнительной инструкции для вершинного шейдера), обеспечивающей быстрый комплексный рассчет источника освещения. Итак, поздравляем: перед нами первый синтетический тест, резултаты Volari в котором можно рассматривать без слез!

    С другой стороны, лимит в ~60 миллионов треугольников и столь слабая зависимость от сложности задачи могут навести на мысль об программной или программно-аппаратной эмуляции T&L. Тогда, столь странная зависимость, могла бы быть объяснена сдерживающим фактором AGP шины, а результат в 60 миллионов треугольников вполне по плечу современным SSE2 процессорам.

  2. Теперь обратимся к вершинным шейдерам 1.1:

    Volari вновь вне конкуренции. В печальном смысле этого слова.

  3. А теперь самое интересное — шейдеры 2.0 с циклами:

    Известное слабое место NVIDIA (косвенная индексация регистров выполняется не очень быстро и в итоге приводит к низкой скорости исполнения циклов, в которых она встречается практически во всех распространенных алгоритмах) ставит ее в неудобное положение, приближая результаты к Volari. Впрочем, даже в случае этого известного недостатка конкурента, XGI все равно умудрились оказаться в заметном проигрыше. Приграв NVIDIA вдвое(!) а ATI еще больше.

Hidden Surface Removal

Проверим максимальную эффективность HSR в процентах в зависимости от сложности сцены (производительность HSR), и усредненное отличие обработки хаотичной и оптимально сортированной сцены (добротность алгоритма HSR) на сцене без текстур. Мы не будем приводить результаты с выборкой текстур, ввиду очень неэффективной работы Volari с текстурами: только без них мы сможем измерить реальную эффективность именно HSR подсистемы этого чипа:

Итак, максимальная теоретическая эффективность выше у ATI — сказывается иерархический буфер глубины, кроме того, у Volari также наблюдается некий всплеск в этом случае для сцены средней степени сложности. NVIDIA на последнем месте, но как мы видим в других тестах, узкие места Volari сводят на нет этот потенциальный источник преимущества. Возможно HSR на Volari также имеет не один уровень отсечения. В эффективности алгоритма чипы показывают себя приблизительно равными. Большинство из них сбалансированны для сцен средней сложности.

Pixel Shading

В данном тесте мы измерим производительность аппаратного исполнения пиксельных шейдеров версии 2.0:

  1. Сам тест, шейдеры 2.0, производительность арифметических операций:

    Грустная история, особенно в случае простого шейдера. Volari проигрывает всем. NVIDIA проигрывает ATI, причем разница в 16 и 32 бит уже не столь заметна на последних драйверах. ATI в плане пиксельных вычислений (не путать с выборкой текстур) впереди планеты всей.

  2. Давайте посмотрим, изменятся ли результаты при использовании альтернативных алгоритмов для тех же самых задач, когда предпочтение отдается не вычислениям с помошью арифметических комманд а выборке данных из заранее рассчитанных таблиц (LUT — Look Up Tables), размещенных в текстурах. Такой подход может несколько изменить расстановку сил — не забываем что продукты ATI лучше сбалансированы в области вычислений а NVIDIA — в области выборки данных. Посмотрим в какой лагерь попадет Volari:

    Кардинально расклад не поменялся, но NVIDIA получила небольшое преимущество. Volari выборку данных не жалует — в этом плане его поведение ближе к ATI. Впрочем по абсолютным цифрам результаты Volari не сравнимы с ATI — налицо многократный проигрыш.

Point Sprites

Итак, на последок — спрайты. В зависимости от размеров:

Опять позор. ATI и NVIDIA прекрасно знают свое дело а в Volari эта возможность реализована сугубо минимальна. И опять всему виною низкая эффективность работы с буфером кадров.

3D-графика, 3DMark03 v.3.40 — синтетические тесты

Подчеркну, что все замеры по всем 3D-тестам проводились в 32-битной глубине цвета.

Скорость закраски





В случае мультитекстурирования:



В принципе данные согласуются с тем что мы получили ранее в тесте D3D RightMark, хотя и есть небольшие различия — результаты Volari в случае одной текстуры чуть лучше (но по прежнему в несколько раз ниже его теоретических пределов), а вот из ATI и NVIDIA тест выжимает меньшие значения. Сказывается отличия к подходу построения этих синтетических тестов — но, разумеется, мы склоняемся больше доверять нашему собственному методу измерения скорости закраски, исходные тексты которого доступны для всех желающих на сайте D3D RightMark.

Пиксельный шейдер





Результаты хорошо согласуются с увиденными ранее.

Вершинные шейдеры





Результаты хорошо согласуются с увиденными ранее.

Выводы из результатов синтетических тестов

Выводы печальны:

  1. Плохая балансировка подсистем чипа;
  2. Катастрофически низкая производительность работы с буфером кадра и закраски;
  3. Низкая производительность кэширования и выборки текстур;
  4. Катастрофически низкая производительность вершинных и пиксельных шейдеров, причем как 1.1 так и 2.0.
Все эти пункты не позволяют надеятся на сколь-нибудь приемлимую скорость в реальных приложениях. Более того, можно предвидеть то, что результаты Volari в реальных приложениях будут недостаточны даже для карт среднего класса, стоящих в два-три раза меньше.

Сказывается небрежная, неумело разработанная архитектура чипа, отсуствие необходимых знаний и опыта у разработчиков.

3D-графика, 3DMark03 — игровые тесты

3DMark03, Game1

Характеристики теста Wings of Fury:

  • DirectX 7.0 тест; примерно 32000 полигонов в сцене, под текстуры используется 16 мегабайт видеопамяти, 6 мегабайт для буферов под вершины и 1 мегабайт для индексов.
  • Все геометрические операции базируются на использовании вершинных шейдеров 1.1, которые могут эмулироваться через CPU (если "железо" не поддерживает аппаратно).
  • Все самолеты выполнены с помощью 4-х текстурных слоев, поэтому акселераторы, умеющие обрабатывать 4 текстуры за проход, будут в выигрыше.
  • Эффекты дыма и шлейфов выполнены с помощью техник точечных спрайтов и др.


3DMark03, Game2

Характеристики теста Battle of Proxycon:

  • DirectX 8.1 тест; примерно 250 000 полигонов в сцене при использовании пиксельных шейдеров 1.1 (и 150 000 полигонов — если используются шейдеры 1.4), под текстуры используется 80 мегабайт видеопамяти, 6 мегабайт для буферов под вершины и 1 мегабайт для индексов.
  • Все геометрические операции базируются на использовании вершинных шейдеров 1.1, которые могут эмулироваться через CPU (если "железо" не поддерживает аппаратно).
  • Все персонажи "одеты" также с помощью вершинных шейдеров.
  • Некоторые источники света производят динамические тени, получаемые при помощи стенсил-буфера.
  • Все пиксельные операции производятся с помощью шейдеров 1.1, или, если это возможно, 1.4.
  • Вычисление попиксельного освещения для эффектов дымок, и других компонентов.
  • Акселераторы, поддерживающие пиксельные шейдеры 1.1, используют один проход для определения Z-буфера, затем по три прохода на каждый источник света. Если акселератор поддерживает шейдеры 1.4, то ему требуется всего по одному проходу на каждый источник света.


3DMark03, Game3

Характеристики теста Trolls' Lair:

  • DirectX 8.1 тест; примерно 560 000 полигонов в сцене при использовании пиксельных шейдеров 1.1 (и 280 000 полигонов — если используются шейдеры 1.4), под текстуры используется 64 мегабайт видеопамяти, 19 мегабайт для буферов под вершины и 2 мегабайта для индексов.
  • Все геометрические операции базируются на использовании вершинных шейдеров 1.1, которые могут эмулироваться через CPU (если "железо" не поддерживает аппаратно).
  • Все персонажи "одеты" также с помощью вершинных шейдеров.
  • Некоторые источники света производят динамические тени, получаемые при помощи стенсил-буфера.
  • Все пиксельные операции производятся с помощью шейдеров 1.1, или, если это возможно, 1.4.
  • Вычисление попиксельного освещения для эффектов дымок, и других компонентов.
  • Для реалистичного отображения волос героини используются физические модели, а также анизотропное освещение.


3DMark03, Game4

Характеристики теста Mother Nature:

  • DirectX 9.0 тест; примерно 780 000 полигонов в сцене, под текстуры используется 50 мегабайт видеопамяти, 54 мегабайт для буферов под вершины и 9 мегабайт для индексов.
  • Каждый лист на деревьях отдельно анимирован при помощи вершинных шейдеров 2.0. Трава анимирована с помощью вершинных шейдеров 1.1.
  • Поверхность озера образована при помощи пиксельных шейдеров 2.0.
  • Небо также получено при помощи пиксельных шейдеров 2.0, для солнечных бликов используется реализованная в DX9 повышенная точность расчетов.
  • Поверхность земли получена с помощью шейдеров 1.4.


Итак, что нам показали тесты в 3DMark03? Да ничего хорошего для детища XGI! И заточки не спасли. Ниже в разделе качества мы покажем, какое качество графики при этом показывает эта карта.

Обратим еще раз внимание на скорость при работе с шейдерами. Годится такое положение вещей для двухпроцессорного ускорителя ценой в 400 долларов? — думаю, что тут даже говорить нечего, ибо это вопиющее безобразие.

3D-графика, игровые тесты

Приступаем к оценке производительности видеокарты в 3D-играх. В качестве инструментария мы использовали:

  • Return to Castle Wolfenstein (MultiPlayer) (id Software/Activision) — OpenGL, мультитекстурирование, Checkpoint-demo, настройки тестирования — все на максимально возможном уровне, S3TC OFF, конфигурации можно скачать тут

  • Serious Sam: The Second Encounter v.1.07 (Croteam/GodGames) — OpenGL, мультитекстурирование, Grand Cathedral demo, настройки тестирования: quality, S3TC OFF

  • Quake3 Arena v.1.17 (id Software/Activision) — OpenGL, мультитекстурирование, Quaver, настройки тестирования все на максимальном уровне: уровень детализации — High, уровень детализации текстур — №4, S3TC OFF, плавность кривых поверхностей резко увеличена при помощи переменных r_subdivisions «1» и r_lodCurveError «30000» (подчеркну, что по умолчанию r_lodCurveError «250» !), конфигурации можно скачать тут

  • Unreal Tournament 2003 v.2225 (Digital Extreme/Epic Games) — Direct3D, Vertex Shaders, Hardware T&L, Dot3, cube texturing, качество по умолчанию

  • Code Creatures Benchmark Pro (CodeCult) — игровой тест, демонстрирующий работу платы в DirectX 8.1, Shaders, HW T&L.

  • Unreal II: The Awakening (Legend Ent./Epic Games) — Direct3D, Vertex Shaders, Hardware T&L, Dot3, cube texturing, качество по умолчанию

  • RightMark 3D v.0.4 (одна из игровых сцен) — DirectX 8.1, Dot3, cube texturing, shadow buffers, vertex and pixel shaders (1.1, 1.4).

  • Tomb Raider: Angel of Darkness v.49 (Core Design/Eldos Software) — DirectX 9.0, три разных записанных demo. Тестирование проводилось при максимально установленном качестве, выключены были лишь Depth of Fields PS20. настройки тестирования приведены здесь.

  • HALO: Combat Evolved (Microsoft) — Direct3D, Vertex/Pixel Shaders 1.1/2.0, Hardware T&L, качество максимальное

  • Half-Life2 (Valve/Sierra) — DirectX 9.0, две разных записанных demo (ixbt07 и coast). Тестирование проводилось при включенной анизотропной фильтрации, а также в тяжелом режиме с АА и анизотропией.

Также, если кто хочет получить демки-бенчмарки, которыми мы пользуемся, то напишите на мой e-mail.

Quake3 Arena, Quaver



Serious Sam: The Second Encounter, Grand Cathedral



Return to Castle Wolfenstein (Multiplayer), Checkpoint



Code Creatures



Unreal Tournament 2003



AquaMark3



RightMark 3D



TR:AoD, paris5_4



Half-Life2 (beta), ixbt0703



HALO



Unreal II



Выводы по результатам тестирования

Очевидно, что продукт от XGI проиграл просто по-страшному! Заметим, что часто эта карта отстает даже от середняков, таких как FX 5700 Ultra и RADEON 9600 XT. Особенно снова видно поражение при работе с шейдерами.

Даже без всяких переименований EXE-файлов игр очевидно, что заточки под то или иное приложение имеются, поскольку, например, в Splinter Cell вдруг у Volari появилось второе дыхание, и карта даже где-то выиграла. Хотя при этом качество рендеринга… Но об этом ниже.

Качество 3D-графики

Перед тем, как коснуться аспекта качества рендеринга в целом, интересно рассмотреть — что дает анизотропия, а также посмотреть на качество реализации би- и три-линейных фильтраций.

АНИЗОТРОПНАЯ, ТРИЛИНЕЙНАЯ и БИЛИНЕЙНАЯ ФИЛЬТРАЦИИ

В качестве инструмента тестирования мы взяли тот же RightMark3D, на примере теста Pixel Filling и рассмотреим.

Напомню, что Volari поддерживает только 4х степень анизотропной фильтрации.

GeForce FX 5900 Ultra RADEON 9800 PRO Volari Duo V8 Ultra
Bilinear
Trilinear


Мы видим, что качество билинейной фильтрации у Volari ужасное. Когда трилинейка вполне нормальная.

ANISOTROPIC и угол наклона GeForce FX 5900 Ultra RADEON 9800 PRO Volari Duo V8 Ultra
ANISOTROPIC without Trilinear
ANISO 8xQ/16xQ/4x, 0 градусов
ANISO 8xQ/16xQ/4x, 30 градусов
ANISO 8xQ/16xQ/4x, 45 градусов
ANISO 8xQ/16xQ/4x, 60 градусов
ANISOTROPIC with Trilinear
ANISO 8xQ/16xQ/4x, 0 градусов
ANISO 8xQ/16xQ/4x, 30 градусов
ANISO 8xQ/16xQ/4x, 45 градусов
ANISO 8xQ/16xQ/4x, 60 градусов


Качество 3D-графики в целом

Первоначально в списке тестовых инструментов была и недавно вышедшая ДЕМО-версия игры Far Cry, показывающая всю прелесть шейдерных технологий.

Однако ниже вы поймете, почему в тестах производительности ее нет.

GeForce FX 5900 Ultra RADEON 9800 PRO Volari Duo V8 Ultra
3DMark03, Game1
3DMark03, Game2
3DMark03, Game3
3DMark03, Game4
AquaMark3
Half-Life2


Итак, мы увидели, что качество рендеринга у Volari действительно неважное, если не сказать сильнее. Есть ли смысл искать заточки и способы поправки качества, когда мы и так видим, что производительность сильно проигрывает? — Думаю, что нет. И так все ясно :-(.



GeForce FX 5900 Ultra RADEON 9800 PRO Volari Duo V8 Ultra
Far Cry, пример1, No ANIS, No AA
Far Cry, пример2, No ANIS, No AA
-
Far Cry, пример3, No ANIS, No AA
-
Far Cry, пример4, No ANIS, No AA
-
Far Cry, пример5, No ANIS, No AA
-
Far Cry, пример6, No ANIS, No AA
-


Ну теперь, думаю, что всем ясно, почему нет тестов Volari в этой игре, поскольку только эта карта посчитала, что в игре наступила безлунная ночь, и потому ничего не видно. Ну понятно, что демо-версия вышла недавно, драйверы не успели еще «заточить». Плюс наглядная демонстрация мысли, что я высказал в начале — отсутствие какой-либо работы с девелоперами.

Выводы

Полагаю, что у читателя уже сложилось определенное мнение об Club3D Volari Duo V8 Ultra. Прежде всего, это очень сырой продукт. Как вообще компания XGI решилась выпустить его на рынок? Дело даже не сколько в драйверах (хотя они нестабильны, и требуют еще очень много работы), а в том, что сама архитектура карты себя не реализует. Хотя филлрейт показывает, что работают оба чипа, создается ощущение, что на реальных приложениях мы меряли однопроцессорную, куда как более слабую, карту. Даже один чип с восьмью конвейерами и частотой 330 МГц должен демонстрировать более выдающееся результаты, а тут их ДВА! Может быть разработчики имели в виду, что второй чип — запасной? Если первый сгорит, то второй послужит горячей заменой? Тогда результаты Volari можно еще как-то объяснить. Но зачем все эти внутренние шины? :)

За красотой карты и стильным внешним видом скрывается ужас наспех сделанного продукта. Вероятно в чипе столько ошибок, что драйверам очень тяжко их исправлять. Возможно, что виною всему бездарная работа разработчиков чипа или программистов, написавших драйвера. Факт остается фактом: не реализовано и 50% потенциала карты. Будем надеятся что следующие творения XGI, по мере выхода (если таковой случится) будут все более и более законченными продуктами.

  1. Данный продукт не стоит и 150 долларов с точки зрения производительности;
  2. Данный продукт не стоит и 50 долларов с точки зрения совместимости и стабильности работы.
  3. Не видно перспектив по исправлению ситуации с увеличением производительности, основные проблеммы кроются в самой архитектуре ускорителя.
  4. Вероятно XGI получает прибыли только от продажи сэмплов таких карт обозревателям, ибо, они практически не высылали образцов, но продать их всегда готовы ;-)
  5. Судя по тому, сколько фирм (от силы 1-2) налетело на эти изделия, Volari будут «ну очень популярны»
  6. Жаль компанию Club3D, которая «вляпалась» в этот продукт…

Пока же мы не можем рекомендовать эту карту к приобретению, иначе, как коллекционерам аппаратных редкостей и курьезов. Лозунг рекламы наоборот в действии: «зачем платить втрое меньше за ту же скорость, когда есть такая недоделанная двухчиповая карта».

Уже после выхода статьи в свет пришла информация о том, что ряд китайских производителей готовят выпустить свои подобные карты Volari Duo V8 Ultra с розничными ценами не выше 200 долларов. Если такое случится, то появилась хоть какая-то призрачная надежда…

К тому же 11 февраля вышли новые драйверы версии 1.02.05, в которых исправлены некоторые ошибки, приводящие ранее к падению теста или игры. К сожалению, чернота в FarCry пока так и не исправлена.




Дополнительно

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.