Сравнительное исследование профессиональных 3D-акселераторов

в SPECviewperf 7: июнь 2002 года


"Все течет, все изменяется, все растет и утолщается". Этот афоризм как нельзя кстати подходит к новой версии теста SPECviewperf. Не так давно мы тестировали работу профессиональных ускорителей этим тестом, а уже вышла новая версия, и это просто наш долг — рассказать вам о результатах. Данный тест достаточно сильно изменился по сравнению с предыдущей версией, поэтому в сравнении версий смысла никакого нет. Если вас интересуют результаты старой версии, то их можно посмотреть по ссылке .

Седьмая версия SPECviewperf состоит из шести тестов, здесь я коротко расскажу о каждом тесте.

3ds max Viewset (3dsmax-01)

Итак, первый тест под названием 3ds max Viewset (3dsmax-01) был создан на основе графики, полученной с помощью 3ds max 3.1. Во время трассировки использовался драйвер плагина OpenGL из Discreet.

       

Модели для этого набора взяты из теста SPECapc 3ds max 3.1. Каждая модель измерялась с помощью двух разных моделей освещения, чтобы отразить круг потенциальных пользователей 3ds max. Модель высокой сложности использует от 5 до 7 локальных источников света, согласно тесту SPECapc, и отражает работу с 3ds max пользователя высокого уровня. Модели освещения средней сложности используют 2 локальных источника света, это более распространенное окружение освещения.

Набор основан на трассировке работающего приложения и включает все изменения состояния, обнаруженные во время нормальной работы 3ds max. Непосредственные OpenGL вызовы используются для передачи данных к графической подсистеме.

В случае SPECapc, тесты включают на 1/3 плавную закраску, на 1/3 закраску граней и на 1/3 каркас.

ТестВесОписание
15.5Juggler, плавная закраска, освещение средней сложности
25.5Juggler, плавная закраска, освещение высокой сложности
35.5Juggler, закраска граней, освещение средней сложности
45.5Juggler, закраска граней, освещение высокой сложности
517.0Juggler, каркас
65.5Сцена Архитектура, плавная закраска, освещение средней сложности
75.5Сцена Архитектура, плавная закраска, освещение высокой сложности
85.5Сцена Архитектура, закраска граней, освещение средней сложности
95.5Сцена Архитектура, закраска граней, освещение средней сложности
1017.0Сцена Архитектура, каркас
115.5Сцена Пейзаж, плавная закраска, освещение средней сложности
125.5Сцена Пейзаж, плавная закраска, освещение высокой сложности
135.5Сцена Пейзаж, закраска граней, освещение высокой сложности
145.5Сцена Пейзаж, грани, освещение высокой сложности

DesignReview Viewset (drv-08)

Второй тест под названием DesignReview Viewset (drv-08) создан специально для моделирования структуры зданий. DesignReview — это пакет 3D моделирования, предназначенный для демонстрации модели завода, включающего конвейеры, оборудование и другие структурные элементы типа двутавровых балок, HVAC трубопроводов и кабельных каналов. Пакет позволяет осматривать модель с разных сторон и манипулировать объектами, облегчая проектирование, опредление помех, поиск компонентов, и давая представление сторонним наблюдателям о сути модели.

DesignReview отражает состояние здания и последовательноси, используя наглядную графику, дополняющую светокопии. По окончанию строительства DesignReview остается ценным инструментом для реконструкции и технического обслуживания. DesignReview является многопоточным приложением, доступным как для UNIX, так и для Windows NT.

       

Модель в этом наборе является частью 3D модели завода, созданной для офшорной нефтеперерабатывающей площадки GYDA, расположенной в Северном море на юго-западном берегу Норвегии. Выражаем благодарность компании Бритиш Петролеум, которая дала разрешение подкомитета SPECopcSM на испорльзование геометрических данных в качестве выборочных данных для этого набора. Использование этих данных ограничено для этого набора.

DesignReview работет на основе резидентного представления модели, которая состоит из объектов высокого порядка, таких как трубы, коленчатая трубопроводная арматура и двутавровые балки. Во время критического анализа завода каждый вид отображается путем преобразования этих объектов высокого порядка в связные треугольники (triangle strips) или ломаные линии (line strips). Назначение допусков для каждого объекта делается динамически, и только те треугольники генерируются, которые находятся спереди. Это видно в этой модели набора по мере вращения.

Большинство моделей DesignReview более 50 МБ и хранятся как объекты высокого порядка. По этой причине и для лучшего динамического назначения допусков и отбрасывания невидимых граней, таблицы отображения не используются.

Закрашенная модель из обновленного drv-08 содержит 367178 вершин в 42821 примитивах. Массивы вершин используются для отправки данных для отражения текущего выпуска Design Revшew приложения. Изменения цвета и материала берутся прямо из модели GYDA. Каркасная модель содержит 1599755 вершин в 94275 примитивах.

Набор определяет 5 тестов, которые представляют наиболее общие действия, выполняемые DesignReview. Вот эти тесты:

ТестВесОписание
175%Визуализация поверхностей по мере удаления. Каждый объект отображается как модель из треугольников, с использованием буферизации глубины, плавной закраской, с одним источником света и разными цветами для примитивов. Свойства материала меняются примерно через каждые 20 примитивов
213%Для большей реалистичности объекты модели могут быть текстурированы. Этот тест текстурирует модели, используя линейный блендинг и множественное отображение. Поддерживается изменение цвета на примитив, и свойства материала меняются так же, как и в тесте 1
34%В качестве допольнительного метода визуального распознавания и определения местонахождения объектов модель может применять прозрачность «screen door». Для этого надо прибавить стиплинг полигонов к тесту 1
44%Чтобы облегчить определение отображенных объектов сложной модели, объекты, которые надо распознать, отображаются как сплошные, а остальные как каркас (ломаными линиями). Ломаные линии визуализируются методом буферизации глубины, плоскости окрашены и не освещаются. Цвета передаются для каждого примитива
54%Два других вида отображаются на экране, чтобы пользователь мог выбрать ориентацию модели. Эти виды отображают положение и ориентацию наблюдателя. Используется каркасная, ортогональная проекция модели. Буферизация глубины не используется, поэтому многопоточность не может быть задействована; это сохраняет порядок рисования


ТестВес (%)Параметры тестирования (См. также параметры по умолчанию)
175%-th -mh gyda1-tsmat -zb -nil 1 -cp PRIMITIVE -va -nv -wt
213%-th -mh gyda2-tsmat -zb -nil 1 -cp PRIMITIVE -tx marble-slate.ppm -te MODULATE -magf LINEAR -minf LINEAR_MIPMAP_LINEAR -va -wt
34%-th -mh gyda2-tsmat -zb -nil 1 -polystipple -cp PRIMITIVE -va -nv -wt
44%-th -mh gyda0-wire -zb -flat -cp PRIMITIVE -va -wt
54%-mh gyda0-wire -ortho -flat -cp PRIMITIVE -va

Data Explorer Viewset (dx-07)

Третий тест Data Explorer Viewset (dx-07) нам уже знаком по предыдущей версии. IBM Visualization Data Explorer (DX) — это программный пакет общего назначения для визуализации и анализа научных данных. Программа построена на управляемой потоком данных модели клиент/сервер и работает в рабочих станциях Unix от Silicon Graphics, IBM, Sun и Hewlett-Packard. Порт OpenGL Data Explorer был дополнен с выпуском DX 2.1.

В данном тесте визуализируется траектория частицы в векторном поле. Ширина каждой «полосы» представляет величину вектора скороста в данном месте. Такие данные могут получиться в результате имитации потоков жидкости через сужения. Представленный объект состоит из 3000 моделей из треугольников, каждая имеет приблизительно 100 вершин. Это набор данных среднего размера для DX.

       

Вес тестов

Все тесты определяют z-буфферизацию с помощью одного источника света в дополнение к цвету, определенному для каждой вершины. Сетки треугольников являются первичными примитивами для этого набора. В то время как Data Explorer поддерживает многие иные режимы взаимодействия, эти допущения покрывают большинство пользовательских взаимодействий.

Первая версия этого набора включала непрямую визуализацию для управления моделью клиент/сервер систем на основе X-Windows. В этой версии тесты с непрямой визуализацей были удалены, чтобы можно было перенести этот набор в окружение Windows NT и OS/2.

ТестВесОписание
140%TMESH, непосредственный режим
220%LINE, непосредственный режим
310%TMESH, перечисление выводимых моделей
48%POINT, непосредственный режим
55%LINE, перечисление выводимых моделей
65%TMESH, таблица с нормалями к граням
75%TMESH, стиплинг полигонов
82.5%TMESH, двухстороннее освещение
92.5%TMESH, отсечение
102%POINT, прямой рендеринг, перечисление выводимых моделей


ТестВес (%)Параметры тестирования (См. также параметры по умолчанию)
140%-mh dx.msh -rm TMESH -cp VERTEX -zb -nl 1
220%-mh dx.msh -rm LINE -cp VERTEX -zb -nl 1
310%-mh dx.msh -rm TMESH -cp VERTEX -dl -zb -nl 1
48%-mh dx.msh -rm POINT -cp VERTEX -zb -nl 1
55%-mh dx.msh -rm LINE -cp VERTEX -dl -zb -nl 1
65%-mh dx.msh -rm TMESH -cp VERTEX -zb -nl 1 -fn
75%-mh dx.msh -rm TMESH -cp VERTEX -zb -nl 1 -pp
82.5%-mh dx.msh -rm TMESH -cp VERTEX -zb -nl 1 -l2s
92.5%-mh dx.msh -rm TMESH -cp VERTEX -zb -nl 1 -c
102%-mh dx.msh -rm POINT -cp VERTEX -dl -zb -nl 1

Lightscape Viewset (light-05)

Четвертый тест Lightscape Viewset (light-05) также нам уже знаком по предыдущей версии. Lightscape Visualization System от Discreet Logic представляет новое поколение технологии компьютерной графики, которая объединяет фирменные алгоритмы излучательности и интерфейс освещенности на физической основе.

Освещение

Наиболее важная особенность Lightscape — это способность точно имитировать глобальные эффекты освещенности. Система содержит две интегрированных компоненты визуализации. Первичная компонента использует прогрессивный вариант метода излучательности и генерирует независимые от вида модели распространиния диффузорного освещения в среде. Захватываются тонкие, но важные эффекты, включая непрямое освещение, мягкие тени и смешивание цветов поверхностей. Последующий процесс, используя метод трассировки луча, добавляет яркости, отражений и эффектов прозрачности специальным видам (view) решения излучательности.

Интерактивность

Большинство программ визуализации раcсчитывают закраску поверхностей во время формирования картинки. Компонента излучательности Lightscape рассчитывает предварительно размытое распределение энергии в пространстве и хранит распределение освещенности как часть 3D модели. Полученная геометрическая модель освещенности может быть затем быстро выведена на экран. Используя программы вывода OpenGL, Lightscape полностью использует преимущества продвинутых графических возможностей 3D рабочих станций SGI или плат ускорения графики на основе PC, совместимых с OpenGL. Lightscape позволяет двигаться интерактивно через полностью смоделированные пространства.

Прогрессивный отбор

Lightscape использует алгоритм излучательности прогрессивного отбора, который дает положительные видимые результаты сразу после обработки. Качество отображения растет по мере прохождения процесса. Таким образом пользователь имеет полный контроль над качеством (супротив времени), необходимым для выполнения данного задания. В любой момент этого процесса пользователь может изменить характеристики источника света или материала поверхности, и система мгновенно отреагирует и выдаст новые результаты без необходимости стартовать решение заново. Такая гибкость и производительность позволяет пользователям быстро тестировать различные комбинации освещения и материала, чтобы достичь желаемого визуального эффекта.

       

Набор определяет 4 теста, которые сожержат наиболее общие действия, выполняемые Lightscape Visualization System:

ТестВесОписание
125%Каркасное отображение по мере удаления модели Cornell Box, используя замкнутые ломаные линии с цветами, данными повершинно
225%Полноэкранное сплошное отображение по мере удаления модели Cornell Box, используя четырехугольники с плавной закраской и буферизацией глубины, с цветами, указанными повершинно
325%Каркасное отображение по мере удаления 750K четырехугольной модели Parliament Building, используя шлейфы замкнутые ломаные линии с цветами, данными повершинно
425%Полноэкранное сплошное отображение по мере удаления 750K четырехугольной модели Parliament Building, используя четырехугольники с плавной закраской и буферизацией глубины, с цветами, данными повершинно


ТестВес (%)Параметры тестирования (См. также параметры по умолчанию)
125%-qd box -rm LINE -cp VERTEX -wt
225%-qd box -rm QUAD -cp VERTEX -zb -bt 30 -xws 1248 -yws 960 -wt
325%-qd parlment -rm LINE -cp VERTEX -wt
425%-qd parlment -rm QUAD -cp VERTEX -zb -bt 30 -xws 1248 -yws 960 -wt

Pro/Engineer Viewset (proe-01)

Пятый тест Pro/Engineer Viewset (proe-01). Proe-01 создан на основе графики, полученной с помощью приложения Pro/ENGINEER 2001Т из PTC.

Во время теста измеряются 2 модели и три режима отображения. PTC отдал модели SPEC для использования в измерениях приложения Pro/ENGINEER. Первая модель, PTC World Car, представляет собой большую рабочую нагрузку модели, состоящей из 3.9 — 5.9 миллионов вершин. Эта модель измеряется в режимах закраски, удаления скрытых линий и каркасном. Каркасные рабочие нагрузки измеряются как в нормальном, так и в режиме сглаживания. Вторая модель — копировщик. Это среднего размера модель состоит из 485000 — 1.6 миллиона вершин. Для нее используются режимы закраски и удаления скрытых линий.

       

Этот набор включает изменения состояния, производимые приложением во время отображения модели. Например, закрашенные кадры PTC World Car включают более 100MB информации о состоянии и вершинах на кадр. Вот примеры включенного состояния: изменение матрицы, материал, состояние источника света, стиплиг линий и т.д. Все изменения состояния исходят от трассировки запущенного приложения. Изменения состояния обходятся намного дороже графическим подсистемам, чем простой вывод геометрии, использующийся в старых наборах.

При зеркальном отражении приложения массивы заданий используются для отрисовки закрашеных (освещенных) тестов, а непосредственный режим для каркаса. Градиентный фон, используемый приложением Pro/E также включен, чтобы улучшить моделирование рабочей нагрузки приложения.

В тестах на 1/3 используется каркас, и на 2/3 закраска.

ТестВесОписание
113.5PTC WorldCar, закраска
213.5PTC WorldCar, закраска, чтобы показать детали модели
313.5PTC WorldCar с режимом удаления скрытых линий
416.0PTC WorldCar с каркасным режимом
516.5PTC WorldCar с использованием сглаженных линий
613.5PTC Copier, закраска
713.5PTC Copier с режимом удаления скрытых линий

Unigraphics Viewset (ugs-01)

Шестой тест Unigraphics Viewset (ugs-01). Ugs-01 viewset был создан на основе графики, полученной с помощью Unigraphics V17.

Модель движка была взята из SPECapc для теста приложений Unigraphics. Измеряются 3 режима визуализации — с закраской, с закраской и прозрачностью и каркасный. Каркасные рабочие нагрузки измеряются как в нормальном, так и в режиме сглаживания. Все тесты проводятся дважды, сначала вращение в центре экрана и затем движение по кадру для измерения производительности отсечения.

       

Набор основан на трассировке запущенного приложения и включает все изменения состояния во время нормальной работы Unigraphics. Что касается приложения, таблицы отображения OpenGL используются для передачи данных графической подсистеме. Тысячи таблиц отображения различных размеров направляются для генерации каждого кадра модели.

В тестах на 1/3 используется каркас и на 2/3 закраска.

ТестВесОписание
116.5Закрашеная модель двигателя
216.5Закрашеная модель двигателя, отсечение
316.5Прозрачная модель двигателя
416.5Прозрачная модель двигателя, отсечение
58.5Каркасная модель двигателя
68.5Каркасная модель двигателя, отсечение
78.5Каркасная модель двигателя, сглаживание
88.5Каркасная модель двигателя, сглаживание, отсечение

Для тестирования я использовал следующие карты:

Помимо этих основных ускорителей, я использовал также карту на базе NVIDIA GeForce 3 и карту на базе NVIDIA GeForce 4 4600, а также еще две "карты": SoftQuadroDCC и SoftQuadro 4 900 XGL.

При тестировании использовался компьютер на базе Pentium 4 2200 MHz:

  • процессор Intel Pentium 4 2200 (L2=512K);
  • системная плата ASUS P4T-E (i850);
  • оперативная память 512 MB RDRAM PC800;
  • жесткий диск Quantum FB AS 20GB.

А также я использовал дополнительный стенд на базе Pentium III 1000 MHz:

  • процессор Intel Pentium III 1000EB;
  • системная плата Chaintech 6OJV2 (i815E);
  • оперативная память 256 MB SDRAM PC133;
  • жесткий диск IBM DPTA 20GB.

Во время тестирования карты вели себя "дружелюбно", то есть, ни один тест не завис и все, абсолютно все тесты были пройдены всеми картами. Тестирование проводилось под управлением Windows XP Professional. На чистую операционную систему устанавливались необходимые драйверы и прогонялись тесты. Драйверы использовались следующие:
Для линейки карт Quadro и GeForce использовалась версия 28.32, для карт FireGL 2 — версия драйвера 20.82, для FireGL 8800 использовалась версия 30.30 и для Wildcat использовалась версия 06.05.03.2. Я не буду приводить в этот раз многочисленные скриншоты с настроек драйверов, просто скажу, что везде, где это было возможно, отключалась вертикальная синхронизация (vsync).

А теперь я представляю на ваш суд результаты работы этих карт.

Как видно, очень хороший потенциал у линейки Quadro 4. Несмотря на общие низкие оценки в этом тесте, карты на базе этого чипа все же впереди. А небольшие показатели говорят лишь о том, что этот тест заставляет работать все карты на пределе своих возможностей и возможностей всей системы. Чуть ниже я приведу дополнительные тесты, которые несколько прояснят нам ситуацию.

И в этом тесте лидируют карты Quadro 4. Причем, как можно видеть, SoftQuadro 4 практически не уступает настоящим Quadro 4, а SoftQuadro DCC даже немного быстрее настоящей Quadro DCC. Карты от ATI держатся "золотой середины" между флагманскими картами и самыми младшими моделями от NVIDIA. Wildcat в этом тесте не показал ничего примечательного.

Этот тест резко отбросил назад игровые акселераторы. Именно здесь начинается настоящая борьба между профессиональными картами и именно здесь хорошо видно отличие профессионального ускорителя от игрового. Результаты же достаточно прогнозируемые. Недавно вышедшие карты являются бесспорными лидерами, остальные — на порядок слабее. НТП во всей своей красе! :)

Очень красивый тест сам по себе дал шанс и остальным картам. Общая картина не изменилась.

И в этом тесте цифры стали более разумными и исчисляются полутора десятками fps. Тест стал более современным, в том плане, что общая нагрузка на акселераторы увеличилась, и, как следствие, количество fps несколько упало. Да, поклонники ATI могут возрадоваться -- наконец-то лидерство перехватывает FireGL 8800. Пусть небольшое, пусть на чуть-чуть, но лидерство, и это факт.

Последний тест помогает нам окончательно определиться. Игровые карты - это игровые карты, а новый SpecViewPerf — это не игрушки. Что и видим - игровые карты и SoftQuadro в этом тесте ничего не могут противопоставить своим старшим собратьям. Лидером остается Quadro 4 900XGL. Совсем рядом FireGL 8800.

Для того, чтобы проверить, насколько велико влияние процессора на результаты этого теста, я протестировал линейку карт от NVIDIA на более слабой машине. Почему именно Quadro? Только потому, что в нашей лаборатории именно эта линейка представлена наиболее полно, начиная от младших моделей и заканчивая самыми последними разработками. Для тестирования использовался процессор предыдущего поколения с тактовой частотой в 1GHz. Результаты получились такие:

Результаты говорят о хорошей масштабируемости этого теста. Более мощные карты являются лидерами.

А вот результаты этого теста говорят о том, что тест процессорозависим. Более мощные карты проигрывают более слабым картам за счет того, что они "простаивают" в ожидании очередной порции данных от процессора.

Этот тест также показывает процессоронезависимость и хорошую масштабируемость.

А вот тот самый красивый тест, который дал шанс всем картам показать наиболее похожие результаты. Теперь совершенно очевидно, почему это произошло. Посмотрите на результаты старших ускорителей. Уже начиная с Quadro DCC вся работа ложится на процессор. В этом тесте от самого ускорителя зависят лишь самые слабые карты. Это самый процессорозависимый тест.

Здесь влияние процессора невелико.

Как и в предыдущем тесте, в этом влияние процессора невелико.

Итоги

Вполне достойный тест для достойных карт. Разработчики в этой версии SPECviewperf добились, на мой взгляд, того необходимого баланса, который и определяет качество и скорость работы карты. Как видите, тест от процессора зависит мало, заставляя "работать" видеоускорители. Новые алгоритмы и оптимизация тестов именно под современные ускорители дают нам следующую расстановку сил. Непревзойденными остаются карты от NVIDIA из линейки Quadro 4. Где-то рядом располагается карта от ATI FireGL 8800, а после FireGL 8800 идут все остальные карты, причем практически "ноздря в ноздрю". Игровые же карты во многих тестах показали, что не способны справляться с профессиональными задачами.




Дополнительно

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.