Тестирование в пакете CINEBENCH 2003


Лето в самом разгаре, установилась жаркая пора. Причем, надо сказать, что словосочетание «жаркая пора» относится не только к хорошей погоде, но и к последним новостям. Как вы можете догадаться, речь идет о бенчмарках и оптимизациях под эти бенчмарки. Скандал вокруг 3DMark2003 разгорелся нешуточный, и, несмотря на то, что все вопросы урегулированы, 3DMark2003 большинство изданий перестали использовать как тестовый пакет. И правильно сделали, так как какой смысл измерять непонятно что. То ли скорость самой карты, то ли ловкость и хитроумность программистов.

В принципе, скандал одним 3DMark2003 не ограничился. Тестовые исследования показали, что такие вот оптимизации (я намеренно избегаю слова «заточки») существуют не только для тестовых пакетов. Многими играми возможно мерять скорость карт, во многих играх есть встроенные бенчмарки и специальные сцены. Так вот, наши исследования показывают, что для этих сцен так же присутствуют оптимизации.

К чему такое вступление? А просто к тому, чтобы читатель был готов получить отличный от нашего исследования результат у себя, купив ту или иную карту. Я не могу со сто процентной уверенностью заявить, что я меряю реальную производительность видеокарты. Нет, теперь я не могу сделать такое утверждение. Впрочем, небольшая оговорка.

Я произвожу измерение готового продукта. Готовый продукт состоит из аппаратной части и программной части в совокупности. Другими словами, видеокарта не может работать без драйвера, как и наоборот. Определить со сто процентной надежностью, что есть оптимизация, а что есть чит, я пока не могу, да и не смогу потом. По умолчанию, я считаю, что присутствует оптимизация драйвера под конкретное приложение, но не оптимизация драйвера под конкретное приложение и конкретную сцену с некоторым изменением в структуре отображения самой сцены. Я допускаю оптимизацию, и именно оптимизацию, даже под конкретную сцену, но без изменений в качестве ее отображения. Изменением в качестве отображения я считаю любое изменение сцены. Изменение угла обзора, замена шейдера, все что угодно, если сам дизайнер\производитель сцены задумал это иначе, чем вы видите (а может и не видите, но потенциально можете увидеть). Скажу более, раньше в тестировании, такие изменения мы вносили в bugs (в ошибки рендеринга). Судите сами...

После такого соглашения (disclamer) я смогу приступить к тестированию.

Увы, но к сожалению, теперь я не могу с ответственностью заявить, что карта Икс быстрее карты Игрек или наоборот. Я могу лишь показать, что в данном тесте есть такое положение вещей. Это я могу утверждать со стопроцентной ответственностью. Выражаю надежду, что такое если оптимизации и проводятся то непосредственно под приложение, а не под конкретный бенчмарк.

CINEBENCH 2003

И после такого вот суматошного вступления, я попробую рассказать вам о том, чем я занимался в эти жаркие дни. Рынок исследуемых мною карт довольно узок и сильно специализирован, поэтому выход новый тестов — событие весьма неординарное. Впрочем, подобная ситуация есть и для игрового рынка, но там все несколько проще, да и цены заметно ниже. Тем не менее, в своей работе R&D (Research and Destro.. простите, Development) я нашел интересный бенчмарк от немецкой компании MAXON.

Логотип CINEBENCH 2003

Данный бенчмарк основан на движке выпускаемого компанией пакета для трехмерного моделирования CINEMA 4D. Данный тестовый пакет абсолютно бесплатен, выпускается в версиях для Windows и Mac OS. Тест предназначен для для исследования производительности не только видеосистемы, но и производительности самой платформы. Специальные сцены, которые рендерятся в процессе тестирования, созданы таким образом чтобы возможно было нагрузить столько процессоров, сколько есть в самой системе (до 16). Тест корректно обрабатывает и все современные технологии, такие как HyperThreading. Тестовые сцены для исследования возможностей видеокарты используют многополигональные объекты, да и сами сцены сложные с точки зрения геометрии. Поскольку это мультиплатформенный тест, то основным API является OpenGL.

Здесь я приведу скриншоты этого теста. Эти скриншоты выполнены в самой компании MAXON, я решил использовать именно их, так как они рекомендованы для применения в пресс-релизе. Первый скриншот показывает сцену финального рендеринга, второй скриншот показывает работу OpenGL.



Мне приходит огромное количество писем с вопросами о производительности игровых карт в профессиональных тестах. Время от времени, я провожу такие исследования, но по всей видимости, это капля в море, поэтому в данном тестировании я решил включить и ряд игровых карт. Список исследованных карт:

    Профессиональные карты:
  • NVIDIA Quadro 2 Pro
  • NVIDIA Quadro 2 MXR
  • NVIDIA Quadro DCC
  • NVIDIA Quadro 4 550XGL
  • NVIDIA Quadro 4 980XGL
  • NVIDIA QuadroFX 2000
  • NVIDIA QuadroFX 1000
  • ATI FireGL 8800
  • ATI FireGL 8700
  • ATI FireGL X1 128MB
  • 3Dlabs Wildcat VP870 (geom)
  • 3Dlabs Wildcat VP870 (text)
    Игровые карты:
  • NVIDIA GeForce4 MX
  • NVIDIA GeForce4 Ti 4600
  • NVIDIA GeForceFX 5200 Ultra
  • NVIDIA GeForceFX 5600 Ultra
  • NVIDIA GeForceFX 5800 Ultra
  • NVIDIA GeForceFX 5900 Ultra
  • ATI Radeon 9000 Pro 128Mb
  • ATI Radeon 9500 128Mb 256bit
  • ATI Radeon 9700 Pro
  • ATI Radeon 9800 Pro
  • ATI Radeon 9200
  • ATI Radeon 9600 Pro

Почему именно эти профессиональные карты были выбраны мной — только потому, что все эти карты есть в нашей лаборатории на постоянной основе, а почему именно эти игровые карты — потому, что на мой взгляд, это наиболее интересные представители игрового сегмента рынка на сегодняшний момент, момент написания этой статьи. Исходя из данных, полученных на этих представителях, можно примерно сделать вывод о производительности практически любой карты, имеющей место быть на рынке сейчас.

Тестовые платформы

    Базовая
  • Материнская плата: Intel Server Board SE7505VB2
  • Центральные процессоры: 2 x Intel Xeon 2,4GHz (HyperThreading включен, получаем 4 логических процессора)
  • Жесткий диск: Fujitsu MPG 40GB
  • Оперативная память: 512MB DDR
  • Монитор: ViewSonic P 817-E
    Вспомогательная
  • Материнская плата: DFI LANParty Pro875
  • Центральные процессоры: 1 x Intel Pentium 4 3,2GHz (HyperThreading включен, получаем 2 логических процессора)
  • Жесткий диск: Fujitsu MPG 40GB
  • Оперативная память: 1GB DDR400
  • Монитор: ViewSonic P 817-E

Все исследования проводились под управлением Windows XP Professional, Service Pack 1, DirectX 9.0a, со всеми установленными необходимыми дополнениями и драйверами. В драйверах принудительно выключалась вертикальная синхронизация. Версии драйверов, используемых мной в тестировании такие:

Для карт на базе чипсетов от NVIDIA — 4465
Для карт на базе чипсетов от ATI FireGL 8x00 — 3056
Для карт на базе чипсетов от ATI FireGL X1 — 1032
Для игровых карт от ATI — 6360
Для карт на базе чипсета от 3Dlabs — 3010392

И теперь от разговоров переходим к делу. Я приведу результаты, полученные на базовой тестовой платформе, а потом на вспомогательной и попробую проанализировать результат. Сначала я хотел бы поделиться результатами финального рендеринга, тем более, что на результат мало влияет видеокарта, гораздо больше влияет производительность самой платформы.

Рендеринг на двухпроцессорной системе с использованием одного процессора:

Рендеринг на двухпроцессорной системе с использованием всех доступных процессоров:

Как видно, результаты мало зависят от карты, по большей части это тест процессора и системы в целом. Комментировать практически нечего, обращаю внимание читателей лишь на то, что при использовании всех доступных процессоров скорость рендеринга увеличилась более чем в два раза:

Прирост скорости:

Здесь же я приведу результаты тестов на однопроцессорной системе на базе Intel Pentium 4 3.2 GHz.

Рендеринг на однопроцессорной системе с использованием одного процессора:

Рендеринг на однопроцессорной системе с использованием всех доступных процессоров (работа HyperThreading):

Прирост скорости:

Да, получился отличный тест процессоров. Видно, что скорость процессора играет весьма важную часть в формировании конечного результата. Видно так же, что если физически добавить процессоров, то скорость возрастает именно в разы по количеству добавленных процессоров. Осмелюсь предположить, что при использовании четырех физических процессоров, прирост составил бы именно в четыре раза. Так же, очень интересно заметить, что технология HT не приносит такого же эффекта, как второй процессор. HT — это именно добавление логического процессора, технология, которая помогает чуть быстрее добиваться нужного результата. Думаю, что данный набор тестов больше пригодился бы нашим разделам по процессорам и материнским платам.

Прежде чем приступить тестированию непосредственно карт, я хотел бы рассказать о том, как работает CINEBENCH 2003.
Вначале, запускается тест «C4D Shading». Это тест использует собственную систему рендеринга из пакета CINEMA 4D. Данная система рендеринга работает в программном режиме, дабы исключить возможные ошибки OpenGL драйвера. После этого запускается OpenGL SoftWare Lighting тест, и после этого происходит запуск теста OpenGL Hardware Lighting. Таким образом, на мой взгляд, достаточно логично высчитывается скорость непосредственно видеокарты. Результаты сравниваются между собой и выявляется некий коэффициент (OpenGL SpeedUp), который и является скоростным показателем карты, в сравнении с эталонами. Если этот коэффициент менее единицы, то можно смело сказать, что используемая видеокарта слаба настолько, что никакого прироста не дает. Если же скорость больше единицы, то карта дает сильные приросты.

Технические характеристики теста выглядят следующим образом: сцена Pump Action содержит в себе 37 тысяч полигонов и 1064 объекта. Таким образом удается сильно нагрузить процессор видеокарты и эта сцена является наилучшим способом протестировать возможность карты отображать количество полигонов в секунду. Сцена City-gen содержит порядка 70 тысяч полигонов и всего пару объектов и является идельной для тестирования по возможности карты скрывать невидимые поверхности и по скорости отображения полигонов. Теперь можно посмотреть на результаты.



C4D Shading двухпроцессорная система:

Практически все карты одинаковы, чего и следовало ожидать, так как это эталонное измерение выполняется программным образом.

C4D Shading однопроцессорная система:

Такая же картина наблюдается и на однопроцессорной системе, с той лишь разницей, что абсолютные показатели выросли настолько, насколько быстрее процессор по количеству колебаний в секунду. :)

Еще один, наполовину программный, тест, OpenGL software lighting:

OpenGL Software Lighting двухпроцессорная система:

Посмотрите, как резко изменяется картина. Мы задействовали OpenGL расширения карт, передав им част управления и как разительно изменилась картина. Теперь наглядно видно, насколько современные ускорители лучше справляются со специфичными функциями чем центральные процессоры, даже самые быстрые.

OpenGL Software Lighting однопроцессорная система:

Теперь посмотрим на результаты полученные от работы непосредственно видеокарты.

OpenGL Hardware Lighting двухпроцессорная система:

OpenGL Hardware Lighting однопроцессорная система:

Как видно, ситуация довольно сильно изменяется в пользу работы современных видеокарт. Их GPU, или VPU, как кому удобнее, позволяет со значительным выигрышем в сравнении с программным решением производить рендеринг в реальном времени. Что интересно заметить, так это то, что профессиональные решения далеко не самые выгодные для этих целей. Игровые решения, как видно из приведенных выше диаграмм, являются порой наиболее выгодным решением. Что еще интересно заметить так это то, что на двухпроцессорной системе видеокарты от NVIDIA работают быстрее видеокарт от ATI. Я думаю, что этот факт является следствием работы драйвера самой видеокарты.

Приросты скорости:

OpenGL SpeedUp: двухпроцессорная система:

OpenGL SpeedUp: однопроцессорная система:

Думаю, что дополнительные комментарии к этим диаграммам не требуются, так как эти диаграммы представляют собой эдакий чарт, в котором все позиции заняты по возможностям.

Выводы

Тестирование карт при помощи тестового пакета CINEBENCH 2003 нам показывает, что не всегда два процессора физических являются наиболее оптимальным решением для задач редактирования сцен. Два процессора нужны, если вы собираетесь производить финальный рендеринг, для редактирования сцен лучше и дешевле воспользоваться однопроцессорным решением, и практически не имеет значения какую видеоподсистему вы для этого случая будете использовать. Гораздо интереснее результаты получаются в том случае, если вы собираете платформу для редактирования. В этом случае именно видеосистеме стоит уделить наибольшее внимание.

Как показывают наши результаты, стремиться приобрести профессиональное решение от того или иного производителя графических чипов не стоит. Особенно если цена профессионального решения оказывается примерно в два, а то и три раза больше. Я считаю, что имеет смысл остановиться на игровом, но при этом выбрать самое дорогое рещение, которое тем не менее, окажется дешевле профессионального. Посмотрите, какие результаты. Практически полная победа современных игровых карт над современными профессиональными! Если вы используете в своей работе пакет CINEMA 4D — то вам однозначно не придется тратиться на дорогие профессиональные карты, если вы конечно же, не используете какие-то специфические их возможности. Однако, если разница в цене не будет велика, имеет смысл подумать о приобретении много процессорной системы, снабженной профессиональной картой. Такая система позволит вам производить и воспользоваться специфичными профессиональными функциями карты и позволит быстро производить рендеринг. Но, еще раз повторюсь, только в том случае, если разница в игровом видео рещении и профессиональном не будет значительной.




Дополнительно

iXBT BRAND 2016

«iXBT Brand 2016» — Выбор читателей в номинации «Процессоры (CPU)»:
Подробнее с условиями участия в розыгрыше можно ознакомиться здесь. Текущие результаты опроса доступны тут.

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.