Futuremark 3DMark06: немного нового


И правда, в новом тесте нового не много. Добрый-старый Марк05 послужил надежной основой для героя этой статьи. А почему бы и нет — DX той же версии, изменения на графическом ландшафте минимальны и сводятся к двум основным фактам — выходу декабрьского обновления DX9 (где послухам уже есть спецификация на SM4, железо для которых — R600 и G80 будет доступно значительно позже, вместе с Vista) и анонсу нового поколения архитектур ATI наконец то поддерживающего SM3. Впрочем, не без оговорок, вспомним, например про вершинное текстурирование. Что ж, даже этих новостей достаточно для новой версии марка — надо и R5XX поддержать, и новые библиотеки DX9 задействовать. Кстати, именно их и предлагает обновить до декабрьского состояния инсталляция теста. Ответим «да» и вперед.

Старое

Тест основан на хорошо нам знакомом 3DMark05. Это логично — версия DX осталась девятой и, хотя, используются библиотеки последнего декабрьского обновления, суть графического конвейера и его возможности не поменялись, и переписывать движок не требуют. Интерфейс тоже напоминает предыдущую версию, но в нем есть и новые пункты. Но, говорить о полном соответствии наследованных тестов нельзя, даже в сохранившихся тестах изменен дизайн «уровней», шейдеры и некоторые другие моменты, соответственно и результаты не будут прежними. Итак:

Новое

Сперва — таблица официальных отличий нового теста и предыдущей версии:

  3DMark05 3DMark06
Версии шейдеров 2.0 2.0 и 3.0
Сложность шейдеров Высокая (до 96 инстр.) Очень высокая (до 512 инстр.)
Детализация геометрии Высокая Очень высокая
Размеры текстур Высокая Очень высокая
Материалы Простые Сложные
Количество источников света Высокое Очень высокое
Мягкие тени 4 выборки 4 и 16 выборок (новый алгоритм теней)
Расчетный объем локальной памяти ускорителя 128 Мегабайт 256 Мегабайт
Расчетный ускоритель Второе поколение SM2 ускорителей (NV4X, R4XX) Второе поколение SM3 ускорителей (G70, R5XX)
Поддержка многоядерных CPU Нет Есть
HDR тест Нет Есть
SM2 тесты 3 2
SM3 тесты Нет 2
SM3 синтетические тесты Нет Есть
CPU тесты 2 вершинных шейдера на CPU 2 сложный AI и симуляция физики
Интерактивная игра Нет Есть

Очевидна переориентация на современные «модные темы», такие как многоядерные процессоры, HDR, нацеленность на SM3 и больший объем памяти графических карт. Нельзя не похвалить за более адекватные тесты CPU — теперь это не маловероятная в реальной жизни игровой станции задача программной эмуляции вершинных шейдеров, а вполне реальная — AI и физика в некой гипотетической игре. Интерактивная игра развлечет тестеров в момент ожидания чего-либо или перерыва ;-).

Доступны три версии теста — Basic, Advanced и Professional. Первая сильно урезана и позволяет фактически запускать только четыре игровых теста с получением финальных Марков, и отдельных результатов по HDR и SM3 (третьим шейдерам). В версии Advanced, которая является платной, доступны уже все тесты, включая синтетические тесты специфичные для SM3 и тесты качества фильтрации текстур и AA. Есть экспорт результатов в файлы MS Еxel, настройки разрешения и режима тестов, отдельные тесты на шейдеры и CPU и т.д. В профессиональной версии добавлены возможности работы из командной строки и в программируемом (батч) режиме, а также дано официальное разрешение на коммерческое использование результатов теста.

А мы перейдем к описанию тестов:

Тесты

Вначале, как обычно, конфигурация тестового стенда:

  • Компьютер на базе Athlon 64 (939Socket)
    • процессор AMD Athlon 64 4000+ (2400MHz) (L2=1024K);
    • системная плата ASUS A8N32 SLI Deluxe на чипсете NVIDIA nForce4 SLI X16;
    • оперативная память 2 GB DDR SDRAM 400MHz (CAS (tCL)=2.5; RAS to CAS delay (tRCD)=3; Row Precharge (tRP)=3; tRAS=6);
    • жесткий диск WD Caviar SE WD1600JD 160GB SATA.
  • RADEON X1800 XT (HIS, PCI-E, 512MB GDDR3, 625/1500 MHz);
  • RADEON X1900 XTX (reference, PCI-E, 512MB GDDR3, 650/1550 MHz);
  • RADEON X1900 XT (reference, PCI-E, 512MB GDDR3, 625/1450 MHz);
  • GeForce 7800 GTX (ASUS EN7800GTX TOP, PCI-E, 256MB GDDR3, 486/1350 MHz);
  • GeForce 7800 GTX (ASUS EN7800GTX, PCI-E, 256MB GDDR3, 430/1200 MHz);
  • GeForce 7800 GTX (reference, PCI-E, 512MB GDDR3, 550/1700 MHz);
  • операционная система Windows XP SP2; DirectX 9.0c;
  • мониторы ViewSonic P810 (21") и Mitsubishi Diamond Pro 2070sb (21").
  • драйверы ATI версии CATALYST 5.13/6.1; NVIDIA версии 81.98.

VSync отключен.

Graphics Test 1: Return to Proxycon

Тест, напоминающий FPS и знакомый нам по предыдущей версии, претерпел существенное улучшение результирующей картинки но попрежнему исполняется полностью в рамках SM2 модели (справа новый вариант — 06, слева старый — 05):

все это благодаря новым шейдерам материалов, более разрешенным текстурам, большему числу источников света (26, 2 из них направленные) и более продвинутому алгоритму теней. В принципе ничего нового, но скорость заметно упала, а качество картинки заметно выросло:

Посмотрим на результаты теста:



Как это принято в нашу эпоху (надеемся, что Vista и DX10 несколько изменят ситуацию), тест достаточно сильно зависит от CPU и платформы — только в разрешении 1600х1200 различие между картами становится действительно скачкообразным. Хорошо заметно, что шейдерная мощь RADEON X1900 не прошла даром — и тени и материалы нагружают в этом тесте в первую очередь пиксельные шейдеры. Даже на самых быстрых картах FPS не высок и не может быть назван «играбильным» даже с натяжкой — это во многом ставит под вопрос адекватность баланса теста по сравнению с реальными играми схожего жанра. Но, как тест на пиксельную производительность он не плох, конечно, если тестовая система снабжена одним из лучших CPU — на более слабой платформе отличие еще больше сгладится.

SM2.0 Graphics Test 2 — Firefly Forest

Лесная сцена (по прежнему SM2) тоже обогатилась более длинными шейдерами, более детальными текстурами, новыми источниками света и тенями и т.д.

Интересно, что, сравнивая с предыдущей версией теста можно наглядно прикинуть, какие изменения в картинке, сколько FPS нам стоили ;-)

А теперь посмотрим на результаты тестов:


Картина достаточно близко повторяет первый игровой тест. Но судя по всему зависимость от процессора тут несколько меньше. Да и NVIDIA уже не вырывается чуток вперед X1900 на младших разрешениях, т.е. тест более стабилен и не подвержен скачкам из за вопросов оптимизации драйверов или взаимодействия платформы и ускорителя. FPS снова не высок, но более адекватен для такого рода сцен (например в квесте или RPG).

HDR/SM3.0 Graphics Test 1 — Canyon Flight

А вот это уже новый тест. Точнее старый, но основательно переработанный. В ход пошли не только SM3 шейдеры но и HDR рендеринг а значит, изменения коснулись и движка сильнее чем в первых двух случаях:



Изображение, как мы видим тоже заметно изменилось. Освещение и правда можно назвать более реалистичным, посмотрим какой ценой ;-)


Ага, в режиме с AA тест просто не работает на G70. Почему? Потому что тогда мы теряем возможность FP16 блендинга необходимую нам для действительно эффективного HDR. RADEON нового поколения эту возможность поддерживает и его результаты остаются на месте. Заметно что зависимость от процессора в этом тесте существенно ниже двух предыдущих, а вот частота карты сказывается очень четко — не только много шейдерной работы, но и немало пересылок данных — буфер кадра в формате FP16 стал больше вдвое. ATI демонстрирует в этом тесте заметные преимущества R580 над R520 (и над G70), причем с ростом разрешения отрыв растет.

HDR/SM3.0 Graphics Test 2 — Deep Freeze

Еще один HDR/SM3 тест (может и не стоило валить два этих понятия в кучу так интенсивно — есть шейдеры и задачи, которые могут требовать интенсивных переходов свойственных SM3 но не быть при этом HDR). Как бы там ни было:

и здесь сравнивать изображение не с чем — в предыдущей версии пакета этого теста не было. Тест во многом кинематографичен — внимание уделялось реалистичности рендеринга теней, освещения, HDR. Результаты:


очень похожи по расстановке сил на предыдущие. Интересно что нельзя однозначно сказать, что тест зависит только от шейдерной мощи. Скорее тест сильнее зависит от общей частоты ускорителя, чем от его вычислительной мощи — видимо все упирается не только в длину шейдеров но и в выборку текстур/ПСП. Но и гораздо более чем «частотное» отличие R580 от R520 нельзя не отметить. Баланс — видимо мы имеем дело с ним.

Подведем окончательные марки, раздельные по шейдерной модели (2 и 3):









А теперь тесты CPU и синтетические тесты:

CPU Tests — Red Valley

Этот тест, наконец-то симулирует именно реальную игровую нагрузку. В наличии два теста, несколько варьирующих характер баланса между физикой и AI, но в общем то схожих. Использована физическая библиотека симуляции Ageia PhysX и некий сложный алгоритм поиска пути, свойственный для многих AI задач в играх.

Feature test — Fill Rate (Single-Texturing и Multi-Texturing)

Эти тесты нам уже хорошо знакомы. Сразу о результатах:





Все вполне ожидаемо — тест упирается в скорость работы с буфером кадра и скорость выборки текстур. И тот и другой параметр в данное время сложился в пользу NVIDIA. Результаты прекрасно согласуются с другими синтетическими тестами, в том числе нашим 3D RightMark, однако последний позволяет прощупать различные блоки более детально, изменяя параметры теста на уровне числа используемых текстур и т.д.

Feature test — Pixel Shader

Один единственный шейдер — поверхности лица из второго игрового теста, был выделен в качестве синтетического пиксельного теста. Результаты:



Вполне соответствуют общим представлениям о раскладе сил, но опять таки не позволяют прощупать конкретные особенности карт, например уклон в сторону вычислений или выборки текстур. Гораздо удобнее применять тесты с набором различных шейдеров и возможностью изменить их параметры.

Feature test — Vertex Shader (Simple и Complex)

А вот здесь уже два шейдера. Один делает типовую трансформацию и подготовку треугольников, а второй рассчитывает достаточно сложную модель исходных параметров для симуляции травы.

Посмотрим на результаты:



Ага, здесь мы обнаружили неверное поведение теста. Столь низкие результаты RADEON X1800 говорят о существенной зависимости теста от пиксельной части (вершинная на равной частоте у него не отличается от X1900). Ата-та Финские ребята! ;-)

Данный тест не может быть рекомендован к использованию, т.к. он искажает картину реальной вершинной производительности чипа.

Теперь сложный вариант:



А вот в сложном тесте ситуация больше похожа на то, что мы видим в других синтетических пакетах.

Shader Particles

Синтетический тест специально для SM3 модели — вычисляется физическая модель системы частиц, результаты вычислений записываются в текстуру и затем используются для построения изображения. Т.е. ускоритель используется как аппаратный ускоритель расчетов, причем пиксельные шейдеры тоже задействованы. Учитывая изрядную шейдерную мощь последних карт, можно только приветствовать такой подход к разгрузке многострадальных CPU занятых исполнением кода DP (отрисовки примитивов) в DX и другими не всегда желанными вещами. Посмотрим на результаты:



RADON X1800 и X1900 является с точки зрения этого теста не совсем SM3 картой. В чем дело? Возможно в отсутствии выборки текстур из вершинных блоков, которая является необходимой для SM3 возможностью (с точки зрения всех кроме ATI). А может и в ином вопросе (ошибка компиляции вершинного шейдера, отсутствия необходимой поддержки переходов в вершинных шейдерах ATI, отсутсвие каких либо режимов выборки текстур в пиксельных или еще что либо), сказать сложно. Однако факт что мы получаем тревожный звоночек.

Perlin Noise

Еще один SM3 тест, фактически вычисляется некий трехмерный шум, базовая для многих процедурных текстур вещь. Этот тест показывает перспективность ускорителя для задач построения процедурных текстур, которые по мере смешения баланса в сторону вычислений, могут стать все более и более популярными в реальных приложениях. Результаты:



Вот тут все окей — и правда карты расположились строго в порядке вычислительных ресурсов в пиксельных шейдерах.

Выводы

Итак, тест не провалился, а скорее удался, хотя назвать его действительно новым сложно. Эволюция, а не революция, схожая с эволюцией некоторых игровых движков, которые начинали с одной версией шейдеров, но постепенно обзавелись и другой, а также вышли на новый уровень детализации. В наше время устоявшегося DX9, царствующего уже не первый год, эта картина типична. Главное — это скорость. Реальные скачки вперед будут возможны с выходом DX10 (или на худой конец SM4 для DX9 которая тоже планируется) — тогда и поглядим. Пока что надо растить шейдеры. В длину. Точность представления в глубину, а текстуры — по обоим направлениям их плоскости. Ура господа!





Дополнительно

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.