NVIDIA GeForce 7800 GTX 256MB PCI-E

Часть 3: Игровые тесты, качество АА, выводы




СОДЕРЖАНИЕ

  1. Части 1 и 2.
  2. Результаты тестов
  3. Результаты тестов: TRAOD
  4. Результаты тестов: FarCry Research
  5. Результаты тестов: FarCry Regulator
  6. Результаты тестов: FarCry Pier
  7. Результаты тестов: F.E.A.R. (MP beta)
  8. Результаты тестов: Half-Life2, ixbt01
  9. Результаты тестов: Half-Life2, ixbt02
  10. Результаты тестов: Half-Life2, ixbt03
  11. Результаты тестов: DOOM III
  12. Результаты тестов: 3DMark05 MARKS
  13. Результаты тестов: Chronicles of Riddick, demo 44
  14. Результаты тестов: Chronicles of Riddick, demo ducche
  15. Выводы


NVIDIA GeForce 7800 GTX 256MB PCI-E: Часть 1: Теория и архитектура

NVIDIA GeForce 7800 GTX 256MB PCI-E: Часть 2: Описание карты, конфигурация стенда, результаты синтетических тестов

В предыдущих частях мы рассмотрели теоретические аспекты архитектуры, присущие новому продукту NVIDIA, а также посмотрели на то, какую производительность GeForce 7800 GTX демонстрирует в синтетических тестах (и убедились в том, что пиксельные конвейеры рендеринга G70 были не просто расширены численно относительно NV45, но и переработаны, в результате чего возросла производительность одного конвейера на единицу частоты; кроме того были увеличены кэши и несколько изменен баланс их работы в расчете на более сложные как геометрически, так и текстурно сцены).

В этом разделе мы разместили главную честь нашего исследования, которая интересует всех геймеров — производительность в реальных игровых 3D-приложениях. А закончим мы наше первое знакомство с GeForce 7800 GTX небольшим комментарием по качеству АА (в первой части статьи мы уже упоминали про новый режим AA на GF7800GTX).

Результаты тестов: сравнение производительности

В качестве инструментария мы использовали:

  • Tomb Raider: Angel of Darkness v.49 (Core Design/Eldos Software) — DirectX 9.0, Paris5_4 demo. Тестирование проводилось при максимально установленном качестве, выключены были лишь Depth of Fields PS20.

  • Half-Life2 (Valve/Sierra) — DirectX 9.0, demo (ixbt01, ixbt02, ixbt03 Тестирование проводилось при максимальном качестве, опция -dxlevel 90, в файле dxsupport.cfg убраны предустановки для видов карт.

  • FarCry 1.3 (Crytek/UbiSoft), DirectX 9.0, мультитекстурирование, 3 demo из уровней Research, Pier, Regulator (запуск игры с опцией -DEVMODE), настройки тестирования все Very High.

  • DOOM III (id Software/Activision) — OpenGL, мультитекстурирование, настройки тестирования — High Quality (ANIS8x). Имеется пример автоматизации запуска с увеличением скорости и уменьшением числа рывков (прекешинг).

  • 3DMark05 (FutureMark) — DirectX 9.0, мультитекстурирование, настройки тестирования — trilinear,

  • F.E.A.R. (Multiplayer beta) (Monolith/Sierra) — DirectX 9.0, мультитекстурирование, настройки тестирования — maximum, Soft shadows.

  • The Chronicles Of Riddick: Escape From Butcher Bay (Starbreeze/Vivendi) — OpenGL, мультитекстурирование, настройки тестирования — максимальное качество текстур, Shader 2.0.

    Выражаю благодарность Ринату Досаеву (AKA 4uckall) и Алексею Островскому (AKA Дучче) за написание демо к данной игре, а также большое спасибо Алексею Берилло AKA Somebody Else за помощь



Игровые тесты, сильно нагружающие блоки пиксельных шейдеров 2.0.

TR:AoD, Paris5_4 DEMO



Результаты тестов: TRAOD

Данный тест давно потерял какую-либо значимость для геймеров, но зато хорошо отображает возможности видеокарт в работе с относительно простыми пиксельными шейдерами 2.0.

Когда вышла GF6800U, она показала внушительное преимущество над тогдашним флагманом ATI — Radeon 9800 XT. Потом ATI выпустила видеокарты серии Radeon X800 и вернула себе лидерство в данном тесте. Теперь NVIDIA опять отобрала у ATI пальму первенства, однако мы ничуть не удивимся, если ATI R520 вернет сложившееся за предыдущие годы статус-кво.

Игровые тесты, сильно нагружающие блоки вершинных шейдеров, смешанно блоки пиксельных шейдеров 1.1 и 2.0, активное мультитекстурирование.

FarCry, Research



Результаты тестов: FarCry Research

В режимах без AA и AF скорость всех видеокарт ограничена центральным процессором. То же самое справедливо для режима 1024х768 с AA и AF, а вот выше уже начинается реальное соперничество.

Результаты показывают, что новая видеокарта NVIDIA в данном тесте еле-еле справилась со старым флагманом ATI — разницу в 2 fps трудно считать весомым преимуществом.

С другой стороны, ситуацию можно рассматривать и наоборот: новая видеокарта NVIDIA обогнала Radeon X850 XT PE настолько, насколько от нее отстала GeForce 6800 Ultra! :-)

Разогнанная (да и не разогнанная тоже) GF7800GTX в данном тесте соперничает с системой из двух GF6800U. SLI на базе G70 показывает максимальный относительный прирост в самом тяжелом режиме — 1600х1200 при AA и AF, что подтверждает уже высказанное нами предположение о существенной ограниченности этого теста возможностями использованного нами центрального процессора.

При этом отдельно отметим, что Crossfire-конфигурация из двух Radeon X850 XT PE вполне может оказаться быстрее двух GeForce 7800 GTX в данном тесте.

Обратим также внимание на результат, продемонстрированный GeForce 7800 GTX при включении режима HDR-рендеринга (FP16-буферы с блендингом): число кадров в секунду (fps) можно считать играбельным вплоть до режима 1280х1024 с AF. Еще раз напоминаем, что AA при включении HDR не работает, поэтому этот результат можно сравнивать с показателями других видеокарт только с точки зрения выбора «HDR+AF или AA+AF?». Отлично видно, что GF7800GTX при активизации HDR вместе с AF демонстрирует производительность уровня GF6800GT с AA и AF.

Активизация HDR все так же приводит к падению fps минимум на треть, что, пожалуй, лучше, чем у NV45 (там падение при включении HDR чаще всего превышало 50%), но все еще слишком много, чтобы считать HDR-режим «практически бесплатным».



FarCry, Regulator



Результаты тестов: FarCry Regulator

Результаты тестирования на уровне Regulator по своей сути повторяют результаты полученные на уровне Research. Разве что превосходство GF7800GTX над RX850XTPE стало более выраженным, да прирост эффективности конвейеров в G70 проявляется во всех «легких» режимах, а не только в разрешении 1600х1200.

FarCry, Pier



Результаты тестов: FarCry Pier

Результаты вплоть до мелочей аналогичны тестированию на уровне Research, правда на этот раз SLI-система из двух GF 7800 GTX уперлась в возможности CPU даже в режиме 1600х1200 с AA и AF — видимо, производительность на этом уровне еще больше зависит от скорости центрального процессора.

Игровые тесты, сильно нагружающие как блоки вершинных шейдеров, так и блоки пиксельных шейдеров 2.0

F.E.A.R. (MP beta)









Результаты тестов: F.E.A.R. (MP beta)

Предупредим возможные вопросы читателей: из-за ограничений по времени показатели производительности сняты лишь в разрешении 1024х768.

F.E.A.R. — новейшая игра, релиз которой запланирован на осень текущего года. Она колоссально нагружает ускорители, поэтому мы видим не столь высокие показатели в абсолютных FPS при максимальном качестве даже без AA и AF.

Результаты таковы, что даже для игры в разрешении 1024х768 вам понадобится, как минимум, Radeon X850 XT PE, чтобы получить удовольствие от максимального качества графики, а для большего комфорта уже нужен GeForce 7800 GTX. Скорости прежних топов (RX850XTPE, GF6800U) примерно равны, а новинка NVIDIA обходит их в среднем на треть, что является весьма неплохим показателем для игры нового поколения.



Half-Life2: ixbt01 demo



Результаты тестов: Half-Life2, ixbt01

Не трудно заметить, что этот тест упирается в производительность CPU вплоть до режима 1280х1024 с AA и AF. При этом мощность SLI-системы из двух G70 остается невостребованной даже в режиме 1600х1200 с AA и AF — остается включать AA 8x (и получать 85,5 fps вместо 94,5).

Более того, даже одна видеокарта GF7800GTX обеспечивает играбельное число fps при форсировании всех «наворотов» — AA 8x, AF 16x, гамма-коррекции и сглаживания альфа-текстур! В подобном «мегакачественном» режиме мы получаем 52 fps на GF7800GTX в разрешении 1600х1200.

Соперник в лице Radeon X850 XT PE оставлен в облаке пыли где-то на обочине истории — по мере роста возможностей CPU будет расти и отрыв GF7800GTX от флагмана канадской компании. Впрочем, он и так составляет 58% в самом тяжелом режиме, что является весьма внушительным показателем для теста, традиционно отдававшего предпочтение архитектуре видеокарт Radeon.

Наконец, отметим, что прирост эффективности чипа G70 над NV45 — приятный сюрприз! — увеличивается по мере роста нагрузки на видеокарту, что — неприятный вывод — совершенно закономерно, если вспомнить, что в «слабых» режимах данный тест «надежно» упирается в производительность CPU.



Half-Life2: ixbt02 demo



Результаты тестов: Half-Life2, ixbt02

Данный тест зависит от производительности CPU еще сильнее, чем предыдущий, что позволяет Radeon X850 XT PE по сути «сравняться» с большую часть времени простаивающей в ожидании данных от CPU GF7800GTX.

А раз все основные режимы уперлись в мощность центрального процессора, то самое время обратить ваше внимание на превосходство GF7800GTX над GF6800U в режиме 1600х1200 «максимальное качество» — с AF, AA 8x и, в случае чипа G70, гамма-коррекцией и сглаживанием альфа-текстур. Не трудно заметить, что даже с этими «бонусами» (а, например, сглаживание альфа-текстур в случае HL2 — «бонус» совсем не лишний) новый флагман NVIDIA почти на 50% превосходит предыдущего лидера американской компании в разрешении 1600х1200.



Half-Life2: ixbt03 demo



Результаты тестов: Half-Life2, ixbt03

По сути, единственный тест в HL2, в котором мы смогли получить минимально ощутимый прирост от использования SLI-системы на базе GF7800GTX — в режиме 1600х1200 с AA/AF.

Что интересно, отрыв GF7800GTX от RX850XTPE в том же режиме не так велик, хотя речи об ограниченности скорости возможностями CPU уже не идет. Видимо, в данном тесте используются шейдеры, оптимально исполняемые именно чипами Radeon. Предположение не кажется маловероятным, если вспомнить историю появления HL2 на свет.



Игровые тесты, сильно нагружающие пиксельный конвейер текстурированием, активная работа стенсиль-буфера, блоков шейдеров

DOOM III High mode



Результаты тестов: DOOM III

GeForce 7800 GTX обгоняет предыдущего флагмана NVIDIA в режимах с нагрузкой в среднем всего на 15%, что, по-видимому, объясняется конфигурацией ROP чипа G70. Подобный результат еще раз доказывает, что показатели видеокарт в Doom 3 сильно зависят от скорости работы с буфером шаблонов — увеличение количества конвейеров с 16 до 24 при сохранении записи 32 результатов в Z-буфер за такт вылилось в 15% прироста производительности в «тяжелых» режимах.

При этом система с двумя GF7800GTX оказалась ограниченной процессором вплоть до режима 1600х1200 с AA и AF, а достичь уровня производительности GF6800U SLI не удалось даже разогнанной GF7800GTX.

Безрадостную для нового детища NVIDIA картину несколько смягчают показатели видеокарты конкурента, которая в данном тесте идет наравне с GF6800GT, отставая от GF7800GTX на внушительные 39,2% в самом тяжелом режиме (1600х1200 с AA и AF). Де-факто она не представляет серьезной угрозы в Doom 3 не только новому поколению GeForce, но и предыдущему тоже.



Chronicles of Riddick, demo 44



Результаты тестов: Chronicles of Riddick, demo 44

Производительность в одной из самых требовательных к графической подсистеме игр последнего года отлично масштабируется практически во всех режимах и разрешениях, за исключением, разве что, разрешения 1024х768 без AA и AF — там новый флагман NVIDIA уже упирается в мощность нашего CPU.

Преимущество GeForce 7800 GTX над предыдущим топом NVIDIA — GeForce 6800 Ultra — достигает 33%. Что хуже, эта разница уменьшается при включении AA и AF.

Разогнанная GF7800GTX находится на уровне GF6800U SLI, а скорость двух объединенных карт GF7800GTX и вовсе поражает воображение — подобный тандем делает играбельными режимы с AA 8x и анизотропной фильтрацией.

GF7800GTX с пониженными до уровня GF6800U характеристиками демонстрирует незначительное преимущество в эффективности, превосходя в данном тесте предыдущий флагман NVIDIA где-то на 10%.



Chronicles of Riddick, demo ducche



Результаты тестов: Chronicles of Riddick, demo ducche

В этом тесте отрыв нового флагмана NVIDIA от старого заметно меньше (за исключением режима 1600х1200 без AA и AF, где GF7800GTX обошел GF6800U на 55%). И опять хорошо видно, как уменьшается отрыв при включении AA и AF.

SLI-система на базе GF7800GTX по-прежнему крайне успешно справляется с AA 8x и анизотропной фильтрацией. Обратите также внимание на прирост, обеспечиваемый SLI-системой в режиме 1600х1200 с AA и AF — по какой-то загадочной причине две G70GTX прошли этот тест более чем в два раза быстрее одной, что, вообще говоря, теоретически невозможно, ведь максимальный прирост при использовании второй видеокарты составляет не более 100 процентов...

Разогнанный до 495 МГц G70 все так же удачно соперничает с тандемом GF6800U SLI. Флагманская видеокарта ATI стабильно занимает последнее место и отстает даже от GF6800GT, не оставляя канадской компании никакой надежды на достойное соперничество с новым флагманом NVIDIA в данном тесте даже в случае использования двухчиповой конфигурации Crossfire: преимущество GF7800GTX над самой быстрой видеокартой ATI в данном тесте достигает 156% — более чем в два с половиной раза быстрее!

Проверка изменений в эффективности конвейеров демонстрирует все те же 5-10% выигрыша G70 с пониженной до уровня NV45 конфигурацией над старым флагманом калифорнийской компании.



Синтетические тесты, сильно нагружающие шейдерные блоки

3DMark05: MARKS



Результаты тестов: 3DMark05 MARKS

Разгон видеокарты выражается в ощутимых приростах даже в режиме 1024х768 без антиалиасинга и анизотропной фильтрации, что отлично подтверждает факт ограниченности производительности в 3D Mark 05 в первую очередь скоростью расчетов пиксельных и вершинных шейдеров.

Прирост относительно предыдущего флагмана NVIDIA значителен, но не огромен.

При этом отметим, что в режимах с нагрузкой мы зафиксировали самые ощутимые приросты эффективности по сравнению с GF6800U — видимо, сказывается оптимизация кэширования для анизотропной фильтрации 16x.

Кроме того, остается открытым вопрос о том, насколько NVIDIA сможет повысить скорость работы 3D Mark 05 за счет новых драйверов — если помните, GF6800U изначально демонстрировала аж на 2000 пунктов меньший результат в стандартном режиме тестирования (1024х768 без AA/AF).

Качество новых режимов АА

Как уже стало известно из предыдущих частей материала, идя навстречу чаяниями игроков и пытаясь исправить присущие MSAA недостатки, NVIDIA ввела дополнительные режимы сглаживания на полупрозрачных текстурах. Ведь не секрет, что multisampling (MSAA) при всех своих достоинствах в плане малого аппетита к производительности обладает недостатком: сглаживанию подлежат объекты, имеющие целостное текстурирование, то есть АА имеется по сути по краям этих объектов (для краткости и понимания). Но последние техники текстурирования все чаще и чаще дают разработчикам использовать очень эффектный прием: на полупрозрачной (прозрачной) текстуре нарисовать ажурные вещи (типа решеток, листьев), не тратясь на организацию полноценных трехмерных моделей. Соответственно, раз это все находится как бы внутри единой текстуры, то MSAA проходит мимо, и при наличии очень красиво исполненного сглаживания, например, на горах, крышах домов, листья деревьев выглядят рвано и бросается в глаза «лесенка» по их краям. Проблему мог бы решить SSAA, но он очень дорогой в плане скорости, и все это знают. Даже до сих пор его включение в состав AA 8x вызывает трехкратное падение производительности например у такого мощного ускорителя, как 6800 Ultra (что в ряде игр снижает играбельность ниже приемлемого уровня).

Поэтому то, что придумали разработчики из NVIDIA: сглаживать именно полупрозрачные текстуры: это очень похвально. Режимов два: MSAA и SSAA, без возможности выбора степени каждого из них. Разумеется, это все работает совместно с основным видом АА (2x, 4x, 8x). Давайте на примере FarCry посмотрим, как это выглядит на практике (мы выбрали место среди деревьев и подошли к одному из них, чтобы посмотреть на листья, выполненные на полупрозрачной текстуре).

No AA at all
Ну раз нет АА вообще, то и комментировать нечего :) «Лесенки» они и везде «лесенки»
MSAA AA4x, TAA OFF
Включен общеизвестный режим АА, сглаживания полупрозрачных текстур нет. Что уже не требовалось доказать: «лесенки» на листьях остались
MSAA AA4x, TAA MSAA
Включен общеизвестный режим АА, а также сглаживание полупрозрачных текстур в режиме MSAA. Лесенки пропали, но в целом как мне кажется, четкость пострадала, текстура стала более размытой.
MSAA AA4x, TAA SSAA
Включен общеизвестный режим АА, а также сглаживание полупрозрачных текстур в режиме SSAA. Как видно, этот режим почему-то не работает. Или виновата игра, или виноваты драйвера. Отмечу, что внешний АА4х включен через драйвера, если его включать при этом из игры, то вообще появляются сильные артефакты.
MSAA AA8x, TAA OFF
Теперь мы включаем самый глубокий внешний АА, который сам по себе уже содержит SSAA (это гибридный между MSAA и SSAA режим), и вот что мы видим при отключенном АА полупрозрачных текстур. Какую-то роль SSAA из AA8x сыграл, и некоторое сглаживание в целом имеется.
MSAA AA8x, TAA MSAA
При том же глубоком внешнем АА и при включенном TАА в режиме MS мы видим, что наверно это самый качественный АА в целом на сегодня. Хотя конечно, побочные эффекты в виде размывания четкости имеются.
MSAA AA8x, TAA SSAA
А если совместно с АА8х мы включим TАА в режиме SS, то снова констатируем, что последний не работает. Увы. Ждем комментариев от NVIDIA.

Для интересующихся подробностями о назначении и принципе работы TAA предназначена 4, дополнительная часть статьи, раскрывающая этот вопрос:

NVIDIA GeForce 7800 GTX 256MB PCI-E: Часть 4: Подробности о TAA



Выводы

Итак: NVIDIA GeForce 7800 GTX 256MB PCI-E — во всех отношениях новый продукт. Это не просто разгон по частоте или расширение числа пиксельных и вершинных конвейеров NV45. Это и переделанный, усовершенствованный растеризационный блок, и обновленная и усиленная геометрическая часть, и новые возможности, включающие долгожданный антиалиасинг прозрачных текстур с альфа-тестом и встроенный в чип HDTV-интерфейс. И хотя архитектурные отличия пиксельных и вершинных процессоров не велики, продуманная оптимизация ALU в пиксельных процессорах, блока растеризации и установки треугольников, post-TCL буферов геометрического конвейера и кэшей текстур выливаются в сумме в заметный прирост производительности этих блоков по сравнению с их прообразами в NV45. Особенно это заметно в сложных сценах и задачах. Кроме того, большой вклад в лидерские характеристики этого ускорителя вносит увеличение числа вершинных и пиксельных процессоров и новые частотные характеристики вкупе с хорошим разгонным потенциалом.

  1. Синтетические предельные тесты, кроме лидерства по абсолютным показателям, продемонстрировали высокий потенциал масштабируемости нового ускорителя и факт оптимизации пиксельных конвейеров и других важных блоков, в том числе кэшей и геометрического конвейера чипа. Балансировка чипа сдвинута в сторону более сложных сцен, что соответствует требованиям времени. Конечно, заявления о двукратном росте производительности пиксельных процессоров на единицу частоты можно считать сильным маркетинговым преувеличением (нехорошо!), но зачастую прирост (от 5% до 20% в зависимости от задачи), действительно имеет место и хорошо заметен в различных синтетических и игровых тестах.
  2. В практических игровых тестах новинка оказалась в среднем на 35-40% быстрее предшественника в лице 6800 Ultra, что чуть меньше прироста по числу конвейеров (если посчитать не мудрствуя лукаво). На понижение сыграли: отстающий блок геометрии (хоть конвейеров стало 8, но по сравнению с пиксельным блоком расширение менее масштабное) и, особенно, упор в почти не выросшую ПСП. Тем не менее, даже такой прирост по скорости очень хорош, особенно это касается современных игр, где изначально производительность при максимальном качестве находится не на очень высоком уровне играбельности даже на таких монстрах как X850XT PE и 6800 Ultra.
  3. Очень отрадным фактом является то, что карта обладает меньшим энергопотреблением, чем 6800 Ultra: замеры показали, что на пике загрузки разница достигала 40-50 Вт. Несмотря на это, все же нагрев платы весьма велик (впрочем, все топовые ускорители сейчас заметно греются). Вместе с этим продукт оснащен системой охлаждения очень скромных по толщине размеров, при этом весьма тихой, что также не может не радовать.
  4. Также положительным моментом является хорошая подготовленность к появлению таких изделий на прилавках и действительно массовому производству. Уже сейчас тысячи таких карт следуют в магазины, и отгрузка практически уже ведется.
  5. Не может не радовать доступность SLI решений на базе нового ускорителя, бальзам на душу энтузиастов и любителей рекордной производительности в самых современных приложениях. Впрочем, в случае SLI, очень часто все упирается в CPU и оправданность покупки двух карт полностью зависит от ситуации с конкретными приложениями. Мы убедились, что этот режим для G70 отлажен, все работает хорошо, проблем не было (во всяком случае в тех тестах, что мы выполнили). Приросты имеются (пусть не столь значительные, как у 6800U SLI, т.к. производительность G70 даже в старших и очень тяжелых режимах начинает упираться в центральный процессор и платформу). Напомним, что для SLI требуется блок питания от 500Вт и выше.
  6. Положительным фактом является поддержка референсной картой видеовхода (оцифровки видеосигнала) и поддержка чипом вывода изображения в HDTV-формате на соответствующие телевизоры и другую бытовую аппаратуру.
  7. Конечно, увеличенная со стандартных 499 до 599 долларов США цена несколько смазывает весьма приятную в целом картину, но посмотрим на реальные цены в магазинах (6800 Ultra изначально имела реальную цену в 650-700 долларов год назад).
  8. В целом можно только порадоваться за новый продукт от NVIDIA, он получился действительно очень хорошим почти во всех отношениях, ну и ждем выхода R520 от ATI, чтобы уже провести реальную битву титанов и сделать окончательные выводы. Отметим, что 7800 Ultra еще не анонсирована и с учетом хорошего разгонного потенциала чипа и связки ускоритель-память, несомненно, может стать сюрпризом с точки зрения частот и производительности.


Более полные сравнительные характеристики видеокарт этого и других классов вы можете увидеть также в наших 3DGiТогах.

Теоретико-аналитические материалы и обзоры видеокарт, в которых рассматриваются функциональные особенности GPU ATI RADEON X800 (R420)/X850 (R480)/X700 (RV410) и NVIDIA GeForce 6800 (NV40/45)/6600 (NV43)



Процессор для тестирования предоставлен компанией




Дополнительно

Обзор NVIDIA GeForce 7800 GTX 256MB PCI-E

NVIDIA GeForce 7800 GTX 256MB PCI-E

Часть 3: Игровые тесты, качество АА, выводы



СОДЕРЖАНИЕ

  1. Части 1 и 2.
  2. Результаты тестов
  3. Результаты тестов: TRAOD
  4. Результаты тестов: FarCry Research
  5. Результаты тестов: FarCry Regulator
  6. Результаты тестов: FarCry Pier
  7. Результаты тестов: F.E.A.R. (MP beta)
  8. Результаты тестов: Half-Life2, ixbt01
  9. Результаты тестов: Half-Life2, ixbt02
  10. Результаты тестов: Half-Life2, ixbt03
  11. Результаты тестов: DOOM III
  12. Результаты тестов: 3DMark05 MARKS
  13. Результаты тестов: Chronicles of Riddick, demo 44
  14. Результаты тестов: Chronicles of Riddick, demo ducche
  15. Выводы


NVIDIA GeForce 7800 GTX 256MB PCI-E: Часть 1: Теория и архитектура

NVIDIA GeForce 7800 GTX 256MB PCI-E: Часть 2: Описание карты, конфигурация стенда, результаты синтетических тестов

В предыдущих частях мы рассмотрели теоретические аспекты архитектуры, присущие новому продукту NVIDIA, а также посмотрели на то, какую производительность GeForce 7800 GTX демонстрирует в синтетических тестах (и убедились в том, что пиксельные конвейеры рендеринга G70 были не просто расширены численно относительно NV45, но и переработаны, в результате чего возросла производительность одного конвейера на единицу частоты; кроме того были увеличены кэши и несколько изменен баланс их работы в расчете на более сложные как геометрически, так и текстурно сцены).

В этом разделе мы разместили главную честь нашего исследования, которая интересует всех геймеров — производительность в реальных игровых 3D-приложениях. А закончим мы наше первое знакомство с GeForce 7800 GTX небольшим комментарием по качеству АА (в первой части статьи мы уже упоминали про новый режим AA на GF7800GTX).

Результаты тестов: сравнение производительности

В качестве инструментария мы использовали:

  • Tomb Raider: Angel of Darkness v.49 (Core Design/Eldos Software) — DirectX 9.0, Paris5_4 demo. Тестирование проводилось при максимально установленном качестве, выключены были лишь Depth of Fields PS20.

  • Half-Life2 (Valve/Sierra) — DirectX 9.0, demo (ixbt01, ixbt02, ixbt03 Тестирование проводилось при максимальном качестве, опция -dxlevel 90, в файле dxsupport.cfg убраны предустановки для видов карт.

  • FarCry 1.3 (Crytek/UbiSoft), DirectX 9.0, мультитекстурирование, 3 demo из уровней Research, Pier, Regulator (запуск игры с опцией -DEVMODE), настройки тестирования все Very High.

  • DOOM III (id Software/Activision) — OpenGL, мультитекстурирование, настройки тестирования — High Quality (ANIS8x). Имеется пример автоматизации запуска с увеличением скорости и уменьшением числа рывков (прекешинг).

  • 3DMark05 (FutureMark) — DirectX 9.0, мультитекстурирование, настройки тестирования — trilinear,

  • F.E.A.R. (Multiplayer beta) (Monolith/Sierra) — DirectX 9.0, мультитекстурирование, настройки тестирования — maximum, Soft shadows.

  • The Chronicles Of Riddick: Escape From Butcher Bay (Starbreeze/Vivendi) — OpenGL, мультитекстурирование, настройки тестирования — максимальное качество текстур, Shader 2.0.

    Выражаю благодарность Ринату Досаеву (AKA 4uckall) и Алексею Островскому (AKA Дучче) за написание демо к данной игре, а также большое спасибо Алексею Берилло AKA Somebody Else за помощь



Игровые тесты, сильно нагружающие блоки пиксельных шейдеров 2.0.

TR:AoD, Paris5_4 DEMO



Результаты тестов: TRAOD

Данный тест давно потерял какую-либо значимость для геймеров, но зато хорошо отображает возможности видеокарт в работе с относительно простыми пиксельными шейдерами 2.0.

Когда вышла GF6800U, она показала внушительное преимущество над тогдашним флагманом ATI — Radeon 9800 XT. Потом ATI выпустила видеокарты серии Radeon X800 и вернула себе лидерство в данном тесте. Теперь NVIDIA опять отобрала у ATI пальму первенства, однако мы ничуть не удивимся, если ATI R520 вернет сложившееся за предыдущие годы статус-кво.

Игровые тесты, сильно нагружающие блоки вершинных шейдеров, смешанно блоки пиксельных шейдеров 1.1 и 2.0, активное мультитекстурирование.

FarCry, Research



Результаты тестов: FarCry Research

В режимах без AA и AF скорость всех видеокарт ограничена центральным процессором. То же самое справедливо для режима 1024х768 с AA и AF, а вот выше уже начинается реальное соперничество.

Результаты показывают, что новая видеокарта NVIDIA в данном тесте еле-еле справилась со старым флагманом ATI — разницу в 2 fps трудно считать весомым преимуществом.

С другой стороны, ситуацию можно рассматривать и наоборот: новая видеокарта NVIDIA обогнала Radeon X850 XT PE настолько, насколько от нее отстала GeForce 6800 Ultra! :-)

Разогнанная (да и не разогнанная тоже) GF7800GTX в данном тесте соперничает с системой из двух GF6800U. SLI на базе G70 показывает максимальный относительный прирост в самом тяжелом режиме — 1600х1200 при AA и AF, что подтверждает уже высказанное нами предположение о существенной ограниченности этого теста возможностями использованного нами центрального процессора.

При этом отдельно отметим, что Crossfire-конфигурация из двух Radeon X850 XT PE вполне может оказаться быстрее двух GeForce 7800 GTX в данном тесте.

Обратим также внимание на результат, продемонстрированный GeForce 7800 GTX при включении режима HDR-рендеринга (FP16-буферы с блендингом): число кадров в секунду (fps) можно считать играбельным вплоть до режима 1280х1024 с AF. Еще раз напоминаем, что AA при включении HDR не работает, поэтому этот результат можно сравнивать с показателями других видеокарт только с точки зрения выбора «HDR+AF или AA+AF?». Отлично видно, что GF7800GTX при активизации HDR вместе с AF демонстрирует производительность уровня GF6800GT с AA и AF.

Активизация HDR все так же приводит к падению fps минимум на треть, что, пожалуй, лучше, чем у NV45 (там падение при включении HDR чаще всего превышало 50%), но все еще слишком много, чтобы считать HDR-режим «практически бесплатным».



FarCry, Regulator



Результаты тестов: FarCry Regulator

Результаты тестирования на уровне Regulator по своей сути повторяют результаты полученные на уровне Research. Разве что превосходство GF7800GTX над RX850XTPE стало более выраженным, да прирост эффективности конвейеров в G70 проявляется во всех «легких» режимах, а не только в разрешении 1600х1200.

FarCry, Pier



Результаты тестов: FarCry Pier

Результаты вплоть до мелочей аналогичны тестированию на уровне Research, правда на этот раз SLI-система из двух GF 7800 GTX уперлась в возможности CPU даже в режиме 1600х1200 с AA и AF — видимо, производительность на этом уровне еще больше зависит от скорости центрального процессора.

Игровые тесты, сильно нагружающие как блоки вершинных шейдеров, так и блоки пиксельных шейдеров 2.0

F.E.A.R. (MP beta)









Результаты тестов: F.E.A.R. (MP beta)

Предупредим возможные вопросы читателей: из-за ограничений по времени показатели производительности сняты лишь в разрешении 1024х768.

F.E.A.R. — новейшая игра, релиз которой запланирован на осень текущего года. Она колоссально нагружает ускорители, поэтому мы видим не столь высокие показатели в абсолютных FPS при максимальном качестве даже без AA и AF.

Результаты таковы, что даже для игры в разрешении 1024х768 вам понадобится, как минимум, Radeon X850 XT PE, чтобы получить удовольствие от максимального качества графики, а для большего комфорта уже нужен GeForce 7800 GTX. Скорости прежних топов (RX850XTPE, GF6800U) примерно равны, а новинка NVIDIA обходит их в среднем на треть, что является весьма неплохим показателем для игры нового поколения.



Half-Life2: ixbt01 demo



Результаты тестов: Half-Life2, ixbt01

Не трудно заметить, что этот тест упирается в производительность CPU вплоть до режима 1280х1024 с AA и AF. При этом мощность SLI-системы из двух G70 остается невостребованной даже в режиме 1600х1200 с AA и AF — остается включать AA 8x (и получать 85,5 fps вместо 94,5).

Более того, даже одна видеокарта GF7800GTX обеспечивает играбельное число fps при форсировании всех «наворотов» — AA 8x, AF 16x, гамма-коррекции и сглаживания альфа-текстур! В подобном «мегакачественном» режиме мы получаем 52 fps на GF7800GTX в разрешении 1600х1200.

Соперник в лице Radeon X850 XT PE оставлен в облаке пыли где-то на обочине истории — по мере роста возможностей CPU будет расти и отрыв GF7800GTX от флагмана канадской компании. Впрочем, он и так составляет 58% в самом тяжелом режиме, что является весьма внушительным показателем для теста, традиционно отдававшего предпочтение архитектуре видеокарт Radeon.

Наконец, отметим, что прирост эффективности чипа G70 над NV45 — приятный сюрприз! — увеличивается по мере роста нагрузки на видеокарту, что — неприятный вывод — совершенно закономерно, если вспомнить, что в «слабых» режимах данный тест «надежно» упирается в производительность CPU.



Half-Life2: ixbt02 demo



Результаты тестов: Half-Life2, ixbt02

Данный тест зависит от производительности CPU еще сильнее, чем предыдущий, что позволяет Radeon X850 XT PE по сути «сравняться» с большую часть времени простаивающей в ожидании данных от CPU GF7800GTX.

А раз все основные режимы уперлись в мощность центрального процессора, то самое время обратить ваше внимание на превосходство GF7800GTX над GF6800U в режиме 1600х1200 «максимальное качество» — с AF, AA 8x и, в случае чипа G70, гамма-коррекцией и сглаживанием альфа-текстур. Не трудно заметить, что даже с этими «бонусами» (а, например, сглаживание альфа-текстур в случае HL2 — «бонус» совсем не лишний) новый флагман NVIDIA почти на 50% превосходит предыдущего лидера американской компании в разрешении 1600х1200.



Half-Life2: ixbt03 demo



Результаты тестов: Half-Life2, ixbt03

По сути, единственный тест в HL2, в котором мы смогли получить минимально ощутимый прирост от использования SLI-системы на базе GF7800GTX — в режиме 1600х1200 с AA/AF.

Что интересно, отрыв GF7800GTX от RX850XTPE в том же режиме не так велик, хотя речи об ограниченности скорости возможностями CPU уже не идет. Видимо, в данном тесте используются шейдеры, оптимально исполняемые именно чипами Radeon. Предположение не кажется маловероятным, если вспомнить историю появления HL2 на свет.



Игровые тесты, сильно нагружающие пиксельный конвейер текстурированием, активная работа стенсиль-буфера, блоков шейдеров

DOOM III High mode



Результаты тестов: DOOM III

GeForce 7800 GTX обгоняет предыдущего флагмана NVIDIA в режимах с нагрузкой в среднем всего на 15%, что, по-видимому, объясняется конфигурацией ROP чипа G70. Подобный результат еще раз доказывает, что показатели видеокарт в Doom 3 сильно зависят от скорости работы с буфером шаблонов — увеличение количества конвейеров с 16 до 24 при сохранении записи 32 результатов в Z-буфер за такт вылилось в 15% прироста производительности в «тяжелых» режимах.

При этом система с двумя GF7800GTX оказалась ограниченной процессором вплоть до режима 1600х1200 с AA и AF, а достичь уровня производительности GF6800U SLI не удалось даже разогнанной GF7800GTX.

Безрадостную для нового детища NVIDIA картину несколько смягчают показатели видеокарты конкурента, которая в данном тесте идет наравне с GF6800GT, отставая от GF7800GTX на внушительные 39,2% в самом тяжелом режиме (1600х1200 с AA и AF). Де-факто она не представляет серьезной угрозы в Doom 3 не только новому поколению GeForce, но и предыдущему тоже.



Chronicles of Riddick, demo 44



Результаты тестов: Chronicles of Riddick, demo 44

Производительность в одной из самых требовательных к графической подсистеме игр последнего года отлично масштабируется практически во всех режимах и разрешениях, за исключением, разве что, разрешения 1024х768 без AA и AF — там новый флагман NVIDIA уже упирается в мощность нашего CPU.

Преимущество GeForce 7800 GTX над предыдущим топом NVIDIA — GeForce 6800 Ultra — достигает 33%. Что хуже, эта разница уменьшается при включении AA и AF.

Разогнанная GF7800GTX находится на уровне GF6800U SLI, а скорость двух объединенных карт GF7800GTX и вовсе поражает воображение — подобный тандем делает играбельными режимы с AA 8x и анизотропной фильтрацией.

GF7800GTX с пониженными до уровня GF6800U характеристиками демонстрирует незначительное преимущество в эффективности, превосходя в данном тесте предыдущий флагман NVIDIA где-то на 10%.



Chronicles of Riddick, demo ducche



Результаты тестов: Chronicles of Riddick, demo ducche

В этом тесте отрыв нового флагмана NVIDIA от старого заметно меньше (за исключением режима 1600х1200 без AA и AF, где GF7800GTX обошел GF6800U на 55%). И опять хорошо видно, как уменьшается отрыв при включении AA и AF.

SLI-система на базе GF7800GTX по-прежнему крайне успешно справляется с AA 8x и анизотропной фильтрацией. Обратите также внимание на прирост, обеспечиваемый SLI-системой в режиме 1600х1200 с AA и AF — по какой-то загадочной причине две G70GTX прошли этот тест более чем в два раза быстрее одной, что, вообще говоря, теоретически невозможно, ведь максимальный прирост при использовании второй видеокарты составляет не более 100 процентов...

Разогнанный до 495 МГц G70 все так же удачно соперничает с тандемом GF6800U SLI. Флагманская видеокарта ATI стабильно занимает последнее место и отстает даже от GF6800GT, не оставляя канадской компании никакой надежды на достойное соперничество с новым флагманом NVIDIA в данном тесте даже в случае использования двухчиповой конфигурации Crossfire: преимущество GF7800GTX над самой быстрой видеокартой ATI в данном тесте достигает 156% — более чем в два с половиной раза быстрее!

Проверка изменений в эффективности конвейеров демонстрирует все те же 5-10% выигрыша G70 с пониженной до уровня NV45 конфигурацией над старым флагманом калифорнийской компании.



Синтетические тесты, сильно нагружающие шейдерные блоки

3DMark05: MARKS



Результаты тестов: 3DMark05 MARKS

Разгон видеокарты выражается в ощутимых приростах даже в режиме 1024х768 без антиалиасинга и анизотропной фильтрации, что отлично подтверждает факт ограниченности производительности в 3D Mark 05 в первую очередь скоростью расчетов пиксельных и вершинных шейдеров.

Прирост относительно предыдущего флагмана NVIDIA значителен, но не огромен.

При этом отметим, что в режимах с нагрузкой мы зафиксировали самые ощутимые приросты эффективности по сравнению с GF6800U — видимо, сказывается оптимизация кэширования для анизотропной фильтрации 16x.

Кроме того, остается открытым вопрос о том, насколько NVIDIA сможет повысить скорость работы 3D Mark 05 за счет новых драйверов — если помните, GF6800U изначально демонстрировала аж на 2000 пунктов меньший результат в стандартном режиме тестирования (1024х768 без AA/AF).

Качество новых режимов АА

Как уже стало известно из предыдущих частей материала, идя навстречу чаяниями игроков и пытаясь исправить присущие MSAA недостатки, NVIDIA ввела дополнительные режимы сглаживания на полупрозрачных текстурах. Ведь не секрет, что multisampling (MSAA) при всех своих достоинствах в плане малого аппетита к производительности обладает недостатком: сглаживанию подлежат объекты, имеющие целостное текстурирование, то есть АА имеется по сути по краям этих объектов (для краткости и понимания). Но последние техники текстурирования все чаще и чаще дают разработчикам использовать очень эффектный прием: на полупрозрачной (прозрачной) текстуре нарисовать ажурные вещи (типа решеток, листьев), не тратясь на организацию полноценных трехмерных моделей. Соответственно, раз это все находится как бы внутри единой текстуры, то MSAA проходит мимо, и при наличии очень красиво исполненного сглаживания, например, на горах, крышах домов, листья деревьев выглядят рвано и бросается в глаза «лесенка» по их краям. Проблему мог бы решить SSAA, но он очень дорогой в плане скорости, и все это знают. Даже до сих пор его включение в состав AA 8x вызывает трехкратное падение производительности например у такого мощного ускорителя, как 6800 Ultra (что в ряде игр снижает играбельность ниже приемлемого уровня).

Поэтому то, что придумали разработчики из NVIDIA: сглаживать именно полупрозрачные текстуры: это очень похвально. Режимов два: MSAA и SSAA, без возможности выбора степени каждого из них. Разумеется, это все работает совместно с основным видом АА (2x, 4x, 8x). Давайте на примере FarCry посмотрим, как это выглядит на практике (мы выбрали место среди деревьев и подошли к одному из них, чтобы посмотреть на листья, выполненные на полупрозрачной текстуре).

No AA at all
Ну раз нет АА вообще, то и комментировать нечего :) «Лесенки» они и везде «лесенки»
MSAA AA4x, TAA OFF
Включен общеизвестный режим АА, сглаживания полупрозрачных текстур нет. Что уже не требовалось доказать: «лесенки» на листьях остались
MSAA AA4x, TAA MSAA
Включен общеизвестный режим АА, а также сглаживание полупрозрачных текстур в режиме MSAA. Лесенки пропали, но в целом как мне кажется, четкость пострадала, текстура стала более размытой.
MSAA AA4x, TAA SSAA
Включен общеизвестный режим АА, а также сглаживание полупрозрачных текстур в режиме SSAA. Как видно, этот режим почему-то не работает. Или виновата игра, или виноваты драйвера. Отмечу, что внешний АА4х включен через драйвера, если его включать при этом из игры, то вообще появляются сильные артефакты.
MSAA AA8x, TAA OFF
Теперь мы включаем самый глубокий внешний АА, который сам по себе уже содержит SSAA (это гибридный между MSAA и SSAA режим), и вот что мы видим при отключенном АА полупрозрачных текстур. Какую-то роль SSAA из AA8x сыграл, и некоторое сглаживание в целом имеется.
MSAA AA8x, TAA MSAA
При том же глубоком внешнем АА и при включенном TАА в режиме MS мы видим, что наверно это самый качественный АА в целом на сегодня. Хотя конечно, побочные эффекты в виде размывания четкости имеются.
MSAA AA8x, TAA SSAA
А если совместно с АА8х мы включим TАА в режиме SS, то снова констатируем, что последний не работает. Увы. Ждем комментариев от NVIDIA.

Для интересующихся подробностями о назначении и принципе работы TAA предназначена 4, дополнительная часть статьи, раскрывающая этот вопрос:

NVIDIA GeForce 7800 GTX 256MB PCI-E: Часть 4: Подробности о TAA



Выводы

Итак: NVIDIA GeForce 7800 GTX 256MB PCI-E — во всех отношениях новый продукт. Это не просто разгон по частоте или расширение числа пиксельных и вершинных конвейеров NV45. Это и переделанный, усовершенствованный растеризационный блок, и обновленная и усиленная геометрическая часть, и новые возможности, включающие долгожданный антиалиасинг прозрачных текстур с альфа-тестом и встроенный в чип HDTV-интерфейс. И хотя архитектурные отличия пиксельных и вершинных процессоров не велики, продуманная оптимизация ALU в пиксельных процессорах, блока растеризации и установки треугольников, post-TCL буферов геометрического конвейера и кэшей текстур выливаются в сумме в заметный прирост производительности этих блоков по сравнению с их прообразами в NV45. Особенно это заметно в сложных сценах и задачах. Кроме того, большой вклад в лидерские характеристики этого ускорителя вносит увеличение числа вершинных и пиксельных процессоров и новые частотные характеристики вкупе с хорошим разгонным потенциалом.

  1. Синтетические предельные тесты, кроме лидерства по абсолютным показателям, продемонстрировали высокий потенциал масштабируемости нового ускорителя и факт оптимизации пиксельных конвейеров и других важных блоков, в том числе кэшей и геометрического конвейера чипа. Балансировка чипа сдвинута в сторону более сложных сцен, что соответствует требованиям времени. Конечно, заявления о двукратном росте производительности пиксельных процессоров на единицу частоты можно считать сильным маркетинговым преувеличением (нехорошо!), но зачастую прирост (от 5% до 20% в зависимости от задачи), действительно имеет место и хорошо заметен в различных синтетических и игровых тестах.
  2. В практических игровых тестах новинка оказалась в среднем на 35-40% быстрее предшественника в лице 6800 Ultra, что чуть меньше прироста по числу конвейеров (если посчитать не мудрствуя лукаво). На понижение сыграли: отстающий блок геометрии (хоть конвейеров стало 8, но по сравнению с пиксельным блоком расширение менее масштабное) и, особенно, упор в почти не выросшую ПСП. Тем не менее, даже такой прирост по скорости очень хорош, особенно это касается современных игр, где изначально производительность при максимальном качестве находится не на очень высоком уровне играбельности даже на таких монстрах как X850XT PE и 6800 Ultra.
  3. Очень отрадным фактом является то, что карта обладает меньшим энергопотреблением, чем 6800 Ultra: замеры показали, что на пике загрузки разница достигала 40-50 Вт. Несмотря на это, все же нагрев платы весьма велик (впрочем, все топовые ускорители сейчас заметно греются). Вместе с этим продукт оснащен системой охлаждения очень скромных по толщине размеров, при этом весьма тихой, что также не может не радовать.
  4. Также положительным моментом является хорошая подготовленность к появлению таких изделий на прилавках и действительно массовому производству. Уже сейчас тысячи таких карт следуют в магазины, и отгрузка практически уже ведется.
  5. Не может не радовать доступность SLI решений на базе нового ускорителя, бальзам на душу энтузиастов и любителей рекордной производительности в самых современных приложениях. Впрочем, в случае SLI, очень часто все упирается в CPU и оправданность покупки двух карт полностью зависит от ситуации с конкретными приложениями. Мы убедились, что этот режим для G70 отлажен, все работает хорошо, проблем не было (во всяком случае в тех тестах, что мы выполнили). Приросты имеются (пусть не столь значительные, как у 6800U SLI, т.к. производительность G70 даже в старших и очень тяжелых режимах начинает упираться в центральный процессор и платформу). Напомним, что для SLI требуется блок питания от 500Вт и выше.
  6. Положительным фактом является поддержка референсной картой видеовхода (оцифровки видеосигнала) и поддержка чипом вывода изображения в HDTV-формате на соответствующие телевизоры и другую бытовую аппаратуру.
  7. Конечно, увеличенная со стандартных 499 до 599 долларов США цена несколько смазывает весьма приятную в целом картину, но посмотрим на реальные цены в магазинах (6800 Ultra изначально имела реальную цену в 650-700 долларов год назад).
  8. В целом можно только порадоваться за новый продукт от NVIDIA, он получился действительно очень хорошим почти во всех отношениях, ну и ждем выхода R520 от ATI, чтобы уже провести реальную битву титанов и сделать окончательные выводы. Отметим, что 7800 Ultra еще не анонсирована и с учетом хорошего разгонного потенциала чипа и связки ускоритель-память, несомненно, может стать сюрпризом с точки зрения частот и производительности.


Более полные сравнительные характеристики видеокарт этого и других классов вы можете увидеть также в наших 3DGiТогах.

Теоретико-аналитические материалы и обзоры видеокарт, в которых рассматриваются функциональные особенности GPU ATI RADEON X800 (R420)/X850 (R480)/X700 (RV410) и NVIDIA GeForce 6800 (NV40/45)/6600 (NV43)



Процессор для тестирования предоставлен компанией