Nvidia Geforce 8800 GTS 512MB (G92)

Снова 128 более сильных калифорнийских стрелков, но с урезанными копьями (512MB и 256bit)


Часть 2: Особенности видеокарт, синтетические тесты





СОДЕРЖАНИЕ

  1. Часть 1 — Теория и архитектура
  2. Часть 2 — Практическое знакомство
  3. Особенности видеокарт
  4. Конфигурация стенда, список тестовых инструментов
  5. Результаты синтетических тестов
  6. Результаты игровых тестов (производительность)


Nvidia Geforce 8800 GTS 512MB (G92): Часть 1: Теоретические сведения


Итак, все подробности об особенностях архитектуры новинок уже освещены в первой части материала.

Сегодня в нашей лаборатории, побывали продукты от компаний BFG и Zotac. Однако, повторю, что в данном случае мы имели возможность просто ДВАЖДЫ посмотреть на одну и ту же по сути референс-карту. У BFG лишь частоты слегко изменены.

Платы



BFG Geforce 8800 GTS OC 512MB PCI-E
  • GPU: Geforce 8800 GTS (G92)
  • Интерфейс: PCI-Express x16
  • Частоты работы GPU (ROPs/Shaders): 675/1674 MHz (номинал — 650/1620 МГц)
  • Частоты работы памяти (физическая (эффективная)): 970 (1940) MHz (номинал — 970 (1940) МГц)
  • Ширина шины обмена с памятью: 256bit
  • Число вершинных процессоров: -
  • Число пиксельных процессоров: -
  • Число универсальных процессоров: 128
  • Число текстурных процессоров: 64 (28) (BLF)
  • Число ROPs: 16
  • Размеры: 220x100x32 мм (последняя величина — максимальная толщина видеокарты).
  • Цвет текстолита: светоо-зеленый
  • RAMDACs/TMDS: интегрированы в GPU.
  • Выходные гнезда: 2xDVI (Dual-Link/HDMI), TV-выход.
  • VIVO: нет
  • TV-out: интегрирован в GPU.
  • Поддержка многопроцессорной работы: SLI (Hardware).
Zotac Geforce 8800 GTS 512MB PCI-E
  • GPU: Geforce 8800 GTS (G92)
  • Интерфейс: PCI-Express x16
  • Частоты работы GPU (ROPs/Shaders): 650/1620 MHz (номинал — 650/1620 МГц)
  • Частоты работы памяти (физическая (эффективная)): 970 (1940) MHz (номинал — 970 (1940) МГц)
  • Ширина шины обмена с памятью: 256bit
  • Число вершинных процессоров: -
  • Число пиксельных процессоров: -
  • Число универсальных процессоров: 128
  • Число текстурных процессоров: 64 (28) (BLF)
  • Число ROPs: 16
  • Размеры: 220x100x32 мм (последняя величина — максимальная толщина видеокарты).
  • Цвет текстолита: светоо-зеленый
  • RAMDACs/TMDS: интегрированы в GPU.
  • Выходные гнезда: 2xDVI (Dual-Link/HDMI), TV-выход.
  • VIVO: нет
  • TV-out: интегрирован в GPU.
  • Поддержка многопроцессорной работы: SLI (Hardware).


BFG Geforce 8800 GTS OC 512MB PCI-E
Zotac Geforce 8800 GTS 512MB PCI-E
Каждая карта имеет 512 МБ памяти GDDR3 SDRAM, размещенной в 8-ми микросхемах на лицевой стороне PCB.

Микросхемы памяти Qimonda (GDDR3). Время выборки у микросхем памяти 1,0 ns, что соответствует частоте работы 1000 (2000) МГц.



Сравнение с эталонным дизайном, вид спереди
Zotac Geforce 8800 GTS 512MB PCI-E Reference card Nvidia Geforce 8800 GT
BFG Geforce 8800 GTS OC 512MB PCI-E


Сравнение с эталонным дизайном, вид сзади
Zotac Geforce 8800 GTS 512MB PCI-E Reference card Nvidia Geforce 8800 GT
BFG Geforce 8800 GTS OC 512MB PCI-E


Фотографии показали, что у 8800GT и нового 8800 GTS используется одна и та же PCB, только усиленная в последнем случае рядом элементов питания, которые ранее не было просто установлены.

Также видно, что каждая плата требует один шестипиновый PCI-E хвост от БП. Поэтому это надо иметь в виду потенциальным покупателям. Требования к БП таковы: нужен блок питания не менее 400Вт с поддержкой токов по 12В каналу не менее 18-20А.

У карт имеется гнездо TV-выхода, которое уникально по разъему, и для вывода изображения на ТВ как через S-Video, так и по RCA, требуется специальный адаптер-переходник, (обычно поставляемый вместе с картой). По ТВ-выходу можно почитать — здесь.

Продолжая изучать карты, мы видим, что они снабжены парой гнезд DVI. Причем, Dual link DVI, что позволяет по цифровому каналу получать разрешения выше 1600х1200. Подключение к аналоговым мониторам с d-Sub (VGA) интерфейсам производится через специальные адаптеры-переходники DVI-to-d-Sub. Максимальные разрешения и частоты:

  • 240 Hz Max Refresh Rate
  • 2048 × 1536 × 32bit @ 85Hz Max — по аналоговому интерфейсу
  • 2560 × 1600 @ 60Hz Max — по цифровому интерфейсу

Что касается возможностей видеокарт по проигрыванию MPEG2 (DVD-Video), то еще в 2002 году мы изучали этот вопрос, с тех пор мало что поменялось. В зависимости от фильма загрузка CPU при проигрывании на современных видеокартах не поднимается выше 25%.

Что касается HDTV и прочих новомодных видеоштучек, то одно из исследований также проведено, и с ним можно ознакомиться здесь.

Теперь о системах охлаждения. Рассмотрим референсный кулер на примере карты от Zotac.

Zotac Geforce 8800 GTS 512MB PCI-E

Отказавшись в случае с 8800 GT от ранее используемых даже в относительно дешевом 8800 GTS 320MB двухслотовых кулеров, компания Nvidia сделала некую ошибку, поскольку было ясно, что узкий однослотовый, да еще и невыбрасывающий горячий воздух вон из системного блока кулер имеет большой недостаток в виде невысокой эффективности, а также он несколько шумный.

И вот на 8800 GTS 512MB разработчики вернулись к прежней схеме, и перед нами большое двухслотовое устройство, охлаждающее не только ядро, но и микросхемы памяти, а также некоторые элементы блока питания. Почему решили сотворить новый кулер, а не просто использовать тот же, что был на 8800 GTS предыдущих выпусков (когда то устройство было как и эффективным, так и тихим), модернизировав лишь контактную площадку под новое расположение микросхем памяти, — осталось загадкой.

Новый кулер имеет лишь более угловатые очертания корпуса, а также некий наклон вентлятора относительно плоскости карты. В остальном все то же самое, принцип прогонки воздуха через массивный радиатор, связанный с подошвой не только пайкой, но и тепловыми трубками. Затем этот уже горячий воздух выносится за пределы системного блока.

Турбина работает на малых оборотах, не выще 1000, поэтому шума нет вообще.



Поскольку новая версия RivaTuner (автор А.Николайчук AKA Unwinder) уже поддерживает G92, то посмотрим на мониторинг, полученный с помощью данной программы.



Zotac Geforce 8800 GTS 512MB PCI-E



BFG Geforce 8800 GTS OC 512MB PCI-E



Как мы видим, температура ядра явно выше 80 градусов, хотя при этом обороты кулера ничуть не выросли (наверно от страха, чтобы кулер не стал шумным, ребята из Nvidia перестарались и заложили в него чрезмерно малые обороты). Полагаю, что с помощью того же RT можно выставить чуть более высокие обороты вентилятора, не нарушив при этом бесшумности, зато температура ядра упадет. Впрочем, и 85 градусов при условии, что тепло выводится за пределы корпуса, это нормально и не критично.

Теперь посмотрим на сами процессоры.

Geforce 8800 GTS 512 (G92)



Размеры кристалла среднего размера (мы видели и более огромные), несмотря на огромное число транзисторов.

Комплектация.

BFG Geforce 8800 GTS OC 512MB PCI-E
Руководство пользователя, CD с драйверами, переходники DVI-to-d-Sub (2 шт.) и S-Video-to-RCA, TV-кабели, адаптер для компонентного вывода, переходник внешнего питания.

Zotac Geforce 8800 GTS 512MB PCI-E
Аналогичный комплект, только без обилия всяких листовок и регистрационных карточек, каковых полно у BFG. А также предложен лишь один адаптер DVI-to-VGA (хотя на мой взгляд, сейчас уже мало кто будет подключать новые подобные карты сразу к двум аналоговым CRT-мониторам).



Упаковка.

BFG Geforce 8800 GTS OC 512MB PCI-E
Я еще ранее говорил, что американская компания BFG все ищет, как бы выделиться среди конкурентов. Эту самую "охваченную голову" они то убирают, то снова ставят. Видимо наверно иссякла дизайнерская мысль. В целом дизайн мне не нравится, надписи нанесены вспешке кое-как, интуитивно хочется даже поправить. Хотя размеры коробки торговцам покажутся привлекательными: не огромные и не мизерные.

Еще раз умилил способ упаковки всех кабелей: их завернули в сверточек и положили рядом с картой. Карта сама находится в жестком отсеке в двух пакетах, поэтому надежно защищена от повреждений.

В целом же тенденция по ухудшению упаковки и комплектации налицо: начиналось с красивых и стильных коробок с майками и другими подарками, закончилось банальной черной коробкой, на которую что-то нанесли.

Zotac Geforce 8800 GTS 512MB PCI-E

Также в материале по 8800 GT я отметил, что Zotac резко изменил дизайн упаковки. И она стала яркой и стильной. Хотя почему-то в прошлом случае было окно, через которое видна карта, а теперь его нет. А также почему-то ушли от драконьей темы, которая была очень даже привлекательна.

Весь комплект расположен в жестких пластиковых отсеках, поэтому повреждения карты в процессе перевозки исключены.



Установка и драйверы

Конфигурация тестового стенда:

  • Компьютер на базе Intel Core2 Duo (775 Socket)
    • процессор Intel Core2 Duo Extreme X6800 (2930 MHz) (L2=4096K);
    • системная плата EVGA nForce 680i SLI на чипсете Nvidia nForce 680i;
    • оперативная память 2 GB DDR2 SDRAM Corsair 1142MHz (CAS (tCL)=5; RAS to CAS delay (tRCD)=5; Row Precharge (tRP)=5; tRAS=15);
    • жесткий диск WD Caviar SE WD1600JD 160GB SATA.
  • операционная система Windows XP SP2; DirectX 9.0c;
  • операционная система Windows Vista Ultimate; DirectX 10.0;
  • монитор Dell 3007WFP (30").
  • драйверы ATI версии CATALYST 7.10; Nvidia версии 169.06.

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

  • D3D RightMark Beta 4 (1050) с описанием на сайте 3d.rightmark.org
  • D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 — тесты пиксельных шейдеров версий 2.0 и 3.0 ссылка.
  • RightMark3D 2.0 с кратким описанием: ссылка

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

Синтетические тесты проводились на следующих видеокартах:

  • Nvidia Geforce 8800 GTS 512MB со стандартными параметрами (далее GF8800GTS 512)
  • Nvidia Geforce 8800 GT со стандартными параметрами (далее GF8800GT)
  • Nvidia Geforce 8800 GTX со стандартными параметрами (далее GF8800GTX)
  • Nvidia Geforce 8800 GTS 640MB со стандартными параметрами (далее GF8800GTS 640)
  • Nvidia Geforce 8800 GTS 320MB со стандартными параметрами (далее GF8800GTS 320)
  • RADEON HD 3870 со стандартными параметрами (далее HD3870)

Для сравнения результатов Geforce 8800 GTS 512MB эти модели были выбраны по следующим причинам: с Geforce 8800 GT будет интересно сравнить, как с решением из другого ценового диапазона, но на том же GPU, со старыми моделями Geforce 8800 GTS сравниваем, чтобы оценить влияние изменений в архитектуре (измененное количество исполнительных блоков, модифицированные TMU), увеличения рабочих частот, с RADEON HD 3870 сравнение будет интересным потому, что это в целом быстрейшее решение от AMD, хотя и из другого ценового диапазона. Ну а Geforce 8800 GTX нам интересна тем, что является одной из быстрейших карт на основе чипа G80.

Direct3D 9: Тесты Pixel Filling

В тесте определяется пиковая производительность выборки текстур (texel rate) в режиме FFP для разного числа текстур, накладываемых на один пиксель:



Лишь у некоторых видеокарт получились значения, близкие к теоретическому максимуму, чаще результаты синтетики не дотягивают до теоретических цифр, ближе всего к этому подбираются видеокарты из серии Geforce 8800 на основе G80, да и решение AMD ближе к нему, чем видеокарты Nvidia, отличающиеся улучшенными TMU, у них в нашем старом тесте теоретический максимум не достигается даже близко. Соотношение результатов Geforce 8800 GT и нового Geforce 8800 GTS 512MB примерно соответствует разности в частотах установленных на них чипов. G92, судя по цифрам, выбирает более 30 текселей за один такт для 32-битных текстур при билинейной фильтрации, хотя теоретически должен в два раза больше.

В случае с малым количеством текстур на пиксель, Geforce 8800 GTS 512 MB выглядит хуже «старых» Geforce 8800, в таких случаях ему не хватает пропускной способности видеопамяти, которая у него меньше, чем у модели GTX. Но вот чем объяснить отставание от старой GTS в тесте с единственной текстурой? Ведь ПСП у решений одинакова. Видимо, свою роль тут играет уже количество блоков ROP, которое у старой модели больше. Или оптимизации для большего количества накладываемых текстур. В более тяжелых условиях видеокарта на основе нового чипа выигрывает уже у всех, включая и Geforce 8800 GTX. Смотрим на результаты в тесте филлрейта:



Второй синтетический тест измеряет скорость заполнения, тут мы видим ту же самую ситуацию, уже с учетом количества записанных в буфер кадра пикселей. Хорошо видно, что в случаях с 0 и 1 накладываемыми текстурами, новое решение Nvidia отстаёт от предыдущих, что объясняется меньшими ПСП и количеством блоков ROP. И всё так же новая карта выходит вперед в ситуациях с большим количеством текстур на пиксель. По сравнению с единственной картой от AMD, Geforce 8800 GTS 512MB показывает до двух раз лучший результат, когда он не ограничивается пропускной способностью памяти.

Direct3D 9: Тесты Geometry Processing Speed

Рассмотрим предельные геометрические тесты, первым у нас будет самый простой вершинный шейдер, показывающий максимальную пропускную способность по треугольникам:



Наглядно видно, что все чипы основаны на унифицированных архитектурах, и все их универсальные исполнительные блоки в этом тесте заняты геометрической работой. Все решения показывают высокие результаты, явно упирающиеся не в пиковую производительность унифицированных блоков, а в производительность других блоков, например, triangle setup.

Эффективность выполнения теста в разных режимах у чипов примерно одинаковая, пиковая производительность в FFP, VS 1.1 и VS 2.0 отличается мало, хотя FFP у Nvidia чуть побыстрее. По этим результатам ничего определенного сказать нельзя, кроме того, что уже по ним видно, что чипы AMD традиционно быстрее обрабатывают геометрию. Смотрим, что изменилось в усложненном тесте с одним diffuse источником освещения:



Получилось почти то же самое, потенциал решений явно выше. В этот раз режим FFP ещё более быстр на всех видеокартах Nvidia, но во всех режимах все Geforce отстают от единственного RADEON, хотя пока что не слишком сильно. Посмотрим, что получится в еще более тяжелых условиях сложного расчета освещения с одним источником света и расчетом бликовой составляющей:



Разница между AMD и Nvidia увеличилась ещё немного, лидером по геометрической производительности остаётся чип RV670, а все карты Nvidia расположились в ту же ровную линейку, новый Geforce 8800 GTS 512MB лишь немного выигрывает у остальных. На смешанном источнике света наличие оптимизированной эмуляции FFP у G8x/G9x стало ещё заметнее. Рассмотрим самую сложную геометрическую задачу с тремя источниками света, включающую статические и динамические переходы:



Ну вот, теперь разница видна между всеми участниками тестов. RADEON HD 3870 остаётся впереди, даже в нашей самой сложной геометрической задаче его возможности не раскрыты полностью, результаты почти совпадают с теми, что были показаны выше. Отмечаем традиционные противоположные слабые места вершинных блоков архитектур AMD и Nvidia — динамические переходы вызывают большее падение производительности у чипов первой, а статические — у чипов второй.

Geforce 8800 GTS 512MB показал себя быстрее остальных моделей Geforce 8800 во всех тестах, сказывается большая частота G92 по сравнению с другими картами. В целом, из-за преимуществ унифицированной архитектуры все чипы довольно хорошо проявляют себя в тестах, они способны использовать все свои универсальные потоковые процессоры для решения геометрических задач, но в реальных приложениях универсальные шейдерные процессоры будут заняты в основном пиксельными расчетами, к исследованию производительности которых мы и переходим.

Direct3D 9: Тесты Pixel Shaders

Первая группа пиксельных шейдеров, которую мы рассматриваем, является очень простой для современных видеочипов, она включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0.



Видно, что эти тесты слишком просты для современных архитектур и не показывают их истинную силу. В простых тестах производительность ограничена скоростью текстурных выборок, что хорошо видно по слабым результатам RADEON HD 3870. В несколько более сложных PS 2.0 тестах результаты становятся интереснее, в самом сложном решение AMD даже выходит вперёд.

Geforce 8800 GTS 512MB всегда опережает остальные варианты Geforce 8800, особенно это заметно по её сравнению со старой моделью GTS, в наиболее сложных тестах разница довольно велика. Новый GTS выигрывает даже у модели GTX, в полном соответствии с теорией, ведь все его возможности улучшились, кроме ПСП и филлрейта, которые хоть и влияют в этих простых тестах, но не настолько уж сильно. Поглядим на результаты тестов более сложных пиксельных программ промежуточных версий:



В зависимом от скорости текстурирования тесте процедурной визуализации воды «Water» используется зависимая выборка из текстур больших уровней вложенности, поэтому RADEON сильно отстаёт от всех решений Nvidia. Наш сегодняшний герой быстрее его почти в три раза. По сравнению с остальными Geforce 8800, новый GTS с 512 Мбайт памяти оказывается всегда производительнее. Так, старая GTS 640MB отстаёт от новой более чем в полтора раза. То ли ещё будет…

Во втором тесте, более интенсивном вычислительно, решение AMD выходит вперёд, эта задача лучше подходит для его архитектуры с большим числом унифицированных вычислительных блоков. Но посмотрите, разница между ним и рассматриваемой видеокартой на основе G92 уже совсем невелика, всего лишь 10%. Nvidia при переходе от G80 к G92 сгладила небольшие недостатки своей архитектуры и быстрейшая из их видеокарт почти не отстаёт от лучшего из RADEON, а ведь совсем недавно ситуация была для них намного хуже.

Direct3D 9: Тесты пиксельных шейдеров New Pixel Shaders

Эти тесты пиксельных шейдеров DirectX 9 ещё сложнее, они делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье Современная терминология 3D графики
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами

Существует два варианта этих шейдеров: с ориентацией на математические вычисления, и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:



В тесте «Frozen Glass» ситуация между картами Nvidia схожа с той, что получилась в предыдущем блоке тестов. Старая Geforce 8800 GTS продолжает сильно отставать от новой, которая всегда впереди даже 8800 GTX. В этом тесте карты Nvidia на базе G80 и G92 опережают HD 3870, что подтверждает ограничение производительности скоростью текстурных выборок, прежде всего.

Лидерство во втором тесте «Parallax Mapping» традиционно принадлежало решениям AMD, лишь рассмотренный недавно Geforce 8800 GT оказался в опасной близости к ним, опережая в том числе и Geforce 8800 GTX. В этом тесте свою роль сыграли улучшенные блоки TMU, ибо для параллакс маппинга нужна ещё одна дополнительная текстурная выборка. Так как у Geforce 8800 GTS 512MB частота чипа ещё выше, а количество разблокированных TMU и ALU больше, эта модель становится лидером и в этом тесте, выигрывая в том числе и у HD 3870! Рассмотрим эти тесты в модификации с предпочтением выборок из текстур математическим вычислениям, там Geforce 8800 GTS 512MB может показать себя ещё лучше:



Ситуация несколько другая, ведь производительность в тестах ещё больше упирается в скорость текстурных блоков, и именно поэтому новый Geforce 8800 GTS опережает старую модель в одном из тестов более чем в два раза, а Geforce 8800 GTX в полтора! А RADEON HD 3870 проигрывает в обоих тестах почти всем картам серии Geforce 8800, кроме старой GTS в «Parallax Mapping». Как и раньше, на всех видеокартах варианты шейдеров с большим количеством математических вычислений работают быстрее, и для современных архитектур GPU смысла в варианте с упором на текстурирование нет.

Рассмотрим результаты еще двух тестов пиксельных шейдеров — версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9. Тесты отличаются тем, что сильно нагружают и ALU и текстурные модули, обе шейдерные программы сложные, длинные, включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье Современная терминология 3D графики
  • Fur — процедурный шейдер, визуализирующий мех



В этих двух тестах нагрузка на видеокарты уже очень велика даже для таких мощных чипов, как RV670 и G92. И хотя решения AMD обеспечивают эффективное исполнение сложных пиксельных шейдеров версии 3.0 с большим количеством ветвлений, HD 3870 от новой Geforce 8800 GTS 512MB отстаёт примерно в два раза. В этих тестах решения на основе G92 вновь показывают заметно лучшие результаты, по сравнению даже с Geforce 8800 GTX. Причём, преимущество Geforce 8800 GTS 512MB просто неприлично велико, более полутора раз. Это можно объяснить как увеличенной частотой, так и ускоренными билинейными текстурными выборками. При анализе результатов таких синтетических тестов нужно учитывать, что в реальных приложениях картина будет несколько иной, так как зачастую используется трилинейная и/или анизотропная фильтрация текстур, да и упор в филлрейт и ПСП нередок, и преимущество в таких случаях может получить уже Geforce 8800 GTX.

Direct3D 10: Тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

В новую версию RightMark3D 2.0 вошли два знакомых PS 3.0 теста под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два полностью новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами, при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель!) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40-80, включение «шейдерного» суперсэмплинга — до 60-120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Тесты процедурной визуализации меха с большим количеством текстурных выборок показывают огромное преимущество решений Nvidia над AMD. Их просто нет смысла сравнивать, такого отставания не должно быть даже теоретически, вероятно, у AMD до сих пор недоработаны Direct3D 10 драйверы.

Все результаты в «High» у решений Nvidia примерно в полтора раза ниже, чем в «Low». Сравнение результатов разных карт Geforce 8800 GTS, новой и старой модели, показывают большое преимущество 512 Мбайт варианта. Судя по цифрам Geforce 8800 GTS 512MB, GT и GTX, производительность в этом тесте зависит не только от количества и скорости блоков TMU, иначе разница была бы иной. Судя по всему, скорость рендеринга упирается в филлрейт (блоки ROP) и ПСП. Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза, возможно в такой ситуации что-то изменится:

Такая сложность под силу уже только топовым чипам Nvidia, решение AMD продолжает отставать. Включение суперсэмплинга увеличивает нагрузку ровно в четыре раза, но на видеокартах семейства G8x оно снижает скорость больше, а на RV670 меньше, за счет чего HD 3870 подтягивается к старым GTS моделям. Ещё интересно, что с увеличением сложности шейдера и нагрузки на видеочип, разница между Geforce 8800 GTX и новым GTS вариантом сокращается. Когда всё меньше и меньше на общую скорость влияет филлрейт и ПСП.

Второй тест, измеряющий производительность выполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок, называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением, число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше, по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Тест интереснее с практической точки зрения, разновидности parallax mapping давно применяются в играх, а тяжелые варианты, вроде нашего steep parallax mapping используются в последних релизах, например, в Crysis и Lost Planet. В нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип примерно в два раза, такой режим называется «High».

Хотя решения AMD ранее были традиционно сильны в наших Direct3D 9 тестах parallax mapping, в обновленном D3D10 варианте без суперсэмплинга RADEON HD 3870 справляется с задачей не очень быстро, тем более что включение самозатенения вызывает у него большее падение производительности, по сравнению с разницей для решений производства Nvidia. Рассматриваемый нами сегодня Geforce 8800 GTS 512MB в сложном режиме опережает всех, а в простом почти не отстаёт от модели GTX. Посмотрим, что изменит включение суперсэмплинга, в прошлом тесте он вызывал большее падение скорости на картах Nvidia и сближал видеокарты на основе G80 и G92.

Полученные значения FPS при включенных суперсэмплинге и самозатенении вновь говорят о тяжелейшей задаче для видеочипов, совместное включение двух опций увеличивают нагрузку почти в восемь раз, вызывая очень большое падение производительности. Разница между скоростью разных видеокарт в целом сохраняется, включение суперсэмплинга сказывается как и в предыдущем случае — карта на чипе AMD улучшает свои показатели относительно решений Nvidia. Для карт Nvidia падение скорости составляет около четырех раз, а для HD 3870 — только три раза. Несмотря на это, он продолжает отставать от остальных видеокарт.

Оба «старых» варианта Geforce 8800 GTS показывают идентичные результаты, проигрывая около полутора раз новой модели. Что касается сравнения Geforce 8800 GTS 512MB и GTX, то обновленный GTS в этот раз уже чуть-чуть опережает модификацию GTX. При увеличении нагрузки на ALU, ситуация меняется в пользу G92. И видно, что в условиях, близких к реальным, у G92 перед G80 нет особых преимуществ от модифицированных TMU с большим количеством блоков адресации.

Direct3D 10: Тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

В наших Direct3D 9 синтетических тестах мы отмечали, что в вычислительно сложных задачах архитектура AMD показывает себя зачастую лучше конкурирующей от Nvidia. Но RADEON HD 3870 уступает в этом тесте лучшему решению на базе G80 и обоим на G92. Производительность Geforce 8800 GTS 512MB значительно выше скорости «старых» Geforce 8800 GTS. Обновленная модель на новом GPU от Nvidia опережает вообще всех, в то время как модель GT лишь немного уступает Geforce 8800 GTX. Всё соответствует производительности (количеству и тактовой частоте) универсальных шейдерных блоков.

Второй тест шейдерных вычислений носит название Fire, и он ещё более тяжёл для ALU. В нём текстурная выборка только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

RADEON HD 3870 привычно проваливает этот тест, ошибка в драйверах AMD никуда не делась. Но это может быть и не ошибкой, а аппаратной проблемой, судя по тому, как долго её не могут исправить. Что касается сравнения видеокарт Nvidia, ситуация там почти не поменялась, Geforce 8800 GTS 512MB более чем в 1.5 раза опережает своих одноименных родственников с иным количеством видеопамяти. Опережение модели GTX теперь стало ещё больше и составляет 14%, почти такая же разница между этими моделями и в мощности ALU, частотах и количестве этих исполнительных блоков.

Direct3D 10: Тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующих частицу. Аналогичные алгоритмы должны получить широкое использование в будущих DirectX 10 играх.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен получилось примерно одинаковым, отличаются только абсолютные значения. Показываемая производительность полностью соответствует количеству точек, с каждым шагом падение FPS составляет около двух раз. Новая модель Geforce 8800 GTS показывает самые высокие результаты, немного обгоняя даже Geforce 8800 GTX. Хотя разница между GT, GTX и GTS 512MB небольшая.

Но эта задача для современных видеокарт не является тяжелой, как показали предыдущие исследования, даже Geforce 8600 GTS в этом тесте показывает высокий результат, что говорит об отсутствии ограничения скорости мощностью шейдерных ALU. Возможно, при переносе части вычислений в геометрический шейдер ситуация изменится.

Но нет, никаких изменений, по сути, не произошло. Все видеокарты показывают почти точно те же результаты при изменении параметра GS load, отвечающем за перенос части вычислений в геометрический шейдер. Geforce 8800 GTS 512MB продолжает лидировать, обгоняя и RADEON HD 3870 и Geforce 8800 GTX. Разница между результатами карт с разным числом исполнительных блоков и частотой остаётся небольшой, возможно, это изменится во втором тесте.

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленном в «Heavy» — ещё и для их отрисовки. То есть, в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер. Сначала рассматриваем лёгкий режим:

И снова результаты видеокарт Nvidia относительно друг друга отличаются не так сильно при любой геометрической сложности. Единственная видеокарта AMD сильно отстаёт от Geforce 8800 GTS 512MB, более чем в два раза. Производительность хорошо масштабируется, разница между режимами близка к теоретическим параметрам, каждый следующий уровень «Polygon count» в два раза медленней предыдущего.

В целом, наблюдается ровно то же самое, что и в предыдущем тесте — Geforce 8800 GTS 512MB опережает всех конкурентов, а GT выступает наравне с GTX. Цифры могут измениться в следующем тесте, с более активным использованием геометрических шейдеров, также интересно сравнить друг с другом результаты, полученные в «Balanced» и «Heavy» режимах.

В этот раз соотношение скоростей изменилось очень сильно. Чип AMD выполняет более сложные геометрические шейдеры эффективнее чипов Nvidia. Но только если сравнивать со всеми старыми моделями последней. Чипы Nvidia показали результаты строго в соответствии с количеством универсальных шейдерных блоков и их частотами, GT чуть уступил GTX, а вот Geforce 8800 GTS 512MB показывает результат, примерно равный результату RADEON HD 3870! В очередной раз мы видим, как Nvidia догоняет AMD в ранее неудобных для них тестах, постепенно устраняя недостатки своих GPU. Причём, чем выше сложность теста — тем быстрее GTS 512MB относительно других карт.

Сравнивая результаты в разных режимах, нужно отметить, что у всех карт Geforce скорость в «Balanced» режиме получилась выше, чем в «Heavy» у RADEON HD 3870. При этом, получаемая в разных режимах картинка не отличается визуально. В конкурентной борьбе решению AMD не помогает и то, что при переходе от использования «instancing» к геометрическому шейдеру при выводе, видеокарты Nvidia сильно теряют в производительности.

Основной вывод по геометрическим шейдерам такой — несмотря на то, что разные тесты геометрических шейдеров могут давать отличающиеся результаты, Geforce 8800 GTS 512MB всегда показывает очень высокие результаты, всегда опережая своих конкурентов. Даже при росте сложности работы для геометрического шейдера, когда чипы AMD традиционно были впереди, теперь выигрывает Nvidia.

Direct3D 10: Скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи по сути и соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Результаты во всех режимах показывают примерно одинаковую картину производительности видеокарт относительно друг друга. Судя по нашим предыдущим исследованиям, на результаты данного теста сильно влияет пропускная способность памяти, что особенно заметно по сравнению моделей GTX и GTS 512MB, так как разницу нельзя объяснить исключительно отличающимся количеством текстурных модулей, тем более что с увеличением нагрузки старшая видеокарта на основе G92 обгоняет G80.

HD 3870 в этот раз хоть и отстаёт, но не очень сильно, а в тяжелом режиме выглядит совсем неплохо. Посмотрим на результаты этого же теста с увеличенным количеством текстурных выборок, что же изменится в нём:

Картина почти та же, всё так же в легком режиме впереди Geforce 8800 GTX, а по мере усложнения вперёд выходит GTS 512MB, обладающий лучшими возможностями TMU, но меньшей ПСП. Ещё ниже, из-за разности в количестве TMU и значениях ПСП, следует Geforce 8800 GT, далее RADEON HD 3870 и обе старые Geforce 8800 GTS.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

В «Waves» мы видим всё почти то же самое, что и в предыдущем тесте «Earth», но разница между видеокартами на основе G92 и G80 стала больше, вероятно, пропускная способность памяти тут ещё важнее. Geforce 8800 GTS 512MB теперь всегда отстаёт от GTX, а в самом лёгком режиме даже от GTS, но с увеличением сложности геометрии восстанавливает свои позиции, проигрывая модели GTX в наиболее сложном тесте лишь 5%. Тем не менее, новый GTS всегда быстрее решения AMD. Смотрим второй режим:

Результаты также примерно соответствуют показанным в предыдущем случае, только разница между GTS 512MB и GTX стала ещё меньше, а RADEON HD 3870 отстаёт от всех карт Nvidia, включая старые GTS. В целом, хорошо видно, что чип G92 отлично справляется с тестами текстурных выборок из вершинных шейдеров, при небольшой геометрической сложности сцен его сдерживает меньшая пропускная способность локальной памяти, а при увеличении количества геометрических данных скорость модели приближается к производительности Geforce 8800 GTX, и в некоторых случаях Geforce 8800 GTS 512MB даже выигрывает.

Выводы по синтетическим тестам

  • Повторим основной вывод предыдущей статьи: архитектура G92 по сравнению с G8x изменилась незначительно, она отличается высокой вычислительной производительностью, нацелена на современные и будущие приложения с большим количеством сложных шейдеров всех типов. Высокая эффективность универсальных процессоров, большое количество блоков TMU и ROP, а также высокие рабочие частоты позволяют этому чипу показывать отличные результаты во всех синтетических тестах. Дополнительную помощь оказывают улучшенные блоки текстурирования. Видеокарта Geforce 8800 GTS 512MB в синтетических тестах всегда показывает результат на уровне более дорогой Geforce 8800 GTX или даже выше, особенно при увеличении нагрузки и отсутствии упора в пропускную способность памяти.


  • Архитектура чипа была дополнительно улучшена при помощи изменений в TMU и вместе с повышенной частотой это приводит к тому, что Geforce 8800 GTS 512MB во многих случаях выигрывает даже у Geforce 8800 GTX, имея большую теоретическую скорость текстурных выборок в определенных условиях. Единственное слабое место у Geforce 8800 GTS 512MB по сравнению с Geforce 8800 GTX — меньшая ширина шины памяти и её пропускная способность, вместе с меньшим количеством блоков ROP. Именно этого и не хватает в некоторых тестах, чтобы показывать результаты выше, чем у модели GTX. Но рассматриваемое сегодня решение отличается более низкой ценой и поэтому её производительности вполне достаточно для успешной конкуренции с видеокартами AMD, да и со своими более дорогими собратьями.

На основе результатов синтетических тестов Geforce 8800 GTS 512MB и других моделей разных ценовых диапазонов мы убедились в том, что новое решение Nvidia получилось очень мощным. Оно может составить сильную конкуренцию даже более дорогим видеокартам Nvidia и AMD. Ну а в следующей части статьи будет самое главное — тесты нового решения Nvidia в современных игровых приложениях, которые должны показать справедливость выводов, сделанных при анализе результатов синтетических тестов.



Nvidia Geforce 8800 GTS 512MB (G92) — Часть 3: игровые тесты





Дополнительно

400 Bad Request

Bad Request

Your browser sent a request that this server could not understand.

ВИКТОРИНА SAMSUNG

Какая модель проектора семейства Samsung The Premiere поддерживает технологию тройного лазера?