Nvidia Geforce GTX 285 240sp 1024MB 512bit PCI-E

Бывший, но обновленный и ускоренный лидер 3D-графики спускается в более дешевую нишу



СОДЕРЖАНИЕ

  1. Часть 1 — Теория и архитектура
  2. Часть 2 — Практическое знакомство
  3. Особенности видеокарт
  4. Конфигурация стенда, список тестовых инструментов
  5. Результаты синтетических тестов
  6. Результаты игровых тестов (производительность)


Nvidia Geforce GTX 285: Часть 1: Теоретические сведения


В данной части мы приступаем к практическим исследованиям нового ускорителя.

Но вообще-то их целых три штуки, поскольку в нашей лаборатории побывали карты от трех производителей. При этом продукт от Zotac имел повышенные частоты работы.

И более того, в то же самое время к нам попалп еще одна карта от Zotac — уже на базе Geforce GTX 295. Однако это просто референс, потому мы расскажем об этой карте кратко, мотивируя это тем, что ранее уже вышел материал по GTX 295.

Когда видеокарты каким-либо образом попадают к нам, то первое, что мы видим, — это красочные или не очень, но упаковки, коробки всех размеров и конфигураций…



Gigabyte Geforce GTX 285 1024MB PCI-E

Красивый глянцевый с нанесенной лазерной гравировкой супер, в нем картонный бокс, сама карта лежит в коробочке из пенополиуретана, комплект — в остальном отсеке.

Leadtek Geforce GTX 285 1024MB PCI-E

Традиционнаый картонный бокс, в котором лежит кусок того же пенополиуретана. В котором зафиксирована видеокарта, а в ином вырезе — всякие кабели и переходники из комплекта.

Zotac Geforce GTX 285 AMP! Edition 1024MB PCI-E

По своей сути аналогичная упаковка, с разницей лишь в том, что в коробке сделано окно, и потому весь комплект прикрыт пластиковой крышкой.

Zotac Geforce GTX 295 2x896MB PCI-E

То же самое.



Как мы видим, все карты надежно закреплены в своих коробках, а это самое главное, поскольку нет опасности повреждеиия плат при перевозке. Что касается дизайнов, что в данном случае они все традиционны для перечисленных выше производителей. Ничего нового мы не увидели.

Открывая коробки, мы достаем не только сами видеокарты, но и полагающийся к ним комплект.

Стоит напомнить еще раз, что в качестве комплекта к подобного рода картам должен идти следующий набор:

  • руководство пользователя,
  • диск с драйверами и утилитами,
  • переходник-адаптер DVI-to-VGA,
  • DVI-to-HMDI адаптер,
  • адаптер компонентного вывода (TV-out),
  • разветвители внешнего питания,
  • аудио-шнурок для соединения со звуковой картой (для передачи звука по HDMI).

И кратко пробежимся по наборам поставок с каждой картой.



Gigabyte Geforce GTX 285 1024MB PCI-E

Комплект неполноценный, поскольку нет адаптеров DVI-to-VGA, DVI-to-HDMI.

Leadtek Geforce GTX 285 1024MB PCI-E

Комплект полноценный и соответствует базовому. Бонус — уже устаревшая игра.

Zotac Geforce GTX 285 AMP! Edition 1024MB PCI-E
Zotac Geforce GTX 295 2x896MB PCI-E

Комплекты более чем полноценные, имеются бонусы в виде игры и 3DMark Vantage, кабель HDMI, а отличаются комплекты у этих карт только разными разветвителями питания (6 пин или 8 пин).



А теперь изучим сами карты.



Zotac Geforce GTX 295 2x896MB PCI-E
  • GPU: 2 × Geforce GTX 280 (GT200)
  • Интерфейс: PCI-Express x16
  • Частоты работы GPU (ROPs/Shaders): 575/1240 MHz (номинал — 575/1240 МГц)
  • Частоты работы памяти (физическая (эффективная)): 1000 (2000) MHz (номинал — 1000 (2000) МГц)
  • Ширина шины обмена с памятью: 2 × 448bit
  • Число вершинных процессоров: -
  • Число пиксельных процессоров: -
  • Число универсальных процессоров: 2 × 240
  • Число текстурных процессоров: 2 × 96 (BLF/TLF)
  • Число ROPs: 2 × 32
  • Размеры: 270x100x33 мм (последняя величина — максимальная толщина видеокарты).
  • Цвет текстолита: черный
  • RAMDACs/TMDS: вынесены в отдельный чип NVIO.
  • Выходные гнезда: 2xDVI (Dual-Link/HDMI), HDMI, TV-out.
  • VIVO: нет
  • TV-out: не выведен.
  • Поддержка многопроцессорной работы: внутренний SLI (Hardware). А также возможен внешний SLI (Quad-SLI)
Zotac Geforce GTX 285 AMP! Edition 1024MB PCI-E
  • GPU: Geforce GTX 285 (GT200)
  • Интерфейс: PCI-Express x16
  • Частоты работы GPU (ROPs/Shaders): 700/1512 MHz (номинал — 650/1475 МГц)
  • Частоты работы памяти (физическая (эффективная)): 1250 (2500) MHz (номинал — 1250 (2500) МГц)
  • Ширина шины обмена с памятью: 512bit
  • Число вершинных процессоров: -
  • Число пиксельных процессоров: -
  • Число универсальных процессоров: 240
  • Число текстурных процессоров: 80 (BLF/TLF)
  • Число ROPs: 32
  • Размеры: 270x100x33 мм (последняя величина — максимальная толщина видеокарты).
  • Цвет текстолита: черный
  • RAMDACs/TMDS: вынесены в отдельный чип NVIO.
  • Выходные гнезда: 2xDVI (Dual-Link/HDMI), TV-out.
  • VIVO: нет
  • TV-out: интегрирован в GPU.
  • Поддержка многопроцессорной работы: SLI (Hardware).
Leadtek Geforce GTX 285 1024MB PCI-E
  • GPU: Geforce GTX 285 (GT200)
  • Интерфейс: PCI-Express x16
  • Частоты работы GPU (ROPs/Shaders): 650/1475 MHz (номинал — 650/1475 МГц)
  • Частоты работы памяти (физическая (эффективная)): 1250 (2500) MHz (номинал — 1250 (2500) МГц)
  • Ширина шины обмена с памятью: 512bit
  • Число вершинных процессоров: -
  • Число пиксельных процессоров: -
  • Число универсальных процессоров: 240
  • Число текстурных процессоров: 80 (BLF/TLF)
  • Число ROPs: 32
  • Размеры: 270x100x33 мм (последняя величина — максимальная толщина видеокарты).
  • Цвет текстолита: черный
  • RAMDACs/TMDS: вынесены в отдельный чип NVIO.
  • Выходные гнезда: 2xDVI (Dual-Link/HDMI), TV-out.
  • VIVO: нет
  • TV-out: интегрирован в GPU.
  • Поддержка многопроцессорной работы: SLI (Hardware).
Gigabyte Geforce GTX 285 1024MB PCI-E
  • GPU: Geforce GTX 285 (GT200)
  • Интерфейс: PCI-Express x16
  • Частоты работы GPU (ROPs/Shaders): 650/1475 MHz (номинал — 650/1475 МГц)
  • Частоты работы памяти (физическая (эффективная)): 1250 (2500) MHz (номинал — 1250 (2500) МГц)
  • Ширина шины обмена с памятью: 512bit
  • Число вершинных процессоров: -
  • Число пиксельных процессоров: -
  • Число универсальных процессоров: 240
  • Число текстурных процессоров: 80 (BLF/TLF)
  • Число ROPs: 32
  • Размеры: 270x100x33 мм (последняя величина — максимальная толщина видеокарты).
  • Цвет текстолита: черный
  • RAMDACs/TMDS: вынесены в отдельный чип NVIO.
  • Выходные гнезда: 2xDVI (Dual-Link/HDMI), TV-out.
  • VIVO: нет
  • TV-out: интегрирован в GPU.
  • Поддержка многопроцессорной работы: SLI (Hardware).


Zotac Geforce GTX 295 2x896MB PCI-E
Карта имеет 2 × 896 МБ памяти GDDR3 SDRAM, размещенной в 14 микросхемах (по 7 на каждой PCB)

Микросхемы памяти Hynix (GDDR3). Микросхемы расчитаны на максимальную частоту работы в 1250 (2500) МГц.

Zotac Geforce GTX 285 AMP! Edition 1024MB PCI-E
Leadtek Geforce GTX 285 1024MB PCI-E
Gigabyte Geforce GTX 285 1024MB PCI-E
Каждая карта имеет 1024 МБ памяти GDDR3 SDRAM, размещенной в 16 микросхемах на лицевой стороне PCB

Микросхемы памяти Hynix (GDDR3). Микросхемы расчитаны на максимальную частоту работы в 1250 (2500) МГц.



Сравнение с эталонным дизайном, вид спереди
Zotac Geforce GTX 295 2x896MB PCI-E Reference Nvidia Geforce GTX 295 2x896MB PCI-E
Zotac Geforce GTX 285 AMP! Edition 1024MB PCI-E Reference Nvidia Geforce GTX 280 1024MB PCI-E
Leadtek Geforce GTX 285 1024MB PCI-E
Gigabyte Geforce GTX 285 1024MB PCI-E


Сравнение с эталонным дизайном, вид сзади
Zotac Geforce GTX 295 2x896MB PCI-E Reference Nvidia Geforce GTX 295 2x896MB PCI-E
Zotac Geforce GTX 285 AMP! Edition 1024MB PCI-E Reference Nvidia Geforce GTX 280 1024MB PCI-E
Leadtek Geforce GTX 285 1024MB PCI-E
Gigabyte Geforce GTX 285 1024MB PCI-E


Напомним, что на данных картах используется все тот же GTX 280 (лишь по 55нм), поэтому он назван GTX 285.



Мы видим, что производитель не просто заменил ядро на более новое, которое обходится дешевле в производстве, но и полностью изменил дизайн PCB, переместив все 16 микросхем памяти на одну лицевую сторону карты. Поэтому такие платы уже не оснащаются задней крышкой, служащей радиатором, благодаря чему GTX 280 выглядел закованным полностью в панцирь системы охлаждения. А в случае GTX 285 мы видим все тот же кулер, но только на лицевой стороне. Это все, конечно же, усложнило разводку и увеличило стоимость PCB, но при этом все микросхемы памяти охлаждаются теперь одинаково с помощью кулера, что немаловажно при том, что в данном случае частоты работы памяти почти равны максимально возможным для данного типа микросхем, когда как на GTX 280 они же работали на более сниженных частотах.

Напоминаем еще раз важный момент: длина ускорителя — 270 мм, как у 8800 GTX/Ultra, поэтому в корпусе должно быть достаточно места для установки такой конструкции. А также обратим внимание на ширину кожуха, которая неизменна вдоль всей длины, а следовательно на материнской плате за PCI-E x16 разъемом не должно быть никаких портов и высоких конденсаторов, причем на ширину 30 мм (то есть не только за самим слотом PCI-E, но за соседним с ним не должно быть никаких высоких частей на системной плате).

Видеокарты этой серии оснащены гнездом для подключения звукового потока с аудио-карты для передачи его затем на HDMI (с помощью переходника DVI-to-HDMI), то есть сама видеокарта не оснащена аудио-кодеком, но осуществляет прием сигнала от внешней звуковой карты. Поэтому, если кому эта функция важна, следите за тем, чтобы в комплекте поставки видеокарты был аудио-шнурок для этих целей.

Особо заметим, что у GTX 285 питание осуществляется с помощью ДВУХ разъемов, но оба 6-пиновые, когда как у GTX 280 — один 6-пиновый, а второй 8-пиновый. Это стало возможным меньшему энергопотреблению ядра, выполненного по 55 нм.

Подключение к аналоговым мониторам с d-Sub (VGA) производится через специальные адаптеры-переходники DVI-to-d-Sub. Также с серийными картами поставляются переходники DVI-to-HDMI (мы помним, что данные ускорители поддерживают полноценную передачу видео и звука на HDMI-приемник), поэтому проблем с такими мониторами также не должно быть. Максимальные разрешения и частоты:

  • 240 Hz Max Refresh Rate
  • 2048 × 1536 × 32bit x85Hz Max — по аналоговому интерфейсу
  • 2560 × 1600 @ 60Hz Max — по цифровому интерфейсу (для DVI-гнезд с Dual-Link)

По поводу HDTV. Одно из исследований также проведено, и с ним можно ознакомиться здесь.

Теперь о кулере. Система охлаждения принципиально не отличается от того варианта, что мы видели еще на Geforce 8800 GTS 512, да и по сути это тот же кулер, что стоит на GTX 260/280. Размеры радиатора и самой карты практически равны.

Это цилиндрического типа кулер, прогоняющий воздух с помощью установленной на одном конце турбины через радиатор внутри длинного пластикового корпуса. Горячий воздух выбрасывается за пределы системного блока, поэтому карта с СО занимает 2 слота.







А далее мы провели исследование температурного режима с помощью утилиты RivaTuner (автор А.Николайчук AKA Unwinder) и получили следующие результаты:

Nvidia Geforce GTX 285 1024MB PCI-E



Nvidia Geforce GTX 285 1024MB PCI-E overclocked



Очевидно, что несмотря на уменьшенный техпроцесс, нагрев у карты весьма велик, хотя и ниже чем у GTX 280. Впрочем, кулер все равно остается тихим.

А теперь мы займемся тестами.

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютер на базе Intel Core2 (775 Socket)
    • процессор Intel Core2 Extreme QX9650 (3000 MHz);
    • системная плата Zotac 790i Ultra а чипсете Nvidia nForce 790i Ultra;
    • оперативная память 2 GB DDR3 SDRAM Corsair 2000MHz;
    • жесткий диск WD Caviar SE WD1600JD 160GB SATA.
    • блок питания Tagan TG900-BZ 900W.
  • операционная система Windows Vista 32bit SP1; DirectX 10.1;
  • монитор Dell 3007WFP (30").
  • драйверы ATI версии 8.561.3 (CATALYST 8.12beta); Nvidia версии 181.20.

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

  • D3D RightMark Beta 4 (1050) с описанием на сайте 3d.rightmark.org
  • D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 — тесты пиксельных шейдеров версий 2.0 и 3.0 ссылка.
  • RightMark3D 2.0 с кратким описанием: ссылка

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

Синтетические тесты проводились на следующих видеокартах:

  • Nvidia Geforce GTX 285 со стандартными параметрами (далее GTX 285)
  • Nvidia Geforce GTX 280 со стандартными параметрами (далее GTX 280)
  • RADEON HD 4870 X2 со стандартными параметрами (далее HD 4870 X2)
  • RADEON HD 4850 X2 со стандартными параметрами (далее HD 4850 X2)

Для сравнения результатов нового решения Geforce GTX 285 были выбраны именно эти модели видеокарт по следующим причинам: Geforce GTX 280 — её непосредственный предшественник, с ним сравниваем, чтобы посмотреть разницу в производительности, привнесённую изменившимися частотами; а с RADEON HD 4850 X2 (и частично HD 4870 X2) сравнение будет интересно потому, что это быстрейшие двухчиповые high-end решения от компании AMD, младшее из которых ещё и конкурирует с GTX 285 по цене.

Также сравнение может быть интересным потому, что результаты GTX 280 и HD 4870 X2 для синтетических тестов были взяты из предыдущих статей, когда использовались иные версии драйверов. То есть, можно будет сравнить, как повлияли последние версии драйверов на производительность видеокарт в синтетических тестах.

Direct3D 9: Тесты Pixel Filling

В тесте определяется пиковая производительность выборки текстур (texel rate) в режиме FFP для разного числа текстур, накладываемых на один пиксель:



Как обычно — у видеокарт получаются значения, не достигающие теоретических. Результаты синтетических тестов не дотягивают до теории, ближе всего к ним подбирались видеокарты предыдущих поколений, а новые видеокарты, отличающихся большим количеством TMU, в нашем тесте теоретического максимума не достигают. Возможно, их начинает ограничивать наш тест.

Хорошо видно, что в тестах с выборкой от 1 до 4 текстур на пиксель, производительность ограничена пропускной способностью видеопамяти, и почти все карты идут вровень. В случае с большим количеством текстур на пиксель, возможности блоков ROP раскрываются, и в более тяжелых условиях двухчиповые карты (а в данных тестах AFR эффективно удваивает частоту кадров, как показывает практика) от AMD выходят вперёд. А результат GTX 285 отличается от цифр GTX 280 соответственно теории. Посмотрим на результаты в тесте филлрейта:



Второй синтетический тест измеряет скорость заполнения, и в нём мы видим ту же самую ситуацию, но с учетом количества записанных в буфер кадра пикселей. И снова в случаях с 0-3 накладываемыми текстурами у всех протестированных видеоплат получается схожий результат, и лишь немного выигрывает двухчиповая HD 4870 X2. А в режимах, когда производительность ограничена не ПСП, а количеством и частотой блоков ROP, у двухчиповых карт есть явное преимущество.

Из интересного можно отметить результаты HD 4850 X2 в вариантах с 2 и 4 текстурами. Вероятно, из-за оптимизаций в новой версии драйвера в этих случаях он даже выигрывает у своего старшего собрата.

Direct3D 9: Тесты Pixel Shaders

Первая группа пиксельных шейдеров, которую мы рассматриваем, является очень простой для современных видеочипов, она включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0.



Тесты просты для современных архитектур и показывают скорее соответствие скорости текстурирования, чем математических расчётов. Ну а в таких простых тестах, когда производительность ограничена скоростью текстурных выборок, двухчиповые решения, работающие в режиме AFR, получают преимущество и выигрывают у одночиповых, в том числе и новой Geforce GTX 285.

Примерно то же соотношение остаётся и в более сложных тестах. Geforce GTX 285 показывает неплохой результат, опережая предыдущую топовую карту на GT200 на 6-12%, что соответствует теоретическим цифрам. Но у двухчиповых карт есть преимущество, ведь в наших старых тестах GTX 280 не догоняла даже Geforce 9800 GX2, не говоря уже о своём нынешнем конкуренте — HD 4850 X2. Посмотрим на результаты тестов более сложных пиксельных программ промежуточных версий:



Даже в сильно зависящем от скорости текстурирования тесте процедурной визуализации воды «Water», где используется зависимая выборка из текстур больших уровней вложенности, двухчиповые карты AMD показывают более чем в два раза лучшие результаты. А ведь раньше все карты RADEON отставали от всех решений на основе G92, G80 и GT200… Ситуация поменялась на противоположную, теперь решения AMD далеко впереди. Рассматриваемая сегодня видеокарта Geforce GTX 285 вновь показывает результат, соответствующий теоретическим цифрам, опережая GTX 280 на 8-10%.

Второй тест, несколько более интенсивный вычислительно, явно ещё лучше подходит для архитектуры AMD, обладающих большим количеством вычислительных блоков. В этом тесте решения Nvidia, в том числе и GTX 285, отстают от своих конкурентов не менее чем в два раза. То есть, даже с учетом высокой эффективности AFR в этом тесте, RV770 явно смотрится лучше GT200 в этот раз.

Direct3D 9: Тесты пиксельных шейдеров New Pixel Shaders

Данные тесты пиксельных шейдеров DirectX 9 ещё сложнее, они делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье Современная терминология 3D графики
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами

Существует два варианта этих шейдеров: с ориентацией на математические вычисления, и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:



Положение видеокарт в тесте «Frozen Glass» слабо отличается от результатов предыдущих тестов. Это математические тесты, зависящие прежде всего от количества и частоты шейдерных блоков, поэтому и Geforce GTX 280 и GTX 285 проигрывают обоим решениям AMD. Новая видеокарта Nvidia, имеющая лишь чуть более высокие частоты, ничего тут особенно не изменила, да и не могла.

Во втором тесте «Parallax Mapping» решения Nvidia уступают картам производства компании AMD ещё чуть больше, до двух раз. А GTX 285 быстрее GTX 280 совсем чуть-чуть, на разницу в частотах шейдерных блоков. Рассмотрим эти тесты в модификации с предпочтением выборок из текстур математическим вычислениям, там видеокарты могут показать иной расклад, ведь ранее чипы Nvidia лучше справлялись с текстурированием:



Но сейчас взаимное положение почти не изменилось, хотя в этих тестах ранее мы видели явный упор производительности в скорость текстурных блоков. Но современные архитектуры AMD и Nvidia подравнялись по характеристикам, и у RV770 уже нет слабого места в виде низкой скорости текстурирования. Поэтому Geforce GTX 285 в обоих тестах хоть и опережает предыдущую карту Nvidia, но двухчиповые платы AMD догнать не в силах. В любом случае, для всех решений варианты шейдеров с большим количеством математических вычислений работают быстрее в 1.5-2 раза, по сравнению с их «текстурными» вариантами.

Рассмотрим результаты ещё двух тестов пиксельных шейдеров — версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9. Тесты отличаются тем, что сильно нагружают и ALU и текстурные модули, обе шейдерные программы сложные, длинные, включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье Современная терминология 3D графики
  • Fur — процедурный шейдер, визуализирующий мех



И снова мы видим почти полную копию ситуации из предыдущих тестов. Двухчиповые решения AMD обладают более высокой математической производительностью, и обеспечивают быстрое исполнение сложных пиксельных шейдеров версии 3.0 с большим количеством ветвлений. Geforce GTX 285 отстаёт от своего прямого конкурента HD 4850 X2 примерно на 85%, хотя своего предшественника в лице GTX 280 обгоняет примерно на 9%, что близко к теоретически достижимым цифрам.

Direct3D 10: Тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два знакомых PS 3.0 теста под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два полностью новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами, при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40-80, включение «шейдерного» суперсэмплинга — до 60-120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Результаты в «High» получились менее чем в полтора раза ниже, чем в «Low», но соотношение примерно одинаковое. Производительность в этом тесте зависит не только от количества и скорости блоков TMU, но и от филлрейта и ПСП. В целом, можно отметить, что Direct3D 10 тесты процедурной визуализации меха с большим количеством текстурных выборок показывают некоторое преимущество решений Nvidia даже над двухчиповыми картами AMD.

Представленный сегодня Geforce GTX 285 выигрывает в обоих режимах и у предшествующей GTX 280 (на 12-13%, что примерно соответствует теоретическим данным), и у двухчиповых HD 4850 X2 и HD 4870 X2. Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза, возможно в такой ситуации что-то изменится, там ПСП с филлрейтом должны влиять меньше:

Включение суперсэмплинга теоретически увеличивает нагрузку в четыре раза, но на видеокартах Nvidia скорость традиционно снижается несколько больше, чем на AMD. Отрыв между решениями разных производителей сокращается, и GTX 285 показывает результат вровень с HD 4870 X2. Впрочем, опережение конкурента HD 4850 X2 остаётся.

Второй тест, измеряющий производительность выполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением, число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше, по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Этот тест интереснее для нас с практической точки зрения, ведь разновидности parallax mapping давно применяются в играх, а тяжелые варианты, вроде аналогичного нашему steep parallax mapping используются в некоторых проектах, например, в Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип примерно в два раза, такой режим называется «High».

Повторилась ситуация из предыдущего теста, а Geforce GTX 285 оторвался даже ещё больше, разница с GTX 280 уже доходит до 15%, вероятно, тест больше ограничен производительностью потоковых процессоров. В обновленном D3D10 варианте тестов parallax mapping без включения суперсэмплинга, решения AMD справляются с задачей всё также хуже видеокарт Nvidia. Да и включение самозатенения вызывает на продукции AMD большее падение производительности, по сравнению с разницей для решений Nvidia.

Посмотрим, что изменит включение суперсэмплинга, в прошлом тесте он вызывал большее падение скорости на картах Nvidia.

При включении суперсэмплинга и самозатенения задача получается ещё более тяжёлой, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая большое падение производительности. Соотношение производительности разных видеокарт уже несколько иное, хотя включение суперсэмплинга сказывается как и в предыдущем случае — карты производства AMD немного улучшают свои показатели относительно решений Nvidia.

Что касается сравнения обновленной модели Geforce GTX 285 с предыдущим топом, он опережает предшественника на 13-14%, что примерно соответствует теоретическим цифрам, если упор производительности был в математические вычисления. Во всех режимах видеокарта отлично справляется с задачей на уровне двухчиповых конкурентов, разве что в Low режиме новая видеокарта немного отстаёт от HD 4870 X2, который не является прямым конкурентом.

Direct3D 10: Тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Мы уже многократно отмечали и в этой статье и в предыдущих, что в вычислительно сложных задачах современная архитектура AMD показывает себя в целом лучше конкурирующей от Nvidia. Так произошло и в этот раз. А благодаря своему двухчиповому устройству (отдельное спасибо режиму AFR), карты AMD более чем в два раза опережают обе Geforce.

Производительность Geforce GTX 285 выше чем у Geforce GTX 280 на 15%, что соответствует теоретической разнице в частотах потоковых процессоров. К сожалению, видеокарта на основе одного чипа GT200b не может конкурировать с двухчиповыми картами компании AMD, уж слишком быстрой в математических вычислениях получилась архитектура RV770.

Второй тест шейдерных вычислений носит название Fire, и он ещё более тяжёл для ALU. В нём текстурная выборка только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

В во втором тесте в этом подразделе скорость рендеринга также ограничена исключительно производительностью шейдерных блоков. Причём, разница между решениями Nvidia и AMD ещё больше. Даже если не учитывать «двухчиповость» первых, они всё равно быстрее, даже в пересчёте на один GPU.

Geforce GTX 285 опережает GTX 280 более чем на 16%, что близко к теоретической разнице в шейдерной производительности, вызванной повышенными частотами. Но с лидерами в лице двухчиповых RADEON HD 4850 X2 и HD 4870 X2 новому решению всё так же не сравниться.

Direct3D 10: Тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующих частицу. Аналогичные алгоритмы должны получить широкое использование в будущих DirectX 10 играх.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Этот график скорее похож на то, что мы видели в разделе D3D9 тестов, чем в предыдущих D3D10. Соотношение скоростей при разной геометрической сложности сцен примерно одинаковое, производительность соответствует количеству точек, с каждым шагом падение FPS составляет около двух раз. Задача для современных видеокарт не очень сложная и ограничение скорости мощностью потоковых процессоров в тесте не явное, производительность ограничена также и ПСП и филлрейтом, хотя и в меньшей степени. А AFR эффективно увеличивает производительность многочиповых решений.

Geforce GTX 285 показывает результат несколько более высокий, чем GTX 280, и разница между ними составляет около 7%. То есть, задача ограничена скорее филлрейтом, чем ПСП или скоростью потоковых процессоров. Двухчиповые RADEON впереди, младшее решение опережает героя нынешней статьи на треть, а старшее — на 75-80% (сказывается более высокая ПСП у HD 4870 X2). Возможно, при переносе части вычислений в геометрический шейдер ситуация изменится, посмотрим:

Разницы между рассмотренными вариантами теста почти нет, она несущественна. Все видеокарты Nvidia показывают почти те же результаты при изменении параметра GS load, отвечающем за перенос части вычислений в геометрический шейдер. Только результаты видеоплат AMD немного выросли, особенно у RADEON HD 4850 X2 на новых драйверах. Geforce GTX 285 продолжает отставать от них, и разница уже даже чуть большая. Посмотрим, что изменится в следующем тесте, который предполагает большую нагрузку именно на геометрические шейдеры…

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленном в «Heavy» — ещё и для их отрисовки. То есть, в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер. Сначала рассматриваем лёгкий режим:

Относительные результаты в разных режимах соответствуют нагрузке: во всех случаях производительность неплохо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть в два раза медленней. Странно, что в этот раз производительность HD 4850 X2 провалилась, как это ранее было с двухчиповой же Geforce 9800 GX2. Скорее всего, в этом виноваты новые драйверы, в которые закралась ошибка, ведь с HD 4870 X2 всё в порядке.

Впрочем, у HD 4850 X2 не было бы шансов обогнать Geforce GTX 285 в этом тесте, ведь даже HD 4870 X2 показала лишь немного более высокий результат. Разница в скорости между решениями Nvidia всё так же соответствует разнице в частоте чипов. Цифры могут измениться на следующей диаграмме, в тесте с более активным использованием геометрических шейдеров. Также будет интересно сравнить друг с другом результаты, полученные в «Balanced» и «Heavy» режимах.

Но снова мы не видим никаких изменений. Если раньше в этом тесте старые архитектуры проваливались далеко вниз, то в GT200 и RV770 устранили недостатки предыдущих архитектур, и теперь они эффективно справляются с задачей. Впрочем, не нужно забывать, что одночиповый Geforce GTX 285 в этом тесте показывает результат почти как у HD 4870 X2. То есть, новая видеокарта Nvidia в тесте Hyperlight определённо быстрее HD 4850 X2, даже если бы последней не помешали ошибки драйверов.

Direct3D 10: Скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи по сути и соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Судя по предыдущим исследованиям, на результаты этого теста сильно влияет пропускная способность памяти, и чем проще режим, тем большее влияние на скорость она оказывает. Это хорошо заметно по простому режиму, где результаты карт близки к разнице ПСП. В более сложных условиях начинает влиять филлрейт, и режим многочипового рендеринга AFR позволяет картам AMD выиграть с большим отрывом.

Geforce GTX 285 показывает результат даже чуть медленнее, чем GTX 280. Это связано с некими изменениями и оптимизациями в драйверах, как мы увидим далее. В лёгком режиме она выигрывает у конкурентов, а в сложных пальма первенства переходит к двухчиповым решениям AMD, которые, как показывают предыдущие исследования, показывают тут двукратный прирост по сравнению с одночиповыми аналогами. Посмотрим на результаты этого же теста с увеличенным количеством текстурных выборок:

Ситуация изменилась не слишком сильно, в лёгком режиме результаты GTX 280 и GTX 285 стали поближе к двухчиповым конкурентам, но в сложном те продолжают лидировать. На этом графике интересно другое — преимущество GTX 285 над GTX 280 несколько выше того, что должно быть теоретически, и HD 4850 X2 с более новыми драйверами в двух тяжелых режимах показывает результат выше, чем у старшего брата. Это явно указывает на оптимизации в драйверах для более сложных режимов, ведь на предыдущем графике было всё иначе.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Тест «Waves» ещё благосклоннее к продукции AMD, и разница между одночиповыми моделями семейства Geforce GTX 200 и двухчиповыми RADEON увеличилась. Скорость в тесте зависит не столько от мощности TMU, сколько от ПСП и филлрейта, которые эффективно удваиваются в режиме AFR. Наш герой Geforce GTX 285 показал результат, не превышающий цифр GTX 280 в двух режимах из трёх, что снова можно списать на оптимизации для тяжелых задач, одна из которых будет на нашем следующем графике.

По сравнению с конкурентом HD 4850 X2, новая карта Nvidia впереди только в легком режиме, а в остальных двух уступает двухчиповому RADEON. Рассмотрим второй вариант этого же теста:

Изменений немного, с увеличением сложности теста результаты двухчиповых видеоплат серии RADEON HD 4800 стали ещё чуть лучше относительно скорости карт Nvidia, так как последние потеряли в скорости несколько больше. Хотя скорость в лёгком режиме продолжает ограничивать в т.ч. и ПСП, Geforce GTX 285 уже уступает обеим картам AMD, которым помогает двухчиповость. В тяжёлых режимах большую роль начинают играть эффективность блоков TMU и «двухчиповость», и поэтому Geforce GTX 285 и GTX 280 в два раза и более отстают от видеоплат AMD.

Выводы по синтетическим тестам

На основе результатов синтетических тестов новой видеокарты Geforce GTX 285, по сравнению с другими решениями обоих основных производителей видеочипов, можно сделать вывод, что новое решение Nvidia получилось слегка более мощным, чем предыдущая модель — GTX 280. Чего и следовало ожидать, ведь в изменениях, способных повлиять на производительность, значатся только повышенные тактовые частоты.

Если смотреть исключительно на цифры, то суммарно GTX 285 показал всё же меньшую частоту кадров в большинстве наших тестов, по сравнению с двухчиповым HD 4850 X2. Впрочем, среди одночиповых видеокарт GTX 285 является быстрейшим решением, и показывает весьма достойный результат даже в сравнении с двухчиповыми картами конкурента (особенно если рассматривать только Direct3D 10 тесты), у которых есть свои проблемы, о которых мы расскажем в отдельном материале.

Кроме увеличения частот, направленных на небольшое увеличение производительности, Nvidia уделила особое внимание энергопотреблению, энергетической эффективности решения, и снижению его себестоимости. Geforce GTX 285 показывает довольно высокую производительность, а благодаря новому техпроцессу и упрощенному дизайну он потребляет сравнительно небольшое количество энергии, да и будет стоить не так дорого, как предшествующая модель Geforce GTX 280 в начале своего жизненного пути. А это для покупателей поважнее результатов в синтетических тестах будет.

В следующей части нашей статьи вы найдёте тесты нового решения компании Nvidia в современных игровых приложениях. Эти результаты должны показать реальное соотношение производительности Geforce GTX 285 и его конкурентов от AMD. Вполне вероятно, что игровые результаты не будут в точности соответствовать выводам, сделанным при анализе результатов синтетических тестов, ведь сравнение одночиповых и двухчиповых карт — дело непростое. Можно предположить, что средняя частота кадров у Geforce GTX 285 и HD 4850 X2 в играх будет близкой, несмотря на то, что в наших синтетических тестах разница иногда достигала двух раз. Синтетика есть синтетика, с ней нужно обращаться осторожно.



Nvidia Geforce GTX 285 — Часть 3: Игровые тесты (производительность)



Блок питания для тестового стенда предоставлен компанией TAGAN
Монитор Dell 3007WFP для тестовых стендов предоставлен компанией Nvidia




Дополнительно

Бывший, но обновленный и ускоренный лидер 3D-графики спускается в более дешевую нишу: Nvidia Geforce GTX 285

Nvidia Geforce GTX 285 240sp 1024MB 512bit PCI-E

Бывший, но обновленный и ускоренный лидер 3D-графики спускается в более дешевую нишу


СОДЕРЖАНИЕ

  1. Часть 1 — Теория и архитектура
  2. Часть 2 — Практическое знакомство
  3. Особенности видеокарт
  4. Конфигурация стенда, список тестовых инструментов
  5. Результаты синтетических тестов
  6. Результаты игровых тестов (производительность)


Nvidia Geforce GTX 285: Часть 1: Теоретические сведения


В данной части мы приступаем к практическим исследованиям нового ускорителя.

Но вообще-то их целых три штуки, поскольку в нашей лаборатории побывали карты от трех производителей. При этом продукт от Zotac имел повышенные частоты работы.

И более того, в то же самое время к нам попалп еще одна карта от Zotac — уже на базе Geforce GTX 295. Однако это просто референс, потому мы расскажем об этой карте кратко, мотивируя это тем, что ранее уже вышел материал по GTX 295.

Когда видеокарты каким-либо образом попадают к нам, то первое, что мы видим, — это красочные или не очень, но упаковки, коробки всех размеров и конфигураций…



Gigabyte Geforce GTX 285 1024MB PCI-E

Красивый глянцевый с нанесенной лазерной гравировкой супер, в нем картонный бокс, сама карта лежит в коробочке из пенополиуретана, комплект — в остальном отсеке.

Leadtek Geforce GTX 285 1024MB PCI-E

Традиционнаый картонный бокс, в котором лежит кусок того же пенополиуретана. В котором зафиксирована видеокарта, а в ином вырезе — всякие кабели и переходники из комплекта.

Zotac Geforce GTX 285 AMP! Edition 1024MB PCI-E

По своей сути аналогичная упаковка, с разницей лишь в том, что в коробке сделано окно, и потому весь комплект прикрыт пластиковой крышкой.

Zotac Geforce GTX 295 2x896MB PCI-E

То же самое.



Как мы видим, все карты надежно закреплены в своих коробках, а это самое главное, поскольку нет опасности повреждеиия плат при перевозке. Что касается дизайнов, что в данном случае они все традиционны для перечисленных выше производителей. Ничего нового мы не увидели.

Открывая коробки, мы достаем не только сами видеокарты, но и полагающийся к ним комплект.

Стоит напомнить еще раз, что в качестве комплекта к подобного рода картам должен идти следующий набор:

  • руководство пользователя,
  • диск с драйверами и утилитами,
  • переходник-адаптер DVI-to-VGA,
  • DVI-to-HMDI адаптер,
  • адаптер компонентного вывода (TV-out),
  • разветвители внешнего питания,
  • аудио-шнурок для соединения со звуковой картой (для передачи звука по HDMI).

И кратко пробежимся по наборам поставок с каждой картой.



Gigabyte Geforce GTX 285 1024MB PCI-E

Комплект неполноценный, поскольку нет адаптеров DVI-to-VGA, DVI-to-HDMI.

Leadtek Geforce GTX 285 1024MB PCI-E

Комплект полноценный и соответствует базовому. Бонус — уже устаревшая игра.

Zotac Geforce GTX 285 AMP! Edition 1024MB PCI-E
Zotac Geforce GTX 295 2x896MB PCI-E

Комплекты более чем полноценные, имеются бонусы в виде игры и 3DMark Vantage, кабель HDMI, а отличаются комплекты у этих карт только разными разветвителями питания (6 пин или 8 пин).



А теперь изучим сами карты.



Zotac Geforce GTX 295 2x896MB PCI-E
  • GPU: 2 × Geforce GTX 280 (GT200)
  • Интерфейс: PCI-Express x16
  • Частоты работы GPU (ROPs/Shaders): 575/1240 MHz (номинал — 575/1240 МГц)
  • Частоты работы памяти (физическая (эффективная)): 1000 (2000) MHz (номинал — 1000 (2000) МГц)
  • Ширина шины обмена с памятью: 2 × 448bit
  • Число вершинных процессоров: -
  • Число пиксельных процессоров: -
  • Число универсальных процессоров: 2 × 240
  • Число текстурных процессоров: 2 × 96 (BLF/TLF)
  • Число ROPs: 2 × 32
  • Размеры: 270x100x33 мм (последняя величина — максимальная толщина видеокарты).
  • Цвет текстолита: черный
  • RAMDACs/TMDS: вынесены в отдельный чип NVIO.
  • Выходные гнезда: 2xDVI (Dual-Link/HDMI), HDMI, TV-out.
  • VIVO: нет
  • TV-out: не выведен.
  • Поддержка многопроцессорной работы: внутренний SLI (Hardware). А также возможен внешний SLI (Quad-SLI)
Zotac Geforce GTX 285 AMP! Edition 1024MB PCI-E
  • GPU: Geforce GTX 285 (GT200)
  • Интерфейс: PCI-Express x16
  • Частоты работы GPU (ROPs/Shaders): 700/1512 MHz (номинал — 650/1475 МГц)
  • Частоты работы памяти (физическая (эффективная)): 1250 (2500) MHz (номинал — 1250 (2500) МГц)
  • Ширина шины обмена с памятью: 512bit
  • Число вершинных процессоров: -
  • Число пиксельных процессоров: -
  • Число универсальных процессоров: 240
  • Число текстурных процессоров: 80 (BLF/TLF)
  • Число ROPs: 32
  • Размеры: 270x100x33 мм (последняя величина — максимальная толщина видеокарты).
  • Цвет текстолита: черный
  • RAMDACs/TMDS: вынесены в отдельный чип NVIO.
  • Выходные гнезда: 2xDVI (Dual-Link/HDMI), TV-out.
  • VIVO: нет
  • TV-out: интегрирован в GPU.
  • Поддержка многопроцессорной работы: SLI (Hardware).
Leadtek Geforce GTX 285 1024MB PCI-E
  • GPU: Geforce GTX 285 (GT200)
  • Интерфейс: PCI-Express x16
  • Частоты работы GPU (ROPs/Shaders): 650/1475 MHz (номинал — 650/1475 МГц)
  • Частоты работы памяти (физическая (эффективная)): 1250 (2500) MHz (номинал — 1250 (2500) МГц)
  • Ширина шины обмена с памятью: 512bit
  • Число вершинных процессоров: -
  • Число пиксельных процессоров: -
  • Число универсальных процессоров: 240
  • Число текстурных процессоров: 80 (BLF/TLF)
  • Число ROPs: 32
  • Размеры: 270x100x33 мм (последняя величина — максимальная толщина видеокарты).
  • Цвет текстолита: черный
  • RAMDACs/TMDS: вынесены в отдельный чип NVIO.
  • Выходные гнезда: 2xDVI (Dual-Link/HDMI), TV-out.
  • VIVO: нет
  • TV-out: интегрирован в GPU.
  • Поддержка многопроцессорной работы: SLI (Hardware).
Gigabyte Geforce GTX 285 1024MB PCI-E
  • GPU: Geforce GTX 285 (GT200)
  • Интерфейс: PCI-Express x16
  • Частоты работы GPU (ROPs/Shaders): 650/1475 MHz (номинал — 650/1475 МГц)
  • Частоты работы памяти (физическая (эффективная)): 1250 (2500) MHz (номинал — 1250 (2500) МГц)
  • Ширина шины обмена с памятью: 512bit
  • Число вершинных процессоров: -
  • Число пиксельных процессоров: -
  • Число универсальных процессоров: 240
  • Число текстурных процессоров: 80 (BLF/TLF)
  • Число ROPs: 32
  • Размеры: 270x100x33 мм (последняя величина — максимальная толщина видеокарты).
  • Цвет текстолита: черный
  • RAMDACs/TMDS: вынесены в отдельный чип NVIO.
  • Выходные гнезда: 2xDVI (Dual-Link/HDMI), TV-out.
  • VIVO: нет
  • TV-out: интегрирован в GPU.
  • Поддержка многопроцессорной работы: SLI (Hardware).


Zotac Geforce GTX 295 2x896MB PCI-E
Карта имеет 2 × 896 МБ памяти GDDR3 SDRAM, размещенной в 14 микросхемах (по 7 на каждой PCB)

Микросхемы памяти Hynix (GDDR3). Микросхемы расчитаны на максимальную частоту работы в 1250 (2500) МГц.

Zotac Geforce GTX 285 AMP! Edition 1024MB PCI-E
Leadtek Geforce GTX 285 1024MB PCI-E
Gigabyte Geforce GTX 285 1024MB PCI-E
Каждая карта имеет 1024 МБ памяти GDDR3 SDRAM, размещенной в 16 микросхемах на лицевой стороне PCB

Микросхемы памяти Hynix (GDDR3). Микросхемы расчитаны на максимальную частоту работы в 1250 (2500) МГц.



Сравнение с эталонным дизайном, вид спереди
Zotac Geforce GTX 295 2x896MB PCI-E Reference Nvidia Geforce GTX 295 2x896MB PCI-E
Zotac Geforce GTX 285 AMP! Edition 1024MB PCI-E Reference Nvidia Geforce GTX 280 1024MB PCI-E
Leadtek Geforce GTX 285 1024MB PCI-E
Gigabyte Geforce GTX 285 1024MB PCI-E


Сравнение с эталонным дизайном, вид сзади
Zotac Geforce GTX 295 2x896MB PCI-E Reference Nvidia Geforce GTX 295 2x896MB PCI-E
Zotac Geforce GTX 285 AMP! Edition 1024MB PCI-E Reference Nvidia Geforce GTX 280 1024MB PCI-E
Leadtek Geforce GTX 285 1024MB PCI-E
Gigabyte Geforce GTX 285 1024MB PCI-E


Напомним, что на данных картах используется все тот же GTX 280 (лишь по 55нм), поэтому он назван GTX 285.



Мы видим, что производитель не просто заменил ядро на более новое, которое обходится дешевле в производстве, но и полностью изменил дизайн PCB, переместив все 16 микросхем памяти на одну лицевую сторону карты. Поэтому такие платы уже не оснащаются задней крышкой, служащей радиатором, благодаря чему GTX 280 выглядел закованным полностью в панцирь системы охлаждения. А в случае GTX 285 мы видим все тот же кулер, но только на лицевой стороне. Это все, конечно же, усложнило разводку и увеличило стоимость PCB, но при этом все микросхемы памяти охлаждаются теперь одинаково с помощью кулера, что немаловажно при том, что в данном случае частоты работы памяти почти равны максимально возможным для данного типа микросхем, когда как на GTX 280 они же работали на более сниженных частотах.

Напоминаем еще раз важный момент: длина ускорителя — 270 мм, как у 8800 GTX/Ultra, поэтому в корпусе должно быть достаточно места для установки такой конструкции. А также обратим внимание на ширину кожуха, которая неизменна вдоль всей длины, а следовательно на материнской плате за PCI-E x16 разъемом не должно быть никаких портов и высоких конденсаторов, причем на ширину 30 мм (то есть не только за самим слотом PCI-E, но за соседним с ним не должно быть никаких высоких частей на системной плате).

Видеокарты этой серии оснащены гнездом для подключения звукового потока с аудио-карты для передачи его затем на HDMI (с помощью переходника DVI-to-HDMI), то есть сама видеокарта не оснащена аудио-кодеком, но осуществляет прием сигнала от внешней звуковой карты. Поэтому, если кому эта функция важна, следите за тем, чтобы в комплекте поставки видеокарты был аудио-шнурок для этих целей.

Особо заметим, что у GTX 285 питание осуществляется с помощью ДВУХ разъемов, но оба 6-пиновые, когда как у GTX 280 — один 6-пиновый, а второй 8-пиновый. Это стало возможным меньшему энергопотреблению ядра, выполненного по 55 нм.

Подключение к аналоговым мониторам с d-Sub (VGA) производится через специальные адаптеры-переходники DVI-to-d-Sub. Также с серийными картами поставляются переходники DVI-to-HDMI (мы помним, что данные ускорители поддерживают полноценную передачу видео и звука на HDMI-приемник), поэтому проблем с такими мониторами также не должно быть. Максимальные разрешения и частоты:

  • 240 Hz Max Refresh Rate
  • 2048 × 1536 × 32bit x85Hz Max — по аналоговому интерфейсу
  • 2560 × 1600 @ 60Hz Max — по цифровому интерфейсу (для DVI-гнезд с Dual-Link)

По поводу HDTV. Одно из исследований также проведено, и с ним можно ознакомиться здесь.

Теперь о кулере. Система охлаждения принципиально не отличается от того варианта, что мы видели еще на Geforce 8800 GTS 512, да и по сути это тот же кулер, что стоит на GTX 260/280. Размеры радиатора и самой карты практически равны.

Это цилиндрического типа кулер, прогоняющий воздух с помощью установленной на одном конце турбины через радиатор внутри длинного пластикового корпуса. Горячий воздух выбрасывается за пределы системного блока, поэтому карта с СО занимает 2 слота.







А далее мы провели исследование температурного режима с помощью утилиты RivaTuner (автор А.Николайчук AKA Unwinder) и получили следующие результаты:

Nvidia Geforce GTX 285 1024MB PCI-E



Nvidia Geforce GTX 285 1024MB PCI-E overclocked



Очевидно, что несмотря на уменьшенный техпроцесс, нагрев у карты весьма велик, хотя и ниже чем у GTX 280. Впрочем, кулер все равно остается тихим.

А теперь мы займемся тестами.

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютер на базе Intel Core2 (775 Socket)
    • процессор Intel Core2 Extreme QX9650 (3000 MHz);
    • системная плата Zotac 790i Ultra а чипсете Nvidia nForce 790i Ultra;
    • оперативная память 2 GB DDR3 SDRAM Corsair 2000MHz;
    • жесткий диск WD Caviar SE WD1600JD 160GB SATA.
    • блок питания Tagan TG900-BZ 900W.
  • операционная система Windows Vista 32bit SP1; DirectX 10.1;
  • монитор Dell 3007WFP (30").
  • драйверы ATI версии 8.561.3 (CATALYST 8.12beta); Nvidia версии 181.20.

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

  • D3D RightMark Beta 4 (1050) с описанием на сайте 3d.rightmark.org
  • D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 — тесты пиксельных шейдеров версий 2.0 и 3.0 ссылка.
  • RightMark3D 2.0 с кратким описанием: ссылка

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

Синтетические тесты проводились на следующих видеокартах:

  • Nvidia Geforce GTX 285 со стандартными параметрами (далее GTX 285)
  • Nvidia Geforce GTX 280 со стандартными параметрами (далее GTX 280)
  • RADEON HD 4870 X2 со стандартными параметрами (далее HD 4870 X2)
  • RADEON HD 4850 X2 со стандартными параметрами (далее HD 4850 X2)

Для сравнения результатов нового решения Geforce GTX 285 были выбраны именно эти модели видеокарт по следующим причинам: Geforce GTX 280 — её непосредственный предшественник, с ним сравниваем, чтобы посмотреть разницу в производительности, привнесённую изменившимися частотами; а с RADEON HD 4850 X2 (и частично HD 4870 X2) сравнение будет интересно потому, что это быстрейшие двухчиповые high-end решения от компании AMD, младшее из которых ещё и конкурирует с GTX 285 по цене.

Также сравнение может быть интересным потому, что результаты GTX 280 и HD 4870 X2 для синтетических тестов были взяты из предыдущих статей, когда использовались иные версии драйверов. То есть, можно будет сравнить, как повлияли последние версии драйверов на производительность видеокарт в синтетических тестах.

Direct3D 9: Тесты Pixel Filling

В тесте определяется пиковая производительность выборки текстур (texel rate) в режиме FFP для разного числа текстур, накладываемых на один пиксель:



Как обычно — у видеокарт получаются значения, не достигающие теоретических. Результаты синтетических тестов не дотягивают до теории, ближе всего к ним подбирались видеокарты предыдущих поколений, а новые видеокарты, отличающихся большим количеством TMU, в нашем тесте теоретического максимума не достигают. Возможно, их начинает ограничивать наш тест.

Хорошо видно, что в тестах с выборкой от 1 до 4 текстур на пиксель, производительность ограничена пропускной способностью видеопамяти, и почти все карты идут вровень. В случае с большим количеством текстур на пиксель, возможности блоков ROP раскрываются, и в более тяжелых условиях двухчиповые карты (а в данных тестах AFR эффективно удваивает частоту кадров, как показывает практика) от AMD выходят вперёд. А результат GTX 285 отличается от цифр GTX 280 соответственно теории. Посмотрим на результаты в тесте филлрейта:



Второй синтетический тест измеряет скорость заполнения, и в нём мы видим ту же самую ситуацию, но с учетом количества записанных в буфер кадра пикселей. И снова в случаях с 0-3 накладываемыми текстурами у всех протестированных видеоплат получается схожий результат, и лишь немного выигрывает двухчиповая HD 4870 X2. А в режимах, когда производительность ограничена не ПСП, а количеством и частотой блоков ROP, у двухчиповых карт есть явное преимущество.

Из интересного можно отметить результаты HD 4850 X2 в вариантах с 2 и 4 текстурами. Вероятно, из-за оптимизаций в новой версии драйвера в этих случаях он даже выигрывает у своего старшего собрата.

Direct3D 9: Тесты Pixel Shaders

Первая группа пиксельных шейдеров, которую мы рассматриваем, является очень простой для современных видеочипов, она включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0.



Тесты просты для современных архитектур и показывают скорее соответствие скорости текстурирования, чем математических расчётов. Ну а в таких простых тестах, когда производительность ограничена скоростью текстурных выборок, двухчиповые решения, работающие в режиме AFR, получают преимущество и выигрывают у одночиповых, в том числе и новой Geforce GTX 285.

Примерно то же соотношение остаётся и в более сложных тестах. Geforce GTX 285 показывает неплохой результат, опережая предыдущую топовую карту на GT200 на 6-12%, что соответствует теоретическим цифрам. Но у двухчиповых карт есть преимущество, ведь в наших старых тестах GTX 280 не догоняла даже Geforce 9800 GX2, не говоря уже о своём нынешнем конкуренте — HD 4850 X2. Посмотрим на результаты тестов более сложных пиксельных программ промежуточных версий:



Даже в сильно зависящем от скорости текстурирования тесте процедурной визуализации воды «Water», где используется зависимая выборка из текстур больших уровней вложенности, двухчиповые карты AMD показывают более чем в два раза лучшие результаты. А ведь раньше все карты RADEON отставали от всех решений на основе G92, G80 и GT200… Ситуация поменялась на противоположную, теперь решения AMD далеко впереди. Рассматриваемая сегодня видеокарта Geforce GTX 285 вновь показывает результат, соответствующий теоретическим цифрам, опережая GTX 280 на 8-10%.

Второй тест, несколько более интенсивный вычислительно, явно ещё лучше подходит для архитектуры AMD, обладающих большим количеством вычислительных блоков. В этом тесте решения Nvidia, в том числе и GTX 285, отстают от своих конкурентов не менее чем в два раза. То есть, даже с учетом высокой эффективности AFR в этом тесте, RV770 явно смотрится лучше GT200 в этот раз.

Direct3D 9: Тесты пиксельных шейдеров New Pixel Shaders

Данные тесты пиксельных шейдеров DirectX 9 ещё сложнее, они делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье Современная терминология 3D графики
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами

Существует два варианта этих шейдеров: с ориентацией на математические вычисления, и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:



Положение видеокарт в тесте «Frozen Glass» слабо отличается от результатов предыдущих тестов. Это математические тесты, зависящие прежде всего от количества и частоты шейдерных блоков, поэтому и Geforce GTX 280 и GTX 285 проигрывают обоим решениям AMD. Новая видеокарта Nvidia, имеющая лишь чуть более высокие частоты, ничего тут особенно не изменила, да и не могла.

Во втором тесте «Parallax Mapping» решения Nvidia уступают картам производства компании AMD ещё чуть больше, до двух раз. А GTX 285 быстрее GTX 280 совсем чуть-чуть, на разницу в частотах шейдерных блоков. Рассмотрим эти тесты в модификации с предпочтением выборок из текстур математическим вычислениям, там видеокарты могут показать иной расклад, ведь ранее чипы Nvidia лучше справлялись с текстурированием:



Но сейчас взаимное положение почти не изменилось, хотя в этих тестах ранее мы видели явный упор производительности в скорость текстурных блоков. Но современные архитектуры AMD и Nvidia подравнялись по характеристикам, и у RV770 уже нет слабого места в виде низкой скорости текстурирования. Поэтому Geforce GTX 285 в обоих тестах хоть и опережает предыдущую карту Nvidia, но двухчиповые платы AMD догнать не в силах. В любом случае, для всех решений варианты шейдеров с большим количеством математических вычислений работают быстрее в 1.5-2 раза, по сравнению с их «текстурными» вариантами.

Рассмотрим результаты ещё двух тестов пиксельных шейдеров — версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9. Тесты отличаются тем, что сильно нагружают и ALU и текстурные модули, обе шейдерные программы сложные, длинные, включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье Современная терминология 3D графики
  • Fur — процедурный шейдер, визуализирующий мех



И снова мы видим почти полную копию ситуации из предыдущих тестов. Двухчиповые решения AMD обладают более высокой математической производительностью, и обеспечивают быстрое исполнение сложных пиксельных шейдеров версии 3.0 с большим количеством ветвлений. Geforce GTX 285 отстаёт от своего прямого конкурента HD 4850 X2 примерно на 85%, хотя своего предшественника в лице GTX 280 обгоняет примерно на 9%, что близко к теоретически достижимым цифрам.

Direct3D 10: Тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два знакомых PS 3.0 теста под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два полностью новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами, при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40-80, включение «шейдерного» суперсэмплинга — до 60-120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Результаты в «High» получились менее чем в полтора раза ниже, чем в «Low», но соотношение примерно одинаковое. Производительность в этом тесте зависит не только от количества и скорости блоков TMU, но и от филлрейта и ПСП. В целом, можно отметить, что Direct3D 10 тесты процедурной визуализации меха с большим количеством текстурных выборок показывают некоторое преимущество решений Nvidia даже над двухчиповыми картами AMD.

Представленный сегодня Geforce GTX 285 выигрывает в обоих режимах и у предшествующей GTX 280 (на 12-13%, что примерно соответствует теоретическим данным), и у двухчиповых HD 4850 X2 и HD 4870 X2. Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза, возможно в такой ситуации что-то изменится, там ПСП с филлрейтом должны влиять меньше:

Включение суперсэмплинга теоретически увеличивает нагрузку в четыре раза, но на видеокартах Nvidia скорость традиционно снижается несколько больше, чем на AMD. Отрыв между решениями разных производителей сокращается, и GTX 285 показывает результат вровень с HD 4870 X2. Впрочем, опережение конкурента HD 4850 X2 остаётся.

Второй тест, измеряющий производительность выполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением, число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше, по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Этот тест интереснее для нас с практической точки зрения, ведь разновидности parallax mapping давно применяются в играх, а тяжелые варианты, вроде аналогичного нашему steep parallax mapping используются в некоторых проектах, например, в Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип примерно в два раза, такой режим называется «High».

Повторилась ситуация из предыдущего теста, а Geforce GTX 285 оторвался даже ещё больше, разница с GTX 280 уже доходит до 15%, вероятно, тест больше ограничен производительностью потоковых процессоров. В обновленном D3D10 варианте тестов parallax mapping без включения суперсэмплинга, решения AMD справляются с задачей всё также хуже видеокарт Nvidia. Да и включение самозатенения вызывает на продукции AMD большее падение производительности, по сравнению с разницей для решений Nvidia.

Посмотрим, что изменит включение суперсэмплинга, в прошлом тесте он вызывал большее падение скорости на картах Nvidia.

При включении суперсэмплинга и самозатенения задача получается ещё более тяжёлой, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая большое падение производительности. Соотношение производительности разных видеокарт уже несколько иное, хотя включение суперсэмплинга сказывается как и в предыдущем случае — карты производства AMD немного улучшают свои показатели относительно решений Nvidia.

Что касается сравнения обновленной модели Geforce GTX 285 с предыдущим топом, он опережает предшественника на 13-14%, что примерно соответствует теоретическим цифрам, если упор производительности был в математические вычисления. Во всех режимах видеокарта отлично справляется с задачей на уровне двухчиповых конкурентов, разве что в Low режиме новая видеокарта немного отстаёт от HD 4870 X2, который не является прямым конкурентом.

Direct3D 10: Тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Мы уже многократно отмечали и в этой статье и в предыдущих, что в вычислительно сложных задачах современная архитектура AMD показывает себя в целом лучше конкурирующей от Nvidia. Так произошло и в этот раз. А благодаря своему двухчиповому устройству (отдельное спасибо режиму AFR), карты AMD более чем в два раза опережают обе Geforce.

Производительность Geforce GTX 285 выше чем у Geforce GTX 280 на 15%, что соответствует теоретической разнице в частотах потоковых процессоров. К сожалению, видеокарта на основе одного чипа GT200b не может конкурировать с двухчиповыми картами компании AMD, уж слишком быстрой в математических вычислениях получилась архитектура RV770.

Второй тест шейдерных вычислений носит название Fire, и он ещё более тяжёл для ALU. В нём текстурная выборка только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

В во втором тесте в этом подразделе скорость рендеринга также ограничена исключительно производительностью шейдерных блоков. Причём, разница между решениями Nvidia и AMD ещё больше. Даже если не учитывать «двухчиповость» первых, они всё равно быстрее, даже в пересчёте на один GPU.

Geforce GTX 285 опережает GTX 280 более чем на 16%, что близко к теоретической разнице в шейдерной производительности, вызванной повышенными частотами. Но с лидерами в лице двухчиповых RADEON HD 4850 X2 и HD 4870 X2 новому решению всё так же не сравниться.

Direct3D 10: Тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующих частицу. Аналогичные алгоритмы должны получить широкое использование в будущих DirectX 10 играх.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Этот график скорее похож на то, что мы видели в разделе D3D9 тестов, чем в предыдущих D3D10. Соотношение скоростей при разной геометрической сложности сцен примерно одинаковое, производительность соответствует количеству точек, с каждым шагом падение FPS составляет около двух раз. Задача для современных видеокарт не очень сложная и ограничение скорости мощностью потоковых процессоров в тесте не явное, производительность ограничена также и ПСП и филлрейтом, хотя и в меньшей степени. А AFR эффективно увеличивает производительность многочиповых решений.

Geforce GTX 285 показывает результат несколько более высокий, чем GTX 280, и разница между ними составляет около 7%. То есть, задача ограничена скорее филлрейтом, чем ПСП или скоростью потоковых процессоров. Двухчиповые RADEON впереди, младшее решение опережает героя нынешней статьи на треть, а старшее — на 75-80% (сказывается более высокая ПСП у HD 4870 X2). Возможно, при переносе части вычислений в геометрический шейдер ситуация изменится, посмотрим:

Разницы между рассмотренными вариантами теста почти нет, она несущественна. Все видеокарты Nvidia показывают почти те же результаты при изменении параметра GS load, отвечающем за перенос части вычислений в геометрический шейдер. Только результаты видеоплат AMD немного выросли, особенно у RADEON HD 4850 X2 на новых драйверах. Geforce GTX 285 продолжает отставать от них, и разница уже даже чуть большая. Посмотрим, что изменится в следующем тесте, который предполагает большую нагрузку именно на геометрические шейдеры…

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленном в «Heavy» — ещё и для их отрисовки. То есть, в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер. Сначала рассматриваем лёгкий режим:

Относительные результаты в разных режимах соответствуют нагрузке: во всех случаях производительность неплохо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть в два раза медленней. Странно, что в этот раз производительность HD 4850 X2 провалилась, как это ранее было с двухчиповой же Geforce 9800 GX2. Скорее всего, в этом виноваты новые драйверы, в которые закралась ошибка, ведь с HD 4870 X2 всё в порядке.

Впрочем, у HD 4850 X2 не было бы шансов обогнать Geforce GTX 285 в этом тесте, ведь даже HD 4870 X2 показала лишь немного более высокий результат. Разница в скорости между решениями Nvidia всё так же соответствует разнице в частоте чипов. Цифры могут измениться на следующей диаграмме, в тесте с более активным использованием геометрических шейдеров. Также будет интересно сравнить друг с другом результаты, полученные в «Balanced» и «Heavy» режимах.

Но снова мы не видим никаких изменений. Если раньше в этом тесте старые архитектуры проваливались далеко вниз, то в GT200 и RV770 устранили недостатки предыдущих архитектур, и теперь они эффективно справляются с задачей. Впрочем, не нужно забывать, что одночиповый Geforce GTX 285 в этом тесте показывает результат почти как у HD 4870 X2. То есть, новая видеокарта Nvidia в тесте Hyperlight определённо быстрее HD 4850 X2, даже если бы последней не помешали ошибки драйверов.

Direct3D 10: Скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи по сути и соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Судя по предыдущим исследованиям, на результаты этого теста сильно влияет пропускная способность памяти, и чем проще режим, тем большее влияние на скорость она оказывает. Это хорошо заметно по простому режиму, где результаты карт близки к разнице ПСП. В более сложных условиях начинает влиять филлрейт, и режим многочипового рендеринга AFR позволяет картам AMD выиграть с большим отрывом.

Geforce GTX 285 показывает результат даже чуть медленнее, чем GTX 280. Это связано с некими изменениями и оптимизациями в драйверах, как мы увидим далее. В лёгком режиме она выигрывает у конкурентов, а в сложных пальма первенства переходит к двухчиповым решениям AMD, которые, как показывают предыдущие исследования, показывают тут двукратный прирост по сравнению с одночиповыми аналогами. Посмотрим на результаты этого же теста с увеличенным количеством текстурных выборок:

Ситуация изменилась не слишком сильно, в лёгком режиме результаты GTX 280 и GTX 285 стали поближе к двухчиповым конкурентам, но в сложном те продолжают лидировать. На этом графике интересно другое — преимущество GTX 285 над GTX 280 несколько выше того, что должно быть теоретически, и HD 4850 X2 с более новыми драйверами в двух тяжелых режимах показывает результат выше, чем у старшего брата. Это явно указывает на оптимизации в драйверах для более сложных режимов, ведь на предыдущем графике было всё иначе.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Тест «Waves» ещё благосклоннее к продукции AMD, и разница между одночиповыми моделями семейства Geforce GTX 200 и двухчиповыми RADEON увеличилась. Скорость в тесте зависит не столько от мощности TMU, сколько от ПСП и филлрейта, которые эффективно удваиваются в режиме AFR. Наш герой Geforce GTX 285 показал результат, не превышающий цифр GTX 280 в двух режимах из трёх, что снова можно списать на оптимизации для тяжелых задач, одна из которых будет на нашем следующем графике.

По сравнению с конкурентом HD 4850 X2, новая карта Nvidia впереди только в легком режиме, а в остальных двух уступает двухчиповому RADEON. Рассмотрим второй вариант этого же теста:

Изменений немного, с увеличением сложности теста результаты двухчиповых видеоплат серии RADEON HD 4800 стали ещё чуть лучше относительно скорости карт Nvidia, так как последние потеряли в скорости несколько больше. Хотя скорость в лёгком режиме продолжает ограничивать в т.ч. и ПСП, Geforce GTX 285 уже уступает обеим картам AMD, которым помогает двухчиповость. В тяжёлых режимах большую роль начинают играть эффективность блоков TMU и «двухчиповость», и поэтому Geforce GTX 285 и GTX 280 в два раза и более отстают от видеоплат AMD.

Выводы по синтетическим тестам

На основе результатов синтетических тестов новой видеокарты Geforce GTX 285, по сравнению с другими решениями обоих основных производителей видеочипов, можно сделать вывод, что новое решение Nvidia получилось слегка более мощным, чем предыдущая модель — GTX 280. Чего и следовало ожидать, ведь в изменениях, способных повлиять на производительность, значатся только повышенные тактовые частоты.

Если смотреть исключительно на цифры, то суммарно GTX 285 показал всё же меньшую частоту кадров в большинстве наших тестов, по сравнению с двухчиповым HD 4850 X2. Впрочем, среди одночиповых видеокарт GTX 285 является быстрейшим решением, и показывает весьма достойный результат даже в сравнении с двухчиповыми картами конкурента (особенно если рассматривать только Direct3D 10 тесты), у которых есть свои проблемы, о которых мы расскажем в отдельном материале.

Кроме увеличения частот, направленных на небольшое увеличение производительности, Nvidia уделила особое внимание энергопотреблению, энергетической эффективности решения, и снижению его себестоимости. Geforce GTX 285 показывает довольно высокую производительность, а благодаря новому техпроцессу и упрощенному дизайну он потребляет сравнительно небольшое количество энергии, да и будет стоить не так дорого, как предшествующая модель Geforce GTX 280 в начале своего жизненного пути. А это для покупателей поважнее результатов в синтетических тестах будет.

В следующей части нашей статьи вы найдёте тесты нового решения компании Nvidia в современных игровых приложениях. Эти результаты должны показать реальное соотношение производительности Geforce GTX 285 и его конкурентов от AMD. Вполне вероятно, что игровые результаты не будут в точности соответствовать выводам, сделанным при анализе результатов синтетических тестов, ведь сравнение одночиповых и двухчиповых карт — дело непростое. Можно предположить, что средняя частота кадров у Geforce GTX 285 и HD 4850 X2 в играх будет близкой, несмотря на то, что в наших синтетических тестах разница иногда достигала двух раз. Синтетика есть синтетика, с ней нужно обращаться осторожно.



Nvidia Geforce GTX 285 — Часть 3: Игровые тесты (производительность)



Блок питания для тестового стенда предоставлен компанией TAGAN
Монитор Dell 3007WFP для тестовых стендов предоставлен компанией Nvidia