Nvidia Geforce GTX 590

описание видеокарты и результаты синтетических тестов


Содержание

В этой части, как обычно, мы изучим саму видеокарту, а также познакомимся с результатами синтетических тестов.

Плата

Nvidia Geforce GTX 590 2×1536 МБ 2×384-битной GDDR5, PCI-E
  • GPU: Geforce GTX 590 (2×GF110)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs), МГц: 607 (номинал — 607)
  • Частота работы памяти (физическая (эффективная)), МГц: 853 (3412) (номинал — 853 (3412)
  • Ширина шины обмена с памятью, бит: 2×384
  • Число вычислительных блоков в GPU/частота работы блоков, МГц: 2×512/1214 (номинал — 2×512/1214)
  • Число операций (ALU) в блоке: 1
  • Суммарное число операций (ALU): 2×512
  • Число блоков текстурирования: 2×64 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 2×48
  • Размеры, мм: 270×100×33 (последняя величина — максимальная толщина видеокарты)
  • Цвет текстолита: черный
  • RAMDACs/TMDS: интегрированы в GPU
  • Выходные гнезда: 3×DVI (Dual-Link/HDMI), DP-mini
  • Поддержка многопроцессорной работы: SLI (Hardware)

Nvidia Geforce GTX 590 2×1536 МБ 2×384-битной GDDR5, PCI-E
Карта имеет 2×1536 МБ памяти GDDR5 SDRAM, размещенной в 24 микросхемах (по 12 на лицевой и оборотной сторонах PCB).

Микросхемы памяти Samsung (GDDR5). Микросхемы расчитаны на максимальную частоту работы в 1250 (5000) МГц.

Сравнение с эталонным дизайном, вид спереди
Nvidia Geforce GTX 590 2×1536 МБ 2×384-битной GDDR5, PCI-E Reference card Nvidia Geforce GTX 580

Сравнение с эталонным дизайном, вид сзади
Nvidia Geforce GTX 590 2×1536 МБ 2×384-битной GDDR5, PCI-E Reference card Nvidia Geforce GTX 580

Разумеется, общего между GTX 580 и GTX 590 — только длина PCB и размеры карты в целом. А в остальном, понятно, это 2 большие разницы: ведь в GTX 590 упаковано, по сути, две GTX 580. Поэтому микросхем памяти в 2 раза больше, и размещены они очень плотно. Конечно же, на плате установлено и два графических процесора.

Подключение к аналоговым мониторам с d-Sub (VGA) производится через специальные адаптеры-переходники DVI-to-d-Sub. Что касается вывода на HDMI, то продукт также обладает такой возможностью — через адаптеры картинку на HDMI можно передавать c DVI-разъемов. Кроме того, у карты есть и Display Port (но требуется переходник с mini-DP).

Максимальные разрешения и частоты:

  • 240 Гц максимальная частота обновления
  • 2048×1536@85 Гц — по аналоговому интерфейсу
  • 2560×1600@60 Гц — по цифровому интерфейсу (для DVI-гнезд с Dual-Link/HDMI)

По поводу HDTV. Одно из исследований также проведено, и с ним можно ознакомиться здесь.

Следует особо упомянуть, что GTX 590 позволяет выводить картинку игры одновременно на три монитора, и даже в стереорежиме. При этом нет ограничения в виде обязательного использования как минимум одного приемника с Display Port, что имеет место в случае карт серии Radeon. Полагаем, что эта функция вывода на три монитора найдет своих поклонников, ибо как раз такой очень мощный ускоритель способен обеспечить приемлемую скорость в огромном разрешении, необходимом для трех мониторов.

Карта требует дополнительного питания, причем двумя 8-контактными разъемами, так что обращайте внимание на переходники питания, которые должны быть в комплектах поставки серийных карт.

О системе охлаждения.

Nvidia Geforce GTX 590 2×1536 МБ 2×384-битной GDDR5, PCI-E
СО по своему принципу схожа с той, что мы видели у Radeon HD 6990, то есть состоит из кожуха, двух радиаторов для GPU и большой платформы, которая охлаждает микросхемы памяти и служит опорой для массивного вентилятора.

Вентилятор установлен в центре конструкции и гонит воздух на радиаторы в двух противоположных направлениях, поэтому выхлоп горячего воздуха производится не только наружу корпуса системного блока, но и в сторону передней панели, где может располагаться корзина с HDD, что не есть хорошо. Поэтому лучше, чтобы жесткие диски в корпусе были установлены выше видеокарты. Каждый радиатор имеет испарительную камеру для повышения эффективности снятия тепла с GPU.

И как огромный плюс данного решения — тихая СО. Да-да, на такой мощной карте — и кулер почти не шумит, что выгодно отличает новинку от конкурента в лице HD 6990.

Мы провели исследование температурного режима с помощью утилиты MSI Afterburner (автор А. Николайчук AKA Unwinder) и получили следующие результаты:

Nvidia Geforce GTX 590 2×1536 МБ 2×384-битной GDDR5, PCI-E

Прекрасный результат для такого очень мощного ускорителя! 87 градусов ядра после 8-часовой работы под нагрузкой — это отлично! А какова расплата за отсутствие шума и не столь высокий нагрев? Вот ниже и покажем.

Видеокарта прибыла к нам без упаковки и комплекта, потому данный вопрос мы опускаем.

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютер на базе Intel Core i7-975 (Socket 1366)
    • процессор Intel Core i7-975 (3340 МГц);
    • системная плата Asus P6T Deluxe на чипсете Intel X58;
    • оперативная память 6 ГБ DDR3 SDRAM Corsair 1600 МГц;
    • жесткий диск WD Caviar SE WD1600JD 160 ГБ SATA;
    • блок питания Tagan TG900-BZ 900 Вт.
  • операционная система Windows 7 64 бит SP1; DirectX 11;
  • монитор Dell 3007WFP (30″);
  • драйверы ATI версии Catalyst 11.4 beta; Nvidia версии 267.24/267.26/267.59/267.71.

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать по следующим ссылкам:

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также обновление DirectX runtime.

Синтетические тесты проводились на следующих моделях видеокарт:

  • Geforce GTX 590 со стандартными параметрами (далее GTX 590)
  • Geforce GTX 570 SLI — две видеокарты GTX 570 в режиме SLI со стандартными параметрами (далее GTX 570 SLI)
  • Geforce GTX 580 со стандартными параметрами (далее GTX 580)
  • Radeon HD 6990 OC с увеличенной до 880 МГц частотой GPU — режим заводского разгона Dual-BIOS (далее HD 6990 OC)
  • Radeon HD 6990 со стандартными параметрами (далее HD 6990)
  • Radeon HD 6970 со стандартными параметрами (далее HD 6970)

Именно эти решения были выбраны для сравнения результатов с новой двухчиповой видеокартой Nvidia вот по каким причинам:

  • пару Geforce GTX 570 в режиме SLI мы в прошлом материале взяли как индикатор ожидаемой производительности GTX 590
  • Geforce GTX 580 являлась быстрейшей видеокартой компании до выхода GTX 590, да ещё и основана на том же самом GPU
  • Radeon HD 6990 взята как сильнейшее двухчиповое решение конкурента, являющееся прямым соперником по цене, причём её цифры даны в двух режимах, в том числе и с фабричным разгоном
  • Radeon HD 6970 в некоторые тесты попал как быстрейшее одночиповое решение компании AMD из той же последней серии HD 6900

Direct3D 9: тесты Pixel Filling

В этом тесте определяется пиковая производительность выборки текстур (texel rate) в режиме FFP для разного числа текстур, накладываемых на один пиксель:

К сожалению, все двухчиповые видеокарты в нашем тесте текстурных выборок показали крайне странные результаты. Nvidia SLI в этом тесте работает явно некорректно, так как цифры систем на базе двух GPU необъяснимо низки, а видеокарта на базе двух видеочипов от AMD то ли упирается в пропускную способность шины памяти, то ли на ней тоже плохо работает CrossFire.

Поэтому и смысла в анализе результатов этого теста из RightMark нет, лучше мы ниже проанализируем цифры скорости текстурирования в соответствующем тесте из пакета 3DMark Vantage. Хотя и по нашему тесту из предыдущих материалов (по одночиповым GTX 580 и HD 6970) хорошо видно, что решения от AMD сильнее видеокарт Nvidia в текстурировании. Результаты в тесте филлрейта в этот раз рассматривать не будем, так как в них мы увидим всё те же некорректные результаты.

Direct3D 9: тесты Pixel Shaders

Первая группа пиксельных шейдеров, которую мы рассматриваем, очень проста для современных видеочипов, она включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся в старых играх.

Эти тесты очень просты для современных видеосистем даже с единственным GPU, и скорость рендеринга в них упирается зачастую в производительность текстурирования, поэтому цифры показывают не все возможности современных решений. Но всё же двухчиповые системы показывают в них неплохой прирост производительности, и эффективность работы CrossFire оказывается несколько выше данного показателя для SLI.

Новая двухчиповая видеокарта Geforce GTX 590 выступила, как ни странно, лучше двух видеокарт GTX 570 в связке, что может объясняться более новой версией драйверов, а также меньшим упором в пропускную способность в случае GTX 590. Двухчиповая карта компании Nvidia обогнала одночиповую GTX 580 на 40-45%, а это явно не очень большая разница.

Сравнение с решениями AMD в этих тестах традиционно не в пользу Nvidia. Даже одиночная GTX 580 немного проигрывает соответствующей HD 6970, а с учётом сравнительно низкой частоты GPU в GTX 590 и меньшей эффективности SLI, двухчиповое решение Nvidia отстаёт от конкурента раза в полтора. Дополнительной причиной отставания может быть ещё и недостаток скорости текстурирования.

Посмотрим на результаты более сложных пиксельных программ промежуточных версий:

В этом случае диаграмма получилась похожей на ту, что мы видели в самых сложных тестах из прошлого раздела. Прирост от второго GPU в HD 6990 составил порядка 80-90%, а вот SLI оказалась эффективна только в подтесте Water. А тест Cook-Torrance, который более интенсивен вычислительно, по какой-то причине не очень хорошо выполняется на SLI-конфигурациях.

В итоге, новая модель Geforce GTX 590 в одном тесте показывает результат на уровне SLI-системы из двух GTX 570, а в Water даже отстаёт. Понятно, что с такими результатами конкурировать у неё получается максимум с одночиповой Radeon HD 6970. Эти тесты явно лучше подходят для архитектуры AMD, чипы которой имеют большее количество математических и текстурных блоков, и у решений Nvidia просто нет никаких шансов в данном случае.

Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье Современная терминология 3D графики.
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

Существует два варианта этих шейдеров: с ориентацией на математические вычисления, и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это универсальные тесты, зависящие и от скорости блоков ALU и от скорости текстурирования, в них важен общий баланс чипа. Производительность новой модели видеокарты Nvidia в тесте «Frozen Glass» оказалась лишь на 41% выше, чем у одночиповой GTX 580, что примерно равно разнице между одночиповым и двухчиповым Radeon. Этот тест снова явно плохо подходит Nvidia, решения которой проигрывают из-за слабого текстурирования. Ну хоть GTX 590 обогнал две GTX 570 (скорее всего, из-за большей ПСП), и то хорошо.

Во втором тесте «Parallax Mapping» решения Nvidia чувствуют себя немногим лучше, но и там проигрывают, особенно с учётом меньшей эффективности работы SLI. Результат GTX 590 лишь на 54% выше цифры GTX 580, а вот в случае HD 6990 против HD 6970 разница составляет около двух раз. Рассмотрим далее эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям — увидим ли мы там какие-то изменения?

Для плат Nvidia ситуация стала ещё более печальной, так как скорость текстурирования у последних видеочипов от AMD значительно выше, чем у GPU производства Nvidia. Поэтому двухчиповые системы из двух GTX 570 и новый GTX 590 проигрывают даже одночиповому Radeon HD 6970 в обоих тестах в модификации с упором на текстурирование! Это вполне объяснимо, так как в этих тестах важнее всего производительность блоков TMU. Поэтому быстрейшим снова становится новый двухчиповый топ из семейства HD 6900, который на 70-80% быстрее своего одночипового собрата.

Но это были устаревшие задачи, в основном с упором в текстурирование и филлрейт. Далее мы рассмотрим результаты ещё двух тестов пиксельных шейдеров — но уже версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9 API. Они наиболее показательны с точки зрения современных игр на ПК, среди которых много мультиплатформенных. Тесты отличаются тем, что сильно нагружают и ALU, и текстурные модули, обе шейдерные программы сложны и длинны, и включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье Современная терминология 3D-графики.
  • Fur — процедурный шейдер, визуализирующий мех.

В наших самых сложных DX9 тестах, видеокарты производства Nvidia всегда выступали сильно, в отличие от предыдущих тестов подраздела. Это связано с тем, что последние два теста не ограничены производительностью текстурных выборок, филлрейтом и ПСП, а зависят от эффективности исполнения кода сравнительно сложных пиксельных шейдеров.

К сожалению, Nvidia снова подводит относительно низкая тактовая частота и малая эффективность двухчипового рендеринга. Новая модель GTX 590 оказывается чуть медленнее, чем GTX 570 SLI, и опережает одиночную GTX 580 лишь на 54-56%. В то время как HD 6990 почти вдвое быстрее, чем её одночиповый аналог HD 6970. Поэтому, в тестах сложных пиксельных шейдеров версии 3.0 новая топовая видеокарта Nvidia показывает результат чуть хуже, чем конкурент от AMD, хотя их одночиповое решение явно сильнее.

Скорость в обоих PS 3.0 тестах слабо зависит от ПСП и текстурирования, зато код отличается сложностью, с чем неплохо справляются обе новые архитектуры Nvidia и AMD. Эти два теста всегда адекватно показывали примерную расстановку графических решений по скорости рендеринга в современных играх. И мы не удивимся, если в игровых тестах Geforce GTX 590 будет совсем немного уступать Radeon HD 6990 даже в обычном режиме, не говоря о фабричном разгоне последней.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два знакомых PS 3.0 теста под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами, при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40-80, включение «шейдерного» суперсэмплинга — до 60-120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в этом тесте сильнее всего зависит от количества и эффективности блоков TMU и ROP. Результаты при детализации уровня «High» у решений AMD получаются примерно в полтора раза ниже, чем при «Low», как и должно быть по теории, а у Nvidia разница несколько ниже теоретической. В Direct3D 10 тестах процедурной визуализации меха с большим количеством текстурных выборок решения Nvidia раньше были сильнее, но семейство Radeon HD 6900 к ним подтянулось.

В варианте без суперсэмплинга, на производительность большее влияние оказывает эффективный филлрейт и пропускная способность памяти. Одночиповое решение Nvidia показывает очень хороший результат, а вот GTX 590 уступила связке из двух GTX 570 — сказываются значительно пониженные тактовые частоты.

По сравнению с конкурирующим решением, новая модель компании Nvidia в простом режиме отстаёт, а при высоких настройках детализации идёт вровень с Radeon HD 6990. В фабрично разогнанном режиме последней разница между платами ещё больше. Посмотрим на результаты в этом же тесте, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза:

Включение суперсэмплинга увеличивает теоретическую нагрузку в четыре раза и результаты решений Nvidia заметно снизились относительно Radeon HD 6990. Geforce GTX 590 оказалась в полтора раза быстрее GTX 580, двухчиповая карта показывает результат на уровне двух GTX 570 в SLI. Но это не помогло справиться с новой двухчиповой видеокартой HD 6990, которая в обоих частотных режимах опережает новинку от Nvidia. Хотя при высокой детализации разница между ними невелика.

Второй шейдерный DX10 тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением, число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше, по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 несколько интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде нашего steep parallax mapping, давно используются во многих проектах, таких как игры Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип примерно в два раза, такой режим называется «High».

Диаграмма во многом похожа на предыдущую без сглаживания методом суперсэмплинга, но позиции решений Nvidia ослабли. В обновленном D3D10 варианте теста без SSAA, GTX 590 уже не достигает уровня HD 6990 ни при каком уровне детализации, отставая также и от пары GTX 570. Прирост производительности по отношению к GTX 580 составил лишь около 40%. К сожалению, мы констатируем очередной проигрыш новинки от Nvidia. Посмотрим, что изменит включение суперсэмплинга, ведь он обычно вызывает дополнительное падение скорости на платах с GPU производства калифорнийской компании.

При включении суперсэмплинга и самозатенения задача ещё более сложная, совместное включение сразу двух этих опций увеличивает нагрузку на карты почти в восемь раз, вызывая большое падение производительности. Разница между скоростными показателями протестированных видеокарт изменилась, включение суперсэмплинга сказывается как и в предыдущем случае — видеокарты производства AMD ещё чуть-чуть улучшили свои показатели относительно решений Nvidia.

С включением SSAA, двухчиповая GTX 590 опережает одночиповую GTX 580 на 52-57%, что совсем неплохо. И всё же, плата Nvidia на базе двух GPU не может опередить аналогичную систему из пары GTX 570, из-за низкой частоты GPU. Поэтому и решению AMD она уступает в обоих тестовых режимах довольно прилично.

В обзоре Radeon HD 6990 мы сделали предположение о том, что двухчиповая плата семейства HD 6900 в этом разделе справится со своим конкурентом от Nvidia, если он будет основан на двух GTX 570 или иметь близкие к ним теоретические характеристики, и оказались правы — так оно и получилось.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты предельных математических тестов привычно соответствуют разнице в частотах и количестве исполнительных блоков, с несомненным влиянием их эффективности. Современная архитектура AMD в таких случаях традиционно имеет огромное преимущество перед конкурирующими видеокартами от Nvidia, и этот факт объясняет полученные нами результаты.

Теоретическая разница в пользу решений AMD велика настолько, что двухчиповые системы Nvidia показывают результаты лишь на уровне лучших одночиповых решений конкурента. Немудрено, что Geforce GTX 590 в таком сравнении смог показать лишь почти ровно вдвое меньший результат, по сравнению с двухчиповым HD 6990 в режиме фабричного разгона.

К сожалению, прирост в 41% по сравнению с GTX 580 не дал новой видеокарте Nvidia возможность догнать даже пару GTX 570 в SLI режиме. Сильно заниженные тактовые частоты новинки на базе двух чипов GF110 оказались хуже даже характеристик GTX 570 (хотя чипы в GTX 590 полноценные, но они работают на очень низкой частоте лишь в 607/1215 МГц).

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нём только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Вот и во втором математическом тесте все решения остались примерно на тех же позициях. Так как скорость рендеринга в этом тесте снова ограничена исключительно производительностью шейдерных блоков, то Radeon HD 6990 снова стал явным лидером сравнения.

За новой моделью компании AMD не может угнаться двухчиповая же Geforce GTX 590, она снова отстаёт почти в два раза, и служит мощным индикатором того, что в следующей архитектуре компании Nvidia нужно бы подтянуть математическую производительность, меняя устройство соответствующих исполнительных блоков. Geforce GTX 590 снова отстала от GTX 570 SLI, а одиночную GTX 580 обогнала на 46%. Скорее всего, и в играх разница между ними будет где-то около 50%, чего может не хватить для конкуренции с Radeon HD 6990.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующих частицу. Аналогичные алгоритмы должны получить широкое использование в будущих DirectX 10 играх.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS почти двукратное. Задача для современных видеокарт не особенно сложная, производительность ограничена не только скоростью обработки геометрии, но и пропускной способностью памяти и филлрейтом в какой-то мере.

В новых чипах AMD увеличила геометрическую производительность, но достать в этом тесте их двухчиповая карта смогла только одиночную GTX 580, и в простых условиях даже обогнала её. С учётом 40-50% прироста от двух чипов, свежая модель GTX 590 от Nvidia значительно опередила решение AMD. Возможно, в случае Radeon виновато ограничение производительности ПСП или низкая эффективность блоков ROP в этой задаче.

А вот от двух плат Geforce GTX 570 в режиме SLI новинка отстала на 9-10%, что объясняется выбранной низкой частотой для GPU двухчипового решения. Посмотрим, что изменится при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте, цифры для решений Nvidia изменились слабо. А вот двухчиповая видеокарта семейства HD 6900 всё же немного реагирует на изменения параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, показывая результаты чуть выше, чем на предыдущей диаграмме. Теперь HD 6990 смогла обогнать GTX 580, но в сравнении с реальными конкурентами ничего не изменилось, и серьёзное отставание от архитектуры Nvidia остаётся.

Geforce GTX 590 всё также немного отстаёт от двух GTX 570 в SLI конфигурации, которые и стали победителем нашего первого геометрического теста. Посмотрим, что изменится в следующем тесте, который предполагает большую нагрузку именно на геометрические шейдеры.

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленном в «Heavy» — ещё и для их отрисовки. То есть, в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер. Сначала рассматриваем лёгкий режим:

К сожалению, мы снова видим, что второй тест геометрических шейдеров «Hyperlight» для сравнения многочиповых систем не подходит вовсе. И CrossFire и SLI по каким-то причинам (недостатки драйверов? невозможность оптимизации кода для двухчипового рендеринга?) в нём не просто неработоспособны, но двухчиповые решения от обеих компаний показывают тут аномально низкие результаты, намного хуже, чем даже аналогичные одночиповые системы. Так было в тесте филлрейта в исполнении видеокарт Nvidia, только теперь к ним присоединилась и видеокарта AMD Radeon.

По предыдущим материалам мы знаем, что видеокарты Nvidia справляются с геометрическими шейдерами в этом тесте заметно лучше, чем решения AMD. И в сравнении Geforce GTX 590 и Radeon HD 6990 вряд ли что изменится, ведь распараллеливание работы блоков установки треугольников выполняется решениями Nvidia гораздо лучше.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи по сути и соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Предыдущие исследования показали, что на результаты этого теста влияет и скорость текстурирования и пропускная способность памяти, но в разной мере. Многочиповые решения, в отличие от последнего теста геометрических шейдеров, в этом тесте выступают очень неплохо, особенно высока эффективность CrossFire.

К сожалению, этого нельзя сказать о Geforce GTX 590, которая явно работала то ли в одночиповом режиме, то ли с крайне низкой эффективностью SLI, так как она лишь слегка обогнала одночиповую GTX 580. А вот Radeon HD 6990, основанный на двух GPU, показывает результаты чуть выше уровня двух GTX 570 в режиме SLI, которые отстали от него только в наиболее простом режиме.

И если бы SLI в случае анонсированной сегодня Geforce GTX 590 работал так же, то она показала бы результат почти на уровне конкурирующей видеокарты AMD, эффективность двухчиповой конфигурации у которой весьма высока. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Во втором тесте VTF соотношение результатов заметно изменилось, особенно в тяжёлом и среднем режимах. Видеокарты Nvidia продолжают показывать низкие результаты при самых лёгких условиях, но опережают Radeon в более сложных. И в тяжёлых режимах ситуация складывается явно в пользу Nvidia. Впрочем, новинка в лице GTX 590 всё так же странно работает, сильно отставая от GTX 570 SLI, что объяснимо разве что недоработкой в драйверах, связанной с работой SLI на конкретно этой видеокарте.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты во втором тесте вершинного текстурирования — «Waves» традиционно сильно отличаются от того, что мы видели на предыдущих диаграммах. В этом тесте эффективность двухчипового рендеринга SLI от Nvidia в случае Geforce GTX 590 снова почти нулевая, в отличие от высокой эффективности CrossFire.

С учётом того, что на HD 6990 установлено два полночастотных и полноценных топовых GPU, в отличие от сильно приторможенных графических процессоров на GTX 590, именно это решение от AMD становится победителем. Даже SLI-система из двух Geforce GTX 570 ощутимо отстаёт от новой платы AMD, хотя на этой системе многочиповый рендеринг явно работает нормально. Рассмотрим второй вариант этого же теста:

Разница, по сравнению с предыдущей диаграммой, получилась совсем небольшой. Хотя скорость видеокарт Nvidia в этот раз снизилась значительно меньше, чем у решений AMD, и последние лидируют теперь лишь в режиме с малым количеством полигонов. А в среднем и тяжёлом режимах впереди всех идёт система на базе двух GTX 570.

А вот двухчиповая новинка Geforce GTX 590 работает тут лишь чуть быстрее одночиповой GTX 580. Nvidia явно нужно озаботиться повышением эффективности AFR-рендеринга в их решениях. Хотя, в синтетике и играх ситуация может быть и различной. Возможно, их драйверы просто не оптимизируются для предельных тестов, подобных RightMark.

3DMark Vantage: Feature-тесты

Синтетические тесты из пакета 3DMark Vantage могут показать нам что-то, что мы ранее упустили. Feature-тесты этого тестового пакета обладают поддержкой DirectX 10 и интересны уже тем, что отличаются от наших. При анализе результатов новых видеокарт в этом пакете мы сможем сделать какие-то новые и полезные выводы, ускользнувшие от нас в тестах семейства RightMark. К сожалению, ещё более новый тестовый пакет компании — 3DMark 11 — не содержит специализированных синтетических тестов и нам в данном случае совсем не интересен.

Feature Test 1: Texture Fill

Первый тест — тест скорости текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Результаты видеокарт в текстурном тесте компании Futuremark всегда ближе к теоретически возможному уровню скорости текстурных выборок и эффективность видеокарт от компаний Nvidia и AMD в нём выше, чем в нашем. Тем более что в нашем тесте и вовсе не удалось оценить производительность блоков TMU из-за явно неадекватных результатов мультичиповых решений.

На диаграмме отлично видно, что видеокарты Nvidia сильно уступают конкурирующим решениям по предельной скорости текстурирования. Вышедшая на рынок сегодня Geforce GTX 590 показывает результат, близкий к тому, что мы видим у одночиповой модели Radeon HD 6970. Ну а двухчиповый HD 6990 становится явным победителем теста, так как текстурная производительность у современных GPU компании AMD очень высока. А вот сегодняшняя новинка, к сожалению, проигрывает в том числе и двум GTX 570 в режиме SLI.

Feature Test 2: Color Fill

Это — тест скорости заполнения. Используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

А вот в этом тесте мы видим совсем другое взаимное расположение видеокарт на диаграмме. Подтест Futuremark измеряет производительность блоков ROP при условии отсутствия упора в величину пропускной способности видеопамяти. И в этом случае видеокарты Nvidia отлично конкурируют с решениями AMD. Тест филлрейта — это единственный тест, где Geforce GTX 590 стала лучшей, чисто номинально обогнав Radeon HD 6990 в любом режиме.

Интересно, что Geforce GTX 590 оказалась явно быстрее и пары GTX 570 в SLI, которые немного не достали до HD 6990. Вероятно, топовые решения тут упираются не только в производительность ROP, но и в пропускную способность памяти, поэтому GTX 590 и показала столь высокий результат. Собственно, явное влияние ПСП на результаты видно и по цифрам HD 6990 в разных режимах. Ведь в режиме повышенных частот этой видеокарты изменяется только тактовая частота GPU, но не видеопамяти.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature тестов, так как подобная техника уже используется в играх. В нём рисуется один четырехугольник (точнее, два треугольника), с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоёмкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжёлого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчёты освещения по Strauss.

Данный тест отличается от других подобных тем, что результаты в нём зависят не исключительно от скорости математических вычислений или эффективности исполнения ветвлений или скорости текстурных выборок, а от всего понемногу. И для достижения высокой скорости важен правильный баланс производительности различных блоков GPU. Влияет на скорость и эффективность выполнения ветвлений в шейдерах.

Сравнительные результаты видеокарт чем-то похожи на то, что мы видели в тесте текстурной производительности ранее, но решения от Nvidia получили небольшое ускорение, которое явственно указывает на то, что не одна текстурная производительность влияет на результаты. И всё же, даже с учётом улучшения сравнительных результатов видеокарт Nvidia, высочайшую скорость показывает свежая двухчиповая модель от компании AMD. Geforce GTX 590 заметно уступает ей, немного отставая в том числе и от пары видеокарт Geforce GTX 570, работающих в режиме SLI.

Feature Test 4: GPU Cloth

Тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте зависит от многих параметров, основными из которых является производительность обработки геометрии и эффективность выполнения геометрических шейдеров. Как и в наших тестах, видеокарты производства компании Nvidia чувствуют себя в этом приложении явно очень хорошо, с большим запасом опережая своих конкурентов.

По этим результатам хорошо видно преимущество архитектуры Nvidia перед графическими чипами AMD. Хотя прирост производительности от второго Cayman составил 87%, но это позволило лишь оторваться от одночиповой Geforce GTX 580. Скорее всего, это объясняется разницей в организации графического конвейера по обработке геометрии у GF110 и Cayman. Лидирует в сравнении пара GTX 570 SLI, а наш сегодняшний герой — Geforce GTX 590 — отстаёт от неё на несколько процентов.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующих частицу. Но тест больше всего загружает шейдерные блоки вершинными расчётами, также тестируется stream out.

Результаты ещё одного теста из пакета 3DMark Vantage похожи на те, что мы видели на предыдущей диаграмме, и тут даже ещё больше важна скорость обработки геометрии. Именно поэтому новая двухчиповая модель семейства HD 6900 отстала теперь уже даже от Geforce GTX 580, имеющей на борту единственный чип GF110!

Сил двух полноценных, но изрядно приторможенных частотой чипов в GTX 590 не хватило, чтобы догнать GTX 570 в SLI, хотя отставание от них мизерное. В любом случае, в обоих синтетических тестах имитации тканей и частиц из тестового пакета 3DMark Vantage, в которых активно используются геометрические шейдеры, решения Nvidia заметно опережают видеокарты из последней линейки Radeon HD 6900.

Feature Test 6: Perlin Noise

Последний feature тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто используемый в процедурном текстурировании, он использует очень много математических расчётов.

Пару чисто математических тестов мы уже видели в нашем пакете RightMark 2.0. Его аналог из бенчмарка компании Futuremark, показывающий пиковую производительность видеочипов в предельных вычислительных задачах, показывает примерно то же самое, то есть подавляющее преимущество решений компании AMD.

Даже в режиме номинальных частот результат Radeon HD 6990 получился заметно выше, чем скорость Geforce GTX 590. Не говоря уже про режим фабричного разгона, в котором GTX 590 снова проиграла своему конкуренту ровно вдвое. Но это уже не удивляет, ведь платы Nvidia по пиковой математике отстают от решений AMD очень давно, и подобные сравнения всегда получаются не в их пользу. Новая модель GTX 590 немного уступила двум платам GTX 570, что в очередной раз показало правильность выбранного нами индикатора производительности GTX 590 в предыдущем материале.

Выводы по синтетическим тестам

По результатам тестирования можно сделать вывод о том, что новая видеокарта Geforce GTX 590, основанная на двух графических процессорах GF110 — одно из быстрейших решений на рынке на сегодня, хотя и немного уступающее своему главному конкуренту (Radeon HD 6990) в большинстве синтетических тестов. GTX 590 взяла верх лишь в тех задачах, производительность в которых ограничена скоростью обработки геометрии, тесселяции и выполнения геометрических шейдеров. Из главных недостатков новинки нужно отметить отставание представленной сегодня видеокарты в тестах текстурирования и пиковой математической производительности. Это объясняется как архитектурными отличиями, так и заниженными тактовыми частотами относительно одночиповых решений.

Если вы помните, в синтетической части тестов обзора Radeon HD 6990, который является прямым конкурентом нового решения Nvidia, в качестве индикатора производительности условного тогда «GTX 590» мы взяли пару Geforce GTX 570, работающих в режиме SLI, и затем сделали вывод о том, что решению такой мощности будет непросто выступать против вышедшей двухчиповой карты компании AMD.

Мы не ошиблись, ведь вышедшая сегодня реальная Geforce GTX 590 в синтетических тестах показала даже чуть меньшую скорость, чем две GTX 570. Даже несмотря на большее количество активных исполнительных блоков в GPU, так получилось из-за их банальной низкой тактовой частоты. Которая, в свою очередь, оказалась такой из-за жёсткого ограничения на энергопотребление топовых графических процессоров Nvidia, которое становилось иначе слишком высоким. Мы задаёмся резонным вопросом: а не лучше ли было сделать двухчиповую карту на базе двух GF114 с сильно повышенными частотами или хотя бы попробовать выжать из пары GF110 ещё 50 МГц, чтобы успешно конкурировать с аналогичной видеокартой AMD?

Но небольшое отставание совсем не значит, что Geforce GTX 590 плоха. Эта видеокарта по производительности является одним из двух лучших 3D-ускорителей, разница между которыми составляет 5—10% и может быть как со знаком плюс, так и со знаком минус, в зависимости от приложения. Поэтому выбор между GTX 590 и HD 6990 нужно осуществлять, глядя на результаты в интересующих вас играх, а также по другим пользовательским характеристикам, таким как шумность системы охлаждения, энергопотребление и т. п. Полезно будет обратить внимание и на реальную розничную цену. С другой стороны, подобные платы предназначены для энтузиастов, и цена их всегда будет высокой просто потому, что это единственные в своём роде видеокарты высочайшего уровня.

По результатам нашей синтетики можно попробовать прикинуть и примерную разницу в производительности в играх. Если GTX 590 опережает GTX 580 в среднем на 45—55%, то HD 6990 быстрее своего одночипового аналога уже на целых 70—80% (и речь о номинальном режиме, при фабричном разгоне будет ещё больше). То есть даже с учётом того, что GTX 580 в наших тестах показала себя явно быстрее, чем HD 6970, можно предположить отставание GTX 590 от HD 6990 в игровых тестах в среднем на 5—10%. Хотя будут встречаться и такие игровые приложения, в которых GTX 590 будет быстрее конкурента. Как раз в следующей части материала мы и проверим это предположение.




Блок питания для тестового стенда предоставлен компанией TAGAN

Корпус ThermalTake 8430 для тестового стенда предоставлен компанией 3Logic

Монитор Dell 3007WFP для тестовых стендов предоставлен компанией Nvidia




Дополнительно

Битва Гигантов: Nvidia Geforce GTX 590 против AMD Radeon HD 6990

Nvidia Geforce GTX 590

описание видеокарты и результаты синтетических тестов

Содержание

В этой части, как обычно, мы изучим саму видеокарту, а также познакомимся с результатами синтетических тестов.

Плата

Nvidia Geforce GTX 590 2×1536 МБ 2×384-битной GDDR5, PCI-E
  • GPU: Geforce GTX 590 (2×GF110)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs), МГц: 607 (номинал — 607)
  • Частота работы памяти (физическая (эффективная)), МГц: 853 (3412) (номинал — 853 (3412)
  • Ширина шины обмена с памятью, бит: 2×384
  • Число вычислительных блоков в GPU/частота работы блоков, МГц: 2×512/1214 (номинал — 2×512/1214)
  • Число операций (ALU) в блоке: 1
  • Суммарное число операций (ALU): 2×512
  • Число блоков текстурирования: 2×64 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 2×48
  • Размеры, мм: 270×100×33 (последняя величина — максимальная толщина видеокарты)
  • Цвет текстолита: черный
  • RAMDACs/TMDS: интегрированы в GPU
  • Выходные гнезда: 3×DVI (Dual-Link/HDMI), DP-mini
  • Поддержка многопроцессорной работы: SLI (Hardware)

Nvidia Geforce GTX 590 2×1536 МБ 2×384-битной GDDR5, PCI-E
Карта имеет 2×1536 МБ памяти GDDR5 SDRAM, размещенной в 24 микросхемах (по 12 на лицевой и оборотной сторонах PCB).

Микросхемы памяти Samsung (GDDR5). Микросхемы расчитаны на максимальную частоту работы в 1250 (5000) МГц.

Сравнение с эталонным дизайном, вид спереди
Nvidia Geforce GTX 590 2×1536 МБ 2×384-битной GDDR5, PCI-E Reference card Nvidia Geforce GTX 580

Сравнение с эталонным дизайном, вид сзади
Nvidia Geforce GTX 590 2×1536 МБ 2×384-битной GDDR5, PCI-E Reference card Nvidia Geforce GTX 580

Разумеется, общего между GTX 580 и GTX 590 — только длина PCB и размеры карты в целом. А в остальном, понятно, это 2 большие разницы: ведь в GTX 590 упаковано, по сути, две GTX 580. Поэтому микросхем памяти в 2 раза больше, и размещены они очень плотно. Конечно же, на плате установлено и два графических процесора.

Подключение к аналоговым мониторам с d-Sub (VGA) производится через специальные адаптеры-переходники DVI-to-d-Sub. Что касается вывода на HDMI, то продукт также обладает такой возможностью — через адаптеры картинку на HDMI можно передавать c DVI-разъемов. Кроме того, у карты есть и Display Port (но требуется переходник с mini-DP).

Максимальные разрешения и частоты:

  • 240 Гц максимальная частота обновления
  • 2048×1536@85 Гц — по аналоговому интерфейсу
  • 2560×1600@60 Гц — по цифровому интерфейсу (для DVI-гнезд с Dual-Link/HDMI)

По поводу HDTV. Одно из исследований также проведено, и с ним можно ознакомиться здесь.

Следует особо упомянуть, что GTX 590 позволяет выводить картинку игры одновременно на три монитора, и даже в стереорежиме. При этом нет ограничения в виде обязательного использования как минимум одного приемника с Display Port, что имеет место в случае карт серии Radeon. Полагаем, что эта функция вывода на три монитора найдет своих поклонников, ибо как раз такой очень мощный ускоритель способен обеспечить приемлемую скорость в огромном разрешении, необходимом для трех мониторов.

Карта требует дополнительного питания, причем двумя 8-контактными разъемами, так что обращайте внимание на переходники питания, которые должны быть в комплектах поставки серийных карт.

О системе охлаждения.

Nvidia Geforce GTX 590 2×1536 МБ 2×384-битной GDDR5, PCI-E
СО по своему принципу схожа с той, что мы видели у Radeon HD 6990, то есть состоит из кожуха, двух радиаторов для GPU и большой платформы, которая охлаждает микросхемы памяти и служит опорой для массивного вентилятора.

Вентилятор установлен в центре конструкции и гонит воздух на радиаторы в двух противоположных направлениях, поэтому выхлоп горячего воздуха производится не только наружу корпуса системного блока, но и в сторону передней панели, где может располагаться корзина с HDD, что не есть хорошо. Поэтому лучше, чтобы жесткие диски в корпусе были установлены выше видеокарты. Каждый радиатор имеет испарительную камеру для повышения эффективности снятия тепла с GPU.

И как огромный плюс данного решения — тихая СО. Да-да, на такой мощной карте — и кулер почти не шумит, что выгодно отличает новинку от конкурента в лице HD 6990.

Мы провели исследование температурного режима с помощью утилиты MSI Afterburner (автор А. Николайчук AKA Unwinder) и получили следующие результаты:

Nvidia Geforce GTX 590 2×1536 МБ 2×384-битной GDDR5, PCI-E

Прекрасный результат для такого очень мощного ускорителя! 87 градусов ядра после 8-часовой работы под нагрузкой — это отлично! А какова расплата за отсутствие шума и не столь высокий нагрев? Вот ниже и покажем.

Видеокарта прибыла к нам без упаковки и комплекта, потому данный вопрос мы опускаем.

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютер на базе Intel Core i7-975 (Socket 1366)
    • процессор Intel Core i7-975 (3340 МГц);
    • системная плата Asus P6T Deluxe на чипсете Intel X58;
    • оперативная память 6 ГБ DDR3 SDRAM Corsair 1600 МГц;
    • жесткий диск WD Caviar SE WD1600JD 160 ГБ SATA;
    • блок питания Tagan TG900-BZ 900 Вт.
  • операционная система Windows 7 64 бит SP1; DirectX 11;
  • монитор Dell 3007WFP (30″);
  • драйверы ATI версии Catalyst 11.4 beta; Nvidia версии 267.24/267.26/267.59/267.71.

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать по следующим ссылкам:

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также обновление DirectX runtime.

Синтетические тесты проводились на следующих моделях видеокарт:

  • Geforce GTX 590 со стандартными параметрами (далее GTX 590)
  • Geforce GTX 570 SLI — две видеокарты GTX 570 в режиме SLI со стандартными параметрами (далее GTX 570 SLI)
  • Geforce GTX 580 со стандартными параметрами (далее GTX 580)
  • Radeon HD 6990 OC с увеличенной до 880 МГц частотой GPU — режим заводского разгона Dual-BIOS (далее HD 6990 OC)
  • Radeon HD 6990 со стандартными параметрами (далее HD 6990)
  • Radeon HD 6970 со стандартными параметрами (далее HD 6970)

Именно эти решения были выбраны для сравнения результатов с новой двухчиповой видеокартой Nvidia вот по каким причинам:

  • пару Geforce GTX 570 в режиме SLI мы в прошлом материале взяли как индикатор ожидаемой производительности GTX 590
  • Geforce GTX 580 являлась быстрейшей видеокартой компании до выхода GTX 590, да ещё и основана на том же самом GPU
  • Radeon HD 6990 взята как сильнейшее двухчиповое решение конкурента, являющееся прямым соперником по цене, причём её цифры даны в двух режимах, в том числе и с фабричным разгоном
  • Radeon HD 6970 в некоторые тесты попал как быстрейшее одночиповое решение компании AMD из той же последней серии HD 6900

Direct3D 9: тесты Pixel Filling

В этом тесте определяется пиковая производительность выборки текстур (texel rate) в режиме FFP для разного числа текстур, накладываемых на один пиксель:

К сожалению, все двухчиповые видеокарты в нашем тесте текстурных выборок показали крайне странные результаты. Nvidia SLI в этом тесте работает явно некорректно, так как цифры систем на базе двух GPU необъяснимо низки, а видеокарта на базе двух видеочипов от AMD то ли упирается в пропускную способность шины памяти, то ли на ней тоже плохо работает CrossFire.

Поэтому и смысла в анализе результатов этого теста из RightMark нет, лучше мы ниже проанализируем цифры скорости текстурирования в соответствующем тесте из пакета 3DMark Vantage. Хотя и по нашему тесту из предыдущих материалов (по одночиповым GTX 580 и HD 6970) хорошо видно, что решения от AMD сильнее видеокарт Nvidia в текстурировании. Результаты в тесте филлрейта в этот раз рассматривать не будем, так как в них мы увидим всё те же некорректные результаты.

Direct3D 9: тесты Pixel Shaders

Первая группа пиксельных шейдеров, которую мы рассматриваем, очень проста для современных видеочипов, она включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся в старых играх.

Эти тесты очень просты для современных видеосистем даже с единственным GPU, и скорость рендеринга в них упирается зачастую в производительность текстурирования, поэтому цифры показывают не все возможности современных решений. Но всё же двухчиповые системы показывают в них неплохой прирост производительности, и эффективность работы CrossFire оказывается несколько выше данного показателя для SLI.

Новая двухчиповая видеокарта Geforce GTX 590 выступила, как ни странно, лучше двух видеокарт GTX 570 в связке, что может объясняться более новой версией драйверов, а также меньшим упором в пропускную способность в случае GTX 590. Двухчиповая карта компании Nvidia обогнала одночиповую GTX 580 на 40-45%, а это явно не очень большая разница.

Сравнение с решениями AMD в этих тестах традиционно не в пользу Nvidia. Даже одиночная GTX 580 немного проигрывает соответствующей HD 6970, а с учётом сравнительно низкой частоты GPU в GTX 590 и меньшей эффективности SLI, двухчиповое решение Nvidia отстаёт от конкурента раза в полтора. Дополнительной причиной отставания может быть ещё и недостаток скорости текстурирования.

Посмотрим на результаты более сложных пиксельных программ промежуточных версий:

В этом случае диаграмма получилась похожей на ту, что мы видели в самых сложных тестах из прошлого раздела. Прирост от второго GPU в HD 6990 составил порядка 80-90%, а вот SLI оказалась эффективна только в подтесте Water. А тест Cook-Torrance, который более интенсивен вычислительно, по какой-то причине не очень хорошо выполняется на SLI-конфигурациях.

В итоге, новая модель Geforce GTX 590 в одном тесте показывает результат на уровне SLI-системы из двух GTX 570, а в Water даже отстаёт. Понятно, что с такими результатами конкурировать у неё получается максимум с одночиповой Radeon HD 6970. Эти тесты явно лучше подходят для архитектуры AMD, чипы которой имеют большее количество математических и текстурных блоков, и у решений Nvidia просто нет никаких шансов в данном случае.

Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье Современная терминология 3D графики.
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

Существует два варианта этих шейдеров: с ориентацией на математические вычисления, и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это универсальные тесты, зависящие и от скорости блоков ALU и от скорости текстурирования, в них важен общий баланс чипа. Производительность новой модели видеокарты Nvidia в тесте «Frozen Glass» оказалась лишь на 41% выше, чем у одночиповой GTX 580, что примерно равно разнице между одночиповым и двухчиповым Radeon. Этот тест снова явно плохо подходит Nvidia, решения которой проигрывают из-за слабого текстурирования. Ну хоть GTX 590 обогнал две GTX 570 (скорее всего, из-за большей ПСП), и то хорошо.

Во втором тесте «Parallax Mapping» решения Nvidia чувствуют себя немногим лучше, но и там проигрывают, особенно с учётом меньшей эффективности работы SLI. Результат GTX 590 лишь на 54% выше цифры GTX 580, а вот в случае HD 6990 против HD 6970 разница составляет около двух раз. Рассмотрим далее эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям — увидим ли мы там какие-то изменения?

Для плат Nvidia ситуация стала ещё более печальной, так как скорость текстурирования у последних видеочипов от AMD значительно выше, чем у GPU производства Nvidia. Поэтому двухчиповые системы из двух GTX 570 и новый GTX 590 проигрывают даже одночиповому Radeon HD 6970 в обоих тестах в модификации с упором на текстурирование! Это вполне объяснимо, так как в этих тестах важнее всего производительность блоков TMU. Поэтому быстрейшим снова становится новый двухчиповый топ из семейства HD 6900, который на 70-80% быстрее своего одночипового собрата.

Но это были устаревшие задачи, в основном с упором в текстурирование и филлрейт. Далее мы рассмотрим результаты ещё двух тестов пиксельных шейдеров — но уже версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9 API. Они наиболее показательны с точки зрения современных игр на ПК, среди которых много мультиплатформенных. Тесты отличаются тем, что сильно нагружают и ALU, и текстурные модули, обе шейдерные программы сложны и длинны, и включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье Современная терминология 3D-графики.
  • Fur — процедурный шейдер, визуализирующий мех.

В наших самых сложных DX9 тестах, видеокарты производства Nvidia всегда выступали сильно, в отличие от предыдущих тестов подраздела. Это связано с тем, что последние два теста не ограничены производительностью текстурных выборок, филлрейтом и ПСП, а зависят от эффективности исполнения кода сравнительно сложных пиксельных шейдеров.

К сожалению, Nvidia снова подводит относительно низкая тактовая частота и малая эффективность двухчипового рендеринга. Новая модель GTX 590 оказывается чуть медленнее, чем GTX 570 SLI, и опережает одиночную GTX 580 лишь на 54-56%. В то время как HD 6990 почти вдвое быстрее, чем её одночиповый аналог HD 6970. Поэтому, в тестах сложных пиксельных шейдеров версии 3.0 новая топовая видеокарта Nvidia показывает результат чуть хуже, чем конкурент от AMD, хотя их одночиповое решение явно сильнее.

Скорость в обоих PS 3.0 тестах слабо зависит от ПСП и текстурирования, зато код отличается сложностью, с чем неплохо справляются обе новые архитектуры Nvidia и AMD. Эти два теста всегда адекватно показывали примерную расстановку графических решений по скорости рендеринга в современных играх. И мы не удивимся, если в игровых тестах Geforce GTX 590 будет совсем немного уступать Radeon HD 6990 даже в обычном режиме, не говоря о фабричном разгоне последней.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два знакомых PS 3.0 теста под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами, при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40-80, включение «шейдерного» суперсэмплинга — до 60-120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в этом тесте сильнее всего зависит от количества и эффективности блоков TMU и ROP. Результаты при детализации уровня «High» у решений AMD получаются примерно в полтора раза ниже, чем при «Low», как и должно быть по теории, а у Nvidia разница несколько ниже теоретической. В Direct3D 10 тестах процедурной визуализации меха с большим количеством текстурных выборок решения Nvidia раньше были сильнее, но семейство Radeon HD 6900 к ним подтянулось.

В варианте без суперсэмплинга, на производительность большее влияние оказывает эффективный филлрейт и пропускная способность памяти. Одночиповое решение Nvidia показывает очень хороший результат, а вот GTX 590 уступила связке из двух GTX 570 — сказываются значительно пониженные тактовые частоты.

По сравнению с конкурирующим решением, новая модель компании Nvidia в простом режиме отстаёт, а при высоких настройках детализации идёт вровень с Radeon HD 6990. В фабрично разогнанном режиме последней разница между платами ещё больше. Посмотрим на результаты в этом же тесте, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза:

Включение суперсэмплинга увеличивает теоретическую нагрузку в четыре раза и результаты решений Nvidia заметно снизились относительно Radeon HD 6990. Geforce GTX 590 оказалась в полтора раза быстрее GTX 580, двухчиповая карта показывает результат на уровне двух GTX 570 в SLI. Но это не помогло справиться с новой двухчиповой видеокартой HD 6990, которая в обоих частотных режимах опережает новинку от Nvidia. Хотя при высокой детализации разница между ними невелика.

Второй шейдерный DX10 тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением, число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше, по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 несколько интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде нашего steep parallax mapping, давно используются во многих проектах, таких как игры Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип примерно в два раза, такой режим называется «High».

Диаграмма во многом похожа на предыдущую без сглаживания методом суперсэмплинга, но позиции решений Nvidia ослабли. В обновленном D3D10 варианте теста без SSAA, GTX 590 уже не достигает уровня HD 6990 ни при каком уровне детализации, отставая также и от пары GTX 570. Прирост производительности по отношению к GTX 580 составил лишь около 40%. К сожалению, мы констатируем очередной проигрыш новинки от Nvidia. Посмотрим, что изменит включение суперсэмплинга, ведь он обычно вызывает дополнительное падение скорости на платах с GPU производства калифорнийской компании.

При включении суперсэмплинга и самозатенения задача ещё более сложная, совместное включение сразу двух этих опций увеличивает нагрузку на карты почти в восемь раз, вызывая большое падение производительности. Разница между скоростными показателями протестированных видеокарт изменилась, включение суперсэмплинга сказывается как и в предыдущем случае — видеокарты производства AMD ещё чуть-чуть улучшили свои показатели относительно решений Nvidia.

С включением SSAA, двухчиповая GTX 590 опережает одночиповую GTX 580 на 52-57%, что совсем неплохо. И всё же, плата Nvidia на базе двух GPU не может опередить аналогичную систему из пары GTX 570, из-за низкой частоты GPU. Поэтому и решению AMD она уступает в обоих тестовых режимах довольно прилично.

В обзоре Radeon HD 6990 мы сделали предположение о том, что двухчиповая плата семейства HD 6900 в этом разделе справится со своим конкурентом от Nvidia, если он будет основан на двух GTX 570 или иметь близкие к ним теоретические характеристики, и оказались правы — так оно и получилось.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты предельных математических тестов привычно соответствуют разнице в частотах и количестве исполнительных блоков, с несомненным влиянием их эффективности. Современная архитектура AMD в таких случаях традиционно имеет огромное преимущество перед конкурирующими видеокартами от Nvidia, и этот факт объясняет полученные нами результаты.

Теоретическая разница в пользу решений AMD велика настолько, что двухчиповые системы Nvidia показывают результаты лишь на уровне лучших одночиповых решений конкурента. Немудрено, что Geforce GTX 590 в таком сравнении смог показать лишь почти ровно вдвое меньший результат, по сравнению с двухчиповым HD 6990 в режиме фабричного разгона.

К сожалению, прирост в 41% по сравнению с GTX 580 не дал новой видеокарте Nvidia возможность догнать даже пару GTX 570 в SLI режиме. Сильно заниженные тактовые частоты новинки на базе двух чипов GF110 оказались хуже даже характеристик GTX 570 (хотя чипы в GTX 590 полноценные, но они работают на очень низкой частоте лишь в 607/1215 МГц).

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нём только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Вот и во втором математическом тесте все решения остались примерно на тех же позициях. Так как скорость рендеринга в этом тесте снова ограничена исключительно производительностью шейдерных блоков, то Radeon HD 6990 снова стал явным лидером сравнения.

За новой моделью компании AMD не может угнаться двухчиповая же Geforce GTX 590, она снова отстаёт почти в два раза, и служит мощным индикатором того, что в следующей архитектуре компании Nvidia нужно бы подтянуть математическую производительность, меняя устройство соответствующих исполнительных блоков. Geforce GTX 590 снова отстала от GTX 570 SLI, а одиночную GTX 580 обогнала на 46%. Скорее всего, и в играх разница между ними будет где-то около 50%, чего может не хватить для конкуренции с Radeon HD 6990.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующих частицу. Аналогичные алгоритмы должны получить широкое использование в будущих DirectX 10 играх.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS почти двукратное. Задача для современных видеокарт не особенно сложная, производительность ограничена не только скоростью обработки геометрии, но и пропускной способностью памяти и филлрейтом в какой-то мере.

В новых чипах AMD увеличила геометрическую производительность, но достать в этом тесте их двухчиповая карта смогла только одиночную GTX 580, и в простых условиях даже обогнала её. С учётом 40-50% прироста от двух чипов, свежая модель GTX 590 от Nvidia значительно опередила решение AMD. Возможно, в случае Radeon виновато ограничение производительности ПСП или низкая эффективность блоков ROP в этой задаче.

А вот от двух плат Geforce GTX 570 в режиме SLI новинка отстала на 9-10%, что объясняется выбранной низкой частотой для GPU двухчипового решения. Посмотрим, что изменится при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте, цифры для решений Nvidia изменились слабо. А вот двухчиповая видеокарта семейства HD 6900 всё же немного реагирует на изменения параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, показывая результаты чуть выше, чем на предыдущей диаграмме. Теперь HD 6990 смогла обогнать GTX 580, но в сравнении с реальными конкурентами ничего не изменилось, и серьёзное отставание от архитектуры Nvidia остаётся.

Geforce GTX 590 всё также немного отстаёт от двух GTX 570 в SLI конфигурации, которые и стали победителем нашего первого геометрического теста. Посмотрим, что изменится в следующем тесте, который предполагает большую нагрузку именно на геометрические шейдеры.

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленном в «Heavy» — ещё и для их отрисовки. То есть, в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер. Сначала рассматриваем лёгкий режим:

К сожалению, мы снова видим, что второй тест геометрических шейдеров «Hyperlight» для сравнения многочиповых систем не подходит вовсе. И CrossFire и SLI по каким-то причинам (недостатки драйверов? невозможность оптимизации кода для двухчипового рендеринга?) в нём не просто неработоспособны, но двухчиповые решения от обеих компаний показывают тут аномально низкие результаты, намного хуже, чем даже аналогичные одночиповые системы. Так было в тесте филлрейта в исполнении видеокарт Nvidia, только теперь к ним присоединилась и видеокарта AMD Radeon.

По предыдущим материалам мы знаем, что видеокарты Nvidia справляются с геометрическими шейдерами в этом тесте заметно лучше, чем решения AMD. И в сравнении Geforce GTX 590 и Radeon HD 6990 вряд ли что изменится, ведь распараллеливание работы блоков установки треугольников выполняется решениями Nvidia гораздо лучше.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи по сути и соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Предыдущие исследования показали, что на результаты этого теста влияет и скорость текстурирования и пропускная способность памяти, но в разной мере. Многочиповые решения, в отличие от последнего теста геометрических шейдеров, в этом тесте выступают очень неплохо, особенно высока эффективность CrossFire.

К сожалению, этого нельзя сказать о Geforce GTX 590, которая явно работала то ли в одночиповом режиме, то ли с крайне низкой эффективностью SLI, так как она лишь слегка обогнала одночиповую GTX 580. А вот Radeon HD 6990, основанный на двух GPU, показывает результаты чуть выше уровня двух GTX 570 в режиме SLI, которые отстали от него только в наиболее простом режиме.

И если бы SLI в случае анонсированной сегодня Geforce GTX 590 работал так же, то она показала бы результат почти на уровне конкурирующей видеокарты AMD, эффективность двухчиповой конфигурации у которой весьма высока. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Во втором тесте VTF соотношение результатов заметно изменилось, особенно в тяжёлом и среднем режимах. Видеокарты Nvidia продолжают показывать низкие результаты при самых лёгких условиях, но опережают Radeon в более сложных. И в тяжёлых режимах ситуация складывается явно в пользу Nvidia. Впрочем, новинка в лице GTX 590 всё так же странно работает, сильно отставая от GTX 570 SLI, что объяснимо разве что недоработкой в драйверах, связанной с работой SLI на конкретно этой видеокарте.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты во втором тесте вершинного текстурирования — «Waves» традиционно сильно отличаются от того, что мы видели на предыдущих диаграммах. В этом тесте эффективность двухчипового рендеринга SLI от Nvidia в случае Geforce GTX 590 снова почти нулевая, в отличие от высокой эффективности CrossFire.

С учётом того, что на HD 6990 установлено два полночастотных и полноценных топовых GPU, в отличие от сильно приторможенных графических процессоров на GTX 590, именно это решение от AMD становится победителем. Даже SLI-система из двух Geforce GTX 570 ощутимо отстаёт от новой платы AMD, хотя на этой системе многочиповый рендеринг явно работает нормально. Рассмотрим второй вариант этого же теста:

Разница, по сравнению с предыдущей диаграммой, получилась совсем небольшой. Хотя скорость видеокарт Nvidia в этот раз снизилась значительно меньше, чем у решений AMD, и последние лидируют теперь лишь в режиме с малым количеством полигонов. А в среднем и тяжёлом режимах впереди всех идёт система на базе двух GTX 570.

А вот двухчиповая новинка Geforce GTX 590 работает тут лишь чуть быстрее одночиповой GTX 580. Nvidia явно нужно озаботиться повышением эффективности AFR-рендеринга в их решениях. Хотя, в синтетике и играх ситуация может быть и различной. Возможно, их драйверы просто не оптимизируются для предельных тестов, подобных RightMark.

3DMark Vantage: Feature-тесты

Синтетические тесты из пакета 3DMark Vantage могут показать нам что-то, что мы ранее упустили. Feature-тесты этого тестового пакета обладают поддержкой DirectX 10 и интересны уже тем, что отличаются от наших. При анализе результатов новых видеокарт в этом пакете мы сможем сделать какие-то новые и полезные выводы, ускользнувшие от нас в тестах семейства RightMark. К сожалению, ещё более новый тестовый пакет компании — 3DMark 11 — не содержит специализированных синтетических тестов и нам в данном случае совсем не интересен.

Feature Test 1: Texture Fill

Первый тест — тест скорости текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Результаты видеокарт в текстурном тесте компании Futuremark всегда ближе к теоретически возможному уровню скорости текстурных выборок и эффективность видеокарт от компаний Nvidia и AMD в нём выше, чем в нашем. Тем более что в нашем тесте и вовсе не удалось оценить производительность блоков TMU из-за явно неадекватных результатов мультичиповых решений.

На диаграмме отлично видно, что видеокарты Nvidia сильно уступают конкурирующим решениям по предельной скорости текстурирования. Вышедшая на рынок сегодня Geforce GTX 590 показывает результат, близкий к тому, что мы видим у одночиповой модели Radeon HD 6970. Ну а двухчиповый HD 6990 становится явным победителем теста, так как текстурная производительность у современных GPU компании AMD очень высока. А вот сегодняшняя новинка, к сожалению, проигрывает в том числе и двум GTX 570 в режиме SLI.

Feature Test 2: Color Fill

Это — тест скорости заполнения. Используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

А вот в этом тесте мы видим совсем другое взаимное расположение видеокарт на диаграмме. Подтест Futuremark измеряет производительность блоков ROP при условии отсутствия упора в величину пропускной способности видеопамяти. И в этом случае видеокарты Nvidia отлично конкурируют с решениями AMD. Тест филлрейта — это единственный тест, где Geforce GTX 590 стала лучшей, чисто номинально обогнав Radeon HD 6990 в любом режиме.

Интересно, что Geforce GTX 590 оказалась явно быстрее и пары GTX 570 в SLI, которые немного не достали до HD 6990. Вероятно, топовые решения тут упираются не только в производительность ROP, но и в пропускную способность памяти, поэтому GTX 590 и показала столь высокий результат. Собственно, явное влияние ПСП на результаты видно и по цифрам HD 6990 в разных режимах. Ведь в режиме повышенных частот этой видеокарты изменяется только тактовая частота GPU, но не видеопамяти.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature тестов, так как подобная техника уже используется в играх. В нём рисуется один четырехугольник (точнее, два треугольника), с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоёмкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжёлого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчёты освещения по Strauss.

Данный тест отличается от других подобных тем, что результаты в нём зависят не исключительно от скорости математических вычислений или эффективности исполнения ветвлений или скорости текстурных выборок, а от всего понемногу. И для достижения высокой скорости важен правильный баланс производительности различных блоков GPU. Влияет на скорость и эффективность выполнения ветвлений в шейдерах.

Сравнительные результаты видеокарт чем-то похожи на то, что мы видели в тесте текстурной производительности ранее, но решения от Nvidia получили небольшое ускорение, которое явственно указывает на то, что не одна текстурная производительность влияет на результаты. И всё же, даже с учётом улучшения сравнительных результатов видеокарт Nvidia, высочайшую скорость показывает свежая двухчиповая модель от компании AMD. Geforce GTX 590 заметно уступает ей, немного отставая в том числе и от пары видеокарт Geforce GTX 570, работающих в режиме SLI.

Feature Test 4: GPU Cloth

Тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте зависит от многих параметров, основными из которых является производительность обработки геометрии и эффективность выполнения геометрических шейдеров. Как и в наших тестах, видеокарты производства компании Nvidia чувствуют себя в этом приложении явно очень хорошо, с большим запасом опережая своих конкурентов.

По этим результатам хорошо видно преимущество архитектуры Nvidia перед графическими чипами AMD. Хотя прирост производительности от второго Cayman составил 87%, но это позволило лишь оторваться от одночиповой Geforce GTX 580. Скорее всего, это объясняется разницей в организации графического конвейера по обработке геометрии у GF110 и Cayman. Лидирует в сравнении пара GTX 570 SLI, а наш сегодняшний герой — Geforce GTX 590 — отстаёт от неё на несколько процентов.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующих частицу. Но тест больше всего загружает шейдерные блоки вершинными расчётами, также тестируется stream out.

Результаты ещё одного теста из пакета 3DMark Vantage похожи на те, что мы видели на предыдущей диаграмме, и тут даже ещё больше важна скорость обработки геометрии. Именно поэтому новая двухчиповая модель семейства HD 6900 отстала теперь уже даже от Geforce GTX 580, имеющей на борту единственный чип GF110!

Сил двух полноценных, но изрядно приторможенных частотой чипов в GTX 590 не хватило, чтобы догнать GTX 570 в SLI, хотя отставание от них мизерное. В любом случае, в обоих синтетических тестах имитации тканей и частиц из тестового пакета 3DMark Vantage, в которых активно используются геометрические шейдеры, решения Nvidia заметно опережают видеокарты из последней линейки Radeon HD 6900.

Feature Test 6: Perlin Noise

Последний feature тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто используемый в процедурном текстурировании, он использует очень много математических расчётов.

Пару чисто математических тестов мы уже видели в нашем пакете RightMark 2.0. Его аналог из бенчмарка компании Futuremark, показывающий пиковую производительность видеочипов в предельных вычислительных задачах, показывает примерно то же самое, то есть подавляющее преимущество решений компании AMD.

Даже в режиме номинальных частот результат Radeon HD 6990 получился заметно выше, чем скорость Geforce GTX 590. Не говоря уже про режим фабричного разгона, в котором GTX 590 снова проиграла своему конкуренту ровно вдвое. Но это уже не удивляет, ведь платы Nvidia по пиковой математике отстают от решений AMD очень давно, и подобные сравнения всегда получаются не в их пользу. Новая модель GTX 590 немного уступила двум платам GTX 570, что в очередной раз показало правильность выбранного нами индикатора производительности GTX 590 в предыдущем материале.

Выводы по синтетическим тестам

По результатам тестирования можно сделать вывод о том, что новая видеокарта Geforce GTX 590, основанная на двух графических процессорах GF110 — одно из быстрейших решений на рынке на сегодня, хотя и немного уступающее своему главному конкуренту (Radeon HD 6990) в большинстве синтетических тестов. GTX 590 взяла верх лишь в тех задачах, производительность в которых ограничена скоростью обработки геометрии, тесселяции и выполнения геометрических шейдеров. Из главных недостатков новинки нужно отметить отставание представленной сегодня видеокарты в тестах текстурирования и пиковой математической производительности. Это объясняется как архитектурными отличиями, так и заниженными тактовыми частотами относительно одночиповых решений.

Если вы помните, в синтетической части тестов обзора Radeon HD 6990, который является прямым конкурентом нового решения Nvidia, в качестве индикатора производительности условного тогда «GTX 590» мы взяли пару Geforce GTX 570, работающих в режиме SLI, и затем сделали вывод о том, что решению такой мощности будет непросто выступать против вышедшей двухчиповой карты компании AMD.

Мы не ошиблись, ведь вышедшая сегодня реальная Geforce GTX 590 в синтетических тестах показала даже чуть меньшую скорость, чем две GTX 570. Даже несмотря на большее количество активных исполнительных блоков в GPU, так получилось из-за их банальной низкой тактовой частоты. Которая, в свою очередь, оказалась такой из-за жёсткого ограничения на энергопотребление топовых графических процессоров Nvidia, которое становилось иначе слишком высоким. Мы задаёмся резонным вопросом: а не лучше ли было сделать двухчиповую карту на базе двух GF114 с сильно повышенными частотами или хотя бы попробовать выжать из пары GF110 ещё 50 МГц, чтобы успешно конкурировать с аналогичной видеокартой AMD?

Но небольшое отставание совсем не значит, что Geforce GTX 590 плоха. Эта видеокарта по производительности является одним из двух лучших 3D-ускорителей, разница между которыми составляет 5—10% и может быть как со знаком плюс, так и со знаком минус, в зависимости от приложения. Поэтому выбор между GTX 590 и HD 6990 нужно осуществлять, глядя на результаты в интересующих вас играх, а также по другим пользовательским характеристикам, таким как шумность системы охлаждения, энергопотребление и т. п. Полезно будет обратить внимание и на реальную розничную цену. С другой стороны, подобные платы предназначены для энтузиастов, и цена их всегда будет высокой просто потому, что это единственные в своём роде видеокарты высочайшего уровня.

По результатам нашей синтетики можно попробовать прикинуть и примерную разницу в производительности в играх. Если GTX 590 опережает GTX 580 в среднем на 45—55%, то HD 6990 быстрее своего одночипового аналога уже на целых 70—80% (и речь о номинальном режиме, при фабричном разгоне будет ещё больше). То есть даже с учётом того, что GTX 580 в наших тестах показала себя явно быстрее, чем HD 6970, можно предположить отставание GTX 590 от HD 6990 в игровых тестах в среднем на 5—10%. Хотя будут встречаться и такие игровые приложения, в которых GTX 590 будет быстрее конкурента. Как раз в следующей части материала мы и проверим это предположение.




Блок питания для тестового стенда предоставлен компанией TAGAN

Корпус ThermalTake 8430 для тестового стенда предоставлен компанией 3Logic

Монитор Dell 3007WFP для тестовых стендов предоставлен компанией Nvidia