Nvidia Geforce GTX 560 Ti 448

описание видеокарты и результаты синтетических тестов




Содержание

В этой части, как обычно, мы изучим сами видеокарты, а также познакомимся с результатами синтетических тестов. В нашей лаборатории побывали две платы на базе GTX 560 Ti 448.

Платы

Zotac Geforce GTX 560 Ti 448 1280 МБ 320-битной GDDR5 PCI-E
  • GPU: Geforce GTX 570 (GF110)
  • Интерфейс: PCI Express x16
  • Частоты работы GPU (ROPs): 765 МГц (номинал — 732 МГц)
  • Частоты работы памяти (физическая (эффективная)): 1000 (4000) МГц (номинал — 950 (3800) МГц)
  • Ширина шины обмена с памятью: 320 бит
  • Число вычислительных блоков в GPU/частота работы блоков: 448/1530 МГц (номинал — 448/1464 МГц)
  • Число операций (ALU) в блоке: 1
  • Суммарное число операций (ALU): 448
  • Число блоков текстурирования: 56 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 40
  • Размеры: 250×100×35 мм (последняя величина — максимальная толщина видеокарты)
  • Цвет текстолита: черный
  • Энергопотребление (пиковое в 3D/в режиме 2D): 215/112 Вт
  • Выходные гнезда: 2×DVI (Dual-Link/HDMI), 1×HDMI, 1×DisplayPort
  • Поддержка многопроцессорной работы: SLI (Hardware)
Gigabyte Geforce GTX 560 Ti 448 1280 МБ 320-битной GDDR5 PCI-E
  • GPU: Geforce GTX 570 (GF110)
  • Интерфейс: PCI Express x16
  • Частоты работы GPU (ROPs): 732 МГц (номинал — 732 МГц)
  • Частоты работы памяти (физическая (эффективная)): 950 (3800) МГц (номинал — 950 (3800) МГц)
  • Ширина шины обмена с памятью: 320 бит
  • Число вычислительных блоков в GPU/частота работы блоков: 448/1464 МГц (номинал — 448/1464 МГц)
  • Число операций (ALU) в блоке: 1
  • Суммарное число операций (ALU): 448
  • Число блоков текстурирования: 56 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 40
  • Размеры: 270×100×36 мм (последняя величина — максимальная толщина видеокарты)
  • Цвет текстолита: синий
  • Энергопотребление (пиковое в 3D/в режиме 2D): 210/102 Вт
  • Выходные гнезда: 2×DVI (Dual-Link/HDMI), 1×HDMI, 1×DisplayPort
  • Поддержка многопроцессорной работы: SLI (Hardware)

Zotac Geforce GTX 560 Ti 448 1280 МБ 320-битной GDDR5 PCI-E
Карта имеет 1280 МБ памяти GDDR5 SDRAM, размещенной в 10 микросхемах на лицевой сторонe PCB.

Микросхемы памяти Samsung (GDDR5). Микросхемы расчитаны на максимальную частоту работы в 1250 (5000) МГц.
Gigabyte Geforce GTX 560 Ti 448 1280 МБ 320-битной GDDR5 PCI-E
Карта имеет 1280 МБ памяти GDDR5 SDRAM, размещенной в 10 микросхемах на лицевой сторонe PCB.

Микросхемы памяти Samsung (GDDR5). Микросхемы расчитаны на максимальную частоту работы в 1250 (5000) МГц.

Сравнение с эталонным дизайном, вид спереди
Zotac Geforce GTX 560 Ti 448 1280 МБ 320-битной GDDR5 PCI-E Reference card Nvidia Geforce GTX 570
Gigabyte Geforce GTX 560 Ti 448 1280 МБ 320-битной GDDR5 PCI-E Reference card Nvidia Geforce GTX 570

Сравнение с эталонным дизайном, вид сзади
Zotac Geforce GTX 560 Ti 448 1280 МБ 320-битной GDDR5 PCI-E Reference card Nvidia Geforce GTX 570
Gigabyte Geforce GTX 560 Ti 448 1280 МБ 320-битной GDDR5 PCI-E Reference card Nvidia Geforce GTX 570

Учитывая, что ускоритель GTX 560 Ti 448 произошел от GTX 570, логично было бы ждать идентичного дизайна PCB. Ведь по сути это та же самая карта, лишь некоторые блоки в ядре урезаны. Однако за время, прошедшее с момента выхода GTX 570, производители уже успели выпустить такие карты собственного дизайна. И правда, ведь зачем разводить шину в 384 бит на PCB, где будут использоваться всего 320 бит? Не секрет, что GTX 570 была создана на базе GTX 580 путем недокомплектации двумя микросхемами памяти — как следствие, шина сузилась с 384 до 320 бит, а объем памяти упал с 1536 до 1280 мегабайт.

Вполне логично предположить, что использовать полноценную PCB от GTX 580 — слишком дорого, поэтому производители выпустили платы своего собственного дизайна, где просто изначально разведена шина в 320 бит. Как видно на снимках выше, они все равно базируются в какой-то степени на GTX 580, даже прослеживаются технологические следы в печатной плате для монтажа 2 дополнительных микросхем памяти (чтобы в сумме было 12, как у GTX 580). Однако дизайн упрощен тем, что подводки к этим местам уже нет. Осталось добавить, что инженеры из Zotac добились уменьшения размеров печатной платы, и ускоритель стал более компактным. А что касается продукта Gigabyte, то если снять наклейку с лицевой стороны PCB, под ней будет маркировка GT-N570, выполненная краской — это явное подтверждение тому, что GTX 560 Ti 448 базируется на прежних GTX 570. Пока непонятно, брались ли готовые GTX 570, которые затем программно урезались до GTX 560 Ti 448, или же на PCB монтировались уже заранее аппаратно урезанные ядра. Я не фанат таких экспериментов, поэтому не стал искать BIOS от соответствующей платы GTX 570 для прошивки. Желающие сами могут проделать подобные манипуляции, я лишь скажу, что мы не несем ответственности за последствия.

Теперь про гнезда выводов. Если у кого из потребителей еще остались старые аналоговые мониторы или первые LCD только с подключением через d-Sub (VGA-гнездо трапецевидной формы), то видеокарты к ним можно подключить через специальные адаптеры-переходники DVI-to-d-Sub. К сожалению, такой возможностью обладает только одно гнездо DVI, поэтому два монитора с d-Sub подключить не удастся. Это уже становится традицией.

Также видим, что все карты имеют по одному гнезду HDMI (ускорители такого рода поддерживают полноценную передачу видео и звука на HDMI-приемник, поскольку обладают собственным звуковым кодеком). Ну и напоследок, также обе карты имеют по гнезду DisplayPort.

Максимальные разрешения и частоты:

  • 240 Гц — максимальная частота обновления
  • 2048×1536@85 Гц — по аналоговому интерфейсу
  • 2560×1600@60 Гц — по цифровому интерфейсу (для DVI-гнезд с Dual-Link/HDMI)

Что касается возможностей ускорения обработки видеопотоков Full HD и т. п. — в 2007 году мы проводили такое исследование, с ним можно ознакомиться здесь. За эти годы кое-какие изменения и новации случились, но они не настолько революционны, чтобы можно было считать вышеуказанный материал окончательно устаревшим. В ближайшем будущем мы обновим ту статью с учетом случившихся за прошедшие годы изменений.

Каждая карта требует дополнительного питания, причем двумя 6-контактными разъемами, так что обращайте внимание на переходники питания, которые должны быть в комплектах поставки серийных карт.

О системах охлаждения.

Zotac Geforce GTX 560 Ti 448 1280 МБ 320-битной GDDR5 PCI-E
Система охлаждения состоит из массивной металлической рамы, которая сама служит радиатором для микросхем памяти, и к которой крепятся большой радиатор с медной подошвой, усиленный тепловыми трубками, и кожух, несущий вентилятор приличных размеров.

Учитывая, что по энергопотреблению и тепловыделению новый ускоритель лишь чуть уступает GTX 570, логично предположить, что нагреваться он будет прилично. И наверное, ему уже маловато традиционного кулера с тепловыми трубками: мы помним, что в этой серии Nvidia стала применять устройства с испарительными камерами, которые показали себя намного более эффективными.

Но в данном случае явно наблюдается небольшой дефицит эффективности охлаждения, о чем свидетельствует некоторый шум вентилятора, повышающего свои обороты до 60% от максимума.
Gigabyte Geforce GTX 560 Ti 448 1280 МБ 320-битной GDDR5 PCI-E
Устройство состоит из двух частей: главного радиатора и кожуха.

Главный радиатор базируется на испарительной камере и тепловых трубках. Данный вариант кулера является очень эффективным, испарительная камера покрывает собой как ядро, так и микросхемы памяти, а тепловые трубки помогают распределить тепло равномерно по радиатору.

А сверху все это покрывает кожух аж с тремя вентиляторами! При этом умная система регулирует частоту вращения каждого вентилятора по отдельности! Можно заметить, что при малой нагрузке третий (хвостовой) вентилятор почти не вертится. Все три вентилятора очень качественно выполнены, в работе они практически не повышают число оборотов (и всегда крутятся примерно на 46% от максимума), при этом шума от карты не было. Данная СО достойна всяческих похвал.

Мы провели исследование температурного режима с помощью утилиты MSI Afterburner (автор А. Николайчук AKA Unwinder) и получили следующие результаты:

Zotac Geforce GTX 560 Ti 448 1280 МБ 320-битной GDDR5 PCI-E
Gigabyte Geforce GTX 560 Ti 448 1280 МБ 320-битной GDDR5 PCI-E

Мы видим прекрасный результат для карты Gigabyte: 63 градуса ядра после 8-часовой работы под нагрузкой! А вот продукт Zotac продемонстрировал нагрев по ядру до 86 градусов. В принципе, это не критично для такого рода ускорителей. Хотя и высоковато.

Базовый комплект поставки карт должен включать в себя руководство пользователя, диск с драйверами и утилитами. Видеокарта Gigabyte прибыла к нам без упаковки и комплекта, потому по ней данный вопрос мы опускаем.

Zotac Geforce GTX 560 Ti 448 1280 МБ 320-битной GDDR5 PCI-E
Базовый комплект, плюс разветвители питания и адаптер DVI-to-VGA.
Gigabyte Geforce GTX 560 Ti 448 1280 МБ 320-битной GDDR5 PCI-E
-
-

Упаковка.

Zotac Geforce GTX 560 Ti 448 1280 МБ 320-битной GDDR5 PCI-E
По сравнению с ранее виденными нами ускорителями уровня Hi-End, упаковка в данном случае упрощена: размеры уменьшились, да и внутри бокса карта теперь лежит просто в картонных распорках, а не в отсеке из пенополиуретана.

Все надписи на коробке четкие, отражают все нужные характеристики ускорителя.
Gigabyte Geforce GTX 560 Ti 448 1280 МБ 320-битной GDDR5 PCI-E
-

-
-

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютер на базе Intel Core i7-975 (Socket 1366)
    • процессор Intel Core i7-975 (3340 МГц);
    • системная плата Asus P6T Deluxe на чипсете Intel X58;
    • оперативная память 6 ГБ DDR3 SDRAM Corsair 1600 МГц;
    • жесткий диск WD Caviar SE WD1600JD 160 ГБ SATA;
    • блок питания Tagan TG900-BZ 900 Вт.
  • операционная система Windows 7 64-битная; DirectX 11;
  • монитор Dell 3007WFP (30″);
  • драйверы AMD версии Catalyst 11.11; Nvidia версии 290.36

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

  • D3D RightMark Beta 4 (1050) с описанием — на сайте 3d.rightmark.org.
  • D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 (тесты пиксельных шейдеров версий 2.0 и 3.0) — здесь.
  • RightMark3D 2.0 с кратким описанием — под Vista без SP1, под Vista c SP1.

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

Синтетические тесты проводились на следующих видеокартах:

  • Geforce GTX 560 Ti 448 Cores со стандартными параметрами (далее GTX 560 Ti 448)
  • Geforce GTX 570 со стандартными параметрами (далее GTX 570)
  • Geforce GTX 560 Ti со стандартными параметрами (далее GTX 560 Ti)
  • Radeon HD 6950 со стандартными параметрами (далее HD 6950)
  • Radeon HD 6870 со стандартными параметрами (далее HD 6870)

Для сравнения результатов новой модели Geforce GTX 560 Ti 448 Cores мы выбрали эти видеокарты по следующим причинам: Radeon HD 6950 и Radeon HD 6870 являются наиболее близкими по цене решениями от единственного конкурента, Geforce GTX 570 — видеокарта на почти таком же графическом процессоре от Nvidia, а GTX 560 Ti — близкое по названию и по некоторым характеристикам решение текущего поколения, основанное на менее мощном чипе GF114.

Данное сравнение производительности в синтетических тестах могло бы получиться не слишком интересным, если бы не возможность для каждого из них выяснить — во что конкретно упирается производительность теста? Ведь GTX 570 сильнее представленной модели по математике и текстурированию, но решения равны по ПСП и филлрейту, а обычная GTX 560 Ti уступает новой GTX 560 Ti 448 Cores по вычислениям, ПСП и филлрейту, но значительно мощнее по возможностям текстурных блоков.

Direct3D 9: тесты Pixel Filling

В тесте определяется пиковая производительность выборки текстур (texel rate) в режиме FFP для разного числа текстур, накладываемых на один пиксель:

В этом тесте видеокарты традиционно показывают цифры, далёкие от теоретически возможных значений, и мы их перепроверяем ещё и в тесте из пакета 3DMark Vantage. Результаты же нашей синтетики для GTX 560 Ti 448 значительно ниже пиковых значений. Получается, что новая видеокарта выбирает лишь до 38 текселей за один такт из 32-битных текстур при билинейной фильтрации в этом тесте, и это значительно ниже теоретической цифры в 56 текселя.

Обе конкурирующие видеокарты от компании AMD продолжают с большим запасом обходить и новое решение Nvidia, особенно в режимах с большим количеством накладываемых на пиксель текстур. Интересно, что несмотря на теоретическую разницу в скорости текстурирования, GTX 560 Ti и GTX 560 Ti 448 весьма близки по скорости. В случаях с небольшим количеством текстур, ограничение по ПСП сказывается сильнее, и все видеокарты там показывают близкие результаты. Посмотрим эти же цифры в тесте филлрейта:

Во втором синтетическом тесте, который показывает скорость заполнения, видно всё то же самое, но уже с учетом количества записанных в буфер кадра пикселей. Снова хорошо видно, что скорость рендеринга у многих решений в простых условиях серьёзно ограничена ПСП.

Максимальный результат снова за решениями AMD, имеющими значительно большее количество TMU и более эффективными по достижению высокого КПД в нашем синтетическом тесте. HD 6950 показывает максимальный результат, значительно превышающий цифры всех видеоплат от Nvidia, включая GTX 560 Ti 448. Интересно, что в случаях с 0-4 накладываемыми текстурами, рассматриваемое сегодня решение находится между GTX 560 Ti и GTX 570, но ближе к первой, хотя ПСП у неё как у второй.

Direct3D 9: тесты Pixel Shaders

Первая группа пиксельных шейдеров, которую мы рассматриваем, очень проста для современных видеочипов, она включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся в старых играх.

Мы не раз писали, что тесты пиксельных шейдеров младших версий весьма и весьма просты для современных GPU и они не могут показать возможности современных видеочипов. В этих тестах производительность ограничена в основном скоростью текстурных модулей, с учётом эффективности блоков и кэширования текстурных данных в реальных задачах, но иногда прослеживается ещё и влияние ПСП видеопамяти.

В самых простых шейдерах разница между всеми видеокартами Nvidia несущественна, а вот в двух сравнительно сложных тестах освещения, GTX 560 Ti 448 явно держится ближе к GTX 570. То есть, в этих задачах скорость ограничивает именно математическая производительность. Немудрено, что решения AMD выступили тут сильнее конкурентов. Хотя GTX 560 Ti 448 почти не отстала от Radeon HD 6870.

Посмотрим на результаты более сложных пиксельных программ промежуточных версий:

Результаты этих двух тестов получились гораздо более любопытными. В весьма сильно зависящем от скорости текстурирования тесте процедурной визуализации воды «Water» используется зависимая выборка из текстур больших уровней вложенности, и поэтому карты в нём обычно располагаются по скорости текстурирования. Поэтому в этом тесте GTX 560 Ti 448 показывает предполагаемый по теории результат, проигрывая и GTX 570 и GTX 560 Ti. Да и обоим решениям AMD в первом тесте она явно уступает, и всё это из-за низкой скорости текстурирования.

Результаты второго теста серьёзно отличаются от первого, в нём оригинальная GTX 560 Ti уже уступает остальным решениям. Тест более интенсивен вычислительно, и в нём явно сказывается влияние математической производительности. Поэтому GTX 560 Ti 448 держится между GTX 570 и GTX 560 Ti, причём ближе к более мощному решению. Понятно, что такой тест лучше подходит для видеокарт AMD, обладающих большим количеством блоков ALU, поэтому оба Radeon оказались впереди.

Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье Современная терминология 3D графики.
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

Существует два варианта этих шейдеров: с ориентацией на математические вычисления, и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это универсальные тесты, зависящие и от скорости блоков ALU и от скорости текстурирования, в них важен баланс чипа, но в данном варианте основная именно математическая производительность. Скорость видеокарт в тесте «Frozen Glass» схожа с той, что мы видели выше в «Cook-Torrance», и новая GTX 560 Ti 448 снова расположилась между GTX 570, имеющей такой же графический процессор GF110, и GTX 560 Ti. Ну а обе видеокарты от AMD прогнозируемо оказались где-то далеко впереди.

Во втором тесте «Parallax Mapping» результаты также похожи на предыдущие, но в этот раз видеоплаты Radeon ушли вперёд уже не настолько далеко. Новая видеокарта на основе чипа GF110 опережает GTX 560 Ti, но отстаёт от GTX 570 и в этом тесте, но теперь она явно ближе к сильнейшей видеокарте Nvidia. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:

В этом случае все видеокарты Nvidia стали ещё больше уступать и Radeon HD 6870 и HD 6950, имеющими больше текстурных модулей. А вот новая модель GTX 560 Ti 448 в тесте Frozen Glass, больше зависящем от производительности TMU, теперь отстаёт от всех, так как имеет самую низкую текстурную производительность. А во втором тесте результаты GTX 560 Ti 448 близки к скорости обычной GTX 560 Ti, что также говорит о влиянии скорости текстурирования.

Но всё это были устаревшие задачи, в основном с упором в текстурирование или филлрейт, не особенно сложные. Далее мы рассмотрим результаты ещё двух тестов пиксельных шейдеров — версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9 API, которые намного показательнее с точки зрения современных игр на ПК. Эти тесты отличаются тем, что сильнее нагружают и ALU, и текстурные модули, обе шейдерные программы сложные и длинные, включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье Современная терминология 3D-графики.
  • Fur — процедурный шейдер, визуализирующий мех.

А вот в тестах пиксельных шейдеров версии 3.0 у всех решений Nvidia всё намного лучше, чем в предыдущих. Оба PS 3.0 теста довольно сложные, они почти не зависят от ПСП и текстурирования, и являются в основном математическими, но с большим количеством переходов и ветвлений, с которыми отлично справляется архитектура Nvidia, а графические процессоры AMD в данном случае заметно уступают.

Итак, в наиболее сложных Direct3D 9 тестах новинка GTX 560 Ti 448 показывает результат почти на уровне GTX 570, и заметно выше чем у соперников в лице Radeon HD 6870 и HD 6950. Интересно, что продвинутого параллакс маппинга оригинальная Geforce GTX 560 Ti уступает видеокартам на базе GF110 довольно сильно, и «виноватой» в этом может быть нехватка ПСП и меньшая эффективность GF114 по сравнению с GF110. А вот у модели «ограниченной серии» GTX 560 Ti 448 Cores результат получился очень неплохой. И, похоже, что в DirectX 11 играх она будет куда ближе к GTX 570, чем к GTX 560 Ti.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два знакомых PS 3.0 теста под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами, при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40-80, включение «шейдерного» суперсэмплинга — до 60-120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в этом тесте зависит совсем не от количества и эффективности блоков TMU, а скорее от филлрейта, что отлично видно по близким цифрам в парах Geforce GTX 570 с GTX 560 Ti 448 и Radeon HD 6870 с HD 6950. Результаты в подтесте «High» получаются примерно в полтора раза ниже, чем в «Low», как и должно быть по теории. В Direct3D 10 тестах процедурной визуализации меха с большим количеством текстурных выборок решения Nvidia всегда были сильнее, и в нашем случае результат получился закономерным.

Новая модель видеокарты от Nvidia совсем чуть-чуть отстаёт от своей старшей сестры Geforce GTX 570, которая и стала лидером теста. А вот обычная GTX 560 Ti далеко позади, что снова говорит о сильном влиянии филлрейта, а возможно и ПСП. Обе платы Radeon опередили только GTX 560 Ti, а новинке Nvidia уступили.

Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза, возможно в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

Включение суперсэмплинга теоретически увеличивает нагрузку в четыре раза, и в таком случае все решения Nvidia сдают позиции, а вот обе видеокарты AMD выглядят сильнее. И теперь оба Radeon немного выигрывают даже у GTX 570, и HD 6870 почему-то опережает HD 6950. Похоже, что производительность ограничивается именно производительностью блоков ROP, которая у HD 6870 выше. Именно поэтому и новая GTX 560 Ti 448 всё так же близка к GTX 570, и обгоняет GTX 560 Ti, что соответствует теоретическим показателям.

Второй тест, измеряющий производительность выполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок, называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением, число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше, по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Этот тест интереснее с практической точки зрения, так как разновидности parallax mapping давно применяются в играх, а тяжелые варианты, вроде нашего steep parallax mapping используются во многих проектах, начиная с уже далеко не новых игр Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип примерно в два раза, такой режим называется «High».

Эта диаграмма очень похожа на предыдущую (без SSAA), а результаты близки даже по абсолютным цифрам. В обновленном D3D10 варианте теста без суперсэмплинга, новая модель GTX 560 Ti 448 Cores справляется с задачей почти так же быстро, как и родственная ей GTX 570 на том же чипе GF110. Заметно более слабая GTX 560 Ti, основанная на GF114, проиграла всем, и отстаёт даже от карт AMD. Посмотрим, что изменит включение суперсэмплинга, он снова должен вызвать большее падение скорости на картах Nvidia.

При включении суперсэмплинга и самозатенения задача становится заметно тяжёлее, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая большое падение производительности. Разница между скоростными показателями нескольких видеокарт изменилась, включение суперсэмплинга сказывается как и в предыдущем случае — карты производства AMD явно улучшили свои показатели относительно решения Nvidia.

И вот теперь видеоплаты Radeon даже чуть-чуть выигрывают у новинки при низкой детализации, и весьма близки к GTX 560 Ti 448 в более сложных условиях. GTX 560 Ti традиционно сильно отстала, имея значительно меньшие филлрейт и ПСП. А вот новое решение Nvidia можно сравнивать скорее с GTX 570, и это — очень хороший результат.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Первый из чисто математических тестов подтверждают, что графический процессор в GTX 560 Ti 448 имеет вычислительные возможности примерно посередине между GTX 560 Ti на базе чипа GF114 и GTX 570 на основе GF110. Что полностью соответствует теоретической разнице в сравнительной производительности блоков ALU. Да и остальные решения расположились примерно соответственно теоретическим показателям.

Видеокарты AMD в этом синтетическом тесте всегда быстрее, так как в вычислительно сложных задачах современная архитектура AMD имеет большое преимущество перед конкурирующими видеокартами Nvidia. В этот раз разрыв между картами Nvidia и AMD хоть и уменьшился, но всё же остаётся довольно большим. GTX 560 Ti уступает им где-то на 30%, что уже лучше, чем было ранее.

В наших прошлых исследованиях мы отметили, что данный тест не полностью зависит от скорости ALU, а самые производительные решения ограничиваются скоростью видеопамяти. Так что рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он ещё тяжелее для ALU, и текстурная выборка в нём только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Но нет, изменений в результатах немного, разве что Radeon HD 6950 вырвался ещё дальше вперёд, как и должно быть по теории. Во втором тесте скорость рендеринга уже ограничена исключительно производительностью шейдерных блоков, и вот тут GTX 560 Ti 448 Cores похвалить не получится — разница между этой моделью и GTX 560 Ti стала совсем незначительной. А GTX 570 обходит их процентов на 10. Поэтому новая видеокарта ограниченного выпуска не смогла догнать конкурентов от компании AMD в наших математических тестах. У Radeon есть явное преимущество, объясняемое большим количеством блоков ALU.

Direct3D 10: тесты геометрических шейдеров

Переходим к результатам тестирования геометрических шейдеров, они нам будут интересны потому, что основным ограничителем производительности в них должна являться скорость обработки геометрии, и будет очень интересно сравнить решения Nvidia, основанные на разных чипах: GF110 и GF114.

В нашем тестовом пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих DirectX 10 играх.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаковое у всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS составляет чуть менее двух раз. Задача для современных видеокарт не слишком сложная, а производительность в целом ограничена не только скоростью обработки геометрии, но и пропускной способностью памяти.

И вот тут очень хорошо видна разница между решениями на базе чипа GF110 и видеокартой, имеющей в основе графический процессор GF114. Geforce GTX 560 Ti 448 Cores показала результат близкий к уровню старшей сестры GTX 570, основанной на таком же графическом процессоре. Эта пара во всех режимах с запасом обогнала остальные видеокарты, показавшие весьма близкие результаты: GTX 560 Ti и обе платы от AMD. Вот и проявилась разница в количестве блоков обработки геометрии.

Видеокарты AMD показали неплохой результат из-за проведённых оптимизаций геометрических блоков, что приблизило скорость выполнения ими геометрических шейдеров к производительности хотя бы GF114. Но с GF110 конкурировать они не могут. Посмотрим, изменится ли ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте, цифры для всех решений Nvidia практически не изменились, а вот Radeon HD 6950 немного подтянула результаты. Все платы от Nvidia в этом тесте вовсе не замечают изменения параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, и показывают аналогичные предыдущей диаграмме результаты. Поэтому и изменений по выводам нет — GTX 560 Ti 448 Cores весьма близка к GTX 570. Посмотрим, что изменится в следующем тесте, который предполагает большую нагрузку именно на геометрические шейдеры.

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленном в «Heavy» — ещё и для их отрисовки. То есть, в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер. Сначала рассматриваем лёгкий режим:

Относительные результаты в разных режимах снова соответствуют нагрузке: во всех случаях производительность неплохо масштабируется, и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть почти в два раза медленнее.

В этом тесте при сбалансированной загрузке скорость рендеринга для всех решений уже менее явно ограничена именно геометрической производительностью. И Geforce GTX 560 Ti с обеими Radeon в этот раз уже меньше отстаёт от пары GTX 570 и представленной новинки GTX 560 Ti 448 Cores, причём с ростом сложности геометрии отставание становится всё меньше. И всё же, несмотря на упор в ПСП, новая модель вместе с GTX 570 остаются лидерами теста.

Цифры должны измениться на следующей диаграмме, в тесте с более активным использованием геометрических шейдеров. Также будет интересно сравнить друг с другом результаты, полученные в «Balanced» и «Heavy» режимах.

А вот в этом тесте разница между GF110 и GF114, да и графическими процессорами от конкурента, снова становится весьма заметной. По скорости исполнения геометрических шейдеров GTX 570 и новая GTX 560 Ti 448 Cores далеко впереди остальных — явно сказывается наличие четырёх растеризаторов в GF110, в отличие от двух у GF114 и удвоенной скорости обработки одного блока у конкурирующих решений. На диаграмме хорошо видно, что возможности GTX 570 и GTX 569 Ti 448 по обработке геометрии и скорости исполнения геометрических шейдеров почти вдвое выше, чем у GTX 560 Ti.

То же самое касается и сравнения с видеокартами от AMD. Новое решение компании Nvidia в этом тесте почти вдвое быстрее, чем Radeon HD 6870 и HD 6950. И всё из-за количества блоков растеризации и геометрии. То есть, у GTX 560 Ti 448 Cores весьма высокая скорость растеризации и обработки геометрии, что является конкурентным преимуществом по сравнению и с прямыми соперниками и с Geforce GTX 560 Ti. Да и в тестах тесселяции, которая уже применяется в играх, скорость будет ограничена уже тесселяторами, и в таких случаях новая плата будет показывать ещё более сильный результат, по сравнению с конкурентами от компании AMD.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи по сути и соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Предыдущие исследования показали, что на результаты этого теста влияет и скорость текстурирования и пропускная способность памяти. Хотя разница между всеми решениями не слишком большая, они расположились почти по линейке: GTX 570 с GTX 560 Ti 448, затем GTX 560 Ti, и после этого оба Radeon.

Новая GTX 560 Ti 448 Cores уверенно обгоняет обоих конкурентов от компании AMD в среднем и сложном режиме, а в лёгком близка к Radeon HD 6950. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Взаимное расположение карт на диаграмме изменилось. Теперь в самом лёгком режиме во что-то неведомое упираются все видеокарты на чипах Nvidia, и поэтому лидером в нём становится Radeon HD 6950. А вот в тяжёлом режиме GTX 560 Ti 448 Cores почти догнала GTX 570 и значительно быстрее конкурентов в виде HD 6870 и HD 6950. А вот разница между GTX 560 Ti 448 и GTX 560 Ti совсем невелика.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты в тесте «Waves» ещё более странные и не похожи на те, что мы видели на предыдущих диаграммах. В этой задаче при разных условиях мы видим уже практическое равенство всех решений, кроме GTX 560 Ti на базе GF114. Все остальные идут ноздря в ноздрю, и рассматриваемая сегодня модель GTX 560 Ti 448 в этом тесте показывает производительность на уровне Geforce GTX 570. Рассмотрим второй вариант этого же теста:

Изменений с ростом сложности условий и в этом тесте очень немного — все решения остались примерно на тех же позициях. Разве что можно отметить, что видеокарты Radeon с ростом сложности теряют больше, чем Nvidia. И поэтому в сложном режиме отстают от всех, хотя в лёгком не уступают даже GTX 570. Новая видеокарта GTX 560 Ti 448 опережает обе платы Radeon в тяжёлом и среднем режимах, всё так же немного отставая в простых условиях.

3DMark Vantage: Feature тесты

Синтетические тесты из пакета 3DMark Vantage хоть уже и не новые, но они обладают поддержкой D3D10 и интересны уже тем, что отличаются от наших. При анализе результатов нового решения Nvidia в этом пакете мы сможем сделать какие-то новые и полезные выводы, ускользнувшие от нас в тестах семейства RightMark. Особенно это касается теста скорости TMU, ведь наш аналог показывает странные результаты.

Feature Test 1: Texture Fill

Первый тест — тест скорости текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

В тесте текстурной производительности из пакета 3DMark Vantage, результаты получаются совершенно иные, чем в нашем RightMark. Эти цифры и больше похожи на реальное положение и ближе к теоретическим. В текстурной синтетике из 3DMark карты Nvidia используют имеющиеся текстурные блоки эффективнее, и GTX 560 Ti 448 показывает теоретически обоснованный результат, оставаясь в самом низу сравнения. Ведь использование чипа GF110 принесло не только достоинства, но и недостаток в виде сравнительно низкой производительности текстурирования из-за меньшего количества блоков TMU.

Вполне понятно, что обеим Radeon новая модель Nvidia уступила, а HD 6950 так и вовсе чуть ли не вдвое быстрее по текстурированию, так как обладает большим количеством блоков TMU. Что касается сравнения с видеокартами от Nvidia, то и тут всё по теории — GTX 560 Ti 448 несколько медленнее обычной GTX 560 Ti, а посередине расположилась GTX 570, в полном соответствии с теорией. Поэтому в играх, где скорость сильно зависит от текстурирования, у представленной модели могут быть небольшие проблемы.

Feature Test 2: Color Fill

Тест скорости заполнения. Используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Показатели производительности в данном тесте соответствуют теоретическим цифрам филлрейта (производительности блоков ROP), без учёта влияния ПСП видеопамяти. Они совсем не похожи на наши потому, что у нас используется целочисленный буфер с 8-бит на компоненту и скорость упирается во что-то неведомое, а в тесте 3DMark Vantage буфер имеет 16-битный формат с плавающей запятой. Цифры 3DMark Vantage показывают именно производительность блоков ROP, а не величину пропускной способности памяти.

Результаты теста примерно соответствуют теоретическим цифрам, и больше всего зависят от количества блоков ROP и их частоты, а влияние ПСП весьма небольшое. Модель ограниченного выпуска GTX 560 Ti 448 Cores показывает очень неплохой результат на уровне Geforce GTX 570 (даже чуть выше, но это погрешность измерений), как и должно быть, ведь количество и частота блоков ROP у них идентичная.

По филлрейту новая плата Nvidia почти догоняет даже старшую из плат конкурента от компании AMD, имеющего такую же теоретическую скорость заполнения, но чуть лучшую эффективность. А Radeon HD 6870 новая плата и вовсе обогнала. Geforce GTX 560 Ti отстаёт от всех решений, являясь слабейшей видеокартой сравнения.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature тестов, так как подобная техника уже используется в играх. В нём рисуется один четырехугольник (точнее, два треугольника), с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоёмкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжёлого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчёты освещения по Strauss.

Тест отличается от других подобных тем, что результаты в нём зависят не исключительно от скорости математических вычислений или эффективности исполнения ветвлений или скорости текстурных выборок, а от всего понемногу. И для достижения высокой скорости важен удачный баланс блоков GPU и ПСП видеопамяти. Заметно влияет на скорость и эффективность выполнения ветвлений в шейдерах.

Именно из-за сравнительно низкой эффективности Geforce GTX 560 Ti и Radeon HD 6870 в этом тесте показывают не очень высокие результаты, первая так и вообще вновь стала самой медленной картой, сильно отстав от быстрейшей HD 6950. А вот новая модель видеоплаты на чипе GF110 не дотягивается до старшей сестры GTX 570 совсем немного, уступая лишь сильнейшей из представленных плат компании AMD.

Feature Test 4: GPU Cloth

Тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Похоже, что на скорость рендеринга в этом тесте также влияет сразу несколько различных параметров. Вероятнее всего, общая скорость зависит от производительности обработки геометрии и эффективности исполнения геометрических шейдеров. Но наибольшее влияние оказывает степень оптимизации драйверов, их эффективность. Именно поэтому мы видим, что Geforce GTX 560 Ti 448 Cores единственный раз стала быстрейшей, что не объяснить никакой теорией, кроме применения обновленных драйверов с лучшей оптимизацией.

Но даже если бы её и не было, в этом тесте даже GTX 560 Ti работает отлично, значительно опережая обе видеокарты от конкурирующей компании AMD. Не говоря уже о решениях на основе топового чипа GF110, которые заметно быстрее и показывают гораздо более высокие результаты при выполнении сложных шейдеров. Любые видеокарты Radeon в этом тесте пасуют перед платами калифорнийцев.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчётами, также тестируется stream out.

Результаты этого теста очень похожи на те, что мы видели на прошлой диаграмме, кроме неожиданно вырвавшегося вперёд GTX 560 Ti 448 Cores. Как раз в этом тесте всё точно соответствует теории, и GTX 560 Ti 448 расположилась чуть позади быстрейшей GTX 570. И обе они оказались значительно быстрее и GTX 560 Ti, основанной на другом чипе и тут явно сказывается заметно большее количество блоков обработки геометрии.

Не говоря уже о видеокартах AMD Radeon, которые остались далеко позади, отстав от новой платы Nvidia почти вдвое. В целом, в синтетических тестах имитации тканей и частиц этого тестового пакета, в которых используются геометрические шейдеры, новое решение показало просто отличный результат, заметно опередив конкурирующие графические процессоры компании AMD и почти догнав младшее топовое решение на основе чипа GF110.

Feature Test 6: Perlin Noise

Последний feature тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто используемый в процедурном текстурировании, он использует очень много математических расчётов.

Этот тест из пакета 3DMark Vantage измеряет пиковую математическую производительность видеочипов в предельной задаче. Показанная в нём скорость всех решений примерно соответствует тому, что должно получаться по теории и что мы видели ранее в наших математических тестах из пакета RightMark 2.0.

И конечно же, видеокарты AMD выигрывают у всех плат Nvidia и в этот раз. Простая, но интенсивная математика выполняется на видеокартах Radeon значительно быстрее, в чём мы уже не раз убеждались. Хотя в других вычислительных тестах с более сложными программами, такими как физические расчёты, решения Nvidia выглядят вполне неплохо, но не в подобных задачах.

В этом же математическом тесте, Geforce GTX 560 Ti 448 Cores, основанная на чипе GF110, показывает скорость лишь чуть-чуть ниже, чем GTX 570, хотя теоретически разница должна быть чуть больше, чем получилось у нас. В остальном — ничего нового, представленная модель быстрее, чем GTX 560 Ti, но отстала от обеих видеокарт Radeon, хотя уже совсем не так драматично, как это было ранее.

Выводы по синтетическим тестам

По результатам проведённых нами синтетических тестов новой модели ограниченного выпуска Nvidia Geforce GTX 560 Ti 448 Cores, основанной на графическом процессоре GF110, а также результатам других моделей видеокарт от обоих производителей видеочипов, можно сделать вывод о том, что Nvidia представила весьма интересную модель, которая в большинстве синтетических тестов была гораздо ближе к топовой Geforce GTX 570, а не оригинальной GTX 560 Ti.

Новая модель основана на известном чипе GF110, который имеет несколько преимуществ перед GF114. Во-первых, в этом чипе физически большее количество таких исполнительных блоков, как ALU и ROP, а также блоков геометрической обработки. Поэтому в вычислительных задачах и играх, упирающихся в филлрейт и скорость обработки геометрии (а некоторые игры уже используют тесселяцию), эта плата будет иметь явное преимущество. Это должно быть особенно хорошо заметно в таких современных играх, как Battlefield 3. Во-вторых, GTX 560 Ti 448 Cores имеет 320-битную шину памяти с большей пропускной способностью, по сравнению с 256-битной у GTX 560 Ti. А игр, ограниченных ПСП, чуть ли не большинство, и недостаточная ПСП очень часто ограничивает производительность GTX 560 Ti.

Но есть у применённого Nvidia подхода и недостатки. Не говоря о несколько большем потреблении энергии чипом GF110, можно отметить меньшую скорость текстурных выборок, так как GF110 имеет меньше текстурных модулей, чем GF114. И по этому параметру «обычная» Geforce GTX 560 Ti значительно опережает даже GTX 570, не говоря уже о GTX 560 Ti 448, имеющей ещё меньше блоков TMU. И этот недостаток вполне может сказаться в случае игр с активным текстурированием.

Предполагаем, что очень неплохие результаты Geforce GTX 560 Ti 448 в нашей «синтетической» части подтвердятся и такими же позитивными результатами и в следующей части нашего материла, посвящённой тестированию в игровых приложениях. Новая плата от компании Nvidia должна показать результаты между Geforce GTX 570 и GTX 560 Ti. Причём, если в устаревших играх она может быть ближе к GTX 560 Ti, то в современных DirectX 11 приложениях должна нагонять Geforce GTX 570.

То же самое и по сравнению с конкурентами — можно предположить, что GTX 560 Ti 448 Cores чаще будет подбираться к Radeon HD 6950, опережая HD 6870. Хотя тут сравнивать сложнее, в каких-то играх новая плата Nvidia может быть быстрее обоих конкурентов, а в других может уступить даже двум платам сразу. Ведь в играх ситуация всегда сложнее, и скорость рендеринга часто зависит сразу от нескольких характеристик, в том числе от филлрейта и текстурирования, которыми сильны платы производства AMD.




Блок питания для тестового стенда предоставлен компанией Tagan

Корпус ThermalTake 8430 для тестового стенда предоставлен компанией 3Logic

Монитор Dell 3007WFP для тестовых стендов предоставлен компанией Nvidia




Дополнительно

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.