Nvidia Geforce GTX 660 Ti:

описание видеокарт и результаты синтетических тестов


Содержание

В этой части мы изучим видеокарты, а также познакомимся с результатами синтетических тестов. В нашей лаборатории побывали 2 карты разных производителей.

Платы

Palit Geforce GTX 660 Ti JetStream 2048 МБ 192-битной GDDR5 PCI-E
  • GPU: Geforce GTX 660 Ti (GK104)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs): 1008—1100 МГц (номинал — 915—980 МГц)
  • Частота работы памяти (физическая (эффективная)): 1525 (6100) МГц (номинал — 1500 (6000) МГц)
  • Ширина шины обмена с памятью: 192 бит
  • Число вычислительных блоков в GPU/частота работы блоков: 7/1008—1100 МГц (номинал — 7/915—1030 МГц)
  • Число операций (ALU) в блоке: 192
  • Суммарное число операций (ALU): 1344
  • Число блоков текстурирования: 112 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 24
  • Размеры: 240×100×45 мм (последняя величина — максимальная толщина видеокарты)
  • Цвет текстолита: черный
  • Энергопотребление (пиковое в 3D/в режиме 2D/в режиме «сна»): 161/59/44 Вт
  • Выходные гнезда: 2×DVI (Dual-Link/VGA), 1×HDMI 1.4a, 1×DisplayPort 1.2
  • Поддержка многопроцессорной работы: SLI (Hardware)
Zotac Geforce GTX 660 Ti AMP! Edition 2048 МБ 192-битной GDDR5 PCI-E
  • GPU: Geforce GTX 660 Ti (GK104)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs): 1032—1130 МГц (номинал — 915—980 МГц)
  • Частота работы памяти (физическая (эффективная)): 1650 (6600) МГц (номинал — 1500 (6000) МГц)
  • Ширина шины обмена с памятью: 192 бит
  • Число вычислительных блоков в GPU/частота работы блоков: 7/1008—1100 МГц (номинал — 7/915—1030 МГц)
  • Число операций (ALU) в блоке: 192
  • Суммарное число операций (ALU): 1344
  • Число блоков текстурирования: 112 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 24
  • Размеры: 195×100×34 мм (последняя величина — максимальная толщина видеокарты)
  • Цвет текстолита: черный
  • Энергопотребление (пиковое в 3D/в режиме 2D/в режиме «сна»): 163/58/45 Вт
  • Выходные гнезда: 2×DVI (Dual-Link/VGA), 1×HDMI 1.4a, 1×DisplayPort 1.2
  • Поддержка многопроцессорной работы: SLI (Hardware)

Palit Geforce GTX 660 Ti JetStream 2048 МБ 192-битной GDDR5 PCI-E
Карта имеет 2048 МБ памяти GDDR5 SDRAM, размещенной в 8 микросхемах (6 на лицевой и 2 на оборотной сторонах PCB).

Микросхемы памяти Hynix (GDDR5). Микросхемы рассчитаны на максимальную частоту работы в 1500 (6000) МГц.
Zotac Geforce GTX 660 Ti AMP! Edition 2048 МБ 192-битной GDDR5 PCI-E
Карта имеет 2048 МБ памяти GDDR5 SDRAM, размещенной в 8 микросхемах (6 на лицевой и 2 на оборотной сторонах PCB).

Микросхемы памяти Hynix (GDDR5). Микросхемы рассчитаны на максимальную частоту работы в 1500 (6000) МГц.

Сравнение с эталонным дизайном, вид спереди
Palit Geforce GTX 660 Ti JetStream 2048 МБ 192-битной GDDR5 PCI-E Reference card Nvidia Geforce GTX 670
Zotac Geforce GTX 660 Ti AMP! Edition 2048 МБ 192-битной GDDR5 PCI-E Reference card Nvidia Geforce GTX 670

Сравнение с эталонным дизайном, вид сзади
Palit Geforce GTX 660 Ti JetStream 2048 МБ 192-битной GDDR5 PCI-E Reference card Nvidia Geforce GTX 670
Zotac Geforce GTX 660 Ti AMP! Edition 2048 МБ 192-битной GDDR5 PCI-E Reference card Nvidia Geforce GTX 670

Что можно сказать? На первый взгляд, дизайн обеих карт (а они по сути одинаковые) очень схож с эталонным для GTX 670: такая же маленькая PCB, те же 8 посадочных мест под микросхемы на лицевой стороне. Однако если посмотреть на оборотную сторону, то увидим, что там посадочных мест только 4, а не 8, как у GTX 670. Это логично с точки зрения урезания шины обмена с памятью с 256 бит до 192 бит. Однако есть свои тонкости.

Как сделать ускоритель со 192-битной шиной, но при этом оснащенный всё тем же объемом памяти в 2 ГБ? Ведь такой объем обычно набирается 8 микросхемами по 2 Гбит каждая, и они суммарно образуют 256-битную шину (8×32 бит). Чтобы получить 192-битную, надо комплектовать карту не 8, а 6 микросхемами, однако тогда объем памяти получится 1,5 ГБ. Можно было бы пойти по тому же пути, что с GTX 550 Ti: поставить 4 микросхемы по 1 Гбит и 2 микросхемы по 2 Гбит каждая — тогда суммарно получили 1 ГБ и 192-битную шину. Благо контроллер памяти у чипов Nvidia умеет работать с микросхемами разной емкости. Но тогда речь шла о суммарном объеме в 1 ГБ. А 2 ГБ с помощью 6 микросхем уже не набрать. Придется ставить 12 с разной емкостью. Собственно, как мы видим, PCB у GTX 660 Ti на это и рассчитаны — можно поставить и 3 ГБ суммарной емкости. В данном случае производители пошли по иному пути: установили не 12 микросхем разной емкости, а 8 одной емкости в 2 Гбит. Но при этом два 64-битных контроллера из трех работают как обычно — каждый с двумя микросхемами по 32-битной шине, а третий работает с четырьмя микросхемами, используя у каждой 16-битную ширину тактового слова, если можно так выразиться (4×16 = 64 бит). Этот вариант с точки зрения себестоимости более предпочителен, потому что на карту монтируется меньше микросхем памяти (8, а не 12).

Видеокарты имеют стандартный для GTX 670/680 набор гнезд вывода: 2 DVI (один из которых Single-Link и совместим с выводом на VGA) и по одному DisplayPort и HDMI (второе гнездо DVI обладает возможностью через адаптер передавать сигнал на HDMI, поэтому суммарно можно подключить 2 приемника с HDMI). Напомним, что ускорители Nvidia достаточно давно обладают собственными звуковыми кодеками, поэтому передача на HDMI-монитор будет полноценной, со звуком.

Максимальные разрешения и частоты:

  • 240 Гц — максимальная частота обновления
  • 2048×1536@85 Гц — по аналоговому интерфейсу
  • 2560×1600@60 Гц — по цифровому интерфейсу (для DVI-гнезд с Dual-Link/HDMI)

Что касается возможностей по ускорению декодирования видео — в 2007 году мы проводили такое исследование, с ним можно ознакомиться здесь.

Каждая карта требует дополнительного питания, причем двумя 6-контактными разъемами.

О системе охлаждения.

Palit Geforce GTX 660 Ti JetStream 2048 МБ 192-битной GDDR5 PCI-E
Несмотря на то, что длина PCB невелика, система охлаждения более громоздка и увеличивает суммарную длину карты в целом. Она представляет собой уже многократно виденный нами тип кулера: центральный массивный пластинчатый радиатор с тепловыми трубками, помогающими распределять тепло равномерно по пластинам, плюс кожух с двумя многолопастными вентиляторами.

Микросхемы памяти, как и силовые элементы — без охлаждения.

Из-за особой контрукции вентиляторов, а также из-за массивности СО в целом частота врашения вентиляторов не превышает 1500 оборотов в минуту, что делает СО очень тихой. По ширине карта с СО еле-еле умещается в два слота.
Zotac Geforce GTX 660 Ti AMP! Edition 2048 МБ 192-битной GDDR5 PCI-E
Инженеры этой компании с гордостью демонстрируют свою СО, которая оказалась столь же компактной, как и сама PCB, и ускоритель в целом выглядит очень маленьким для топового продукта. При этом по ширине карта с СО занимает все те же 2 слота.

Конструкция радиатора схожа с предыдущей, однако тепловые трубки прямо впрессованы в основание и по сути прижимаются к ядру, разнося тепло по радиатору. Микросхемы памяти также не охлаждаются. А вот силовые элементы БП имеют свой небольшой радиатор.

Несмотря на то, что используемые вентиляторы — особой конструкции, предусматривающей пониженный уровень шума, общая компактность СО заставляет их работать на частоте около 2400 оборотов в минуту (при максимальной нагрузке), что делает охлаждение уж точно никак не бесшумным. Да, если сравнивать со стандартной СО с вентиляторами на таких же оборотах, то получится тише. Это факт. Но в целом СО не бесшумна. Хотя и критичного шума не производит.

Мы провели исследование температурного режима с помощью новой версии утилиты EVGA PrecisionX (автор А. Николайчук AKA Unwinder) и получили следующие результаты.

Palit Geforce GTX 660 Ti JetStream 2048 МБ 192-битной GDDR5 PCI-E
Zotac Geforce GTX 660 Ti AMP! Edition 2048 МБ 192-битной GDDR5 PCI-E

После 6 часов прогона карты под максимальной игровой нагрузкой максимальная температура ядра составила 72 градуса у продукта Palit и 69 градусов у карты Zotac, что очень даже неплохо для моделей из почти топовой серии.

Комплектация. Базовый комплект поставки должен включать в себя руководство пользователя и диск с драйверами и утилитами.

Palit Geforce GTX 660 Ti JetStream 2048 МБ 192-битной GDDR5 PCI-E
Перед нами базовый комплект плюс разветвитель на 6-контактный коннектор питания и адаптеры DVI-to-VGA, HDMI-to-DVI. То есть данный комплект позволяет максимально возможно использовать карту с различными приемниками — например, подключить к трем мониторам через DVI.
Zotac Geforce GTX 660 Ti AMP! Edition 2048 МБ 192-битной GDDR5 PCI-E
Базовый комплект плюс адаптер DVI-to-VGA и 2 разветвителя питания.

На очереди рассмотрение упаковок.

Palit Geforce GTX 660 Ti JetStream 2048 МБ 192-битной GDDR5 PCI-E
Ускоритель размещен в пластиковом отсеке, повторяющем конфигурацию карты, так что карта хорошо защищена от повреждений при перевозке.
Zotac Geforce GTX 660 Ti AMP! Edition 2048 МБ 192-битной GDDR5 PCI-E
Ускоритель размещен в отсеке из пенополиуретана, поэтому также хорошо защищен от повреждений при перевозке.

Установка и драйверы

Конфигурация тестового стенда:

    Компьютеры на базе процессора Intel Core i7-3960X (Socket 2011):
    • процессор Intel Core i7-3960X (o/c 4 ГГц);
    • системная плата Asus Sabertooth X79 на чипсете Intel X79;
    • системная плата MSI X79A-GD45(8D) на чипсете Intel X79;
    • оперативная память 8 ГБ DDR3 SDRAM Corsair 1866 МГц;
    • жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA2;
    • жесткий диск WD Caviar Blue WD10EZEX 1 TБ SATA2;
    • 2 блока питания Enermax Platimax 1200 Вт.
  • операционная система Windows 7 64-битная; DirectX 11;
  • монитор Dell UltraSharp U3011 (30″);
  • драйверы AMD версии Catalyst 12.7beta; Nvidia версии 305.37

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

В качестве синтетических тестов DirectX 11 мы использовали примеры из пакетов SDK компаний Microsoft и AMD, а также демонстрационной программой Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010).

Мы взяли и приложения обоих производителей видеочипов: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain, также известная как Island11.

Синтетические тесты проводились на следующих видеокартах:

  • Geforce GTX 660 Ti со стандартными параметрами (далее GTX 660 Ti)
  • Geforce GTX 670 со стандартными параметрами (далее GTX 670)
  • Geforce GTX 580 со стандартными параметрами (далее GTX 580)
  • Radeon HD 7950 со стандартными параметрами (далее HD 7950)
  • Radeon HD 7870 со стандартными параметрами (далее HD 7870)

Для сравнения результатов выпущенной сегодня на рынок видеокарты модели Geforce GTX 660 Ti эти решения были выбраны по следующим причинам. Geforce GTX 670 является ближайшей к GTX 660 Ti моделью по техническим характеристикам, да ещё и на базе того же GK104, сравнение с GTX 580 будет интересно по причине разных поколений и ценовых диапазонов видеокарт — устаревшая модель является топовой одночиповой моделью предыдущей архитектуры Nvidia.

Выбранные решения от конкурирующей компании AMD были взяты для тестов потому, что Radeon HD 7950 имеет близкие к анонсированной видеокарте Geforce характеристики и цену, равно как и вторая модель — Radeon HD 7870. Они весьма близки друг к другу по скорости, и составляют пару конкурирующих с Geforce GTX 660 Ti моделей.

Direct3D 9: тесты Pixel Shaders

Тесты текстурирования и заполнения (филлрейта) из пакета 3DMark Vantage мы рассмотрим ниже, а первая группа пиксельных шейдеров, которую мы используем, включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся в старых играх, и она очень проста для современных видеочипов.

Эти тесты просты для современных GPU, и скорость в них часто упирается в производительность текстурирования или филлрейт. Поэтому они способны показать далеко не все возможности современных видеочипов, но интересны нам с точки зрения аналогов устаревших игровых приложений, которых до сих пор достаточно. Судя по нашим предыдущим сравнениям, производительность последних видеокарт в этих тестах ограничена чаще всего филлрейтом, хотя и влияние скорости текстурных модулей также прослеживается.

Новинка от Nvidia весьма неплохо смотрится на уровне своей старшей сестры Geforce GTX 670, уступая ей не так уж много. В этих тестах лидирует топовая видеоплата компании AMD, но новинку Geforce GTX 660 Ti мы с ней не сравниваем. Что касается сравнения GTX 660 Ti с Radeon HD 7950 и HD 7870, то тут дела уже поинтереснее. Любопытно, что из этих трёх видеокарт по причине высокой тактовой частоты HD 7870 оказывается лидером во всех тестах, а не HD 7950 или GTX 660 Ti.

В общем, в наших первых тестах Geforce GTX 660 Ti выступила на хорошем уровне, по сравнению с конкурирующими видеокартами от AMD, и почти всегда быстрее старой топовой GTX 580. Возможно, Radeon HD 7950 подвели программные оптимизации в драйверах, ведь использовались разные их версии. Посмотрим на результаты более сложных пиксельных программ промежуточных версий:

Тест Cook-Torrance более интенсивен вычислительно, разница в нём примерно соответствует разнице в количестве ALU и их частоте, но и от скорости TMU она также зависит. Хотя данный тест исторически лучше подходит для графических решений компании AMD, но все новые платы Geforce на базе архитектуры Kepler в нём также оказались весьма сильны.

Интересна большая разница по скорости между Radeon HD 7970 и HD 7950, и даже HD 7870 оказывается примерно на том же уровне, что и младший Radeon из топовой парочки. Ну а наша сегодняшняя героиня в лице Geforce GTX 660 Ti при сравнении прямых конкурентов выходит победителем, пусть и с небольшим преимуществом. Что касается абсолютного лидерства, то тут ожидаемо самым быстрым оказывается топовый Radeon. Ну а Geforce GTX 580 из-за своей низкой математической производительности остался далеко позади.

Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье Современная терминология 3D-графики.
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

Существует два варианта этих шейдеров: с ориентацией на математические вычисления и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это — универсальные тесты, производительность в которых зависит и от скорости блоков ALU, и от скорости текстурирования, также в них важен общий баланс чипа и эффективность исполнения вычислительных программ. Результаты теста показывают, что в этих конкретных задачах архитектура AMD смотрится заметно лучше, чем GPU производства Nvidia.

На производительность топовой Radeon HD 7970 мы не смотрим, но даже более слабые HD 7950 и HD 7870 в тесте «Frozen Glass» обходят рассматриваемую сегодня новинку. Которая, впрочем, совсем немного уступила старшей GTX 670, и заметно обогнала GTX 580. Возможно, скорость ограничивается ещё и пропускной способностью видеопамяти, ведь предшествующая топовая модель GTX 580 показывает не такие уж плохие результаты.

Во втором тесте «Parallax Mapping» новая видеокарта Nvidia показала производительность, несколько хуже той, что мы получили от Radeon HD 7950 и Geforce GTX 670, не говоря уже о HD 7870, которая уступает лишь топовому GPU от AMD, который является единоличным лидером. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:

Для плат с GPU производства Nvidia положение улучшилось, и Geforce GTX 660 Ti теперь опережает конкурентов в одном тесте и уступает лишь HD 7870 в одном из них. Современные чипы AMD в этих задачах работают несколько эффективнее, что отлично видно по топовому решению. Новая видеокарта серии Geforce GTX 600 в тесте Parallax Mapping сильна — она немного уступила GTX 670 и заметно опередила HD 7950, а вот в тесте Frozen Glass наблюдается небольшое отставание от HD 7870.

Но то были устаревшие задачи, с упором в текстурирование и филлрейт. Далее мы рассмотрим результаты ещё двух тестов пиксельных шейдеров — но уже версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9. Они наиболее показательны с точки зрения современных игр на ПК, среди которых много мультиплатформенных. Тесты отличаются тем, что сильно нагружают и ALU, и текстурные модули, обе шейдерные программы сложны и длинны, и включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье Современная терминология 3D-графики.
  • Fur — процедурный шейдер, визуализирующий мех.

Данные тесты не ограничены производительностью лишь текстурных выборок, и больше всего зависят от эффективности исполнения сложного шейдерного кода. В самых тяжёлых DX9-тестах из первой версии пакета RightMark видеокарты производства Nvidia ранее были сильнее, но в последней архитектуре компании AMD исправили положение и теперь именно топовое решение на чипе архитектуры GCN в PS 3.0 сравнении показывает лучший результат.

А рассматриваемая сегодня модель Geforce GTX 660 Ti тоже смотрится неплохо, особенно по сравнению с собратьями от Nvidia. Она почти не уступает GTX 670 и заметно быстрее GTX 580 в одном из тестов. Что касается сравнения со своими прямыми конкурентами, то в «Fur» новинка стала победителем, а вот в «Steep Parallax Mapping» увы, дела не столь выдающиеся — результат Radeon HD 7950 и HD 7870 заметно выше, почти на 20%. Но тут сказывается явная сравнительная неэффективность решений от Nvidia в этой задаче, так как упора в пропускную способность в данном тесте не наблюдается.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два знакомых теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

В этом тесте производительность зависит в большей степени от количества и эффективности блоков TMU, также влияет и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает ещё и эффективный филлрейт и пропускная способность памяти, что хорошо видно по цифрам GTX 660 Ti и GTX 670. Результаты при детализации уровня «High» получаются до полутора раза ниже, чем при «Low».

Как и в аналогичных DX9 тестах, в задачах процедурной визуализации меха с большим количеством текстурных выборок, за пару поколений графических архитектур компания AMD не только сократила разницу с платами Nvidia, а с выпуском GCN и вовсе вырвалась вперёд. И теперь именно карты Radeon являются лидерами таких сравнений, что говорит о высокой эффективности выполнения ими данных пиксельных программ.

Рассматриваемая сегодня модель Geforce GTX 660 Ti показала результат чуть хуже GTX 670, что совершенно неудивительно. Интересно, что обе они уступили GTX 580, что может говорить о снизившейся эффективности исполнения сложных шейдеров или о недостатке пропускной способности памяти (эффективного филлрейта). Да и в целом, GTX 660 Ti тут оказалась медленнее всех участников, прилично уступив обоим конкурентам в виде Radeon HD 7950 и HD 7870.

Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: возможно, в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

Обе видеокарты новой линейки Geforce GTX 600 улучшили свои результаты относительно старой Geforce GTX 580, но при включении суперсэмплинга, увеличивающего теоретическую нагрузку вчетверо, результаты решений Nvidia в целом всё равно значительно ухудшились, по сравнению с показателями видеокарт компании AMD. А если разница по скорости рендеринга в данной задаче и так была высокой, то теперь разгром стал и вовсе неприличным.

Протестированная нами сегодня новинка от компании Nvidia опередила только старую GTX 580, уступив совсем немного старшей сестре. Но это не может быть утешением на фоне громадного проигрыша в 40-60% двум своим конкурентам — видеокартам моделей Radeon HD 7950 и HD 7870. Результаты явно говорят о «любви» GCN к сложным вычислениям и преимущество в этих тестах явно за чипами компании AMD, предпочитающими попиксельные вычисления.

Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип ещё примерно в два раза — такой режим называется «High».

Диаграмма очень похожа на предыдущую без дополнительного включения SSAA, разве что Geforce GTX 580 теперь спустилась на последнее место. Решения Nvidia в этом тесте ничуть не улучшили своё положение и новая плата Geforce GTX 660 Ti в обновленном D3D10-варианте теста без суперсэмплинга всё так же сильно отстаёт от своих прямых соперников Radeon HD 7950 и HD 7870, обходя лишь GTX 580. Посмотрим, что изменит включение суперсэмплинга, ведь он обычно вызывает сильное падение скорости на платах Nvidia.

И тут всё примерно так же, что и в «Fur». При включении суперсэмплинга и самозатенения, задача получается ещё более тяжёлой, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьёзное падение производительности. Разница между скоростными показателями протестированных видеокарт изменилась, включение суперсэмплинга сказывается, как и в предыдущем случае — видеокарты производства AMD улучшают относительные показатели, по сравнению с платами на чипах Nvidia.

Разница между Geforce GTX 660 Ti и GTX 670 несколько увеличилась, равно как и отставание старой топовой модели GTX 580. Ну а Radeon HD 7970 с HD 7870 снова далеко впереди и показывают близкие результаты. Сегодняшняя новинка не может конкурировать с ними в этом тесте, уж очень неэффективно работают графические решения Nvidia в наших D3D10-тестах пиксельных шейдеров. Остаётся радоваться лишь тому, что и GTX 670 недалеко ушла.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты предельных математических тестов чаще всего более-менее соответствуют разнице в частотах и количестве вычислительных блоков, но с влиянием разной эффективности их использования. Архитектуры AMD последних лет в таких случаях ранее имели огромное преимущество перед конкурирующими видеокартами Nvidia, которое можно увидеть, сравнив результаты GTX 580 и HD 7870, но именно в архитектуре Kepler число потоковых процессоров и пиковая математическая производительность Geforce значительно возросли.

Результаты видеокарт на диаграмме расположились примерно соответственно теории, с некоторыми исключениями. В обзоре Geforce GTX 670 мы отмечали, что в этом тесте видеокарта Nvidia впервые опередила своего прямого конкурента в лице Radeon HD 7950. Логично, что и Geforce GTX 660 Ti, имеющая ту же математическую производительность, всё так же осталась впереди, обогнав и HD 7950 и HD 7870, предлагаемые по схожим ценам. Исходя из теории, в этом тесте скорость видеокарт AMD должна быть выше, но карты семейства Geforce GTX 600 в этот раз сработали эффективнее.

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нём только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Во втором математическом тесте относительный результат новинки от Nvidia оказался несколько ниже, и она уже уступила и Radeon HD 7950 и HD 7870, причём ровно столько, сколько и должна по теории, то есть не так уж и много. Разница в скорости между двумя Radeon и двумя современными Geforce совсем невелика, и это можно считать явным движением вперёд со стороны Nvidia.

Отлично видно, насколько печальны результаты GTX 580 из предыдущего поколения — всё-таки новая архитектура Kepler для приложений такого рода подходит куда лучше. И с выходом новой архитектуры Nvidia разница между Radeon и Geforce стала совсем небольшой, в отличие от предыдущих нескольких лет. Более того — в данном сравнении и вовсе нет явного победителя — в первом тесте победила GTX 660 Ti, а во втором — HD 7950.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаковое для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS почти двукратное. Задача эта для современных видеокарт не слишком сложная, и производительность в ней ограничена скоростью обработки геометрии и пропускной способностью памяти.

Хорошо заметна разница между видеокартами на чипах Nvidia и решениями AMD. Если в предыдущих тестах с пиксельными шейдерами платы AMD были в среднем несколько эффективнее и быстрее, то первый же тест геометрии показал, что в таких задачах платы Nvidia остаются лидерами. Сегодняшняя новинка Geforce GTX 660 Ti хотя и отстаёт от GTX 670, что говорит об упоре в ПСП, но не слишком сильно.

Это позволяет ей обходить обоих конкурентов в задаче, и итог сравнения вполне логичен — разница между Geforce GTX 660 Ti и Radeon HD 7950 заметная, а HD 7870 так и вовсе далеко позади. В этом поколении платы Radeon улучшили свои показатели, но пока всё же не смогли догнать даже лучшую из Fermi, не говоря уже о Kepler. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры не изменились для устаревшей платы Nvidia и немного улучшились для всех плат AMD и решений Nvidia современного поколения. Все видеокарты в данном тесте слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, поэтому и все выводы остаются прежними. Представленная сегодня модель Geforce GTX 660 Ti чуть быстрее, чем Radeon HD 7950 и значительно опережает HD 7870. Интересно, что изменится в следующем тесте, который предполагает большую нагрузку именно на геометрические шейдеры.

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленным в «Heavy» — ещё и для их отрисовки. То есть в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер.

В этом тесте нет результатов Radeon HD 7870, так как по какой-то причине они не запустились на этой модели. Относительные результаты остальных решений в разных режимах также примерно соответствуют изменению нагрузки: во всех случаях производительность неплохо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть чуть менее чем в два раза медленней.

В этом тесте скорость рендеринга ограничена в основном геометрической производительностью, но с некоторым влиянием пропускной способности видеопамяти. В этот раз Geforce GTX 660 Ti показала скорость аналогичную скорости старшей модели GTX 670 и опередила соперничающую с ней видеоплату Radeon HD 7950. Цифры должны серьёзно измениться на следующей диаграмме, в тесте с более активным использованием геометрических шейдеров. Также будет интересно сравнить друг с другом результаты, полученные в режимах «Balanced» и «Heavy».

В этот раз при переносе вычислений в геометрический шейдер диаграмма поменялась весьма серьёзно и все видеокарты Nvidia оказались заметно быстрее единственной платы от AMD, даже Geforce GTX 580 предыдущего поколения справилась с этой задачей. Ну а новая плата на базе топового чипа архитектуры Kepler ещё лучше выполнила тест, показав скорость, близкую к GTX 670.

Этот тест явно упирается именно в производительность геометрических блоков, с мощностью которых у решений Nvidia всё очень неплохо. И хотя результаты плат конкурента на базе Tahiti заметно улучшились, новейшие решения на базе чипа GK104 значительно опережают их в этой категории наших тестов.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Наши предыдущие исследования показали, что на результаты этого теста может влиять и скорость текстурирования и пропускная способность памяти, особенно в лёгком режиме. А результаты видеокарт Nvidia и вовсе ограничены ещё чем-то странным. И между схожими по классу платами разница в этом тесте порой получается очень маленькой.

Geforce GTX 660 Ti лишь немного отстала от своей сестры-близнеца GTX 670, уступив в лёгких условиях из-за недостатка ПСП. А вот по сравнению со своими соперниками всё неплохо. Radeon HD 7950 по какой-то причине показывает результаты несколько хуже, чем HD 7870, и новинка от Nvidia в среднем оказывается быстрее их обоих, уступая только HD 7870 в лёгком режиме, когда скорость ограничена пропускной способностью памяти. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Взаимное расположение карт на диаграмме немного изменилось за счёт того, что платы Nvidia обеспечили ту же скорость рендеринга во всех режимах, в отличие от решений AMD, которые результаты которых ухудшились. Подтверждается версия об упоре скорости видеоплат Geforce в некую преграду. Теперь результаты Geforce GTX 660 Ti близки к скорости GTX 670 и намного быстрее (почти до двух раз!) чем у Radeon HD 7950 и HD 7870. В этом тесте новинка оказалась быстрее соперников уже во всех режимах.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты во втором тесте вершинного текстурирования «Waves» не похожи на то, что мы видели на предыдущих диаграммах. В этот раз показатели старой топовой модели Geforce GTX 580 оказались очень низкими в тяжёлом режиме. Все остальные видеокарты сравнения показали очень близкие результаты во всех условиях. Radeon HD 7950 снова выступила чуть хуже младшей модели HD 7870, которая показала результат на уровне представленной сегодня платы Geforce GTX 660 Ti. Рассмотрим второй вариант этого же теста:

В этот раз также уже не произошло изменений, как в предыдущие разы, и видеокарты производства AMD не ухудшили свои результаты. Зато в лёгких режимах пострадали видеоплаты компании Nvidia. Это позволило Radeon HD 7870 обойти калифорнийскую новинку, и представленная сегодня плата на чипе архитектуры Kepler проиграла своему прямому конкуренту совсем немного. А вот с Radeon HD 7950 они идут нос к носу. В целом, GTX 660 Ti в тестах вершинного текстурирования выступила неплохо, хотя это и не имеет особого значения в современных играх.

3DMark Vantage: тесты Feature

Синтетические тесты из пакета 3DMark Vantage покажут нам то, что мы ранее упустили. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10 и интересны тем, что отличаются от наших и до сих пор актуальны. При анализе результатов новой видеокарты Nvidia в этом пакете мы сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark.

Feature Test 1: Texture Fill

Первый тест — тест скорости текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Хотя тест компании Futuremark не показывает теоретически возможного уровня производительности текстурных выборок, но эффективность видеокарт AMD и Nvidia в нём достаточно высока и сравнительные цифры моделей довольно близки к соответствующим теоретическим параметрам. И в этот раз получилось так же, несмотря на небольшое превышение скорости Geforce GTX 660 Ti над GTX 670 (видимо, вызванное разной работой технологии GPU Boost). По теории лучшими видеокартой в сравнении должна быть пара GTX 660 Ti и GTX 670, так и получилось.

В случае сравнения Geforce GTX 660 Ti с парой конкурентов: Radeon HD 7950 и HD 7870 всё также примерно соответствует теории. Новинка от Nvidia обогнала обоих прямых конкурентов, а уж Geforce GTX 580 из предыдущего поколения и вовсе осталась очень далеко позади, уступив GTX 660 Ti более двух раз. Неплохое начало для новой модели.

Feature Test 2: Color Fill

Это тест скорости заполнения. Используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Ситуация в тесте производительности блоков ROP также более-менее повторяет теорию. Хотя мы определили ранее, что цифры этого подтеста из 3DMark Vantage показывают производительность блоков ROP с учётом величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»). Хотя тест измеряет скорее пропускную способность памяти, чем производительность ROP, в сегодняшнем случае это неважно, так как GTX 660 Ti отстаёт от GTX 670 по обоим параметрам одинаково.

Новая модель Geforce GTX 660 Ti показала неплохую скорость ровно посередине между Radeon HD 7950 и HD 7870 — своих основных и прямых конкурентов, и чуть лучше, чем Geforce GTX 580 из предыдущего поколения, что явственно указывает на улучшение эффективности работы блоков TMU в Kepler.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нём рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоёмкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжёлого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчёты освещения по Strauss.

Тест отличается от проведённых нами ранее тем, что результаты в нём зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от всего сразу. А для достижения высокой скорости тут важен верный баланс GPU, а также эффективность выполнения сложных шейдеров. И в синтетике из 3DMark Vantage платы Geforce и Radeon показывают примерно такие же относительные результаты, что и в аналогичных тестах из нашего тестового пакета.

Новая модель Geforce GTX 660 Ti опережает предшествующую топовую GTX 580 и идёт наравне со старшей GTX 670 (то есть, упора в ПСП и филлрейт нет), но отстаёт от обоих конкурентов от компании AMD. В этом тесте эффективность вычислительных блоков Kepler несколько ниже, чем у Fermi и GCN. Поэтому в сравнении с конкурирующими платами Radeon HD 7950 и HD 7870 на базе архитектуры GCN, новинке от Nvidia проиграла. Причём, новая Geforce уступила HD 7950 довольно много — почти 20%. Всё же в подобных вычислительных задачах топовые видеокарты компании AMD чуть лучше справляются с работой.

Feature Test 4: GPU Cloth

Тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте также зависит сразу от нескольких параметров, но основными факторами влияния являются производительность обработки геометрии и эффективность выполнения геометрических шейдеров. Из-за влияния геометрических блоков вполне логично, что все видеокарты производства Nvidia чувствуют себя в этом тестировании весьма неплохо, обгоняя соответствующие по цене платы Radeon.

Представленная сегодня модель Geforce GTX 660 Ti легко опережает обоих конкурентов в виде моделей Radeon HD 7950 и HD 7870. Это один из тестов, в которых видно явное преимущество решений Nvidia, имеющих по несколько геометрических блоков. Интересно, что представленная сегодня новинка на базе чипа GK104 даже немного опередила старшую сестру GTX 670, имеющую точно такие же теоретические показатели. Видимо, в последних драйверах были проведены некоторые оптимизации, положительно сказавшиеся на геометрической производительности.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчётами, также тестируется stream out.

Самый интересный вывод из диаграмма — это практический единственный тест, в котором новые платы на базе чипа с архитектурой Kepler весьма значительно уступают лучшему из представителей архитектуры Fermi. В случае этого теста сравнительные результаты, скорее всего, объясняются показателем филлрейта, ведь пикового значение его у GTX 580 выше. В пользу этого же вывода говорит заметная разница между частотой кадров на GTX 660 Ti и GTX 670, отличающихся только филлрейтом и ПСП.

Зато если сравнивать скорость новой Geforce GTX 660 Ti с производительностью её соперников, то новинка от Nvidia оказывается впереди даже несмотря на падение скорости относительно GTX 670. Итого, в синтетических тестах имитации тканей и частиц из тестового пакета 3DMark Vantage, в которых активно используются геометрические шейдеры, новая плата Nvidia продолжает традиции других моделей, заметно опережая своих соперников из семейства AMD Radeon. HD 7000.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических расчётов.

В чисто математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы видим несколько другое распределение результатов, по сравнению с аналогичными тестами из нашего тестового пакета. В этом случае производительность решений не совсем соответствует теории и расходится с тем, что мы видели ранее в математических тестах из пакета RightMark 2.0.

Видеокарты на базе чипов архитектуры GCN от компании AMD отлично справляются с такими задачами, почти всегда Radeon показывают лучшие результаты в случаях, когда выполняется сравнительно простая, но весьма интенсивная математика. Поэтому и неудивительно, что одно из топовых решений компании AMD победило в тесте, а HD 7870 стала второй. Рассматриваемая сегодня модель Geforce GTX 660 Ti уступила своим соперникам 13-15%. У видеокарт на основе чипа GK104 эффективность в этой задаче явно низка, ведь по теории, GTX 660 Ti должна быть почти на уровне HD 7870, а в реальности этого не видно.

Direct3D 11: Вычислительные шейдеры

Чтобы протестировать новое решение компании Nvidia в задачах, использующих такие новые возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы воспользовались примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, Nvidia и AMD.

Сначала мы рассмотрим тесты, использующие вычислительные (Compute) шейдеры. Их появление — одно из наиболее важных нововведений в последних версиях DX API, они уже используются в современных играх для выполнения различных задач: постобработки, симуляций и т. п. В первом тесте показан пример HDR-рендеринга с tone mapping из DirectX SDK, с постобработкой, использующей пиксельные и вычислительные шейдеры.

Хотя это и не самый удачный пример для вычислительных шейдеров, но разницу в производительности в одной из конкретных задач он может показать. Разницы в скорости расчётов в вычислительном и пиксельном шейдерах для плат Nvidia с видеочипами архитектуры Kepler практически нет, равно как и для плат компании AMD. Судя по предыдущим тестам, результаты в задаче явно зависят не столько от математической мощи и даже не от эффективности вычислений, а от других факторов, вроде ПСП и производительности ROP.

Отметим, что новинка компании Nvidia в этом тесте отстаёт от старшей GTX 670 совсем немного и находится где-то посередине между Radeon HD 7970 и HD 7870. То есть, примерно на уровне HD 7950, результатов которого в DX11 тестах у нас нет. Второй тест вычислительных шейдеров также взят из Microsoft DirectX SDK, в нём показана расчётная задача гравитации N тел (N-body) — симуляция динамической системы частиц, на которую воздействуют физические силы, такие как гравитация.

В этом тесте результаты иные, и разница между Geforce GTX 670 и новой GTX 660 Ti стала даже ещё больше — видимо, снова мы наблюдаем упор в ПСП и/или филлрейт, а не в скорость исполнения простых математических вычислений. Возможно, скорость больше зависит от эффективности этих вычислений, в чём Nvidia всегда была сильна, хотя и не во всех задачах.

В целом, самый младший из Kepler очень неплохо справляется с работой, так как Geforce GTX 660 Ti быстрее не только HD 7870, которая является её конкурентом, но обгоняет и топовую плату AMD, явно более дорогую. Переходим к тестам производительности в задачах тесселяции, которые, скорее всего, покажут ещё одну сильную сторону новой платы под маркой Geforce.

Direct3D 11: Производительность тесселяции

Вычислительные шейдеры очень важны, но ещё одним важным нововведением в Direct3D 11 считается аппаратная тесселяция. Мы очень подробно рассматривали её в своей теоретической статье про Nvidia GF100. Тесселяцию уже довольно давно начали использовать в DX11-играх, таких как STALKER: Зов Припяти, DiRT 2, Aliens vs Predator, Metro 2033, Civilization V, Crysis 2, Battlefield 3 и других. В некоторых из них тесселяция используется для моделей персонажей, в других — для имитации реалистичной водной поверхности или ландшафта.

Существует несколько различных схем разбиения графических примитивов (тесселяции). Например, phong tessellation, PN triangles, Catmull-Clark subdivision. Так, схема разбиения PN Triangles используется в STALKER: Зов Припяти, а в Metro 2033 — Phong tessellation. Эти методы сравнительно быстро и просто внедряются в процесс разработки игр и существующие движки, поэтому и стали популярными.

Первым тестом тесселяции будет пример Detail Tessellation из ATI Radeon SDK. В нём реализована не только тесселяция, но и две разные техники попиксельной обработки: простое наложение карт нормалей и parallax occlusion mapping. Что ж, сравним DX11-решения AMD и Nvidia в различных условиях:

В тесте простого бампмаппинга видно, что платы упираются в ПСП. Это очевидно и по сравнению GTX 660 Ti и GTX 670, отличающихся как раз по этому параметру. Именно поэтому и Radeon HD 7970 так сильна и с запасом обгоняет обе Geforce. Второй подтест с более сложными попиксельными расчётами показал, что и эффективность выполнения сложных математических вычислений в пиксельных шейдерах у чипов архитектуры GCN несколько выше, чем у GPU производства компании Nvidia. Даже если не брать в расчёт топовую видеоплату семейства Radeon HD 7000, то даже относительно дешёвая HD 7870 обогнала представленную сегодня GTX 660 Ti в этом подтесте, показав на четверть лучший результат в тесте parallax mapping.

В самом интересном подтесте тесселяции мы также отмечаем очень сильные результаты обеих видеокарт Radeon. В данном тесте тесселяции разбиение треугольников умеренное, скорость в нём не полностью упирается в производительность обработки геометрии, и поэтому платы компании AMD не теряют много в производительности, и их запаса скорости обработки треугольников вполне хватает, чтобы показывать лучшие результаты. А уж Radeon HD 7870 и вообще лидирует в данном тесте из-за высокой тактовой частоты GPU.

Вторым тестом производительности тесселяции будет ещё один пример для 3D-разработчиков из ATI Radeon SDK — PN Triangles. Собственно, оба примера входят также и в состав DX SDK, так что мы уверены, что на их основе создают свой код игровые разработчики. Этот пример мы протестировали с различным коэффициентом разбиения (tessellation factor), чтобы понять, как сильно влияет его изменение на общую производительность.

В этом примере мы видим уже более сложную геометрию, и сравнение геометрической мощи различных решений становится интереснее. Все представленные в статье современные решения неплохо справляются с лёгкой и средней геометрической нагрузкой, показывая близкие цифры, но в самых тяжёлых условиях графические процессоры Nvidia остаются непревзойдёнными.

Чипы архитектур Nvidia хороши в таких задачах, особенно верхние решения линейки Geforce GTX 600. И анонсированная сегодня видеоплата Geforce GTX 660 Ti почти не уступает своей старшей сестре, выигрывая у конкурентов в разы. Хотя надо признать, что Radeon последней серии весьма неплохо выглядят во всех условиях, кроме экстремальной нагрузки геометрических блоков.

Давайте рассмотрим результаты ещё одного теста — демонстрационной программы Nvidia Realistic Water Terrain, также известной как Island. В этой демке используется тесселяция и карты смещения (displacement mapping) для рендеринга реалистично выглядящей поверхности океана и ландшафта.

Island не является чисто синтетическим тестом для измерения исключительно геометрической производительности GPU, так как он содержит и сложные пиксельные и вычислительные шейдеры в том числе, и такая нагрузка ближе к реальным играм, в которых используются все блоки GPU, а не только геометрические, как в предыдущих тестах геометрии.

Мы протестировали демо при четырёх разных коэффициентах тесселяции, в данном случае настройка называется Dynamic Tessellation LOD. И если при самом первом коэффициенте разбиения треугольников, когда скорость не ограничена производительностью геометрических блоков, видеокарты компании AMD показывают отличные результаты, то при увеличении геометрической работы платы компании Nvidia начинают выигрывать, и довольно сильно. При увеличении коэффициента разбиения (а соответственно и сложности сцены) производительность обеих представленных плат Radeon падает довольно сильно.

Выпущенная сегодня плата от Nvidia во всех режимах уступает GTX 670 совсем немного, но выигрывает у конкурирующих решений в виде Radeon HD 7970 и HD 7870 во всех условиях, кроме самого простого. Высокая тактовая частота видеочипа и большая математическая мощь позволили новинке из нового семейства показать сильный результат, и хотя современная архитектура компании AMD серьёзно подтянула геометрическую производительность, в синтетических тестах они всё же продолжают сильно проигрывать решениям Nvidia, в отличие от реальных игровых приложений, где ситуация не столь однозначна.

Выводы по синтетическим тестам

Результаты синтетических тестов новой модели видеокарты Geforce GTX 660 Ti, основанной на «урезанном» графическом процессоре GK104 архитектуры Kepler, а также результатам других моделей видеокарт производства обоих производителей дискретных видеочипов, были предсказуемыми. Ведь новое решение компании Nvidia во многом повторяет по характеристикам предыдущую околотоповую модель Geforce GTX 670. Неудивительно, что при объявленной цене свежая модель должна стать одной из самых выгодных видеокарт производительного сегмента на рынке.

И по техническим характеристикам и по синтетическим тестам отставание новой модели от Geforce GTX 670 оказалось совсем невелико, а значит, что и в играх будут показаны отличные результаты, особенно если взять во внимание и фабрично разогнанные варианты. Мы уже неоднократно рассматривали видеокарты на базе графического процессора GK104, этот чип новой архитектуры Kepler имеет множество улучшений, направленных на увеличение производительности и энергоэффективности. Наш набор синтетических тестов показал, что производительность Geforce GTX 660 Ti почти во всех задачах близка к Geforce GTX 670, и чаще всего она быстрее конкурирующей по цене модели Radeon HD 7870 и почти на уровне HD 7950.

Небольшой недостаток в виде урезанной шины памяти, а вместе с тем и её пропускной способности, сказался только в редких тестах, равно как и недостаток филлрейта. Вероятно, в некоторых играх эти ограничения скажутся более явно и не позволят новой плате показать результат на уровне старшей сестры Geforce GTX 670, обогнав Radeon HD 7950 с запасом. С другой стороны, новинка и стоит меньше, а некоторые варианты GTX 660 Ti будут иметь повышенные частоты и локальную память большего объёма — 3 гигабайта вместо 2 гигабайт у GTX 670.

Исходя из полученных данных производительности и технических характеристик, видеокарта Geforce GTX 660 Ti должна стать весьма неплохим предложением для той части игроков и энтузиастов, которые не хотят платить за наиболее дорогие топовые решения вроде GTX 670 и GTX 680. Отличные результаты Geforce GTX 660 Ti в большинстве наших синтетических тестов должны быть подкреплены соответствующими показателями и в игровых приложениях нашего тестового набора. Мы предполагаем, что новинка покажет высокую скорость в играх, став одной из наиболее привлекательных видеокарт в своём ценовом сегменте.

Nvidia Geforce GTX 660 Ti — Часть 3: производительность в игровых тестах →

2 блока питания Platimax для тестового стенда предоставлены компанией Enermax

Корпус ThermalTake 8430 для тестового стенда предоставлен компанией 3Logic

Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт

Системная плата Asus Sabertooth X79 для тестового стенда предоставлена компанией AsusTeK

Системная плата MSI X79A GD45 (8B) для тестового стенда предоставлена компанией MSI

Жесткий диск Seagate Barracuda 7200.14 3TB для тестовых стендов предоставлен компанией Seagate




Дополнительно

iXBT BRAND 2016

«iXBT Brand 2016» — Выбор читателей в номинации «Процессоры (CPU)»:
Подробнее с условиями участия в розыгрыше можно ознакомиться здесь. Текущие результаты опроса доступны тут.

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.