Nvidia Geforce GTX 960

Часть 2: Особенности карты и синтетические тесты

Содержание

Устройство(а)

MSI Geforce GTX 960 Gaming 2G 2048 МБ 128-битной GDDR5 PCI-E
ПараметрЗначениеНоминальное значение (референс)
GPUGeforce GTX 960 (GM206)
ИнтерфейсPCI Express x16
Частота работы GPU (ROPs), МГц1215—13421126—1178
Частота работы памяти (физическая (эффективная)), МГц1750 (7000)1750 (7000)
Ширина шины обмена с памятью, бит128
Число вычислительных блоков в GPU/частота работы блоков, МГц8/1215—13428/1126—1178
Число операций (ALU) в блоке128
Суммарное число операций (ALU)1024
Число блоков текстурирования (BLF/TLF/ANIS)64
Число блоков растеризации (ROP)32
Размеры, мм270×125×35190×100×36
Количество слотов в системном блоке, занимаемые видеокартой22
Цвет текстолитачерныйчерный
Энергопотребление (пиковое в 3D/в режиме 2D/в режиме «сна»), Вт124/50/18119/45/17
Уровень шума (фоновый/в режиме 2D/в режиме 2D (просмотр видео)/в режиме максимального 3D), дБА20/20/21/23,5
Выходные гнезда1×DVI (Dual-Link/HDMI), 1×HDMI 2.0, 3×DisplayPort 1.21×DVI (Dual-Link/HDMI), 1×HDMI 2.0, 3×DisplayPort 1.2
Поддержка многопроцессорной работыSLI
Максимальное количество приемников/мониторов для одновременного вывода изображения44
Дополнительное питание: количество 8-контактных разъемов1Нет
Дополнительное питание: количество 6-контактных разъемовНет1
Максимальное разрешение 2D: DP/HDMI/Dual-Link DVI/Single-Link DVI3840×2400/3840×2400/2560×1600/1920×1200
Максимальное разрешение 3D: DP/HDMI/Dual-Link DVI/Single-Link DVI3840×2400/3840×2400/2560×1600/1920×1200

Комплектация локальной памятью
Картa имеeт 2048 МБ памяти GDDR5 SDRAM, размещенной в 4 микросхемах по 2 Гбит (по 2 на каждой стороне PCB).

Микросхемы памяти Samsung (GDDR5). Микросхемы расчитаны на номинальную частоту работы в 1785 (7140) МГц.

Сравнение с эталонным дизайном (reference)
Вид спереди
MSI Geforce GTX 960 Gaming 2G 2048 МБ 128-битной GDDR5 PCI-E Reference card Nvidia Geforce GTX 960
Вид сзади
MSI Geforce GTX 960 Gaming 2G 2048 МБ 128-битной GDDR5 PCI-E Reference card Nvidia Geforce GTX 960

Карта должна быть очень простой из-за 128-битной шины обмена с памятью, которую мы наблюдаем у 3D-акселераторов уже 15 лет как минимум. Сейчас такие карты представлены преимущественно в бюджетном сегменте. Однако Nvidia пытается использовать эту шину и в среднем сегменте. Что сразу бросается в глаза? То, что плата, по сути, 192-битная, то есть разведена шина шириной в 192 бит, а не 128: это можно легко вычислить по количеству посадочных мест под микросхемы памяти — их 6. Сейчас все микросхемы памяти 32-битные, поэтому посчитать нетрудно. А установлено всего 4 микросхемы, доступ к которым и получается 128-битным. Это дает нам понять, что ядро GM206 имеет суммарный контроллер памяти 192 бит, а не 128, и в данном варианте у GPU просто урезаны кое-какие блоки для работы со 128-битной шиной. Поэтому, как нам кажется, есть возможность появления на рынке старшего продукта (GTX 965 или GTX 960 Ti) на основе того же самого GPU GM206, но со 192-битной шиной и всеми включенными блоками.

В остальном ничего особо примечательного в плате нет. Схема питания ядра 4-фазная, использованы фирменные дроссельные катушки SFC (Super Ferrite Choke), входящие в состав системы питания памяти и GPU. Все это мы уже видели ранее в продуктах MSI. Использование 8-контактного разъема питания вместо обычного 6-контактного говорит о некотором оверклокерском потенциале этой карты (хотя она и так работает на повышенных частотах). Правда, как показали тесты, разгонять ядро имеет смысл только при работе в относительно низких разрешениях, уж больно мала ПСП (пропускная способность памяти) при 128-битной шине для такого GPU.

Система охлаждения
Как обычно, если мы видим ускоритель MSI, то имеем дело с серией кулеров TwinFrozr. Карта вместе с таким кулером занимает два слота в системном блоке, радиатор выполнен из большого количества пластин, покрытых никелем. В подошву впрессованы тепловые трубки, помогающие распределять тепло по периферийным пластинам.

Сверху надет кожух с двумя вентиляторами, при этом СО обладает очень полезным свойством останавливать вентиляторы, если температура GPU ниже 60-62 градусов.

Микросхемы памяти не имеют охлаждения, а силовые транзисторы охлаждаются специальным радиатором.

После 6-часового прогона под нагрузкой максимальная температура GPU не превысила 63 градусов, что является отличным результатом для такого рода ускорителей.
Мониторинг температурного режима с помощью EVGA PrecisionX (автор А. Николайчук AKA Unwinder)

Методика измерения шума

  • Помещение шумоизолировано и заглушено, снижены реверберации.
  • Системный блок, в котором исследовался шум видеокарт, не имеет вентиляторов, не является источником механического шума.
  • Фоновый уровень — 20 дБА — это уровень шума в комнате и уровень шумов собственно шумомера.
  • Измерения проводились на расстоянии 50 см от видеокарты на уровне системы охлаждения.
  • Режимы измерения:
    1. Режим простоя в 2D: загружен интернет-браузер с веб-сайтом iXBT.com, окно Microsoft Word, ряд интернет-коммуникаторов.
    2. Режим 2D с просмотром фильмов: используется SmoothVideo Project (SVP) (аппаратное декодирование со вставкой промежуточных кадров).
    3. Режим 3D с максимальной нагрузкой на ускоритель: используется тест FurMark.

В режиме простоя в 2D вентиляторы не работали, температура ядра не поднималась выше 30 °С, шум — фоновый.

При просмотре фильма с аппаратным декодированием температура ядра медленно росла до 60 °С, включались вентиляторы на 800 оборотах в минуту, температура тут же падала, вентиляторы останавливались. Уровень шума при включении вентиляторов не превышал 21 дБА.

В режиме максимальной нагрузки в 3D температура достигала уровня 63 °С, частота вращения вентиляторов — чуть более 1000 оборотов в минуту, шум вырастал до 23,5 дБА.

Комплектация.
Базовый комплект поставки должен включать в себя руководство пользователя, диск с драйверами и утилитами. По техническим причинам (не зависящим от нас) карта попала к нам без указанного комплекта (в нем, кроме базового набора, должны быть еще разветвитель питания и адаптер DVI-to-VGA). Также комплект включает бонус: на коробке не зря есть намек на связь с игрой War Face — внутри можно найти бонус-купон с кодами для подарочного получения мощного комплекта оружия в данной игре.

Упаковка

Установка и драйверы

Конфигурация тестового стенда

  • Компьютеры на базе процессора Intel Core i7-3960X (Socket 2011):
    • 2 процессора Intel Core i7-3960X (o/c 4 ГГц);
    • СО Hydro SeriesT H100i Extreme Performance CPU Cooler;
    • СО Intel Thermal Solution RTS2011LC;
    • системная плата Asus Sabertooth X79 на чипсете Intel X79;
    • системная плата MSI X79A-GD45(8D) на чипсете Intel X79;
    • оперативная память 16 ГБ DDR3 Corsair Vengeance CMZ16GX3M4A1600C9 1600 МГц;
    • жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA2;
    • жесткий диск WD Caviar Blue WD10EZEX 1 TБ SATA2;
    • 2 SSD Corsair Neutron SSD CSSD-N120GB3-BK;
    • блок питания Thermaltake Амур 1200 (1200 Вт);
    • блок питания Thermaltake Toughpower DPS G 1050W (1050 Вт);
    • корпус Corsair Obsidian 800D Full Tower.
  • операционная система Windows 7 64-битная; DirectX 11.1;
  • монитор Samsung U28D590D (28″);
  • монитор Asus ProArt PA249Q (24″);
  • клавиатура Cougar 700K;
  • драйверы AMD версии Catalyst 14.12,
  • драйверы Nvidia версии 347.25,
  • VSync отключен.


Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

В качестве синтетических тестов DirectX 11 мы использовали примеры из пакетов SDK компаний Microsoft и AMD, а также демонстрационную программу Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010). Мы взяли и приложения обоих производителей видеочипов: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain, также известная, как Island11.

Синтетические тесты проводились на следующих видеокартах:

  • Geforce GTX 960 со стандартными параметрами (сокращенно GTX 960)
  • Geforce GTX 760 со стандартными параметрами (сокращенно GTX 760)
  • Geforce GTX 660 со стандартными параметрами (сокращенно GTX 660)
  • Radeon R9 285 со стандартными параметрами (сокращенно R9 285)
  • Radeon R9 270X со стандартными параметрами (сокращенно R9 270X)

Для анализа производительности новой модели видеокарты Geforce GTX 960 нами были выбраны именно эти решения по следующим причинам. Geforce GTX 760 является прямой предшественницей новинки из предыдущего семейства GTX 700, она основана на графическом процессоре предыдущей архитектуры Kepler схожего ценового позиционирования. То же самое относится и к GTX 660, только эта модель ещё старше — посмотрим, насколько новинка быстрее или медленнее их.

От конкурирующей компании AMD мы также выбрали две видеокарты для нашего сравнения. Они основаны на разных графических процессорах и отличаются по цене. При условии снижения цен, главным ценовым конкурентом для Geforce GTX 960 может стать модель Radeon R9 285, и такое сравнение будет интересно с рыночной точки зрения. Ну а Radeon R9 270X мы взяли для того, чтобы оценить, насколько новая плата Nvidia оказалась быстрее аналога конкурента на базе GPU схожей сложности.

Direct3D 9: тесты Pixel Shaders

Тесты текстурирования и заполнения (филлрейта) из пакета 3DMark Vantage мы рассмотрим чуть позже, а первая группа пиксельных шейдеров, которую мы используем, включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся разве что в старых играх, очень простых для современных видеочипов.

С такими тестами все современные GPU справляются с легкостью, и производительность столь мощных решений упирается в различные ограничители. Эти тесты не способны показать все возможности современных видеочипов и интересны лишь с точки зрения устаревших игровых приложений и сравнения разных архитектур. Производительность современных видеокарт в них ограничена скоростью текстурирования или филлрейта, а видеокарты Nvidia и вовсе давно перестали оптимизировать для таких задач.

Новая модель видеокарты Nvidia в большинстве тестов уступает решению предыдущего поколения на аналогичном чипе Kepler около 10-15% из-за меньшей скорости текстурирования, но в двух самых сложных задачах расчёта освещения, где важна математическая производительность, он выглядит гораздо лучше, в сложнейшем уже выигрывая более 20%. Сравнение с GTX 660 более благоприятное, новое решение быстрее почти всегда. Зато новинка уступает плате Radeon R9 285 во всех тестах, и только в последнем они близки. Посмотрим на результаты более сложных пиксельных программ промежуточных версий:

Мы снова видим аналогичный предыдущей диаграмме результат, если сравнивать пару самых новых видеокарт Nvidia — в одном из тестов новинка впереди на 16%, а в другом — серьёзно уступает предшественнице (около 20%). Тест Cook-Torrance вычислительно интенсивный, и скорость в нем больше зависит от количества ALU и их частоты, поэтому GTX 960 показала в нём очень хороший результат, обогнав GTX 760. И даже с учётом того, что этот тест исторически лучше подходит для графических решений компании AMD, новая плата Geforce на базе архитектуры Maxwell в нём показала сильный результат на уровне Radeon R9 285, что подтверждает высокую математическую производительность GM206.

Зато в тесте Water, скорость в котором больше зависит от текстурирования, мы видим совершенно иное, ведь по скорости текстурирования новая модель уступает Geforce из предыдущего поколения. И даже GTX 660 из позапрошлого семейства оказался быстрее! В этом явно виноват упор или в текстурирование или в пропускную способность памяти, которая у GTX 960 тоже ниже. Собственно, в этом тесте новинка уступает вообще всем представленным в сравнении решениям, в том числе плате от AMD.

Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье «Современная терминология 3D-графики».
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

Существует два варианта этих шейдеров: с ориентацией на математические вычисления и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это — универсальные тесты, производительность в которых зависит и от скорости блоков ALU, и от скорости текстурирования, также в них важен общий баланс чипа и эффективность исполнения вычислительных программ. Прошлые наши исследования показывают, что в этих конкретных задачах архитектура GCN от AMD выступает значительно лучше графической архитектуры Nvidia Kepler, да и Maxwell не особенно улучшила положение Geforce.

В тесте «Frozen Glass» скорость больше зависит от математической производительности и платы Nvidia всегда упираются во что-то неведомое, сильно проигрывая аналогичным по цене платам Radeon. Новая модель Geforce оказывается в этом тесте на уровне предшественницы GTX 760, немного опережая GTX 660 и серьёзно уступая Radeon.

Да и во втором тесте «Parallax Mapping» новая видеокарта Geforce GTX 960 тоже показала невысокую производительность, отстав уже и от GTX 760, что говорит о влиянии не только математической производительности, но и текстурной или ПСП. Сравнивать с платой Radeon R9 285 нет смысла, она быстрее всех в этих тестах. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:

В этих условиях положение видеоплат от Nvidia улучшилось, так как они справляются с текстурными выборками лучше, чем Radeon. Правда, конкретно Geforce GTX 960 лишь ещё больше отстала от предшественницы GTX 760, так как у чипа GM206 меньше блоков TMU, важных для этой пары тестов. Ну хоть Geforce GTX 660 новинка опередила с запасом, и то хорошо. Но конкурент в лице Radeon R9 285 всё же впереди.

Это были давно устаревшие задачи, с упором в текстурирование, чего почти не встречается в играх. Дальше мы рассмотрим результаты еще двух тестов пиксельных шейдеров, но уже версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9. Они более показательны с точки зрения современных игр на ПК, среди которых много мультиплатформенных. Тесты отличаются тем, что сильно нагружают и ALU, и текстурные модули, обе шейдерные программы сложны и длинны и включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье «Современная терминология 3D-графики».
  • Fur — процедурный шейдер, визуализирующий мех.

Эти тесты уже не ограничены производительностью только текстурных выборок или филлрейтом и скорость в них больше всего зависит от эффективности исполнения сложного шейдерного кода. И когда дело коснулось самых тяжёлых DX9-тестов из первой версии пакета RightMark, то новая видеокарта производства Nvidia показала результат, заметно превосходящий производительность обеих плат Geforce предыдущего поколения.

Новинка от компании Nvidia показывает в этих задачах довольно сильный результат, обойдя на 8-16% модель предыдущего поколения Geforce GTX 760, не говоря уже о GTX 660. А вот что касается сравнения с конкурентом от AMD, то тут положение снова печальное. Новинка способна конкурировать с Radeon R9 285 только в тесте Fur, а вот в тесте продвинутого параллакс-маппинга разница между решениями почти полуторакратная — в пользу платы AMD, разумеется.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два уже знакомых нам теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также еще два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нем используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в данном тесте зависит от количества и эффективности блоков TMU, влияет также и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает еще и эффективный филлрейт и пропускная способность памяти. Результаты при детализации уровня «High» получаются до полутора раза ниже, чем при «Low».

В задачах процедурной визуализации меха с большим количеством текстурных выборок, с выпуском видеочипов на базе архитектуры GCN компания AMD вырвалась вперед по производительности, и по сей день платы Radeon являются лидерами в этих сравнениях, что говорит о значительно более высокой эффективности выполнения ими этих программ. Такой вывод подтверждается и сегодняшним сравнением — представленная сегодня видеокарта Nvidia проиграла обоим конкурентам от AMD — даже слабой Radeon R9 270X.

В первом Direct3D 10 тесте новая видеоплата модели Geforce GTX 960 оказалась чуть медленнее своего ценового аналога из предыдущего поколения в виде GTX 760, но отставание невелико — 2-8%. Вероятно, такой результат объясним заметно меньшей скоростью текстурирования у GTX 960, да и по пропускной способности она отстаёт. Дело явно не в производительности блоков ALU. Зато GTX 660 осталась далеко позади.

Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: возможно, в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

В изменившихся условиях новая видеокарта модели Geforce GTX 960 уже опережает аналогичную модель из предыдущего поколения — GTX 760, оказываясь быстрейшей из плат Nvidia. В этот раз она быстрее предшественницы на 7-12%, да и отставание от конкурентов в виде Radeon R9 285 и R9 270X подсократилось, хоть и осталось — в подобных вычислениях чипы компании AMD очень сильны, они явно предпочитают попиксельные вычисления.

Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип еще примерно в два раза — такой режим называется «High».

Диаграмма в целом похожа на предыдущую, также без включения суперсэмплинга, и в этот раз новая Geforce GTX 960 оказалась ближе к GTX 760, проигрывая только в самых простых условиях, где сказывается недостаток ПСП. В сложных условиях новинка уже слегка опережает модель предыдущего поколения от Nvidia, не говоря уже о плате позапрошлой серии GTX 660. Но если брать сравнение с видеокартами AMD, то тут мало что изменилось — в этом случае всё примерно так же, как было и ранее в предыдущем тесте. Новинка GTX 960 уступает и Radeon R9 270X и R9 285. Посмотрим, что изменит включение суперсэмплинга:

При включении суперсэмплинга и самозатенения задача становится тяжелее, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьезное падение производительности. Разница между скоростными показателями протестированных видеокарт немного изменилась, включение суперсэмплинга сказывается меньше, чем в предыдущем случае.

И хотя графические решения AMD Radeon и в этом D3D10-тесте пиксельных шейдеров работают эффективнее, по сравнению с конкурирующими платами Geforce, но новый чип GM206 изменяет ситуацию в лучшую сторону — представленная плата Geforce GTX 960 на чипе архитектуры Maxwell стала на 10-24% быстрее предшествующей Geforce GTX 760, а старую GTX 660 обгоняет в полтора раза. Да и от соперничающих с ней Radeon отстаёт уже не так сильно, приближаясь хотя бы к младшей модели.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты предельных математических тестов чаще всего соответствуют разнице по частотам и количеству вычислительных блоков, но лишь примерно, так как на результаты влияет и разная эффективность их использования в конкретных задачах, и оптимизация драйверов, и новейшие системы управления частотами и питанием, и даже упор в ПСП. В случае теста Mineral, новая модель Geforce GTX 960 оказалась чуть быстрее платы GTX 760 из предыдущего поколения, которую заменила в линейке компании Nvidia, а GTX 660 осталась позади обеих.

И даже сравнение Geforce GTX 960 с конкурирующими платами компании AMD уже не такое печальное, как это было раньше. Обновление архитектуры Nvidia с Kepler до Maxwell привело к тому, что новые чипы в таких тестах приблизились к конкурирующим решениям от AMD. Но в этом математическом тесте плате на чипе GM206 не удалось показать все возможности из-за упора в ПСП, который не дал раскрыть истинную скорость ALU.

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нем только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Во втором нашем математическом тесте из RigthMark мы видим уже иные результаты видеокарт относительно друг друга. Так, новая Geforce GTX 960 уже заметно опережает не только GTX 660, но и GTX 760. Да и от Radeon R9 270X уже практически нет отставания. Хотя Radeon R9 285 продолжает оставаться лидером в тестах математических вычислений, но в целом в таких задачах новый видеочип Nvidia показал себя очень неплохо.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трех уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близкое к двукратному. Задача эта для мощных современных видеокарт очень простая, и производительность в ней ограничена скоростью обработки геометрии, а иногда и пропускной способностью памяти и/или филлрейтом.

Разница между результатами видеокарт на чипах Nvidia и AMD обычно есть в пользу решений калифорнийской компании, и она обусловлена отличиями в геометрических конвейерах чипов этих компаний. Но в данном случае, видеочипы Nvidia не топовые и имеют не слишком много блоков по обработке геометрии, поэтому и выигрыша не видно. Но всё равно, если в предыдущих тестах с пиксельными шейдерами платы AMD справлялись с работой зачастую лучше решений Nvidia, то тесты геометрии показывают, что в таких задачах платы Geforce конкурентоспособнее.

Новая модель Geforce GTX 960 слегка отстаёт от аналогичной платы GTX 760 из предыдущего поколения, обгоняя только GTX 660, а две видеокарты Radeon показывают вдвое отличающиеся результаты, что делает Radeon R9 285 лидером, а R9 270X — отстающим решением. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры улучшились и для плат AMD и для решений Nvidia, кроме Radeon R9 285. Впрочем, это ничего особенно не меняет. Видеокарты в этом тесте геометрических шейдеров слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, поэтому и выводы остаются прежними. Разве что к лидеру платы Nvidia подобрались явно поближе.

К сожалению, «Hyperlight» — второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load, в котором используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output, на всех современных видеокартах компании AMD просто не работает. В какой-то момент очередное обновление драйверов Catalyst привело к тому, что данный тест перестал запускаться на платах этой компании, и эта ошибка не исправлена вот уже несколько лет. Так что рассматриваем в этом тесте только результаты видеокарт Nvidia:

На диаграмме мы видим примерно то же самое, что и в тесте Galaxy — новая видеоплата на базе чипа GM206 оказалась примерно на уровне GTX 760, в сложных условиях даже обгоняя её. Разница между ними невелика, как и отставание Geforce GTX 660 от этой пары. Возможно, в тяжёлом режиме что-то изменится:

Действительно, в таких условиях результаты видеокарт компании Nvidia немного изменились, и разница между GTX 960 и GTX 760 увеличилась до 18%. Новая Geforce GTX 960 в тяжелых условиях явно быстрее подобной платы из прошлого поколения в виде Geforce GTX 760. В общем, в этих тестах новинка показала себя неплохо, эффективно справляясь с различными программами на основе геометрических шейдеров.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Предыдущие исследования показали, что на результаты этого теста может влиять и филлрейт и пропускная способность памяти, что особенно хорошо заметно по результатам Geforce GTX 960 в простых режимах. Новая видеокарта компании Nvidia в этом тесте показывает скорость явно ниже, чем аналогичная по рыночному позиционированию плата GTX 760 из предыдущего поколения, во всех режимах явно упираясь в ПСП — отставание составляет порядка 10-30%. И даже GTX 660 в двух из трёх режимов оказалась быстрее — именно из-за недостатка ПСП у новинки.

Рыночные же конкуренты новинки в виде Radeon R9 285 и R9 270X в этот раз оказались куда сильнее, опережая все платы от Nvidia, особенно в лёгком режиме. И только в тяжёлом режиме GTX 760 смогла достать R9 270X, что явно не получится записать Geforce в актив. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Ситуация на диаграмме очень сильно изменилась, решения компании AMD в тяжелых режимах потеряли значительно больше плат Geforce. Новая модель Geforce GTX 960 показала скорость выше конкурентов в сложном режиме, проиграв в лёгких из-за всё той же нехватки пропускной способности памяти. Если сравнивать новинку с решениями этой же компании из предыдущих поколений, то GTX 960 опережает обе платы в тяжёлом режиме, отставая в самом лёгком.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нем используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты во втором тесте вершинного текстурирования «Waves» не слишком похожи на то, что мы видели на предыдущих диаграммах. Скоростные показатели всех Geforce в этом тесте ухудшились, и новая модель Nvidia Geforce GTX 960 показывает скорость лишь на уровне древней GTX 660, но никак не GTX 760, отставая от последней на 30% — вот к чему привело решение по установке всего лишь 128-битной шины памяти и 64 блоков TMU в чип GM206. Если сравнивать новинку с конкурентами, то обе платы Radeon смогли показать лучшую производительность в этом тесте во всех режимах. Рассмотрим второй вариант этой же задачи:

С усложнением задачи во втором тесте текстурных выборок скорость всех решений стала ниже, и видеокарты Nvidia пострадали сильнее. Но в выводах меняется не слишком многое, новая модель Geforce GTX 960 отстаёт от GTX 760 даже ещё чуть больше — до 32%, да и в сравнении её с предшественницей из позапрошлой серии Geforce GTX 660, новинка проигрывает в двух из трёх режимов — дело явно в недостаточной скорости текстурирования и ПСП. Обе платы Radeon далеко впереди в этих тестах — у них то со скоростью текстурирования и особенно ПСП всё в порядке.

3DMark Vantage: тесты Feature

Синтетические тесты из пакета 3DMark Vantage покажут нам то, что мы ранее упустили. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10, до сих пор актуальны и интересны тем, что отличаются от наших. При анализе результатов видеокарты модели Geforce GTX 960 в этом пакете мы сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark. Feature Test 1: Texture Fill

Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Эффективность видеокарт AMD и Nvidia в текстурном тесте компании Futuremark достаточно высока и итоговые цифры разных моделей близки к соответствующим теоретическим параметрам. Увы, но 16%-ная разница в скорости между GTX 960 и GTX 760 оказалась в пользу решения предыдущего поколения, полностью в соответствии с теорией — у новинки банально меньше блоков TMU. Если же сравнивать GTX 960 с GTX 660, то рассматриваемая сегодня модель на основе чипа GM206 по текстурированию близка к видеокарте позапрошлого поколения, и лишь чуть-чуть опережает её.

Что же касается сравнения скорости текстурирования новой топовой видеоплаты Nvidia с близкими по цене решениями конкурента, то тут новинка также уступает даже слабому сопернику по ценовой нише — Radeon R9 270X, не говоря уже о R9 285, который в полтора раза быстрее. Сравнительно малое количество текстурных блоков в GM206 явно сказывается на итоговом результате. Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Цифры второго подтеста 3DMark Vantage показывают производительность блоков ROP, без учёта величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), поэтому тест измеряет именно производительность ROP. Это видно по результатам — рассматриваемая сегодня плата Geforce GTX 960 заметно опередила и GTX 660 и GTX 760, обогнав плату прошлого поколения на треть — это понятно, так как с количеством блоков ROP и эффективностью их работы в GPU архитектуры Maxwell всё в полном порядке.

Если сравнивать скорость заполнения сцены новой видеокартой Geforce GTX 960 с видеокартами AMD, то рассматриваемая нами сегодня плата в этом тесте показывает скорость заполнения сцены между показателями Radeon R9 270X и более дорогой Radeon R9 285. Хотя оптимизации по эффективности сжатия данных буфера кадра и большое количество блоков ROP сделали своё дело, но достать старшего из конкурентов не получилось. Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.

Этот тест из пакета 3DMark Vantage отличается от проведенных нами ранее тем, что результаты в нем зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен верный баланс GPU, а также эффективность выполнения сложных шейдеров.

В данном случае, важны и математическая и текстурная производительность, и в этой «синтетике» из 3DMark Vantage новая плата Geforce GTX 960 оказалась почти на четверть быстрее своего аналога на базе графического процессора архитектуры Kepler из семейства GTX 700, не говоря уже про Geforce GTX 660.

Новинка Nvidia показала результат на одном уровне с Radeon R9 270X и обе они почти 20% проигрывают старшей плате в виде Radeon R9 285. Это объясняется тем, что графические процессоры производства компании AMD в этой задаче работают несколько эффективнее чипов Nvidia. Feature Test 4: GPU Cloth

Четвертый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте также зависит сразу от нескольких параметров, и основными факторами влияния должны бы являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. То есть, сильные стороны чипов Nvidia должны проявляться, но увы — ничего такого мы не увидели, платы Nvidia показали не слишком высокую скорость. А новая модель Geforce GTX 960 так и вовсе показала результат хуже всех решений, отстав даже от GTX 660!

Сравнение с платами Radeon в этом тесте приводит к логичным выводам — несмотря на меньшее количество геометрических исполнительных блоков и отставание по геометрической производительности, по сравнению с конкурирующими решениями Nvidia, обе платы Radeon в этом тесте работают весьма эффективно и обгоняют все платы Geforce, представленные в сравнении. Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.

Во втором «геометрическом» тесте из 3DMark Vantage ситуация серьёзно изменилась, в этот раз все Geforce подтянулись к Radeon. Новая модель GTX 960 работает заметно лучше — новинка даже оказалась на пару процентов быстрее своего предшественника в лице GTX 760, и обе они опережают плату GTX 660 из позапрошлого поколения.

Да и сравнение новинки Nvidia с конкурирующими видеокартами от компании AMD в этот раз более позитивное, ведь она показала результат строго между двумя платами от компании-соперника. Новинка опережает Radeon R9 270X примерно на столько же, на сколько быстрее её более дорогая модель Radeon R9 285. Вот такие разные эти два теста: синтетический тест имитации тканей и тест с симуляцией системы частиц. Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических вычислений.

В этом случае производительность решений не полностью соответствует теории, но она близка к тому, что мы видели в других аналогичных тестах. В математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы видим иное распределение результатов, по сравнению с аналогичными тестами из нашего тестового пакета. Результат новинки Geforce GTX 960 почти совпадает со скоростью Radeon R9 270X.

Оно и понятно, видеочипы компании AMD с архитектурой GCN до сих пор справляются с подобными задачами лучше решений конкурента, особенно в тех случаях, когда выполняется интенсивная «математика». Но очередная модель компании Nvidia из семейства Geforce GTX 900 в этом тесте показала неплохой результат, на четверть обогнав Geforce GTX 760 и больше чем в 1,5 раза опередив GTX 660. И хотя этого не хватило, чтобы догнать Radeon R9 285, но разница в пользу решения AMD не так уж велика.

Direct3D 11: Вычислительные шейдеры

Чтобы протестировать анонсированное сегодня решение компании Nvidia в задачах, использующих такие возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы воспользовались примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, Nvidia и AMD.

Сначала мы рассмотрим тесты, использующие вычислительные (Compute) шейдеры. Их появление — одно из наиболее важных нововведений в последних версиях DX API, они уже используются в современных играх для выполнения различных задач: постобработки, симуляций и т. п. В первом тесте показан пример HDR-рендеринга с tone mapping из DirectX SDK, с постобработкой, использующей пиксельные и вычислительные шейдеры.

Скорость расчетов в вычислительном и пиксельном шейдерах для всех плат AMD и Nvidia давно уже приблизительно одинаковая, отличия наблюдались только у видеокарт на основе GPU предыдущих архитектур. Судя по нашим предыдущим тестам, результаты в задаче порой зависят не столько от математической мощи и эффективности вычислений, сколько от других факторов, вроде пропускной способности памяти.

Похоже, что в данном случае скорость видеокарт больше всего зависит от ПСП. Новая плата компании Nvidia в этом тесте отстаёт от обеих предшественниц в виде Geforce GTX 760 и GTX 660, уступая более новой 11-12%, что объяснимо теорией — ПСП новинки явно ниже. Если сравнивать Geforce GTX 960 с конкурентом в лице Radeon R9 285, то рассматриваемая сегодня плата калифорнийской компании отстаёт и от него.

Второй тест вычислительных шейдеров также взят из Microsoft DirectX SDK, в нем показана расчетная задача гравитации N тел (N-body) — симуляция динамической системы частиц, на которую воздействуют физические силы, такие как гравитация.

В этом тесте чаще всего наблюдается упор в скорость исполнения сложных математических вычислений, обработки геометрии и эффективность выполнения кода с ветвлениями. В этом DX11-тесте расклад сил между решениями двух разных компаний получился совершенно иной, да и среди плат Geforce соотношение необычное.

Решения компании Nvidia в этот раз явно сильнее, чем платы соперника, ведь даже старая Geforce GTX 660 близка к единственному Radeon. Ну а GTX 960 удивила на четверть большей производительностью, по сравнению с моделью предыдущего поколения в виде GTX 760. Похоже, что данная задача заметно эффективнее рассчитывается на графических процессорах архитектуры Maxwell, которые имеют в составе больше потоковых процессоров.

Direct3D 11: Производительность тесселяции

Вычислительные шейдеры очень важны, но еще одним важным нововведением в Direct3D 11 считается аппаратная тесселяция. Мы очень подробно рассматривали ее в своей теоретической статье про Nvidia GF100. Тесселяцию уже довольно давно начали использовать в DX11-играх, таких как STALKER: Зов Припяти, DiRT 2, Aliens vs Predator, Metro Last Light, Civilization V, Crysis 3, Battlefield 3 и других. В некоторых из них тесселяция используется для моделей персонажей, в других — для имитации реалистичной водной поверхности или ландшафта.

Существует несколько различных схем разбиения графических примитивов (тесселяции). Например, phong tessellation, PN triangles, Catmull-Clark subdivision. Так, схема разбиения PN Triangles используется в STALKER: Зов Припяти, а в Metro 2033 — Phong tessellation. Эти методы сравнительно быстро и просто внедряются в процесс разработки игр и существующие движки, поэтому и стали популярными.

Первым тестом тесселяции будет пример Detail Tessellation из ATI Radeon SDK. В нем реализована не только тесселяция, но и две разные техники попиксельной обработки: простое наложение карт нормалей и parallax occlusion mapping. Что ж, сравним DX11-решения AMD и Nvidia в различных условиях:

В тесте простого бампмаппинга скорость плат очень важна, так как эта задача давно стала слишком легкой и производительность в ней упирается в ПСП или филлрейт. Сегодняшний герой обзора незначительно на 9% уступает предшествующей модели Geforce GTX 760, почти на столько же обгоняя GTX 660, ну а решение конкурента в виде Radeon R9 285 оказалось быстрее всех.

Во втором подтесте с более сложными попиксельными расчетами новинка стала уже на 12% быстрее модели Geforce GTX 760, не говоря о GTX660, хотя всё так же заметно отстаёт от конкурирующей Radeon R9 285. Всё-таки эффективность выполнения математических вычислений в пиксельных шейдерах у чипов архитектуры GCN выше, чем у Kepler, хотя Maxwell слегка улучшил позиции решений Nvidia.

Удивила новинка в подтесте с применением лёгкой степени тесселяции — анонсированная плата Nvidia уступила абсолютно всем решениям, в том числе моделям предыдущего и позапрошлого поколения GTX 760 и GTX 660. Вероятно, сказывается недостаток пропускной способности, ибо уж текстурирование в этом тесте никак не влияет. Если сравнивать новинку с единственной платой производства AMD, то уступает ещё больше, так как в этом тесте тесселяции разбиение треугольников весьма умеренное.

Вторым тестом производительности тесселяции будет еще один пример для 3D-разработчиков из ATI Radeon SDK — PN Triangles. Собственно, оба примера входят также и в состав DX SDK, так что мы уверены, что на их основе создают свой код игровые разработчики. Этот пример мы протестировали с различным коэффициентом разбиения (tessellation factor), чтобы понять, как сильно влияет его изменение на общую производительность.

В этом тесте применяется более сложная геометрия, поэтому и сравнение геометрической мощи различных решений приносит другие выводы. Представленные в материале современные решения достаточно хорошо справляются с легкой и средней геометрической нагрузкой, показывая высокую скорость. И хотя в лёгких условиях графический процессор AMD в составе Radeon R9 285 отлично работает, опережая всех конкурентов, но в тяжёлых режимах платы Nvidia выходят вперёд с большим запасом. Так, в самых сложных режимах представленная сегодня Geforce GTX 960 показывает скорость заметно лучше, чем Radeon.

Что касается сравнения плат Nvidia различных поколений между собой, то рассматриваемая сегодня модель Geforce GTX 960 тоже наращивает преимущество с ростом геометрической нагрузки, так как в лёгком режиме упирается в ПСП. В итоге она опережает предшествующую плату Geforce GTX 760 в самом сложном режиме в полтора раза! Да и модель GTX 660 из позапрошлого поколения отстаёт от новинки примерно так же. Удивительно, но в самых лёгких тестах именно самая старая плата Nvidia показывает лучшие результаты.

Рассмотрим результаты еще одного теста — демонстрационной программы Nvidia Realistic Water Terrain, также известной как Island. В этой демке используется тесселяция и карты смещения (displacement mapping) для рендеринга реалистично выглядящей поверхности океана и ландшафта.

Тест Island не является чисто синтетическим тестом для измерения исключительно геометрической производительности GPU, так как он содержит и сложные пиксельные и вычислительные шейдеры в том числе, и такая нагрузка ближе к реальным играм, в которых используются все блоки GPU, а не только геометрические, как в предыдущих тестах геометрии. Хотя основной все равно остается именно нагрузка на блоки обработки геометрии, но может влиять и та же ПСП, например.

Мы тестируем все видеоплаты при четырех разных коэффициентах тесселяции — в данном случае настройка называется Dynamic Tessellation LOD. При первом коэффициенте разбиения треугольников, скорость не ограничена производительностью геометрических блоков, и видеокарта Radeon R9 285 показывает высокий результат, близкий к скорости лучшей из плат Nvidia и превосходящий результат анонсированной платы Geforce GTX 960, но уже на следующих ступенях геометрической нагрузки производительность платы Radeon снижается, и новинка Nvidia выходит вперёд.

Преимущество платы Nvidia на видеочипе GM206 в таких тестах уже весьма приличное, хоть и не многократное, как в случае топовых решений. Интересно, что если сравнить Geforce GTX 960 с GTX 760, то разница между их производительностью доходит до 30%, что не объяснить одной возросшей скоростью обработки геометрии. Подтверждается наше предположение о том, что графические процессоры Maxwell заметно эффективнее работают в режиме смешанной нагрузки, быстро переключаясь от исполнения графических задач к вычислительным и обратно.

***

Проанализировав результаты синтетических тестов новой видеокарты Nvidia Geforce GTX 960, основанной на новом графическом процессоре среднего уровня GM206, а также рассмотрев результаты других моделей видеокарт от обоих производителей дискретных видеочипов, можно сделать вывод о том, что рассматриваемая сегодня видеокарта может составить конкуренцию соперникам от компании AMD, став неплохой заменой для модели Geforce GTX 760.

Новая видеокарта компании Nvidia показывает неплохие (хоть и не идеальные) результаты в «синтетике», близкие к показателям этой платы прошлого поколения. По-настоящему слабых сторон у Geforce GTX 960 две, и обе они раскрылись в наших синтетических тестах. Во-первых, текстурная производительность решения на базе чипа GM206 явно ниже, чем у GTX 760, что особенно может сказываться в старых играх, требовательных к скорости блоков TMU.

А во-вторых, нехватка ПСП относительно даже решений Nvidia прошлого и позапрошлого поколений, явно ограничивающая скорость Geforce GTX 960 в некоторых случаях, которые вполне могут повториться и в игровых приложениях, особенно при высоком разрешении рендеринга и включенном сглаживании. Впрочем, для самого распространённого разрешения 1920x1080 при сглаживании методом MFAA, таких случаев не должно быть слишком много — для таких условий ПСП должно быть достаточно.

Что касается сравнения с платами Radeon, то у них разные сильные стороны. В большинстве тестов более сложный графический процессор AMD в составе модели Radeon R9 285 оказался быстрее, в том числе из-за большей пропускной способности памяти и скорости текстурирования, но также и эффективного исполнения вычислительных задач. В других случаях графический процессор архитектуры Maxwell берёт реванш — особенно это заметно в тестах геометрии. Впрочем, ситуация в реальных игровых приложениях будет отличаться от итогов синтетических тестов, но Geforce GTX 960 должен показать скорость примерно на уровне GTX 760 или чуть выше — в зависимости от задачи.

При всём этом, Geforce GTX 960 потребляет энергии гораздо меньше, чем тот же Radeon R9 285, и по энергоэффективности новая модель компании Nvidia выглядит столь же впечатляюще, что и топовые — инженеры Nvidia добились высочайшей эффективности чипов архитектуры Maxwell. Не нужно забывать о куда большей функциональности новинки Nvidia: DirectX 12, VXGI, MFAA, G-Sync, DSR, H.265 и т.д. С рыночной же точки зрения многое будет зависеть от реальных розничных цен в магазинах и сравнения производительности в игровых приложениях.

И как раз для того, чтобы оценить скорость новинки в играх, в следующей части нашего материала мы определим производительность Geforce GTX 960 в нашем наборе игровых проектов и сравним её с показателями конкурентов, оценив оправданность розничной цены новинки и верность решения по применению 128-битной шиной памяти.



Средняя текущая цена (количество предложений) в московской рознице:
Рассматриваемые картыКонкуренты
GTX 960 — $182 (на 01.06.16) R9 280 — $276(2)
GTX 960 — $182 (на 01.06.16) R9 285 — $213(5)
GTX 960 — $182 (на 01.06.16) GTX 760 — $212 (на 01.06.16)
GTX 960 — $182 (на 01.06.16) GTX 660 Ti — $309(2)
MSI GTX 960 Gaming — $243(74) GTX 960 — $182 (на 01.06.16)


Благодарим компанию Nvidia Russia
и лично Ирину Шеховцову
за предоставленную на тестирование видеокарту

2 блока питания Thermaltake DPS G 1050W/Амур 1200 для тестового стенда предоставлены компанией Thermaltake

Корпус Corsair Obsidian 800D Full Tower для тестового стенда предоставлен компанией Corsair

Модули памяти Corsair Vengeance CMZ16GX3M4X1600C9 для тестового стенда предоставлены компанией Corsair

Corsair Hydro SeriesT H100i CPU Cooler для тестового стенда предоставлен компанией Corsair

Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт

Системная плата Asus Sabertooth X79 для тестового стенда предоставлена компанией Asustek

Системная плата MSI X79A-GD45(8D) для тестового стенда предоставлена компанией MSI

Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate

Накопитель SSD OCZ Octane 512 ГБ для тестового стенда предоставлен компанией OCZ Russia

2 накопителя SSD Corsair Neutron SeriesT 120 ГБ для тестового стенда предоставлены компанией Corsair

Монитор Asus ProArt PA249Q для рабочего компьютера предоставлен компанией Asustek

Клавиатура Cougar 700K для рабочего компьютера предоставленa компанией Cougar




22 января 2015 Г.

Nvidia Geforce GTX 960. 2:

Nvidia Geforce GTX 960

2:

()

MSI Geforce GTX 960 Gaming 2G 2048 128- GDDR5 PCI-E
()
GPUGeforce GTX 960 (GM206)
PCI Express x16
GPU (ROPs), 1215—13421126—1178
( ()), 1750 (7000)1750 (7000)
, 128
GPU/ , 8/1215—13428/1126—1178
(ALU) 128
(ALU)1024
(BLF/TLF/ANIS)64
(ROP)32
, 270×125×35190×100×36
, 22
( 3D/ 2D/ «»), 124/50/18119/45/17
(/ 2D/ 2D ( )/ 3D), 20/20/21/23,5
1×DVI (Dual-Link/HDMI), 1×HDMI 2.0, 3×DisplayPort 1.21×DVI (Dual-Link/HDMI), 1×HDMI 2.0, 3×DisplayPort 1.2
SLI
/ 44
: 8- 1
: 6- 1
2D: DP/HDMI/Dual-Link DVI/Single-Link DVI3840×2400/3840×2400/2560×1600/1920×1200
3D: DP/HDMI/Dual-Link DVI/Single-Link DVI3840×2400/3840×2400/2560×1600/1920×1200

a e 2048  GDDR5 SDRAM, 4 2 ( 2 PCB).

Samsung (GDDR5). 1785 (7140) .

(reference)
MSI Geforce GTX 960 Gaming 2G 2048 128- GDDR5 PCI-E Reference card Nvidia Geforce GTX 960
MSI Geforce GTX 960 Gaming 2G 2048 128- GDDR5 PCI-E Reference card Nvidia Geforce GTX 960

- 128- , 3D- 15 . . Nvidia . ? , , , 192-, 192 , 128: — 6. 32-, . 4 , 128-. , GM206 192 , 128, GPU - 128- . , , (GTX 965 GTX 960 Ti) GPU GM206, 192- .

. 4-, SFC (Super Ferrite Choke), GPU. MSI. 8- 6- ( ). , , , ( ) 128- GPU.

, MSI, TwinFrozr. , , . , .

, , GPU 60-62 .

, .

6- GPU 63 , .
EVGA PrecisionX ( . AKA Unwinder)

  • , .
  • , , , .
  • — 20 — .
  • 50 .
  • :
    1. 2D: - - iXBT.com, Microsoft Word, -.
    2. 2D : SmoothVideo Project (SVP) ( ).
    3. 3D : FurMark.

2D , 30 °, — .

60 °, 800 , , . 21 .

3D 63 °, — 1000 , 23,5 .

.
, . ( ) ( , , DVI-to-VGA). : War Face — - .

  • Intel Core i7-3960X (Socket 2011):
    • 2 Intel Core i7-3960X (o/c 4 );
    • Hydro SeriesT H100i Extreme Performance CPU Cooler;
    • Intel Thermal Solution RTS2011LC;
    • Asus Sabertooth X79 Intel X79;
    • MSI X79A-GD45(8D) Intel X79;
    • 16 DDR3 Corsair Vengeance CMZ16GX3M4A1600C9 1600 ;
    • Seagate Barracuda 7200.14 3 SATA2;
    • WD Caviar Blue WD10EZEX 1 T SATA2;
    • 2 SSD Corsair Neutron SSD CSSD-N120GB3-BK;
    • Thermaltake 1200 (1200 );
    • Thermaltake Toughpower DPS G 1050W (1050 );
    • Corsair Obsidian 800D Full Tower.
  • Windows 7 64-; DirectX 11.1;
  • Samsung U28D590D (28″);
  • Asus ProArt PA249Q (24″);
  • Cougar 700K;
  • AMD Catalyst 14.12,
  • Nvidia 347.25,
  • VSync .


:

RightMark3D 2.0 MS Visual Studio 2005 runtime, DirectX runtime.

DirectX 11 SDK Microsoft AMD, Nvidia. -, HDRToneMappingCS11.exe NBodyGravityCS11.exe DirectX SDK (February 2010). : Nvidia AMD. ATI Radeon SDK DetailTessellation11 PNTriangles11 ( DirectX SDK). Nvidia — Realistic Water Terrain, , Island11.

:

  • Geforce GTX 960 ( GTX 960)
  • Geforce GTX 760 ( GTX 760)
  • Geforce GTX 660 ( GTX 660)
  • Radeon R9 285 ( R9 285)
  • Radeon R9 270X ( R9 270X)

Geforce GTX 960 . Geforce GTX 760 GTX 700, Kepler . GTX 660, — , .

AMD . . , Geforce GTX 960 Radeon R9 285, . Radeon R9 270X , , Nvidia GPU .

Direct3D 9: Pixel Shaders

() 3DMark Vantage , , , : 1.1, 1.4 2.0, , .

GPU , . . , Nvidia .

Nvidia Kepler 10-15% - , , , , 20%. GTX 660 , . Radeon R9 285 , . :

, Nvidia — 16%, — ( 20%). Cook-Torrance , ALU , GTX 960 , GTX 760. , AMD, Geforce Maxwell Radeon R9 285, GM206.

Water, , , Geforce . GTX 660 ! , GTX 960 . , , AMD.

Direct3D 9: Pixel Shaders 2.0

DirectX 9 , , , . 2.0:

  • Parallax Mapping — , « 3D-».
  • Frozen Glass — .

: . , :

— , ALU, , . , GCN AMD Nvidia Kepler, Maxwell Geforce.

«Frozen Glass» Nvidia - , Radeon. Geforce GTX 760, GTX 660 Radeon.

«Parallax Mapping» Geforce GTX 960 , GTX 760, , . Radeon R9 285 , . :

Nvidia , , Radeon. , Geforce GTX 960 GTX 760, GM206 TMU, . Geforce GTX 660 , . Radeon R9 285 .

, , . , 3.0, Direct3D 9. , . , ALU, , :

  • Steep Parallax Mapping — «» parallax mapping, « 3D-».
  • Fur — , .

. DX9- RightMark, Nvidia , Geforce .

Nvidia , 8-16% Geforce GTX 760, GTX 660. AMD, . Radeon R9 285 Fur, - — AMD, .

Direct3D 10: PS 4.0 (, )

RightMark3D PS 3.0 Direct3D 9, DirectX 10, . , .

( ) ALU. , .

Fur. 15 30 . Effect detail — «High» 40—80, «» — 60—120 , «High» SSAA «» — 160 320 .

, , «Low» «High» .

TMU, . . «High» , «Low».

, GCN AMD , Radeon , . — Nvidia AMD — Radeon R9 270X.

Direct3D 10 Geforce GTX 960 GTX 760, — 2-8%. , GTX 960, . ALU. GTX 660 .

, «» , : , - , :

Geforce GTX 960 — GTX 760, Nvidia. 7-12%, Radeon R9 285 R9 270X , — AMD , .

DX10- Steep Parallax Mapping. 10 50 . , . 80 400 , . :

- Direct3D 10 , parallax mapping , , steep parallax mapping, , Crysis Lost Planet. , , , , — «High».

, , Geforce GTX 960 GTX 760, , . Nvidia, GTX 660. AMD, — , . GTX 960 Radeon R9 270X R9 285. , :

, , . , , .

AMD Radeon D3D10- , Geforce, GM206 — Geforce GTX 960 Maxwell 10-24% Geforce GTX 760, GTX 660 . Radeon , .

Direct3D 10: PS 4.0 ()

TMU. , , .

— Mineral. , 65 sin cos.

, , , , , . Mineral, Geforce GTX 960 GTX 760 , Nvidia, GTX 660 .

Geforce GTX 960 AMD , . Nvidia Kepler Maxwell , AMD. GM206 - , ALU.

, Fire. ALU, , sin cos , 130. , :

RigthMark . , Geforce GTX 960 GTX 660, GTX 760. Radeon R9 270X . Radeon R9 285 , Nvidia .

Direct3D 10:

RightMark3D 2.0 , «Galaxy», «point sprites» Direct3D. GPU, , . DirectX 10.

, , . «GS load» , — . .

«Galaxy», , :

, , FPS . , , / .

Nvidia AMD , . , Nvidia , . , AMD Nvidia, , Geforce .

Geforce GTX 960 GTX 760 , GTX 660, Radeon , Radeon R9 285 , R9 270X — . , :

AMD Nvidia, Radeon R9 285. , . GS load, , . Nvidia .

, «Hyperlight» — , : instancing, stream output, buffer load, , Direct3D 10 — stream output, AMD . - Catalyst , , . Nvidia:

, Galaxy — GM206 GTX 760, . , Geforce GTX 660 . , - :

, Nvidia , GTX 960 GTX 760 18%. Geforce GTX 960 Geforce GTX 760. , , .

Direct3D 10:

«Vertex Texture Fetch» . , , «Earth» «Waves» . displacement mapping , , «Waves» , «Earth» — .

«Earth», «Effect detail Low»:

, , Geforce GTX 960 . Nvidia , GTX 760 , — 10-30%. GTX 660 — - .

Radeon R9 285 R9 270X , Nvidia, . GTX 760 R9 270X, Geforce . :

, AMD Geforce. Geforce GTX 960 , - . , GTX 960 , .

. «Waves» , . 14 («Effect detail Low») 24 («Effect detail High») . .

«Waves» , . Geforce , Nvidia Geforce GTX 960 GTX 660, GTX 760, 30% — 128- 64 TMU GM206. , Radeon . :

, Nvidia . , Geforce GTX 960 GTX 760 — 32%, Geforce GTX 660, — . Radeon — .

3DMark Vantage: Feature

3DMark Vantage , . Feature DirectX 10, , . Geforce GTX 960 - , RightMark.

Feature Test 1: Texture Fill

. , , .

AMD Nvidia Futuremark . , 16%- GTX 960 GTX 760 , — TMU. GTX 960 GTX 660, GM206 , - .

Nvidia , — Radeon R9 270X, R9 285, . GM206 .

Feature Test 2: Color Fill

— . , . (render target) -. 16- FP16, , HDR-, .

3DMark Vantage ROP, (. . « »), ROP. — Geforce GTX 960 GTX 660 GTX 760, — , ROP GPU Maxwell .

Geforce GTX 960 AMD, Radeon R9 270X Radeon R9 285. ROP , .

Feature Test 3: Parallax Occlusion Mapping

feature-, . (, ) Parallax Occlusion Mapping, . . Strauss. , , Strauss.

3DMark Vantage , , , . GPU, .

, , «» 3DMark Vantage Geforce GTX 960 Kepler GTX 700, Geforce GTX 660.

Nvidia Radeon R9 270X 20% Radeon R9 285. , AMD Nvidia.

Feature Test 4: GPU Cloth

, ( ) . , , . stream out . , stream out.

, . , Nvidia , — , Nvidia . Geforce GTX 960 , GTX 660!

Radeon — , Nvidia, Radeon Geforce, .

Feature Test 5: GPU Particles

, . , . Stream out , . , , .

RightMark3D 2.0, , , . , stream out.

«» 3DMark Vantage , Geforce Radeon. GTX 960 — GTX 760, GTX 660 .

Nvidia AMD , -. Radeon R9 270X , Radeon R9 285. : .

Feature Test 6: Perlin Noise

feature- Vantage - , Perlin noise . . Perlin noise — , , .

, , . Futuremark, , , . Geforce GTX 960 Radeon R9 270X.

, AMD GCN , , «». Nvidia Geforce GTX 900 , Geforce GTX 760 1,5 GTX 660. , Radeon R9 285, AMD .

Direct3D 11:

Nvidia , DirectX 11, , (SDK) Microsoft, Nvidia AMD.

, (Compute) . — DX API, : , . . HDR- tone mapping DirectX SDK, , .

AMD Nvidia , GPU . , , , .

, . Nvidia Geforce GTX 760 GTX 660, 11-12%, — . Geforce GTX 960 Radeon R9 285, .

Microsoft DirectX SDK, N (N-body) — , , .

, . DX11- , Geforce .

Nvidia , , Geforce GTX 660 Radeon. GTX 960 , GTX 760. , Maxwell, .

Direct3D 11:

, Direct3D 11 . Nvidia GF100. DX11-, STALKER: , DiRT 2, Aliens vs Predator, Metro Last Light, Civilization V, Crysis 3, Battlefield 3 . , — .

(). , phong tessellation, PN triangles, Catmull-Clark subdivision. , PN Triangles STALKER: , Metro 2033 — Phong tessellation. , .

Detail Tessellation ATI Radeon SDK. , : parallax occlusion mapping. , DX11- AMD Nvidia :

, . 9% Geforce GTX 760, GTX 660, Radeon R9 285 .

12% Geforce GTX 760, GTX660, Radeon R9 285. - GCN , Kepler, Maxwell Nvidia.

— Nvidia , GTX 760 GTX 660. , , . AMD, , .

3D- ATI Radeon SDK — PN Triangles. , DX SDK, , . (tessellation factor), , .

, . , . AMD Radeon R9 285 , , Nvidia . , Geforce GTX 960 , Radeon.

Nvidia , Geforce GTX 960 , . Geforce GTX 760 ! GTX 660 . , Nvidia .

— Nvidia Realistic Water Terrain, Island. (displacement mapping) .

Island GPU, , , GPU, , . , , .

— Dynamic Tessellation LOD. , , Radeon R9 285 , Nvidia Geforce GTX 960, Radeon , Nvidia .

Nvidia GM206 , , . , Geforce GTX 960 GTX 760, 30%, . , Maxwell , .

***

Nvidia Geforce GTX 960, GM206, , , AMD, Geforce GTX 760.

Nvidia ( ) «», . - Geforce GTX 960 , . -, GM206 , GTX 760, , TMU.

-, Nvidia , Geforce GTX 960 , , . , 1920x1080 MFAA, — .

Radeon, . AMD Radeon R9 285 , - , . Maxwell — . , , Geforce GTX 960 GTX 760 — .

, Geforce GTX 960 , Radeon R9 285, Nvidia , — Nvidia Maxwell. Nvidia: DirectX 12, VXGI, MFAA, G-Sync, DSR, H.265 .. .

, , Geforce GTX 960 , 128- .



( ) :
GTX 960 — R9 280 —
GTX 960 — R9 285 —
GTX 960 — GTX 760 —
GTX 960 — GTX 660 Ti —
MSI GTX 960 Gaming — GTX 960 —



2 Thermaltake DPS G 1050W/ 1200 Thermaltake

Corsair Obsidian 800D Full Tower Corsair

Corsair Vengeance CMZ16GX3M4X1600C9 Corsair

Corsair Hydro SeriesT H100i CPU Cooler Corsair

Dell UltraSharp U3011

Asus Sabertooth X79 Asustek

MSI X79A-GD45(8D) MSI

Seagate Barracuda 7200.14 3 Seagate

SSD OCZ Octane 512 OCZ Russia

2 SSD Corsair Neutron SeriesT 120 Corsair

Asus ProArt PA249Q Asustek

Cougar 700K a Cougar