Видеоускоритель Nvidia GeForce GTX 950

Часть 2: особенности карты


Содержание

Данная часть знакомит читателей с особенностями видеокарты, а также с результатами синтетических тестов.

Устройство(а)


MSI GeForce GTX 950 Gaming 2G 2048 МБ 128-битной GDDR5 PCI-E
ПараметрЗначениеНоминальное значение (референс)
GPUGeForce GTX 950 (GM206)
ИнтерфейсPCI Express x16
Частота работы GPU (ROPs), МГц1126—13661024—1277
Частота работы памяти (физическая (эффективная)), МГц1663 (6652)1650 (6600)
Ширина шины обмена с памятью, бит128
Число вычислительных блоков в GPU6
Число операций (ALU) в блоке128
Суммарное количество блоков ALU768
Число блоков текстурирования (BLF/TLF/ANIS)48
Число блоков растеризации (ROP)32
Размеры, мм270×120×35190×100×36
Количество слотов в системном блоке, занимаемые видеокартой22
Цвет текстолитачерныйчерный
ЭнергопотреблениеПиковое в 3D, Вт9192
В режиме 2D, Вт3335
В режиме «сна», Вт1212
Уровень шумаВ режиме 2D, дБА2020
В режиме 2D (просмотр видео), дБА2020
В режиме максимального 3D, дБА21.532
Выходные гнезда1×DVI (Dual-Link/HDMI), 1×HDMI 2.0, 3×DisplayPort 1.21×DVI (Dual-Link/HDMI), 1×HDMI 2.0, 3×DisplayPort 1.2
Поддержка многопроцессорной работыSLI
Максимальное количество приемников/мониторов для одновременного вывода изображения44
Дополнительное питание: количество 8-контактных разъемовНетНет
Дополнительное питание: количество 6-контактных разъемов11
Максимальное разрешение 2DDisplay Port4096×2160
HDMI4096×2160
Dual-Link DVI2560×1600
Максимальное разрешение 3DDisplay Port4096×2160
HDMI4096×2160
Dual-Link DVI2560×1600

Комплектация локальной памятью
Картa имеeт 2048 МБ памяти GDDR5 SDRAM, размещенной в 4 микросхемах по 4 Гбит (по 2 на каждой стороне PCB).

Микросхемы памяти Samsung (GDDR5). Микросхемы расчитаны на номинальную частоту работы в 1785 (7140) МГц.

Сравнение с эталонным дизайном (reference)
Вид спереди
MSI GeForce GTX 950 Gaming 2G 2048 МБ 128-битной GDDR5 PCI-E Reference card Nvidia GeForce GTX 960
Вид сзади
MSI GeForce GTX 950 Gaming 2G 2048 МБ 128-битной GDDR5 PCI-E Reference card Nvidia GeForce GTX 960

Поскольку GeForce GTX 950 как бы получился из GTX 960, имея лишь урезанное ядро, то мы сравниваем нашу карту именно с референс-образцом GTX 960. Очевидно, что кроме внесения изменений инженерами MSI в части системы питания, мало чего изменилось.

Схема питания стала 4-фазной, использует дроссельные катушки SFC (Super Ferrite Choke), управляется цифровым контроллером NCP81174 производства ON Semiconductor.

Система охлаждения
Линейка Gaming ускорителей от MSI всегда комплектуется кулерами серии TwinFrozr. Карта вместе с таким кулером занимает два слота в системном блоке, радиатор выполнен из большого количества пластин, покрытых никелем. В подошву впрессованы тепловые трубки, помогающие распределять тепло по периферийным пластинам.

Сверху надет кожух с двумя вентиляторами, при этом СО обладает очень полезным свойством останавливать вентиляторы, если температура GPU ниже 60-62 градусов. В случае необходимости вентилятор с красным ободом можно снять без демонтажа всей СО с видеокарты. Хотя, как мы видим, кулер и так практически бесшумен.

Микросхемы памяти не имеют охлаждения, а силовые транзисторы охлаждаются специальным радиатором.

После 6-часового прогона под нагрузкой максимальная температура GPU не превысила 63 градусов, что является отличным результатом для такого рода ускорителей.
Мониторинг температурного режима с помощью MSI Afterburner (автор А. Николайчук AKA Unwinder)

Методика измерения шума

  • Помещение шумоизолировано и заглушено, снижены реверберации.
  • Системный блок, в котором исследовался шум видеокарт, не имеет вентиляторов, не является источником механического шума.
  • Фоновый уровень 20 дБА — это уровень шума в комнате и уровень шумов собственно шумомера.
  • Измерения проводились на расстоянии 50 см от видеокарты на уровне системы охлаждения.
  • Режимы измерения:
    1. Режим простоя в 2D: загружен интернет-браузер с сайтом iXBT.com, окно Microsoft Word, ряд интернет-коммуникаторов.
    2. Режим 2D с просмотром фильмов: используется SmoothVideo Project (SVP) — аппаратное декодирование со вставкой промежуточных кадров.
    3. Режим 3D с максимальной нагрузкой на ускоритель: используется тест FurMark.

В режиме простоя в 2D вентиляторы не работали, при этом температура графического ядра не поднималась выше 50 градусов, а шум был равен фоновому.

При просмотре фильма с аппаратным декодированием температура графического ядра медленно вырастала до 62 градусов, вентиляторы включались на короткое время и снова выключались, шум оставался близким к фоновому.

В режиме максимальной нагрузки в 3D температура достигала уровня 63 °C, частота вращения вентиляторов составляла 778 оборотов в минуту, шум был в пределах фонового - 21.5 дБА. В целом СО безусловно относится к категории практически бесшумных.

Термоснимок



Хорошо видно, что наиболее нагретая область — в районе GPU. Размытость снимка снова объясняется невозможностью нормально сфокусироваться на задней поверхности карты.


Комплектация
Базовый комплект поставки должен включать в себя руководство пользователя, диск с драйверами и утилитами. Мы видим базовый комплект плюс переходник DVI-to-VGA.

Упаковка

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

В качестве синтетических тестов DirectX 11 мы использовали примеры из пакетов SDK компаний Microsoft и AMD, а также демонстрационную программу NVIDIA. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010). Мы взяли и приложения обоих производителей видеочипов: NVIDIA и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании NVIDIA — Realistic Water Terrain, также известная, как Island11.

Синтетические тесты проводились на следующих видеокартах:

  • GeForce GTX 950 со стандартными параметрами (сокращенно GTX 950)
  • GeForce GTX 960 со стандартными параметрами (сокращенно GTX 960)
  • GeForce GTX 750 Ti со стандартными параметрами (сокращенно GTX 750 Ti)
  • Radeon R7 370 со стандартными параметрами (сокращенно R7 370)

Для анализа производительности новой модели видеокарты GeForce GTX 950 нами были выбраны именно эти решения по следующим причинам. GeForce GTX 750 Ti является соседкой новинки по ценовой линейке снизу, она принадлежит к предыдущему семейству GTX 700 и основана на графическом процессоре архитектуры Maxwell первого поколения. Вторая же модель от NVIDIA, которую мы выбрали для сравнения, имеет в своём составе такой же графический процессор GM206, но в полноценном варианте, и стоит эта видеокарта чуть дороже рассматриваемой новинки.

От конкурирующей компании AMD в этот раз мы выбрали лишь одну модель видеокарты для нашего сравнения — просто потому, что ценовой конкурент у GeForce GTX 950 один, а почти все платы AMD текущей линейки являются переименованными решениями предыдущего поколения. Итак, основным ценовым конкурентом для рассматриваемой сегодня видеокарты NVIDIA является модель Radeon R7 370, и наше сравнение будет интересно скорее с рыночной точки зрения, так как технически плата компании AMD уже порядком устарела.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Какое-то время назад мы отказались от устаревших DirectX 9 тестов, так как современные видеокарты показывают в них не слишком показательные результаты, будучи зачастую ограничены ПСП, филлрейтом или текстурированием. Кроме того, под такие задачи уже давно не оптимизируют видеодрайверы, не говоря уже о том, что двухчиповые видеокарты далеко не всегда корректно работают в таких приложениях.

Во вторую версию RightMark3D вошли два уже знакомых нам теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также еще два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нем используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в данном тесте зависит от количества и эффективности блоков TMU, влияет также и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает еще и эффективный филлрейт и пропускная способность памяти. Результаты при детализации уровня «High» получаются до полутора раза ниже, чем при «Low».

С выпуском видеочипов на базе архитектуры GCN, в задачах процедурной визуализации меха с большим количеством текстурных выборок компания AMD вырвалась вперед по производительности, вот и сегодня единственная плата Radeon стала лидером в этом сравнении, что говорит о значительно более высокой эффективности выполнения этих программ графическими процессорами AMD. Представленная сегодня видеокарта NVIDIA проиграла конкуренту от AMD не очень много, но ощутимо.

В первом Direct3D 10 тесте новая видеоплата модели GeForce GTX 950 оказалась на 16-17% медленнее своей старшей сестры в виде GTX 960 — этот результат объясним заметно меньшей скоростью текстурирования и математических вычислений у GTX 950, а по другим параметрам она отстаёт не слишком сильно. Зато GeForce GTX 750 Ti на чипе Maxwell первого поколения осталась далеко позади.

Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: возможно, в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

В изменившихся условиях новая видеокарта модели GeForce GTX 950 опережает модель предыдущего поколения GTX 750 Ti ещё заметнее, уступая старшей из плат NVIDIA те же 16-17%. Отставание от конкурента в виде Radeon R7 370 если и сократилось, то всё равно осталось весьма значительным — в подобных вычислениях чипы компании AMD очень сильны, они явно предпочитают попиксельные вычисления.

Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип еще примерно в два раза — такой режим называется «High».

Диаграмма в целом в чём-то похожа на предыдущую, также без включения суперсэмплинга, и в этот раз новая GeForce GTX 950 оказалась на тех же позициях: ощутимо быстрее GTX 750 Ti и GTX 960 и R7 370. Но разница между видеокартами на основе графического процессора GM206 составляет уже 14-18%, в зависимости от условий (в тяжёлых отставание больше). Если брать сравнение с видеокартой компании AMD, то тут немногое изменилось — и в этом случае всё примерно так же, как было в предыдущем тесте — новинка явно уступает Radeon R7 370. Посмотрим, что изменит включение суперсэмплинга:

При включении суперсэмплинга и самозатенения задача становится тяжелее, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьезное падение производительности. Разница между скоростными показателями протестированных видеокарт немного изменилась, включение суперсэмплинга сказывается меньше, чем в предыдущем случае.

Хотя графические решения AMD Radeon и в этом D3D10-тесте пиксельных шейдеров работают эффективнее, по сравнению с конкурирующими платами GeForce, именно в таких усложнившихся условиях последние явно начинают их догонять. Так, новый чип GM206 в полном своём варианте взял верх над Pitcairn — плата GeForce GTX 960 на чипе архитектуры Maxwell чуть быстрее Radeon R7 370. Новинка же базируется на урезанном чипе GM206, поэтому отстаёт до 20% от старшего варианта. Зато GeForce GTX 750 Ti она обгоняет более чем в полтора раза.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты предельных математических тестов чаще всего соответствуют разнице по частотам и количеству вычислительных блоков, но лишь примерно, так как на результаты влияет и разная эффективность их использования в конкретных задачах, и оптимизация драйверов, и новейшие системы управления частотами и питанием, и даже упор в ПСП. В случае теста Mineral, новая модель GeForce GTX 950 оказалась заметно медленнее платы GTX 960 из этого же поколения, основанной на полноценном чипе GM206. Да и GTX 750 Ti оказалась удивительно близка к новинке.

Ещё более неожиданным оказался проигрыш конкурирующей с GTX 950 видеоплатой компании AMD. Обновление архитектуры NVIDIA с Kepler до Maxwell привело к тому, что новые чипы в таких тестах не просто приблизились к конкурирующим решениям от AMD, но уже и побеждают их в ряде случаев. В этом математическом тесте плате на урезанном чипе GM206 удалось показать свои сильные стороны и опередить конкурента в виде Radeon R7 370!

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нем только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Во втором математическом тесте из нашего пакета RigthMark 2.0 мы видим уже несколько иные результаты видеокарт относительно друг друга. Так, новая GeForce GTX 950 уже заметно опережает GTX 750 Ti, продолжая отставать на 20% от старшей модели GTX 960. И выигрыш над Radeon R7 370 примерно такой же — более 10%. Удивительно, но в таких задачах новое решение NVIDIA из данного ценового диапазона показало себя очень неплохо.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трех уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близкое к двукратному. Задача эта для мощных современных видеокарт очень простая, и производительность в ней ограничена скоростью обработки геометрии, а иногда и пропускной способностью памяти и/или филлрейтом.

Разница между результатами видеокарт на чипах NVIDIA и AMD обычно есть в пользу решений калифорнийской компании, и она обусловлена отличиями в геометрических конвейерах чипов этих компаний. Хотя в данном случае видеочипы NVIDIA не топовые и имеют не слишком много блоков по обработке геометрии, поэтому выигрыш не слишком большой, но он есть. Если в некоторых из предыдущих тестов с пиксельными шейдерами платы AMD справлялись с работой зачастую лучше решений NVIDIA, то тесты геометрии показывают, что в таких задачах платы GeForce заметно конкурентоспособнее.

Так, новая модель GeForce GTX 950 лишь на 5% отстаёт от платы GTX 960 на основе полноценного чипа GM206, а плата GeForce GTX 750 Ti предыдущего поколения остаётся далеко позади. Но даже она обгоняет конкурирующую видеокарту Radeon R7 370, которая стала аутсайдером в этом тесте. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры улучшились и для плат AMD и для решений NVIDIA, хотя это ничего особенного и не поменяло. Видеокарты в этом тесте геометрических шейдеров довольно слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, поэтому и выводы остаются прежними: GeForce GTX 950 мало отстаёт от GTX 960, заметно опережая и GTX 750 Ti и главного ценового конкурента — Radeon R7 370.

К сожалению, «Hyperlight» — второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load, в котором используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output, на всех современных видеокартах компании AMD просто не работает. В какой-то момент очередное обновление драйверов Catalyst привело к тому, что данный тест перестал запускаться на платах этой компании, и эта ошибка не исправлена вот уже несколько лет. Так что рассматриваем в этом тесте только результаты видеокарт NVIDIA:

Интересно, что в этом тесте расклад на диаграмме совершенно другой, чем в тесте Galaxy — новая видеоплата на базе урезанного чипа GM206 уступила старшей модели GTX 960 аж 28-33%. Правда, GTX 750 Ti всё равно отстаёт от новинки, но уже совсем не так сильно. Можно сказать, что GTX 950 в этот раз оказалась ровно посередине между своими соседями по семейству GeForce. Возможно, в тяжёлом режиме что-то изменится:

Действительно, в таких условиях результаты видеокарт заметно изменились, и разница между GTX 950 и GTX 960 нивелировалась до 9-12%. Неудивительно, что GTX 750 Ti в таком случае серьёзно отстала от рассматриваемой сегодня модели. Новая GeForce GTX 950 в более тяжелых условиях явно быстрее подобной платы на базе чипа Maxwell первого поколения. В целом, в тестах геометрии новинка показала себя достаточно неплохо, эффективно справляясь с различными программами на основе геометрических шейдеров.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Предыдущие исследования показали, что на результаты этого теста может влиять и филлрейт и пропускная способность памяти, что хорошо заметно по результатам видеокарт GeForce в простых режимах. Новая видеокарта компании NVIDIA в этом тесте показывает скорость до 10% ниже, чем GeForce GTX 960, что вполне объяснимо теорией. GTX 750 Ti из предыдущего поколения отстала от пары решений на чипе GM206 не слишком сильно, все они во всех режимах явно упираются в ПСП, особенно в лёгких.

Рыночный конкурент новинки в виде Radeon R7 370 в этот раз сильнее в лёгком режиме (опередил все платы от NVIDIA), но в среднем они уже сравнимы, а в тяжёлом режиме решение AMD уже так и вовсе уже отстаёт от представленной недавно модели GeForce GTX 950. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Ситуация на диаграмме очень сильно изменилась, решение компании AMD в тяжелых режимах потеряло значительно больше всех плат NVIDIA. Новая модель GeForce GTX 950 показала скорость на 8-13% ниже, чем GTX 960, и примерно так же обошла GTX 750 Ti. Это не относится к лёгкому режиму из-за всё упора всех GeForce во что-то странное. Если сравнивать новинку с конкурирующим решением компании AMD, то можно сказать, что GeForce GTX 950 явно опережает плату Radeon R7 370 в тяжёлых режимах, эти платы равны только в самом лёгком варианте теста.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нем используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты во втором тесте вершинного текстурирования «Waves» вообще не похожи на то, что мы видели на предыдущих диаграммах. Скоростные показатели всех GeForce в этом тесте заметно ухудшились, а новая модель NVIDIA GeForce GTX 950 и вовсе чуть не стала худшей среди всех. От GeForce GTX 960 она отстаёт на 5-9%, показывая в среднем режиме скорость лишь на уровне GTX 750 Ti, и только в тяжёлом режиме обгоняя её. Если сравнивать новинку с конкурентом в лице Radeon R7 370, то решение AMD смогло показать лучшую производительность в этом тесте во всех режимах. Рассмотрим второй вариант этой же задачи:

С усложнением задачи во втором тесте текстурных выборок скорость всех решений стала ниже, и видеокарты NVIDIA пострадали сильнее. Хотя в выводах меняется не слишком многое, новая модель GeForce GTX 950 отстаёт от GTX 960 те же 5-10%, объяснимые теорией, а GeForce GTX 750 Ti близка к ней в среднем и лёгком режимах. Единственная плата Radeon, представленная в нашем сегодняшнем тестировании, оказалась далеко впереди во всех условиях этого теста — с вершинным текстурированием дела у неё обстоят явно лучше, чем у свежей модели NVIDIA.

3DMark Vantage: тесты Feature

Синтетические тесты из пакета 3DMark Vantage покажут нам то, что мы ранее упустили. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10, до сих пор актуальны и интересны тем, что отличаются от наших. При анализе результатов видеокарты модели GeForce GTX 950 в этом пакете мы сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark.

Feature Test 1: Texture Fill

Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Эффективность видеокарт AMD и NVIDIA в текстурном тесте компании Futuremark достаточно высока и итоговые цифры разных моделей близки к соответствующим теоретическим параметрам. Разница в скорости между GTX 950 и GTX 960 оказалась равна 26% в пользу старшего решения на том же чипе, что соответствует теоретической разнице — у новинки меньше активных блоков TMU. Если сравнивать GTX 950 с GTX 750 Ti, то рассматриваемая сегодня модель на основе чипа GM206 по текстурированию примерно настолько же опередила видеокарту прошлого поколения, насколько отстала от GTX 960.

Что же касается сравнения скорости текстурирования новой бюджетной видеоплаты NVIDIA с самым близким по цене решением конкурента, то GeForce GTX 950 заметно уступает своему сопернику по ценовой нише в лице Radeon R7 370 — сказывается сравнительно малое количество текстурных блоков в GM206-250.

Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Цифры второго подтеста 3DMark Vantage показывают производительность блоков ROP, без учёта величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), поэтому тест измеряет именно производительность ROP. Рассматриваемая сегодня плата GeForce GTX 950 почти не отстала от старшей GTX 960, так как по количеству блоков ROP между ними нет никакой разницы, да и турбо-частота для GPU близкая. Новинка заметно опередила и GTX 750 Ti, более чем вдвое обогнав плату прошлого поколения, стоящую в линейке на ступень ниже.

Если сравнивать скорость заполнения сцены новой видеокартой GeForce GTX 950 с видеокартами AMD, то тут с эффективностью архитектуры Maxwell всё в полном порядке — рассматриваемая сегодня плата в этом тесте показывает скорость заполнения сцены чуть ли не вдвое выше, чем имеет Radeon R7 370. Вероятно, сказались в том числе и оптимизации по эффективности сжатия данных буфера кадра, а не только большое количество блоков ROP.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.

Этот тест из пакета 3DMark Vantage отличается от проведенных нами ранее тем, что результаты в нем зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен верный баланс GPU, а также эффективность выполнения сложных шейдеров.

В данном случае важны и математическая и текстурная производительность, и в этой «синтетике» из 3DMark Vantage новая плата GeForce GTX 950 оказалась на четверть медленнее своей старшей сестры на базе графического процессора GM206, выиграв примерно столько же у GPU первого поколения Maxwell из семейства GTX 700. Новинка от NVIDIA показала результат чуть хуже, чем Radeon R7 370 — графические процессоры производства компании AMD в этой задаче традиционно работают несколько эффективнее чипов NVIDIA.

Feature Test 4: GPU Cloth

Четвертый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте также зависит сразу от нескольких параметров, и основными факторами влияния должны бы являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. То есть, сильные стороны чипов NVIDIA должны проявляться, но увы — снова мы не увидели ничего подобного, ведь платы NVIDIA показали совсем невыдающуюся скорость. Новая модель GeForce GTX 950 и вовсе стала худшей среди всех решений, по каким-то причинам отстав даже от GeForce GTX 750 Ti!

Сравнение с видеоплатой Radeon R7 370 в этом тесте приводит к логичным выводам — несмотря на меньшее количество геометрических исполнительных блоков и отставание по геометрической производительности, по сравнению с конкурирующими решениями NVIDIA, решение AMD в этом тесте работает гораздо эффективнее, обгоняя абсолютно все видеокарты GeForce, представленные в сравнении, включая и представленную недавно новинку.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.

Во втором «геометрическом» тесте из 3DMark Vantage ситуация заметно изменилась, в этот раз GeForce подтянулись к Radeon — по крайней мере, основанные на архитектуре Maxwell второго поколения. Новая модель GeForce GTX 950 работает заметно лучше, пусть она и оказалась на 14% медленнее старшей модели видеокарты, основанной на графическом процессоре GM206. Зато GTX 750 Ti на чипе GM107 первого поколения Maxwell осталась далеко позади.

Сравнение новинки NVIDIA с конкурирующей с ней видеокартой от компании AMD в этот раз куда позитивнее, ведь они показали очень близкие результаты. Разница между GeForce GTX 950 и Radeon R7 370 оказалась равна всего лишь 1%, что меньше погрешности измерения, так что можно считать их равными в этот раз. Вот такие разные эти два теста: синтетический тест имитации тканей и тест с симуляцией системы частиц.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических вычислений.

В этом случае производительность решений не полностью соответствует теории, но она близка к тому, что мы видели в других аналогичных тестах. В математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы видим иное распределение результатов, по сравнению с аналогичными тестами из нашего тестового пакета RightMark 2.0.

Видеочипы компании AMD с архитектурой GCN до сих пор справляются с задачами, когда выполняется интенсивная «математика», чуть лучше решений конкурента. Впрочем, новая бюджетная модель компании NVIDIA из семейства GeForce GTX 900 в этом тесте показала неплохой результат, уступив прямому ценовому сопернику в лице Radeon R7 370 всего лишь порядка 10% — разница в пользу решения AMD не слишком велика. Что касается соседей по семейству GeForce, новинка уступила старшей модели на GM206 целых 27% (объяснимых теоретически) и почти столько же выиграла у GeForce GTX 750 Ti. Вполне ожидаемый результат.

Direct3D 11: Вычислительные шейдеры

Чтобы протестировать анонсированное сегодня решение компании NVIDIA в задачах, использующих такие возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы воспользовались примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, NVIDIA и AMD.

Сначала мы рассмотрим тесты, использующие вычислительные (Compute) шейдеры. Их появление — одно из наиболее важных нововведений в последних версиях DX API, они уже используются в современных играх для выполнения различных задач: постобработки, симуляций и т. п. В первом тесте показан пример HDR-рендеринга с tone mapping из DirectX SDK, с постобработкой, использующей пиксельные и вычислительные шейдеры.

Скорость расчетов в вычислительном и пиксельном шейдерах для всех плат AMD и NVIDIA давно уже приблизительно одинаковая, отличия наблюдались только у видеокарт на основе GPU предыдущих архитектур. Судя по нашим предыдущим тестам, результаты в задаче порой зависят не столько от математической мощи и эффективности вычислений, сколько от других факторов, вроде пропускной способности памяти.

Новая плата компании NVIDIA в этом тесте даже немного опережает старшую модель GeForce GTX 960, что может объясняться как погрешностью измерения (1-2% явно входят в её пределы), так и несколько большей реальной рабочей частотой. Естественно, обе они при этом опережают GeForce GTX 750 Ti, имеющую меньшую ПСП, но если сравнивать GeForce GTX 950 с конкурентом в лице Radeon R7 370, то рассматриваемая нами сегодня плата заметно отстаёт от него в этом тесте.

Второй тест вычислительных шейдеров также взят из Microsoft DirectX SDK, в нем показана расчетная задача гравитации N тел (N-body) — симуляция динамической системы частиц, на которую воздействуют физические силы, такие как гравитация.

В этом тесте чаще всего наблюдается упор в скорость исполнения сложных математических вычислений, обработки геометрии и эффективность выполнения кода с ветвлениями. В этом DX11-тесте расклад сил между решениями двух разных компаний получился необычный, а вот среди плат GeForce соотношение уже привычное — новая модель GeForce GTX 950 оказалась примерно посередине между GTX 960 и GTX 750 Ti.

Решения компании NVIDIA в этом тесте явно сильнее единственной видеоплаты соперника, и даже младшая GeForce GTX 750 Ti близка к Radeon R7 370. Ну а GTX 950 отличилась куда большей производительностью, по сравнению с моделью на Maxwell первого поколения, ну а GTX 960 ещё быстрее (на 20%). Эта задача заметно эффективнее рассчитывается на графических процессорах архитектуры Maxwell, которые имеют в составе большое количество потоковых процессоров.

Direct3D 11: Производительность тесселяции

Вычислительные шейдеры очень важны, но еще одним важным нововведением в Direct3D 11 считается аппаратная тесселяция. Мы очень подробно рассматривали ее в своей теоретической статье про NVIDIA GF100. Тесселяцию уже довольно давно начали использовать в DX11-играх, таких как STALKER: Зов Припяти, DiRT 2, Aliens vs Predator, Metro Last Light, Civilization V, Crysis 3, Battlefield 3 и других. В некоторых из них тесселяция используется для моделей персонажей, в других — для имитации реалистичной водной поверхности или ландшафта.

Существует несколько различных схем разбиения графических примитивов (тесселяции). Например, phong tessellation, PN triangles, Catmull-Clark subdivision. Так, схема разбиения PN Triangles используется в STALKER: Зов Припяти, а в Metro 2033 — Phong tessellation. Эти методы сравнительно быстро и просто внедряются в процесс разработки игр и существующие движки, поэтому и стали популярными.

Первым тестом тесселяции будет пример Detail Tessellation из ATI Radeon SDK. В нем реализована не только тесселяция, но и две разные техники попиксельной обработки: простое наложение карт нормалей и parallax occlusion mapping. Что ж, сравним DX11-решения AMD и NVIDIA в различных условиях:

В тесте простого бампмаппинга скорость плат не слишком важна, так как эта задача давно стала слишком легкой и производительность в ней упирается в ПСП или филлрейт. Сегодняшний герой обзора практически не уступает старшей модели GeForce GTX 960, и они обе заметно обгоняют и GeForce GTX 750 Ti и решение конкурента в виде Radeon R7 370, как ни странно.

Во втором подтесте с более сложными попиксельными расчетами новинка уже на 17% медленнее модели GeForce GTX 960, что хорошо объяснимо теорией, ведь количество блоков ALU и TMU в урезанном чипе GM206 на четверть меньше. Понятно, что GTX 750 Ti ещё медленнее, но все они уступают конкурирующей Radeon R7 370, с которой в этом подтесте может поспорить только GTX 960. Эффективность выполнения вычислений в пиксельных шейдерах у чипов архитектуры GCN повыше, хотя выход Maxwell и улучшил позиции решений NVIDIA.

В подтесте с применением лёгкой степени тесселяции ситуация иная — свежеанонсированная плата NVIDIA даже чуть опередила GeForce GTX 960, обе они чуть быстрее GTX 750 Ti, но обе же уступили и единственной плате производства AMD. В этом тесте тесселяции разбиение треугольников весьма умеренное, поэтому Radeon R7 370 оказалась быстрее всех (заодно заметим, что в режиме простого бампмаппинга её что-то явно ограничивало).

Вторым тестом производительности тесселяции будет еще один пример для 3D-разработчиков из ATI Radeon SDK — PN Triangles. Собственно, оба примера входят также и в состав DX SDK, так что мы уверены, что на их основе создают свой код игровые разработчики. Этот пример мы протестировали с различным коэффициентом разбиения (tessellation factor), чтобы понять, как сильно влияет его изменение на общую производительность.

В этом тесте применяется уже более сложная геометрия, поэтому и сравнение геометрической мощи различных решений приносит нам совсем другие выводы. Представленные в материале современные решения достаточно уверенно справляются с легкой и средней геометрической нагрузкой, показывая высокую скорость. Но хотя в лёгких условиях графический процессор AMD в составе Radeon R7 370 отлично работает, опережая конкурентов, в тяжёлых режимах платы NVIDIA выходят вперёд с большим запасом. Так, в самом сложном режиме представленная недавно модель GeForce GTX 950 показывает скорость вдвое лучше, чем единственный Radeon в сегодняшних тестах.

Что касается сравнения плат NVIDIA между собой, то рассматриваемая сегодня модель GeForce GTX 950 теряет относительную форму по сравнению с GTX 960 с ростом геометрической нагрузки. Если в лёгком режиме новинка даже опережает старшую модель, то в тяжёлом уже уступает до 20%, что нелегко объяснить теорией, ведь в тестах тесселяции на скорость не должны влиять производительность блоков ALU и TMU. Зато GeForce GTX 750 Ti обе платы на базе GM206 обогнали с явным преимуществом.

Рассмотрим результаты еще одного теста — демонстрационной программы NVIDIA Realistic Water Terrain, также известной как Island. В этой демке используется тесселяция и карты смещения (displacement mapping) для рендеринга реалистично выглядящей поверхности океана и ландшафта.

Тест Island не является чисто синтетическим тестом для измерения исключительно геометрической производительности GPU, так как он содержит и сложные пиксельные и вычислительные шейдеры в том числе, и такая нагрузка ближе к реальным играм, в которых используются все блоки GPU, а не только геометрические, как в предыдущих тестах геометрии. Хотя основной все равно остается именно нагрузка на блоки обработки геометрии, но может влиять и та же ПСП, например.

Мы тестируем все видеоплаты при четырех разных коэффициентах тесселяции — в данном случае настройка называется Dynamic Tessellation LOD. При первом коэффициенте разбиения треугольников, скорость не ограничена производительностью геометрических блоков, и видеокарта Radeon R7 370 показывает достаточно высокий результат, близкий к скорости лучших из плат NVIDIA, в том числе к результату анонсированной платы GeForce GTX 950. Но уже на следующих ступенях геометрической нагрузки производительность платы Radeon снижается, и новинка NVIDIA выходит вперёд, а в самом сложном режиме её превосходство составляет более двух раз.

Если сравнить GeForce GTX 950 с GTX 960, то, как и в предыдущем тесте, разница между их производительностью растёт вместе со сложностью. Начинается всё с проигрыша младшей модели в 3%, а заканчивается разницей в 11% в пользу решения на основе полноценного графического процессора GM206. Графические процессоры архитектуры Maxwell очень эффективно работают в тестах тесселяции, в том числе в режиме смешанной нагрузки, быстро переключаясь от исполнения графических задач к вычислительным и обратно.

***

Проанализировав результаты синтетических тестов новой видеокарты NVIDIA GeForce GTX 950, основанной на урезанном графическом процессоре GM206, а также рассмотрев результаты других моделей видеокарт от обоих производителей дискретных видеочипов, можно сделать вывод о том, что рассматриваемая сегодня видеокарта вполне может составить конкуренцию главному сопернику от компании AMD, став неплохим дополнением линейки GeForce.

Новая видеокарта компании NVIDIA показывает неплохие результаты в «синтетике», и слабых сторон у GeForce GTX 950 не так много. Возможно, математическая и текстурная производительность решения на базе чипа GM206-250 урезана чуть больше, чем хотелось бы, но она всё равно неплохо соперничает с Radeon R7 370. Причём, из-за новых методов сжатия информации в буфере, нехватка ПСП наблюдается не слишком часто, хотя иногда это и может ограничить скорость рендеринга в игровых приложениях, особенно при высоком разрешении рендеринга и включенном сглаживании. Но для разрешения 1920x1080 при сглаживании методом MFAA, имеющейся ПСП должно быть достаточно.

При сравнении новинки с соперничающей с ней моделью Radeon R7 370, можно понять, что у них разные сильные стороны. В части тестов оказывается быстрее графический процессор AMD, отличающийся более эффективным исполнением некоторых вычислительных задач, а в тестах геометрии и части математических задач уже графический процессор архитектуры Maxwell вырывается вперёд. Ситуация в реальных игровых приложениях будет отличаться от синтетических тестов, хотя GeForce GTX 950 в любом случае должен показать скорость примерно на уровне Radeon R7 370.

При этом, новинка куда энергоэффективнее, потребляя энергии гораздо меньше, чем тот же Radeon R7 370. Инженеры NVIDIA добились высочайшей эффективности в архитектуре Maxwell, также не стоит забывать и о куда большей функциональности современных решений NVIDIA: Feature Level 12.1, сглаживание методом MFAA, аппаратное декодирование видеоформата H.265, поддержка HDMI 2.0 и т.д. С рыночной же точки зрения ситуация будет зависеть от реальных розничных цен в магазинах и соотношения производительности в играх.

Чтобы оценить скорость новинки в игровых приложениях, в следующей части нашего материала мы оценим производительность GeForce GTX 950 в нашем наборе игровых проектов и сравним её с показателями конкурентов, оценив оправданность розничной цены новинки.



Средняя текущая цена (количество предложений) в московской рознице:
Рассматриваемые карты Конкуренты
GTX 950 — 11 700  (на 01.12.16) R7 370 — Н/Д(0)
GTX 950 — 11 700  (на 01.12.16) R9 270X — $195 (на 01.06.16)
GTX 950 — 11 700  (на 01.12.16) GTX 750 Ti — 8000  (на 01.12.16)
MSI GTX 950 Gaming — Н/Д(0) GTX 950 — 11 700  (на 01.12.16)


Благодарим компанию MSI Russia
и лично Бориса Волка
за предоставленную на тестирование видеокарту

Блок питания Thermaltake DPS G 1050W для тестового стенда предоставлены компанией Thermaltake

Корпус Corsair Obsidian 800D Full Tower для тестового стенда предоставлен компанией Corsair

Модули памяти Corsair Vengeance CMZ16GX3M4X1600C9 для тестового стенда предоставлены компанией Corsair

Corsair Hydro SeriesT H100i CPU Cooler для тестового стенда предоставлен компанией Corsair

Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт

Системная плата MSI X79A-GD45(8D) для тестового стенда предоставлена компанией MSI

Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate

2 накопителя SSD Corsair Neutron SeriesT 120 ГБ для тестового стенда предоставлены компанией Corsair




Дополнительно

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.