Nvidia Geforce GTX 980

Часть 2: Особенности карты и синтетические тесты


Содержание

Устройство(а)


Nvidia Geforce GTX 980 4096 МБ 256-битной GDDR5 PCI-E
ПараметрНоминальное значение (референс)
GPUGeforce GTX 980 (GM204)
ИнтерфейсPCI Express x16
Частота работы GPU (ROPs), МГц1126—1265
Частота работы памяти (физическая (эффективная)), МГц1750 (7000)
Ширина шины обмена с памятью, бит256
Число вычислительных блоков в GPU/частота работы блоков, МГц16/1126—1265
Число операций (ALU) в блоке128
Суммарное число операций (ALU)2048
Число блоков текстурирования (BLF/TLF/ANIS)128
Число блоков растеризации (ROP)64
Размеры, мм270×100×35
Количество слотов в системном блоке, занимаемые видеокартой2
Цвет текстолитачерный
Энергопотребление (пиковое в 3D/в режиме 2D/в режиме «сна»), Вт162/78/28
Выходные гнезда1×DVI (Dual-Link/HDMI), 1×HDMI 2.0, 3×DisplayPort 1.2
Поддержка многопроцессорной работыSLI
Максимальное количество приемников/мониторов для одновременного вывода изображения4
Дополнительное питание: количество 8-контактных разъемовНет
Дополнительное питание: количество 6-контактных разъемов2
Максимальное разрешение 2D: DP/HDMI/Dual-Link DVI/Single-Link DVI3840×2400/3840×2400/2560×1600/1920×1200
Максимальное разрешение 3D: DP/HDMI/Dual-Link DVI/Single-Link DVI3840×2400/3840×2400/2560×1600/1920×1200

Комплектация локальной памятью
Картa имеeт 4096 МБ памяти GDDR5 SDRAM, размещенной в 8 микросхемах по 4 Гбит на лицевой стороне PCB.

Микросхемы памяти Samsung (GDDR5). Микросхемы расчитаны на номинальную частоту работы в 1785 (7140) МГц.

Сравнение с эталонным дизайном (reference)
Вид спереди
Nvidia Geforce GTX 980 4096 МБ 256-битной GDDR5 PCI-E Reference card Nvidia Geforce GTX 680
Вид сзади
Nvidia Geforce GTX 980 4096 МБ 256-битной GDDR5 PCI-E Reference card Nvidia Geforce GTX 680

Мы сравниваем с GTX 680, потому что GTX 980 — прямой наследник того семейства: ядра относятся к одной категории (GF104, GF114, GK104, GM204), к тому же у карт идентична шина обмена с памятью. И действительно, в разводке PCB мы видим очень много схожего. Серьезные изменения затронули лишь систему питания, что вызвано сильно отличающимся от GK104 потреблением энергии, а также вольтажами (обо всем этом мы уже говорили выше).

Схема питания ядра 4-фазная, 1-фазная у питания микросхем памяти. В разводке заложена возможность увеличения количества фаз для более тонкого оверклокинга. Видимо, поэтому имеется и посадочное место под 8-контактный разъем питания. Полагаю, что все партнеры Nvidia будут выпускать умеренно и даже сильно разогнанные варианты GTX 980.

Система охлаждения
СО очень похожа на ранее изученные нами референс-кулеры Nvidia. Большой радиатор из медного сплава, который охлаждает ядро, микросхемы памяти и силовые транзисторы системы питания, имеет в своей основе испарительную камеру, которая прижимается к GPU. В результате не требуется применение тепловых трубок: эффективности испарительной камеры достаточно.

Сверху на радиаторе установлен кожух со смещенным в конец цилиндрическим вентилятором (очень привычная для Nvidia схема СО).

После 6-часового прогона под нагрузкой максимальная температура GPU не превысила 81 градус, что является хорошим результатом для такого мощного ускорителя. При этом максимальная частота вращения вентилятора не превышала 1815 оборотов в минуту, что делало кулер практически бесшумным. Обычно мы начинаем слышать вентиляторы на частотах 1800-2000 оборотов в минуту, но на уровне 1800 об/мин шум практически не выделяется на фоне работы системного блок. А вот если частота вращения достигает 2500 оборотов в минуту, то такие СО уже однозначно становятся некомфортными по шумовым параметрам. Конечно, это несколько упрощенная классификация, ведь все зависит еще от конструкции вентиляторов, а также от степени восприимчивости того или иного человека к шуму. Единой субъективной оценки быть не может.
Мониторинг температурного режима с помощью EVGA PrecisionX (автор А. Николайчук AKA Unwinder)

Карта поставляется в стильной фирменной коробке (правда, без дополнительного комплекта).

Упаковка

Установка и драйверы

Конфигурация тестового стенда

  • Компьютеры на базе процессора Intel Core i7-3960X (Socket 2011):
    • 2 процессора Intel Core i7-3960X (o/c 4 ГГц);
    • СО Hydro SeriesT H100i Extreme Performance CPU Cooler;
    • СО Intel Thermal Solution RTS2011LC;
    • системная плата Asus Sabertooth X79 на чипсете Intel X79;
    • системная плата MSI X79A-GD45(8D) на чипсете Intel X79;
    • оперативная память 16 ГБ DDR3 Corsair Vengeance CMZ16GX3M4A1600C9 1600 МГц;
    • жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA2;
    • жесткий диск WD Caviar Blue WD10EZEX 1 TБ SATA2;
    • 2 SSD Corsair Neutron SSD CSSD-N120GB3-BK;
    • 2 блока питания Corsair CMPSU-1200AXEU (1200 Вт);
    • корпус Corsair Obsidian 800D Full Tower.
  • операционная система Windows 7 64-битная; DirectX 11.1;
  • монитор Dell UltraSharp U3011 (30″);
  • монитор Asus ProArt PA249Q (24″);
  • драйверы AMD версии Catalyst 14.7 RC3, Nvidia версии 340.52 (для GTX 980 — 344.07). VSync отключен.


Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

В качестве синтетических тестов DirectX 11 мы использовали примеры из пакетов SDK компаний Microsoft и AMD, а также демонстрационную программу Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010). Мы взяли и приложения обоих производителей видеочипов: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain, также известная, как Island11.

Синтетические тесты проводились на следующих видеокартах:

  • Geforce GTX 980 со стандартными параметрами (сокращенно GTX 980)
  • Geforce GTX 780 Ti со стандартными параметрами (сокращенно GTX 780 Ti)
  • Geforce GTX 780 со стандартными параметрами (сокращенно GTX 780)
  • Radeon R9 290X со стандартными параметрами (сокращенно R9 290X)
  • Radeon R9 285 со стандартными параметрами (сокращенно R9 285)

Для анализа результатов новейшей топовой видеокарты Geforce GTX 980 нами были выбраны именно эти решения по следующим причинам. Geforce GTX 780 и GTX 780 Ti являются моделями компании Nvidia из предыдущего семейства, которые основаны на графических процессорах GK110 и которые новинка заменяет на рынке. Будет очень интересно узнать, сможет ли плата на базе GM204 опередить оба варианта на GK110, или только более слабый вариант.

От конкурирующей компании AMD для нашего сравнения мы также выбрали две видеокарты, но уже основанные на разных графических процессорах. Radeon R9 290X является главным ценовым конкурентом для Geforce GTX 980, и мы сравним их с рыночной точки зрения. А Radeon R9 285, хоть и стоит дешевле, но по всем параметрам (площадь и сложность GPU, количество исполнительных блоков, энергопотребление) эти два видеочипа весьма близки друг к другу, и по их сравнению мы лучше поймём слабые и сильные стороны архитектур Maxwell и GCN.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Прошло уже некоторое время, как мы отказались от устаревших тестов DirectX 9, так как все мощные решения отличаются в них не слишком показательными результатами, будучи серьёзно ограничены ПСП, филлрейтом или текстурированием. К тому же, некоторые из видеокарт некорректно работают в таких приложениях, а Nvidia и вовсе давно перестала заниматься оптимизацией D3D9-приложений.

Во вторую версию RightMark3D вошли два уже знакомых нам теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также еще два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нем используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в этом тесте зависит от количества и эффективности блоков TMU, влияет также и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает еще и эффективный филлрейт и пропускная способность памяти. Результаты при детализации уровня «High» получаются до полутора раза ниже, чем при «Low».

В задачах процедурной визуализации меха с большим количеством текстурных выборок, с выпуском видеочипов на базе архитектуры GCN компания AMD вырвалась вперед по производительности, и сейчас платы Radeon являются лидерами в этих сравнениях, что говорит о значительно более высокой эффективности выполнения ими этих программ.

В первом же тесте новая видеоплата модели Geforce GTX 980 явно быстрее аналогов предыдущего поколения в виде GTX 780 и даже GTX 780 Ti, но преимущество над старшей небольшое — 9%. Похоже, что в таком исходе виновато более эффективное исполнение данной задачи и большая скорость заполнения, так как скорость текстурирования у GTX 980 невысока. Понятно, что представленная видеокарта проиграла главному конкуренту AMD Radeon R9 290X, а вот с близкой по всем остальным параметрам R9 285 она справилась, что для Nvidia в этих тестах очень неплохо.

Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: возможно, в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

И в этих условиях новая топовая видеокарта Geforce GTX 980 также опережает аналоги из предыдущего поколения — и GTX 780 и даже GTX 780 Ti, хотя разница между ними сократилась до 6-7%. Отставание от главного ценового конкурента в виде Radeon R9 290X лишь увеличилось, да и превосходства над R9 285 уже почти нет — в подобных вычислениях чипы компании AMD явно сильны, они предпочитают попиксельные вычисления.

Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип еще примерно в два раза — такой режим называется «High».

Диаграмма очень похожа на предыдущую (также без включения суперсэмплинга), и в этот раз новая Geforce GTX 980 показала скорость до 9% быстрее, чем GTX 780 Ti. Понятно, что она продолжает заметно опережать и более слабую модель от Nvidia. Ну и если брать сравнение с видеокартами AMD, то в этом случае все примерно так же. Новинка уступает Radeon R9 290X и опережает R9 285, как и в прошлом тесте. Похоже, что новая плата от Nvidia в пиксельных шейдерах справляется с работой лучше предыдущих решений, что не может не радовать. Посмотрим, что изменит включение суперсэмплинга:

Изменений в этот раз чуть больше, чем в предыдущем тесте. При включении суперсэмплинга и самозатенения задача получается еще более тяжелой и совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьезное падение производительности. Разница между скоростными показателями протестированных видеокарт немного изменилась, включение суперсэмплинга сказывается меньше, чем в предыдущем случае.

Хотя старшее графическое решение Radeon и в этом D3D10-тесте пиксельных шейдеров работает эффективнее, по сравнению с конкурирующими платами Geforce, но новый чип GM204 явно меняет ситуацию в лучшую сторону — представленная сегодня топовая плата Geforce GTX 980 на этом чипе архитектуры Maxwell заметно быстрее предшественников от Nvidia и отстаёт только от одной Radeon R9 290X, да и то не слишком существенно.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты предельных математических тестов чаще всего лишь примерно соответствуют разнице по частотам и количеству вычислительных блоков, так как на результаты влияет и разная эффективность их использования в конкретных задачах, и оптимизация драйверов, и новейшие системы управления частотами и питанием, и даже упор в ПСП, особенно в случае быстрейших решений. Тем более любопытно, что в случае теста Mineral, новая модель Geforce GTX 980 оказалась аж на 13% быстрее платы GTX 780 Ti из предыдущего поколения! Не говоря уже о GTX 780, которая отстала ещё сильнее.

И даже сравнение Geforce GTX 980 с платой компании AMD, стоящей примерно столько же, приносит совершенно иные выводы, чем несколько лет подряд — чуть ли не впервые за эти годы обновление архитектуры Nvidia привело к тому, что их новый чип в таких тестах имеет преимущество перед конкурирующими решениями AMD! В первом математическом тесте даже конкурирующая с новинкой по цене видеокарта Radeon R9 290X оказалась чуть позади, не говоря уже о Radeon R9 285, который основан на схожем по сложности и параметрам чипе Tonga. Просто отличный результат для GM204 — новая архитектура Maxwell показала своё превосходство!

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нем только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

И во втором нашем математическом тесте мы видим примерно такие же результаты видеокарт относительно друг друга — разница несущественная. Так, Geforce GTX 980 опережает GTX 780 Ti уже на 14%, и Radeon R9 290X всё так же чуть-чуть отстаёт от новинки производства Nvidia, хотя по теории должна быть немного впереди. Похоже, что в тестах пиковой математической производительности новый видеочип Nvidia работает эффективнее, чем GPU соперничающей компании.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трех уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаковое для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близкое к двукратному. Задача эта для мощных современных видеокарт очень простая, и производительность в ней ограничена скоростью обработки геометрии, а иногда и пропускной способностью памяти и/или филлрейтом.

Разница между результатами видеокарт на чипах Nvidia и AMD обусловлена отличиями в геометрических конвейерах чипов этих компаний, и она весьма заметна. Если в предыдущих тестах с пиксельными шейдерами платы AMD справлялись с работой не хуже, а то и лучше решений Nvidia, то первые же тесты геометрии показывают, что в таких задачах платы Nvidia более чем конкурентоспособны.

Новинка в лице Geforce GTX 980 опережает аналоги из прошлого поколения в лице Geforce GTX 780 и GTX 780 Ti, выигрывая у мощнейшей платы на GK110 целых 38-47%. Обе видеокарты Radeon в этот раз сильно отстают, что можно объяснить тем, что геометрическая производительность у графических процессоров компании AMD хуже, чем у Nvidia. Особенно отличился тут новый GM204, который справляется с работой заметно быстрее всех. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры слегка улучшились и для плат AMD и для решений Nvidia, но разница невелика и ничего не меняет. Видеокарты в этом тесте геометрических шейдеров слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, поэтому и выводы остаются прежними. Плата Nvidia на базе нового графического процессора архитектуры Maxwell быстрее аналогичных моделей на чипах GK110 до полутора раз и более, а также быстрее обоих решений конкурента — и Radeon R9 290X, и R9 285.

К сожалению, «Hyperlight» — второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load, в котором используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output, на всех современных видеокартах компании AMD просто не работает. В какой-то момент очередное обновление драйверов Catalyst привело к тому, что данный тест перестал запускаться на платах этой компании, и эта ошибка не исправлена вот уже несколько лет. Но давайте рассмотрим поведение видеокарт Nvidia в этом тесте:

Видим примерно то же самое, что и в тесте Galaxy — новинка на чипе GM204 заметно впереди, правда, разница между Geforce GTX 980 и GTX 780 Ti уже не полуторакратная, а лишь на треть. Может быть, в более тяжёлом режиме что-то изменится:

Так и есть, в таких условиях результаты видеокарт компании Nvidia сближаются, и Geforce GTX 980 уже показывает скорость лишь на 15% быстрее лучшей одночиповой платы прошлого поколения — Geforce GTX 780 Ti. В общем, новинка снова показала себя исключительно с лучшей стороны, она весьма эффективно выполняет различные программы на основе геометрических шейдеров. Переходим к тестам текстурных выборок из вершинных шейдеров.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Наши предыдущие исследования показали, что на результаты этого теста может влиять и филлрейт и пропускная способность памяти, что особенно заметно в легком режиме. Новая топовая видеокарта компании Nvidia в нём показывает скорость до 29% быстрее, по сравнению с аналогичной платой GTX 780 Ti из предыдущего поколения, и в лёгком режиме явно упёрлась в ПСП.

Главный ценовой конкурент новинки в виде Radeon R9 290X в этот раз опережает анонсированную новинку от Nvidia, особенно в лёгком режиме. Впрочем, разница в остальных двух режимах невелика, а вот схожий по сложности GPU вариант Radeon R9 285 заметно отстаёт от обеих указанных плат. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Ситуация на диаграмме заметно изменилась, решения компании AMD в тяжелых режимах потеряли явно больше, чем платы Geforce. Новая видеоплата Geforce GTX 980 показала скорость уже выше, чем оба конкурента, кроме лёгкого режима, где она упёрлась в пропускную способность памяти. Если же сравнивать новинку с решениями Nvidia из предыдущего поколения, то она опережает плату GTX 780 Ti на всё те же 28% (в самом сложном режиме).

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нем используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты во втором тесте вершинного текстурирования «Waves» не слишком похожи на то, что мы видели на предыдущих диаграммах. Скоростные показатели всех Geforce в этом тесте сильно ухудшились, и хотя новая модель Nvidia Geforce GTX 980 всё ещё быстрее, чем GTX 780 Ti, но уже лишь на 7-8%. А если сравнивать с конкурентами, то даже плата Radeon R9 285 смогла показать близкую к GTX 980 производительность в этом тесте, а схожая с новинкой по цене Radeon R9 290X опередила их, став лучшей в этом тесте. Рассмотрим второй вариант этой же задачи:

С усложнением задачи во втором тесте текстурных выборок скорость всех решений стала ниже, и больше всего пострадали видеокарты Nvidia. В выводах мало что меняется, но новая модель Geforce GTX 980 теперь явно уступает не только Radeon R9 290X, но и стоящей куда меньше Radeon R9 285 схожей сложности. При сравнении с предшественниками из серии Geforce GTX 700 новинка опережает GTX 780 Ti на те же 5-8%.

3DMark Vantage: тесты Feature

Синтетические тесты из пакета 3DMark Vantage покажут нам то, что мы ранее упустили. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10 и интересны тем, что отличаются от наших и до сих пор актуальны. При анализе результатов видеокарты модели Geforce GTX 980 в этом пакете мы сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark.

Feature Test 1: Texture Fill

Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Эффективность видеокарт AMD и Nvidia в текстурном тесте компании Futuremark достаточно высока и итоговые цифры разных моделей близки к соответствующим теоретическим параметрам. Разница в скорости между GTX 980 и GTX 780 Ti оказалась близкой к 28%, причём в пользу решения предыдущего поколения, что объяснимо теоретически — ведь у новинки меньше блоков TMU. И даже если сравнивать GTX 980 с GTX 780, то даже не самая быстрая плата, созданная на основе GK110, по текстурированию явно быстрее, чем GM204.

Что касается сравнения скорости текстурирования новой топовой видеоплаты Nvidia с аналогичным по цене решением конкурента, то новинка Nvidia по текстурной скорости также уступает своему главному сопернику по ценовой нише — Radeon R9 290X, а вот соперник по сложности графического процессора и печатной плате в виде Radeon R9 285 оказался даже ещё менее эффективным по текстурированию.

Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Цифры второго подтеста 3DMark Vantage показывают производительность блоков ROP с учетом величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), и тест измеряет пропускную способность и/или производительность ROP. В этот раз похоже на второе. Неудивительно, что результат у выпущенной сегодня топовой платы Geforce GTX 980 получился аж почти на две трети лучше, чем у GTX 780 Ti, не говоря уже о младшей GTX 780. Это можно объяснить разницей по количеству и эффективности работы блоков ROP, в чём новинка весьма хороша.

И даже если сравнивать скорость заполнения сцены новой видеокартой Geforce GTX 980 с видеокартами AMD, то рассматриваемая нами сегодня плата в этом тесте показывает скорость заполнения сцены, превышающую то, что могут и идентичная по цене Radeon R9 290X и более новая Radeon R9 285, также имеющая некие оптимизации по эффективности сжатия данных буфера кадра.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.

Данный тест пакета 3DMark Vantage отличается от проведенных нами ранее тем, что результаты в нем зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен верный баланс GPU, а также эффективность выполнения сложных шейдеров.

В данном случае, важны и математическая и текстурная производительность, и в этой «синтетике» из 3DMark Vantage новая плата Geforce GTX 980 оказалась на 10% быстрее своего аналога на базе лучшего графического процессора архитектуры Kepler, и с запасом обогнала ещё одну плату предыдущего поколения — GTX 780.

При таких данных новинка совсем немного (менее 10%) проигрывает своему сопернику по цене в виде AMD Radeon R9 290X, но показывает результат заметно лучше уровня другой платы этой компании, взятой для сравнения из-за схожего по сложности GPU — Radeon R9 285. Мы знали, что графические процессоры производства компании AMD в этой задаче работают эффективно, но теперь и новинка на базе GM204 вплотную подобралась к лучшей одночиповой модели Radeon.

Feature Test 4: GPU Cloth

Четвертый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте также зависит сразу от нескольких параметров, и основными факторами влияния должны бы являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. То есть, сильные стороны чипов Nvidia должны были проявиться именно тут, но нет — все платы Nvidia показали не слишком высокую скорость. В результате, новая модель Geforce GTX 980 показала скорость ровно на одном уровне с GTX 780 Ti, лишь немного опередив GTX 780.

Сравнение с платами Radeon в этом тесте довольно печально — несмотря на меньшее количество геометрических исполнительных блоков и отставание по геометрической производительности, по сравнению с конкурирующими решениями Nvidia, обе платы Radeon в этом тесте работают весьма эффективно и обгоняют все три Geforce.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.

А вот во втором «геометрическом» тесте из 3DMark Vantage ситуация сильно изменилась, и в этот раз новая Geforce GTX 980 работает заметно лучше — новинка на 15% быстрее своего предшественника в виде GTX 780 Ti, и на четверть быстрее, чем GTX 780. В этом тесте наблюдается упор или в геометрическую производительность или в производительность блоков ROP — по этим параметрам новый GM204 очень хорош.

Сравнение новинки Nvidia с конкурирующими видеокартами компании AMD в этот раз куда более радостное. Обе платы от компании-соперника показывают меньшие результаты, и новинке уступает не только Radeon R9 285, но и главный ценовой конкурент в виде Radeon R9 290X. Получается, что платы на чипах AMD лучше выполняют синтетический тест имитации тканей из тестового пакета 3DMark Vantage, а за Nvidia остаётся тест с расчётом частиц, хотя в обоих активно используются геометрические шейдеры.

Feature Test 6: Perlin Noise

Ну и последний feature-тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических вычислений.

В математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы видим почти такое же распределение результатов, как и в аналогичных тестах нашего тестового пакета, лишь за одним исключением, связанным с результатом Radeon R9 290X. Хотя в этом случае производительность решений не полностью соответствует теории, но довольно близка к тому, что мы видели в других математических тестах.

Видеочипы компании AMD с архитектурой GCN до сих пор справляются с подобными задачами лучше конкурента, особенно в тех случаях, когда выполняется интенсивная «математика». Неудивительно, что новая топовая модель компании Nvidia в этом тесте хоть и показала отличный результат, обогнав Geforce GTX 780 Ti на 7%, что очень неплохо для такого несложного GPU, да ещё со столь низким потреблением энергии, но этого не хватило, чтобы достать Radeon R9 290X, который является главным соперником новинки по цене. Разница между ними не превысила 10%, но она есть. А вот Radeon R9 285 на схожем по сложности с GM204 чипе Tonga, довольно заметно отстал от новинки, что ещё раз говорит о потрясающей эффективности архитектуры Maxwell.

Direct3D 11: Вычислительные шейдеры

Чтобы протестировать анонсированное сегодня решение компании Nvidia в задачах, использующих такие возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы воспользовались примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, Nvidia и AMD.

Сначала мы рассмотрим тесты, использующие вычислительные (Compute) шейдеры. Их появление — одно из наиболее важных нововведений в последних версиях DX API, они уже используются в современных играх для выполнения различных задач: постобработки, симуляций и т. п. В первом тесте показан пример HDR-рендеринга с tone mapping из DirectX SDK, с постобработкой, использующей пиксельные и вычислительные шейдеры.

Скорость расчетов в вычислительном и пиксельном шейдерах для всех плат AMD и Nvidia давно уже приблизительно одинаковая, отличия наблюдались только у видеокарт на основе GPU предыдущих архитектур. Судя по нашим предыдущим тестам, результаты в задаче порой зависят не столько от математической мощи и эффективности вычислений, сколько от других факторов, вроде пропускной способности памяти и производительности блоков ROP.

Похоже, что в данном случае скорость видеокарт всё же зависит больше всего от математической производительности. Новая плата компании Nvidia в этом тесте уже уступает 4-5% своей самой мощной предшественнице в лице Geforce GTX 780 Ti. Да и если сравнивать Geforce GTX 980 с прямым ценовым конкурентом в лице Radeon R9 290X, то рассматриваемая нами сегодня плата немного отстаёт от него. А вот Radeon R9 285 на основе схожего по сложности GPU, чуть ли не вдвое медленнее — похоже, что GM204 весьма эффективно работает и в этой задаче.

Второй тест вычислительных шейдеров также взят из Microsoft DirectX SDK, в нем показана расчетная задача гравитации N тел (N-body) — симуляция динамической системы частиц, на которую воздействуют физические силы, такие как гравитация.

В этом тесте чаще всего наблюдается упор в скорость исполнения сложных математических вычислений и в эффективность выполнения кода с ветвлениями. И во втором DX11-тесте расклад сил между решениями двух разных компаний уже совершенно иной. Решения компании Nvidia в этот раз явно сильнее, чем платы соперника, а новинка Geforce GTX 980 снова удивила своей высокой скоростью.

Обе видеоплаты Radeon выглядят в этом тесте не слишком сильно. Похоже, что в GK110 и GM204 настолько много геометрических блоков, что Hawaii и Tonga просто не могут соперничать с ними. Интересно, что результат Geforce GTX 980 заметно выше, чем GTX 780 Ti, что можно объяснить как раз ещё больше увеличенной скоростью обработки геометрии и непревзойдённой скоростью заполнения у новинки.

Direct3D 11: Производительность тесселяции

Вычислительные шейдеры очень важны, но еще одним важным нововведением в Direct3D 11 считается аппаратная тесселяция. Мы очень подробно рассматривали ее в своей теоретической статье про Nvidia GF100. Тесселяцию уже довольно давно начали использовать в DX11-играх, таких как STALKER: Зов Припяти, DiRT 2, Aliens vs Predator, Metro Last Light, Civilization V, Crysis 3, Battlefield 3 и других. В некоторых из них тесселяция используется для моделей персонажей, в других — для имитации реалистичной водной поверхности или ландшафта.

Существует несколько различных схем разбиения графических примитивов (тесселяции). Например, phong tessellation, PN triangles, Catmull-Clark subdivision. Так, схема разбиения PN Triangles используется в STALKER: Зов Припяти, а в Metro 2033 — Phong tessellation. Эти методы сравнительно быстро и просто внедряются в процесс разработки игр и существующие движки, поэтому и стали популярными.

Первым тестом тесселяции будет пример Detail Tessellation из ATI Radeon SDK. В нем реализована не только тесселяция, но и две разные техники попиксельной обработки: простое наложение карт нормалей и parallax occlusion mapping. Что ж, сравним DX11-решения AMD и Nvidia в различных условиях:

В тесте простого бампмаппинга скорость плат не так уж важна, так как эта задача давно стала слишком легкой и производительность упирается в ПСП или филлрейт. Сегодняшний герой обзора превосходит предшествующую модель Geforce GTX 780 Ti на 7%, да и Radeon R9 285 также оказался позади в первом подтесте. А вот схожий по цене Radeon R9 290X быстрее всех них.

Во втором подтесте с более сложными попиксельными расчетами новинка снова на 7% быстрее модели Geforce GTX 780 Ti, и опять заметно уступает конкурирующей Radeon R9 290X, обгоняя при этом Radeon R9 285 на базе близкого по сложности GPU. Всё же эффективность выполнения математических вычислений в пиксельных шейдерах у чипов архитектуры GCN выше, чем у Kepler, но Maxwell явно улучшил позиции решений Nvidia.

В подтесте с применением легкой тесселяции, новая плата Nvidia уже лишь на 3% быстрее модели предыдущего поколения — GTX 780 Ti. Если сравнивать новинку с платами производства AMD, то она снова находится между ними на диаграмме. В этом тесте тесселяции разбиение треугольников весьма умеренное и скорость не упирается в производительность блоков обработки геометрии, поэтому Radeon R9 290X быстрее, чем Geforce GTX 980, а R9 285 — медленнее.

Вторым тестом производительности тесселяции будет еще один пример для 3D-разработчиков из ATI Radeon SDK — PN Triangles. Собственно, оба примера входят также и в состав DX SDK, так что мы уверены, что на их основе создают свой код игровые разработчики. Этот пример мы протестировали с различным коэффициентом разбиения (tessellation factor), чтобы понять, как сильно влияет его изменение на общую производительность.

В этом тесте в тяжелых режимах применяется уже более сложная геометрия, поэтому и сравнение геометрической мощи различных решений приносит совершенно другие выводы. Все представленные в материале современные решения достаточно хорошо справляются с легкой и средней геометрической нагрузкой, показывая высокую скорость. И хотя в лёгких условиях графические процессоры AMD отлично работают, даже опережая калифорнийских конкурентов, в тяжёлых режимах платы Nvidia явно выходят вперёд — в двух сложных режимах представленная сегодня Geforce GTX 980 показывает скорость явно лучше, чем у обеих Radeon.

Что касается сравнения плат Nvidia различных поколений между собой, то рассматриваемая сегодня модель Geforce GTX 980 наращивает преимущество с ростом геометрической нагрузки — ровно как и должно быть по теории. Она опережает предшествующую плату на чипе GK110 в сложных режимах до 22%, в то время, как в самом лёгком преимущество составляет жалкий 1%. Снова отличный результат для топового чипа Maxwell!

Рассмотрим результаты еще одного теста — демонстрационной программы Nvidia Realistic Water Terrain, также известной как Island. В этой демке используется тесселяция и карты смещения (displacement mapping) для рендеринга реалистично выглядящей поверхности океана и ландшафта.

Тест Island не является чисто синтетическим тестом для измерения исключительно геометрической производительности GPU, так как он содержит и сложные пиксельные и вычислительные шейдеры в том числе, и такая нагрузка ближе к реальным играм, в которых используются все блоки GPU, а не только геометрические, как в предыдущих тестах геометрии. Хотя основной все равно остается именно нагрузка на блоки обработки геометрии.

Мы тестируем все видеоплаты при четырех разных коэффициентах тесселяции — в данном случае настройка называется Dynamic Tessellation LOD. При первом коэффициенте разбиения треугольников, скорость не ограничена производительностью геометрических блоков, и видеокарта Radeon R9 290X показывает высокий результат, почти подбираясь к скорости анонсированной сегодня платы Nvidia, но уже на следующих ступенях нагрузки производительность обеих плат Radeon снижается весьма серьёзно, и Geforce GTX 980 выходит вперёд.

В общем, преимущество плат на чипах Nvidia в таких тестах доходит до двух раз. А вот если сравнить Geforce GTX 980 с GTX 780 Ti, то разница между их производительностью не такая большая — 10-15%. Более того, в режимах невысокой геометрической нагрузки скорость рендеринга упирается в ПСП и GTX 780 Ti оказывается даже быстрее, и лишь в сложных режимах новинка «разгоняется» и оказывается быстрее лучшей из видеокарт на основе GK110 — очень неплохой результат.

***

Подводя итоги этого раздела статьи и проанализировав результаты синтетических тестов анонсированной сегодня видеокарты Nvidia Geforce GTX 980, основанной на совершенно новом графическом процессоре GM204, а также рассмотрев результаты и других моделей видеокарт от обоих производителей дискретных видеочипов, можно сделать вывод о том, что рассматриваемая плате GTX 980 вполне сможет составить конкуренцию не только сопернику по цене от компании AMD в виде Radeon R9 290X, но во многих случаях сможет поспорить и с мощнейшей моделью из предыдущего поколения — Geforce GTX 780 Ti, основанной на лучшем чипе семейства Kepler.

Новая видеокарта компании Nvidia почти всегда показывает высокие результаты в «синтетике», схожие или превышающие показатели Geforce GTX 780 Ti, да и в соперничестве с Radeon R9 290X новинка неплохо выглядит (кроме некоторых тестов, в которых более сложный графический процессор AMD быстрее, в том числе из-за большей пропускной способности памяти и эффективного исполнения пиксельных шейдеров). В реальных игровых приложениях ситуация может несколько отличаться от наших синтетических тестов, но Geforce GTX 980 должна стать сильным конкурентом для Radeon R9 290X и в игровых тестах.

Удивительно то, что новая топовая модель от Nvidia явно основана на менее сложном GPU, по сравнению с Hawaii, но успешно конкурирует с этим решением, что позволяет компании выставить явно завышенную цену на новинку, чтобы заработать больше денег. По сути, чисто с технической точки зрения, Geforce GTX 980 на базе GM204 надо сравнивать с Radeon R9 285 на основе Tonga — эти два графических процессора весьма похожи друг на друга, они имеют близкую сложность и площадь чипов, набор исполнительных устройств, шину памяти и т.п. Но так как Maxwell отличается потрясающе высокой энергоэффективностью и производительностью, Nvidia смогла выставить его против более сложного (и более дорогого в производстве, кстати) Hawaii, что должно принести компании ещё немного денег.

При всём этом, Geforce GTX 980 ещё и потребляет меньше энергии, чем даже Radeon R9 285! Не говоря уже о просто невменяемо прожорливом на его фоне Radeon R9 290X с более чем в полтора раза большим энергопотреблением. В общем, чисто технически Geforce GTX 980 и GM204 выглядят потрясающе — инженеры Nvidia добились просто сумасшедшей эффективности работы всех исполнительных блоков нового GPU. Плюс к этому, новый чип ещё и функционально весьма хорош (см. первую часть статьи). С рыночной же точки зрения, ситуация пока что не столь радужна — это просто хороший конкурент для Radeon R9 290X на данный момент времени, хотя и явно более перспективный и функционально насыщенный.

Для того, чтобы сделать окончательные выводы по реальному положению дел, нужно узнать производительность новинки Nvidia на базе первого чипа второго поколения архитектуры Maxwell в игровых проектах. Что мы и сделаем в следующей части нашего материала, оценив в том числе и оправданность розничной цены решения уже с учётом скорости рендеринга Geforce GTX 980 и конкурирующих плат Radeon в наборе игр.



Средняя текущая цена (количество предложений) в московской рознице:
Рассматриваемые карты Конкуренты
GTX 980 — 22000 руб. (на 04.12.17) R9 290X — $431(33)
GTX 980 — 22000 руб. (на 04.12.17) R9 290 — $551(2)
GTX 980 — 22000 руб. (на 04.12.17) GTX 780 Ti — $518(11)
GTX 980 — 22000 руб. (на 04.12.17) GTX 780 — $662 (на 01.08.16)


Благодарим компанию Nvidia Russia
и лично Ирину Шеховцову
за предоставленную на тестирование видеокарту

2 блока питания Corsair CMPSU-1200AXEU для тестового стенда предоставлены компанией Corsair

Корпус Corsair Obsidian 800D Full Tower для тестового стенда предоставлен компанией Corsair

Модули памяти Corsair Vengeance CMZ16GX3M4X1600C9 для тестового стенда предоставлены компанией Corsair

Corsair Hydro SeriesT H100i CPU Cooler для тестового стенда предоставлен компанией Corsair

Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт

Системная плата Asus Sabertooth X79 для тестового стенда предоставлена компанией Asustek

Системная плата MSI X79A-GD45(8D) для тестового стенда предоставлена компанией MSI

Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate

Накопитель SSD OCZ Octane 512 ГБ для тестового стенда предоставлен компанией OCZ Russia

2 накопителя SSD Corsair Neutron SeriesT 120 ГБ для тестового стенда предоставлены компанией Corsair

Монитор Asus ProArt PA249Q для рабочего компьютера предоставлен компанией Asustek




Дополнительно