Видеоускоритель Nvidia GeForce GTX 1070 Ti

Часть 2: особенности карты, результаты синтетических тестов


Содержание

Данная часть знакомит читателей с особенностями видеокарты, а также с результатами синтетических тестов.

Устройство(а)

Nvidia GeForce GTX 1070 Ti Founders Edition 8 ГБ 256-битной GDDR5
ПараметрЗначениеНоминальное значение (референс)
GPUGeForce GTX 1070 Ti (GP104)
ИнтерфейсPCI Express x16
Частота работы GPU (ROPs), МГц1607—18851607—1885
Частота работы памяти (физическая (эффективная)), МГц2000 (8000)2000 (8000)
Ширина шины обмена с памятью, бит256
Число вычислительных блоков в GPU19
Число операций (ALU) в блоке128
Суммарное количество блоков ALU2432
Число блоков текстурирования (BLF/TLF/ANIS)152
Число блоков растеризации (ROP)64
Размеры, мм270×100×35270×100×35
Количество слотов в системном блоке, занимаемые видеокартой22
Цвет текстолитачерныйчерный
ЭнергопотреблениеПиковое в 3D, Вт182182
В режиме 2D, Вт3131
В режиме «сна», Вт1111
Уровень шумаВ режиме 2D, дБА31,031,0
В режиме 2D (просмотр видео), дБА33,033,0
В режиме максимального 3D, дБА38,738,7
Выходные гнезда1×DVI-D (Dual-Link), 1×HDMI 2.0b, 3×DisplayPort 1.2/1.3/1.41×DVI-D (Dual-Link), 1×HDMI 2.0b, 3×DisplayPort 1.2/1.3/1.4
Поддержка многопроцессорной работыSLI
Максимальное количество приемников/мониторов для одновременного вывода изображения44
Дополнительное питание: количество 8-контактных разъемов11
Дополнительное питание: количество 6-контактных разъемовНетНет
Максимальное разрешение 2DDisplay Port4096×2160
HDMI4096×2160
DVI2560×1600
Максимальное разрешение 3DDisplay Port4096×2160
HDMI4096×2160
DVI2560×1600

Комплектация локальной памятью
Карта имеет 8 ГБ памяти GDDR5 SDRAM, размещенной в 8 микросхемах по 8 Гбит на лицевой стороне PCB.

Микросхемы памяти Micron (GDDR5) рассчитаны на номинальную частоту работы в 2000 (8000) МГц.

Сравнение с эталонным дизайном (reference)
Вид спереди
Nvidia GeForce GTX 1070 Ti Founders Edition 8 ГБ 256-битной GDDR5 Reference card Nvidia GeForce GTX 1080
Вид сзади
Nvidia GeForce GTX 1070 Ti Founders Edition 8 ГБ 256-битной GDDR5 Reference card Nvidia GeForce GTX 1080

Очевидно, что карта GTX 1070 Ti получена из карты GTX 1080, куда установлено ядро с немного урезанными блоками (а если вести отсчет от GTX 1070, то, наоборот, ядро усилено). PCB этих карт абсолютно одинаковы.

Схема питания получила 5 фаз (dualFET), управляется цифровым контроллером NCP81022 производства On Semiconductor.

Система охлаждения
Референсная СО Nvidia имеет традиционную закрытую форму с цилиндрическим вентилятором на конце. Радиатор, прижимающийся к ядру, основан на испарительной камере, внутри которой находится особая легкоиспаряемая жидкость. Нижняя пластина камеры прижимается к ядру, тепло передается жидкости, которая испаряется и уносит тепло к верхней пластине (имеющей ребра охлаждения), где пары конденсируются. Мы уже рассказывали о такой схеме современного охлаждения топовых ускорителей.

Вентилятор гонит воздух через вышеупомянутый радиатор и имеет особую форму крыльчатки, обеспечивающую пониженный уровень шума.

Микросхемы памяти и силовые транзисторы охлаждаются с помощью специальной пластины кулера. На оборотной стороне PCB установлена пластина, которая является, по сути, декорацией и предохраняет заднюю часть от повреждений.

После 6-часового прогона под нагрузкой максимальная температура GPU не превысила 83 градусов, что является нормальным и обычным результатом для топовых ускорителей. На торце СО имеется подсвечиваемый логотип ускорителя.
Мониторинг температурного режима с помощью MSI Afterburner (автор А. Николайчук AKA Unwinder)

Методика измерения шума

  • Помещение шумоизолировано и заглушено, снижены реверберации.
  • Системный блок, в котором исследовался шум видеокарт, не имеет вентиляторов, не является источником механического шума.
  • Фоновый уровень 18 дБА — это уровень шума в комнате и уровень шумов собственно шумомера.
  • Измерения проводились на расстоянии 50 см от видеокарты на уровне системы охлаждения.
  • Режимы измерения:
    1. Режим простоя в 2D: загружен интернет-браузер с сайтом iXBT.com, окно Microsoft Word, ряд интернет-коммуникаторов.
    2. Режим 2D с просмотром фильмов: используется SmoothVideo Project (SVP) — аппаратное декодирование со вставкой промежуточных кадров.
    3. Режим 3D с максимальной нагрузкой на ускоритель: используется тест FurMark.
  • Оценка градаций уровня шума выполняется по методике, описанной здесь:
    • 28 дБА и менее: шум плохо различим уже на расстоянии одного метра от источника, даже при очень низком уровне фонового шума. Оценка: шум минимальный.
    • от 29 до 34 дБА: шум различим уже с двух метров от источника, но не особо обращает на себя внимания. С таким уровнем шума вполне можно мириться даже при долговременной работе. Оценка: шум низкий.
    • от 35 до 39 дБА: шум уверенно различается и заметно обращает на себя внимание, особенно в помещении с низким уровнем шума. Работать с таким уровнем шума можно, но спать будет затруднительно. Оценка: шум средний.
    • 40 дБА и более: такой постоянный уровень шума уже начинает раздражать, от него быстро устаешь, появляется желание выйти из комнаты или выключить прибор. Оценка: шум высокий.

В режиме простоя в 2D вентилятор работал на частоте 1100 оборотов в минуту, при этом температура графического ядра не поднималась выше 31 градуса, а уровень шума был немного выше фонового и составлял 23,0 дБА.

При просмотре фильма с аппаратным декодированием температура графического ядра чуть вырастала (до 33 градусов), вентилятор работал на той же частоте вращения (1100 об/мин), уровень шума не изменялся (23,0 дБА).

В режиме максимальной нагрузки в 3D температура достигала уровня 83 °C, частота вращения вентилятора поднималась до 2168 оборотов в минуту, шум вырастал до 38,7 дБА. В результате шум СО под нагрузкой достаточно высокий, но не переходящий эргономических пределов. Стоит напомнить, что референсные кулеры будут встречаться на практике только в картах Founders Edition, которые в основном можно купить на сайте компании Nvidia (партнеры такие карты обычно почти не пускают в продажу, только в первых партиях).

Термоснимок




Максимальный нагрев карты (не ядра) 73 градуса — на печатной плате с края под пластиной с обратной стороны.


Комплектация
Видеокарта попала к нам в ОЕМ-виде, без комплекта.


Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

Синтетические тесты проводились на следующих видеокартах:

  • GeForce GTX 1070 Ti со стандартными параметрами (сокращенно GTX 1070 Ti)
  • GeForce GTX 1080 со стандартными параметрами (сокращенно GTX 1080)
  • GeForce GTX 1070 со стандартными параметрами (сокращенно GTX 1070)
  • Radeon RX Vega 64 со стандартными параметрами (сокращенно RX Vega 64)
  • Radeon RX Vega 56 со стандартными параметрами (сокращенно RX Vega 56)

Для анализа производительности новой модели видеокарты GeForce GTX 1070 Ti были выбраны именно эти решения Nvidia по очень простой причине, которую мы уже упоминали на прошлой странице. GeForce GTX 1070 Ti вклинивается в линейку видеокарт компании строго между моделей GeForce GTX 1080 и GTX 1070, основанных на таком же графическом процессоре GP104, но с разным количеством активных исполнительных блоков. Хотя новая видеокарта по мощности ближе к GeForce GTX 1080, но и сравнение с младшей GTX 1070 также будет интересным.

Выбрать конкурентов из стана соперников также было довольно просто. Компания AMD выпустила две модели видеокарт на основе графического процессора Vega 10, аналогичного GP104 по мощности: Radeon RX Vega 64 и Vega 56, и они примерно соответствуют уровню GeForce GTX 1080 и GTX 1070 Ti, как по цене, так и по производительности. Справедливости ради, еще раз отметим, что реальным соперником на рынке для представленной GTX 1070 Ti является именно младшая модель видеокарты компании AMD — Radeon RX Vega 56.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

В DirectX 10-версию RightMark3D вошли два ранее знакомых нам теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также два дополнительных теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы. Эти тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нем используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в этом тесте зависит от количества и эффективности блоков TMU, на результат влияет также и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает еще и эффективный филлрейт с пропускной способностью памяти. Результаты при детализации уровня «High» получаются чуть ниже, чем при детализации «Low».

В задачах процедурной визуализации меха с большим количеством текстурных выборок, решения компании AMD лидируют со времени выпуска первых видеочипов на базе архитектуры GCN, и именно различные модели Radeon являлись лучшими в этих сравнениях, что говорит о большей эффективности выполнения ими подобных программ. Это подтверждается и сегодня — хотя рассматриваемая нами видеокарта GeForce GTX 1070 Ti и практически не уступила GTX 1080, но с Radeon RX Vega 56 конкурировать не может, не говоря уже о более мощной модели на основе графического процессора Vega 10.

В первом нашем Direct3D 10-тесте новая видеоплата компании Nvidia оказалась всего на 1% медленнее старшей модели GeForce GTX 1080, основанной на полном чипе GP104, а отрыв от младшего решения GTX 1070 получился более чем в 20%, что хоть и меньше теоретической разницы, но все же весьма ощутимо. Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: в такой ситуации что-то должно измениться, и ПСП с филлрейтом будут влиять меньше:

В усложненных условиях результаты теста мало изменились, но став лишь чуть интереснее. Новая видеокарта модели GeForce GTX 1070 Ti опережает модель GTX 1070 даже несколько меньше, а вот от GTX 1080 она отстала уже на 7-8%, что хоть и близко к теоретическому отрыву в 5%, но все же больше его. GeForce GTX 1070 Ti в этом тесте все так же отстает от конкурирующих с ним видеокарт в виде Radeon RX Vega 56 и Vega 64, хотя в самом сложном режиме разница между урезанными GP104 от Nvidia и Vega 10 от AMD оказалась уже не такой большой, как раньше — около 20%.

Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis, Lost Planet и многих других. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип еще примерно в два раза — такой режим называется «High».

Диаграмма очень схожа с предыдущей, также без включения суперсэмплинга. В этот раз новая модель видеокарты GeForce GTX 1070 Ti оказалась лишь на 2% медленнее старшей сестры GTX 1080, опередив младшую модель GTX 1070 на привычные 20%. Если мы посмотрим на сравнение с видеокартами AMD, то в этом случае новинка все так же сильно отстает — младшая из плат Radeon, которая и является ее конкурентом, оказалась быстрее на 26-27%. Посмотрим, что изменит включение суперсэмплинга:

При включении суперсэмплинга и самозатенения задача становится тяжелее, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьезное падение производительности. Разница между скоростными показателями протестированных видеокарт немного изменилась, хотя включение суперсэмплинга и сказывается меньше, чем в предыдущем случае. Эти условия в наших сравнениях обычно существенно меняют соотношение сил, это же получилось и сегодня.

Хотя графические решения AMD Radeon в этом D3D10-тесте пиксельных шейдеров также работают несколько эффективнее конкурирующих плат GeForce, но новые видеокарты, основанные на чипах архитектуры Pascal, смогли показать достойные результаты. Так, новая модель GTX 1070 Ti уже практически не уступает Radeon RX Vega 56 в самых тяжелых условиях (разница составила 5%). По сравнению с другими решениями Nvidia, новая видеокарта показала скорость на 18-24% быстрее GeForce GTX 1070 и уступила старшей GTX 1080 около 4%, что соответствует теории.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты предельных математических тестов чаще всего лишь примерно соответствуют разнице по частотам и количеству вычислительных блоков, на результаты влияет и разная эффективность их использования в конкретных задачах, и оптимизация драйверов, и новейшие системы управления частотами и питанием, а порой даже упор в ПСП.

В случае нашего теста Mineral, выпущенная сегодня в продажу GeForce GTX 1070 Ti показала неплохой результат на уровне GTX 1080, серьезно опередив младшую модель GTX 1070. Что касается плат от компании AMD, то главный соперник сегодняшней новинки в виде Radeon RX Vega 56 смог обойти видеокарту Nvidia более чем на 20% — в математических тестах графические процессоры AMD всегда сильны.

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нем только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Во втором математическом тесте из нашего RightMark мы видим почти такие же результаты, очень похожие на предыдущую диаграмму. Новая модель GeForce GTX 1070 Ti и в этот раз ничуть не отстала от GTX 1080 и оказалась на 24% быстрее своей младшей сестры GTX 1070, что близко к теоретической разнице между ними.

Если сравнивать урезанный GP104 архитектуры Pascal с решениями AMD, то обе видеокарты Radeon показывают лучшие результаты, так как графические процессоры этой компании весьма сильны именно в математических тестах, хотя с выпуском решений архитектуры Pascal компания Nvidia и улучшила свои позиции, в том числе и по математической производительности, но GeForce GTX 1070 Ti этого не хватило для того, чтобы достать Vega 56 — последняя хоть и не так сильно (на 13%), но быстрее.

Direct3D 10: тесты геометрических шейдеров

В составе пакета RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трех уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близкое к двукратному. Задача эта для мощных современных видеокарт довольно простая, и производительность в ней ограничена скоростью обработки геометрии, а иногда и пропускной способностью памяти и/или филлрейтом.

Разница между результатами видеокарт на чипах Nvidia и AMD тут не слишком большая, но она в пользу решений калифорнийской компании. Вероятно, это обусловлено отличиями в геометрических конвейерах чипов этих компаний. В тестах геометрии платы GeForce всегда были конкурентоспособнее Radeon, и хотя последние подтянулись с выпуском Vega, но даже не топовый GP104 до сих пор имеет большее количество блоков по обработке геометрии и выигрывает у своих конкурентов.

Новая модель GeForce GTX 1070 Ti обогнала свою младшую сестру GTX 1070 на основе еще более урезанной GP104 во всех условиях на 7-11%, а от старшей платы GTX 1080 заметно отстала лишь в самом сложном режиме. Видеокарты Radeon в этом тесте показывают результаты несколько хуже. Прямой конкурент в виде Radeon RX Vega 56 на основе самого мощного GPU компании AMD уступил до 24% в сложных условиях, да и Vega 64 также проиграла новинке (в легком режиме скорость чем-то ограничена). Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки цифры в этом тесте изменились незначительно, и для плат AMD и для решений Nvidia. Видеокарты в этом тесте геометрических шейдеров слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, поэтому и наши выводы остаются неизменными. GeForce GTX 1070 Ti и в этом подтесте показала сильный результат, обогнав конкурентов от AMD в тяжелых и средних условиях, и почти не отстав от GeForce GTX 1080, что соответствует теории.

К сожалению, «Hyperlight» — второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load, в котором используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output, на всех современных видеокартах компании AMD не работает. Этот тест давно перестал запускаться на платах этой компании, и ошибка не исправлена вот уже несколько лет. Так что рассматриваем в этом тесте только результаты видеокарт Nvidia:

На этой диаграмме мы видим несколько иные относительные результаты, по сравнению с тестом Galaxy, тут есть явные отличия. Новая видеоплата компании Nvidia, основанная на урезанном чипе GP104, хоть и оказалась быстрее младшей модели GeForce GTX 1070 примерно на 10%, но и от более мощной модификации на том же GPU она отстала на 6-8%, особенно в сложных условиях. Эта разница явно больше теоретической. Возможно, тут сказывается упор в пропускную способность памяти. Посмотрим, изменится ли что-то в тяжелом режиме:

В таких условиях результаты видеокарт GeForce явно поменялись, но сегодняшняя новинка относительно своих сестер положение не изменила. GeForce GTX 1070 Ti обогнала GTX 1070 на 11-15%, уступив старшей модели до 8%, что многовато, так как по текстурной и шейдерной производительности разница должна быть меньшей. Впрочем, вывод в любом случае такой — в тестах на основе геометрических шейдеров новинка показала себя очень хорошо, особенно по сравнению с конкурентами от AMD.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Наши предыдущие исследования показали, что на результаты этого теста может влиять филлрейт или пропускная способность памяти, ограничивающие производительность, что всегда хорошо заметно по результатам плат Nvidia в простых режимах. Новая видеокарта GeForce GTX 1070 Ti в этом тесте показывает скорость на уровне старшей модели на том же графическом процессоре, ведь все они имеют одинаковую скорость заполнения сцены. GeForce GTX 1070 отстала от новинки на 17-18%, что чуть ниже теоретической разницы.

Обе платы компании AMD на базе видеочипа Vega 10 в этот раз оказались весьма сильны, и они не просто достали до рассматриваемой сегодня модели GeForce, но и опередили ее с запасом — только в самых сложных условиях разница между GTX 1070 Ti и Vega 56 оказалась 11%, в других условиях она была до 30%. Посмотрим на производительность представленных в сравнении видеокарт в этом же тесте, но с увеличенным количеством текстурных выборок:

Ситуация на диаграмме заметно изменилась, решения компании AMD в тяжелых режимах потеряли значительно больше плат GeForce. Хотя в самом легком режиме они продолжают отлично выступать, опережая в том числе новое решение на основе урезанного чипа GP104, но в сложных условиях модель GeForce GTX 1070 Ti показала уже более высокую скорость. Она на 15-19% быстрее GTX 1070 и все так же отстает до 8% от полноценного GP104. Если сравнивать новинку с парой Radeon, то она явно проигрывает платам AMD в легком и среднем режимах, а вот в тяжелом одерживает победу, обогнав конкурента на весомые 20%.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нем используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты во втором тесте вершинного текстурирования «Waves» похожи на то, что мы видели на предыдущих диаграммах, но скоростные показатели всех GeForce в этом тесте несколько ниже. Производительности новой модели GeForce GTX 1070 Ti хватает для того, чтобы показать результат лучше GTX 1070 на 10-16% и не отстать от GTX 1080 более чем на 6% (и то не всегда), а вот решения конкурента тут явно быстрее. Radeon RX Vega 56 впереди в легком режиме на 25%, и на 8% — в тяжелом. Рассмотрим второй вариант этой же задачи:

С усложнением условий во втором тесте текстурных выборок скорость всех решений стала ниже, но пострадали все видеокарты, поэтому выводы меняются мало. Новая модель GeForce GTX 1070 Ti на 7-14% быстрее своей младшей сестры GTX 1070, но совсем не отстает от более мощного варианта на том же GPU. Если сравнивать новинку с неплохо выступившими в этих тестах Radeon, то прямой конкурент от AMD всегда быстрее GTX 1070 Ti, пусть разница между ними и сокращается с 20% в легких условиях сразу до 6% в тяжелых.

3DMark Vantage: тесты Feature

Синтетические тесты из пакета 3DMark Vantage могут открыть нам то, что мы ранее упустили. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10, до сих пор актуальны и интересны тем, что отличаются от наших. При анализе результатов новейшей видеокарты GeForce GTX 1070 Ti в этом пакете мы сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark.

Feature Test 1: Texture Fill

Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Эффективность работы видеокарт AMD и Nvidia в текстурном тесте компании Futuremark достаточно высока, и итоговые цифры разных моделей близки к соответствующим теоретическим параметрам. Разница в скорости между GeForce GTX 1070 Ti и GTX 1080 точно соответствует теории — 5% в пользу более мощного решения. Младший же вариант видеокарты на основе еще больше урезанного GP104 отстал от новинки почти на треть, и эта разница также соответствует теоретической по скорости текстурирования.

Что касается сравнения скорости текстурирования новой видеоплаты Nvidia с конкурирующими с ней решениями конкурента, то и тут новинка отстала от обеих видеокарт AMD. Решения этой компании AMD с текстурированием справляются весьма неплохо. Прямой соперник новинки Radeon RX Vega 56, имеющий немало блоков TMU, обошел GTX 1070 Ti на 12%, а старший GPU оказался еще быстрее.

Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Цифры из второго подтеста 3DMark Vantage показывают производительность блоков ROP, без учета величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), и тест обычно измеряет именно производительность ROP. Рассматриваемая нами сегодня плата GeForce GTX 1070 Ti снова опередила младшую модель GTX 1070 более чем на четверть, отстав от старшей GTX 1080 на 7% — немного непонятно, почему получилась такая разница между ними в тесте, который должен показывать разницу в филлрейте (скорости блоков ROP).

Если сравнивать скорость заполнения сцены новой видеокартой GeForce GTX 1070 Ti с взятыми нами в тест решениями компании AMD, то рассматриваемая сегодня плата в этой задаче показала скорость на уровне старшей Radeon RX Vega 64, а ее прямой конкурент в виде Vega 56 отстает от новинки на 12%. На результатах явно сказывается и разное количество блоков ROP у этих плат и разная эффективность оптимизаций при сжатии ими данных во фреймбуфере.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника давно используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.

Этот тест из пакета 3DMark Vantage отличается от проанализированных нами ранее тем, что результаты в нем зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен правильный баланс GPU, а также эффективность выполнения сложных шейдеров.

В этой «синтетике» из 3DMark Vantage, когда важны и математическая и текстурная производительность, новая плата GeForce GTX 1070 Ti снова показала очень неплохой результат, оказавшись на 27% быстрее младшей модели на том же графическом процессоре GP104, что полностью соответствует теории. Старшая же модель GTX 1080 была быстрее на те же 7%. Что еще более приятно, новая плата от Nvidia показала в этом тесте результат на 3% лучше, чем RX Vega 56, хотя Radeon в этом тесте обычно были весьма сильны.

Feature Test 4: GPU Cloth

Четвертый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте также зависит сразу от нескольких параметров, и основными факторами влияния должны являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. То есть, сильные стороны чипов Nvidia должны проявляться, но мы всегда отмечали странные результаты GeForce в этом тесте, в котором очередная новая видеокарта компании показала все ту же низкую скорость на уровне своих ближайших родственниц, младшей и старшей.

Неудивительно, что в таких условиях сравнение с платами Radeon в этом тесте для GeForce GTX 1070 Ti получилось не очень радостным. Несмотря на теоретическое отставание по геометрической производительности у чипов AMD, по сравнению с конкурирующими решениями, платы Radeon в этом тесте работают весьма эффективно, заметно обгоняя все видеокарты GeForce, представленные в нашем сравнении. Что-то на видеокартах Nvidia не работает так, как должно, и двукратного проигрыша просто быть не может даже в теории.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.

Во втором «геометрическом» тесте из 3DMark Vantage ситуация сильно отличается от предыдущей диаграммы. В этот раз новая GeForce GTX 1070 Ti показывает результат, лишь на 4-7% меньше сразу трех видеокарт сравнения, имеющих близкие результаты. Новая плата Nvidia в этот раз на 9% опередила младшую модель GeForce GTX 1070, стоящей на ступень ниже, но отстала от остальных. Сравнение новинки от компании Nvidia с конкурирующими видеокартами AMD в этот раз показало ее отставание на 4% от прямого соперника — Radeon RX Vega 64.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом для GPU, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических вычислений.

В этом математическом тесте производительность решений хоть и не полностью соответствует теории, но близка к тому, что должно быть, исходя из пиковых показателей. В математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы видим распределение результатов, несколько отличающееся от того, что мы получили в схожих тестах нашего пакета RightMark.

Хорошо видно, что видеочипы компании AMD с архитектурой GCN справляются с подобными задачами явно лучше решений конкурента в случаях, когда выполняется интенсивная «математика», но новая модель от компании Nvidia, основанная на урезанном графическом процессоре GP104, почти достала своего соперника Radeon RX Vega 56, уступив тому 12% — это немало, но даже такой проигрыш можно считать неплохим результатом для новинки, с учетом специфики этого конкретного теста.

Если сравнивать новинку с соседними моделями компании в линейке, то GTX 1070 Ti в этом тесте получилась быстрее GTX 1070 на традиционные уже 28%, и все те же привычные для нашего материала 7% уступила старшей GTX 1080, что довольно близко и к теоретической разнице между всеми этими решениями на основе GP104.

***

Исходя из результатов синтетических тестов новой видеокарты Nvidia GeForce GTX 1070 Ti, основанной на урезанном графическом процессоре GP104, а также показателям производительности других моделей видеокарт от обоих производителей дискретных видеочипов, мы делаем вывод о том, что рассматриваемая нами сегодня видеокарта станет сильным конкурентом на рынке, а также одним из наиболее выгодных решений на рынке мощных игровых видеокарт в целом. Самое важное достижение новинки в том, что она совсем незначительно отстала от GeForce GTX 1080 (примерно на 5-7%, что соответствует теории) и была заметно быстрее GeForce GTX 1070.

А это значит, что конкурент для Radeon RX Vega 56 в играх должен получиться сильный, хотя сравнение решений AMD и Nvidia в синтетических тестах никогда простым не было. Видеокарта компании Nvidia показала хорошие результаты почти во всех синтетических тестах, уступив в некоторых из них своему конкуренту по объективным причинам. И хотя мы не раз наблюдали и проигрыши новинки в синтетике, по сравнению с недавно вышедшими на рынок платами Radeon, но тут нужно учитывать практику предыдущих тестов, которые показали, что не всю синтетику можно напрямую перенести на игры. В которых мы увидим соотношение результатов, не соответствующее каким-то одним типам синтетических тестов: чисто геометрических или сугубо математических.

Ведь у Radeon и GeForce разные сильные стороны, и хотя решения компании AMD традиционно отличаются эффективным исполнением интенсивных вычислительных задач, графические процессоры Nvidia весьма эффективно используют свои возможности в реальных играх и имеют достаточную скорость текстурирования и высокую скорость заполнения. Поэтому в игровых приложениях все будет несколько иначе, по сравнению с синтетическими тестами. GeForce GTX 1070 Ti должна показать в играх скорость чуть ниже уровня GeForce GTX 1080, что поставит ее на очень хорошую позицию, по сравнению с конкурирующей видеокартой Radeon RX Vega 56, против которой она и создавалась, собственно.

В следующей части нашего материала мы как раз и оценим производительность новой видеокарты Nvidia, созданной на основе слегка урезанного графического процессора GP104, по сравнению с ее конкурентом в игровых приложениях, протестировав GeForce GTX 1070 Ti в нашем наборе современных игр и сравнив показатели новинки с Radeon RX Vega 56.



Средняя цена (количество предложений) в московской рознице:
Рассматриваемые карты Конкуренты
GTX 1070 Ti 8 ГБ — 35000 руб. (на 04.12.17) GTX 1080 8 ГБ — 39000 руб. (на 04.12.17)
GTX 1070 Ti 8 ГБ — 35000 руб. (на 04.12.17) R9 Fury X 4 ГБ — 28 700  (на 03.08.17)
GTX 1070 Ti 8 ГБ — 35000 руб. (на 04.12.17) RX Vega 56 8 ГБ — 40000 руб. (на 04.12.17)
GTX 1070 Ti 8 ГБ — 35000 руб. (на 04.12.17) RX Vega 64 8 ГБ — 44500 руб. (на 04.12.17)


Благодарим компанию Nvidia Russia
и лично Ирину Шеховцову
за предоставленную на тестирование видеокарту

Блок питания Seasonic Prime 1000 W Titanium для тестового стенда предоставлен компанией Seasonic

Модули памяти AMD Radeon R9 8 ГБ UDIMM 3200 МГц для тестового стенда предоставлены компанией AMD

Системная плата Asus ROG Crosshair VI Hero для тестового стенда предоставлена компанией AMD

CPU Cooler Antec Kuhler H2O 920 для тестового стенда предоставлен компанией AMD

Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт

Корпус Corsair Obsidian 800D Full Tower для тестового стенда предоставлен компанией Corsair

Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate





Дополнительно

Обзор видеоускорителя Nvidia GeForce GTX 1070 Ti. Часть 2: особенности карты, результаты синтетических тестов

Видеоускоритель Nvidia GeForce GTX 1070 Ti

Часть 2: особенности карты, результаты синтетических тестов

Содержание

Данная часть знакомит читателей с особенностями видеокарты, а также с результатами синтетических тестов.

Устройство(а)

Nvidia GeForce GTX 1070 Ti Founders Edition 8 ГБ 256-битной GDDR5
ПараметрЗначениеНоминальное значение (референс)
GPUGeForce GTX 1070 Ti (GP104)
ИнтерфейсPCI Express x16
Частота работы GPU (ROPs), МГц1607—18851607—1885
Частота работы памяти (физическая (эффективная)), МГц2000 (8000)2000 (8000)
Ширина шины обмена с памятью, бит256
Число вычислительных блоков в GPU19
Число операций (ALU) в блоке128
Суммарное количество блоков ALU2432
Число блоков текстурирования (BLF/TLF/ANIS)152
Число блоков растеризации (ROP)64
Размеры, мм270×100×35270×100×35
Количество слотов в системном блоке, занимаемые видеокартой22
Цвет текстолитачерныйчерный
ЭнергопотреблениеПиковое в 3D, Вт182182
В режиме 2D, Вт3131
В режиме «сна», Вт1111
Уровень шумаВ режиме 2D, дБА31,031,0
В режиме 2D (просмотр видео), дБА33,033,0
В режиме максимального 3D, дБА38,738,7
Выходные гнезда1×DVI-D (Dual-Link), 1×HDMI 2.0b, 3×DisplayPort 1.2/1.3/1.41×DVI-D (Dual-Link), 1×HDMI 2.0b, 3×DisplayPort 1.2/1.3/1.4
Поддержка многопроцессорной работыSLI
Максимальное количество приемников/мониторов для одновременного вывода изображения44
Дополнительное питание: количество 8-контактных разъемов11
Дополнительное питание: количество 6-контактных разъемовНетНет
Максимальное разрешение 2DDisplay Port4096×2160
HDMI4096×2160
DVI2560×1600
Максимальное разрешение 3DDisplay Port4096×2160
HDMI4096×2160
DVI2560×1600

Комплектация локальной памятью
Карта имеет 8 ГБ памяти GDDR5 SDRAM, размещенной в 8 микросхемах по 8 Гбит на лицевой стороне PCB.

Микросхемы памяти Micron (GDDR5) рассчитаны на номинальную частоту работы в 2000 (8000) МГц.

Сравнение с эталонным дизайном (reference)
Вид спереди
Nvidia GeForce GTX 1070 Ti Founders Edition 8 ГБ 256-битной GDDR5 Reference card Nvidia GeForce GTX 1080
Вид сзади
Nvidia GeForce GTX 1070 Ti Founders Edition 8 ГБ 256-битной GDDR5 Reference card Nvidia GeForce GTX 1080

Очевидно, что карта GTX 1070 Ti получена из карты GTX 1080, куда установлено ядро с немного урезанными блоками (а если вести отсчет от GTX 1070, то, наоборот, ядро усилено). PCB этих карт абсолютно одинаковы.

Схема питания получила 5 фаз (dualFET), управляется цифровым контроллером NCP81022 производства On Semiconductor.

Система охлаждения
Референсная СО Nvidia имеет традиционную закрытую форму с цилиндрическим вентилятором на конце. Радиатор, прижимающийся к ядру, основан на испарительной камере, внутри которой находится особая легкоиспаряемая жидкость. Нижняя пластина камеры прижимается к ядру, тепло передается жидкости, которая испаряется и уносит тепло к верхней пластине (имеющей ребра охлаждения), где пары конденсируются. Мы уже рассказывали о такой схеме современного охлаждения топовых ускорителей.

Вентилятор гонит воздух через вышеупомянутый радиатор и имеет особую форму крыльчатки, обеспечивающую пониженный уровень шума.

Микросхемы памяти и силовые транзисторы охлаждаются с помощью специальной пластины кулера. На оборотной стороне PCB установлена пластина, которая является, по сути, декорацией и предохраняет заднюю часть от повреждений.

После 6-часового прогона под нагрузкой максимальная температура GPU не превысила 83 градусов, что является нормальным и обычным результатом для топовых ускорителей. На торце СО имеется подсвечиваемый логотип ускорителя.
Мониторинг температурного режима с помощью MSI Afterburner (автор А. Николайчук AKA Unwinder)

Методика измерения шума

  • Помещение шумоизолировано и заглушено, снижены реверберации.
  • Системный блок, в котором исследовался шум видеокарт, не имеет вентиляторов, не является источником механического шума.
  • Фоновый уровень 18 дБА — это уровень шума в комнате и уровень шумов собственно шумомера.
  • Измерения проводились на расстоянии 50 см от видеокарты на уровне системы охлаждения.
  • Режимы измерения:
    1. Режим простоя в 2D: загружен интернет-браузер с сайтом iXBT.com, окно Microsoft Word, ряд интернет-коммуникаторов.
    2. Режим 2D с просмотром фильмов: используется SmoothVideo Project (SVP) — аппаратное декодирование со вставкой промежуточных кадров.
    3. Режим 3D с максимальной нагрузкой на ускоритель: используется тест FurMark.
  • Оценка градаций уровня шума выполняется по методике, описанной здесь:
    • 28 дБА и менее: шум плохо различим уже на расстоянии одного метра от источника, даже при очень низком уровне фонового шума. Оценка: шум минимальный.
    • от 29 до 34 дБА: шум различим уже с двух метров от источника, но не особо обращает на себя внимания. С таким уровнем шума вполне можно мириться даже при долговременной работе. Оценка: шум низкий.
    • от 35 до 39 дБА: шум уверенно различается и заметно обращает на себя внимание, особенно в помещении с низким уровнем шума. Работать с таким уровнем шума можно, но спать будет затруднительно. Оценка: шум средний.
    • 40 дБА и более: такой постоянный уровень шума уже начинает раздражать, от него быстро устаешь, появляется желание выйти из комнаты или выключить прибор. Оценка: шум высокий.

В режиме простоя в 2D вентилятор работал на частоте 1100 оборотов в минуту, при этом температура графического ядра не поднималась выше 31 градуса, а уровень шума был немного выше фонового и составлял 23,0 дБА.

При просмотре фильма с аппаратным декодированием температура графического ядра чуть вырастала (до 33 градусов), вентилятор работал на той же частоте вращения (1100 об/мин), уровень шума не изменялся (23,0 дБА).

В режиме максимальной нагрузки в 3D температура достигала уровня 83 °C, частота вращения вентилятора поднималась до 2168 оборотов в минуту, шум вырастал до 38,7 дБА. В результате шум СО под нагрузкой достаточно высокий, но не переходящий эргономических пределов. Стоит напомнить, что референсные кулеры будут встречаться на практике только в картах Founders Edition, которые в основном можно купить на сайте компании Nvidia (партнеры такие карты обычно почти не пускают в продажу, только в первых партиях).

Термоснимок




Максимальный нагрев карты (не ядра) 73 градуса — на печатной плате с края под пластиной с обратной стороны.


Комплектация
Видеокарта попала к нам в ОЕМ-виде, без комплекта.


Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

Синтетические тесты проводились на следующих видеокартах:

  • GeForce GTX 1070 Ti со стандартными параметрами (сокращенно GTX 1070 Ti)
  • GeForce GTX 1080 со стандартными параметрами (сокращенно GTX 1080)
  • GeForce GTX 1070 со стандартными параметрами (сокращенно GTX 1070)
  • Radeon RX Vega 64 со стандартными параметрами (сокращенно RX Vega 64)
  • Radeon RX Vega 56 со стандартными параметрами (сокращенно RX Vega 56)

Для анализа производительности новой модели видеокарты GeForce GTX 1070 Ti были выбраны именно эти решения Nvidia по очень простой причине, которую мы уже упоминали на прошлой странице. GeForce GTX 1070 Ti вклинивается в линейку видеокарт компании строго между моделей GeForce GTX 1080 и GTX 1070, основанных на таком же графическом процессоре GP104, но с разным количеством активных исполнительных блоков. Хотя новая видеокарта по мощности ближе к GeForce GTX 1080, но и сравнение с младшей GTX 1070 также будет интересным.

Выбрать конкурентов из стана соперников также было довольно просто. Компания AMD выпустила две модели видеокарт на основе графического процессора Vega 10, аналогичного GP104 по мощности: Radeon RX Vega 64 и Vega 56, и они примерно соответствуют уровню GeForce GTX 1080 и GTX 1070 Ti, как по цене, так и по производительности. Справедливости ради, еще раз отметим, что реальным соперником на рынке для представленной GTX 1070 Ti является именно младшая модель видеокарты компании AMD — Radeon RX Vega 56.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

В DirectX 10-версию RightMark3D вошли два ранее знакомых нам теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также два дополнительных теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы. Эти тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нем используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в этом тесте зависит от количества и эффективности блоков TMU, на результат влияет также и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает еще и эффективный филлрейт с пропускной способностью памяти. Результаты при детализации уровня «High» получаются чуть ниже, чем при детализации «Low».

В задачах процедурной визуализации меха с большим количеством текстурных выборок, решения компании AMD лидируют со времени выпуска первых видеочипов на базе архитектуры GCN, и именно различные модели Radeon являлись лучшими в этих сравнениях, что говорит о большей эффективности выполнения ими подобных программ. Это подтверждается и сегодня — хотя рассматриваемая нами видеокарта GeForce GTX 1070 Ti и практически не уступила GTX 1080, но с Radeon RX Vega 56 конкурировать не может, не говоря уже о более мощной модели на основе графического процессора Vega 10.

В первом нашем Direct3D 10-тесте новая видеоплата компании Nvidia оказалась всего на 1% медленнее старшей модели GeForce GTX 1080, основанной на полном чипе GP104, а отрыв от младшего решения GTX 1070 получился более чем в 20%, что хоть и меньше теоретической разницы, но все же весьма ощутимо. Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: в такой ситуации что-то должно измениться, и ПСП с филлрейтом будут влиять меньше:

В усложненных условиях результаты теста мало изменились, но став лишь чуть интереснее. Новая видеокарта модели GeForce GTX 1070 Ti опережает модель GTX 1070 даже несколько меньше, а вот от GTX 1080 она отстала уже на 7-8%, что хоть и близко к теоретическому отрыву в 5%, но все же больше его. GeForce GTX 1070 Ti в этом тесте все так же отстает от конкурирующих с ним видеокарт в виде Radeon RX Vega 56 и Vega 64, хотя в самом сложном режиме разница между урезанными GP104 от Nvidia и Vega 10 от AMD оказалась уже не такой большой, как раньше — около 20%.

Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis, Lost Planet и многих других. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип еще примерно в два раза — такой режим называется «High».

Диаграмма очень схожа с предыдущей, также без включения суперсэмплинга. В этот раз новая модель видеокарты GeForce GTX 1070 Ti оказалась лишь на 2% медленнее старшей сестры GTX 1080, опередив младшую модель GTX 1070 на привычные 20%. Если мы посмотрим на сравнение с видеокартами AMD, то в этом случае новинка все так же сильно отстает — младшая из плат Radeon, которая и является ее конкурентом, оказалась быстрее на 26-27%. Посмотрим, что изменит включение суперсэмплинга:

При включении суперсэмплинга и самозатенения задача становится тяжелее, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьезное падение производительности. Разница между скоростными показателями протестированных видеокарт немного изменилась, хотя включение суперсэмплинга и сказывается меньше, чем в предыдущем случае. Эти условия в наших сравнениях обычно существенно меняют соотношение сил, это же получилось и сегодня.

Хотя графические решения AMD Radeon в этом D3D10-тесте пиксельных шейдеров также работают несколько эффективнее конкурирующих плат GeForce, но новые видеокарты, основанные на чипах архитектуры Pascal, смогли показать достойные результаты. Так, новая модель GTX 1070 Ti уже практически не уступает Radeon RX Vega 56 в самых тяжелых условиях (разница составила 5%). По сравнению с другими решениями Nvidia, новая видеокарта показала скорость на 18-24% быстрее GeForce GTX 1070 и уступила старшей GTX 1080 около 4%, что соответствует теории.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты предельных математических тестов чаще всего лишь примерно соответствуют разнице по частотам и количеству вычислительных блоков, на результаты влияет и разная эффективность их использования в конкретных задачах, и оптимизация драйверов, и новейшие системы управления частотами и питанием, а порой даже упор в ПСП.

В случае нашего теста Mineral, выпущенная сегодня в продажу GeForce GTX 1070 Ti показала неплохой результат на уровне GTX 1080, серьезно опередив младшую модель GTX 1070. Что касается плат от компании AMD, то главный соперник сегодняшней новинки в виде Radeon RX Vega 56 смог обойти видеокарту Nvidia более чем на 20% — в математических тестах графические процессоры AMD всегда сильны.

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нем только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Во втором математическом тесте из нашего RightMark мы видим почти такие же результаты, очень похожие на предыдущую диаграмму. Новая модель GeForce GTX 1070 Ti и в этот раз ничуть не отстала от GTX 1080 и оказалась на 24% быстрее своей младшей сестры GTX 1070, что близко к теоретической разнице между ними.

Если сравнивать урезанный GP104 архитектуры Pascal с решениями AMD, то обе видеокарты Radeon показывают лучшие результаты, так как графические процессоры этой компании весьма сильны именно в математических тестах, хотя с выпуском решений архитектуры Pascal компания Nvidia и улучшила свои позиции, в том числе и по математической производительности, но GeForce GTX 1070 Ti этого не хватило для того, чтобы достать Vega 56 — последняя хоть и не так сильно (на 13%), но быстрее.

Direct3D 10: тесты геометрических шейдеров

В составе пакета RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трех уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близкое к двукратному. Задача эта для мощных современных видеокарт довольно простая, и производительность в ней ограничена скоростью обработки геометрии, а иногда и пропускной способностью памяти и/или филлрейтом.

Разница между результатами видеокарт на чипах Nvidia и AMD тут не слишком большая, но она в пользу решений калифорнийской компании. Вероятно, это обусловлено отличиями в геометрических конвейерах чипов этих компаний. В тестах геометрии платы GeForce всегда были конкурентоспособнее Radeon, и хотя последние подтянулись с выпуском Vega, но даже не топовый GP104 до сих пор имеет большее количество блоков по обработке геометрии и выигрывает у своих конкурентов.

Новая модель GeForce GTX 1070 Ti обогнала свою младшую сестру GTX 1070 на основе еще более урезанной GP104 во всех условиях на 7-11%, а от старшей платы GTX 1080 заметно отстала лишь в самом сложном режиме. Видеокарты Radeon в этом тесте показывают результаты несколько хуже. Прямой конкурент в виде Radeon RX Vega 56 на основе самого мощного GPU компании AMD уступил до 24% в сложных условиях, да и Vega 64 также проиграла новинке (в легком режиме скорость чем-то ограничена). Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки цифры в этом тесте изменились незначительно, и для плат AMD и для решений Nvidia. Видеокарты в этом тесте геометрических шейдеров слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, поэтому и наши выводы остаются неизменными. GeForce GTX 1070 Ti и в этом подтесте показала сильный результат, обогнав конкурентов от AMD в тяжелых и средних условиях, и почти не отстав от GeForce GTX 1080, что соответствует теории.

К сожалению, «Hyperlight» — второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load, в котором используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output, на всех современных видеокартах компании AMD не работает. Этот тест давно перестал запускаться на платах этой компании, и ошибка не исправлена вот уже несколько лет. Так что рассматриваем в этом тесте только результаты видеокарт Nvidia:

На этой диаграмме мы видим несколько иные относительные результаты, по сравнению с тестом Galaxy, тут есть явные отличия. Новая видеоплата компании Nvidia, основанная на урезанном чипе GP104, хоть и оказалась быстрее младшей модели GeForce GTX 1070 примерно на 10%, но и от более мощной модификации на том же GPU она отстала на 6-8%, особенно в сложных условиях. Эта разница явно больше теоретической. Возможно, тут сказывается упор в пропускную способность памяти. Посмотрим, изменится ли что-то в тяжелом режиме:

В таких условиях результаты видеокарт GeForce явно поменялись, но сегодняшняя новинка относительно своих сестер положение не изменила. GeForce GTX 1070 Ti обогнала GTX 1070 на 11-15%, уступив старшей модели до 8%, что многовато, так как по текстурной и шейдерной производительности разница должна быть меньшей. Впрочем, вывод в любом случае такой — в тестах на основе геометрических шейдеров новинка показала себя очень хорошо, особенно по сравнению с конкурентами от AMD.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Наши предыдущие исследования показали, что на результаты этого теста может влиять филлрейт или пропускная способность памяти, ограничивающие производительность, что всегда хорошо заметно по результатам плат Nvidia в простых режимах. Новая видеокарта GeForce GTX 1070 Ti в этом тесте показывает скорость на уровне старшей модели на том же графическом процессоре, ведь все они имеют одинаковую скорость заполнения сцены. GeForce GTX 1070 отстала от новинки на 17-18%, что чуть ниже теоретической разницы.

Обе платы компании AMD на базе видеочипа Vega 10 в этот раз оказались весьма сильны, и они не просто достали до рассматриваемой сегодня модели GeForce, но и опередили ее с запасом — только в самых сложных условиях разница между GTX 1070 Ti и Vega 56 оказалась 11%, в других условиях она была до 30%. Посмотрим на производительность представленных в сравнении видеокарт в этом же тесте, но с увеличенным количеством текстурных выборок:

Ситуация на диаграмме заметно изменилась, решения компании AMD в тяжелых режимах потеряли значительно больше плат GeForce. Хотя в самом легком режиме они продолжают отлично выступать, опережая в том числе новое решение на основе урезанного чипа GP104, но в сложных условиях модель GeForce GTX 1070 Ti показала уже более высокую скорость. Она на 15-19% быстрее GTX 1070 и все так же отстает до 8% от полноценного GP104. Если сравнивать новинку с парой Radeon, то она явно проигрывает платам AMD в легком и среднем режимах, а вот в тяжелом одерживает победу, обогнав конкурента на весомые 20%.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нем используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты во втором тесте вершинного текстурирования «Waves» похожи на то, что мы видели на предыдущих диаграммах, но скоростные показатели всех GeForce в этом тесте несколько ниже. Производительности новой модели GeForce GTX 1070 Ti хватает для того, чтобы показать результат лучше GTX 1070 на 10-16% и не отстать от GTX 1080 более чем на 6% (и то не всегда), а вот решения конкурента тут явно быстрее. Radeon RX Vega 56 впереди в легком режиме на 25%, и на 8% — в тяжелом. Рассмотрим второй вариант этой же задачи:

С усложнением условий во втором тесте текстурных выборок скорость всех решений стала ниже, но пострадали все видеокарты, поэтому выводы меняются мало. Новая модель GeForce GTX 1070 Ti на 7-14% быстрее своей младшей сестры GTX 1070, но совсем не отстает от более мощного варианта на том же GPU. Если сравнивать новинку с неплохо выступившими в этих тестах Radeon, то прямой конкурент от AMD всегда быстрее GTX 1070 Ti, пусть разница между ними и сокращается с 20% в легких условиях сразу до 6% в тяжелых.

3DMark Vantage: тесты Feature

Синтетические тесты из пакета 3DMark Vantage могут открыть нам то, что мы ранее упустили. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10, до сих пор актуальны и интересны тем, что отличаются от наших. При анализе результатов новейшей видеокарты GeForce GTX 1070 Ti в этом пакете мы сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark.

Feature Test 1: Texture Fill

Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Эффективность работы видеокарт AMD и Nvidia в текстурном тесте компании Futuremark достаточно высока, и итоговые цифры разных моделей близки к соответствующим теоретическим параметрам. Разница в скорости между GeForce GTX 1070 Ti и GTX 1080 точно соответствует теории — 5% в пользу более мощного решения. Младший же вариант видеокарты на основе еще больше урезанного GP104 отстал от новинки почти на треть, и эта разница также соответствует теоретической по скорости текстурирования.

Что касается сравнения скорости текстурирования новой видеоплаты Nvidia с конкурирующими с ней решениями конкурента, то и тут новинка отстала от обеих видеокарт AMD. Решения этой компании AMD с текстурированием справляются весьма неплохо. Прямой соперник новинки Radeon RX Vega 56, имеющий немало блоков TMU, обошел GTX 1070 Ti на 12%, а старший GPU оказался еще быстрее.

Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Цифры из второго подтеста 3DMark Vantage показывают производительность блоков ROP, без учета величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), и тест обычно измеряет именно производительность ROP. Рассматриваемая нами сегодня плата GeForce GTX 1070 Ti снова опередила младшую модель GTX 1070 более чем на четверть, отстав от старшей GTX 1080 на 7% — немного непонятно, почему получилась такая разница между ними в тесте, который должен показывать разницу в филлрейте (скорости блоков ROP).

Если сравнивать скорость заполнения сцены новой видеокартой GeForce GTX 1070 Ti с взятыми нами в тест решениями компании AMD, то рассматриваемая сегодня плата в этой задаче показала скорость на уровне старшей Radeon RX Vega 64, а ее прямой конкурент в виде Vega 56 отстает от новинки на 12%. На результатах явно сказывается и разное количество блоков ROP у этих плат и разная эффективность оптимизаций при сжатии ими данных во фреймбуфере.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника давно используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.

Этот тест из пакета 3DMark Vantage отличается от проанализированных нами ранее тем, что результаты в нем зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен правильный баланс GPU, а также эффективность выполнения сложных шейдеров.

В этой «синтетике» из 3DMark Vantage, когда важны и математическая и текстурная производительность, новая плата GeForce GTX 1070 Ti снова показала очень неплохой результат, оказавшись на 27% быстрее младшей модели на том же графическом процессоре GP104, что полностью соответствует теории. Старшая же модель GTX 1080 была быстрее на те же 7%. Что еще более приятно, новая плата от Nvidia показала в этом тесте результат на 3% лучше, чем RX Vega 56, хотя Radeon в этом тесте обычно были весьма сильны.

Feature Test 4: GPU Cloth

Четвертый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте также зависит сразу от нескольких параметров, и основными факторами влияния должны являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. То есть, сильные стороны чипов Nvidia должны проявляться, но мы всегда отмечали странные результаты GeForce в этом тесте, в котором очередная новая видеокарта компании показала все ту же низкую скорость на уровне своих ближайших родственниц, младшей и старшей.

Неудивительно, что в таких условиях сравнение с платами Radeon в этом тесте для GeForce GTX 1070 Ti получилось не очень радостным. Несмотря на теоретическое отставание по геометрической производительности у чипов AMD, по сравнению с конкурирующими решениями, платы Radeon в этом тесте работают весьма эффективно, заметно обгоняя все видеокарты GeForce, представленные в нашем сравнении. Что-то на видеокартах Nvidia не работает так, как должно, и двукратного проигрыша просто быть не может даже в теории.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.

Во втором «геометрическом» тесте из 3DMark Vantage ситуация сильно отличается от предыдущей диаграммы. В этот раз новая GeForce GTX 1070 Ti показывает результат, лишь на 4-7% меньше сразу трех видеокарт сравнения, имеющих близкие результаты. Новая плата Nvidia в этот раз на 9% опередила младшую модель GeForce GTX 1070, стоящей на ступень ниже, но отстала от остальных. Сравнение новинки от компании Nvidia с конкурирующими видеокартами AMD в этот раз показало ее отставание на 4% от прямого соперника — Radeon RX Vega 64.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом для GPU, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических вычислений.

В этом математическом тесте производительность решений хоть и не полностью соответствует теории, но близка к тому, что должно быть, исходя из пиковых показателей. В математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы видим распределение результатов, несколько отличающееся от того, что мы получили в схожих тестах нашего пакета RightMark.

Хорошо видно, что видеочипы компании AMD с архитектурой GCN справляются с подобными задачами явно лучше решений конкурента в случаях, когда выполняется интенсивная «математика», но новая модель от компании Nvidia, основанная на урезанном графическом процессоре GP104, почти достала своего соперника Radeon RX Vega 56, уступив тому 12% — это немало, но даже такой проигрыш можно считать неплохим результатом для новинки, с учетом специфики этого конкретного теста.

Если сравнивать новинку с соседними моделями компании в линейке, то GTX 1070 Ti в этом тесте получилась быстрее GTX 1070 на традиционные уже 28%, и все те же привычные для нашего материала 7% уступила старшей GTX 1080, что довольно близко и к теоретической разнице между всеми этими решениями на основе GP104.

***

Исходя из результатов синтетических тестов новой видеокарты Nvidia GeForce GTX 1070 Ti, основанной на урезанном графическом процессоре GP104, а также показателям производительности других моделей видеокарт от обоих производителей дискретных видеочипов, мы делаем вывод о том, что рассматриваемая нами сегодня видеокарта станет сильным конкурентом на рынке, а также одним из наиболее выгодных решений на рынке мощных игровых видеокарт в целом. Самое важное достижение новинки в том, что она совсем незначительно отстала от GeForce GTX 1080 (примерно на 5-7%, что соответствует теории) и была заметно быстрее GeForce GTX 1070.

А это значит, что конкурент для Radeon RX Vega 56 в играх должен получиться сильный, хотя сравнение решений AMD и Nvidia в синтетических тестах никогда простым не было. Видеокарта компании Nvidia показала хорошие результаты почти во всех синтетических тестах, уступив в некоторых из них своему конкуренту по объективным причинам. И хотя мы не раз наблюдали и проигрыши новинки в синтетике, по сравнению с недавно вышедшими на рынок платами Radeon, но тут нужно учитывать практику предыдущих тестов, которые показали, что не всю синтетику можно напрямую перенести на игры. В которых мы увидим соотношение результатов, не соответствующее каким-то одним типам синтетических тестов: чисто геометрических или сугубо математических.

Ведь у Radeon и GeForce разные сильные стороны, и хотя решения компании AMD традиционно отличаются эффективным исполнением интенсивных вычислительных задач, графические процессоры Nvidia весьма эффективно используют свои возможности в реальных играх и имеют достаточную скорость текстурирования и высокую скорость заполнения. Поэтому в игровых приложениях все будет несколько иначе, по сравнению с синтетическими тестами. GeForce GTX 1070 Ti должна показать в играх скорость чуть ниже уровня GeForce GTX 1080, что поставит ее на очень хорошую позицию, по сравнению с конкурирующей видеокартой Radeon RX Vega 56, против которой она и создавалась, собственно.

В следующей части нашего материала мы как раз и оценим производительность новой видеокарты Nvidia, созданной на основе слегка урезанного графического процессора GP104, по сравнению с ее конкурентом в игровых приложениях, протестировав GeForce GTX 1070 Ti в нашем наборе современных игр и сравнив показатели новинки с Radeon RX Vega 56.



Средняя цена (количество предложений) в московской рознице:
Рассматриваемые карты Конкуренты
GTX 1070 Ti 8 ГБ — GTX 1080 8 ГБ —
GTX 1070 Ti 8 ГБ — R9 Fury X 4 ГБ —
GTX 1070 Ti 8 ГБ — RX Vega 56 8 ГБ —
GTX 1070 Ti 8 ГБ — RX Vega 64 8 ГБ —


Благодарим компанию Nvidia Russia
и лично Ирину Шеховцову
за предоставленную на тестирование видеокарту

Блок питания Seasonic Prime 1000 W Titanium для тестового стенда предоставлен компанией Seasonic

Модули памяти AMD Radeon R9 8 ГБ UDIMM 3200 МГц для тестового стенда предоставлены компанией AMD

Системная плата Asus ROG Crosshair VI Hero для тестового стенда предоставлена компанией AMD

CPU Cooler Antec Kuhler H2O 920 для тестового стенда предоставлен компанией AMD

Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт

Корпус Corsair Obsidian 800D Full Tower для тестового стенда предоставлен компанией Corsair

Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate