Видеоускоритель Nvidia GeForce GTX 1080 Ti

Часть 2: особенности карты, результаты синтетических тестов


Содержание

Данная часть знакомит читателей с особенностями видеокарты, а также с результатами синтетических тестов.

Видеообзор

Для начала предлагаем посмотреть наш видеообзор ускорителя Nvidia GeForce GTX 1080 Ti:

Наш видеообзор ускорителя Nvidia GeForce GTX 1080 Ti можно также посмотреть на iXBT.Video

Теперь давайте взглянем на спецификации устройства.

Устройство(а)

Nvidia GeForce GTX 1080 Ti Founders Edition 11 ГБ 352-битной GDDR5X
ПараметрЗначениеНоминальное значение (референс)
GPUGeForce GTX 1080 Ti (GP102) (P/N 900-1G611-2550-000 D 032)
ИнтерфейсPCI Express x16
Частота работы GPU (ROPs), МГц1480—18851480—1885
Частота работы памяти (физическая (эффективная)), МГц2750 (11000)2750 (11000)
Ширина шины обмена с памятью, бит352
Число вычислительных блоков в GPU28
Число операций (ALU) в блоке128
Суммарное количество блоков ALU3584
Число блоков текстурирования (BLF/TLF/ANIS)224
Число блоков растеризации (ROP)88
Размеры, мм270×100×35270×100×35
Количество слотов в системном блоке, занимаемые видеокартой22
Цвет текстолитачерныйчерный
ЭнергопотреблениеПиковое в 3D, Вт259259
В режиме 2D, Вт3737
В режиме «сна», Вт1111
Уровень шумаВ режиме 2D, дБА24,224,2
В режиме 2D (просмотр видео), дБА25,625,6
В режиме максимального 3D, дБА39,639,6
Выходные гнезда1×HDMI 2.0b, 3×DisplayPort 1.2/1.3/1.41×HDMI 2.0b, 3×DisplayPort 1.2/1.3/1.4
Поддержка многопроцессорной работыSLI
Максимальное количество приемников/мониторов для одновременного вывода изображения44
Дополнительное питание: количество 8-контактных разъемов11
Дополнительное питание: количество 6-контактных разъемов11
Максимальное разрешение 2DDisplay Port4096×2160
HDMI4096×2160
DVI (через переходник от DP)2560×1600
Максимальное разрешение 3DDisplay Port4096×2160
HDMI4096×2160
DVI (через переходник от DP)2560×1600

Комплектация локальной памятью
Карта имеет 11 ГБ памяти GDDR5X SDRAM, размещенной в 11 микросхемах по 8 Гбит на лицевой стороне PCB.

Микросхемы памяти Micron (GDDR5X) рассчитаны на номинальную частоту работы в 2800 (11200) МГц.

Сравнение с эталонным дизайном (reference)
Вид спереди
Nvidia GeForce GTX 1080 Ti Founders Edition 11 ГБ 352-битной GDDR5X Reference card Nvidia GeForce GTX 1080
Вид сзади
Nvidia GeForce GTX 1080 Ti Founders Edition 11 ГБ 352-битной GDDR5X Reference card Nvidia GeForce GTX 1080

По идее, мы должны сравнивать с аналогом (GTX 980 Ti) из предыдущего поколения, однако вряд ли это имеет смысл, ибо GTX 980 Ti давно уже морально устарел и на рынке продаются лишь его складские остатки. Все же интереснее сравнить с нынешним флагманом, который уступил свое первенство именно сейчас — GTX 1080. При этом следует учитывать также и то, что ценник на GTX 1080 когда-то начинался примерно с таких же цифр (сейчас, разумеется, цены сильно просели).

Понятно, что PCB абсолютно разные, потому что шины обмена с памятью отличаются: 256 бит у GTX 1080 и 352 бита у GTX 1080 Ti. Тут напрашивается сравнение с Titan X (Pascal), потому что ядра GP102 у него и у GTX 1080 Ti совершенно одинаковые, однако в нашем тестлабе Titan X (Pascal) пока еще не было. Тем не менее, легко понять, что 1080 Ti получился простым изъятием одной микросхемы памяти (минус 1 гигабайт и минус 32 бита из 384-битной шины обмена с памятью) у Titan, поэтому и количество ROP у новой карты уменьшилось (оно тесно связано с контроллером памяти). Однако если посмотреть на спецификации Titan X (Pascal), то мы видим, что частоты работы GTX 1080 Ti значительно выше, поэтому мы вправе ожидать, что новинка по производительности будет не только сильно превосходить GTX 1080, но и обходить Titan X (остается вопрос: зачем тогда вообще будет нужен Titan X с его фантастически высокой ценой?).

Схема питания получила 7 фаз (dualFET), управляется цифровым контроллером NCP81022 производства On Semiconductor. Благодаря такому весьма мощному силовому блоку, обеспечивающему гибкое регулирование питания, Nvidia обещает возможность повышения частот работы ядра до 2 ГГц и даже выше. Поэтому мы вправе ожидать от партнеров Nvidia появления ускорителей серии Xtreme/Matrix/SuperJet/Amp и т. п. с графическими ядрами, фабрично разогнанными по частоте до очень серьезного уровня.

Система охлаждения
Референсная СО Nvidia имеет традиционную закрытую форму с цилиндрическим вентилятором на конце. Радиатор, прижимающийся к ядру, основан на испарительной камере, внутри которой находится особая легкоиспаряемая жидкость. Нижняя пластина камеры прижимается к ядру, тепло передается жидкости, которая испаряется и уносит тепло к верхней пластине (имеющей ребра охлаждения), где пары конденсируются. Мы уже рассказывали о такой схеме современного охлаждения топовых ускорителей.

Вентилятор гонит воздух через вышеупомянутый радиатор и имеет особую форму крыльчатки, обеспечивающую пониженный уровень шума.

Микросхемы памяти и силовые транзисторы охлаждаются с помощью специальной пластины кулера. На оборотной стороне PCB установлена пластина, которая является, по сути, декорацией и предохраняет заднюю часть от повреждений.

После 6-часового прогона под нагрузкой максимальная температура GPU не превысила 84 градусов, что является нормальным и обычным результатом для топовых ускорителей. На торце СО имеется подсвечиваемый логотип ускорителя.
Мониторинг температурного режима с помощью MSI Afterburner (автор А. Николайчук AKA Unwinder)

Методика измерения шума

  • Помещение шумоизолировано и заглушено, снижены реверберации.
  • Системный блок, в котором исследовался шум видеокарт, не имеет вентиляторов, не является источником механического шума.
  • Фоновый уровень 18 дБА — это уровень шума в комнате и уровень шумов собственно шумомера.
  • Измерения проводились на расстоянии 50 см от видеокарты на уровне системы охлаждения.
  • Режимы измерения:
    1. Режим простоя в 2D: загружен интернет-браузер с сайтом iXBT.com, окно Microsoft Word, ряд интернет-коммуникаторов.
    2. Режим 2D с просмотром фильмов: используется SmoothVideo Project (SVP) — аппаратное декодирование со вставкой промежуточных кадров.
    3. Режим 3D с максимальной нагрузкой на ускоритель: используется тест FurMark.
  • Оценка градаций уровня шума выполняется по методике, описанной здесь.
    • 28 дБА и менее: шум практически малоразличим на расстоянии более одного метра от источника, даже при очень низком уровне фонового шума. Оценка: шум минимальный.
    • 29…34 дБА: шум различим в пределах двух метров от источника, но практически не обращается на себя внимания. С таким уровнем шума можно вполне смириться при долговременной работе, дажи при условии низкого уроня фонового шума в помещении. Оценка: шум низкий.
    • 35…39 дБА: шум уверенно различается и заметно обращает на себя внимание, особенно в помещении с низким уровнем шума. Работать с таким уровнем шума можно, но вот спать будет затруднительно. Оценка: шум средний.
    • 40 дБА и более: такой постоянный уровень шума уже начинает раздражать, от него быстро устаешь и появляется желание выйти из комнаты или выключить прибор. Оценка: шум высокий.

В режиме простоя в 2D вентилятор работал на частоте 1100 оборотов в минуту, при этом температура графического ядра не поднималась выше 31 градуса, а уровень шума был чуть выше фонового и составлял 24,2 дБА.

При просмотре фильма с аппаратным декодированием температура графического ядра медленно вырастала до 52 градусов, вентилятор работал на частоте вращения 1380 оборотов в минуту, уровень шума составлял 25,6 дБА.

В режиме максимальной нагрузки в 3D температура достигала уровня 84 °C, частота вращения вентилятора поднималась до 2300 оборотов в минуту, шум вырастал до 39,6 дБА. В результате: шум СО под нагрузкой - высокий. Стоит напомнить, что референсные кулеры будут встречаться на практике только в картах Founders Edition, которые в основном можно купить на сайте компании Nvidia (партнеры такие карты обычно почти не пускают в продажу, только в первых партиях).

Термоснимок



Максимальный нагрев 78 градусов — на печатной плате с края под пластиной с обратной стороны. На фотографии получилось меньше, так как снято с большего расстояния.


Комплектация
Базовый комплект поставки должен включать в себя руководство пользователя, диск с драйверами и утилитами. Напомним, что это не просто тестовый экземпляр, а полноценный серийный вариант Founders Edition, который будет продаваться именно в таком виде. Перед нами базовый комплект, включающий в себя также переходник DP-to-DVI, так что владельцы мониторов только с DVI могут не расстраиваться: подключение все равно возможно сразу же после покупки.

Упаковка


Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

Синтетические тесты проводились на следующих видеокартах:

  • GeForce GTX 1080 Ti со стандартными параметрами (сокращенно GTX 1080 Ti)
  • GeForce GTX 1080 со стандартными параметрами (сокращенно GTX 1080)
  • GeForce GTX 980 Ti со стандартными параметрами (сокращенно GTX 980 Ti)
  • Radeon R9 Fury X со стандартными параметрами (сокращенно R9 Fury X)
  • Radeon RX 480 со стандартными параметрами (сокращенно RX 480)

Для анализа производительности новой модели видеокарты GeForce GTX 1080 Ti были выбраны именно эти решения по следующим причинам. GeForce GTX 980 Ti является прямым предшественником новинки, основанном на аналогичном по сложности и позиционированию графическом процессоре из предыдущего поколения Maxwell. Видеокарта GeForce GTX 1080 же взята как игровое решение из текущего поколения, стоящее в линейке на шаг ниже — сравнение с ним покажет, насколько хороша GTX 1080 Ti, и есть ли смысл нынешним владельцам GTX 1080 думать о модернизации.

От конкурирующей компании AMD было выбрать что-то очень трудно по уже не раз озвученной причине — у них просто нет конкурентоспособных продуктов на уровне GeForce GTX 1080 Ti, как минимум пока. Но в итоге мы все же взяли две видеокарты разных поколений и семейств. Видеоплата Radeon RX 480 хотя и основана на самом современном GPU компании, но дотягивает она только до уровня GeForce GTX 1060. Но что есть, то есть. И еще одним, снова лишь номинальным соперником для представленной GTX 1080 Ti стала самая производительная видеокарта компании AMD — Radeon R9 Fury X.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

В DirectX 10-версию RightMark3D вошли два ранее знакомых нам теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также два дополнительных теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы. Эти тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нем используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в данном тесте зависит от количества и эффективности блоков TMU, на результат влияет также и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает еще и эффективный филлрейт с пропускной способностью памяти. Результаты при детализации уровня «High» получаются несколько ниже, чем при детализации «Low».

В задачах процедурной визуализации меха с большим количеством текстурных выборок, решения компании AMD лидируют еще со времени выпуска первых видеочипов на базе архитектуры GCN. Именно платы Radeon до сих пор являлись лучшими в этих сравнениях, что говорит о большей эффективности выполнения ими подобных программ. Этот вывод подтверждается и сегодняшним тестированием — хотя рассматриваемая нами новая видеокарта GeForce GTX 1080 Ti и выиграла у всех остальных решений, включая платы конкурента, ту же Radeon R9 Fury X она обогнала совсем чуть-чуть, а ведь она основана на гораздо менее сложном графическом процессоре прошлого поколения.

В первом Direct3D 10 тесте новая видеоплата компании Nvidia оказалась на 27-37% быстрее предыдущей топовой модели в линейке — GeForce GTX 1080, основанной на чипе GP104. Отрыв от решения прошлого поколения со схожим позиционированием (GTX 980 Ti) оказался еще более впечатляющим. Пока что все идет так, как и должно быть, и GTX 1080 Ti очень сильна. Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: в такой ситуации что-то должно измениться, и ПСП с филлрейтом будут влиять меньше:

В усложненных условиях результаты теста чуть интереснее. Новая видеокарта модели GeForce GTX 1080 Ti опережает модель GTX 980 Ti гораздо больше, почти в два раза, а вот GTX 1080 отстала на все те же 27-28%, что близко к тому отрыву, что мы и ожидали от новинки. Также GTX 1080 Ti опережает и конкурирующие (очень относительно, напомним!) видеокарты в виде Radeon R9 Fury X и RX 480, хотя разница между GP102 от Nvidia и Fiji от AMD оказалась совсем не такой большой, какой ее можно было бы ожидать, исходя из теории.

Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis, Lost Planet и многих других. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип еще примерно в два раза — такой режим называется «High».

Диаграмма в целом схожа с предыдущей, также без включения суперсэмплинга, и в этот раз новая модель видеокарты GeForce GTX 1080 Ti оказалась более чем на 30% быстрее как устаревшей GTX 980 Ti из предыдущего поколения, так и младшей модели GTX 1080, соседствующей с ней в продуктовой линейке. Если же делать сравнение с видеокартами AMD, то в этом случае новинка выступила еще чуть лучше — она опережает обе платы Radeon, и разница между GTX 1080 Ti и Fury X даже увеличилась. Посмотрим, что изменит включение суперсэмплинга:

При включении суперсэмплинга и самозатенения задача становится тяжелее, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьезное падение производительности. Разница между скоростными показателями протестированных видеокарт немного изменилась, хотя включение суперсэмплинга сказывается меньше, чем в предыдущем случае.

В наших сравнениях подобные условия обычно весьма существенно меняют соотношение сил. Так получилось и в этот раз. Хотя графические решения AMD Radeon и в этом D3D10-тесте пиксельных шейдеров также работают несколько эффективнее конкурирующих плат GeForce, но новые видеокарты, основанные на чипах архитектуры Pascal, смогли показать достойные результаты. Так, новая модель GTX 1080 Ti значительно опередила Radeon R9 Fury X во всех условиях, хотя в самых простых была к ней куда ближе. По сравнению с другими решениями Nvidia, новинка показала скорость на те же 30-36% быстрее GeForce GTX 1080 и обогнала GTX 980 Ti более чем в полтора раза.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты предельных математических тестов чаще всего лишь примерно соответствуют разнице по частотам и количеству вычислительных блоков, на результаты влияет и разная эффективность их использования в конкретных задачах, и оптимизация драйверов, и новейшие системы управления частотами и питанием, а порой даже упор в ПСП. В случае нашего теста Mineral, сразу три видеокарты сравнения показали схожие результаты, с незначительной разницей между ними.

В условиях этого теста выпущенная сегодня GeForce GTX 1080 Ti стала явным победителем, серьезно опередив и платы от компании AMD (с графическими процессорами куда меньшей сложности и цены, впрочем, не забывайте о том, что реального конкурента для GTX 1080 Ti просто нет) и свою предшественницу на базе чипа архитектуры Maxwell. Стоящая на ступень ниже видеокарта GTX 1080 отстала от новинки сразу на 49%, что не очень похоже на реальную разницу в производительности. Куда вероятнее то, что младшую плату ограничивает ПСП или что-то другое.

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нем только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Во втором математическом тесте из нашего RightMark мы видим почти такие же результаты, очень похожие на то, с чем мы познакомились на предыдущей диаграмме. Возможно, они отражают реальное положение дел, и результаты видеокарт относительно друг друга близки к тому, что мы увидим в играх. Новая модель GeForce GTX 1080 Ti в этот раз на 39% опережает GTX 1080 и еще чуть быстрее своей прямой предшественницы GTX 980 Ti.

Если сравнивать GPU архитектуры Pascal с решениями AMD, то обе видеокарты Radeon показывают куда меньшие результаты, что совершенно логично, ведь они и менее сложны и не такие мощные, да и позиционируются совсем иначе. Ждем выхода Vega, ждем... Тем более, что GeForce GTX 1080 Ti не так уж сильно и ушла от Radeon R9 Fury X, и графические процессоры AMD, даже вышедшие давно, до сих пор весьма сильны именно в математических тестах. Но с выпуском решений архитектуры Pascal компания Nvidia явно улучшила свои позиции, в том числе и по математической производительности.

Direct3D 10: тесты геометрических шейдеров

В составе пакета RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трех уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близкое к двукратному. Задача эта для мощных современных видеокарт довольно простая, и производительность в ней ограничена скоростью обработки геометрии, а иногда и пропускной способностью памяти и/или филлрейтом.

Разница между результатами видеокарт на чипах Nvidia и AMD явно в пользу решений калифорнийской компании и она обусловлена отличиями в геометрических конвейерах чипов этих компаний. В тестах геометрии платы GeForce всегда были конкурентоспособнее Radeon, вот и в данном случае хорошо видно, что топовые видеочипы Nvidia, имеющие большое количество блоков по обработке геометрии, выигрывают с заметным преимуществом.

Новая модель GeForce GTX 1080 Ti обогнала свою младшую сестру GTX 1080 на основе GP104 во всех условиях примерно на 22-26%, а предшествующую ей топовую плату прошлого поколения GTX 980 Ti обошла еще с большим запасом. Видеокарты Radeon в этом тесте показывают результаты заметно хуже, Radeon RX 480 на самом новом GPU компании AMD стал аутсайдером, да и Fury X проигрывает новинке более чем вдвое. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры изменились незначительно для плат AMD и для решений Nvidia. И это ничего особенного не изменило. Видеокарты в этом тесте геометрических шейдеров слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, поэтому и наши выводы остаются неизменными. GeForce GTX 1080 Ti и в этом подтесте показала самый сильный результат, обогнав все остальные видеокарты, использовавшиеся нами в тестах. Отставание лучшей из Radeon в сложных условиях снова более чем двукратное.

К сожалению, «Hyperlight» — второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load, в котором используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output, на всех современных видеокартах компании AMD не работает. Этот тест давно перестал запускаться на платах этой компании, и ошибка не исправлена вот уже несколько лет. Так что рассматриваем в этом тесте только результаты видеокарт Nvidia:

На этой диаграмме мы снова видим примерно то же самое, что и в тесте Galaxy, хотя есть и отличия. Новая видеоплата компании Nvidia, основанная на чипе GP102, оказалась заметно быстрее как прошлого топового решения GeForce GTX 980 Ti, так и менее мощной модификации GTX 1080 на основе младшего GPU, особенно в сложных условиях. Разница между парой GTX 1080 Ti и GTX 1080 получилась снова 29-32%, что вполне ожидаемо, исходя из теории. Возможно, в тяжелом режиме что-то изменится:

Действительно, в таких условиях результаты видеокарт GeForce изменились довольно серьезно, но в основном это касается GTX 980 Ti, которая обогнала GTX 1080 и подтянулась к сегодняшней новинке. Которая, в свою очередь, осталась лучшей во всех тестовых условиях, обогнав GTX 1080 на привычную треть. Так что можно сделать вывод, что в тестах на основе геометрических шейдеров новинка показала себя ожидаемо и достойно, став наиболее производительным GPU вообще, как и ожидалось.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Наши предыдущие исследования показали, что на результаты этого теста может влиять и филлрейт и пропускная способность памяти, ограничивающая производительность, что хорошо заметно по результатам плат Nvidia в простых режимах. Новая видеокарта GeForce GTX 1080 Ti в этом тесте показывает скорость выше, чем у всех остальных решений, ее не ограничивает ПСП, как мы это видим на примере GTX 1080, на которой этот тест исполняется не очень хорошо. Разница между ними получилась 40-50%, что явно выше наших ожиданий.

Самая старая плата компании AMD на базе видеочипа Fiji в этот раз также оказалась весьма сильной, хоть и не достала до новой модели GeForce, которая победила условных конкурентов с явным преимуществом. Посмотрим на производительность представленных в сравнении видеокарт в этом же тесте, но с увеличенным количеством текстурных выборок:

Ситуация на диаграмме немного изменилась, и решения компании AMD в тяжелых режимах потеряли значительно больше плат GeForce. Впрочем, в самом легком они продолжают выступать неплохо, хотя и отстают от нового решения на основе чипа GP102, конечно же. Модель GeForce GTX 1080 Ti в сложных условиях показала скорость на 36-44% выше, чем у GTX 1080, примерно настолько же серьезно обогнав и предшественницу по позиционированию GTX 980 Ti. Если сравнивать новинку с двумя Radeon, то она явно выиграла у плат AMD во всех режимах, чему нет смысла удивляться — это сложный топовый GPU нынешнего поколения, аналогов которому просто нет у AMD.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нем используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты во втором тесте вершинного текстурирования «Waves» в целом похожи на то, что мы видели на предыдущих диаграммах, но скоростные показатели всех GeForce в этом тесте чуть ниже. Впрочем, производительности новой модели GeForce GTX 1080 Ti хватает для того, чтобы показывает результат лучше всех. Даже номинальное топовое решение конкурента Radeon R9 Fury X явно отстает, хоть и не в разы. Естественно, что новинка стала лучшей среди трех рассмотренных GeForce, в тяжелом режиме обогнав GTX 1080 на 45%, а в легком — лишь на 22%, так как GTX 1080 явно ограничена ПСП. Рассмотрим второй вариант этой же задачи:

С усложнением условий во втором тесте текстурных выборок скорость всех решений стала ниже, но видеокарты Nvidia пострадали несколько больше. Поэтому и в выводах меняется мало что. Новая модель GeForce GTX 1080 Ti на те же 20-39% быстрее своей младшей сестры GTX 1080, и опережает лучшую игровую видеокарту из предыдущего поколения Maxwell еще больше. Если сравнивать новинку с неплохо выступившей Radeon R9 Fury X, то хорошо видно, что плата AMD хоть и отстает от GTX 1080 Ti, но разница между ними не так велика, как разница в сложности графических процессоров и их цене. И все же можно смело признать новинку явным лидером и в тестах текстурных выборок.

3DMark Vantage: тесты Feature

Синтетические тесты из пакета 3DMark Vantage могут открыть нам то, что мы ранее упустили. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10, до сих пор актуальны и интересны тем, что отличаются от наших. При анализе результатов новейшей видеокарты GeForce GTX 1080 Ti в этом пакете мы сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark.

Feature Test 1: Texture Fill

Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Эффективность работы видеокарт AMD и Nvidia в текстурном тесте компании Futuremark достаточно высока, и итоговые цифры разных моделей близки к соответствующим теоретическим параметрам. Разница в скорости между GeForce GTX 1080 Ti и GTX 1080 оказалась лишь 32% в пользу более мощного решения, что не так уж близко к теоретической разнице — вероятно, старшую модель что-то ограничивает. Предшествующая модель GTX 980 Ti отстала от новинки практически вдвое, и вот эта разница уже соответствует теоретической по скорости текстурирования.

Что касается сравнения скорости текстурирования новой топовой видеоплаты от Nvidia с хоть и не конкурирующими с ней, но лучшими из имеющихся на рынке решениями конкурента, то новинка опередила обе видеокарты AMD, в том числе решение верхнего ценового диапазона R9 Fury X, имеющее немало блоков TMU. Результаты теста показывают, что видеокарты компании AMD с текстурированием справляются неплохо, но с выпуском более мощных моделей графических процессоров, компания Nvidia отобрала у них номинальное лидерство — именно GTX 1080 Ti и стала лучшей по скорости текстурирования.

Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Цифры из второго подтеста 3DMark Vantage показывают производительность блоков ROP, без учета величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), и тест измеряет именно производительность ROP. Рассматриваемая нами сегодня плата GeForce GTX 1080 Ti снова опередила все остальные видеокарты сравнения, что неудивительно. Лучшей из остальных плат стала ее младшая сестра GTX 1080, которая отстала не так уж сильно, примерно на 21%, что близко к теории по скорости блоков ROP (26%). Прямая предшественница в виде GTX 980 Ti выступила заметно слабее.

Если сравнивать скорость заполнения сцены новой видеокартой GeForce GTX 1080 Ti с самыми мощными решениями компании AMD, то рассматриваемая сегодня плата в этом тесте показала на 40% большую скорость заполнения сцены по сравнению с Radeon R9 Fury X, и более чем вдвое обходит более современное, хоть и менее мощное решение в виде Radeon RX 480. На результатах явно сказывается большое количество блоков ROP у новинки, вместе с эффективными оптимизациями по сжатию данных.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника давно используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.

Этот тест из пакета 3DMark Vantage отличается от проанализированных нами ранее тем, что результаты в нем зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен правильный баланс GPU, а также эффективность выполнения сложных шейдеров.

В данном случае, важны и математическая и текстурная производительность, и в этой «синтетике» из 3DMark Vantage новая плата GeForce GTX 1080 Ti показала отличный результат, оказавшись на 29% быстрее младшей модели текущего поколения Pascal, что полностью соответствует теории. Топовая игровая модель предыдущего поколения, основанная на графическом процессоре архитектуры Maxwell, проиграла почти в два раза. Ну и понятно, что новая плата от Nvidia показала в этом тесте результат на 45% лучше, чем R9 Fury X, и оказалась более чем вдвое быстрее RX 480 — платы Radeon ей явно не конкуренты.

Feature Test 4: GPU Cloth

Четвертый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте также зависит сразу от нескольких параметров, и основными факторами влияния должны являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. То есть, сильные стороны чипов Nvidia должны бы проявляться, но мы снова отмечаем странные результаты в этом тесте, в котором очередная новая видеокарта GeForce показала сравнительно низкую скорость, лишь на 15% опередив свою младшую родственницу GTX 1080. Да и свою прямую предшественницу GTX 980 Ti новинка обогнала не слишком явно.

Поэтому неудивительно, что в таких условиях сравнение с платами Radeon в этом тесте для GeForce GTX 1080 Ti не самое радостное. Несмотря на теоретически меньшее количество геометрических исполнительных блоков и отставание по геометрической производительности у чипов AMD, по сравнению с конкурирующими решениями, платы Radeon в этом тесте работают весьма и весьма эффективно, с запасом обгоняя все видеокарты GeForce, представленные в нашем сравнении. Что-то на видеокартах Nvidia явно работает не так, как следует.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.

Зато во втором «геометрическом» тесте из 3DMark Vantage ситуация совершенно иная. В этот раз новая GeForce GTX 1080 Ti уже показывает максимальный результат, обогнав как платы соперника, так и ранее вышедшие решения архитектуры Maxwell и Pascal. Новая одночиповая плата в этот раз снова стала лидером сравнения, более чем на 27% опередив младшую модель текущей линейки, которая стоит в ней на ступень ниже. Топовая плата предыдущего поколения GTX 980 Ti осталась где-то далеко позади.

Сравнение новинки от компании Nvidia с конкурирующими видеокартами AMD в этот раз снова позитивное — топовая плата семейства Pascal на чипе GP102 показала результат лучше обеих одночиповых видеокарт компании-соперника. Мы снова оговариваемся, что обе платы Radeon не являются прямыми конкурентами, но иных у AMD пока нет. Новинка от Nvidia более чем на 50% опережает Radeon R9 Fury X и почти вдвое быстрее RX 480 в этом конкретном тесте.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом для GPU, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических вычислений.

В этом математическом тесте производительность решений хоть и не полностью соответствует теории, но очень близка к тому, что должна быть, исходя из пиковых показателей. В математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы видим распределение результатов, отличающееся от того, что мы получили в схожих тестах нашего пакета RightMark.

Хотя видеочипы компании AMD с архитектурой GCN до сих пор справляются с подобными задачами лучше решений конкурента в случаях, когда выполняется интенсивная «математика», но наиболее производительная игровая модель компании Nvidia, основанная на графическом процессоре GP102 архитектуры Pascal, наконец-то обошла Radeon R9 Fury X, не говоря уже о Radeon RX 480. Конечно, эти GPU сильно отличаются по сложности, цене и времени выхода на рынок, но даже такой выигрыш можно считать неплохим результатом для всей линейки Pascal.

В итоге, можно смело назвать GeForce GTX 1080 Ti наиболее производительным решением. И если сравнивать новинку с предыдущими моделями компании из семейств Pascal и Maxwell, то GTX 1080 Ti в этом тесте получилась на 35% быстрее GTX 1080, и чуть ли не в два раза производительнее своей предшественницы по позиционированию в виде GTX 980 Ti, что довольно близко к теоретической разнице между этими решениями. Мы считаем, что это очень хорошие показатели для GTX 1080 Ti, который гарантируют приличный выигрыш новинки и в игровых приложениях.

***

Судя по результатам синтетических тестов новой видеокарты Nvidia GeForce GTX 1080 Ti, основанной на мощнейшем графическом процессоре GP102 с архитектурой Pascal, а также показателям производительности других моделей видеокарт от обоих производителей дискретных видеочипов, мы делаем однозначный вывод — рассматриваемая сегодня видеокарта является наиболее производительным решением на рынке игровых видеокарт, обходя GeForce GTX 1080 примерно на 25-35% и показывая скорость на уровне дорогого решения для энтузиастов Titan X (на основе Pascal). Естественно, что останутся позади и все видеокарты конкурента, начиная с Radeon R9 Fury X.

Топовая видеокарта компании Nvidia показала лучшие результаты почти во всех синтетических тестах, уступив лишь в некоторых из них. И хотя в редких синтетических тестах мы наблюдали и проигрыши, по сравнению с имеющимися на рынке платами Radeon в частности, как показала практика предыдущих тестов, не всю синтетику можно переносить на игры, и в них мы увидим соотношение результатов, не соответствующих каким-то одним типам синтетических тестов: чисто геометрических или чисто математических. Известно, что у Radeon и GeForce разные сильные стороны: решения компании AMD традиционно отличаются весьма эффективным исполнением интенсивных вычислительных задач, а графические процессоры Nvidia отыгрываются в геометрических тестах с применением тесселяции и тестах со сложными вычислениями. Да и со скоростью текстурирования у GeForce GTX 1080 Ti все просто прекрасно.

В общем, в игровых приложениях все будет несколько иначе, по сравнению с синтетическими тестами, и модель GeForce GTX 1080 Ti должна показать в играх скорость примерно на уровне Titan X и, по нашим ожиданиям, она будет примерно на треть производительнее GeForce GTX 1080, также опережая все видеокарты Radeon с большим преимуществом. В следующей части нашего материала мы оценим производительность новинки по сравнению с ее (условными) конкурентами в игровых приложениях, протестировав GeForce GTX 1080 Ti в наборе современных игр и сравнив ее показатели со скоростью конкурентов.



Средняя цена (количество предложений) в московской рознице:
Рассматриваемые карты Конкуренты
GTX 1080 Ti 11 ГБ — 57000 руб. (на 04.12.17) GTX 1080 8 ГБ — 39000 руб. (на 04.12.17)
GTX 1080 Ti 11 ГБ — 57000 руб. (на 04.12.17) R9 Fury X 4 ГБ — 28 700  (на 03.08.17)
GTX 1080 Ti 11 ГБ — 57000 руб. (на 04.12.17) GTX Titan X (Pascal) — 90 000  (на 22.06.17)
GTX 1080 Ti 11 ГБ — 57000 руб. (на 04.12.17) GTX 980 Ti 6 ГБ — 32 000  (на 22.06.17)


Благодарим компанию Nvidia Russia
и лично Ирину Шеховцову
за предоставленную на тестирование видеокарту

Блок питания Thermaltake DPS G 1050W для тестового стенда предоставлены компанией Thermaltake

Корпус Corsair Obsidian 800D Full Tower для тестового стенда предоставлен компанией Corsair

Модули памяти G.Skill Ripjaws4 F4-2800C16Q-16GRK для тестового стенда предоставлены компанией G.Skill

Corsair Hydro SeriesT H100i CPU Cooler для тестового стенда предоставлен компанией Corsair

Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт

Системная плата ASRock Fatal1ty X99X Killer для тестового стенда предоставлена компанией ASRock

Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate

2 накопителя SSD Corsair Neutron SeriesT 120 ГБ для тестового стенда предоставлены компанией Corsair




Дополнительно