Видеоускоритель Nvidia GeForce GTX 1080

Часть 2: особенности карты, результаты синтетических тестов


Содержание

Данная часть знакомит читателей с особенностями видеокарты, а также с результатами синтетических тестов.

Видеообзор

Для начала предлагаем посмотреть наш видеообзор ускорителя Nvidia GeForce GTX 1080:

Теперь давайте взглянем на спецификации устройства.

Устройство(а)

Nvidia GeForce GTX 1080 8 ГБ 256-битной GDDR5X PCI-E
ПараметрЗначениеНоминальное значение (референс)
GPUGeForce GTX 1080 (GP104) (P/N 699-1G413-0000-000 R)
ИнтерфейсPCI Express x16
Частота работы GPU (ROPs), МГц1607-18851607-1885
Частота работы памяти (физическая (эффективная)), МГц2500 (10000)2500 (10000)
Ширина шины обмена с памятью, бит256
Число вычислительных блоков в GPU20
Число операций (ALU) в блоке128
Суммарное количество блоков ALU2560
Число блоков текстурирования (BLF/TLF/ANIS)160
Число блоков растеризации (ROP)64
Размеры, мм270×100×35270×100×35
Количество слотов в системном блоке, занимаемые видеокартой22
Цвет текстолитачерныйчерный
ЭнергопотреблениеПиковое в 3D, Вт182182
В режиме 2D, Вт5151
В режиме «сна», Вт2828
Уровень шумаВ режиме 2D, дБА20,520,5
В режиме 2D (просмотр видео), дБА20,520,5
В режиме максимального 3D, дБА27,527,5
Выходные гнезда1×DVI (Dual-Link/HDMI), 1×HDMI 2.0, 3×DisplayPort 1.21×DVI (Dual-Link/HDMI), 1×HDMI 2.0, 3×DisplayPort 1.2
Поддержка многопроцессорной работыSLI
Максимальное количество приемников/мониторов для одновременного вывода изображения44
Дополнительное питание: количество 8-контактных разъемов11
Дополнительное питание: количество 6-контактных разъемовНетНет
Максимальное разрешение 2DDisplay Port4096×2160
HDMI4096×2160
Dual-Link DVI2560×1600
Single-Link DVI1920×1200
Максимальное разрешение 3DDisplay Port4096×2160
HDMI4096×2160
Dual-Link DVI2560×1600
Single-Link DVI1920×1200

Комплектация локальной памятью
Карта имеет 8 ГБ памяти GDDR5X SDRAM, размещенной в 8 микросхемах по 8 Гбит на лицевой сторонe PCB.

Микросхемы памяти Micron (GDDR5X). Микросхемы рассчитаны на номинальную частоту работы в 2500 (10000) МГц.

Сравнение с эталонным дизайном (reference)
Вид спереди
Nvidia GeForce GTX 1080 8 ГБ 256-битной GDDR5X PCI-E Reference card Nvidia GeForce GTX 980
Вид сзади
Nvidia GeForce GTX 1080 8 ГБ 256-битной GDDR5X PCI-E Reference card Nvidia GeForce GTX 980

Поскольку GTX 1080 (GP104) имеет 256-битную шину обмена с памятью, то логично будет сравнить этот ускоритель с GTX 980 (GM204), который также имел аналогичную шину. И мы видим, что карты действительно очень похожи. Во всяком случае, прекрасно видно, что они даже выпускаются на одном заводе. Расположение микросхем памяти идентичное. Хорошо заметна разница в площади кристаллов ядер: переход с техпроцесса 28 нм на 16 нм позволил уменьшить площадь, несмотря на намного большее количество транзисторов и, соответственно, блоков в GPU. Схема питания усилена и получила 6 фаз, управляется цифровым контроллером NCP81022 производства On Semiconductor. На момент написания материала разгон ускорителя был невозможен (имеющиеся в открытом доступе утилиты не могли регулировать частоты).

Система охлаждения
Референсная СО Nvidia имеет традиционную закрытую форму с цилиндрическим вентилятором на конце. Радиатор, прижимающийся к ядру, основан на испарительной камере, внутри которой находится особая легкоиспаряемая жидкость. Нижняя пластина камеры прижимается к ядру, тепло передается жидкости, которая испаряется и уносит тепло к верхней пластине (имеющей ребра охлаждения), где пары конденсируются. Мы уже рассказывали о такой схеме современного охлаждения топовых ускорителей.

Вентилятор гонит воздух через вышеупомянутый радиатор и имеет особую форму крыльчатки, дающую пониженный уровень шума.

Микросхемы памяти и силовые транзисторы охлаждаются с помощью специальной пластины у кулера. На оборотной стороне PCB установлена пластина, которая через термоинтерфейс прижимается к печатной плате, помогая охлаждению. Впрочем, в большей степени эта пластина установлена в качестве декорации и служит ребром жесткости.

После 6-часового прогона под нагрузкой максимальная температура GPU не превысила 79 градусов, что является очень хорошим результатом для топовых ускорителей, тем более с такой частотой ядра!
Мониторинг температурного режима с помощью MSI Afterburner (автор А. Николайчук AKA Unwinder)

Методика измерения шума

  • Помещение шумоизолировано и заглушено, снижены реверберации.
  • Системный блок, в котором исследовался шум видеокарт, не имеет вентиляторов, не является источником механического шума.
  • Фоновый уровень 20 дБА — это уровень шума в комнате и уровень шумов собственно шумомера.
  • Измерения проводились на расстоянии 50 см от видеокарты на уровне системы охлаждения.
  • Режимы измерения:
    1. Режим простоя в 2D: загружен интернет-браузер с сайтом iXBT.com, окно Microsoft Word, ряд интернет-коммуникаторов.
    2. Режим 2D с просмотром фильмов: используется SmoothVideo Project (SVP) — аппаратное декодирование со вставкой промежуточных кадров.
    3. Режим 3D с максимальной нагрузкой на ускоритель: используется тест FurMark.

В режиме простоя в 2D вентилятор работал на частоте 1000 оборотов в минуту, при этом температура графического ядра не поднималась выше 32 градусов, а уровень шума был равен фоновому и составлял 20,5 дБА.

При просмотре фильма с аппаратным декодированием температура графического ядра медленно вырастала до 40 градусов, вентилятор работал на частоте вращения 1250 оборотов в минуту, уровень шума не менялся.

В режиме максимальной нагрузки в 3D температура достигала уровня 79 °C, частота вращения вентилятора поднималась до 2013 оборотов в минуту, шум вырастал до 27,5 дБА. В результате мы смело можем говорить о тихой СО. Впрочем, референсные кулеры будут встречаться на практике только в первых партиях, пока партнеры Nvidia будут продавать именно референсные карты, а не продукты собственного производства.

Комплектация
Карта к нам попала c референс-комплектом (фирменная упаковка Nvidia без дополнений).

Упаковка

Установка и драйверы

Конфигурация тестового стенда

  • Компьютер на базе процессора Intel Core i7-5960X (Socket 2011):
    • процессор Intel Core i7-5960X (o/c 4 ГГц);
    • СО Intel Thermal Solution RTS2011LC;
    • системная плата ASRock Fatal1ty X99X Killer на чипсете Intel X99;
    • оперативная память 16 ГБ DDR4 G.Skill Ripjaws4 F4-2800C16Q-16GRK 2800 МГц;
    • жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA2;
    • 2 SSD Corsair Neutron SSD CSSD-N120GB3-BK;
    • блок питания Thermaltake Toughpower DPS G 1050W (1050 Вт);
    • корпус Corsair Obsidian 800D Full Tower.
  • операционная система Windows 10 Pro 64-битная; DirectX 12;
  • монитор Samsung U28D590D (28″);
  • клавиатура Cougar 700K;
  • драйверы AMD версии Crimson Edition 16.5.2;
  • драйверы Nvidia версии 365.18 (для GTX 1080 — 368.13);
  • VSync отключен.


Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

В качестве синтетических тестов DirectX 11 мы использовали примеры из пакетов SDK компаний Microsoft и AMD, а также демонстрационную программу Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010). Мы взяли и приложения обоих производителей видеочипов: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain, также известная как Island11.

Синтетические тесты проводились на следующих видеокартах:

  • GeForce GTX 1080 со стандартными параметрами (сокращенно GTX 1080)
  • GeForce GTX 980 Ti со стандартными параметрами (сокращенно GTX 980 Ti)
  • GeForce GTX 980 со стандартными параметрами (сокращенно GTX 980)
  • Radeon R9 Fury X со стандартными параметрами (сокращенно R9 Fury X)
  • Radeon R9 390X со стандартными параметрами (сокращенно R9 390X)

Для анализа производительности новой модели видеокарты GeForce GTX 1080 были выбраны именно эти решения по следующим причинам. GeForce GTX 980 является прямым предшественником новинки, основанном на аналогичном по сложности графическом процессоре из предыдущего поколения Maxwell. Видеокарта GeForce GTX 980 Ti, в свою очередь, взята как игровое решение прошлого поколения с максимальной производительностью — сравнение с ним покажет, может ли GTX 1080 конкурировать с самым сложным GPU семейства Maxwell.

От конкурирующей компании AMD для нашего сравнения мы выбрали две видеокарты разных поколений и семейств. Младшая из видеоплат Radeon R9 390X основана на уже очень старом графическом процессоре Hawaii, до сих пор составляющем неплохую конкуренцию в некоторых синтетических тестах. И хотя реального соперника для GeForce GTX 1080 у AMD пока что нет, в качестве самого производительного решения мы взяли их самую мощную одночиповую видеокарту модели Radeon R9 Fury X.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

От устаревших DirectX 9 тестов мы отказались, а во вторую версию RightMark3D вошли два ранее знакомых теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также еще два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Эти тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нем используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в данном тесте зависит от количества и эффективности блоков TMU, влияет на результат также и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает еще и эффективный филлрейт и пропускная способность памяти. Результаты при детализации уровня «High» получаются несколько ниже, чем при детализации «Low».

В задачах процедурной визуализации меха с большим количеством текстурных выборок, компания AMD лидирует еще со времени выпуска первых видеочипов на базе архитектуры GCN. Именно платы Radeon до сих пор являются лучшими в этих сравнениях, что говорит о большей эффективности выполнения ими этих программ. Этот вывод подтверждается и сегодняшним сравнением — рассматриваемая нами новая видеокарта Nvidia проиграла обоим решениям конкурента, включая Radeon R9 390X на устаревшем графическом процессоре.

В нашем первом Direct3D 10 тесте новая видеоплата модели GeForce GTX 1080 оказалась до 10% быстрее топовой модели предыдущего поколения и еще быстрее своей предшественницы на чипе GM204. Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: в такой ситуации что-то должно измениться, и ПСП с филлрейтом будут влиять меньше:

А вот в усложненных условиях результаты теста куда интереснее! Новая видеокарта модели GeForce GTX 1080 уже опережает модель GTX 980 Ti на целые 32-40%, что близко к той разнице, что мы от нее ожидали. Также новинка опережает и аналогичную по позиционированию модель из прошлого поколения — GTX 980, оказываясь быстрее уже чуть ли не вдвое. Да и отставание от конкурентов в виде Radeon R9 Fury X и R9 390X сильно сократилось, а младшую модель новинка Nvidia в сложных условиях и вовсе наконец-то смогла обойти.

Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis, Lost Planet и многих других. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип еще примерно в два раза — такой режим называется «High».

Диаграмма в целом схожа с предыдущей (также без включения суперсэмплинга), и в этот раз новая модель видеокарты GeForce GTX 1080 оказалась лишь чуть-чуть быстрее GTX 980 Ti и еще быстрее прямой предшественницы. Если же брать сравнение с видеокартами AMD, то хотя в этом случае новинка уступает обеим платам Radeon не так много, но все же уступает. Посмотрим, что изменит включение суперсэмплинга:

При включение суперсэмплинга и самозатенения задача становится тяжелее, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьезное падение производительности. Разница между скоростными показателями протестированных видеокарт немного изменилась, хотя включение суперсэмплинга сказывается меньше, чем в предыдущем случае.

И в нашем сегодняшнем сравнении такие условия полностью изменили соотношение сил. Мы раньше писали, что графические решения AMD Radeon и в этом D3D10-тесте пиксельных шейдеров работают эффективнее конкурирующих плат GeForce, но именно новая модель GeForce GTX 1080, основанная на первом чипе архитектуры Pascal смогла показать результат на уровне Radeon R9 Fury X во всех условиях. А уж устаревшее решение конкурента и вовсе осталось позади. По сравнению с решениями Nvidia прошлого поколения, новинка показала скорость на четверть быстрее GeForce GTX 980 Ti и обогнала GTX 980 в полтора раза — похоже, что примерно такой и будет реальная разница между решениями Nvidia в игровых приложениях.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты предельных математических тестов чаще всего лишь примерно соответствуют разнице по частотам и количеству вычислительных блоков, на результаты влияет и разная эффективность их использования в конкретных задачах, и оптимизация драйверов, и новейшие системы управления частотами и питанием, и даже упор в ПСП. В случае нашего теста Mineral, все видеокарты сравнения показали схожие результаты, разница между ними незначительна — похоже, что тест достиг своего максимума и не отражает реальной разницы в производительности.

Удивительно лишь то, что в таких условиях GeForce GTX 1080 в этом тесте уступила вообще всем — и платам от компании AMD и своим предшественницам на базе чипов архитектуры Maxwell. Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нем только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Во втором математическом тесте из нашего RigthMark мы видим уже более-менее похожие на реальное положение дел результаты видеокарт относительно друг друга. Так, новая модель GeForce GTX 1080 в этот раз уже на 7% опережает GTX 980 Ti и заметно быстрее прямой предшественницы GTX 980.

Если сравнивать GPU архитектуры Pascal с Radeon, то обе видеокарты на чипах компании AMD показывают чуть меньшие результаты, но разница между GeForce GTX 1080 и Radeon R9 Fury X совсем невелика. А графический процессор Hawaii, несмотря на то, что он был выпущен очень давно, до сих пор весьма силен в математических тестах. Но с выпуском чипа GP104 компания Nvidia явно подтянула свои позиции в том числе и по математической производительности.

Direct3D 10: тесты геометрических шейдеров

В составе пакета RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трех уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близкое к двукратному. Задача эта для мощных современных видеокарт довольно простая, и производительность в ней ограничена скоростью обработки геометрии, а иногда и пропускной способностью памяти и/или филлрейтом.

Разница между результатами видеокарт на чипах Nvidia и AMD явно в пользу решений калифорнийской компании и, скорее всего, она обусловлена отличиями в геометрических конвейерах чипов этих компаний. В тестах геометрии платы GeForce всегда были конкурентоспособнее Radeon. В данном случае хорошо заметно, что топовые видеочипы Nvidia имеют большое количество блоков по обработке геометрии, поэтому они и выигрывают с заметным преимуществом.

Новая модель GeForce GTX 1080 почти не отстает от GTX 980 Ti в простых условиях, обгоняя топовую плату прошлого поколения в сложных на 11%, ну а GeForce GTX 980 заметно отстает от обеих. Видеокарты Radeon показывают сильно худшие результаты, Radeon R9 390X на старом GPU стала аутсайдером, да и Fury X почти вдвое проигрывает новинке от Nvidia. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры изменились незначительно для плат AMD и для решений Nvidia. И это ничего особенно не меняет. Видеокарты в этом тесте геометрических шейдеров слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, поэтому и наши выводы остаются неизменными. GeForce GTX 1080 и в этом подтесте показала отличный результат, обогнав все остальные видеокарты, использовавшиеся нами в тестах. Отставание Radeon в сложных условиях двух- и более кратное.

К сожалению, «Hyperlight» — второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load, в котором используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output, на всех современных видеокартах компании AMD не работает. Этот тест давно перестал запускаться на платах этой компании, и ошибка не исправлена вот уже несколько лет. Так что рассматриваем в этом тесте только результаты видеокарт Nvidia:

На этой диаграмме мы видим примерно то же самое, что и в тесте Galaxy, хотя есть и отличия. Новая видеоплата на базе чипа GP104 оказалась чуть быстрее прошлого топового решения GeForce GTX 980 Ti, а GTX 980 серьезно уступила им обеим, особенно в сложных условиях. Разница между первой парой невелика, возможно, в тяжелом режиме что-то изменится:

Действительно, в таких условиях результаты видеокарт компании Nvidia серьезно изменились, а GTX 980 не просто подтянулась к GTX 980 Ti и GTX 1080, но и стала лучшей в самых простых условиях. Впрочем, в остальных двух режимах выиграл предыдущий топ в виде GTX 980 Ti, а новая GTX 1080 проигрывает ей несколько процентов в этом подтесте. Хотя в целом в тестах на основе геометрических шейдеров новинка показала себя неплохо.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Наши предыдущие исследования показали, что на результаты этого теста может влиять и филлрейт и пропускная способность памяти, ограничивающая производительность, что хорошо заметно по результатам плат Nvidia в простых режимах. Новая видеокарта компании Nvidia в этом тесте показывает скорость явно заниженную — этот тест не очень хорошо исполняется на всех платах GeForce, которые оказались примерно на одном уровне.

Интересно, что лидером в этом тесте является старая плата компании AMD на базе видеочипа Hawaii — в этот раз они оказалась сильнее всех плат от Nvidia и даже обогнала Radeon R9 Fury X. Посмотрим на производительность представленных в сравнении видеокарт в этом же тесте, но с увеличенным количеством текстурных выборок:

Ситуация на диаграмме слегка изменилась, и решения компании AMD в тяжелых режимах потеряли значительно больше плат GeForce. Впрочем, в самом легком они продолжают лидировать. Новая модель GeForce GTX 1080 в сложных условиях показала скорость, близкую к GTX 980 Ti, немного обогнав GTX 980. Если сравнивать новинку с Radeon, то явно выиграла у обеих плат AMD в двух из трех режимов, кроме самого легкого — снова мы видим упор во что-то неведомое.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нем используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты во втором тесте вершинного текстурирования «Waves» во многом похожи на то, что мы видели на предыдущих диаграммах. Скоростные показатели всех GeForce в этом тесте ниже производительности решений конкурента, и все же новая модель GeForce GTX 1080 показывает скорость на уровне нынешнего топового решения конкурента Radeon R9 Fury X. Впрочем, R9 390X оказался быстрее их обоих. Зато новинка стала лучшей среди трех рассмотренных GeForce, в тяжелом режиме обогнав GTX 980 Ti аж на 21%. Рассмотрим второй вариант этой же задачи:

С усложнением задачи во втором тесте текстурных выборок скорость всех решений стала ниже, и видеокарты Nvidia пострадали несколько больше. Поэтому и в выводах ничего не меняется, хотя новая модель GeForce GTX 1080 уже до 33% быстрее лучшей видеокарты из предыдущего поколения Maxwell. А уж ее предшественница GTX 980 так и вовсе отстала в полтора раза. Если сравнивать с Radeon R9 Fury X, то оба решения близки друг к другу в двух подтестах из трех. Зато самая старая из видеокарт Radeon снова впереди планеты всей.

3DMark Vantage: тесты Feature

Синтетические тесты из пакета 3DMark Vantage могут показать нам то, что мы ранее упустили. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10, до сих пор актуальны и интересны тем, что отличаются от наших. При анализе результатов новейшей видеокарты GeForce GTX 1080 в этом пакете мы сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark.

Feature Test 1: Texture Fill

Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Эффективность видеокарт AMD и Nvidia в текстурном тесте компании Futuremark достаточно высока и итоговые цифры разных моделей близки к соответствующим теоретическим параметрам. Разница в скорости между GeForce GTX 980 Ti и GTX 1080 оказалась почти полуторакратной в пользу свежего решения на базе чипа архитектуры Pascal, и это явно больше теоретической разницы — вероятно, сказываются какие-то оптимизации. А уж GTX 980 и вовсе отстала почти вдвое, хотя по теории разница в скорости текстурирования не превышает полутора раз.

Что касается сравнения скорости текстурирования новой топовой видеоплаты от Nvidia с имеющимися на рынке решениями конкурента, то новинка все же уступает видеокарте верхнего ценового диапазона R9 Fury X, имеющей очень много блоков TMU, а вот R9 390X отстал от них обеих. Результаты этого теста показывают, что видеокарты компании AMD с текстурированием справляются весьма неплохо, но с выпуском GTX 1080 конкурент подобрался к лучшей из них совсем близко.

Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Цифры из второго подтеста 3DMark Vantage показывают производительность блоков ROP, без учета величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), и тест измеряет именно производительность ROP. Рассматриваемая нами сегодня плата GeForce GTX 1080 заметно опередила все остальные видеокарты сравнения. Лучшая из остальных плат Nvidia отстала не так уж сильно, примерно на треть, а прямая предшественница и вовсе более чем в полтора раза медленнее новинки. Это также лучше теоретических показателей для GP104, так что на тест явно влияет и эффективность работы блоков ROP.

Если сравнивать скорость заполнения сцены новой видеокартой GeForce GTX 1080 с решениями компании AMD, то рассматриваемая нами сегодня плата в этом тесте показывает втрое (!) большую скорость заполнения сцены по сравнению с Radeon R9 390X, и примерно на 16% она обошла текущее топовое решение в виде Radeon R9 Fury X. Сказалось достаточно большое количество блоков ROP и эффективные оптимизации по сжатию данных в буфере кадра.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника давно используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.

Этот тест из пакета 3DMark Vantage отличается от проведенных нами ранее тем, что результаты в нем зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен верный баланс GPU, а также эффективность выполнения сложных шейдеров.

В данном случае, важны и математическая и текстурная производительность, и в этой «синтетике» из 3DMark Vantage новая плата GeForce GTX 1080 показала просто отличный результат, оказавшись в полтора раза быстрее топовой модели предыдущего поколения, основанного на базе лучшего графического процессора архитектуры Maxwell — GTX 980 Ti. А младшая модель GTX 980 на основе GM204 так и вовсе проиграла более 80%. Новая плата Nvidia в этом тесте показала результат заметно лучше, чем Radeon R9 390X и на 12% опередила Radeon R9 Fury X — неплохой результат.

Feature Test 4: GPU Cloth

Четвертый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте также зависит сразу от нескольких параметров, и основными факторами влияния должны бы являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. То есть, сильные стороны чипов Nvidia должны проявляться, но увы — мы снова отмечаем странные результаты. В этом тесте очередная новая видеокарта Nvidia показала низкую скорость, даже немного уступив в нем своей прямой предшественнице GTX 980. Впрочем, GTX 980 Ti ведет себя в этом тесте еще хуже...

Неудивительно, что в таких условиях сравнение с платами Radeon в этом тесте для новинки не самое радостное. Несмотря на теоретически меньшее количество геометрических исполнительных блоков и отставание по геометрической производительности у чипов AMD, по сравнению с конкурирующими решениями, платы Radeon в этом тесте работают весьма и весьма эффективно, обгоняя все видеокарты GeForce, представленные в сравнении.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.

А вот во втором «геометрическом» тесте из 3DMark Vantage ситуация изменилась. В этот раз новая GeForce уже показывает максимальные результаты, обогнав как платы соперника, так и решения архитектуры Maxwell. Новая одночиповая плата GeForce GTX 1080 в этот раза стала лидером сравнения, более чем на 20% опередив топовую плату предыдущего поколения GTX 980 Ti, а предшественницу и вовсе на 37%.

Сравнение новинки от Nvidia с конкурирующими видеокартами компании AMD в этот раз довольно позитивное — первая плата семейства Pascal показала результат лучше, чем у обеих одночиповых видеокарт компании-соперника. Новинка на те же 21% опережает Radeon R9 Fury X и заметно быстрее, чем R9 390X в этом тесте. Удивительно, как получилась такая большая разница в двух вроде бы похожих тестах.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом для GPU, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических вычислений.

Наконец-то мы увидели математический тест, в котором производительность решений хоть и не полностью соответствует теории, но очень близка к тому, что должна быть, исходя из пиковых показателей. В математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы видим распределение результатов, сильно отличающееся по сравнению со схожими тестами из нашего тестового пакета.

Хотя видеочипы компании AMD с архитектурой GCN до сих пор справляются с подобными задачами лучше решений конкурента в случаях, когда выполняется интенсивная «математика», но новая топовая модель компании Nvidia, основанная на первом игровом чипе Pascal, почти достала Radeon R9 Fury X, не говоря уже о Radeon R9 390X. И это можно назвать отличным результатом, учитывая сложность этих GPU, у Nvidia наконец-то получилось столь производительное решение с точки зрения вычислений.

Понятно, что если сравнивать новинку с предыдущими моделями компании из семейства GeForce GTX 900, то в этом тесте разница просто огромна. Рассматриваемая сегодня видеокарта показала результат на треть лучше, чем GTX 980 Ti и на 75% быстрее предшественницы в виде GTX 980, что довольно близко к теоретической разнице между этими решениями. Это очень хорошие показатели, предвещающие сильные выступления GeForce GTX 1080 в игровых приложениях.

Direct3D 11: Вычислительные шейдеры

Чтобы протестировать выпущенное сегодня решение компании Nvidia в задачах, использующих такие возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы хотели воспользоваться примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, Nvidia и AMD.

Увы, но многие из привычных для нас тестов, использующие вычислительные шейдеры и тесселяцию, на тестовой системе с DirectX 12 под управлением операционной системы Windows 10 работают некорректно. Времени на исправление ошибок у нас не было, так что в этот раз придется довольствоваться одним тестом вычислительных шейдеров и одним — тесселяции. Тест вычислительных шейдеров был взят из Microsoft DirectX SDK, в нем показана расчетная задача гравитации N тел (N-body) — симуляция динамической системы частиц, на которую воздействуют такие физические силы, как гравитация.

В этом вычислительном тесте чаще всего отмечается упор в скорость исполнения сложных математических вычислений, обработки геометрии и эффективность выполнения кода с ветвлениями. И, как вы можете видеть, в данном DX11-тесте расклад сил между графическими процессорами двух разных компаний получился совершенно иной, по сравнению с любым другим тестом из предыдущих — в этот раз он явно в пользу видеоплат GeForce.

Эта задача весьма эффективно выполняется на графических процессорах архитектуры Maxwell, как мы отмечали в ранних материалах, но на первом же GPU семейства Pascal она получила еще большую производительность. Новинка в виде модели GeForce GTX 1080 в этом тесте в полтора раза обогнала GTX 980 Ti — топовую модель предыдущего поколения. Впрочем, последняя недалеко ушла по скорости от GTX 980. В любом случае, за столь сильные результаты новинку можно лишь похвалить.

Direct3D 11: Производительность тесселяции

Вычислительные шейдеры очень важны, но еще одним важным нововведением в Direct3D 11 считается аппаратная тесселяция. Мы очень подробно рассматривали ее в своей теоретической статье про Nvidia GF100. Тесселяцию уже довольно давно начали использовать в DX11-играх, таких как STALKER: Зов Припяти, DiRT 2, Aliens vs Predator, Metro Last Light, Civilization V, Crysis 3, Battlefield 3 и других. В некоторых из них тесселяция используется для моделей персонажей, в других — для имитации реалистичной водной поверхности или ландшафта.

Существует несколько различных схем разбиения графических примитивов (тесселяции). Например, phong tessellation, PN triangles, Catmull-Clark subdivision. Так, схема разбиения PN Triangles используется в STALKER: Зов Припяти, а в Metro 2033 — Phong tessellation. Эти методы сравнительно быстро и просто внедряются в процесс разработки игр и существующие движки, поэтому и стали популярными.

Увы, но единственным тестом тесселяции из трех, который запустился на новой тестовой системе, стала демонстрационная программа Nvidia Realistic Water Terrain, также известная как Island. В этой демке используется тесселяция и карты смещения (displacement mapping) для рендеринга реалистично выглядящей поверхности океана и ландшафта.

Тест Island интересен тем, что он не является чисто синтетическим тестом для измерения исключительно геометрической производительности GPU, он содержит и сложные пиксельные и вычислительные шейдеры в том числе, и такая нагрузка ближе к реальным играм, в которых используются все блоки GPU, а не только геометрические. Хотя основной все равно остается именно нагрузка на блоки обработки геометрии, но на результат в этом тесте влияет и та же ПСП и способность эффективно выполнять шейдеры различных типов.

Мы тестируем все видеоплаты при четырех разных коэффициентах тесселяции — в данном случае настройка называется Dynamic Tessellation LOD. При первом коэффициенте разбиения треугольников, скорость не ограничена производительностью геометрических блоков, поэтому топовая видеокарта Radeon показывает довольно высокий результат, близкий к показателям GeForce GTX 980 Ti. Но уже на следующих ступенях геометрической нагрузки производительность платы Radeon снижается, и все решения Nvidia выходят вперед.

Преимущество же новой платы Nvidia, основанной на видеочипе GP104, перед всеми соперниками просто потрясающее — оно многократное не только при сравнении с Radeon R9 Fury X, но и с GeForce GTX 980! Графические процессоры Maxwell и так довольно эффективно работают в режиме смешанной нагрузки, переключаясь от исполнения графических задач к вычислительным, но в Pascal эта возможность получила дополнительные улучшения, как мы поняли по теоретической части. Вероятно, именно поэтому новая плата GeForce GTX 1080 и опередила GTX 980 Ti примерно вдвое, и это было весьма неожиданно. Если же сравнить новинку с GTX 980, то разница между их производительностью и вовсе более чем двукратная. Похоже, что и по производительности обработки геометрии архитектуру Pascal подтянули и смешанные вычисления на этих чипах выполняются куда эффективнее.

***

Судя по результатам синтетических тестов новой видеокарты Nvidia GeForce GTX 1080, основанной на совершенно новом графическом процессоре GP104, ставшим первенцем архитектуры Pascal, а также результатам других моделей видеокарт от обоих производителей дискретных видеочипов, мы делаем вывод о том, что рассматриваемая сегодня видеокарта абсолютно точно должна стать наиболее производительным одночиповым решением на рынке, обойдя и GeForce GTX 980 Ti и Radeon R9 Fury X.

Новая видеокарта компании Nvidia показала сильные результаты в самых важных синтетических тестах, во многих из них опередив остальные решения. Да, в некоторой синтетике были и проигрыши, по сравнению с имеющимися на рынке платами Radeon в частности, но, как показала практика, в играх наблюдается совершенно иная картина, и не всю синтетику можно переносить на игры. В очередной раз отмечаем, что у Radeon и GeForce есть разные сильные стороны. Если решения компании AMD традиционно отличаются весьма эффективным исполнением сравнительно простых, но интенсивных вычислительных задач, то графические процессоры Nvidia отыгрываются в геометрических тестах с применением тесселяции и некоторых тестах с более сложными вычислениями.

В реальных игровых приложениях все равно все будет несколько иначе, по сравнению с синтетическими тестами, и модель GeForce GTX 1080 должна показать в играх скорость примерно на треть выше уровня GeForce GTX 980 Ti по нашим оценкам, опередив Radeon R9 Fury X и GeForce GTX 980 с большим преимуществом. В следующей части нашего материала мы как раз и предлагаем оценить производительность новинки по сравнению с конкурентами в играх. Мы протестировали GeForce GTX 1080 в нашем наборе игровых тестов и сравнили ее показатели со скоростью конкурентов.



Средняя текущая цена (количество предложений) в московской рознице:
Рассматриваемые карты Конкуренты
GTX 1080 — 39000 руб. (на 04.12.17) GTX Titan X — 62 000  (на 01.03.17)
GTX 1080 — 39000 руб. (на 04.12.17) GTX 980 Ti — 32 000  (на 22.06.17)
GTX 1080 — 39000 руб. (на 04.12.17) R9 FuryX — 28 700  (на 03.08.17)


Благодарим компанию Nvidia Russia
и лично Ирину Шеховцову
за предоставленную на тестирование видеокарту

Блок питания Thermaltake DPS G 1050W для тестового стенда предоставлены компанией Thermaltake

Корпус Corsair Obsidian 800D Full Tower для тестового стенда предоставлен компанией Corsair

Модули памяти G.Skill Ripjaws4 F4-2800C16Q-16GRK для тестового стенда предоставлены компанией G.Skill

Corsair Hydro SeriesT H100i CPU Cooler для тестового стенда предоставлен компанией Corsair

Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт

Системная плата ASRock Fatal1ty X99X Killer для тестового стенда предоставлена компанией ASRock

Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate

2 накопителя SSD Corsair Neutron SeriesT 120 ГБ для тестового стенда предоставлены компанией Corsair




Дополнительно