Видеоускоритель AMD Radeon RX Vega 56

Часть 2: особенности карты, результаты синтетических тестов


Содержание

Данная часть знакомит читателей с особенностями видеокарты, а также с результатами синтетических тестов.

Устройство(а)

AMD Radeon RX Vega 56 8 ГБ 2048-битной HBM2 (P/N 102D0500100 000001)
ПараметрЗначениеНоминальное значение (референс)
GPURadeon RX Vega 56 (Vega10)
ИнтерфейсPCI Express x16
Частота работы GPU (ROPs), МГц1156—15901156—1590
Частота работы памяти (физическая (эффективная)), МГц800 (1600)800 (1600)
Ширина шины обмена с памятью, бит2048
Число вычислительных блоков в GPU56
Число операций (ALU) в блоке64
Суммарное количество блоков ALU3584
Число блоков текстурирования (BLF/TLF/ANIS)224
Число блоков растеризации (ROP)64
Размеры, мм270×100×36270×100×36
Количество слотов в системном блоке, занимаемые видеокартой22
Цвет текстолитачерныйчерный
ЭнергопотреблениеПиковое в 3D, Вт209209
В режиме 2D, Вт4040
В режиме «сна», Вт33
Уровень шумаВ режиме 2D, дБА19,119,1
В режиме 2D (просмотр видео), дБА18,718,7
В режиме максимального 3D, дБА41,641,6
Выходные гнезда1×HDMI 2.0b, 3×DisplayPort 1.3/1.41×HDMI 2.0b, 3×DisplayPort 1.3/1.4
Поддержка многопроцессорной работыCrossFire
Максимальное количество приемников/мониторов для одновременного вывода изображения44
Дополнительное питание: количество 8-контактных разъемов22
Дополнительное питание: количество 6-контактных разъемовНетНет
Максимальное разрешение 2DDisplay Port4096×2160
HDMI4096×2160
Dual-Link DVI2560×1600
Максимальное разрешение 3DDisplay Port4096×2160
HDMI4096×2160
Dual-Link DVI2560×1600

Комплектация локальной памятью
Карта имеет 8192 МБ памяти HBM2, размещенной в 2 блоках (стеках) по 32 Гбит вместе с GPU в одной упаковке.

Микросхемы памяти Samsung (HBM2) рассчитаны на номинальную частоту работы в 1000 (2000) МГц.

Сравнение с эталонным дизайном (reference)
Вид спереди
AMD Radeon RX Vega 56 8 ГБ 2048-битной HBM2 AMD Radeon RX Vega 64
Вид сзади
AMD Radeon RX Vega 56 8 ГБ 2048-битной HBM2 AMD Radeon RX Vega 64

Radeon RX Vega 56 получен из старшего собрата Vega 64, поэтому карты полностью идентичны.

Схема питания имеет 13 (12 для GPU и 1 для памяти) фаз и управляется цифровым контроллером IOR 35217 компании Infineon. Остальные детали по самой карте и особенностям управления через драйвера можно посмотреть в прошлом обзоре.

Следует отметить, что карта имеет две микросхемы BIOS, режим энергопотребления можно выставить переключателем на верхнем торце карты.

Около разъемов питания имеется 8 светодиодов, которые информируют о загруженности GPU. Там же рядом есть переключатели, с помощью которых можно поменять цвет индикации (красный или синий) и выключить ее вообще. Разумеется, данная функция реализована только на референс-карте.

Система охлаждения
Главной частью системы охлаждения является большой медный радиатор, имеющий в своей подошве испарительную камеру. Подошва охлаждает весь чип (GPU + HBM2).

Поверх радиатора установлен кожух с одним 75-миллиметровым радиальным вентилятором, расположенным в конце кожуха, который продувает воздух через радиатор к решетке у задней панели компьютера.

Силовые транзисторы охлаждаются пластиной, прижимающейся к основному радиатору. На обороте видеокарты установлена толстая пластина, которая обеспечивает жесткость относительно массивной видеокарты (предотвращая изгиб печатной платы), а также защищает от повреждений распаянные на обороте PCB элементы логики.

После 6-часового прогона под нагрузкой максимальная температура ядра не превысила 75 градусов, что является удовлетворительным результатом для видеокарты такого уровня.
Мониторинг температурного режима с помощью MSI Afterburner (автор А. Николайчук AKA Unwinder)

Методика измерения шума

  • Помещение шумоизолировано и заглушено, снижены реверберации.
  • Системный блок, в котором исследовался шум видеокарт, не имеет вентиляторов, не является источником механического шума.
  • Фоновый уровень 18 дБА — это уровень шума в комнате и уровень шумов собственно шумомера.
  • Измерения проводились на расстоянии 50 см от видеокарты на уровне системы охлаждения.
  • Режимы измерения:
    1. Режим простоя в 2D: загружен интернет-браузер с сайтом iXBT.com, окно Microsoft Word, ряд интернет-коммуникаторов.
    2. Режим 2D с просмотром фильмов: используется SmoothVideo Project (SVP) — аппаратное декодирование со вставкой промежуточных кадров.
    3. Режим 3D с максимальной нагрузкой на ускоритель: используется тест FurMark.
  • Оценка градаций уровня шума выполняется по методике, описанной здесь:
    • 28 дБА и менее: шум плохо различим уже на расстоянии одного метра от источника, даже при очень низком уровне фонового шума. Оценка: шум минимальный.
    • от 29 до 34 дБА: шум различим уже с двух метров от источника, но не особо обращает на себя внимания. С таким уровнем шума вполне можно мириться даже при долговременной работе. Оценка: шум низкий.
    • от 35 до 39 дБА: шум уверенно различается и заметно обращает на себя внимание, особенно в помещении с низким уровнем шума. Работать с таким уровнем шума можно, но спать будет затруднительно. Оценка: шум средний.
    • 40 дБА и более: такой постоянный уровень шума уже начинает раздражать, от него быстро устаешь, появляется желание выйти из комнаты или выключить прибор. Оценка: шум высокий.

В режиме простоя температура графического ядра не поднималась выше 30 градусов, частота вращения вентилятора составляла 690 оборотов в минуту, уровень шума был равен 19,1 дБА (практически бесшумно).

При просмотре фильма с аппаратным декодированием температура графического ядра не поднималась выше 37 градусов, уровень шума составил 18,7 дБА.

В режиме максимальной нагрузки в 3D температура достигала уровня 75 °C, частота вращения вентилятора вырастала до 2130 оборотов в минуту, уровень шума поднимался до 41,7 дБА. Это высокий уровень шума, под нагрузкой акустическая эргономика карты неудовлетворительная. В то же время стоит отметить, что такая система охлаждения будет применяться только на референсных картах AMD, этих видеокарт выпущено очень мало, а на картах партнеров AMD будут свои кулеры. Поэтому зацикливаться на шуме референс-кулера нет смысла.

Термоснимок



Максимальный нагрев 83 градуса — на печатной плате с обратной стороны в районе ядра.



Комплектация
Карта поступила к нам на тест в минимальной комплектации: кроме нее самой в упаковке ничего больше не было.

Упаковка.


Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать по ссылкам:

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

Синтетические тесты проводились на следующих видеокартах:

  • Radeon RX Vega 56 со стандартными параметрами (сокращенно RX Vega 56)
  • Radeon RX Vega 64 со стандартными параметрами (сокращенно RX Vega 64)
  • Radeon RX 580 со стандартными параметрами (сокращенно RX 580)
  • GeForce GTX 1080 со стандартными параметрами (сокращенно GTX 1080)
  • GeForce GTX 1070 со стандартными параметрами (сокращенно GTX 1070)

При выходе видеокарты, основанной на урезанной версии видеочипа (в данном случае Vega 10), мы традиционно сравниваем новинку с видеокартой на полноценном GPU, относящейся к соседнему рыночному сегменту — Radeon RX Vega 64. Второй видеокартой от компании AMD для нашего сравнения мы взяли современную модель Radeon RX 580, которая основана на менее мощном графическом процессоре и точно будет отставать от новинки на чипе Vega 10, но нам интересно посмотреть, насколько лучшая модель на Polaris 10 медленнее урезанного по скорости нового GPU.

От конкурирующей компании Nvidia для сегодняшнего сравнения мы также взяли две видеокарты. Конечно же это GeForce GTX 1070, которая конкурирует с рассматриваемой сегодня новой моделью Radeon на рынке. Сравнение с этой видеокартой будет интересно потому, что они по цене близки (GeForce стоит несколько дешевле), и по производительности можно будет прикинуть, какая из них выгоднее. Ну а GeForce GTX 1080 для синтетических тестов мы взяли потому, что это более дорогое и производительное решение от конкурента, которое новинка от AMD должна догонять или даже обгонять в некоторых тестах, например вычислительных.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два известных ранее теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также еще два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы. Эти тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нем используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

В этом тесте производительность зависит больше от количества и эффективности блоков TMU, но на результат обычно влияет также и эффективность выполнения сложных шейдеров. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает еще и эффективный филлрейт и пропускная способность памяти. Результаты при детализации уровня «High» получаются несколько ниже, чем при детализации «Low».

В задачах процедурной визуализации меха с большим количеством текстурных выборок, решения компании AMD выступали лучше конкурента еще со времен выпуска первых видеочипов на базе архитектуры GCN. И до сих пор платы Radeon в этом тесте выглядят весьма неплохо, хотя графические решения архитектуры Polaris и сдали позиции. А вот рассматриваемая сегодня видеокарта Radeon RX Vega 56 показала в этом тесте очень хороший результат, как и ее старшая сестра на основе полноценного Vega 10.

Новая модель компании AMD в нашем первом тесте обошла не только GeForce GTX 1070, но и GeForce GTX 1080, не говоря уже о Radeon RX 580. И это объяснимо теорией, ведь Radeon RX Vega 56 по пиковым цифрам лишь на 15% медленнее старшей видеокарты, и заметно быстрее решения семейства Polaris. У нас же разница между Vega 56 и Vega 64 получилась 12%, что близко к теории. Посмотрим на результат в этой же задаче, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: в такой ситуации ПСП с филлрейтом должны влиять меньше:

В усложненных условиях результаты теста несколько более интересны. Видеокарта модели Radeon RX Vega 64 все так же впереди всех, а отставание урезанной новинки увеличилось до 15-16%, что полностью соответствует теоретической разнице по тактовым частотам и количеству блоков TMU. Radeon RX 580, основанная на графическом процессоре архитектуры Polaris, выглядит заметно хуже, а если смотреть результаты конкурирующих решений, то преимущество новинки остается даже перед GeForce GTX 1080, а уж прямой конкурент GTX 1070 и вовсе повержен.

Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis, Lost Planet и многих других. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип еще примерно в два раза — такой режим называется «High».

Диаграмма в целом похожа на предыдущую, также без учета суперсэмплинга, и в этом тесте модель видеокарты Radeon RX Vega 56 снова отстает лишь от старшей сестры, которая выигрывает сравнение. Разница между видеокартами семейства Radeon RX Vega все так же соответствует теории — Vega 64 быстрее новой платы на 12%. Скорость новинки AMD и в этом тесте оказалась значительно выше, чем не только у конкурирующей с ней GeForce GTX 1070, но и у GTX 1080. Даже старшая из моделей Nvidia не смогла достать до урезанной Vega 10. Посмотрим, что изменит включение суперсэмплинга:

При включении суперсэмплинга и самозатенения задача становится тяжелее, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьезное падение производительности. Разница между скоростными показателями протестированных видеокарт немного изменилась, хотя включение суперсэмплинга сказывается не так сильно — меньше, чем в предыдущем случае.

Более сложный режим не слишком сильно изменил соотношение сил в нашем сравнении, разве что видеокарты GeForce явно подтянулись к Radeon. Но графические решения AMD и в этом D3D10-тесте пиксельных шейдеров работают эффективнее конкурирующих плат GeForce, хотя ускорители Nvidia, основанные на архитектуре Pascal, почти догнали своих соперников. Рассматриваемая сегодня видеокарта смогла показать производительность выше, чем у GeForce GTX 1080, хотя в самом сложном режиме разница между ними весьма мала. Скорость Vega 64 и Vega 56 точно соответствует теории, разница между ними составляет 16-17%.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты предельных математических тестов чаще всего не полностью соответствуют разнице по частотам и количеству вычислительных блоков, потому что на результаты влияет и разная эффективность их использования в конкретных задачах, и оптимизация драйверов, и новейшие системы управления частотами и питанием, и даже упор в ПСП. В тесте Mineral, видеокарты зачастую показывают не самые показательные результаты, иногда далекие как от теории, так и от результатов в других аналогичных тестах.

Новая модель Radeon на базе урезанного чипа Vega 10 показала довольно высокий результат, оказавшись заметно быстрее более слабой видеокарты AMD и отстав от старшей модели на 8%, что не полностью соответствует теоретическим пиковым показателям. Похоже, что старшая модель ограничена филлрейтом/ПСП. Естественно, что новинка значительно быстрее не только GeForce GTX 1070, но также опережает и более дорогую модель GTX 1080.

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нем только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Во втором математическом тесте из нашего RightMark соотношение между скоростью видеокарт относительно друг друга немного изменилось — в этот раз рассматриваемая модель Radeon RX Vega 56 отстала от старшей Vega 64 на 13%, что ближе к теоретической разнице между пиковыми значениями вычислительной скорости. Что касается сравнения с платами GeForce, то тут изменений немного — новинка все так же впереди обеих плат Nvidia, а прямой конкурент в лице GTX 1070 повержен с почти полуторакратным преимуществом. Что неудивительно, так как с математическими тестами у решений AMD всегда все хорошо.

Direct3D 10: тесты геометрических шейдеров

В составе пакета RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трех уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение частоты кадров близко к двукратному. Задача эта для мощных современных видеокарт довольно простая, и производительность в ней ограничена скоростью обработки геометрии, а иногда и пропускной способностью памяти и/или филлрейтом. Что мы и видим на примере решений на основе Vega 10, скорее всего.

Разница между результатами видеокарт компаний Nvidia и AMD здесь чаще всего в пользу решений первой, что обусловлено отличиями в геометрических конвейерах чипов этих производителей GPU. В тестах геометрии платы GeForce всегда были конкурентоспособнее Radeon, и обе видеокарты GeForce выигрывают у старых Radeon. А вот именно Vega 10 смогла составить им конкуренцию, заметно опередив Radeon RX 580. Разница между Vega 64 и Vega 56 составила 4-5%, что близко к теоретической разнице и по скорости обработки геометрии и по ПСП.

Новая модель видеокарты AMD, основанная на урезанном чипе Vega 10, имеет специальные оптимизации по работе с геометрией, и она выступила почти на уровне GeForce GTX 1070 — своего главного конкурента. Новинка компании AMD хоть и уступила сопернику, но не так уж много и в сложных условиях. Естественно, что более дорогая GeForce GTX 1080 еще быстрее. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры мало изменились и для плат AMD и для решений Nvidia, поэтому и в наших выводах ничего не меняется. Видеокарты в этом тесте геометрических шейдеров слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер. Radeon RX Vega 56 в этом подтесте показала результат медленнее Vega 64 на 3-6%, что также близко к теоретической разнице. Также новинка чуть-чуть отстала от GeForce GTX 1070, проиграв более дорогой GeForce GTX 1080 в этом тесте. Но и это можно считать отличным результатом для AMD, ведь в Vega 10 скорость обработки геометрии явно улучшена.

К сожалению, «Hyperlight» — второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load, в котором используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output, на всех современных видеокартах компании AMD не работает много лет, и мы его для Radeon не используем.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

На результаты этого теста может влиять и филлрейт и пропускная способность памяти, ограничивающая производительность, что мы заметили в предыдущих наших тестах. Особенно хорошо это заметно в случае мощных GPU и простых режимах тестирования. Рассматриваемая сегодня видеокарта компании AMD в этом тесте показывает высокую скорость, отставая от платы на полноценном чипе Vega 10 лишь на 2-3%. Это близко к теории, и очень похоже, что производительность этих решений ограничена ПСП.

Еще больше ограничены в скорости решения компании Nvidia, основанные на двух модификациях графического процессора архитектуры Pascal. Именно поэтому и конкурирующая с новинкой плата GeForce GTX 1070 оказалась заметно медленнее Vega 56, и даже старшая GTX 1080 ей уступила, особенно в простых режимах, в которых решения Nvidia явно уперлись во что-то. Посмотрим на производительность представленных в сравнении видеокарт в этом же тесте, с увеличенным количеством текстурных выборок:

В этом случае ситуация на диаграмме изменилась, и видеокарты компании AMD в тяжелых режимах потеряли больше, по сравнению с платами GeForce. В легком режиме у Radeon все снова неплохо, но чем больше работы для GPU, тем хуже их сравнительные результаты. Но все же даже в самом сложном режиме рассматриваемая нами модель Radeon RX Vega 56 показала скорость на уровне конкурирующей GeForce GTX 1070, с запасом обогнав ее в простых условиях. Тут все зависит от условий сравнения, и даже GTX 1080 не всегда впереди Vega 56. Что касается сравнения двух Radeon на чипе Vega 10, то урезанный вариант отстает от полноценного уже на 8-13%, что уже куда ближе к теоретической разнице по скорости текстурирования.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нем используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Во втором тесте вершинного текстурирования «Waves» результаты иные и они не во всем похожи на то, что мы видели на предыдущих диаграммах. Решения Nvidia тут явно медленнее, и Radeon RX Vega 56 теперь во всех режимах быстрее более дорогой GeForce GTX 1080. Прямой же конкурент в виде GTX 1070 отстает до полутора крат. Разница в производительностью между новой видеокартой и полноценной Vega 64 составила 5-9%, что снова несколько меньше теоретической разницы. Рассмотрим второй вариант этой же задачи:

С усложнением задачи во втором тесте текстурных выборок скорость всех решений стала ниже, но выводы остаются прежними. Сегодняшняя героиня Radeon RX Vega 56 в любых условиях оказалась лучше GeForce GTX 1080, а ее прямой конкурент GTX 1070 уступает до 44%. Разница между RX Vega 56 и RX Vega 64 составила около 10-13%, что объяснимо теорией и уже ближе к разнице в пиковых показателях. Возможно, что мощные видеокарты в этих тестах ограничены ПСП или производительностью блоков ROP.

3DMark Vantage: тесты Feature

Синтетические тесты из пакета 3DMark Vantage могут показать нам другие результаты, на что мы и надеемся. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10, до сих пор актуальны и интересны тем, что отличаются от наших и реже упираются в ПСП. При анализе результатов видеокарты Radeon RX Vega 56 в этом пакете мы наверняка сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark.

Feature Test 1: Texture Fill

Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Эффективность видеокарт AMD и Nvidia в текстурном тесте компании Futuremark обычно достаточно высока и итоговые цифры разных моделей близки к соответствующим теоретическим параметрам. Разница в скорости между Radeon RX Vega 56 и Radeon RX Vega 64 получилась даже чуть больше теоретической — 20%. Это хоть и близко к теоретической разнице в пиковых показателях скорости текстурирования, но все же чуть больше ожидаемого — по какой-то причине новинка отстала сильнее.

Что касается сравнения скорости текстурирования видеоплаты Radeon RX Vega 56 с аналогичным показателем ускорителей от Nvidia, новинка выступила лучше, чем более дорогая GeForce GTX 1080, не говоря о GTX 1070, которая является ее прямым ценовым конкурентом. Видеокарта Nvidia уступила Vega 56 по скорости работы блоков TMU чуть ли не на 50%. Это легко объяснимо, ведь даже в составе урезанного чипа Vega 10 много активных текстурных блоков, да и тактовая частота GPU достаточно высокая.

Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Цифры второго подтеста 3DMark Vantage обычно показывают производительность блоков ROP, без учета величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), и тест измеряет именно производительность ROP. И в этом показателе рассматриваемая сегодня платы Radeon RX Vega 56 уступает своей старшей сестре многовато — 12%, хотя разница должна быть меньшей, исходя из теории.

Сравнение с видеокартами Nvidia показывает, что скорость заполнения сцены урезанной по GPU моделью видеокарты Vega 56 от компании AMD находится между результатами двух ускорителей Nvidia в этом тесте. Сегодняшняя новинка показала скорость заполнения сцены чуть хуже, чем GeForce GTX 1080, но лучше своего прямого конкурента GeForce GTX 1070, что очень хорошо для нее, так как производительность блоков ROP — одно из теоретических слабых мест нового GPU. Неудивительно, что более дорогая модель GTX 1080 стала победителем в этом тесте.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника давно используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.

Этот тест из пакета 3DMark Vantage отличается от проведенных нами ранее тем, что результаты в нем зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен верный баланс GPU, а также эффективность выполнения сложных шейдеров.

В данном случае важны и математическая и текстурная производительность, и в этой «синтетике» из 3DMark Vantage новая плата Radeon RX Vega 56 снова показала ожидаемый результат, хорошо объяснимый теорией, отстав от RX Vega 64 ровно настолько, насколько мы ждали, судя по теоретическим пиковым показателям — преимущество старшей модели над Vega 56 составило 18%, что очень близко к теории. Конкуренты в этом тесте обычно достаточно сильны, но новинка все равно обогнала своего прямого соперника в лице GeForce GTX 1070 почти на четверть, немного отстав от более дорогой GTX 1080.

Feature Test 4: GPU Cloth

Четвертый тест пакета интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте также зависит сразу от нескольких параметров, и основными факторами влияния должны являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. То есть, сильные стороны чипов Nvidia должны бы проявиться, но мы давно отметили странные результаты всех GeForce в этом тесте, в котором они явно не могут соперничать с видеокартами Radeon.

Несмотря на теоретически меньшее количество геометрических исполнительных блоков и отставание по геометрической производительности у чипов конкурента, по сравнению с решениями Nvidia, все платы Radeon в этом тесте работают отлично, обгоняя обе видеокарты GeForce, представленные в сравнении, даже заметно более дорогие. Рассматриваемая нами сегодня плата Radeon RX Vega 56 более чем вдвое быстрее своей соперницы в виде GeForce GTX 1070, и даже GTX 1080 ушла не слишком далеко.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.

А вот во втором «геометрическом» тесте из 3DMark Vantage ситуация уже больше похожа на то, что мы видели в своих геометрических тестах. В этом тесте симуляции физики для частиц, видеокарта Radeon RX Vega 56 показывает результат всего на 3% хуже, чем Radeon RX Vega 64, что объяснимо теорией, так как по скорости обработки геометрии разница между ними только в тактовой частоте. Рассматриваемая новинка показала результат почти такой же, что и более дорогая GeForce GTX 1080, а ее конкурент GTX 1070 немного отстала от обеих.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом для GPU, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических вычислений.

В пакет компании Futuremark включен математический тест, в котором производительность решений хоть и не полностью соответствует теории, но обычно близка к тому, что должно быть, исходя из пиковых показателей. В данном математическом тесте, показывающем пиковую производительность видеочипов в предельных задачах, мы видим распределение результатов, несколько отличающееся от того, что мы получили в схожих тестах нашего тестового пакета.

Все графические процессоры архитектуры GCN справляются с задачей лучше решений конкурента в случаях, когда выполняется интенсивная «математика». И хотя новые модели видеокарт компании Nvidia, основанные на архитектуре Pascal, также показывают высокую скорость, но прямой конкурент GeForce GTX 1070 почти в полтора раза отстал от Radeon RX Vega 56 в этом тесте, так как новинка имеет достаточно много активных блоков ALU и приличную тактовую частоту. Поэтому же она обгоняет и даже более мощную и дорогую модель GeForce GTX 1080.

Если сравнивать скорость новой видеокарты Radeon со старшей моделью, то полноценная модель компании AMD из нового семейства Vega в этом тесте оказалась быстрее Vega 56 более чем на 20%, что хоть и близко к теоретической разнице между этими видеокартами, но все же выше ее. Вероятно, младшую модель в таких тестах сдерживает установленный предел энергопотребления и она сбрасывает частоту сильнее, чем старший GPU со всеми разблокированными исполнительными блоками.

***

Результаты синтетических тестов видеокарты AMD Radeon RX Vega 56, основанной на урезанной версии графического процессора Vega 10, показали нам, что новая видеокарта AMD должна стать одним из лидеров по производительности в своем классе, учитывая рекомендованную цену. Достаточно большое количество активных исполнительных блоков и приличная тактовая частота позволяет новинке лишь на 10-15% уступать модели видеокарты на основе полноценного GPU модели Vega 10.

Меньший уровень производительности рассматриваемого ускорителя был нами ожидаем, учитывая урезанный по исполнительным блокам GPU, работающий на несколько меньшей частоте и имеющий меньший уровень энергопотребления. Но Radeon RX Vega 56 по производительности не так уж много проигрывает своей старшей сестре с воздушным охлаждением Radeon RX Vega 64, и выглядит даже более сбалансированной по характеристикам видеокартой.

Новая модель Radeon выступила в синтетике отлично и она должна обеспечить весьма конкурентоспособную скорость в играх при самых высоких настройках, так как в синтетических тестах она не только выиграла у прямого конкурента в лице GeForce GTX 1070, но и почти не уступала GeForce GTX 1080, заметно обгоняя решения Nvidia в математических и текстурных тестах. Так что можно сделать прогноз о том, что в играх Vega 56 покажет себя не хуже, став серьезным соперником для видеокарт GeForce. Если бы еще реальные розничные цены были ближе к рекомендованной...

В следующей части нашего материала мы рассмотрим производительность Radeon RX Vega 56 в сравнении с другими 3D-ускорителями в нашем наборе современных игровых приложений и сделаем окончательные выводы о позиционировании на рынке и целесообразности приобретения анонсированного недавно решения компании AMD.

Средняя цена (количество предложений) в московской рознице:
Рассматриваемые карты Конкуренты
RX Vega 56 8 ГБ — 40000 руб. (на 04.12.17) GTX 1070 8 ГБ — 29400 руб. (на 04.12.17)
RX Vega 56 8 ГБ — 40000 руб. (на 04.12.17) GTX 1080 8 ГБ — 39000 руб. (на 04.12.17)
RX Vega 56 8 ГБ — 40000 руб. (на 04.12.17) R9 Fury X 4 ГБ — 28 700  (на 03.08.17)

Благодарим компанию AMD Russia
и лично Ивана Мазнева
за предоставленную на тестирование видеокарту

Блок питания Seasonic Prime 1000 W Titanium для тестового стенда предоставлен компанией Seasonic

Модули памяти AMD Radeon R9 8 ГБ UDIMM 3200 МГц для тестового стенда предоставлены компанией AMD

Системная плата Asus ROG Crosshair VI Hero для тестового стенда предоставлена компанией AMD

CPU Cooler Antec Kuhler H2O 920 для тестового стенда предоставлен компанией AMD

Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт

Корпус Corsair Obsidian 800D Full Tower для тестового стенда предоставлен компанией Corsair

Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate





Дополнительно

Обзор видеоускорителя AMD Radeon RX Vega 56. Часть 2: особенности карты, результаты синтетических тестов

Видеоускоритель AMD Radeon RX Vega 56

Часть 2: особенности карты, результаты синтетических тестов

Содержание

Данная часть знакомит читателей с особенностями видеокарты, а также с результатами синтетических тестов.

Устройство(а)

AMD Radeon RX Vega 56 8 ГБ 2048-битной HBM2 (P/N 102D0500100 000001)
ПараметрЗначениеНоминальное значение (референс)
GPURadeon RX Vega 56 (Vega10)
ИнтерфейсPCI Express x16
Частота работы GPU (ROPs), МГц1156—15901156—1590
Частота работы памяти (физическая (эффективная)), МГц800 (1600)800 (1600)
Ширина шины обмена с памятью, бит2048
Число вычислительных блоков в GPU56
Число операций (ALU) в блоке64
Суммарное количество блоков ALU3584
Число блоков текстурирования (BLF/TLF/ANIS)224
Число блоков растеризации (ROP)64
Размеры, мм270×100×36270×100×36
Количество слотов в системном блоке, занимаемые видеокартой22
Цвет текстолитачерныйчерный
ЭнергопотреблениеПиковое в 3D, Вт209209
В режиме 2D, Вт4040
В режиме «сна», Вт33
Уровень шумаВ режиме 2D, дБА19,119,1
В режиме 2D (просмотр видео), дБА18,718,7
В режиме максимального 3D, дБА41,641,6
Выходные гнезда1×HDMI 2.0b, 3×DisplayPort 1.3/1.41×HDMI 2.0b, 3×DisplayPort 1.3/1.4
Поддержка многопроцессорной работыCrossFire
Максимальное количество приемников/мониторов для одновременного вывода изображения44
Дополнительное питание: количество 8-контактных разъемов22
Дополнительное питание: количество 6-контактных разъемовНетНет
Максимальное разрешение 2DDisplay Port4096×2160
HDMI4096×2160
Dual-Link DVI2560×1600
Максимальное разрешение 3DDisplay Port4096×2160
HDMI4096×2160
Dual-Link DVI2560×1600

Комплектация локальной памятью
Карта имеет 8192 МБ памяти HBM2, размещенной в 2 блоках (стеках) по 32 Гбит вместе с GPU в одной упаковке.

Микросхемы памяти Samsung (HBM2) рассчитаны на номинальную частоту работы в 1000 (2000) МГц.

Сравнение с эталонным дизайном (reference)
Вид спереди
AMD Radeon RX Vega 56 8 ГБ 2048-битной HBM2 AMD Radeon RX Vega 64
Вид сзади
AMD Radeon RX Vega 56 8 ГБ 2048-битной HBM2 AMD Radeon RX Vega 64

Radeon RX Vega 56 получен из старшего собрата Vega 64, поэтому карты полностью идентичны.

Схема питания имеет 13 (12 для GPU и 1 для памяти) фаз и управляется цифровым контроллером IOR 35217 компании Infineon. Остальные детали по самой карте и особенностям управления через драйвера можно посмотреть в прошлом обзоре.

Следует отметить, что карта имеет две микросхемы BIOS, режим энергопотребления можно выставить переключателем на верхнем торце карты.

Около разъемов питания имеется 8 светодиодов, которые информируют о загруженности GPU. Там же рядом есть переключатели, с помощью которых можно поменять цвет индикации (красный или синий) и выключить ее вообще. Разумеется, данная функция реализована только на референс-карте.

Система охлаждения
Главной частью системы охлаждения является большой медный радиатор, имеющий в своей подошве испарительную камеру. Подошва охлаждает весь чип (GPU + HBM2).

Поверх радиатора установлен кожух с одним 75-миллиметровым радиальным вентилятором, расположенным в конце кожуха, который продувает воздух через радиатор к решетке у задней панели компьютера.

Силовые транзисторы охлаждаются пластиной, прижимающейся к основному радиатору. На обороте видеокарты установлена толстая пластина, которая обеспечивает жесткость относительно массивной видеокарты (предотвращая изгиб печатной платы), а также защищает от повреждений распаянные на обороте PCB элементы логики.

После 6-часового прогона под нагрузкой максимальная температура ядра не превысила 75 градусов, что является удовлетворительным результатом для видеокарты такого уровня.
Мониторинг температурного режима с помощью MSI Afterburner (автор А. Николайчук AKA Unwinder)

Методика измерения шума

  • Помещение шумоизолировано и заглушено, снижены реверберации.
  • Системный блок, в котором исследовался шум видеокарт, не имеет вентиляторов, не является источником механического шума.
  • Фоновый уровень 18 дБА — это уровень шума в комнате и уровень шумов собственно шумомера.
  • Измерения проводились на расстоянии 50 см от видеокарты на уровне системы охлаждения.
  • Режимы измерения:
    1. Режим простоя в 2D: загружен интернет-браузер с сайтом iXBT.com, окно Microsoft Word, ряд интернет-коммуникаторов.
    2. Режим 2D с просмотром фильмов: используется SmoothVideo Project (SVP) — аппаратное декодирование со вставкой промежуточных кадров.
    3. Режим 3D с максимальной нагрузкой на ускоритель: используется тест FurMark.
  • Оценка градаций уровня шума выполняется по методике, описанной здесь:
    • 28 дБА и менее: шум плохо различим уже на расстоянии одного метра от источника, даже при очень низком уровне фонового шума. Оценка: шум минимальный.
    • от 29 до 34 дБА: шум различим уже с двух метров от источника, но не особо обращает на себя внимания. С таким уровнем шума вполне можно мириться даже при долговременной работе. Оценка: шум низкий.
    • от 35 до 39 дБА: шум уверенно различается и заметно обращает на себя внимание, особенно в помещении с низким уровнем шума. Работать с таким уровнем шума можно, но спать будет затруднительно. Оценка: шум средний.
    • 40 дБА и более: такой постоянный уровень шума уже начинает раздражать, от него быстро устаешь, появляется желание выйти из комнаты или выключить прибор. Оценка: шум высокий.

В режиме простоя температура графического ядра не поднималась выше 30 градусов, частота вращения вентилятора составляла 690 оборотов в минуту, уровень шума был равен 19,1 дБА (практически бесшумно).

При просмотре фильма с аппаратным декодированием температура графического ядра не поднималась выше 37 градусов, уровень шума составил 18,7 дБА.

В режиме максимальной нагрузки в 3D температура достигала уровня 75 °C, частота вращения вентилятора вырастала до 2130 оборотов в минуту, уровень шума поднимался до 41,7 дБА. Это высокий уровень шума, под нагрузкой акустическая эргономика карты неудовлетворительная. В то же время стоит отметить, что такая система охлаждения будет применяться только на референсных картах AMD, этих видеокарт выпущено очень мало, а на картах партнеров AMD будут свои кулеры. Поэтому зацикливаться на шуме референс-кулера нет смысла.

Термоснимок



Максимальный нагрев 83 градуса — на печатной плате с обратной стороны в районе ядра.



Комплектация
Карта поступила к нам на тест в минимальной комплектации: кроме нее самой в упаковке ничего больше не было.

Упаковка.


Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать по ссылкам:

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

Синтетические тесты проводились на следующих видеокартах:

  • Radeon RX Vega 56 со стандартными параметрами (сокращенно RX Vega 56)
  • Radeon RX Vega 64 со стандартными параметрами (сокращенно RX Vega 64)
  • Radeon RX 580 со стандартными параметрами (сокращенно RX 580)
  • GeForce GTX 1080 со стандартными параметрами (сокращенно GTX 1080)
  • GeForce GTX 1070 со стандартными параметрами (сокращенно GTX 1070)

При выходе видеокарты, основанной на урезанной версии видеочипа (в данном случае Vega 10), мы традиционно сравниваем новинку с видеокартой на полноценном GPU, относящейся к соседнему рыночному сегменту — Radeon RX Vega 64. Второй видеокартой от компании AMD для нашего сравнения мы взяли современную модель Radeon RX 580, которая основана на менее мощном графическом процессоре и точно будет отставать от новинки на чипе Vega 10, но нам интересно посмотреть, насколько лучшая модель на Polaris 10 медленнее урезанного по скорости нового GPU.

От конкурирующей компании Nvidia для сегодняшнего сравнения мы также взяли две видеокарты. Конечно же это GeForce GTX 1070, которая конкурирует с рассматриваемой сегодня новой моделью Radeon на рынке. Сравнение с этой видеокартой будет интересно потому, что они по цене близки (GeForce стоит несколько дешевле), и по производительности можно будет прикинуть, какая из них выгоднее. Ну а GeForce GTX 1080 для синтетических тестов мы взяли потому, что это более дорогое и производительное решение от конкурента, которое новинка от AMD должна догонять или даже обгонять в некоторых тестах, например вычислительных.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два известных ранее теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также еще два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы. Эти тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нем используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

В этом тесте производительность зависит больше от количества и эффективности блоков TMU, но на результат обычно влияет также и эффективность выполнения сложных шейдеров. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает еще и эффективный филлрейт и пропускная способность памяти. Результаты при детализации уровня «High» получаются несколько ниже, чем при детализации «Low».

В задачах процедурной визуализации меха с большим количеством текстурных выборок, решения компании AMD выступали лучше конкурента еще со времен выпуска первых видеочипов на базе архитектуры GCN. И до сих пор платы Radeon в этом тесте выглядят весьма неплохо, хотя графические решения архитектуры Polaris и сдали позиции. А вот рассматриваемая сегодня видеокарта Radeon RX Vega 56 показала в этом тесте очень хороший результат, как и ее старшая сестра на основе полноценного Vega 10.

Новая модель компании AMD в нашем первом тесте обошла не только GeForce GTX 1070, но и GeForce GTX 1080, не говоря уже о Radeon RX 580. И это объяснимо теорией, ведь Radeon RX Vega 56 по пиковым цифрам лишь на 15% медленнее старшей видеокарты, и заметно быстрее решения семейства Polaris. У нас же разница между Vega 56 и Vega 64 получилась 12%, что близко к теории. Посмотрим на результат в этой же задаче, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: в такой ситуации ПСП с филлрейтом должны влиять меньше:

В усложненных условиях результаты теста несколько более интересны. Видеокарта модели Radeon RX Vega 64 все так же впереди всех, а отставание урезанной новинки увеличилось до 15-16%, что полностью соответствует теоретической разнице по тактовым частотам и количеству блоков TMU. Radeon RX 580, основанная на графическом процессоре архитектуры Polaris, выглядит заметно хуже, а если смотреть результаты конкурирующих решений, то преимущество новинки остается даже перед GeForce GTX 1080, а уж прямой конкурент GTX 1070 и вовсе повержен.

Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis, Lost Planet и многих других. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип еще примерно в два раза — такой режим называется «High».

Диаграмма в целом похожа на предыдущую, также без учета суперсэмплинга, и в этом тесте модель видеокарты Radeon RX Vega 56 снова отстает лишь от старшей сестры, которая выигрывает сравнение. Разница между видеокартами семейства Radeon RX Vega все так же соответствует теории — Vega 64 быстрее новой платы на 12%. Скорость новинки AMD и в этом тесте оказалась значительно выше, чем не только у конкурирующей с ней GeForce GTX 1070, но и у GTX 1080. Даже старшая из моделей Nvidia не смогла достать до урезанной Vega 10. Посмотрим, что изменит включение суперсэмплинга:

При включении суперсэмплинга и самозатенения задача становится тяжелее, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьезное падение производительности. Разница между скоростными показателями протестированных видеокарт немного изменилась, хотя включение суперсэмплинга сказывается не так сильно — меньше, чем в предыдущем случае.

Более сложный режим не слишком сильно изменил соотношение сил в нашем сравнении, разве что видеокарты GeForce явно подтянулись к Radeon. Но графические решения AMD и в этом D3D10-тесте пиксельных шейдеров работают эффективнее конкурирующих плат GeForce, хотя ускорители Nvidia, основанные на архитектуре Pascal, почти догнали своих соперников. Рассматриваемая сегодня видеокарта смогла показать производительность выше, чем у GeForce GTX 1080, хотя в самом сложном режиме разница между ними весьма мала. Скорость Vega 64 и Vega 56 точно соответствует теории, разница между ними составляет 16-17%.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты предельных математических тестов чаще всего не полностью соответствуют разнице по частотам и количеству вычислительных блоков, потому что на результаты влияет и разная эффективность их использования в конкретных задачах, и оптимизация драйверов, и новейшие системы управления частотами и питанием, и даже упор в ПСП. В тесте Mineral, видеокарты зачастую показывают не самые показательные результаты, иногда далекие как от теории, так и от результатов в других аналогичных тестах.

Новая модель Radeon на базе урезанного чипа Vega 10 показала довольно высокий результат, оказавшись заметно быстрее более слабой видеокарты AMD и отстав от старшей модели на 8%, что не полностью соответствует теоретическим пиковым показателям. Похоже, что старшая модель ограничена филлрейтом/ПСП. Естественно, что новинка значительно быстрее не только GeForce GTX 1070, но также опережает и более дорогую модель GTX 1080.

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нем только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Во втором математическом тесте из нашего RightMark соотношение между скоростью видеокарт относительно друг друга немного изменилось — в этот раз рассматриваемая модель Radeon RX Vega 56 отстала от старшей Vega 64 на 13%, что ближе к теоретической разнице между пиковыми значениями вычислительной скорости. Что касается сравнения с платами GeForce, то тут изменений немного — новинка все так же впереди обеих плат Nvidia, а прямой конкурент в лице GTX 1070 повержен с почти полуторакратным преимуществом. Что неудивительно, так как с математическими тестами у решений AMD всегда все хорошо.

Direct3D 10: тесты геометрических шейдеров

В составе пакета RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трех уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение частоты кадров близко к двукратному. Задача эта для мощных современных видеокарт довольно простая, и производительность в ней ограничена скоростью обработки геометрии, а иногда и пропускной способностью памяти и/или филлрейтом. Что мы и видим на примере решений на основе Vega 10, скорее всего.

Разница между результатами видеокарт компаний Nvidia и AMD здесь чаще всего в пользу решений первой, что обусловлено отличиями в геометрических конвейерах чипов этих производителей GPU. В тестах геометрии платы GeForce всегда были конкурентоспособнее Radeon, и обе видеокарты GeForce выигрывают у старых Radeon. А вот именно Vega 10 смогла составить им конкуренцию, заметно опередив Radeon RX 580. Разница между Vega 64 и Vega 56 составила 4-5%, что близко к теоретической разнице и по скорости обработки геометрии и по ПСП.

Новая модель видеокарты AMD, основанная на урезанном чипе Vega 10, имеет специальные оптимизации по работе с геометрией, и она выступила почти на уровне GeForce GTX 1070 — своего главного конкурента. Новинка компании AMD хоть и уступила сопернику, но не так уж много и в сложных условиях. Естественно, что более дорогая GeForce GTX 1080 еще быстрее. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры мало изменились и для плат AMD и для решений Nvidia, поэтому и в наших выводах ничего не меняется. Видеокарты в этом тесте геометрических шейдеров слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер. Radeon RX Vega 56 в этом подтесте показала результат медленнее Vega 64 на 3-6%, что также близко к теоретической разнице. Также новинка чуть-чуть отстала от GeForce GTX 1070, проиграв более дорогой GeForce GTX 1080 в этом тесте. Но и это можно считать отличным результатом для AMD, ведь в Vega 10 скорость обработки геометрии явно улучшена.

К сожалению, «Hyperlight» — второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load, в котором используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output, на всех современных видеокартах компании AMD не работает много лет, и мы его для Radeon не используем.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

На результаты этого теста может влиять и филлрейт и пропускная способность памяти, ограничивающая производительность, что мы заметили в предыдущих наших тестах. Особенно хорошо это заметно в случае мощных GPU и простых режимах тестирования. Рассматриваемая сегодня видеокарта компании AMD в этом тесте показывает высокую скорость, отставая от платы на полноценном чипе Vega 10 лишь на 2-3%. Это близко к теории, и очень похоже, что производительность этих решений ограничена ПСП.

Еще больше ограничены в скорости решения компании Nvidia, основанные на двух модификациях графического процессора архитектуры Pascal. Именно поэтому и конкурирующая с новинкой плата GeForce GTX 1070 оказалась заметно медленнее Vega 56, и даже старшая GTX 1080 ей уступила, особенно в простых режимах, в которых решения Nvidia явно уперлись во что-то. Посмотрим на производительность представленных в сравнении видеокарт в этом же тесте, с увеличенным количеством текстурных выборок:

В этом случае ситуация на диаграмме изменилась, и видеокарты компании AMD в тяжелых режимах потеряли больше, по сравнению с платами GeForce. В легком режиме у Radeon все снова неплохо, но чем больше работы для GPU, тем хуже их сравнительные результаты. Но все же даже в самом сложном режиме рассматриваемая нами модель Radeon RX Vega 56 показала скорость на уровне конкурирующей GeForce GTX 1070, с запасом обогнав ее в простых условиях. Тут все зависит от условий сравнения, и даже GTX 1080 не всегда впереди Vega 56. Что касается сравнения двух Radeon на чипе Vega 10, то урезанный вариант отстает от полноценного уже на 8-13%, что уже куда ближе к теоретической разнице по скорости текстурирования.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нем используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Во втором тесте вершинного текстурирования «Waves» результаты иные и они не во всем похожи на то, что мы видели на предыдущих диаграммах. Решения Nvidia тут явно медленнее, и Radeon RX Vega 56 теперь во всех режимах быстрее более дорогой GeForce GTX 1080. Прямой же конкурент в виде GTX 1070 отстает до полутора крат. Разница в производительностью между новой видеокартой и полноценной Vega 64 составила 5-9%, что снова несколько меньше теоретической разницы. Рассмотрим второй вариант этой же задачи:

С усложнением задачи во втором тесте текстурных выборок скорость всех решений стала ниже, но выводы остаются прежними. Сегодняшняя героиня Radeon RX Vega 56 в любых условиях оказалась лучше GeForce GTX 1080, а ее прямой конкурент GTX 1070 уступает до 44%. Разница между RX Vega 56 и RX Vega 64 составила около 10-13%, что объяснимо теорией и уже ближе к разнице в пиковых показателях. Возможно, что мощные видеокарты в этих тестах ограничены ПСП или производительностью блоков ROP.

3DMark Vantage: тесты Feature

Синтетические тесты из пакета 3DMark Vantage могут показать нам другие результаты, на что мы и надеемся. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10, до сих пор актуальны и интересны тем, что отличаются от наших и реже упираются в ПСП. При анализе результатов видеокарты Radeon RX Vega 56 в этом пакете мы наверняка сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark.

Feature Test 1: Texture Fill

Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Эффективность видеокарт AMD и Nvidia в текстурном тесте компании Futuremark обычно достаточно высока и итоговые цифры разных моделей близки к соответствующим теоретическим параметрам. Разница в скорости между Radeon RX Vega 56 и Radeon RX Vega 64 получилась даже чуть больше теоретической — 20%. Это хоть и близко к теоретической разнице в пиковых показателях скорости текстурирования, но все же чуть больше ожидаемого — по какой-то причине новинка отстала сильнее.

Что касается сравнения скорости текстурирования видеоплаты Radeon RX Vega 56 с аналогичным показателем ускорителей от Nvidia, новинка выступила лучше, чем более дорогая GeForce GTX 1080, не говоря о GTX 1070, которая является ее прямым ценовым конкурентом. Видеокарта Nvidia уступила Vega 56 по скорости работы блоков TMU чуть ли не на 50%. Это легко объяснимо, ведь даже в составе урезанного чипа Vega 10 много активных текстурных блоков, да и тактовая частота GPU достаточно высокая.

Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Цифры второго подтеста 3DMark Vantage обычно показывают производительность блоков ROP, без учета величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), и тест измеряет именно производительность ROP. И в этом показателе рассматриваемая сегодня платы Radeon RX Vega 56 уступает своей старшей сестре многовато — 12%, хотя разница должна быть меньшей, исходя из теории.

Сравнение с видеокартами Nvidia показывает, что скорость заполнения сцены урезанной по GPU моделью видеокарты Vega 56 от компании AMD находится между результатами двух ускорителей Nvidia в этом тесте. Сегодняшняя новинка показала скорость заполнения сцены чуть хуже, чем GeForce GTX 1080, но лучше своего прямого конкурента GeForce GTX 1070, что очень хорошо для нее, так как производительность блоков ROP — одно из теоретических слабых мест нового GPU. Неудивительно, что более дорогая модель GTX 1080 стала победителем в этом тесте.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника давно используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.

Этот тест из пакета 3DMark Vantage отличается от проведенных нами ранее тем, что результаты в нем зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен верный баланс GPU, а также эффективность выполнения сложных шейдеров.

В данном случае важны и математическая и текстурная производительность, и в этой «синтетике» из 3DMark Vantage новая плата Radeon RX Vega 56 снова показала ожидаемый результат, хорошо объяснимый теорией, отстав от RX Vega 64 ровно настолько, насколько мы ждали, судя по теоретическим пиковым показателям — преимущество старшей модели над Vega 56 составило 18%, что очень близко к теории. Конкуренты в этом тесте обычно достаточно сильны, но новинка все равно обогнала своего прямого соперника в лице GeForce GTX 1070 почти на четверть, немного отстав от более дорогой GTX 1080.

Feature Test 4: GPU Cloth

Четвертый тест пакета интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте также зависит сразу от нескольких параметров, и основными факторами влияния должны являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. То есть, сильные стороны чипов Nvidia должны бы проявиться, но мы давно отметили странные результаты всех GeForce в этом тесте, в котором они явно не могут соперничать с видеокартами Radeon.

Несмотря на теоретически меньшее количество геометрических исполнительных блоков и отставание по геометрической производительности у чипов конкурента, по сравнению с решениями Nvidia, все платы Radeon в этом тесте работают отлично, обгоняя обе видеокарты GeForce, представленные в сравнении, даже заметно более дорогие. Рассматриваемая нами сегодня плата Radeon RX Vega 56 более чем вдвое быстрее своей соперницы в виде GeForce GTX 1070, и даже GTX 1080 ушла не слишком далеко.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.

А вот во втором «геометрическом» тесте из 3DMark Vantage ситуация уже больше похожа на то, что мы видели в своих геометрических тестах. В этом тесте симуляции физики для частиц, видеокарта Radeon RX Vega 56 показывает результат всего на 3% хуже, чем Radeon RX Vega 64, что объяснимо теорией, так как по скорости обработки геометрии разница между ними только в тактовой частоте. Рассматриваемая новинка показала результат почти такой же, что и более дорогая GeForce GTX 1080, а ее конкурент GTX 1070 немного отстала от обеих.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом для GPU, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических вычислений.

В пакет компании Futuremark включен математический тест, в котором производительность решений хоть и не полностью соответствует теории, но обычно близка к тому, что должно быть, исходя из пиковых показателей. В данном математическом тесте, показывающем пиковую производительность видеочипов в предельных задачах, мы видим распределение результатов, несколько отличающееся от того, что мы получили в схожих тестах нашего тестового пакета.

Все графические процессоры архитектуры GCN справляются с задачей лучше решений конкурента в случаях, когда выполняется интенсивная «математика». И хотя новые модели видеокарт компании Nvidia, основанные на архитектуре Pascal, также показывают высокую скорость, но прямой конкурент GeForce GTX 1070 почти в полтора раза отстал от Radeon RX Vega 56 в этом тесте, так как новинка имеет достаточно много активных блоков ALU и приличную тактовую частоту. Поэтому же она обгоняет и даже более мощную и дорогую модель GeForce GTX 1080.

Если сравнивать скорость новой видеокарты Radeon со старшей моделью, то полноценная модель компании AMD из нового семейства Vega в этом тесте оказалась быстрее Vega 56 более чем на 20%, что хоть и близко к теоретической разнице между этими видеокартами, но все же выше ее. Вероятно, младшую модель в таких тестах сдерживает установленный предел энергопотребления и она сбрасывает частоту сильнее, чем старший GPU со всеми разблокированными исполнительными блоками.

***

Результаты синтетических тестов видеокарты AMD Radeon RX Vega 56, основанной на урезанной версии графического процессора Vega 10, показали нам, что новая видеокарта AMD должна стать одним из лидеров по производительности в своем классе, учитывая рекомендованную цену. Достаточно большое количество активных исполнительных блоков и приличная тактовая частота позволяет новинке лишь на 10-15% уступать модели видеокарты на основе полноценного GPU модели Vega 10.

Меньший уровень производительности рассматриваемого ускорителя был нами ожидаем, учитывая урезанный по исполнительным блокам GPU, работающий на несколько меньшей частоте и имеющий меньший уровень энергопотребления. Но Radeon RX Vega 56 по производительности не так уж много проигрывает своей старшей сестре с воздушным охлаждением Radeon RX Vega 64, и выглядит даже более сбалансированной по характеристикам видеокартой.

Новая модель Radeon выступила в синтетике отлично и она должна обеспечить весьма конкурентоспособную скорость в играх при самых высоких настройках, так как в синтетических тестах она не только выиграла у прямого конкурента в лице GeForce GTX 1070, но и почти не уступала GeForce GTX 1080, заметно обгоняя решения Nvidia в математических и текстурных тестах. Так что можно сделать прогноз о том, что в играх Vega 56 покажет себя не хуже, став серьезным соперником для видеокарт GeForce. Если бы еще реальные розничные цены были ближе к рекомендованной...

В следующей части нашего материала мы рассмотрим производительность Radeon RX Vega 56 в сравнении с другими 3D-ускорителями в нашем наборе современных игровых приложений и сделаем окончательные выводы о позиционировании на рынке и целесообразности приобретения анонсированного недавно решения компании AMD.

Средняя цена (количество предложений) в московской рознице:
Рассматриваемые карты Конкуренты
RX Vega 56 8 ГБ — GTX 1070 8 ГБ —
RX Vega 56 8 ГБ — GTX 1080 8 ГБ —
RX Vega 56 8 ГБ — R9 Fury X 4 ГБ —

Благодарим компанию AMD Russia
и лично Ивана Мазнева
за предоставленную на тестирование видеокарту

Блок питания Seasonic Prime 1000 W Titanium для тестового стенда предоставлен компанией Seasonic

Модули памяти AMD Radeon R9 8 ГБ UDIMM 3200 МГц для тестового стенда предоставлены компанией AMD

Системная плата Asus ROG Crosshair VI Hero для тестового стенда предоставлена компанией AMD

CPU Cooler Antec Kuhler H2O 920 для тестового стенда предоставлен компанией AMD

Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт

Корпус Corsair Obsidian 800D Full Tower для тестового стенда предоставлен компанией Corsair

Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate