Видеоускоритель AMD Radeon RX Vega 64

Часть 2: видеообзор, особенности карты, результаты синтетических тестов


Содержание

Данная часть знакомит читателей с особенностями видеокарты, а также с результатами синтетических тестов.

Видеообзор

Для начала предлагаем посмотреть наш видеообзор ускорителя AMD Radeon RX Vega 64:

Наш видеообзор ускорителя AMD Radeon RX Vega 64 можно также посмотреть на iXBT.Video

Теперь давайте взглянем на спецификации устройства.

Устройство(а)

AMD Radeon RX Vega 64 8 ГБ 2048-битной HBM2 (P/N 102D0500100 000001)
ПараметрЗначениеНоминальное значение (референс)
GPURadeon RX Vega 64 (Vega10)
ИнтерфейсPCI Express x16
Частота работы GPU (ROPs), МГц1250—16301250—1630
Частота работы памяти (физическая (эффективная)), МГц945 (1890)945 (1890)
Ширина шины обмена с памятью, бит2048
Число вычислительных блоков в GPU64
Число операций (ALU) в блоке64
Суммарное количество блоков ALU4096
Число блоков текстурирования (BLF/TLF/ANIS)256
Число блоков растеризации (ROP)64
Размеры, мм270×100×36270×100×36
Количество слотов в системном блоке, занимаемые видеокартой22
Цвет текстолитачерныйчерный
ЭнергопотреблениеПиковое в 3D, Вт297297
В режиме 2D, Вт4040
В режиме «сна», Вт33
Уровень шумаВ режиме 2D, дБА22,322,3
В режиме 2D (просмотр видео), дБА22,322,3
В режиме максимального 3D, дБА45,645,6
Выходные гнезда1×HDMI 2.0b, 3×DisplayPort 1.3/1.41×HDMI 2.0b, 3×DisplayPort 1.3/1.4
Поддержка многопроцессорной работыCrossFire
Максимальное количество приемников/мониторов для одновременного вывода изображения44
Дополнительное питание: количество 8-контактных разъемов22
Дополнительное питание: количество 6-контактных разъемовНетНет
Максимальное разрешение 2DDisplay Port4096×2160
HDMI4096×2160
Dual-Link DVI2560×1600
Максимальное разрешение 3DDisplay Port4096×2160
HDMI4096×2160
Dual-Link DVI2560×1600

Комплектация локальной памятью
Карта имеет 8192 МБ памяти HBM2, размещенной в 2 блоках (стеках) по 32 Гбит вместе с GPU в одной упаковке.

Микросхемы памяти Samsung (HBM2) рассчитаны на номинальную частоту работы в 1000 (2000) МГц.

Сравнение с эталонным дизайном (reference)
Вид спереди
AMD Radeon RX Vega 64 8 ГБ 2048-битной HBM2 AMD Radeon R9 Fury X
Вид сзади
AMD Radeon RX Vega 64 8 ГБ 2048-битной HBM2 AMD Radeon R9 Fury X

Поскольку у Radeon R9 Fury X используется аналогичная компоновка (память интегрирована с GPU), то с этой картой и будем сравнивать. Разумеется, разные техпроцессы ядер, а также разный тип памяти (HBM1/HBM2) сказались на обвязке, и карты выглядят по-разному.

Схема питания имеет 13 (12 для GPU и 1 для памяти) фаз и управляется цифровым контроллером IOR 35217 компании Infineon.


Кристалл самого ядра получился весьма крупным (484 мм²), он объединен в одной упаковке с двумя кристаллами памяти. Этот тандем припаян к PCB с помощью 2088 BGA-контактов.


В настройках драйверов можно управлять режимом работы карты: Power Save (экономичный по питанию), Balanced (по умолчанию), Turbo (больше упор на производительность), User (пользовательский). Также можно регулировать работу памяти HBM2 в качестве кэша (добавлять ОЗУ компьютера, делая HBM2 кэш-памятью верхнего уровня: это бывает полезно, если игра хочет больше памяти и не дает выставить нужные настройки), следить за потреблением, ограничивать его (при необходимости) и пр.









Следует отметить, что карта имеет две микросхемы BIOS, поэтому кроме упомянутого способа настройки в драйверах режим энергопотребления можно выставить и переключателем на верхнем торце карты (см. выше в таблице VBIOS Mode).

Около разъемов питания имеется 8 светодиодов, которые информируют о загруженности GPU. Там же рядом есть переключатели, с помощью которых можно поменять цвет индикации (красный или синий) и выключить ее вообще. Разумеется, данная функция реализована только на референс-карте, а партнеры AMD могут выпускать свои карты без этой особенности.


Система охлаждения
Главной частью системы охлаждения является большой медный радиатор, имеющий в своей подошве испарительную камеру. Подошва охлаждает весь чип (GPU + HBM2).

Поверх радиатора установлен кожух с одним 75-миллиметровым радиальным вентилятором, расположенным в конце кожуха, который продувает воздух через радиатор к решетке у задней панели компьютера.

Силовые транзисторы охлаждаются пластиной, прижимающейся к основному радиатору. На обороте видеокарты установлена толстая пластина, которая обеспечивает жесткость относительно массивной видеокарты (предотвращая изгиб печатной платы), а также защищает от повреждений распаянные на обороте PCB элементы логики.

После 6-часового прогона под нагрузкой максимальная температура ядра не превысила 84 градусов, что является удовлетворительным результатом для видеокарты такого уровня.
Мониторинг температурного режима с помощью MSI Afterburner (автор А. Николайчук AKA Unwinder)

Методика измерения шума

  • Помещение шумоизолировано и заглушено, снижены реверберации.
  • Системный блок, в котором исследовался шум видеокарт, не имеет вентиляторов, не является источником механического шума.
  • Фоновый уровень 18 дБА — это уровень шума в комнате и уровень шумов собственно шумомера.
  • Измерения проводились на расстоянии 50 см от видеокарты на уровне системы охлаждения.
  • Режимы измерения:
    1. Режим простоя в 2D: загружен интернет-браузер с сайтом iXBT.com, окно Microsoft Word, ряд интернет-коммуникаторов.
    2. Режим 2D с просмотром фильмов: используется SmoothVideo Project (SVP) — аппаратное декодирование со вставкой промежуточных кадров.
    3. Режим 3D с максимальной нагрузкой на ускоритель: используется тест FurMark.
  • Оценка градаций уровня шума выполняется по методике, описанной здесь:
    • 28 дБА и менее: шум плохо различим уже на расстоянии одного метра от источника, даже при очень низком уровне фонового шума. Оценка: шум минимальный.
    • от 29 до 34 дБА: шум различим уже с двух метров от источника, но не особо обращает на себя внимания. С таким уровнем шума вполне можно мириться даже при долговременной работе. Оценка: шум низкий.
    • от 35 до 39 дБА: шум уверенно различается и заметно обращает на себя внимание, особенно в помещении с низким уровнем шума. Работать с таким уровнем шума можно, но спать будет затруднительно. Оценка: шум средний.
    • 40 дБА и более: такой постоянный уровень шума уже начинает раздражать, от него быстро устаешь, появляется желание выйти из комнаты или выключить прибор. Оценка: шум высокий.

В режиме простоя температура графического ядра не поднималась выше 40 градусов, частота вращения вентилятора составляла 680 оборотов в минуту, уровень шума был равен 22,3 дБА (очень тихо).

При просмотре фильма с аппаратным декодированием температура графического ядра не изменялась, уровень шума также не менялся (22,3 дБА).

В режиме максимальной нагрузки в 3D температура достигала уровня 84 °C, частота вращения вентилятора вырастала до 2403 оборотов в минуту, уровень шума поднимался до 45,6 дБА. Это высокий уровень шума, под нагрузкой акустическая эргономика карты неудовлетворительная. В то же время стоит отметить, что такая система охлаждения будет применяться только на референсных картах AMD (и то есть вариант RX Vega 64 Liquid Cooled с ЖСО, более тихий, но и более дорогой), этих видеокарт выпущено очень мало, а на картах партнеров AMD будут свои кулеры. Поэтому зацикливаться на шуме референс-кулера нет смысла.

Термоснимок



Максимальный нагрев 83 градуса — на печатной плате с обратной стороны в районе ядра.



Комплектация
Компания AMD для нового продукта создала просто фантастический комплект, куда кроме карты вошли буклеты, копия реального GPU Vega10, сувенир с логотипом Vega, фирменный браслет и несколько наклеек.

Упаковка просто прекрасна. Все выполнено из бархатного плотного картона.


Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

Синтетические тесты проводились на следующих видеокартах:

  • Radeon RX Vega 64 со стандартными параметрами (сокращенно RX Vega 64)
  • Radeon RX 580 со стандартными параметрами (сокращенно RX 580)
  • Radeon R9 Fury X со стандартными параметрами (сокращенно R9 Fury X)
  • GeForce GTX 1080 Ti со стандартными параметрами (сокращенно GTX 1080 Ti)
  • GeForce GTX 1080 со стандартными параметрами (сокращенно GTX 1080)

Прямым предшественником из предыдущих поколений для Radeon RX Vega 64 является видеокарта Radeon R9 Fury X, именно поэтому мы и взяли эту модель, хоть уже и довольно устаревшую, но во многом очень похожую на Vega и относящуюся к тому же рыночному сегменту. Второй же видеокартой от компании AMD мы взяли вполне современную модель Radeon RX 580, которая основана на менее мощном графическом процессоре и точно будет отставать от всех, но нам интересно посмотреть, насколько хорошо сработали архитектурные изменения в Vega 10, по сравнению с Polaris 10.

От конкурирующей компании Nvidia для сегодняшнего сравнения мы также взяли две видеокарты. Конечно же это GeForce GTX 1080, которая конкурирует с рассматриваемой сегодня новой моделью Radeon на рынке. Сравнение с ней будет интересно по всем статьям — они и по цене близки и по энергоэффективности их интересно сравнить, зная потребление обеих. Ну а GeForce GTX 1080 Ti для синтетических тестов мы взяли потому, что это топовое решение от Nvidia, которое основано на самом сложном и дорогом GPU этой компании, и которое теоретически должна достать новинка от AMD хотя бы в вычислительных тестах.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два ранее знакомых теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также еще два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы. Эти тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нем используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

В этом тесте производительность зависит больше от количества и эффективности блоков TMU, но на результат обычно влияет также и эффективность выполнения сложных шейдеров. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает еще и эффективный филлрейт и пропускная способность памяти. Результаты при детализации уровня «High» получаются несколько ниже, чем при детализации «Low».

В задачах процедурной визуализации меха с большим количеством текстурных выборок, решения компании AMD выступали отлично еще со времен выпуска первых видеочипов на базе архитектуры GCN. И до сих пор платы Radeon в этом тесте выглядят весьма неплохо, хотя графические решения архитектуры Polaris немного сдали позиции. А вот рассматриваемая сегодня видеокарта Radeon RX Vega 64 показала в этом тесте наилучший результат, немного обогнав даже более дорогую GeForce GTX 1080 Ti.

Естественно, что новая модель компании AMD в нашем первом тесте также обошла и GeForce GTX 1080, не говоря о Radeon RX 580. Все это вполне объяснимо, ведь Radeon RX Vega 64 по теории в 1.2-1.4 раза быстрее Fury X и в 1.8-2.0 раза быстрее, чем видеокарта семейства Polaris. Именно так в нашем тесте и получилось, никаких архитектурных преимуществ у Vega 10 мы пока не увидели. Посмотрим на результат в этой же задаче, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: в такой ситуации что-то должно измениться, и ПСП с филлрейтом будут влиять меньше:

В усложненных условиях результаты теста обычно несколько более интересны. Видеокарта модели Radeon RX Vega 64 все так же впереди всех, но отставание GeForce GTX 1080 Ti значительно уменьшилось, особенно в сложнейшем режиме. Radeon RX 580 на основе графического процессора архитектуры Polaris выглядит заметно хуже, а вот плата на Fiji отстала не так уж сильно. Впрочем, всё снова соответствует теории, с учётом разности по тактовым частотам и количеству блоков TMU. Если же смотреть на конкурирующие платы, то преимущество перед GeForce GTX 1080 остаётся весьма серьёзным.

Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis, Lost Planet и многих других. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип еще примерно в два раза — такой режим называется «High».

Диаграмма в целом похожа на предыдущую, также без учета суперсэмплинга, и в этом тесте модель видеокарты Radeon RX Vega 64 снова выигрывает у всех остальных. Скорость новинки в этом тесте оказалась заметно выше, чем у конкурирующей с ней GeForce GTX 1080, да и старшая видеокарта Nvidia не смогла достать до Vega 10. Разница между видеокартами Radeon всё так же соответствует теории — Vega 64 быстрее платы на Polaris почти вдвое, а Fiji отстаёт на четверть — всё точно по теории. Посмотрим, что изменит включение суперсэмплинга:

При включении суперсэмплинга и самозатенения задача становится тяжелее, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьезное падение производительности. Разница между скоростными показателями протестированных видеокарт немного изменилась, хотя включение суперсэмплинга сказывается не так сильно — меньше, чем в предыдущем случае.

Более сложный режим не слишком сильно изменил соотношение сил в нашем сравнении, разве что старшая GeForce теперь стала быстрейшей в сравнении, обогнав сегодняшнюю новинку. Впрочем, графические решения AMD Radeon и в этом D3D10-тесте пиксельных шейдеров работают эффективнее конкурирующих плат GeForce, хотя ускорители Nvidia, основанные на архитектуре Pascal, почти догнали своих соперников. Сегодняшняя героиня показала результат, точно соответствующий теории, обогнав Fury X на 21-27% и Polaris на 75-97%.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты предельных математических тестов чаще всего не полностью соответствуют разнице по частотам и количеству вычислительных блоков, потому что на результаты влияет и разная эффективность их использования в конкретных задачах, и оптимизация драйверов, и новейшие системы управления частотами и питанием, и даже упор в ПСП. В тесте Mineral, видеокарты зачастую показывают не слишком показательные результаты, довольно далекие как от теории, так и от результатов в других аналогичных тестах.

Но в этот раз всё более-менее верно, новая модель Radeon на базе чипа Vega 10 показала достаточно высокий результат. Radeon RX Vega 64 оказалась быстрее других видеокарт AMD на 30% и 100%, соответственно для Radeon R9 Fury X и RX 580, что довольно точно соответствует теоретическим пиковым показателям. Естественно, что она значительно быстрее GeForce GTX 1080 и совсем не так уж много уступила топовой и дорогой GTX 1080 Ti, по понятным причинам ставшей лучшей в этом сравнении.

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нем только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Вот и во втором математическом тесте из нашего RightMark соотношение между скоростью видеокарт относительно друг друга оказалось практически таким же — изменений довольно мало. И в этот раз рассматриваемая модель Radeon RX Vega 64 опередила своих сородичей на 38% и 120%, что уже чуть выше теоретической разницы. Вероятно, именно тут и сказались архитектурные улучшения в Vega 10. Что касается сравнения с GeForce, то от GTX 1080 Ti новинка отстала ещё меньше, а прямой конкурент в лице GTX 1080 был снова повержен. Неудивительно, ведь с математическими тестами у AMD всегда всё было хорошо.

Direct3D 10: тесты геометрических шейдеров

В составе пакета RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трех уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение частоты кадров близко к двукратному. Задача эта для мощных современных видеокарт довольно простая, и производительность в ней ограничена скоростью обработки геометрии, а иногда и пропускной способностью памяти и/или филлрейтом.

Разница между результатами видеокарт компаний Nvidia и AMD здесь почти всегда в пользу решений первой, что обусловлено отличиями в геометрических конвейерах чипов этих производителей GPU. В тестах геометрии платы GeForce всегда были конкурентоспособнее Radeon, и в данном случае хорошо видно, что оба видеочипа Nvidia выигрывают у всех Radeon... Всех, кроме Vega 10! Новинка опередила Fury X на 33-40% и RX 580 на 50-80%, что близко к теоретическим цифрам.

Новая модель видеокарты AMD, основанная на чипе архитектуры Vega, имеет специальные оптимизации по работе с геометрией, поэтому и Radeon RX Vega 64 выступила гораздо лучше. Сегодняшняя новинка компании хоть и уступила GeForce GTX 1080, но лишь в сложных условиях и не так уж много, что можно считать успехом для AMD — в геометрических тестах это непросто. Естественно, топовая GeForce GTX 1080 Ti далеко впереди, но у неё слишком уж много геометрических блоков. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры мало изменились и для плат AMD и для решений Nvidia, поэтому и в наших выводах ничего особо не меняется. Видеокарты в этом тесте геометрических шейдеров слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер. Radeon RX Vega 64 в этом подтесте показала результат снова лучше других Radeon на те же 30-40% и 50-80%, соответственно. Также новинка чуть-чуть отстала от GeForce GTX 1080, уступив GeForce GTX 1080 Ti уже слишком много. Но эти показатели можно считать явным успехом AMD — они явно улучшили скорость обработки геометрии в Vega.

К сожалению, «Hyperlight» — второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load, в котором используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output, на всех современных видеокартах компании AMD не работает много лет, и мы его для Radeon не используем.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

На результаты этого теста может влиять и филлрейт и пропускная способность памяти, ограничивающая производительность, что мы заметили в предыдущих наших тестах. Особенно хорошо это заметно в случае мощных GPU и простых режимах тестирования. Рассматриваемая сегодня видеокарта компании AMD в этом тесте показывает приличную скорость, опережая плату на чипе Fiji на 13-20%, а Polaris — на 75-90%. Это близко к теории, но Fiji оказался ближе, чем мы ожидали. Возможно, производительность всё же была ограничена ПСП, которые у двух старших плат AMD близки.

Лидером же в этом тесте является топовая видеоплата компании Nvidia, основанная на мощнейшем графическом процессоре архитектуры Pascal. Но она стоит дороже, а вот конкурирующая с новинкой AMD плата GeForce GTX 1080 оказалась явно медленнее Vega 64, особенно в простых режимах. Новинка в виде Radeon RX Vega 64 явно опережает своего соперника и в этом тесте. Посмотрим на производительность представленных в сравнении видеокарт в этом же тесте, но с увеличенным количеством текстурных выборок:

Ситуация на диаграмме изменилась, и видеокарты компании AMD в тяжелых режимах потеряли больше, по сравнению с платами GeForce. В легком режиме у Radeon все очень неплохо, а вот в самом тяжелом они сильно сдали. И поэтому рассматриваемая модель Radeon RX Vega 64 в сложных условиях показала скорость хуже GeForce GTX 1080, обогнав её в простых условиях. Можно сказать, что тут у соперников примерный паритет и всё зависит от условий сравнения. Что касается остальных Radeon, то плата на чипе Vega 10 опередила модель RX 580 на 87-95%, что очень близко к теории, а вот Fury X оказалась медленнее лишь на 13-17%, что ниже наших ожиданий — в этом моменте Vega 10 явно недорабатывает.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нем используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты во втором тесте вершинного текстурирования «Waves» не во всём похожи на то, что мы видели на предыдущих диаграммах, так как решения Nvidia тут явно медленнее. И Radeon RX Vega 64 теперь конкурирует скорее с GeForce GTX 1080 Ti, чуть-чуть не доставая до неё. Скоростные показатели новинки AMD в этом тесте явно лучше других решений, кроме топовой платы Nvidia, и разница в производительностью между новой видеокартой и RX 580 почти достигла двукратной, а вот Fury X снова медленнее лишь на 16-21%, что меньше теоретической разницы. Похоже, что в тестах вершинного текстурирования Vega не получает преимуществ от архитектурных улучшений. Рассмотрим второй вариант этой же задачи:

С усложнением задачи во втором тесте текстурных выборок скорость всех решений стала ниже, но выводов это не меняет. Правда, рассматриваемая сегодня топовая плата Radeon RX Vega 64 уже в любых условиях оказалась или не хуже или лучше GeForce GTX 1080 Ti. Естественно, что конкурирующая GTX 1080 ей уступила, и довольно сильно. Разница между RX 580 и RX Vega 64 примерно двукратная, что полностью объяснимо теорией, да и если сравнивать скорость RX Vega 64 с производительностью R9 Fury X, то в этот раз новинка показывает преимущество до 26%, что близко к разница в теоретических показателях. Похоже, что новый графический процессор в этих тестах ограничен ПСП или возможностями блоков ROP несколько сильнее Fiji.

3DMark Vantage: тесты Feature

Синтетические тесты из пакета 3DMark Vantage могут показать нам другие результаты, на что мы и надеемся. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10, до сих пор актуальны и интересны тем, что отличаются от наших и реже упираются в ПСП. При анализе результатов видеокарты Radeon RX Vega 64 в этом пакете мы наверняка сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark.

Feature Test 1: Texture Fill

Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Эффективность видеокарт AMD и Nvidia в текстурном тесте компании Futuremark обычно достаточно высока и итоговые цифры разных моделей близки к соответствующим теоретическим параметрам. Разница в скорости между Radeon RX Vega 64 и Radeon RX 580 получилась близкой к теоретической — 1,9 раза, да и между Fury X и Vega 64 мы увидели всё те же знакомые 27%, очень близкие к теоретической разнице в пиковых показателях скорости текстурирования.

Что касается сравнения скорости текстурирования видеоплаты Radeon RX Vega 64 с аналогичным показателем ускорителей от Nvidia, новинка показала результат лучше даже чем GeForce GTX 1080 Ti, не говоря о GTX 1080, которая является её прямым ценовым конкурентом. Видеокарта Nvidia уступила новинке более чем 35% в скорости работы блоков TMU. Действительно, в составе Vega 10 очень много текстурных блоков и тактовая частота GPU довольно высокая, так что всё легко объяснимо.

Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Цифры второго подтеста 3DMark Vantage обычно показывают производительность блоков ROP, без учета величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), и тест измеряет именно производительность ROP. И вот как раз по этим показателям у рассматриваемой нами сегодня платы Radeon RX Vega 64 всё не очень хорошо даже по сравнению с другими видеокартами на чипах AMD. Если по теории преимущество перед Fury X должно быть от 25%, то на практике получается лишь 9%! То же самое касается Radeon RX 580, которую новинка опередила лишь на 63%, хотя по теории должна не менее чем на 80%. Очень похоже на то, что блоки ROP в Vega 10 по какой-то странной причине работают хуже, чем у предыдущих GPU компании. Может быть, сказались изменения во внутреннем устройстве чипа, ведь блоки ROP теперь «привязаны» к контроллерам памяти, да и схема кэширования данных изменилась.

Неудивительно, что сравнение с видеокартами Nvidia не очень радужное. Если сравнивать скорость заполнения сцены старшей моделью видеокарты текущего поколения от компании AMD с результатами ускорителей Nvidia в этом тесте, то сегодняшняя новинка показала скорость заполнения сцены на 6% хуже, чем GeForce GTX 1080. Это немного, но всё равно не радует, потому что по теории всё должно быть явно лучше. Понятно, что более дорогая модель GTX 1080 Ti стала лидером этого теста.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника давно используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.

Этот тест из пакета 3DMark Vantage отличается от проведенных нами ранее тем, что результаты в нем зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен верный баланс GPU, а также эффективность выполнения сложных шейдеров.

В данном случае важны и математическая и текстурная производительность, и в этой «синтетике» из 3DMark Vantage новая плата Radeon на базе архитектуры Vega снова показала ожидаемый результат, хорошо объяснимый теорией. Radeon RX Vega 64 опередила модели из предыдущих семейств Radeon ровно настолько, насколько мы ждали — преимущество над Fury X составило 25%, а над RX 580 — 88%.

А вот современные конкуренты от Nvidia в этом тесте сильны и имеют достаточное количество исполнительных устройств. Хотя новинка всё равно смогла обогнать прямого соперника в лице GeForce GTX 1080 на 10%, отстав только от более дорогой GTX 1080 Ti. В общем, с математической производительностью у Vega 10 всё в порядке, это уж точно.

Feature Test 4: GPU Cloth

Четвертый тест пакета интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте также зависит сразу от нескольких параметров, и основными факторами влияния должны являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. То есть, сильные стороны чипов Nvidia должны бы проявиться, но мы давно отметили странные результаты всех GeForce в этом тесте, в котором они явно не соперники для видеокарт компании AMD. Странность результатов подтверждает сравнение Radeon, в котором Fury X оказалась хуже других собратьев.

Несмотря на теоретически меньшее количество геометрических исполнительных блоков и отставание по геометрической производительности у чипов конкурента, по сравнению с решениями Nvidia, все платы Radeon в этом тесте работают отлично, обгоняя обе видеокарты GeForce, представленные в сравнении, даже заметно более дорогие. Так, рассматриваемая сегодня плата Radeon RX Vega 64 чуть ли не вдвое обогнала в этом тесте даже GeForce GTX 1080 Ti, не говоря уже о GTX 1080.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.

А вот во втором «геометрическом» тесте из 3DMark Vantage ситуация уже больше похожа на то, что мы видели в своих геометрических тестах. В этом тесте симуляции физики для частиц, видеокарта Radeon RX Vega 64 показывает результат на 20% лучше, чем Radeon R9 Fury X, и на 50% лучше Radeon RX 580 — это далековато до теоретической разницы, но куда ближе к истине, чем в предыдущем тесте. Новинка компании AMD показала результат ровно такой же, что и её конкурент GeForce GTX 1080, и обе они уступили разве что более дорогой GTX 1080 Ti.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом для GPU, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических вычислений.

В пакет компании Futuremark включен математический тест, в котором производительность решений хоть и не полностью соответствует теории, но близка к тому, что должно быть, исходя из пиковых показателей. В данном математическом тесте, показывающем пиковую производительность видеочипов в предельных задачах, мы видим распределение результатов, несколько отличающееся от того, что мы получили в схожих тестах нашего тестового пакета.

Все графические процессоры архитектуры GCN справляются с задачей лучше решений конкурента в случаях, когда выполняется интенсивная «математика». И хотя новые модели видеокарт компании Nvidia, основанные на архитектуре Pascal, также показывают высокую скорость, но прямой конкурент GeForce GTX 1080 всё же серьёзно отстал от Radeon RX Vega 64 в этом тесте. Новинка AMD имеет достаточно много блоков ALU и приличную тактовую частоту, поэтому почти догоняет более мощную и дорогую модель GeForce GTX 1080 Ti — мы уже говорили, что в математических тестах новинка очень хороша!

Если сравнивать скорость новой видеокарты Radeon с предшественниками, то рассматриваемая модель компании AMD из нового семейства Vega в этом тесте оказалась быстрее Fury X на 24%, а плату на основе чипа Polaris новинка обогнала на 95%, что очень близко к теоретической разнице между этими видеокартами. То есть, никакие архитектурные улучшения в Vega 10 в нашей синтетике не сработали, а вот некоторый проигрыш из-за меньшей эффективности работы блоков ROP в соответствующем тесте мы увидели.

***

Результаты синтетических тестов видеокарты AMD Radeon RX Vega 64, основанной на новом графическом процессоре Vega 10, разработанном для верхнего ценового диапазона, мы оцениваем неоднозначно. С одной стороны, сравнение с конкурирующими моделями видеокарт второго производителя видеочипов (даже топовой моделью, которая стоит заметно дороже) говорит о том, что новая топовая видеокарта AMD в своем классе должна стать явным лидером, особенно по скорости математических вычислений.

С другой стороны, мы не увидели никаких архитектурных улучшений в действии. Да, повышенная тактовая частота сработала, новая видеокарта быстрее своих предшественников ровно настолько, насколько выше её частота и больше количество исполнительных блоков (при сравнении с Radeon RX 580). Но этого мало, ведь в предыдущей части мы расписывали столько новых достоинств Vega 10. Но все они скорее потенциальные, и для получения пользы от них нужно переписывать код, используя 16-битные вычисления, интринсики, шейдеры примитивов и так далее. В существующем же коде 3D-приложений эффективность Vega ничуть не лучше, чем у Polaris и Fiji. И даже чуть хуже, если говорить об эффективности работы блоков ROP — посмотрите на результаты второго теста из 3DMark Vantage, они говорят сами за себя.

Впрочем, всё это придирки, ведь по сути новая модель Radeon выступила отлично и она должна обеспечить конкурентоспособную скорость в играх при самых высоких настройках, так как в синтетических тестах она практически нигде не уступала GeForce GTX 1080, заметно обгоняя решение Nvidia в математических тестах. Можно точно сказать, что соперник для пока ещё господствующей на рынке платы получился неплохой. Более того, учитывая успехи RX Vega 64 во всех математических тестах нашего сравнения, можно с уверенностью утверждать, что уж для майнинга криптовалют она подойдёт просто отлично! Мы уверены, что анонсированная на днях новинка AMD является быстрейшей в этом деле. Относиться к которому можно по-разному, но факт есть факт: энтузиасты майнинга — точно такие же покупатели видеокарт, что и игроки. И в следующей версии синтетических тестов нам придётся включать майнинг в тестовый набор, так как интерес к нему высокий.

Возвращаясь к играм, в следующей части нашего материала мы рассмотрим производительность Radeon RX Vega 64 по сравнению с другими 3D-ускорителями в наборе современных игровых приложений и сделаем окончательные выводы о выгодности анонсированного недавно решения компании AMD для игрового применения.

Средняя цена (количество предложений) в московской рознице:
Рассматриваемые карты Конкуренты
RX Vega 64 8 ГБ — 49 500  (на 08.09.17) GTX 1080 Ti 11 ГБ — 53 000  (на 08.09.17)
RX Vega 64 8 ГБ — 49 500  (на 08.09.17) GTX 1080 8 ГБ — 35 800  (на 08.09.17)
RX Vega 64 8 ГБ — 49 500  (на 08.09.17) GTX 1070 8 ГБ — 30 500  (на 08.09.17)
RX Vega 64 8 ГБ — 49 500  (на 08.09.17) R9 Fury X 4 ГБ — 28 700  (на 03.08.17)

Благодарим компанию AMD Russia
и лично Ивана Мазнева
за предоставленную на тестирование видеокарту

Блок питания Seasonic Prime 1000 W Titanium для тестового стенда предоставлен компанией Seasonic

Модули памяти AMD Radeon R9 8 ГБ UDIMM 3200 МГц для тестового стенда предоставлены компанией AMD

Системная плата Asus ROG Crosshair VI Hero для тестового стенда предоставлена компанией AMD

CPU Cooler Antec Kuhler H2O 920 для тестового стенда предоставлен компанией AMD

Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт

Корпус Corsair Obsidian 800D Full Tower для тестового стенда предоставлен компанией Corsair

Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate




Дополнительно

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.