Обзор видеоускорителя AMD Radeon VII: когда цифры техпроцесса превыше всего

Справочные материалы:

Теоретическая часть: особенности архитектуры

Прошлый год для графического подразделения компании AMD получился довольно спокойным. Они уже не первый год занимаются сравнительно небольшими модификациями весьма удачной для своего времени архитектуры GCN, но в 2016 году запустили новую линейку Polaris, а в 2017 — Vega. В прошлом же году компания AMD выпустила разве что мобильные версии Vega и очередное обновление топа линейки Polaris в виде Radeon RX 590. Куда более интересными были новые серверные продукты Radeon Instinct MI50 и MI60, ставшие первенцами индустрии в деле освоения техпроцесса 7 нм.

Выход новой игровой видеокарты в начале года — довольно редкое событие, но в компании решили представить новую топовую модель Radeon VII именно на шоу CES 2019 в январе. Естественно, совершенно новый GPU они бы разработать не успели, так что новинка основана на серверном решении, которое используется в линейке Radeon Instinct. Что же нового в «седьмом» Radeon? GPU под кодовым именем Vega 20 очень похож на своего предшественника Vega 10, который был улучшен для повышения конкурентоспособности решений компании, предназначенных для рынка научных вычислений и машинного обучения.

Чуть ли не самым важным в новом графическом процессоре является то, что он произведен по новейшему техпроцессу 7 нм компании TSMC, что позволило AMD немного увеличить сложность чипа, повысить его производительность, а главное — улучшить энергоэффективность. Вполне вероятно, что себестоимость производства нового GPU не позволяла выпустить новинку на рынок игровых решений ранее, но так как конкурент выпустил целую новую линейку видеокарт, то нужно было ответить хоть чем-то.

И поскольку линейка Nvidia GeForce RTX отличается высокими ценами, AMD смогла позволить себе выпустить на игровой рынок GPU с немалой себестоимостью и получать хоть какую-то прибыль даже с такого сложного и дорогого в производстве решения, изначально предназначенного для серверного рынка. Неудивительно, что в AMD решили назначить на Radeon VII такую же цену, как у прямого конкурента — GeForce RTX 2080. И сегодня мы разберемся, насколько это обосновано.

Так как основой рассматриваемой сегодня видеокарты Radeon VII является графический процессор Vega 20, являющийся незначительно модифицированным чипом Vega 10, имеющим архитектуру GCN пятого поколения, схожую с архитектурой более ранних решений компании AMD, то перед прочтением статьи будет весьма полезно ознакомиться с нашими предыдущими материалами по видеокартам компании:

Графический ускоритель Radeon VII
Кодовое имя чипа Vega 20 (улучшенный Vega 10)
Технология производства 7 нм (для Vega 10 — 14 нм)
Количество транзисторов 13,2 млрд (у Vega 10 — 12,5 млрд)
Площадь ядра 331 мм² (у Vega 10 — 495 мм²)
Архитектура унифицированная, с массивом процессоров для потоковой обработки любых видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectX DirectX 12, с поддержкой уровня возможностей Feature Level 12_1
Шина памяти 4096-битная (у Vega 10 — 2048-битная) шина памяти с поддержкой стандарта High Bandwidth Memory второго поколения
Частота процессора (базовая/турбо/пиковая) 1400/1750/1800 МГц (у Vega 10 —1274/1546/1630 МГц)
Вычислительные блоки 64 вычислительных блока GCN (активных из них 60), состоящих в целом из 4096 ALU (активных 3840) для расчетов с плавающей запятой (поддерживаются целочисленные и плавающие форматы INT4, INT8, INT16, FP16, FP32 и FP64)
Блоки текстурирования 256 блоков (240 активных) текстурной адресации и фильтрации с поддержкой FP16/FP32-компонент и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
Блоки растровых операций (ROP) 64 блока ROP с поддержкой режимов сглаживания с возможностью программируемой выборки более чем 16 сэмплов на пиксель, в том числе при FP16- или FP32-формате буфера кадра.
Поддержка мониторов поддержка до шести мониторов, подключенных по интерфейсам DVI, HDMI 2.0b и DisplayPort 1.4
Спецификации референсной видеокарты Radeon VII
Частота ядра 1400/1750/1800 МГц
Количество универсальных процессоров 3840
Количество текстурных блоков 240
Количество блоков блендинга 64
Эффективная частота памяти 2000 МГц
Тип памяти HBM2
Шина памяти 4096-бит
Объем памяти 16 ГБ
Пропускная способность памяти 1 ТБ/с
Вычислительная производительность (FP16) до 27,6 терафлопс
Вычислительная производительность (FP32) до 13,8 терафлопс
Вычислительная производительность (FP64) до 3,5 терафлопс
Теоретическая максимальная скорость закраски 115 гигапикселей/с
Теоретическая скорость выборки текстур 432 гигатекселя/с
Шина PCI Express 3.0
Разъемы один HDMI и три DisplayPort
Энергопотребление до 300 Вт (у RX Vega 64 — 295 Вт)
Дополнительное питание два 8-контактных разъема
Число слотов, занимаемых в системном корпусе 2
Рекомендуемая цена $699

Название очередной модели видеокарты AMD не соответствует принятой ранее системе наименований. Сегодняшняя новинка снова имеет имя собственное, но в этот раз — римскую цифру после названия семейства Radeon, которая означает... да мало ли что она может означать. Или Vega II, или намек на использование техпроцесса 7 нм. В общем, типичное маркетинговое название. Начальные буквы RX из наименования также исчезли, хотя не так давно AMD они очень нравились, в тех же Radeon RX Vega они есть.

Рассматриваемая сегодня модель Radeon VII занимает в текущей линейке компании место топового решения, и ее рекомендованная цена недвусмысленно намекает на то, что главным конкурентом видеокарты на рынке будет GeForce RTX 2080, имеющая ровно такую же цену. Что ж, тем проще и для рынка, и для нас, а то очень часто производители выставляют среднюю цену между парой решений конкурента и приходится вычислять соотношение цены и производительности. При равных ценах все просто: какая видеокарта функциональнее и быстрее — та и привлекательнее.

Референсный вариант Radeon VII имеет обычный воздушный кулер открытого типа. Внешний вид корпуса сделан в стиле угловатого металлического бруска, который известен со времен модификаций Vega 64 Limited Edition и Liquid, но теперь применяется схема с тремя вентиляторами, привычная по множеству решений различных производителей видеокарт. Естественно, столь мощная система охлаждения важна для видеокарты с потреблением аж в 300 Вт. Хотя это лишь на 5 Вт больше, чем у RX Vega 64, но и сам кристалл GPU стал меньшего размера и к площади добавились еще два стека HBM2-памяти.

Эталонный вариант видеокарты Radeon VII имеет три видеовыхода DisplayPort и один HDMI. По поддержке стандартов вывода никаких изменений в Vega 20 нет. По понятным причинам, видеокарты Radeon VII существуют исключительно в версии с 16 ГБ памяти, что было обусловлено изначальным профессиональным применением Vega 20.

Для дополнительного питания референсная плата использует два 8-контактных разъема, и значение типичного энергопотребления для модели Radeon VII установлено на уровне 300 Вт, что лишь чуть больше, чем у Vega 64. С одной стороны, два разъема питания будут полезны при разгоне, с другой — как бы не получилось так, что по уровню потребления энергии Radeon VII недалеко ушла от Vega 64 при всех преимуществах нового техпроцесса...

Видеокарты модели Radeon VII продаются в референсном виде несколькими партнерами компании. Чтобы дополнительно привлечь игроков, в комплекте с новой топовой видеокартой предлагается сразу три современные игры (две из которых еще даже не вышли): Devil May Cry 5, The Division 2 и Resident Evil 2 (единственная, которая уже вышла — и, к слову, получила высокие оценки прессы и игроков).

Впрочем, эти игры доступны не только с новинкой, но и с Radeon RX 590 и модификациями RX Vega. И даже новоиспеченные покупатели моделей RX 580 и RX 570 смогут выбрать, но уже лишь две игры из трех. Конкурент в лице GeForce RTX 2080 предлагает свой комплект: Anthem, Battlefield V и Metro Exodus, и тут уж каждому решать для себя самостоятельно, какой из них интереснее.

Архитектурные особенности

Графический процессор Vega 20 основан на архитектуре GCN 5, и это почти тот же Vega 10, но с несколькими изменениями, ориентированными на серверные вычисления. Если совсем вкратце, то Vega 20 — это чуть улучшенный Vega 10 архитектуры GCN, произведенный при помощи техпроцесса 7 нм. Благодаря более совершенной технологии производства, 13,2 млрд транзисторов поместились в чип площадью 331 мм², хотя 12,5 млрд транзисторов Vega 10 занимали куда большую площадь в 495 мм².

При переходе производителей GPU на новый техпроцесс часто увеличивается количество исполнительных блоков, поднимающих производительность более нового чипа. В случае Vega 20 разработчики решили обойтись почти неизменным чипом, но со сниженным энергопотреблением и повышенной частотой. В случае с не до конца отлаженным техпроцессом это решение логично, ведь производство столь сложных чипов на ранней стадии жизни техпроцесса слишком рискованно и означает низкий выход годных чипов, а увеличение площади кристалла приведет к слишком большому росту брака. До сих пор на техпроцессе 7 нм у TSMC массово производились только сравнительно небольшие мобильные однокристальные системы, а кристалл Vega 20 куда более сложен.

Давайте наглядно сравним площади чипов семейства Vega двух разных поколений: предыдущего с площадью 495 мм² и нового, уместившегося в 331 мм² благодаря самому совершенному на сегодняшний день техпроцессу:

Именно это снижение размеров кристалла позволило сэкономить место на чипе для того, чтобы поместить на подложку-интерпозер схожего размера еще два стека HBM2-памяти, что привело к росту объема локальной видеопамяти до 16 ГБ. Это не первый GPU компании с таким объемом, был уже вариант Radeon Vega Frontier Edition, но Radeon VII точно является более массовым вариантом.

Удвоенный объем локальной видеопамяти вместе с удвоенной пропускной способностью стали, пожалуй, самым большим изменением в Radeon VII по сравнению с RX Vega 64. Кроме размещения не двух, а четырех стеков HBM2-памяти на интерпозере, также была немного увеличена и частота работы микросхем памяти. Естественно, все это делалось, в основном, для серверных продуктов, ведь в игровых видеокартах такие объемы памяти и ПСП вряд ли актуальны до сих пор.

Наличие 16 ГБ в игровой видеокарте сейчас не является таким уж явным преимуществом: в абсолютном большинстве игр даже при максимальных (без бессмысленного повышения внутреннего разрешения рендеринга до 8К) настройках вполне хватает и 8 ГБ. В консолях большего объема памяти просто нет, так что все мультиплатформенные проекты в таком объеме VRAM не нуждаются, да и ПК-разработчики также не ориентируются на GPU с 16 ГБ по причине их крайней редкости.

Но нужно понимать, что Vega 20 предназначена прежде всего для профессиональной сферы, а там такой объем видеопамяти уже вполне востребован. Более того, даже в варианте Radeon VII он может быть полезен в приложениях по созданию контента, например при обработке видео и в 3D-рендеринге. В таких задачах имеющиеся 16 ГБ будут поглощены с легкостью. Ну, и для игровых применений запас по объему памяти вполне может греть душу, как минимум. Да и с маркетинговой точки зрения 16 всегда лучше, чем 8 или даже 11.

Если говорить о самом кристалле, то графический процессор Vega 20 относится к пятому поколению архитектуры Graphics Core Next, базовым ее блоком является вычислительный блок Compute Unit (CU), из которых собраны все графические процессоры AMD. Блок CU имеет выделенное локальное хранилище данных для обмена данными или расширения локального регистрового стека, а также кэш-память первого уровня с возможностью чтения и записи и полноценный текстурный конвейер с блоками выборки и фильтрации, он разделен на подразделы, каждый из которых работает над своим потоком команд. Каждый из таких блоков самостоятельно занимается планированием и распределением работы.

На архитектурном уровне графический процессор Vega 20 — это практически полная копия Vega 10 с некоторыми улучшениями и увеличенным количеством контроллеров памяти. Все остальные блоки чипа остались в том же количестве (физически; некоторые из них были отключены конкретно в модели Radeon VII), GPU содержит 64 CU и 256 текстурных модулей (активными из них остались 60 CU и 240 TMU), размещенных в четырех шейдерных движках, также имеется 64 блока ROP и один командный процессор. В итоге, всего в составе активных вычислительных блоков находится 3840 потоковых процессоров (в Vega 64 их 4096) и 240 текстурных блоков (против 256 в Vega 64).

Есть в чипе Vega 20 некоторые улучшения и изменения, направленные на повышение производительности. Одним из них является удвоенная ПСП: каждому исполнительному блоку теперь доступна вдвое более высокая скорость обмена с памятью. С другой стороны, количество блоков ROP в GPU осталось прежним, и поэтому в ограниченных скоростью заполнения играх особого прироста производительности не будет. Зато повышенная ПСП будет полезной для вычислительных задач.

Получается, что между Vega 20 и Vega 10 не так много отличий, и у новинки даже чуть меньше активных вычислительных блоков. Однако для Radeon VII заявлена пиковая тактовая частота в 1800 МГц, хотя официальная турбо-частота несколько ниже: 1750 МГц. Напомним, что у Radeon RX Vega 64 пиковая частота равна 1630 МГц, а кроме того, новый Radeon VII способен дольше работать на более высокой частоте, поддерживая ее чаще, чем предшествующая модель. Так что новинка должна быть в целом явно побыстрее Vega 64.

Поговорим о более явных улучшениях, среди которых — нескольких новых инструкций и типов данных для ускорения задач машинного обучения. Особых деталей AMD публике не выдает, но в Vega 20 они добавили типы данных INT8 и INT4, востребованные в некоторых задачах глубокого обучения, не требующих высокой точности вычислений. Также к возможностям нового GPU добавлена новая инструкция FP16 dot product, предназначенная для алгоритмов глубокого обучения, которая накапливает результат в формате FP32 — с большей точностью по сравнению с типичной инструкцией FP16 dot product.

Еще одно очень важное изменение для серверных процессоров — увеличение производительности вычислений с двойной точностью, FP64. Архитектура GCN позволяет варьировать производительность FP64 от 1/2 до 1/16 темпа FP32-вычислений, и для игровых решений это значение всегда было самым низким, 1/16, а все серверные GPU имели половинный темп вычислений. В Vega 20 этот темп максимален — 1/2 от FP32 для FP64. И если по FP32-производительности новый чип не сильно быстрее Vega 10, то по операциям с двойной точностью увеличение производительности уже более 8 раз.

Но это касается профессиональных решений, а в Radeon VII ожидали те же 1/16. Однако AMD и тут решила дать пользователям новые возможности, ограничив скорость FP64 для видеокарты Radeon VII на уровне 1/4 от скорости FP32, что очень прилично и может быть востребовано для многих серьезных вычислительных применений. Конечно, обеспеченные профессионалы в любом случае предпочтут Radeon Instinct, но в ряде задач вполне можно будет обойтись и игровым Radeon VII.

По спецификациям Radeon VII соответствует серверной модели Radeon Instinct MI50, но чтобы продажи игрового GPU не ударили по более серьезному рынку, в AMD решили слегка ограничить вычислительные возможности Vega 20 искусственным образом, не только снизив производительность вычислений с двойной точностью (FP64), но и отключив поддержку коррекции ошибок ECC для чипа. Впрочем, для части полу- и профессиональных применений Radeon VII все равно подходит куда лучше других игровых GPU.

И пусть Radeon VII не так быстр в FP64-вычислениях, как Radeon Instinct MI60 и MI50, но 3,5 терафлопс дают новой модели большое преимущество в определенных задачах, использующих именно такую точность вычислений. И на данный момент у новинки не существует конкурентов в этом смысле, все Nvidia GeForce и остальные AMD Radeon имеют крайне низкую FP64-производительность, а Titan V стоит вчетверо дороже. Конечно, мы говорим о маленькой нише на большом рынке, но некоторые исследователи точно будут довольны.

Для разделения рынков Radeon VII также был ограничен по возможностям внешних связей. Технически, Vega 20 имеет поддержку PCI Express 4.0 (к слову, это в принципе первый GPU с поддержкой новой версии PCIe), но лишь в вариантах Radeon Instinct, а работа Radeon VII ограничена скоростями PCI Express 3.0. То же самое касается возможностей внешних линков Infinity Fabric для многочиповых конфигураций: в Instinct они есть, а в Radeon VII отключены. Также новинка не поддерживает привычный CrossFire — только работу многочиповых систем в пределах возможностей DirectX 12 и Vulkan, для чего нужна поддержка со стороны разработчиков игровых приложений.

Абсолютно все остальные функциональные возможности Vega 10 поддерживаются и новым GPU, включая удвоенный темп для FP16-инструкций (используется в Far Cry 5 и Wolfenstein II, если говорить об играх), Draw Stream Binning Rasterizer (DSBR) и так и не заработавшие в реальности шейдеры примитивов (primitive shaders), требующие поддержки как со стороны драйверов, так и игровых разработчиков. С точки зрения поддержки устройств вывода и видеокодирования и декодирования, в Vega 20 изменений тоже практически нет: технически, блоки вроде бы обновились, но никаких новых возможностей по сравнению с Vega 10 у них не появилось.

Зато была улучшена работа с отслеживанием температуры всего GPU. По заявлениям AMD, в новом чипе содержится вдвое большее количество температурных датчиков — уже 64 штуки. Это позволяет точно контролировать температуру всего чипа, а не только в каких-то областях, и с несколько большей точностью. Одно это изменение привело к дополнительному приросту на 1%-2% в производительности за счет меньшего времени работы графического процессора в режиме тротлинга. Данные с температурных датчиков и GPU теперь считываются иным образом и требуют обновления соответствующего ПО для поддержки новых вызовов API AMD.

Со всеми остальными возможностями чипов семейства Vega, которые в Radeon VII ничуть не изменились, вы можете познакомиться в базовом обзоре видеокарты Radeon RX Vega 64, там они описаны во всех подробностях.

Предварительная оценка производительности и промежуточные выводы

Прежде чем делать какие-то наметки по производительности Radeon VII, для начала давайте сравним характеристики нескольких моделей видеокарт AMD, включив в таблицу два варианта игровых решений на разных поколениях чипа Vega и самую лучшую видеокарту семейства Polaris:

  Radeon VII Radeon RX Vega 64 AMD Radeon RX 590
Техпроцесс TSMC, 7 нм GloFo, 14 нм GloFo, 12 нм
Кодовое наименование GPU Vega 20 Vega 10 Polaris 30
Архитектура GCN 5 GCN 5 GCN 4
Количество транзисторов, млрд 13,2 12,5 5,7
Площадь кристалла, мм² 331 495 232
Количество блоков ALU 3840 4096 2304
Количество блоков TMU 240 256 144
Количество блоков ROP 64 64 32
Базовая частота, МГц 1400 1247 1469
Турбо частота, МГц 1750 1546 1545
Частота видеопамяти, МГц 2000 1890 8000
Ширина шины видеопамяти, бит 4096 2048 256
Объем видеопамяти, ГБ 16 8 8
Производительность FP32, TFLOPS 13,8 12,7 7,1
Производительность FP64, TFLOPS 3,5 0,8 0,4
Энергопотребление, Вт 300 295 225
Рекомендованная цена, $ 699 499 279

Из таблицы видно, что сегодняшняя новинка по теоретической пиковой производительности отличается от Vega 64 не так уж сильно. В явных преимуществах у нее больший объем памяти и ПСП, а вот производительность вроде бы не должна сильно отличаться. При этом в теории Radeon VII до двух раз быстрее Radeon RX 590, что мы дальше проверим уже на практике.

Если говорить о данных самой компании AMD, то по игровой производительности новая модель Radeon VII практически во всех современных играх дает значительный прирост частоты кадров по сравнению с предыдущими продуктами компании из этого рыночного сегмента, да и по сравнению с конкурирующими продуктами предыдущего поколения новинка смотрится довольно неплохо. Вот диаграмма игровой производительности Radeon VII по сравнению с Radeon RX Vega 64 и GeForce GTX 1080:

Как видите, по измерениям специалистов из AMD, их новое детище опережает как предыдущую модель этой же компании, так и ее давнего конкурента. По этим данным, Radeon VII оказалась значительно быстрее парочки представителей GPU прошлых лет, но зачем сравнивать новинку с устаревшими видеокартами? А что получится, если сравнить рассматриваемый сегодня продукт со свежим конкурентом в виде GeForce RTX 2080, который продается по той же цене?

Судя по измерениям, проведенным в широком наборе самых популярных игровых приложений, хорошо подготовленный для высоких разрешений Radeon VII смотрится очень неплохо по сравнению с прямым конкурентом GeForce RTX 2080, как минимум при использовании 4K-разрешения. Да, кое-где новинка уступает видеокарте Nvidia, но в других играх значительно опережает, а в среднем они где-то на одном уровне. Всё это, повторим, по данным AMD и в выгодных для них условиях.

Собственные игровые тесты мы проведем чуть позже, а сейчас напомним важный момент: Radeon VII предназначен не только для любителей игр, но и для любителей и профессионалов, занимающихся созданием цифрового контента в 3D-пакетах и ПО для видеоредактирования, научными вычислениями и так далее. К примеру, в Blender (это популярное ПО для рендеринга, использующее возможности GPU AMD при помощи плагина Radeon ProRender), а также DaVinci Resolve и Adobe Premiere (это ПО для редактирования видеороликов, их цветокоррекции и наложения визуальных эффектов) в сложных задачах типа редактирования 4K- и 8K-видео используется более восьми гигабайт видеопамяти, и Radeon VII здесь раскрывает свои возможности, опережая Vega 64 примерно на 25%-30% и показывая производительность примерно на уровне GeForce RTX 2080 или даже выше.

Довольно важным преимуществом Radeon VII в этих случаях является наличие 16 ГБ сверхбыстрой HBM2-памяти с шириной шины в 4096-бит и пропускной способностью в 1 ТБ/с. И для современных игр при максимальных настройках графики и ультравысоких разрешениях рендеринга это может быть полезно. Так, рекомендуемые требования к объему видеопамяти у популярной серии игр Battlefield менее чем за десяток лет выросли с 0,5-1 ГБ в 2010—2011 гг. до 6-8 ГБ для последней игры серии — Battlefield V.

Замеры специалистов компании AMD, проведенные с использованием такого ПО, как MSI Afterburner и Windows Task Manager, показали, что популярные игровые и профессиональные приложения в разрешении 4K и выше используют больше 8 ГБ видеопамяти, имеющихся в наличии у большинства решений ценового диапазона, в котором выступает Radeon VII, вроде ее прямого конкурента — GeForce RTX 2080.

Так, при редактировании видеороликов высокого разрешения в Adobe Premiere используется 10—12 ГБ видеопамяти, а в играх иногда отмечается использование 11—13 ГБ локальной памяти GPU. Другое дело, что большие цифры объема используемой памяти вовсе не говорят о том, что объема 8 ГБ будет недостаточно: современные игры зачастую используют стриминг текстур и других ресурсов и просто забивают данными максимально возможный объем памяти, пока она есть в наличии. То есть если при 16 ГБ у Radeon VII будет использоваться 11—12 ГБ, то на GeForce RTX 2080 может вполне хватать и 8 ГБ. Сам по себе объем занятой VRAM не значит ничего.

Тем более, что в AMD сделали хитро, добавив значения используемого объема видеопамяти при использовании таких настроек, как повышенное разрешение рендеринга (к примеру, при выводе в 4K-разрешении сам рендеринг производится при 8K-разрешении), при довольно низкой частоте кадров. Впрочем, при достаточно высоком FPS также есть вероятность того, что при нехватке видеопамяти на GPU с меньшим ее объемом будут наблюдаться неприятные рывки при подгрузке данных из ОЗУ, тогда как Radeon VII предоставит их быстрее — уже загруженными в быструю видеопамять. Такая ситуация показана на диаграмме времени рендеринга кадров:

Сравнение данных Radeon VII и GeForce RTX 2080 показывает, что с видеокартой AMD наблюдается гораздо меньше подгрузок данных, когда частота кадров падает до неприятных притормаживаний, и игровой процесс в целом достаточно плавный, а вот GeForce при нехватке локальной видеопамяти частенько лезет за не поместившимися в видеопамять данными в ОЗУ, что вызывает некомфортные подергивания картинки (зеленые пики на графике).

Такое поведение разных видеокарт не будет видно по средним значениям частоты кадров, но даже при беглом взгляде на диаграмму времени отрисовки кадров оно сразу становится очевидно. По данным AMD, их видеокарты справляются с задачей обеспечения плавности лучше конкурента, но чтобы подтвердить это, нужно проводить отдельное серьезное исследование. В любом случае, больше видеопамяти точно лучше, чем меньше.

Особенности видеокарты

Объект исследования: ускоритель трехмерной графики (видеокарта) AMD Radeon VII 16 ГБ 4096-битной HBM2

Сведения о производителе: Компания ATI Technologies (торговая марка ATI) основана в 1985 году в Канаде как Array Technology Inc. В том же году была переименована в ATI Technologies. Штаб-квартира в г. Маркхам (Торонто). C 1987 года компания сконцентрировалась на выпуске графических решений для ПК. Начиная с 2000 года основным брендом графических решений ATI становится Radeon, под которым выпускаются GPU как для настольных ПК, так и для ноутбуков. В 2006 году компанию ATI Technologies покупает компания AMD, в которой образуется подразделение AMD Graphics Products Group (AMD GPG). C 2010 года AMD отказывается от бренда ATI, оставив лишь Radeon. Штаб-квартира AMD в Саннивейл (Калифорния), а у AMD GPG остается главным офисом бывший офис AMD в Маркхаме (Канада). Своего производства нет. Общая численность сотрудников AMD GPG (включая региональные офисы) — около 2000 человек.

Характеристики карты

AMD Radeon VII 16 ГБ 4096-битной HBM2
GPU Radeon VII (Vega20)
Интерфейс PCI Express x16
Частота работы GPU (ROPs), МГц 1400—1750(Boost)—1803(Max)
Частота работы памяти (физическая (эффективная)), МГц 1000 (2000)
Ширина шины обмена с памятью, бит 4096
Число вычислительных блоков в GPU 60
Число операций (ALU) в блоке 64
Суммарное количество блоков ALU 3840
Число блоков текстурирования (BLF/TLF/ANIS) 240
Число блоков растеризации (ROP) 64
Число блоков Ray Tracing
Число тензорных блоков
Размеры, мм 270×105×40
Количество слотов в системном блоке, занимаемые видеокартой 2
Цвет текстолита черный
Энергопотребление пиковое в 3D, Вт 305
Энергопотребление в режиме 2D, Вт 20
Энергопотребление в режиме «сна», Вт 10
Уровень шума в 3D (максимальная нагрузка), дБА 46,0
Уровень шума в 2D (просмотр видео), дБА 21,7
Уровень шума в 2D (в простое), дБА 21,7
Видеовыходы 1×HDMI 2.0b
3×DisplayPort 1.4
Поддержка многопроцессорной работы CrossFire (под вопросом)
Максимальное количество приемников/мониторов для одновременного вывода изображения 4
Питание: 8-контактные разъемы 2
Питание: 6-контактные разъемы 0
Максимальное разрешение/частота, Display Port 3840×2160@160 Гц (7680×4320@30 Гц)
Максимальное разрешение/частота, HDMI 3840×2160@60 Гц
Максимальное разрешение/частота, Dual-Link DVI 2560×1600@60 Гц (1920×1200@120 Гц)
Максимальное разрешение/частота, Single-Link DVI 1920×1200@60 Гц (1280×1024@85 Гц)
Средняя цена в продаже отсутствует (на момент публикации)

Особенности карты и сравнение с AMD Radeon RX Vega 64

AMD Radeon VII AMD Radeon RX Vega 64
вид спереди
вид сзади

Поскольку Radeon VII является прямым наследником Vega 64, интересно сравнить именно с Vega 64. К тому же GPU Vega20 (Radeon VII) — это, по сути, обновленный с переходом на новый техпроцесс Vega10 (RX Vega64). Архитектура почти та же самая, есть изменения в частотах, кешах, шине обмена с памятью.

Очевидно, что печатные платы схожи в размерах и расположении элементов. Это связано, скорее всего, с необходимостью размещения довольно сложной системы питания, а также установки довольно габаритной системы охлаждения, поэтому, несмотря на отсутствие на печатной плате мест под отдельные микросхемы памяти, PCB все же получилась большой. Помнится, среди всего семейства GPU, оснащенных HBM-памятью, только Fury Nano мог похвастаться очень компактными размерами карты (что как раз подчеркивает его название), но энергопотребление у него было жестко ограничено, так что частоты также были сильно ниже, чем у остальных карт линейки Fury.

Схема питания использует 10 фаз для GPU и 2 фазы для памяти. При этом на плате есть посадочные места для 16 дросселей, конденсаторов и т. д., то есть теоретически можно организовать 16 полноценных фаз. Используются весьма дорогие транзисторные сборки DrMOS со встроенным драйвером.

Карта имеет два 8-контактных разъема питания, поэтому в целом система питания рассчитана на энергопотребление до 375 Вт. Стоит отметить, что с карты убраны световые индикаторы мониторинга состояния, которые имеются около разъемов питания у RX Vega. Также нет и двойного BIOS.

Память

Карта имеет 16 ГБ памяти HBM2, размещенной в 4 модулях по 32 Гбит в единой упаковке с GPU. Модули памяти Samsung (HBM2) рассчитаны на номинальную частоту работы в 1000 (2000) МГц.

Охлаждение и нагрев

Главной частью кулера является испарительная камера, оборотная часть которой припаяна к массивному радиатору (имеющему также тепловые трубки для улучшения рассеивания тепла). Поверх установлен кожух с тремя вентиляторами, работающими на одинаковой частоте вращения. Силовые транзисторы охлаждаются тем же радиатором через специальный термоинтерфейс. С оборотной стороны карта прикрывается специальной пластиной, которая играет скорее декоративную роль. В целом виден единый стиль: все покрыто алюминиевым сплавом.

Мониторинг температурного режима с помощью MSI Afterburner (автор А. Николайчук AKA Unwinder):

После 6-часового прогона под нагрузкой максимальная температура ядра не превысила 79 градусов, что является удовлетворительным результатом для видеокарты такого уровня. Следует обратить внимание на второе значение температуры (оно обозначено как «ГП 2», в терминах AMD это Junction Temperature). Это сводное значение, полученное от дополнительных датчиков, разбросанных по всему кристаллу. Именно это значение является ключевым сигналом для драйверов: в случае превышения температуры 100 градусов процессор переводится в режим тротлинга, при достижении этого порогового значения драйвер уже будет пытаться понижать частоты работы. Надо сказать, что такая картина встречалась нам весьма часто, то есть СО все же нуждается в улучшении.

Максимальный нагрев — центральная часть карты в области GPU.

Шум

Методика измерения шума подразумевает, что помещение шумоизолировано и заглушено, снижены реверберации. Системный блок, в котором исследуется шум видеокарт, не имеет вентиляторов, не является источником механического шума. Фоновый уровень 18 дБА — это уровень шума в комнате и уровень шумов собственно шумомера. Измерения проводятся с расстояния 50 см от видеокарты на уровне системы охлаждения.

Режимы измерения:

  • Режим простоя в 2D: загружен интернет-браузер с сайтом iXBT.com, окно Microsoft Word, ряд интернет-коммуникаторов
  • Режим 2D с просмотром фильмов: используется SmoothVideo Project (SVP) — аппаратное декодирование со вставкой промежуточных кадров
  • Режим 3D с максимальной нагрузкой на ускоритель: используется тест FurMark

Оценка градаций уровня шума выполняется по методике, описанной здесь:

  • 28 дБА и менее: шум плохо различим уже на расстоянии одного метра от источника, даже при очень низком уровне фонового шума. Оценка: шум минимальный.
  • от 29 до 34 дБА: шум различим уже с двух метров от источника, но не особо обращает на себя внимания. С таким уровнем шума вполне можно мириться даже при долговременной работе. Оценка: шум низкий.
  • от 35 до 39 дБА: шум уверенно различается и заметно обращает на себя внимание, особенно в помещении с низким уровнем шума. Работать с таким уровнем шума можно, но спать будет затруднительно. Оценка: шум средний.
  • 40 дБА и более: такой постоянный уровень шума уже начинает раздражать, от него быстро устаешь, появляется желание выйти из комнаты или выключить прибор. Оценка: шум высокий.

В режиме простоя в 2D температура составляла 30 °C, вентиляторы работали на частоте вращения 800 оборотов в минуту. Шум был равен 21,7 дБА (практически бесшумно).

При просмотре фильма с аппаратным декодированием ничего не менялось: температура ядра оставалась прежней, вентиляторы работали на тех же оборотах, шум сохранялся на уровне 21,7 дБА.

В режиме максимальной нагрузки в 3D температура достигала 79 °C. Вентиляторы при этом раскручивались до 2922 оборотов в минуту, шум вырастал до 46,0 дБА, так что шум от данной СО высокий и даже очень высокий. Это подтверждает наше мнение о том, что используемый кулер не является эффективным. Странно видеть такое решение от инженеров AMD.

Комплект поставки и упаковка

Базовый комплект поставки серийной карты должен включать в себя руководство пользователя, диск с драйверами и утилитами. Для прессы компания AMD снабдила карту этаким постаментом, имеющим подсветку и впрессованный в него чип Radeon VII. Понятно, что в продажу поступят карты партнеров AMD с их собственными комплектами.

Синтетические тесты

Недавно мы обновили пакет синтетических тестов, он все еще экспериментальный и будет меняться. Мы бы хотели добавить еще больше примеров с вычислениями (compute), но с этим есть определенные сложности. В будущем мы постараемся расширить и улучшить набор синтетических тестов, и если у вас есть четкие и обоснованные предложения — напишите их в комментариях к статье или отправьте авторам почтой.

Из ранее активно использовавшихся нами тестов RightMark3D мы оставили лишь несколько самых тяжелых вариантов. Остальные уже изрядно устарели и на столь мощных GPU упираются в различные ограничители, не загружают работой блоки графического процессора и не показывают истинную его производительность. А вот синтетические Feature-тесты из набора 3DMark Vantage мы пока что решили оставить в полном составе, так как заменить их попросту нечем, хотя и они уже устарели.

Из более-менее новых бенчмарков мы начали использовать несколько примеров, входящих в DirectX SDK и пакет SDK компании AMD (скомпилированные примеры применения D3D11 и D3D12), а также несколько тестов для измерения производительности трассировки лучей (при их поддержке) и один тест для сравнения производительности сглаживания методами DLSS и TAA — только для решений Nvidia. В качестве полусинтетического теста нами также используется и популярный 3DMark Time Spy, помогающий определить прирост от асинхронных вычислений.

Синтетические тесты проводились на следующих видеокартах:

  • Radeon VII со стандартными параметрами (RVII)
  • Radeon RX Vega 64 со стандартными параметрами (RX Vega 64)
  • Radeon RX 590 со стандартными параметрами (RX 590)
  • GeForce RTX 2080 со стандартными параметрами (RTX 2080)
  • GeForce GTX 1080 Ti со стандартными параметрами (GTX 1080 Ti)

Для анализа производительности новой видеокарты Radeon VII мы взяли эти решения по следующим причинам. Вполне естественно было сравнить новинку с ее прямым предшественником Radeon RX Vega 64 — так мы поймем, насколько увеличилась производительность чипа Vega при переходе на 7 нм техпроцесс. Также мы сравним топовый Radeon VII и с самым производительным решением семейства Polaris — Radeon RX 590, чтобы увидеть разницу в производительности между Vega и Polaris.

В качестве основного конкурента для Radeon VII мы выбрали видеокарту GeForce RTX 2080, так как она имеет идентичную цену и, предположительно, близкую производительность. Второй видеокартой от компании Nvidia для нашего сегодняшнего сравнения мы взяли модель GTX 1080 Ti из прошлого поколения — она также близка по скорости, и будет интересно — смогли ли в AMD с использованием 7 нм техпроцесса догнать топ-модель конкурента из предыдущего поколения.

 
Тесты Direct3D 10
 
Тесты из 3DMark Vantage
 
Тесты Direct3D 11
 
Тесты Direct3D 12
 
Вычислительные тесты

Выводы по теоретической части и синтетическим тестам

Судя по теоретическим данным и синтетическим тестам, видеокарта модели Radeon VII, основанная на урезанной версии графического процессора Vega 20 архитектуры GCN пятого поколения, занимает на рынке игровых видеокарт место на самом верху линейки компании AMD. Хотя у Radeon VII не все было прекрасно с некоторыми из наших синтетических бенчмарков, мы думаем, что в играх новинка должна оказаться заметно быстрее Vega 64 и быть примерно где-то на уровне GeForce RTX 2080, в зависимости от конкретных приложений.

Видеокарта Radeon VII основана на первом GPU, произведенном по 7 нм техпроцессу, нацеленном как на пользователей игровых приложений, так и профессионального ПО для созданию контента. На данный момент это наиболее производительное решение компании AMD на рынке игровых видеокарт. Если смотреть на прирост производительности относительно предыдущего топового решения Vega 64, то тут Radeon VII выглядит очень неплохо, опережая предшественника на величину до 20%-25% (чем выше разрешение, тем большим получается преимущество). Так что, несмотря на меньшее количество исполнительных блоков у Vega 20, модель Radeon VII за счет более высоких частот и лучшей энергоэффективности имеет явное превосходство.

А вот если остановиться на том, как новинка справляется с прямым конкурентом в виде GeForce RTX 2080, то в среднем Radeon VII все же помедленнее видеокарты Nvidia. Конечно, наверняка будут задачи и игры, где новинка будет блистать, показывая результат лучше, чем у соперника (это такие игры как Far Cry 5 и Wolfenstein II), но достаточно много будет и игр, в которых новинка AMD проиграет. Не говоря уже о поддержке новых функциональных возможностей, вроде аппаратной трассировки лучей или специализированных тензорных блоков для ускорения задач глубокого обучения (кое-что в Vega 20 улучшили в этом плане, но она все же отстает от конкурента).

Создается впечатление, что AMD не слишком старалась выступить лучше по соотношению производительности (в играх), возможностей и цены, в которых их решения всегда были традиционно сильны. У конкурента это соотношение даже лучше, а Radeon VII не настолько хороша, чтобы все кинулись за ней, предпочтя решение AMD. Скорее всего, так получилось из-за высокой себестоимости новинки, ведь произведенный по сверхновому 7 нм техпроцессу чип имеет немалый размер и себестоимость производства, особенно учитывая четыре стека HBM2-памяти приличного объема, соединенные интерпозером. Общая себестоимость производства новинки высока и не позволяет снизить цену значительно ниже, чем у GeForce RTX 2080.

Что касается преимущества Radeon VII по объему видеопамяти, то оно на данный момент наблюдается далеко не везде — наверняка, в каких-то профессиональных задачах это имеет смысл и дает прирост скорости, но даже в самых современных играх сейчас вполне достаточно и 8 ГБ видеопамяти. Конечно, удвоенный объем может сказаться в будущем, но пока что толку от него в основном нет. Но эта видеокарта может выглядеть привлекательной для серьезного применения при создании контента: редактировании и монтаже видеороликов, 3D-рендеринге, других задачах профессиональной визуализации. Что подтверждают и наши вычислительные тесты, вроде LuxMark. Как раз для таких задач цена новинки в $699 — просто отличная!

Но с архитектурной точки зрения это лишь улучшенная Vega со всеми ее недостатками — устаревшая архитектура GCN с отсутствием новой функциональности и высоким энергопотреблением. Вероятно, именно последнее не дало 7 нм чипу конкурировать с топовым решением конкурента, а если бы Radeon VII был на уровне RTX 2080 Ti, то на преимущество последней по функциональности можно было бы и закрыть глаза. Но даже с RTX 2080 конкуренция получилась вялой — топовый Radeon не имеет преимущества по соотношению цены и производительности чуть ли не впервые за долгие годы. И на игровом рынке ее позиции далеко не так хороши по сравнению с GeForce RTX 2080. Впрочем, положение AMD в любом случае улучшилось за счет выхода нового топового решения.

Игровые тесты

Конфигурация тестового стенда

  • Компьютер на базе процессора AMD Ryzen 7 2700X (Socket AM4):
    • процессор AMD Ryzen 7 2700X (разгон до 4,0 ГГц);
    • СО Antec Kuhler H2O 920;
    • системная плата Asus ROG Crosshair VI Hero на чипсете AMD X370;
    • оперативная память 16 ГБ (2×8 ГБ) DDR4 AMD Radeon R9 UDIMM 3200 МГц (16-18-18-39);
    • жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA2;
    • блок питания Seasonic Prime 1000 W Titanium (1000 Вт);
    • блок питания Thermaltake RGB 750W;
    • корпус Thermaltake Versa J24;
  • операционная система Windows 10 Pro 64-битная; DirectX 12;
  • телевизор LG 43UK6750 (43″ 4K HDR);
  • драйверы AMD версии 19.2.1 (для Radeon VII — 19.2.2);
  • драйверы Nvidia версии 418.91;
  • VSync отключен.

Список инструментов тестирования

Во всех играх использовалось максимальное качество графики в настройках.

  • Wolfenstein II: The New Colossus (Bethesda Softworks/MachineGames)
  • Tom Clancy’s Ghost Recon Wildlands (Ubisoft/Ubisoft)
  • Assassin’s Creed: Origins (Ubisoft/Ubisoft)
  • Battlefield V (EA Digital Illusions CE/Electronic Arts)
  • Far Cry 5 (Ubisoft/Ubisoft)
  • Shadow of the Tomb Raider (Eidos Montreal/Square Enix) — HDR включен
  • Total War: Warhammer II (Creative Assembly/Sega)
  • Strange Brigade (Rebellion Developments/Rebellion Developments)

Результаты тестирования.

 
Wolfenstein II: The New Colossus
 
Tom Clancy’s Ghost Recon Wildlands
 
Assassin’ Creed: Origins
 
Battlefield V
 
Far Cry 5
 
Shadow of the Tomb Raider
 
Total War: Warhammer II
 
Strange Brigade

Рейтинг iXBT.com

Рейтинг ускорителей iXBT.com демонстрирует нам функциональность видеокарт друг относительно друга и нормирован по самому слабому ускорителю — Radeon RX 550 (то есть сочетание скорости и функций Radeon RX 550 приняты за 100%). Рейтинги ведутся по 20 ежемесячно исследуемым нами акселераторам в рамках проекта Лучшая видеокарта месяца. Из общего списка выбирается группа карт для анализа, куда входят Radeon VII и его конкуренты.

Для расчета рейтинга полезности использованы розничные цены на конец февраля 2019 года.

Модель ускорителя Рейтинг iXBT.com Рейтинг полезности Цена, руб.
01 GeForce RTX 2080 Ti 11 ГБ, 1350—1950/14000 1180 157 75 000
02 GeForce RTX 2080 8 ГБ, 1515—1950/14000 1000 200 50 000
03 Radeon VII 16 ГБ, 1400—1750/2000 930 169 55 000
04 GeForce GTX 1080 Ti 11 ГБ, 1480—1885/11000 850 189 45 000
05 GeForce RTX 2070 8 ГБ, 1410—1850/14000 770 217 35 500

Мы видим, что в среднем по всем играм и разрешениям Radeon VII быстрее, чем GeForce GTX 1080 Ti, однако немного уступает своему основному конкуренту GeForce RTX 2080. Тем не менее, разница между GeForce RTX 2080 и Radeon VII не является существенной, а это значит, что новый ускоритель AMD прекрасно подойдет для игр в разрешении 2.5К при максимальных настройках качества, а в некоторых играх ему покорится и разрешение 4К без снижения настроек.

Рейтинг полезности

Рейтинг полезности тех же карт получается, если показатели предыдущего рейтинга разделить на цены соответствующих ускорителей.

Модель ускорителя Рейтинг полезности Рейтинг iXBT.com Цена, руб.
05 GeForce RTX 2070 8 ГБ, 1410—1850/14000 217 770 35 500
11 GeForce RTX 2080 8 ГБ, 1515—1950/14000 200 1000 50 000
12 GeForce GTX 1080 Ti 11 ГБ, 1480—1885/11000 189 850 45 000
17 Radeon VII 16 ГБ, 1400—1750/2000 169 930 55 000
18 GeForce RTX 2080 Ti 11 ГБ, 1350—1950/14000 157 1180 75 000

А вот в этом рейтинге картина для нового ускорителя резко портится. Да, на момент написания статьи Radeon VII еще не появился в продаже, мы взяли условную цену, полученную из рекомендованной для США (699 долларов) путем умножения на привычный уже для российской розницы коэффициент 1,2 (и это еще минимум!), так что мы ожидаем, что первые цены будут даже выше 55 000 рублей. А при такой цене Radeon VII резко уступает не только своему прямому конкуренту GeForce RTX 2080, но и уже уходящему с рынка бывшему флагману GeForce GTX 1080 Ti. Напомним, что новинке AMD необходимо быть дешевле GeForce RTX 2080, поскольку ускоритель Nvidia ненамного, но быстрее.

Выводы

AMD Radeon VII (16 ГБ) дает нам первое представление о самом тонком на сегодня техпроцессе для GPU — 7 нм. Переход на него позволил резко поднять частоты работы GPU, уменьшить площадь самого кристалла, что дало возможность на такой же площади подложки, как у Radeon RX Vega 64, разместить уже 4 модуля HBM2, не только получив вдвое больший объем памяти в 16 гигабайт, но и увеличив в 2 раза ширину шины обмена с памятью, а это обеспечило дополнительный прирост производительности относительно Radeon RX Vega 64, особенно в высоких разрешениях.

В среднем Radeon VII продемонстрировал производительность чуть ниже GeForce RTX 2080, однако в ряде игр обгоняет его в разрешениях 2.5К и 4К. К сожалению, объявленная AMD цена на новинку сильно портит картину, при текущем ценовом раскладе привлекательность Radeon VII невысока. Да, разумеется, у него 16 ГБ видеопамяти (против 8 ГБ у GeForce RTX 2080), но сейчас практически все игры довольствуются объемом 8 ГБ, даже 11 ГБ у GeForce RTX 2080 Ti и GeForce GTX 1080 Ti являются избыточными, и в ближайшие пару лет наличие 8 ГБ памяти вряд ли станет «удавкой» даже для топовых ускорителей.

Второй (после цены) минус новинки — это очень шумная и малоэффективная система охлаждения. Снова повторим, что мотивы инженеров, выпустивших карту с таким кулером, совершенно непонятны. Они не тестировали эту СО в реальности? Или решили, что сильным гулом современного игрока не напугать? В общем, очень странное решение, а партнеры AMD, к сожалению, пока не планируют выпускать Radeon VII с собственным дизайном PCB и систем охлаждения.

Radeon VII интересен как первенец техпроцесса 7 нм. И если бы в AMD не решили, что новый ускоритель будет продаваться чуть дороже, чем чуть более быстрое решение Nvidia, то его, наверное, ждал бы определенный успех (насколько это слово вообще применимо к топовым ускорителям с их крохотными тиражами). Но при текущих раскладах надежды нет и на это. А вот если найти применение такой видеокарте не в играх, а в вычислительных процессах, рабочих станциях, то здесь картина может кардинально поменяться. Новый GPU обеспечивает отличную производительность не только в играх, но и в пакетах 3D-графики, видеоредактирования и других сложных вычислительных задачах. В том числе для этого в Vega 20 оставили лишь вчетверо меньший темп исполнения операций с двойной точностью FP64 (по сравнению с FP32), тогда как у предыдущих решений компании, не относящихся к профессиональным, он был в 16 раз меньше.

Также Radeon VII имеет вдвое больший объем видеопамяти по сравнению с видеокартами семейства Vega первого поколения, что важно в тех же профессиональных приложениях (и некоторых современных играх при максимальных настройках), и обеспечивает более чем вдвое более широкую полосу пропускания памяти, что также полезно для требовательных задач. За счет этого Radeon VII позволяет выставить максимальные настройки графики в играх при любых поддерживаемых разрешениях, вплоть до 8K, а в профессиональном ПО для создания контента повышенный объем видеопамяти обеспечит приличный прирост производительности при редактировании видео сверхвысокого разрешения и снизит время рендеринга самых сложных сцен. Для этих задач GPU получился довольно привлекательным.

Компания AMD в любом случае вернулась в бой в верхнем ценовом сегменте, и это не может не радовать. Будем надеяться, что изрядно затянувшаяся передышка с выжиманием последних соков из GCN вскоре выльется во что-то значительно более конкурентоспособное. Нужно еще посмотреть на следующий шаг компании — Navi. Настораживает, что это должна быть все та же GCN, но мы надеемся, что хотя бы вопрос энергоэффективности в следующей серии графических решений AMD будет решен, иначе конкурировать им будет очень непросто.

Благодарим компанию AMD Russia
и лично Ивана Мазнева
за предоставленную на тестирование видеокарту

Для тестового стенда:
блок питания Seasonic Prime 1000 W Titanium предоставлен компанией Seasonic

4 марта 2019 Г.