Справочная информация по семейству видеокарт AMD Radeon (2019)

Предыдущие поколения видеокарт AMD Radeon

Спецификации графических процессоров Radeon выпуска 2019 года

Кодовое имя Vega 20 Navi 10
Базовая статья здесь здесь
Технология (нм) 7
Транзисторов (млрд) 13,2 10,3
Площадь ядра (мм²) 331 251
Универсальных процессоров 4096 2560
Текстурных блоков 256 160
Блоков блендинга 64 64
Шина памяти 4096 256
Типы памяти HBM2 GDDR6
Системная шина PCI Express 4.0 PCI Express 3.0
Интерфейсы DVI Dual-Link
HDMI 2.0b
DisplayPort 1.4

Спецификации референсных карт Radeon выпуска 2019 года

Карта Чип Блоков ALU/TMU/ROP Частота ядра, МГц Эффективная частота памяти, МГц Объем памяти, ГБ ПСП, ГБ/c
(бит)
Текстури­рование, Гтекс Филлрейт, Гпикс TDP, Вт
Radeon VII Vega 20 3840/240/64 1247(1546) 2000 16 HBM2 1024 (4096) 432 115 300
Radeon RX 5700 XT Navi 10 2560/160/64 1605(1905) 14000 8 GDDR6 448 (256) 305 122 225
Radeon RX 5700 Navi 10 2304/144/64 1465(1725) 14000 8 GDDR6 448 (256) 248 110 180

Графический ускоритель Radeon VII

2018 год для графического подразделения компании AMD получился довольно спокойным. Они уже не первый год занимаются сравнительно небольшими модификациями весьма удачной для своего времени архитектуры GCN, но в 2016 году запустили новую линейку Polaris, а в 2017 — Vega. В 2018 же году компания AMD выпустила разве что мобильные версии Vega и очередное обновление топа линейки Polaris в виде Radeon RX 590. Куда более интересными были новые серверные продукты Radeon Instinct MI50 и MI60, ставшие первенцами индустрии в деле освоения техпроцесса 7 нм.

Выход новой игровой видеокарты в начале года — довольно редкое событие, но в компании решили представить новую топовую модель Radeon VII именно на шоу CES 2019 в январе. Естественно, совершенно новый GPU они бы разработать не успели, так что новинка основана на серверном решении, которое используется в линейке Radeon Instinct. Что же нового в «седьмом» Radeon? GPU под кодовым именем Vega 20 очень похож на своего предшественника Vega 10, который был улучшен для повышения конкурентоспособности решений компании, предназначенных для рынка научных вычислений и машинного обучения.

Чуть ли не самым важным в этом графическом процессоре является то, что он произведен по новейшему техпроцессу 7 нм компании TSMC, что позволило AMD немного увеличить сложность чипа, повысить его производительность, а главное — улучшить энергоэффективность. Вполне вероятно, что себестоимость производства нового GPU не позволяла выпустить новинку на рынок игровых решений ранее, но так как конкурент выпустил целую новую линейку видеокарт, то нужно было ответить хоть чем-то.

И поскольку линейка Nvidia GeForce RTX поначалу отличалась сравнительно высокими ценами, то AMD смогла позволить себе выпустить на игровой рынок GPU с немалой себестоимостью и получать хоть какую-то прибыль даже с такого сложного и дорогого в производстве решения, изначально предназначенного для серверного рынка. Неудивительно, что в AMD решили назначить на Radeon VII такую же цену, как у прямого конкурента — GeForce RTX 2080.

Графический ускоритель Radeon VII
Кодовое имя чипа Vega 20 (улучшенный Vega 10)
Технология производства 7 нм (для Vega 10 — 14 нм)
Количество транзисторов 13,2 млрд (у Vega 10 — 12,5 млрд)
Площадь ядра 331 мм² (у Vega 10 — 495 мм²)
Архитектура унифицированная, с массивом процессоров для потоковой обработки любых видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectX DirectX 12, с поддержкой уровня возможностей Feature Level 12_1
Шина памяти 4096-битная (у Vega 10 — 2048-битная) шина памяти с поддержкой стандарта High Bandwidth Memory второго поколения
Частота процессора (базовая/турбо/пиковая) 1400/1750/1800 МГц (у Vega 10 —1274/1546/1630 МГц)
Вычислительные блоки 64 вычислительных блока GCN (активных из них 60), состоящих в целом из 4096 ALU (активных 3840) для расчетов с плавающей запятой (поддерживаются целочисленные и плавающие форматы INT4, INT8, INT16, FP16, FP32 и FP64)
Блоки текстурирования 256 блоков (240 активных) текстурной адресации и фильтрации с поддержкой FP16/FP32-компонент и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
Блоки растровых операций (ROP) 64 блока ROP с поддержкой режимов сглаживания с возможностью программируемой выборки более чем 16 сэмплов на пиксель, в том числе при FP16- или FP32-формате буфера кадра.
Поддержка мониторов поддержка до шести мониторов, подключенных по интерфейсам DVI, HDMI 2.0b и DisplayPort 1.4
Спецификации референсной видеокарты Radeon VII
Частота ядра 1400/1750/1800 МГц
Количество универсальных процессоров 3840
Количество текстурных блоков 240
Количество блоков блендинга 64
Эффективная частота памяти 2000 МГц
Тип памяти HBM2
Шина памяти 4096-бит
Объем памяти 16 ГБ
Пропускная способность памяти 1 ТБ/с
Вычислительная производительность (FP16) до 27,6 терафлопс
Вычислительная производительность (FP32) до 13,8 терафлопс
Вычислительная производительность (FP64) до 3,5 терафлопс
Теоретическая максимальная скорость закраски 115 гигапикселей/с
Теоретическая скорость выборки текстур 432 гигатекселя/с
Шина PCI Express 3.0
Разъемы один HDMI и три DisplayPort
Энергопотребление до 300 Вт (у RX Vega 64 — 295 Вт)
Дополнительное питание два 8-контактных разъема
Число слотов, занимаемых в системном корпусе 2
Рекомендуемая цена $699

Название этой модели видеокарты AMD не соответствует принятой системе наименований. Модель имеет имя собственное, но в этот раз — римскую цифру после названия семейства Radeon, которая означает... да мало ли что она может означать. Или Vega II, или намек на использование техпроцесса 7 нм. В общем, типичное маркетинговое название. Начальные буквы RX из наименования также исчезли, хотя и в ранних Radeon RX Vega они есть, и в более новых RX 5700 остались.

Модель Radeon VII во время её выхода заняла в текущей линейке компании место топового решения, и ее рекомендованная цена говорила о том, что главным конкурентом видеокарты на рынке является GeForce RTX 2080, имеющая ровно такую же цену.

Референсный вариант Radeon VII имеет обычный воздушный кулер открытого типа. Внешний вид корпуса сделан в стиле угловатого металлического бруска, который известен со времен модификаций Vega 64 Limited Edition и Liquid, но теперь применяется схема с тремя вентиляторами, привычная по множеству решений различных производителей видеокарт. Естественно, столь мощная система охлаждения важна для видеокарты с потреблением аж в 300 Вт. Хотя это лишь на 5 Вт больше, чем у RX Vega 64, но и сам кристалл GPU стал меньшего размера и к площади добавились еще два стека HBM2-памяти.

Эталонный вариант видеокарты Radeon VII имеет три видеовыхода DisplayPort и один HDMI. По поддержке стандартов вывода никаких изменений в Vega 20 нет. По понятным причинам, видеокарты Radeon VII существуют исключительно в версии с 16 ГБ памяти, что было обусловлено изначальным профессиональным применением Vega 20.

Для дополнительного питания референсная плата использует два 8-контактных разъема, и значение типичного энергопотребления для модели Radeon VII установлено на уровне 300 Вт, что лишь чуть больше, чем у Vega 64. С одной стороны, два разъема питания будут полезны при разгоне, с другой — как бы не получилось так, что по уровню потребления энергии Radeon VII недалеко ушла от Vega 64 при всех преимуществах нового техпроцесса...

Видеокарты модели Radeon VII продавались исключительно в референсном виде несколькими партнерами компании. Чтобы дополнительно привлечь игроков, в комплекте с новой топовой видеокартой предлагалось сразу три современные игры (две из которых еще даже не вышли): Devil May Cry 5, The Division 2 и Resident Evil 2. Конкурент в лице GeForce RTX 2080 предлагал свой комплект: Anthem, Battlefield V и Metro Exodus, и выбор из них — дело вкуса.

Архитектурные особенности

Графический процессор Vega 20 основан на архитектуре GCN 5, и это почти тот же Vega 10, но с несколькими изменениями, ориентированными на серверные вычисления. Если совсем вкратце, то Vega 20 — это чуть улучшенный Vega 10 архитектуры GCN, произведенный при помощи техпроцесса 7 нм. Благодаря более совершенной технологии производства, 13,2 млрд транзисторов поместились в чип площадью 331 мм², хотя 12,5 млрд транзисторов Vega 10 занимали куда большую площадь в 495 мм².

При переходе производителей GPU на новый техпроцесс часто увеличивается количество исполнительных блоков, поднимающих производительность более нового чипа. В случае Vega 20 разработчики решили обойтись почти неизменным чипом, но со сниженным энергопотреблением и повышенной частотой. В случае с не до конца отлаженным техпроцессом это решение логично, ведь производство столь сложных чипов на ранней стадии жизни техпроцесса слишком рискованно и означает низкий выход годных чипов, а увеличение площади кристалла приведет к слишком большому росту брака. До сих пор на техпроцессе 7 нм у TSMC массово производились только сравнительно небольшие мобильные однокристальные системы, а кристалл Vega 20 куда более сложен.

Давайте наглядно сравним площади чипов семейства Vega двух разных поколений: предыдущего с площадью 495 мм² и нового, уместившегося в 331 мм² благодаря самому совершенному на сегодняшний день техпроцессу:

Именно это снижение размеров кристалла позволило сэкономить место на чипе для того, чтобы поместить на подложку-интерпозер схожего размера еще два стека HBM2-памяти, что привело к росту объема локальной видеопамяти до 16 ГБ. Это не первый GPU компании с таким объемом, был уже вариант Radeon Vega Frontier Edition, но Radeon VII является несколько более массовым вариантом.

Удвоенный объем локальной видеопамяти вместе с удвоенной пропускной способностью стали, пожалуй, самым большим изменением в Radeon VII по сравнению с RX Vega 64. Кроме размещения не двух, а четырех стеков HBM2-памяти на интерпозере, также была немного увеличена и частота работы микросхем памяти. Естественно, все это делалось, в основном, для серверных продуктов, ведь в игровых видеокартах такие объемы памяти и ПСП вряд ли актуальны до сих пор.

Наличие 16 ГБ в игровой видеокарте сейчас не является таким уж явным преимуществом: в абсолютном большинстве игр даже при максимальных (без бессмысленного повышения внутреннего разрешения рендеринга до 8К) настройках вполне хватает и 8 ГБ. В консолях большего объема памяти просто нет, так что все мультиплатформенные проекты в таком объеме VRAM не нуждаются, да и ПК-разработчики также не ориентируются на GPU с 16 ГБ по причине их крайней редкости.

Но нужно понимать, что Vega 20 предназначена прежде всего для профессиональной сферы, а там такой объем видеопамяти уже вполне востребован. Более того, даже в варианте Radeon VII он может быть полезен в приложениях по созданию контента, например при обработке видео и в 3D-рендеринге. В таких задачах имеющиеся 16 ГБ будут поглощены с легкостью. Ну, и для игровых применений запас по объему памяти вполне может греть душу, как минимум. Да и с маркетинговой точки зрения 16 всегда лучше, чем 8 или даже 11.

Если говорить о самом кристалле, то графический процессор Vega 20 относится к пятому поколению архитектуры Graphics Core Next, базовым ее блоком является вычислительный блок Compute Unit (CU), из которых собраны все графические процессоры AMD. Блок CU имеет выделенное локальное хранилище данных для обмена данными или расширения локального регистрового стека, а также кэш-память первого уровня с возможностью чтения и записи и полноценный текстурный конвейер с блоками выборки и фильтрации, он разделен на подразделы, каждый из которых работает над своим потоком команд. Каждый из таких блоков самостоятельно занимается планированием и распределением работы.

На архитектурном уровне графический процессор Vega 20 — это практически полная копия Vega 10 с некоторыми улучшениями и увеличенным количеством контроллеров памяти. Все остальные блоки чипа остались в том же количестве (физически; некоторые из них были отключены конкретно в модели Radeon VII), GPU содержит 64 CU и 256 текстурных модулей (активными из них остались 60 CU и 240 TMU), размещенных в четырех шейдерных движках, также имеется 64 блока ROP и один командный процессор. В итоге, всего в составе активных вычислительных блоков находится 3840 потоковых процессоров (в Vega 64 их 4096) и 240 текстурных блоков (против 256 в Vega 64).

Есть в чипе Vega 20 некоторые улучшения и изменения, направленные на повышение производительности. Одним из них является удвоенная ПСП: каждому исполнительному блоку теперь доступна вдвое более высокая скорость обмена с памятью. С другой стороны, количество блоков ROP в GPU осталось прежним, и поэтому в ограниченных скоростью заполнения играх особого прироста производительности нет. Зато повышенная ПСП полезна для вычислительных задач.

Получается, что между Vega 20 и Vega 10 не так много отличий, и у новинки даже чуть меньше активных вычислительных блоков. Однако для Radeon VII заявлена пиковая тактовая частота в 1800 МГц, хотя официальная турбо-частота несколько ниже: 1750 МГц. Напомним, что у Radeon RX Vega 64 пиковая частота равна 1630 МГц, а кроме того, новый Radeon VII способен дольше работать на более высокой частоте, поддерживая ее чаще, чем предшествующая модель. Так что новинка должна быть в целом явно побыстрее Vega 64.

Поговорим о более явных улучшениях, среди которых — нескольких новых инструкций и типов данных для ускорения задач машинного обучения. Особых деталей AMD публике не выдает, но в Vega 20 они добавили типы данных INT8 и INT4, востребованные в некоторых задачах глубокого обучения, не требующих высокой точности вычислений. Также к возможностям нового GPU добавлена новая инструкция FP16 dot product, предназначенная для алгоритмов глубокого обучения, которая накапливает результат в формате FP32 — с большей точностью по сравнению с типичной инструкцией FP16 dot product.

Еще одно очень важное изменение для серверных процессоров — увеличение производительности вычислений с двойной точностью, FP64. Архитектура GCN позволяет варьировать производительность FP64 от 1/2 до 1/16 темпа FP32-вычислений, и для игровых решений это значение всегда было самым низким, 1/16, а все серверные GPU имели половинный темп вычислений. В Vega 20 этот темп максимален — 1/2 от FP32 для FP64. И если по FP32-производительности новый чип не сильно быстрее Vega 10, то по операциям с двойной точностью увеличение производительности уже более 8 раз.

Но это касается профессиональных решений, а в Radeon VII ожидали те же 1/16. Однако AMD и тут решила дать пользователям новые возможности, ограничив скорость FP64 для видеокарты Radeon VII на уровне 1/4 от скорости FP32, что может быть востребовано для многих серьезных вычислительных применений. Конечно, обеспеченные профессионалы в любом случае предпочтут Radeon Instinct, но в ряде задач вполне можно будет обойтись и игровым Radeon VII.

По спецификациям Radeon VII соответствует серверной модели Radeon Instinct MI50, но чтобы продажи игрового GPU не ударили по более серьезному рынку, в AMD решили слегка ограничить вычислительные возможности Vega 20 искусственным образом, не только снизив производительность вычислений с двойной точностью (FP64), но и отключив поддержку коррекции ошибок ECC для чипа. Впрочем, для части полу- и профессиональных применений Radeon VII все равно подходит куда лучше других игровых GPU.

И пусть Radeon VII не так быстр в FP64-вычислениях, как Radeon Instinct MI60 и MI50, но 3,5 терафлопс дают новой модели большое преимущество в определенных задачах, использующих именно такую точность вычислений. И на момент выхода у новинки не было конкурентов в этом смысле, все Nvidia GeForce и остальные AMD Radeon имеют крайне низкую FP64-производительность, а Titan V стоит вчетверо дороже. Конечно, мы говорим о маленькой нише на большом рынке, но некоторые исследователи точно обрадовались.

Для разделения рынков Radeon VII также был ограничен по возможностям внешних связей. Технически, Vega 20 имеет поддержку PCI Express 4.0 (к слову, это в принципе первый GPU с поддержкой новой версии PCIe), но лишь в вариантах Radeon Instinct, а работа Radeon VII ограничена скоростями PCI Express 3.0. То же самое касается возможностей внешних линков Infinity Fabric для многочиповых конфигураций: в Instinct они есть, а в Radeon VII отключены. Также новинка не поддерживает привычный CrossFire — только работу многочиповых систем в пределах возможностей DirectX 12 и Vulkan, для чего нужна поддержка со стороны разработчиков игровых приложений.

Абсолютно все остальные функциональные возможности Vega 10 поддерживаются и новым GPU, включая удвоенный темп для FP16-инструкций (используется в Far Cry 5 и Wolfenstein II, если говорить об играх), Draw Stream Binning Rasterizer (DSBR) и так и не заработавшие в реальности шейдеры примитивов (primitive shaders), требующие поддержки как со стороны драйверов, так и игровых разработчиков. С точки зрения поддержки устройств вывода и видеокодирования и декодирования, в Vega 20 изменений тоже практически нет: технически, блоки вроде бы обновились, но никаких новых возможностей по сравнению с Vega 10 у них не появилось.

Зато была улучшена работа с отслеживанием температуры всего GPU. По заявлениям AMD, в новом чипе содержится вдвое большее количество температурных датчиков — уже 64 штуки. Это позволяет точно контролировать температуру всего чипа, а не только в каких-то областях, и с несколько большей точностью. Одно это изменение привело к дополнительному приросту на 1%-2% в производительности за счет меньшего времени работы графического процессора в режиме тротлинга. Данные с температурных датчиков и GPU теперь считываются иным образом и требуют обновления соответствующего ПО для поддержки новых вызовов API AMD.

Со всеми остальными возможностями чипов семейства Vega, которые в Radeon VII ничуть не изменились, вы можете познакомиться в базовом обзоре видеокарты Radeon RX Vega 64, там они описаны во всех подробностях.

Оценка производительности и выводы

Сравним характеристики нескольких моделей видеокарт AMD, включив в таблицу два варианта игровых решений на разных поколениях чипа Vega и самую лучшую видеокарту семейства Polaris:

  Radeon VII Radeon RX Vega 64 AMD Radeon RX 590
Техпроцесс TSMC, 7 нм GloFo, 14 нм GloFo, 12 нм
Кодовое наименование GPU Vega 20 Vega 10 Polaris 30
Архитектура GCN 5 GCN 5 GCN 4
Количество транзисторов, млрд 13,2 12,5 5,7
Площадь кристалла, мм² 331 495 232
Количество блоков ALU 3840 4096 2304
Количество блоков TMU 240 256 144
Количество блоков ROP 64 64 32
Базовая частота, МГц 1400 1247 1469
Турбо-частота, МГц 1750 1546 1545
Частота видеопамяти, МГц 2000 1890 8000
Ширина шины видеопамяти, бит 4096 2048 256
Объем видеопамяти, ГБ 16 8 8
Производительность FP32, TFLOPS 13,8 12,7 7,1
Производительность FP64, TFLOPS 3,5 0,8 0,4
Энергопотребление, Вт 300 295 225
Рекомендованная цена, $ 699 499 279

Из таблицы видно, что сегодняшняя новинка по теоретической пиковой производительности отличается от Vega 64 не так уж сильно. В явных преимуществах у нее больший объем памяти и ПСП, а вот производительность вроде бы не должна сильно отличаться. При этом в теории Radeon VII до двух раз быстрее Radeon RX 590.

Если говорить о данных самой компании AMD, то по игровой производительности новая модель Radeon VII практически во всех современных играх дает значительный прирост частоты кадров по сравнению с предыдущими продуктами компании из этого рыночного сегмента, да и по сравнению с конкурирующими продуктами предыдущего поколения новинка смотрится довольно неплохо. Вот диаграмма игровой производительности Radeon VII по сравнению с Radeon RX Vega 64 и GeForce GTX 1080:

Как видите, по измерениям специалистов из AMD, их новое детище опережает как предыдущую модель этой же компании, так и ее давнего конкурента. По этим данным, Radeon VII оказалась значительно быстрее парочки представителей GPU прошлых лет, но зачем сравнивать новинку с устаревшими видеокартами? А что получится, если сравнить рассматриваемый сегодня продукт со свежим конкурентом в виде GeForce RTX 2080, который продается по той же цене?

Судя по измерениям, проведенным в широком наборе самых популярных игровых приложений, хорошо подготовленный для высоких разрешений Radeon VII смотрится очень неплохо по сравнению с прямым конкурентом GeForce RTX 2080, как минимум при использовании 4K-разрешения. Да, кое-где новинка уступает видеокарте Nvidia, но в других играх значительно опережает, а в среднем они где-то на одном уровне.

Напомним ещё один важный момент: Radeon VII предназначен не только для любителей игр, но и для любителей и профессионалов, занимающихся созданием цифрового контента в 3D-пакетах и ПО для видеоредактирования, научными вычислениями и так далее. К примеру, в Blender (это популярное ПО для рендеринга, использующее возможности GPU AMD при помощи плагина Radeon ProRender), а также DaVinci Resolve и Adobe Premiere (это ПО для редактирования видеороликов, их цветокоррекции и наложения визуальных эффектов) в сложных задачах типа редактирования 4K- и 8K-видео используется более восьми гигабайт видеопамяти, и Radeon VII здесь раскрывает свои возможности, опережая Vega 64 примерно на 25%-30% и показывая производительность примерно на уровне GeForce RTX 2080 или даже выше.

Довольно важным преимуществом Radeon VII в этих случаях является наличие 16 ГБ сверхбыстрой HBM2-памяти с шириной шины в 4096-бит и пропускной способностью в 1 ТБ/с. И для современных игр при максимальных настройках графики и ультравысоких разрешениях рендеринга это может быть полезно. Так, рекомендуемые требования к объему видеопамяти у популярной серии игр Battlefield менее чем за десяток лет выросли с 0,5-1 ГБ в 2010—2011 гг. до 6-8 ГБ для последней игры серии — Battlefield V.

Замеры специалистов компании AMD, проведенные с использованием такого ПО, как MSI Afterburner и Windows Task Manager, показали, что популярные игровые и профессиональные приложения в разрешении 4K и выше используют больше 8 ГБ видеопамяти, имеющихся в наличии у большинства решений ценового диапазона, в котором выступает Radeon VII, вроде ее прямого конкурента — GeForce RTX 2080.

Так, при редактировании видеороликов высокого разрешения в Adobe Premiere используется 10—12 ГБ видеопамяти, а в играх иногда отмечается использование 11—13 ГБ локальной памяти GPU. Другое дело, что большие цифры объема используемой памяти вовсе не говорят о том, что объема 8 ГБ будет недостаточно: современные игры зачастую используют стриминг текстур и других ресурсов и просто забивают данными максимально возможный объем памяти, пока она есть в наличии. То есть если при 16 ГБ у Radeon VII будет использоваться 11—12 ГБ, то на GeForce RTX 2080 может вполне хватать и 8 ГБ. Сам по себе объем занятой VRAM мало что значит.

Впрочем, при достаточно высоком FPS также есть вероятность того, что при нехватке видеопамяти на GPU с меньшим ее объемом будут наблюдаться неприятные рывки при подгрузке данных из ОЗУ, тогда как Radeon VII предоставит их быстрее — уже загруженными в быструю видеопамять. Такая ситуация показана на диаграмме времени рендеринга кадров:

Сравнение данных Radeon VII и GeForce RTX 2080 показывает, что с видеокартой AMD наблюдается гораздо меньше подгрузок данных, когда частота кадров падает до неприятных притормаживаний, и игровой процесс в целом достаточно плавный, а вот GeForce при нехватке локальной видеопамяти частенько лезет за не поместившимися в видеопамять данными в ОЗУ, что вызывает некомфортные подергивания картинки (зеленые пики на графике).

Такое поведение разных видеокарт не будет видно по средним значениям частоты кадров, но даже при беглом взгляде на диаграмму времени отрисовки кадров оно сразу становится очевидно. По данным AMD, их видеокарты справляются с задачей обеспечения плавности лучше конкурента, но чтобы подтвердить это, нужно проводить отдельное серьезное исследование. В любом случае, больше видеопамяти точно лучше, чем меньше.

Увы, но жизненный путь Radeon VII оказался недолгим — после выхода пары видеокарт Radeon RX 5700 (XT) она постепенно была выведена с рынка. Выпускалась эта видеокарта не слишком большими партиями, была не слишком сильно востребована и являлась скорее имиджевым решением. Тем более — стала первой, основанной на 7 нм графическом процессоре.

Графические ускорители Radeon RX 5700 (XT)

В июне 2019 года, во время игровой выставки E3, компания AMD сделала несколько анонсов, включающих центральные процессоры Ryzen на базе новой архитектуры Zen 2, а также новое семейство видеокарт Radeon RX 5700 также созданное на основе новой архитектуры — RDNA. Компания показывала эти продукты еще раньше, на Computex, но полноценный запуск был назначен на 7 июля (07.07) — дату, перекликающуюся с техпроцессом 7 нм, применяемым при производстве всех новинок компании.

Пусть на рынке дискретных GPU для ПК компания AMD не является лидером, но если брать распространение продукции этой компании в целом, то их графические решения применяются не только в значительной части ПК и ноутбуков, но и в игровых консолях (вообще всех основных, включая консоли грядущего поколения, которые будут основаны на улучшенных Zen 2 и Navi), облачных сервисах (Google Stadia) и мобильных решениях (соглашение с Samsung). Общее количество продуктов AMD, используемое по всему миру, составляет более 400 миллионов штук.

Компания задумала закрепить свой успех выпуском настольных CPU и GPU, созданных с применением самого совершенного на сегодня технологического процесса 7 нм, позволяющего поместить больше транзисторов в чип той же площади, увеличить рабочие частоты и повысить энергоэффективность. Но это не единственная их особенность, в новых продуктах компании AMD используются улучшенные архитектуры Zen 2 и RDNA.

Новейшие графические решения AMD на чипе Navi 10 включают пару видеокарт, предназначенных для верхнего-среднего ценового диапазона, которые заменяют модели RX Vega 64 и Vega 56 в линейке компании, предлагая схожую производительность и лучшую энергоэффективность за меньшие деньги. Пока что в новой линейке не представлены топовые модели — вероятно, что-то более мощное появится несколько позже, а пока что было решено сконцентрироваться на самой большой части рынка энтузиастов.

Представленные видеокарты компании AMD стали первыми решениями, основанными на новой архитектуре RDNA (Radeon DNA), которая хоть и связана с GCN, но претерпела довольно значительные изменения. Основной целью при создании новой архитектуры было увеличение эффективности использования имеющихся вычислительных блоков, а также повышение энергоэффективности, по сравнению с GCN. Также очень важна и возможность масштабирования от мобильных решений (недавно было заявлено о сотрудничестве с компанией Samsung о применении RDNA в их будущих продуктах) до серверов и суперкомпьютеров, ведь эта архитектура станет основой для будущих решений компании, предназначенных для разных рынков.

Долгожданный графический процессор Navi вышел на рынок несколько позже, чем его ожидали пользователи, и со времени начала разговоров о полностью новом GPU компании AMD на 7 нм прошло уже очень много времени. Почему новинки должны быть особенно интересны именно сейчас? Как обычно в таких случаях, производитель говорит об актуальности апгрейда. Ведь порядка 70% игроков до сих пор используют устаревшие видеокарты трехлетней давности и даже старше, а наиболее популярные GPU предназначены для Full HD-разрешения.

В то же время, современные игры становятся все более требовательными, и для достижения 60 FPS и выше в них приходится снижать настройки графики даже на таких мощных видеокартах, как Radeon RX Vega 56, которую и заменяет младшее решение новой линейки. А многие пользователи переходят с Full HD-разрешения к более продвинутому 2560×1440. Соответственно, по мнению специалистов компании AMD, 2019 год — самое время для апгрейда на видеокарты из новой линейки Radeon RX 5700, которая предназначена для тех, кто планирует использовать монитор с разрешением в 2560×1440 пикселей.

Графические ускорители серии Radeon RX 5700
Кодовое имя чипа Navi 10
Технология производства 7 нм
Количество транзисторов 10,3 млрд
Площадь ядра 251 мм²
Архитектура унифицированная, с массивом процессоров для потоковой обработки любых видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectX DirectX 12, с поддержкой уровня возможностей Feature Level 12_1
Шина памяти 256-битная шина памяти с поддержкой стандарта GDDR6
Частота процессора (базовая/игровая/пиковая) 1605/1755/1905 МГц
Вычислительные блоки 40 вычислительных блоков CU, состоящих в целом из 2560 ALU для целочисленных расчетов и расчетов с плавающей запятой (поддерживаются форматы INT4, INT8, INT16, FP16, FP32 и FP64)
Блоки текстурирования 160 блоков текстурной адресации и фильтрации с поддержкой FP16/FP32-компонент и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
Блоки растровых операций (ROP) 64 блока ROP с поддержкой режимов сглаживания с возможностью программируемой выборки более чем 16 сэмплов на пиксель, в том числе при FP16- или FP32-формате буфера кадра.
Поддержка мониторов поддержка до шести мониторов, подключенных по интерфейсам DVI, HDMI 2.0b и DisplayPort 1.4
Спецификации референсной видеокарты Radeon RX 5700 XT
Частота ядра (базовая/игровая/пиковая) 1605/1755/1905 МГц
Количество универсальных процессоров 2560
Количество текстурных блоков 160
Количество блоков блендинга 64
Эффективная частота памяти 14 ГГц
Тип памяти GDDR6
Шина памяти 256-бит
Объем памяти 8 ГБ
Пропускная способность памяти 448 ГБ/с
Вычислительная производительность (FP16) до 19,5 терафлопс
Вычислительная производительность (FP32) до 9,7 терафлопс
Теоретическая максимальная скорость закраски 122 гигапикселя/с
Теоретическая скорость выборки текстур 305 гигатекселей/с
Шина PCI Express 4.0
Разъемы один HDMI и три DisplayPort
Энергопотребление до 225 Вт
Дополнительное питание 8-контактный и 6-контактный разъемы
Число слотов, занимаемых в системном корпусе 2
Рекомендуемая цена $399 (29 499 руб.)
Спецификации референсной видеокарты Radeon RX 5700
Частота ядра (базовая/игровая/пиковая) 1465/1625/1725 МГц
Количество универсальных процессоров 2304
Количество текстурных блоков 144
Количество блоков блендинга 64
Эффективная частота памяти 14 ГГц
Тип памяти GDDR6
Шина памяти 256-бит
Объем памяти 8 ГБ
Пропускная способность памяти 448 ГБ/с
Вычислительная производительность (FP16) до 15,9 терафлопс
Вычислительная производительность (FP32) до 7,9 терафлопс
Теоретическая максимальная скорость закраски 110 гигапикселей/с
Теоретическая скорость выборки текстур 248 гигатекселей/с
Шина PCI Express 4.0
Разъемы один HDMI и три DisplayPort
Энергопотребление до 180 Вт
Дополнительное питание 8-контактный и 6-контактный разъемы
Число слотов, занимаемых в системном корпусе 2
Рекомендуемая цена $349 (25 499 руб.)

В очередной раз изменилась система наименований видеокарт AMD. Вместо трех цифрах в RX 6xx они решили перейти к четырем цифрам и старому доброму суффиксу XT. При этом, и начальные буквы RX из наименования не исчезли. AMD запустила в продажу две модели новой серии: Radeon RX 5700 XT — на полноценной версии GPU, и немного урезанную по скорости Radeon RX 5700. Старшая модель RX 5700 XT имеет 40 вычислительных блоков CU и работает на частоте до 1,9 ГГц, а в младшей RX 5700 деактивированы четыре CU (10%) и GPU работает на более скромной частоте — заодно таким образом будут продаваться те чипы, которые не могут работать в полноценной конфигурации.

Видеокарты серии Radeon 5700 стали долгожданным дополнением линейки компании AMD, они заменяют все виды линейки Vega, будучи быстрее и эффективнее. Что касается цены, то изначально на RX 5700 XT выставили цену в $449, а на младшую 5700 — $379, так как конкурентами новинок, по мнению AMD, являются видеокарты GeForce RTX 2070 и RTX 2060 соответственно. Но Nvidia за несколько дней до выхода новинок нанесла превентивный удар, выпустив обновленную и ускоренную линейку Super, поэтому AMD пришлось чуть-чуть урезать свои аппетиты, и цены на новинки стали уже $399 и $349 соответственно.

И если изначально AMD предполагала, что 5700 XT за $449 будет конкурировать с RTX 2070 за $499, то после выхода улучшенной линейки карт Nvidia Super и снижения цен на «обычные» RTX им пришлось несколько понизить свои цены и ожидания, так как Super примерно на 10%-15% быстрее старых вариантов. С учетом того, что новинки, по тестам AMD, были чуть быстрее обычных вариантов RTX, такое снижение цен совершенно логично.

Платы Radeon RX 5700 XT и Radeon RX 5700 в референсном дизайне предлагают один разъем HDMI 2.0b и по три разъема DisplayPort 1.4 HDR c поддержкой технологии Display Stream Compression, позволяющей по одному кабелю подключать поддерживающие технологию HDR-мониторы с разрешением 4K и частотой развертки 144 Гц (или 8K HDR 60 Гц или 4K при 240 Гц).

Неудивительно, что для решений этого ценового диапазона в AMD решили отказаться от очень интересной, но весьма дорогой HBM2-памяти. Тем более, что уже получила широкое распространение быстрая GDDR6-память, ставшая логичным выбором для нового GPU. Да и объем видеопамяти в 8 ГБ кажется единственно правильным вариантом для этого ценового диапазона. 4 ГБ — уже слишком мало, а 16 ГБ — перебор, не имеющий никакого смысла для игровых решений.

Если говорить об энергопотреблении GPU, то потребление всей платой RX 5700 XT составляет 225 Вт, что аналогично Radeon RX 590 и близко к Vega 56. Для доставки необходимого питания, кроме слота PCI Express используются два дополнительных разъема питания: 8- и 6-контактный, позволяющие обеспечить подачу 225 Вт. Это довольно много для решения среднего уровня, тем более — с GPU, произведенным по самому совершенному на сегодня техпроцессу.

В отличие от обычной Radeon RX 5700, которая похожа скорее на Radeon VII, дизайн корпуса старшей модели XT был переделан, он имеет явную «вмятину» на одной из граней, которая смотрится довольно забавно. В остальном, это кулер того же стиля, что и во всех предыдущих продуктах компании на протяжении многих лет — с испарительной камерой, отводящей тепло от GPU к радиатору. Конечно, кулер оптимизирован по сравнению с его предшественниками, для достижения лучшего охлаждения и меньшего шума. Все равно в нестандартных видеокартах партнеров компании применяются другие решения.

Понятно, что при меньшем количестве активных исполнительных блоков, работающих на сниженной частоте (а наверняка еще и напряжении) в случае младшей Radeon RX 5700, ниже становится и потребление энергии. Действительно, младшая карта вместо 225 Вт потребляет уже всего 180 Вт, что сравнимо с потреблением RX 580, так что из пары новых GPU именно младшая должна стать более энергоэффективной, как это часто и бывает. К слову, обе видеокарты в референсном дизайне имеют 7-фазную систему питания, что должно обеспечить неплохие возможности по разгону.

Чтобы улучшить привлекательность новых решений для покупателей, AMD приготовила комплект с трехмесячной подпиской на сервис Microsoft Xbox Game Pass. Приобретающие видеокарты серии Radeon RX 5700 серии, процессоры Ryzen 3000 и другие продукты AMD у участвующих в акции продавцов, получат трехмесячный доступ к сервису Xbox Game Pass для ПК.

Также отметим, что ограниченным тиражом было выпущено и специальное юбилейное издание Radeon RX 5700 XT — в честь 50-летия компании. Эта модель получила увеличенные тактовые частоты и некоторые детали золотого цвета, а также автограф руководителя AMD — Лизы Су. Такая модель видеокарты предназначена для фанатов компании, она обойдется еще чуть дороже и найти ее будет сложнее.

Архитектурные особенности

Графический процессор Navi 10 основан на совершенно новой архитектуре RDNA которая была спроектирована для оптимального распределения загрузки исполнительных блоков графическими и вычислительными задачами, которых становится все больше в играх. Также была серьезно переработана система кэширования, снижены задержки, повышена пропускная способность и энергоэффективность многоуровневого кэша.

Хотя архитектура действительно новая, но базовые блоки в ней — это все те же вычислительные блоки Compute Unit (CU), из которых собраны все современные графические процессоры AMD. Каждый CU имеет выделенное локальное хранилище данных для обмена данными или расширения локального регистрового стека, а также кэш-память и полноценный текстурный конвейер с блоками выборки и фильтрации. Каждый из таких блоков самостоятельно занимается планированием и распределением работы. Рассмотрим схему полноценной версии чипа:

Как видите, архитектура RDNA хоть и действительно была серьезно переделана, но она унаследовала и некоторые элементы GCN. Полная версия Navi 10 содержит 40 вычислительных блоков нового дизайна, которые состоят из 2560 блоков ALU, 160 блоков TMU, 64 блоков ROP и четырех асинхронных вычислительных движков. Также новый GPU содержит процессор обработки геометрии с четырьмя блоками обработки примитивов.

Сразу видно, что в Navi исправили одну из слабостей предыдущих графических процессоров компании — относительное малое количество блоков растеризации, что вызывало в результате низкую скорость обработки геометрии и относительно большой урон производительности при включении мультисэмплинга. Теперь блоков ROP стало больше по отношению к ALU, и такие вещи, как заполнение геометрического буфера, карты теней и другие проходы растеризации будут осуществляться заметно быстрее.

Также претерпел довольно большие изменения и общий дизайн вычислительных блоков, хотя в общих чертах он и схож с тем, что было в GCN. По сравнению с предыдущими GPU, в Navi было удвоено количество скалярных блоков и блоков управления, скалярные инструкции могут исполняться каждый цикл, а не раз в четыре. Появился выделенный скалярный блок и выделенный блок выдачи инструкций, улучшена предвыборка.

Но главное — новые CU имеют два режима исполнения: Wave32 и Wave64, адаптированные для разных типов загрузок, а ширина блока SIMD была увеличена с 16 слотов (SIMD16) до 32 (SIMD32), так что размер вейвфронта теперь соответствует размеру SIMD. Это ключевое архитектурное изменение RDNA позволяет более эффективно загружать работой имеющиеся блоки SIMD. Если в GCN один Wave64 выполняется за четыре такта на SIMD16, то в случае RDNA один Wave32 исполняется за один же такт на одном SIMD32. А исполнение 64 потоков группируется как пара Wave32 и они исполняются на двух SIMD32. Два вычислительных блока Compute Unit могут работать как единый процессор (workgroup processor), это дает доступ к удвоенному количеству ALU и удвоенному регистровому файлу, а также до четырех раз увеличенной ПСП для кэша.

В AMD как бы разделили CU, перейдя на вейвфронты по 32 потоков. Такая организация помогает выполнять задачи эффективнее при незаполненном вейвфронте. Широкий вейвфронт в 64 потока хорош для параллельных неграфических вычислений, а для графики вейвфронт из 32 тредов упрощает задачу использования имеющихся ресурсов при шейдинге разных материалов. На чипах архитектуры GCN любой вейвфронт выполняется за четыре такта, а на RDNA за один такт при 32 элементах на одном SIMD или 64 элементов также за один такт, но уже на паре SIMD. Также в CU стало вдвое больше скалярных блоков и шедулеров. Все сделало RDNA несколько ближе к тому, что есть у Nvidia, и игровым программистам теперь будет проще оптимизировать под AMD и Nvidia одновременно. С другой стороны, довольно большое количество существующих оптимизаций под GCN и его асинхронные вычисления могут перестать работать с той же эффективностью.

В RDNA появилась возможность параллельного запуска и обработки нескольких независимых инструкций за один такт, что дает некоторый прирост по эффективности исполнения, хотя и не слишком большой. У конкурента еще в старых GPU можно было параллельно выполнять и математические инструкции и операции по сохранению и загрузке (load/store), но затем оставили только параллельное исполнение математики и load/store. В последних же поколениях, начиная с Volta, куда большая эффективность достигается удвоением темпа исполнения инструкций и независимыми блоками для обработки целочисленных данных и данных с плавающей запятой, а также load/store блоками. У AMD такого (пока что) нет.

Так как вычислительные блоки СU в Navi довольно сильно переработаны, то к качеству оптимизации драйверов и компилятора шейдеров предъявляются повышенные требования. Вполне возможно, что привычные простые порты с консольных GCN уже не будут оптимально подходить для новой архитектуры RDNA, и программистам AMD пришлось переделывать компилятор, и они еще будут оптимизировать его для новой архитектуры какое-то время.

Хотя разница между GCN и RDNA есть, но архитектуры явно родственные. Преимущества в новом распределении и исполнении инструкций привели к увеличению загрузки имеющихся в GPU блоков — если в GCN часть ALU простаивали, то в RDNA часть задержек маскируется возможностью многопоточного исполнения. RDNA получается несколько ближе к решениям Nvidia по универсальности, но для нее придется иначе оптимизировать код, а не как для GCN, и раскрытие возможностей может быть постепенным.

Кроме того, что был повышен темп исполнения инструкций вычислительными процессорами, также увеличили и эффективность кэширования. Была изменена иерархия уровней кэш-памяти, добавлена кэш-память первого уровня общим объемом в 512 КБ, удвоена пропускная способность между вычислительными блоками и L0-кэшем, а объем L2-кэша стал больше — 4 МБ на чип (как у конкурирующей GeForce RTX 2060).

Уменьшение задержек кэш-памяти на каждом уровне составило более чем 20%, а задержка доступа к данным из видеопамяти была снижена на 7%-8%, что тоже очень полезно. И это еще не говоря о повышении пропускной способности на всех уровнях подсистемы памяти. Кроме этого, на многих линиях передачи данных внутри чипа (между кэшами L1 и L2 и памятью в том числе) используется сжатие данных без потерь, помогающее экономить ПСП и энергию.

Все архитектурные улучшения RDNA по сравнению с GCN привели к тому, что эффективность (общая производительность GPU при равной тактовой частоте) выросла на четверть, а энергоэффективность — на все 50%. При этом, далеко не все преимущество было достигнуто при помощи техпроцесса 7 нм, его вклад составил лишь около 25%-30%, а остальной прирост был достигнут за счет архитектурных улучшений в RDNA и модернизированной системы питания.

Если сравнивать графические процессоры семейства Navi с Vega, то новый GPU быстрее Vega 56 на 25%-40%, а абсолютный прирост производительности над Vega 64 составляет 14%, и это при меньшем на 23% уровне потребления энергии. И если перейти к сравнению площадей этих GPU, то новое решение более чем вдвое меньше по размеру (251 мм² против 495 мм²) за счет применения техпроцесса 7 нм против 14 нм, что позволяет не только повысить производительность нового GPU, но и снизить себестоимость продукции.

А вот с точки зрения поддержки новых графических возможностей в RDNA не так много нового. Эти GPU поддерживают все те возможности Direct3D12, что и GCN, включая Rapid Packed Math (FP16) — вдвое ускоренные вычисления со сниженной точностью. Увы, но Navi не поддерживает какого-либо аппаратного ускорения трассировки лучей, как не было объявлено и о поддержке переменной частоты закраски (variable rate shading).

Поддержка высокопроизводительной шины PCI Express 4.0

Компания AMD стала первой в индустрии, кто реализовал и выпустил в продажу сразу несколько продуктов с поддержкой PCI Express новой версии 4.0. И видеокарты Radeon RX 5700 и процессоры Ryzen 3000 и чипсет X570 — все готово к передаче действительно больших объемов данных на высокой скорости — вдвое выше, чем у привычной версии 3.0. Да, уже была анонсирована и еще более производительная версия PCI Express 5.0, но когда там она еще появится в готовых продуктах...

В случае установки видеокарт новой серии в системную плату на базе чипсета AMD X570, у вас получится решение с полной поддержкой PCIe 4.0 — единственное имеющееся на рынке. Создатели общепринятого индустриального бенчмарка 3DMark уже создали специальный тест для измерения производительности шины PCI Express, который показывает серьезное превосходство новой версии шины над предыдущей.

Конечно, это всего лишь тест, а в играх и обычных приложениях разницы вы не увидите еще долго, но в некоторых профессиональных задачах, вроде проигрывания видеороликов разрешения 8K формата ProRes4x4 в специализированном ПО DaVinci Resolve 16, с использованием PCI Express 4.0 по данным AMD получается 60 FPS вместо 36 FPS в случае PCIe 3.0.

Улучшенные движки по выводу изображения и обработке видеоданных

Некоторые изменения произошли и в блоках обработки видео и вывода изображения на дисплеи. Увы, поддержки HDMI 2.1 в Navi нет, и контроллер схож с тем, что мы видели в Vega, он поддерживает HDMI 2.0b и DisplayPort 1.4 HDR (с FreeSync 2, конечно же). Единственное дополнение тут — поддержка потокового сжатия DisplayPort 1.4 Display Stream Compression (DSC), Display Stream Compression 1.2a, позволяющее одним кабелем подключать 4K-мониторы с частотой обновления до 240 Гц или 4K HDR с 120 Гц или 8K-мониторы при 60 Гц.

Сжатие Display Stream Compression позволяет снизить требования к пропускной способности кабеля для вывода высоких разрешений при высокой частоте обновления данных. Это нужно для поддержки 4K-мониторов с частотой обновления в 144 Гц и выше, ведь возможностей стандартного DP 1.4 не хватает для вывода картинки в такой конфигурации. Также возможно подключение шлемов виртуальной реальности по единственному разъему, если это реализуют партнеры компании.

Движок обработки видеоданных в Navi обеспечивает улучшенное кодирование в HEVC (H.265) формат при разрешении до 8K с ускорением времени кодирования до 40%, по сравнению с предыдущими GPU компании. Кодирование видеоданных в 4K осуществляется при частоте кадров 60 FPS, а декодирование — до 90 FPS (или 24 FPS для 8K-разрешения). Для H.264 декодирование осуществляется в 4K до 150 FPS, а кодирование — до 90 FPS. Видеопоток Full HD-разрешения кодируется и декодируется в оба формата на частоте кадров до 360 FPS. Поток в формате VP9, популярном в Youtube и Twitch, также аппаратно декодируется в разрешении до 4K при 60 FPS.

Новые программные технологии

Помимо аппаратной части всегда важна и программная поддержка — и в новой версии драйверов Adrenalin 2019 Edition, кроме уже известных нам ранее технологий AMD Link, Radeon Relive, Radeon Chill, появились и новые. К примеру, это Radeon Anti Lag — возможность, значительно (на 30% и даже больше) снижающая задержки между действиями игрока и их отображением на экране. Это особенно важно для киберспортивных применений:

По данным AMD, с включением Radeon Anti Lag, в подобных играх время между действием и отображением на экране становится на треть меньше. Вместо 45-55 мс в некоторых играх получается 30-37 мс, что будет заметно игрокам высокого уровня. Особых технических деталей реализации в AMD не раскрывают, но по описанию работы похоже, что все делается программно в драйвере — он слегка притормаживает очередь кадров на CPU и приводит возможности CPU и GPU к единому целому, что и улучшает отзывчивость.

Эта возможность лучше работает, когда производительность ограничена мощностью GPU, если графический процессор достаточно медленный, а CPU — быстрый. В обратных случаях, с упором скорости в CPU, никакой разницы не будет. Кстати, эта новая возможность работает не только на новых видеокартах серии Radeon 5700, но и на всех решениях на основе GCN, в играх, использующих DirectX 9 и DirectX 11.

Также была объявлена поддержка адаптивного увеличения резкости Radeon Image Sharpening. По сути, это встроенный в драйвер несложный постфильтр для повышения резкости изображения с минимальным влиянием на производительность (до пары процентов). Его полезность особенно хорошо проявляется в тех играх, которые используют алгоритмы полноэкранного сглаживания, сильно замыливающие изображение (FXAA, TAA и другие).

Кроме этого, Radeon Image Sharpening (RIS) умеет также качественно повышать разрешение из низкого в рабочее разрешение монитора. На данный момент возможность открыта только для видеокарт на основе графических процессоров Navi для игр, использующих Vulkan, DirectX 9 и DirectX 12. Зато технология поддерживается большим количеством игр и не требует никаких изменений в их коде.

Подобное адаптивное увеличение резкости (Contrast Adaptive Sharpening) входит и в комплект AMD FidelityFX, который предлагается разработчикам для встраивания в игры. Кроме повышения резкости, а также качественного фильтра масштабирования, позволяющего повысить резкость при выводе изображения, отрисованного в меньшем разрешении в большее, в будущем также предполагается добавление в пакет и других постфильтров.

Повышение резкости работает неплохо, и лучше всего подходит для игр с сглаживанием типа TAA, которое сильно замыливает картинку, используя данные из предыдущих кадров. Для AMD важно, что работа CAS дополнительно ускоряется на видеокартах Vega и Navi при помощи Rapid Packed Math — удвоенного темпа исполнения инструкций с FP16-точностью. AMD FidelityFX уже поддержан разработчиками Saber, Codemasters, Ubisoft, Capcom, Unity, Rebellion, Gearbox, Croteam и другими — для интеграции в их будущие игры.

Оценка производительности и выводы

Сравним характеристики нескольких моделей видеокарт компании, включив в таблицу Vega 64, которую заменяет старшая из представленных моделей, а также самую мощную видеокарту семейства Polaris:

  Radeon RX 5700 XT Radeon RX Vega 64 AMD Radeon RX 590
Техпроцесс TSMC, 7 нм GloFo, 14 нм GloFo, 12 нм
Кодовое наименование GPU Navi 10 Vega 10 Polaris 30
Архитектура RDNA GCN 5 GCN 4
Количество транзисторов, млрд 10,3 12,5 5,7
Площадь кристалла, мм² 251 495 232
Количество блоков ALU 2560 4096 2304
Количество блоков TMU 160 256 144
Количество блоков ROP 64 64 32
Базовая частота, МГц 1605 1247 1469
Турбо-частота, МГц 1905 1546 1545
Частота видеопамяти, МГц 14000 1890 8000
Ширина шины видеопамяти, бит 256 2048 256
Объем видеопамяти, ГБ 8 8 8
Производительность FP32, TFLOPS 9,8 12,7 7,1
Энергопотребление, Вт 225 295 225
Рекомендованная цена, $ 399 499 279

Хотя Navi заменила Vega на рынке, по своей сути Navi 10 — это скорее аналог Polaris. То есть, GPU среднего уровня, а не топовый чип. Новый графический процессор имеет площадь 251 мм² и содержит 10,3 миллиарда транзисторов. То есть чип Navi 10 получился лишь чуть больше Polaris 10, имеющего площадь в 232 мм², но при этом вмещает чуть ли не вдвое больше транзисторов, благодаря техпроцессу 7 нм.

Так как архитектура RDNA оптимизирована для увеличения эффективности, то напрямую спецификации сравнивать нужно с осторожностью — наверняка Radeon RX 5700 (XT) даже при схожем количестве исполнительных блоков и на одной частоте должен быть производительнее своих предшественников из семейства Polaris. По крайней мере в теории, на практике могут возникнуть вопросы в случае ПО, хорошо оптимизированного именно под особенности GCN, вроде активного использования асинхронных вычислений, от которых на RDNA может наблюдаться меньший прирост (в теории).

Пара слов по поводу тактовых частот новых GPU. AMD говорит, что старший чип работает на частоте до 1905 МГц, но это так называемая «турбо-частота» (boost), максимальная для чипа вообще. Работает же GPU чаще на несколько меньшей — появившейся в Navi «игровой частоте» (game), что является аналогом турбо-частоты для видеокарт Nvidia. Это — типичная тактовая частота, средняя достигаемая в процессе игры. Сам по себе подход по тактовым частотам остался неизменным, она повышается до того, как ограничивается пределами по питанию и температуре. И в играх, вполне вероятно, будет наблюдаться изменение тактовой частоты GPU от «игровой» до «турбо», и даже выше — как и у Nvidia (хотя названия для этих частот у компаний разные).

Все это не влияет ни на что, кроме пиковых показателей — компании AMD и Nvidia отличаются разным подходом и указывают цифры при разных частотах. Для Radeon RX 5700 XT максимальная производительность достигает 9,75 терафлопс для FP32-точности, что хоть и значительно выше, чем у Polaris, но не совсем соответствует увеличившейся сложности GPU. То есть пиковые теоретические показатели относительно сложности чипа у GCN выше, но в том и дело, что на практике они практически недостижимы. А RDNA намеренно была изменена так, чтобы при меньшей теоретической производительности было легче достичь более высокой реальной скорости. Все это нужно учитывать в своих прикидках.

Графический процессор Navi 10 имеет 64 блока ROP, что вдвое больше, чем у Polaris, хоть и столько же, что и у Vega, но соотношение ROP к ALU у нового GPU выше. Для того, чтобы прокормить новый чип данными, Navi 10 поддерживает видеопамять типа GDDR6, обеспечивающую гораздо более высокую пропускную способность, по сравнению с GDDR5 (448 ГБ/с против 256 ГБ/с у Polaris). Кроме этого, было переработано сжатие данных, а вместе с ним выросла и эффективная пропускная способность памяти, в чем решения AMD ранее уступали конкурентам. В целом, с 64 более эффективными блоками ROP и серьезно повышенной ПСП, семейство RX 5700 выглядит более сбалансированным, по сравнению с Polaris.

Младшая модель Radeon RX 5700 имеет несколько меньшую производительность, энергопотребление и цену. Из 40 блоков CU в младшей модели активными остались 36 штук, а тактовая частота снижена до 1625 МГц игровой и 1725 МГц турбо-частоты. То есть чисто теоретически, младшая модель должна обеспечивать около 87% скорости старшей. Исключая производительность блоков ROP и обработки геометрии, которые будут лишь на 7% медленнее, чем у старшей модели. А по ПСП видеопамяти разницы между XT и не-XT вообще нет никакой. Обе карты имеют по 8 ГБ GDDR6-памяти, работающей на эффективной частоте в 14 ГГц.

По собственным тестам компании получается, что Radeon RX 5700 XT примерно на треть быстрее, чем Vega 56 в современных играх. Переход на вейвфронты по 32 потока, о котором мы говорили в предыдущем разделе материала, должен повысить производительность в тех приложениях, где GCN частенько простаивала — в играх без асинхронных вычислений и с большим количеством вызовов функций отрисовки. С другой стороны, и возможностей для постепенной оптимизации при помощи асинхронных вычислений в случае RDNA будет уже меньше.

Radeon RX 5700 XT позиционируется в качестве конкурента для GeForce RTX 2070, и по тестам компании AMD в разрешении 1440p в среднем превосходит его по производительности на несколько процентов. Разница в скорости рендеринга достигает 22% для популярной игры Battlefield V, но иногда бывает и отрицательной — для некоторых игр из тех, с разработчиками которых сотрудничал конкурент. Если сравнивать старшую версию с RX Vega 56, то преимущество новой видеокарты Radeon RX 5700 XT над ней составляет уже более чем 25%.

Младшая Radeon RX 5700 сражается на рынке с GeForce RTX 2060, имея среднее преимущество по производительности над решением Nvidia около 10%. Как видите из измерений специалистов AMD, их новые решения опережают как предыдущие модели этой же компании, так и неплохо конкурируют с соперниками от Nvidia.

Судя по этим измерениям, проведенным в наборе популярных игровых приложений, обе видеокарты семейства Radeon RX 5700 смотрятся очень неплохо по сравнению со своими прямыми конкурентами. В основном новинки опережают соответствующие видеокарты Nvidia, и в среднем они обеспечивают чуть более высокую скорость рендеринга.

23 сентября 2019 Г.