Семейства видеокарт AMD Radeon Справочная информация

 


Справочная информация о семействе видеокарт Radeon X
Справочная информация о семействе видеокарт Radeon X1000
Справочная информация о семействе видеокарт Radeon HD 2000
Справочная информация о семействе видеокарт Radeon HD 4000
Справочная информация о семействе видеокарт Radeon HD 5000
Справочная информация о семействе видеокарт Radeon HD 6000
Справочная информация о семействе видеокарт Radeon HD 7000
Справочная информация о семействе видеокарт Radeon 200
Справочная информация о семействе видеокарт Radeon 300
Справочная информация о семействе видеокарт Radeon 400
Справочная информация о семействе видеокарт Radeon 500 и Vega
 

Спецификации графических процессоров семейства Radeon 500

кодовое имя Vega 10 Polaris 10/20 Polaris 11/21 Polaris 12
базовая статья здесь здесь - здесь
технология (нм) 14
транзисторов (млрд) 12,5 5,7 3,0 2,2
универсальных процессоров 4096 2304 1024 512
текстурных блоков 256 144 64 32
блоков блендинга 64 32 16
шина памяти 2048 256 128
типы памяти HBM2 GDDR5
системная шина PCI Express 3.0 x16
интерфейсы DVI Dual-Link
HDMI 2.0b
DisplayPort 1.4
D3D Feature Level 12_1 12_0
точность вычислений FP16/FP32/FP64 FP32/FP64



 

Спецификации референсных карт семейства Radeon 500

карта чип блоков ALU/TMU/ROP частота ядра, МГц частота памяти, МГц объем памяти, ГБ ПСП, ГБ/c
(бит)
текстури-
рование, Гтекс
филлрейт, Гпикс TDP, Вт
Radeon RX Vega 64 Vega 10 4096/256/64 1247(1546) 945(1890) 8 HBM2 484 (2048) 320-396 80-100 295
Radeon RX Vega 56 Vega 10 3584/224/64 1156(1471) 800(1600) 8 HBM2 410 (2048) 260-330 74-94 210
Radeon RX 580 Polaris 10/20 2304/144/32 1257(1340) 2000(8000) 4/8 GDDR5 256 (256) 181-193 40-43 185
Radeon RX 570 Polaris 10/20 2048/128/32 1168(1244) 1750(7000) 4/8 GDDR5 224 (256) 150-160 37-40 150
Radeon RX 560 Polaris 11 1024/64/16 1175(1275) 1750(7000) 2/4 GDDR5 112 (128) 75-82 18-20 80
Radeon RX 550 Polaris 12 512/32/16 1100(1183) 1750(7000) 2/4 GDDR5 112 (128) 35-38 18-19 50


Графический ускоритель Radeon RX Vega 64 (с воздушным охлаждением)

Параметр Значение
Кодовое имя чипа Vega 10
Технология производства 14 нм FinFET LPP
Количество транзисторов 12,5 млрд.
Площадь ядра 486 мм²
Архитектура Унифицированная, с массивом общих процессоров для потоковой обработки многочисленных видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectX DirectX 12, с поддержкой уровня возможностей Feature Level 12_1
Шина памяти 2048-битная шина памяти с поддержкой стандарта High Bandwidth Memory второго поколения
Частота графического процессора 1274 (1546) МГц
Вычислительные блоки 64 вычислительных блока GCN, состоящих в целом из 4096 ALU для расчетов с плавающей запятой (поддерживаются целочисленные и плавающие форматы INT8, INT16, FP16, FP32 и FP64)
Блоки текстурирования 256 текстурных блоков, с поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
Блоки растеризации (ROP) 64 блока ROP с поддержкой режимов сглаживания с возможностью программируемой выборки более чем 16 сэмплов на пиксель, в том числе при FP16- или FP32-формате буфера кадра. Пиковая производительность до 64 отсчетов за такт, а в режиме без цвета (Z only) — 256 отсчетов за такт
Поддержка мониторов Интегрированная поддержка до шести мониторов, подключенных по интерфейсам DVI, HDMI 2.0b и DisplayPort 1.4
 
 
Спецификации референсной видеокарты Radeon RX Vega 64
 
Параметр Значение
Частота ядра 1274 (1546) МГц
Количество универсальных процессоров 4096
Количество текстурных блоков 256
Количество блоков блендинга 64
Эффективная частота памяти 1890 (2×945) МГц
Тип памяти HBM2
Шина памяти 2048-бит
Объем памяти 8 ГБ
Пропускная способность памяти 484 ГБ/с
Вычислительная производительность (FP32) до 12,7 терафлопс
Теоретическая максимальная скорость закраски 99 гигапикселей/с
Теоретическая скорость выборки текстур 396 гигатекселей/с
Шина PCI Express 3.0
Разъемы Один разъем HDMI и три DisplayPort
Энергопотребление до 295 Вт
Дополнительное питание Два 8-контактных разъема
Число слотов, занимаемых в системном корпусе 2
Рекомендуемая цена $499 (для рынка США)
 
Спецификации референсной видеокарты Radeon RX Vega 56
 
Параметр Значение
Частота ядра 1156 (1471) МГц
Количество универсальных процессоров 3584
Количество текстурных блоков 224
Количество блоков блендинга 64
Эффективная частота памяти 1600 (2×800) МГц
Тип памяти HBM2
Шина памяти 2048-бит
Объем памяти 8 ГБ
Пропускная способность памяти 410 ГБ/с
Вычислительная производительность (FP32) до 10,5 терафлопс
Теоретическая максимальная скорость закраски 94 гигапикселей/с
Теоретическая скорость выборки текстур 330 гигатекселей/с
Шина PCI Express 3.0
Разъемы Один разъем HDMI и три DisplayPort
Энергопотребление до 210 Вт
Дополнительное питание Два 8-контактных разъема
Число слотов, занимаемых в системном корпусе 2
Рекомендуемая цена $399 (для рынка США)

Названия новых моделей видеокарт компании AMD изменили принятую ранее систему наименований. Во-первых, они снова (как и Fury ранее) имеют имя собственное — Vega, во-вторых, цифра после названия семейства теперь означает количество активных исполнительных блоков архитектуры GCN в графическом процессоре — 64 или 56 для урезанной версии. Так что цифр типа 560, 570 и 580 в этот раз нет. А вот начальные буквы RX остались, и это немного странно. Они ведь раньше показывали уровень видеокарты: R7 были медленнее, чем R9, например. Похоже, что теперь AMD просто понравилось сочетание RX, и они продолжили его использовать.

Модели нового семейства Vega заняли в текущей линейке компании самые верхние позиции, дополняя семейство Polaris (Radeon 500) на рынке. Vega 64 и 56 относятся к верхнему ценовому уровню, выше старшей из них разве что её вариант Liquid Cooled Edition с ещё несколько большей производительностью (и ценой, соответственно). Давайте посмотрим на цены всех представленных решений:

 

Разброс в цене представленных решений немалый — от $399 за RX Vega 56 до $699 за топовую видеокарту с водяным охлаждением. Но в данном случае речь идёт уже не только о видеокарте, а целом паке, который обходится в лишнюю сотню долларов. Что же предлагает AMD за дополнительные $100? В компании считают, что таким образом помогут пользователям решиться на апгрейд игровых систем, добавив возможность приобрести современный монитор, процессор и системную плату со значительной скидкой. А кроме этого, в комплекте будут предлагаться ещё и бесплатные игры.

 

В частности, в предложение компании входит $200 скидка на приобретение ультраширокоформатного современного монитора Samsung CF791 с диагональю 34" и поддержкой технологии FreeSync, $100 скидка на некоторые процессоры Ryzen 7 в комплекте с системными платами на чипсете X370 — уже только это даёт экономию в $300, а они ещё и предлагают игры в комплекте, который будет зависеть от региона (для США их стоимость в рознице составляет ещё $120).

На бумаге предложение выглядит неплохо. В принципе, для тех, кто планирует сделать большой апгрейд, подобное предложение выглядит отличным вариантом для того, чтобы сэкономить свои деньги, а если кто просто хочет купить себе новую Radeon RX Vega, то заплатит на сотню меньше. В реальности есть некоторые детали — во-первых, нужно учитывать региональные особенности (кое-где никаких мониторов вам не предложат, а набор игр будет не таким привлекательным), а во-вторых — в некоторых случаях, предложенная скидка на приобретение монитора просто не имеет смысла, так как можно купить аналогичную модель за те же деньги и без каких-то скидок.

Кстати, внимательный читатель заметит, что показанные на слайдах видеокарты с воздушным охлаждением существуют двух видов: с серебристым корпусом системы охлаждения и чёрным, причём, по одной цене. В действительности, отличия между ними есть только по корпусу, а по остальным характеристикам они идентичны. Первые выпущены ограниченной серией и закончатся в продаже довольно быстро, если уже не (есть такие данные, что первые партии уже в основном распроданы).

Референсный вариант Radeon RX Vega 64 предлагается по рекомендованной цене в $499, и эту цену нельзя назвать слишком уж привлекательной, ведь на рынке по схожей цене давно продаётся такая модель, как GeForce GTX 1080, в том числе и в виде фабрично разогнанных версий. Именно с ними и конкурирует новинка.

По понятным причинам, видеокарты Radeon RX Vega 64 существуют исключительно в версиях с 8 ГБ памяти типа HBM2, и даже Vega 56 не отличается по этому параметру. Решение по установке именно 8 ГБ памяти на новые GPU вполне практично. 4 ГБ на топовую карту ставить нельзя, даже на картах семейства Fury этого было маловато, но и 16 ГБ кажутся расточительством с учётом огромной себестоимости HBM2-памяти. Так что 8 ГБ можно считать «золотой серединой», и это хоть и не оставляет особого запаса на будущее, но в ближайшее время будет вполне достаточно, особенно учитывая, что видеопамять у Vega можно расширить за счёт системной памяти (подробнее см. далее).

Для дополнительного питания референсные платы используют два 8-контактных разъема, и значение типичного энергопотребления для модели Radeon RX Vega 64 на основе полноценного графического процессора Vega 10 при воздушном охлаждении установлено на уровне 295 Вт (210 Вт для Vega 56). С одной стороны, два разъёма оставляют полезный запас на случай разгона, с другой — выглядят довольно пугающе. Как бы не получилось так, что по потреблению энергии платы на чипе Vega 10 станут рекордсменами надолго (как минимум, в своём классе).

Архитектурные особенности Vega

Анонсированные решения AMD основаны на первом графическом процессоре новой архитектуры Vega, который произведён по 14 нм FinFET LPP техпроцессу и содержит 12,5 миллиардов транзисторов. Этот сложный чип получил название Vega 10 и он содержит в себе в целом порядка 45 МБ SRAM-памяти, разработан для работы на высокой тактовой частоте вплоть до 1,7 ГГц (при условии жидкостного охлаждения), а внутренние связи используют уже известную нам по процессорам компании шину Infinity Fabric. Площадь немаленького чипа составляет 486 мм2 и на следующей фотографии можно наглядно оценить размеры кристаллов Vega (справа), по сравнению с кристаллами Fiji (видеокарты семейства Fury):

 

Графический процессор Vega 10 относится к архитектуре Graphics Core Next, хоть и значительно модифицированной. Базовым блоком архитектуры является вычислительный блок Compute Unit (CU), из которых собраны все графические процессоры AMD. Вычислительный блок CU имеет выделенное локальное хранилище данных для обмена данными или расширения локального регистрового стека, а также кэш-память первого уровня с возможностью чтения и записи и полноценный текстурный конвейер с блоками выборки и фильтрации, он разделен на подразделы, каждый из которых работает над своим потоком команд. Каждый из таких блоков занимается планированием и распределением работы самостоятельно.

Полноценный графический процессор Vega 10 содержит 4 движка асинхронного исполнения команд, 4 модифицированных геометрических движка и 64 вычислительных блока Compute Unit нового поколения — серьёзно переделанные, по сравнению с предыдущими архитектурами, как заверяют представители AMD. Всего в составе этих вычислительных блоков находится 4096 потоковых процессоров, 256 текстурных блоков и 64 блока ROP. Соответственно, по количество блоков можно понять, что это топовый GPU, предназначенный сразу для нескольких рынков: игрового, вычислительного, профессиональной графики и т.д. Рассмотрим схему нового графического процессора (по клику на изображении доступна увеличенная версия иллюстрации):

 

Хотя по количеству блоков Vega 10 повторяет чип Fiji, новое решение отличается специальными оптимизациями для работы на повышенной частоте, а также включает множественные архитектурные модификации, улучшающие производительность и энергоэффективность. К примеру, самая мощная модель Radeon RX Vega 64 Liquid Cooled Edition с жидкостным охлаждением способна дать производительность в 13,7 терафлопс при вычислениях с одинарной точностью и 27,4 терафлопс для 16-битных вычислений половинной точности, поддержка которых появилась в Vega.

При проектировании нового чипа для снижения задержек инженеры AMD воспользовались опытом создания архитектуры Zen, на 8% сократив внутренние задержки, получив на 18% меньшую площадь на кристалле для внутренних линий с почти вдвое меньшим потреблением энергии. Все линии данных в чипе на критических участках были укорочены и оптимизированы, основные ALU имеют четыре стадии, чип оптимизирован по утечкам, и в результате (вклад нового техпроцесса также учитываем) Vega 10 может работать на частоте до 1,7 ГГц, хотя предыдущие 28 нм чипы довольствовались частотой порядка 1,0-1,3 ГГц.

Графический процессор Vega 10 стал первым, в котором используется внутренняя шина Infinity Fabric, имеющая низкие задержки и предназначенная для соединения всех блоков процессора друг с другом. Так как эта шина стала стандартной для всех современных решений AMD, то она позволяет использовать гибкий модульный подход при создании различных чипов, в которых можно использовать любые блоки. В представленном GPU каналы данных Infinity Fabric соединяют основное графическое ядро с другими логическими блоками, такими как контроллеры памяти, контроллер PCI Express, дисплейный движок, движок обработки видеоданных. Благодаря использованию Infinity Fabric во всех них, встраивать возможности архитектуры Vega в будущие чипы (кто сказал APU?) будет намного проще.

Новая иерархия памяти с высокопроизводительным кэшем

В графическом процессоре Vega 10 используется HBM2-память с поддержкой ECC, важной для профессиональных применений, расположенная на одной подложке с самим GPU. Новый чип имеет HBM2-память, работающую по 2048-битной шине при тактовой частоте, близкой к 1 ГГц, что даёт высокую пропускную способность в 484 ГБ/с. В достижениях именно HBM2-памяти, по сравнению с первым поколением высокопроизводительной памяти — теоретически еще большая пиковая пропускная способность. HBM второго поколения может быть вдвое быстрее первого (хотя в случае Vega решили оставить ПСП на том же уровне). Также доступна до восьми раз большая емкость на каждый стек чипов памяти, что было наибольшим недостатком и самым обидным ограничением HBM1-памяти, известным по графическим процессорам Fiji, на которых основаны видеокарты серии Fury.

Отметим и традиционные преимущества HBM2 перед GDDR5-памятью, вроде более чем вдвое меньшего физического размера, занимаемого на печатной плате — именно поэтому и стало возможно создание таких малогабаритных плат, как Radeon R9 Nano и планируемой к выпуску RX Vega Nano (название условное, мы сами придумали). Также сотрудники AMD заявляют, что новый тип памяти, который планируется применять в Vega, до четырех-пяти раз более энергоэффективен, по сравнению с привычной GDDR5-памятью.

Теоретически возможен объем памяти до 32 ГБ, раз нам говорят о восьмикратном приросте поддерживаемого объёма на стек. Пока что в AMD решили поставить на игровые чипы 8 ГБ HBM2-памяти, а на профессиональные решения для высокопроизводительных вычислений — 16 ГБ. Это и понятно, ведь себестоимость этой новой памяти весьма велика, а 8 ГБ до сих пор хватает практически всем играм почти в любых условиях и настройках. А если и не хватит, то Vega будет использовать системную память, и вот об этой возможности мы сейчас и поговорим.

Самое любопытное в подсистеме памяти Vega то, что HBM2-память можно использовать как кэш-память для данных, которые находятся на медленных носителях. По сути, HBM2 в Vega используется как кэш-память последнего уровня для системной памяти и накопителей данных. По словам представителей AMD, высокопроизводительный кэш и его контроллер позволяют использовать плоскую виртуальную адресацию до 512 терабайт данных на разных носителях, и его работа полностью прозрачна для пользовательских приложений. 512 ТБ — это 49-битный доступ, но почему именно столько? Потому что этого как раз достаточно для того, чтобы с большим запасом покрыть 48-битную виртуальную адресацию современных CPU вместе с локальной видеопамятью GPU, что позволяет получить доступ к полному и единому адресному пространству памяти CPU и GPU, а также к дополнительным данным на накопителях.

При рендеринге, GPU требуется доступ ко всем ресурсам и данным, используемым в сцене, и обычно все они должны помещаться в локальную видеопамять. Альтернативный подход предлагает подкачивать недостающие данные из системной памяти по PCI Express шине, но зачастую такой метод не обеспечивает достаточной ПСП и имеет большие задержки. Конечно, игровые разработчики стараются обходить эти ограничения при помощи специальных хаков в коде, но сложное управление памятью — явно не то, чем бы они хотели заниматься, а объём локальной видеопамяти всегда ограничен.

По исследованиям AMD, игры The Witcher Wild Hunt и Fallout 4 в 4K-разрешении при ультра-настройках качества в реальности используют примерно вдвое меньше данных из локальной видеопамяти, чем они заполнили ее объема. К примеру, если игра заняла всю имеющуюся локальную видеопамять объемом в 8 ГБ, то при рендеринге кадра в реальности осуществляется доступ к ресурсам, занимающим вдвое меньший объем. То есть, играм технически совсем не обязательно было занимать все 8 ГБ, можно было бы обойтись и 4 ГБ локальной памяти. Иными словами, в играх видеопамять зачастую уже и так используется как общее адресное пространство, которое графический движок заполняет геометрией и текстурами. Фактически, можно хранить только самые важные данные в быстрой кэш-памяти, постепенно подгружая из более медленной все новые и новые ресурсы, требуемые при работе над кадром.

А ведь в дальнейшем объемы, занимаемые ресурсами игр и других приложений, продолжат свой неумолимый рост, и этот вопрос нужно как-то решать. Путь тупого наращивания объема видеопамяти — самый простой, но неоптимальный вариант, да и при этом потребление энергии микросхемами памяти будет расти слишком быстро, поэтому в AMD и решили пойти другим путем, предложив быстрый кэш, подгружающий ресурсы с более медленной памяти большего объема. Важно, что их решение не требует какого-либо вмешательства со стороны разработчиков программного обеспечения, и аппаратная кэш-память сама определяет, какие ресурсы будут нужны в каждый момент времени, подгружая их в быструю память по мере необходимости.

Такой подход позволяет использовать больший объем данных, чем помещается в видеопамяти, но лишь при правильной работе контроллера кэш-памяти. И то — вряд ли он сможет решить все проблемы, когда объем данных, требуемых при работе над сценой, значительно превышает объем быстрой кэш-памяти. Но в теории все выглядит красиво — с точки зрения ПО будет некая общая память, размещением данных в каждой из составляющих которой, и их менеджментом не нужно заниматься разработчику, а всё делается графическим процессором автоматически.

Для того, чтобы HBM2-память работала как кэш для системной памяти, энергонезависимой памяти (твердотельные SSD-накопители) или даже сетевых накопителей, нужно специальное управление всей этой иерархией — чтобы GPU брал данные из одного места и сохранял их в других по мере необходимости. Для решения этих задач в графический процессор Vega был внедрен новый контроллер высокопроизводительной кэш-памяти — High Bandwidth Cache Controller (HBCC).

 

Архитектура виртуальной памяти Vega использует страницы памяти разного размера (размер страниц настраивается, большие страницы лучше подойдут для последовательного доступа, а маленькие для случайного), неактивные перемещаются в более медленное хранилище, освобождая кэш для активных страниц памяти. При этом не требуется сложного управления памятью со стороны приложения, да и хранить все данные в быстрой локальной памяти (кэше) не обязательно. Такой подход позволяет использовать виртуально бесконечный объём ресурсов из многих миллионов треугольников и сотен гигабайт текстурных данных. В принципе, это похоже на поддержку виртуальной памяти в графических процессорах конкурента, но его решения имеют подобные возможности только для вычислительных применений, но не в графических задачах.

Если GPU пытается получить доступ к данным, не находящимся в локальной памяти, он подтягивает только требуемые страницы памяти по шине PCI Express, и сохраняет их в высокопроизводительном кэше (она же HBM2-память), вместо того, чтобы заставить весь чип простаивать до копирования ресурса целиком (например, если это большая текстура на несколько мегабайт) по шине. Разница между подходами в том, что маленькие страницы памяти меньше текстур и других ресурсов целиком, и их можно скопировать в кэш намного быстрее. А уже после копирования в кэш, любой доступ к данным внутри страницы будет максимально быстрым, так как она целиком находится в HBM2.

AMD называет такую новую архитектуру памяти революционной и для игровых и для профессиональных применений. Процессоры, основанные на архитектуре Vega, потенциально имеют лучший аппаратный менеджмент памяти, по сравнению с привычными программными решениями. К примеру, весьма интересно выглядит профессиональная карта Radeon Pro SSG с SSD-накопителями на борту, которые позволяют иметь видеопамять очень большого объёма (терабайты!), со сниженными задержками и высокой ПСП. Подобные решения могут использоваться при качественном рендеринге и редактировании видеоданных в 8К-разрешении и уже применяются в профессиональной сфере.

Важно, что можно использовать различные режимы работы высокопроизводительного кэша HBM2: inclusive и exclusive, с иерархической или плоской моделью памяти, а также устанавливать необходимый размер страниц, которые оптимизируются для частных случаев: маленькие страницы для случайного доступа и большие для последовательного.

 

Доступ к большому объёму видеопамяти с аппаратным менеджментом в теории позволит игровым разработчикам создавать уникальные игровые миры большого размера с высокой детализацией, лучшим освещением и анимацией, без традиционных опасений вылететь за пределы имеющегося объёма локальной видеопамяти. Но пока что это лишь теория, а практически новой технологией компании AMD заинтересовались, к примеру, в компании Bethesda, известной по играм с виртуальными мирами огромного размера, и наверняка какие-то их грядущие проекты будут использовать возможности HBCC.

Чтобы получить максимум от новой иерархии памяти в Vega, все исполнительные блоки нового GPU получили доступ к кэш-памяти второго уровня (L2), что отличается от предыдущих чипов архитектуры GCN, в которых пиксельные движки имели собственные независимые кэши. Это также важно для различных техник, использующих рендеринг в текстуры, например (карты теней, отложенное затенение и многое другое. А также, так как L2-кэш теперь играет ещё более важную роль в новой иерархии памяти и из-за применения тайловой растеризации (см.далее), то в AMD решили вдвое увеличить его объём — до 4 МБ, по сравнению с 2 МБ у предыдущих GPU компании.

Ещё одно важное отличие Vega от ранних графических архитектур, которое мы отметим — если пиксельные и текстурные блоки предыдущих GPU не могли обращаться к памяти одновременно (когерентность памяти), то теперь блоки растеризации RBE (render back-end) имеют быстрый доступ к кэш-памяти второго уровня и используют ее для экономии ПСП видеопамяти. Все это в теории должно помочь серьезно увеличить производительность в игровых и профессиональных приложениях, использующих отложенное затенение (deferred shading), в частности.

Геометрические движки нового поколения

Нововведения в графической архитектуре Vega многочисленны, и связаны они не только с подсистемой памяти. Также в новом GPU были сделаны и улучшения в геометрическом конвейере, более гибком и программируемом, чем предыдущие. Не секрет, что одной из наиболее существенных проблем 3D-графики с давних времён является так называемый overdraw — многократная прорисовка одних и тех же пикселей на экране, относящихся к разным поверхностям и моделям, которые загораживают друг друга так, что камере виден лишь ближайший пиксель.

После всех оптимизаций в кадре и так присутствует несколько миллионов полигонов, но если прорисовывать всю геометрию уровня, то это значение вырастет в десятки раз, и графический процессор большую часть времени будет заниматься бесполезной работой по отрисовке тех пикселей, которые пользователь никогда не увидит. Для оптимизации существует большое количество алгоритмов, включающих сравнение Z-координат и другие методы, предназначенные для отбрасывания невидимой геометрии, но её всё равно остаётся больше, чем необходимо.

Новый программируемый геометрический движок в графическом процессоре Vega 10 включает несколько нововведений, позволяющих увеличить итоговый темп обработки геометрии — по данным AMD, новый GPU способен обрабатывать геометрию значительно быстрее, по сравнению с решениями предыдущих поколений. Если графический процессор Fiji имеет четыре движка геометрии и обрабатывает четыре полигона за такт, то GPU новой архитектуры Vega с тем же количеством геометрических движков способен обрабатывать до 17 полигонов за такт (в определённых условиях). Также специалисты компании AMD смогли улучшить балансировку загрузки различных вычислительных блоков работой при помощи продвинутого блока распределения работы.

 

Более того, AMD уже некоторое время выступает за довольно радикальное изменение существующего геометрического конвейера и введение новых типов шейдеров. Каждая стадия существующего графического конвейера имеет свои недостатки, обусловленные ограничениями старых GPU, но новые графические процессоры их не имеют и являются более гибкими. Специалисты компании предлагают ввести Primitive Shaders — новую аппаратную стадию конвейера, которая объединяет проходы вершин и примитивов и позволит отбрасывать невидимые примитивы очень рано, повысив общую эффективность работы.

Эти новые шейдеры могут работать над различными типами примитивов (вершины, полигоны, патчи), и у них много потенциальных применений, кроме отбрасывания невидимых примитивов: для ускорения исполнения вершинных шейдеров, при рендеринге карт теней, систем частиц, рендеринге с переменным разрешением и т.д. И хотя Vega и сама по себе быстрее Fiji обрабатывает геометрию, предлагаемое изменение конвейера позволяет повысить скорость ещё втрое-вчетверо! Хотя Vega 10 имеет четыре геометрических движка, которые в обычных условиях могут обрабатывать четыре же примитива за такт, это значение вырастает до 17 и более при условии применения шейдеров примитивов.

 

Новый тип шейдеров не заменяет предыдущий подход с традиционным конвейером, а дополняет его. Шейдеры примитивов невозможно использовать в рамках текущих API и приложений без соответствующих изменений, но компания сотрудничает с ведущими разработчиками для того, чтобы заинтересовать их. Плюс к этому, специалисты AMD могут использовать новый подход для специфических оптимизаций под конкретные приложения в своих драйверах.

Произошли и изменения, связанные с новой иерархией памяти (кэширования данных). Геометрические движки теперь могут использовать начиповую кэш-память второго уровня для хранения вершинных данных. Эта возможность дополняет имеющийся выделенный кэш параметров, который удвоился в объеме, по сравнению с решениями предыдущего поколения Polaris. Возможности кэширования геометрии стали более гибкими и они позволяют видеодрайверу выбрать оптимальный подход для различных вариантов использования.

Ещё одно изменение в обработке геометрии в Vega — улучшенная балансировка нагрузки между несколькими имеющимися геометрическими движками. Для этого в новом GPU есть специальный блок — интеллектуальный диспетчер intelligent workload distributor (IWD), который максимизирует загрузку движков, настраивает параметры геометрического конвейера в зависимости от вызовов функций отрисовки (draw calls), которые он получает от ПО. Диспетчер IWD старается минимизировать простои геометрических движков, связанные с переключениями контекста при выполнении вызовов функций отрисовки и пакует несколько небольших вызовов, которые не заполняют wavefront из 64 потоков, в один большой пакет.

Вычислительные блоки NCU и двойной темп для 16-битных вычислений

Из других важных изменений Vega 10 отметим улучшения, связанные с вычислительными блоками нового поколения, которые назвали Vega NCU — Next-Generation Compute Unit. Одной из самых важных новых возможностей вычислительного блока следующего поколения является Rapid Packed Math — двойной темп операций вычислений над целочисленными данными и данными с плавающей запятой половинной точности — то есть, INT16 и FP16 (по сравнению с общепринятыми в графических процессорах FP32).

Каждый из имеющихся в новом графическом процессоре Vega блоков NCU умеет исполнять 128 операций с привычной 32-битной точностью (FP32) за такт, или вдвое больше — 256 уже 16-битных (FP16 или INT16) операций, так называемых packed-вычислений. То же самое касается и операций над 8-битными данными, которые могут выполняться с еще более высоким темпом — учетверённым.

 

Вычисления в форматах INT16 и FP16 имеют вполне достаточную точность для использования во множестве современных задач, таких как машинное зрение и обучение, а удвоенный темп их исполнения, по сравнению с FP32, позволяет ускорить такие вычисления ровно вдвое, в отличие от предыдущих поколений GPU, не имеющих такой особенности. Также сниженная точность вычислений может подойти и для некоторых игровых применений, не требующих привычной точности 32-битных вычислений, и в этом очень поможет поддержка ускоренных 16-битных вычислений современными консолями, которые никогда не испытывают избытка вычислительных ресурсов. На это есть большая надежда, так как решения AMD применяются чуть ли не во всех консолях текущего поколения.

Интересно, что в решениях конкурирующей с AMD компании Nvidia аналогичная аппаратная возможность FP16-вычислений с двойным темпом появилась в графических процессорах даже несколько раньше, но... только в профессиональных и мобильных решениях, но не в GPU, предназначенных для установки в массовые настольные ПК. Так что у вышедших видеокарт на чипе Vega появилось потенциальное преимущество, которое раскроется, если разработчики действительно начнут использовать INT16 и FP16 массово. Правда, вычисления со сниженной точностью в играх применимы далеко не во всех алгоритмах и эффектах — помнится, несколько лет назад за подобный подход критиковали решения Nvidia того времени.

Лишь небольшая часть алгоритмов и техник в графических задачах может довольствоваться сниженной точностью вычислений, в том числе и потому, что ошибки накапливаются при нескольких проходах. Даже если на 16-битные «рельсы» переведут значимую часть вычислительных алгоритмов в играх, то реальное влияние на общую производительность вряд ли превысит десяток процентов. По замерам специалистов AMD, использование FP16 и INT16, а также смешанной точности вычислений даёт в некоем бенчмарке 3DMark Serra при постобработке до 20-25% преимущества, по сравнению с полной FP32-точностью — и это без видимых потерь в качестве. В указанном тесте целочисленные 16-битные данные используются при генерации процедурных поверхностей и в алгоритме шума для объёмного освещения, дающие 25% прироста производительности, а также 16-битные операции с плавающей запятой в алгоритме постобработки Bloom, что даёт 20% прирост скорости рендеринга.

Самое главное, что 16-битные форматы данных и операций уже сейчас можно использовать в существующих графических API, и при оптимизации мультиплатформенных игр велика вероятность того, что ПК-версии также получат соответствующие оптимизации, связанные с применением 16-битных вычислений там, где это не приводит к деградации изображения. А уж чисто вычислительные задачи нового поколения, вроде распознавания образов, машинного зрения и обучения, совершенно точно получат приличный прирост в скорости от удвоенного темпа 16-битных вычислений.

Всего же в архитектуру Vega добавили 40 новых инструкций. Кроме операций над 16-битными данными, служащими для повышения количества исполняемых операций за такт, были добавлены 32-битные целочисленные инструкции, восемь инструкций для адресации памяти и хеширования, используемых в задачах криптографии и майнинге криптовалют, а также новые ADD/SUB инструкции, полезные для минимизации использования регистров.

NCU также поддерживает набор 8-битных целочисленных операций SAD (Sum of Absolute Differences), QSAD (счетверённый SAD), объединяющая SAD с операторами сдвига для увеличения производительности и энергоэффективности, а также «маскируемую» инструкцию MQSAD, игнорирующую пиксели заднего плана и используемую для изоляции движущихся в кадре объектов от фона. Эти операции используются в широком наборе алгоритмов обработки изображений и видеоданных, включая классификацию изображений для машинного обучения, для детекции движения, при распознавании жестов и в других задачах машинного зрения.

Новые пиксельные движки

В последние годы игроками всё чаще используются дисплеи ультравысокого разрешения, поддерживающие высокую частоту обновления, что требует высокопроизводительной пиксельной обработки (филлрейта). Современные мониторы имеют 4K, 5K, и даже 8K-разрешения, и некоторые из них отличаются высокой частотой обновления, вплоть до 240 Гц, что повышает требования к графическим процессорам. Да и шлемы виртуальной реальности более чем удваивают нагрузку на пиксельные движки, по сравнению с FullHD-мониторами. Поэтому неудивительно, что графический процессор Vega получил улучшенные пиксельные движки, которые были спроектированы для повышения производительности, более эффективного использования данных и соответствующего увеличения энергоэффективности.

Новый движок отличается от предыдущих тем, что использует тайловую растеризацию Draw Stream Binning Rasterizer (DSBR), аналогично тому, что было сделано инженерами Nvidia в Maxwell и следующих архитектурах. В процессе обработки пикселей используется начиповый кэш для промежуточного хранения данных и новая логика работы растеризатора, который разбивает буфер на тайлы. Далее пиксельный движок определяет, какие геометрические примитивы попадают в каждый тайл (binning), генерируется список примитивов и вызовов функций отрисовки (draw stream) для каждого тайла, и каждый тайл затем отдельно растеризуется с большей эффективностью, используя при работе только начиповый кэш, исключая необходимость обращения к более медленной локальной видеопамяти.

Мы неоднократно писали о таком гибридном методе, сочетающем преимущества привычного подхода и тайловых графических архитектур, и подробно останавливаться на деталях уже не будем. Основной плюс такого подхода состоит в сокращении необходимости чтения и записи данных из медленной видеопамяти, при тайловой растеризации это делается лишь один раз. В Vega 10 используется относительно малое количество тайлов и GPU работает с партиями примитивов ограниченного размера, по сравнению с тайловыми архитектурами прошлого. Это позволяет снизить затраты, связанные с отсечением и сортировкой, особенно высокие в случае геометрически сложных сцен, обеспечивая большую производительность и эффективность.

Затенение пикселей также может быть отложено до обработки всей геометрии, чтобы осуществлять работу только над видимыми пикселями. При этом отрисовываются только видимые камере пиксели, а значения невидимых отбрасываются, что повышает производительность и эффективность. Такое отложенное затенение можно запретить для тех тайлов, которые содержат полупрозрачные полигоны, чтобы не нарушать правильность рендеринга сцены.

Тайловые оптимизации Draw Stream Binning Rasterizer значительно снижают количество обращений к видеопамяти, увеличивая общую производительность и повышая энергоэффективность. В случае Vega 10, применение тайловой растеризации обеспечивает снижение требований к ПСП примерно на 10-15% (иногда и больше) в различном программном обеспечении при аналогичном энергопотреблении.

 

Правда, не очень понятно, насколько это повысит производительность Vega 10, не особо страдающей от нехватки ПСП. Возможно, на 10-15% меньшие требования к ПСП не дадут увеличения скорости в принципе. А вот где есть приросты производительности, так это в профессиональных приложениях, особенно если разработчики ПО отправляют геометрию на отрисовку специальным образом или если отрисовывают большое количество перекрывающих друг друга треугольников. К примеру, в тесте energy01 из пакета SPECviewperf 12 скорость рендеринга при включении DSBR вырастает более чем вдвое.

Высокая производительность — это отлично, но не менее важна и функциональность. Новые пиксельные движки Vega 10 были специально доработаны для поддержки большинства функций DirectX 12 с уровнем возможностей Feature Level 12_1, а также имеют расширенную поддержку Vulkan 1.0. В результате, новый графический процессор AMD имеет наиболее полную поддержку Feature Level 12_1 на данный момент, которая превосходит не только GPU компании прошлого поколения, но и лучшего из имеющихся конкурентов — графические процессоры семейства Pascal от NVIDIA.

 

В частности, в Vega появилась поддержка Raster Ordered Views, Conservative Rasterization уровня Tier 3 и Tiled Resources уровня Tier 3, что несколько лучше, чем возможности любых GPU конкурента. К примеру, дополнительный третий уровень возможностей для консервативной растеризации позволяет использовать её в алгоритмах эффективного отбрасывания невидимой геометрии (occlusion culling).

Никуда не делось и весьма эффективное использование асинхронных вычислений, которое является давним преимуществом решений AMD. Применение этой возможности в DX12-версии игры The Division даёт прирост в 13%, а все специфические оптимизации основного процесса рендеринга игры DOOM на PS4, просто перенесённые на ПК с графическим процессором AMD, сразу же дали 43% прироста в скорости.

 

Пожалуй, можно назвать графический процессор Vega 10 самым функциональным видеочипом из ныне существующих на рынке, и особенно полезен он будет для разработчиков игр, которые стараются использовать продвинутые алгоритмы и техники, а также все новые технологии. В качестве яркого примера такой игры можно назвать грядущую Wolfenstein II: The New Colossus на движке id Tech 6, в котором планируется применять такие возможности, как Rapid Packed Math, асинхронные вычисления, и интринсики вычислительных шейдеров.

Вывод на дисплей и обработка видеоданных

Графический процессор Vega 10 предлагает наиболее современную поддержку всех современных стандартов вывода изображения на дисплеи, превосходя по этим возможностям предыдущие решения семейства Polaris. Новый GPU поддерживает стандарт DisplayPort 1.4 с HBR3, MST и HDR, а также HDMI 2.0 с выводом информации в разрешении до 4K при частоте обновления в 60 Гц, в 12-битном цветовом формате и 4:2:0 кодировании. Защищённый контент при помощи HDCP поддерживается для HDMI и DisplayPort портов. Конечно же, то же самое касается технологии FreeSync, графический процессор поддерживает как динамически изменяемую частоту обновления FreeSync, так и вторую версию стандарта с поддержкой HDR-дисплеев с низкими задержками и высоким качеством изображения.

 

Нужно отметить, что экосистема Radeon FreeSync постоянно развивается, и на рынке уже доступны сотни моделей мониторов с поддержкой технологии динамической частоты обновления экрана от AMD. Из последних новинок на рынке можно отметить три типа FreeSync-дисплеев: с разрешением 1440p и частотой обновления до 144 Гц, с разрешением 3440x1440 пикселей при 100 Гц и 4K-дисплеи с частотой обновления в 60 Гц.

Как и Polaris, новая Vega поддерживает до шести одновременно подключенных дисплеев, но эта поддержка расширена в сторону больших разрешений, частоты обновления и глубины цвета. HDR-дисплеи требуют большей полосы пропускания из-за увеличения объёма передаваемой информации, и поэтому многомониторные системы имеют более жёсткие ограничения по подключению. Vega 10 утраивает число подключаемых мониторов при 4K 60 Гц и 64-битном HDR-формате, и добавляет поддержку двух дополнительных режимов вывода, на которые не способен Polaris.

 

В состав графического процессора Vega 10 включены самые современные движки для кодирования и декодирования видеоданных. Как и предыдущие GPU, новая Vega поддерживает аппаратное декодирование формата HEVC/H.265 с профилем Main 10 при разрешениях до 3840x2160 и с 60 FPS, с поддержкой 10-битного цвета для HDR. Декодирование формата H.264 также поддерживается до 4K-разрешения при 60 кадрах в секунду, а декодирование формата VP9 при разрешениях до 3840x2160 использует гибридный подход, использующий и блок декодирования видео и шейдерные движки GPU, чтобы снизить нагрузку на центральный процессор системы.

Аппаратный кодировщик, встроенный в Vega, также поддерживает большинство популярных форматов, он может кодировать данные в HEVC/H.265 при FullHD-разрешении и 240 FPS, в 1440p-разрешении при 120 FPS и в 4К-разрешении при 60 FPS. Кодирование видео в формате H.264 поддерживается для 1920x1080 при 120 FPS, для 1440p и 4K — при 60 FPS (последнее также было недоступно в Polaris, который способен максимум на 30 FPS для 4K-разрешения).

Также Vega 10 имеет аппаратную поддержку технологии виртуализации SR-IOV, позволяя делить ресурсы GPU между несколькими сеансами в виртуализированной среде. Vega 10 добавляет возможность общего использования аппаратного кодирования и декодирования видео и обеспечивает ускорение аппаратного кодирования в 16 одновременных сеансах. Эта возможность будет полезна для многопользовательской виртуализации при интенсивных графических нагрузках, вроде удаленных рабочих станций и облачных игр.

Нововведения и улучшения в программной части

Не можем мы обойти и вопросы работы программных технологий. Так, использование технологии Radeon Chill, позволяющей ограничить частоту кадров, а вместе с ней и потребление энергии, обеспечивает значительно лучшую энергоэффективность, по сравнению с обычным режимом по умолчанию. В протестированных специалистами AMD играх (не только нетребовательных сетевых, вроде DOTA 2, но и таких проектах, как Battlefield 1) было отмечено снижение энергопотребления на 50-75%, что может быть весьма полезно.

 

Ещё одна интересная технология, доступная в драйверах видеокарт Radeon — Enhanced Sync. Она работает как и аналогичная возможность в драйверах конкурентов, снижая задержки вывода на дисплей в различных случаях. Технология работает и при подключении мониторов с фиксированной частотой обновления и с FreeSync-мониторами, поддерживающими компенсацию низкой частоты кадров LFC и обеспечивает снижение задержек до 68% по сравнению с режимом включенной вертикальной синхронизации в DOTA 2. В других играх улучшения также заметны:

 

Технология Radeon WattMan уже известна нам по предыдущим решениям, она позволяет простым способом настроить оптимизированные по энергопотреблению и производительности режимы работы. Вместе с Vega 10 в драйверах появились предустановленные профили производительности/потребления: power save, balance, turbo и пользовательский custom, отличающиеся различными пределами потребления энергии:

 

Режим power save устанавливает самое низкое значение энергопотребления, он самый экономичный и тихий, в смысле шума от вентилятора системы охлаждения. В среднем, этот режим на 25-35% энергоэффективнее сбалансированного. Турборежим наиболее производительный, но к сбалансированному он добавляет лишь несколько процентов скорости даже в самых тяжёлых условиях работы. Этот экстремальный режим будет полезен скорее для любителей разгона. К слову, для тех, кто хочет ещё большей свободы в настройках энергопотребления, в AMD добавили второй BIOS, который можно включить (с перезагрузкой, конечно же) при помощи специального переключателя на плате: primary и secondary.

Интересно также, что в драйвере для Vega можно изменять режим работы High Bandwidth Cache Controller. При включении кэширования видеопамяти можно также задать объём доступной системной памяти, который будет использоваться для дополнения к локальной видеопамяти на GPU. К примеру, при выделении 4 ГБ из системного ОЗУ и при добавлении к ним 8 ГБ кэша HBCC, общий объём доступной приложениям видеопамяти станет равным 12 ГБ.

Особенно полезным режим может быть в случае недостатка 8 ГБ локальной памяти, имеющейся у игровых вариантов Vega, ведь при помощи этой настройки её можно расширить до требуемого значения. На практике, включение кэширования HBCC не всегда приводит к повышению производительности, зачастую она даже немного снижается, если 8 ГБ локальной видеопамяти и так достаточно. Но в некоторых приложениях специалисты компании AMD обнаружили повышение производительности. Например, в бенчмарке Unigine Heaven отмечается рост скорости рендеринга на 7%.

Краткие выводы

Что касается самого важного вопроса 3D-производительности, то архитектура Vega обеспечивает значительное улучшение в производительности относительно предыдущих GPU компании, и комбинация архитектурных улучшений и более высокой частоты работы позволяет новому GPU значительно опередить графический процессор предыдущего поколения, аналогичный по позиционированию — Fiji. Тактовая частота нового GPU выросла более чем в полтора раза, что сказалось на большинстве теоретических цифр, а скорость FP16-вычислений благодаря Rapid Packed Math возросла ещё больше.

Видеокарты моделей Radeon RX Vega 64 и RX Vega 56 стали одними из первых решений семейства Vega, основанными на графическом процессоре, произведенном при помощи технологического процесса 14 нм FinFET LPP. Новый графический процессор компании AMD отличается новыми функциональными возможностями и архитектурными оптимизациями, что позволило значительно улучшить производительность и энергоэффективность нового решения, как минимум в теории.

Хотя графический процессор Vega 10 архитектурно во многом повторяет решения из предыдущих архитектур, да и в целом графические процессоры разных поколений GCN по сути не слишком сильно отличаются друг от друга, но по уверениям AMD в новом GPU было сделано множество улучшений для более эффективных вычислений и для ускорения процесса рендеринга. Vega 10 имеет новые функциональные возможности, и должна быть более эффективной, по сравнению с Polaris и Fiji. А это, в свою очередь, означает лучшие пользовательские характеристики по тепловыделению и шуму от системы охлаждения.

На какое-то время архитектура Vega стала основой высокопроизводительных графических решений компании AMD. Несколько раньше игровых видеокарт вышли решения для серьёзных вычислений Radeon Instinct, также были анонсированы и видеокарты для профессиональной графики Radeon Pro на основе графического процессора Vega 10. Но ещё более интересным является вариант RX Vega 56 на основе урезанного чипа Vega 10, обладающий более привлекательным соотношением цены и производительности.

По предварительным же оценкам и тестам, Radeon RX Vega 56 смотрится очень неплохо, частенько опережая конкурента в лице GeForce GTX 1070, особенно с учётом более низкой рекомендованной цены. Но тут нужно учитывать, что видеокарта NVIDIA продаётся на рынке уже очень давно и цены на неё давно устаканились, в отличие от новинки компании AMD, которая до сих пор продаётся в недостаточных объёмах и по завышенным ценам, не позволяющим делать однозначные выводы о её конкурентоспособности. Но всё же именно модель Radeon RX Vega 56 кажется нам наиболее удачной с рыночной точки зрения, обладая привлекательным соотношением рекомендуемой цены и производительности. Но реальные цены нужно снижать, улучшая рыночную доступность, ведь конкурент не дремлет, анонсировав GeForce GTX 1070 Ti совсем недавно.

Графический ускоритель Radeon RX 580

Параметр Значение
Кодовое имя чипа Polaris 20
Технология производства 14 нм FinFET
Количество транзисторов 5,7 млрд.
Площадь ядра 232 мм²
Архитектура Унифицированная, с массивом общих процессоров для потоковой обработки многочисленных видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectX DirectX 12, с поддержкой уровня возможностей Feature Level 12_0
Шина памяти 256-битная: восемь независимых 32-битных контроллеров памяти с поддержкой GDDR5-памяти
Частота графического процессора 1257 (1340) МГц
Вычислительные блоки 36 вычислительных блоков GCN, включающих 144 SIMD-ядер, состоящих в целом из 2304 ALU для расчетов с плавающей запятой (поддерживаются целочисленные и плавающие форматы, с точностью FP16, FP32 и FP64)
Блоки текстурирования 144 текстурных блока, с поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
Блоки растеризации (ROP) 32 блока ROP с поддержкой режимов сглаживания с возможностью программируемой выборки более чем 16 сэмплов на пиксель, в том числе при FP16- или FP32-формате буфера кадра. Пиковая производительность до 32 отсчетов за такт, а в режиме без цвета (Z only) — 128 отсчетов за такт
Поддержка мониторов Интегрированная поддержка до шести мониторов, подключенных по интерфейсам DVI, HDMI 2.0b и DisplayPort 1.3/1.4 Ready
 
Спецификации референсной видеокарты Radeon RX 580
 
Параметр Значение
Частота ядра 1257 (1340) МГц
Количество универсальных процессоров 2304
Количество текстурных блоков 144
Количество блоков блендинга 32
Эффективная частота памяти 8000 (4×2000) МГц
Тип памяти GDDR5
Шина памяти 256-бит
Объем памяти 4/8 ГБ
Пропускная способность памяти 256 ГБ/с
Вычислительная производительность (FP32) до 6,2 терафлопс
Теоретическая максимальная скорость закраски 43 гигапиксел/с
Теоретическая скорость выборки текстур 193 гигатекселя/с
Шина PCI Express 3.0
Разъемы Один разъем HDMI и три DisplayPort
Энергопотребление до 185 Вт
Дополнительное питание Один 8-контактный разъем
Число слотов, занимаемых в системном корпусе 2
Рекомендуемая цена 13449/15299 руб

Название рассматриваемой видеокарты соответствует текущей системе наименований компании AMD. Имя модели отличается от предшествующей ей RX 480 лишь измененной цифрой условного поколения — RX 580. Изменение хоть и понятное, но довольно спорное, ведь никакого нового поколения на деле нет, это всё тот же старый добрый Polaris. Куда справедливее было бы название типа Radeon RX 485, но разве оно звучит, что называется? Впрочем, AMD можно понять, при почти уже прошедшем годе отсутствия действительно новых GPU им нужно что-то выпускать, и желательно назвать это что-то названием погромче.

Понятно, что старшая модель семейства Radeon RX 500 встала в текущей линейке компании на место предыдущей RX 480, аналогичной по позиционированию, ведь это просто её разогнанный вариант. Рекомендованные цены на Radeon RX 580 довольно привлекательны, но они не сильно отличаются от цен видеокарт почти годичной давности. Впрочем, на рынке новая видеокарта AMD будет конкурировать с более дорогим вариантом GeForce GTX 1060 с 6 ГБ видеопамяти, и на его фоне предложение по соотношению цены и производительности в своем классе можно назвать неплохим.

Как и их предшественницы, видеокарты Radeon RX 580 поставляются в версиях с 4 ГБ и 8 ГБ GDDR5-памяти, и это даёт партнёрам компании максимальную гибкость. Младший вариант позволит покупателям сэкономить, так как 4 ГБ до сих пор достаточно в большом количестве игр и это — оптимальный объём видеопамяти для видеокарты этого класса на момент её выхода. Но и у 8 ГБ варианта есть своё преимущество, которое уже раскрывается в играх при использовании высоких разрешений, а в перспективе такой объём видеопамяти станет только актуальнее. 8 ГБ памяти дают запас на будущее, так как требования к объему VRAM постоянно растут, и он позволит избежать неприятных падений производительности и рывков FPS.

Для дополнительного питания референсной платой используется один 8-контактный разъем, в отличие от 6-контактного у Radeon RX 480, а значение типичного энергопотребления для новинки составляет 185 Вт, в отличие от 150 Вт для предшественницы, и это — правильное решение. Оно позволяет обеспечить GPU и другие компоненты большим количеством энергии, что особенно важно с учётом проблем референсной Radeon RX 480, которая была вынуждена забирать очень много энергии с PCI Express слота, так как одиночный 6-контактный разъём не обеспечивал необходимого для GPU количества энергии.

Понятно, что запас по питанию позволил улучшить как частотные характеристики референсной видеокарты, так и её разгонный потенциал. К слову, «близость» Polaris 20 и Polaris 10 (фактически, это просто разные ревизии одного чипа) сыграла тут на пользу новинке, так как партнёры компании AMD сразу же анонсировали и выпустили фабрично разогнанные версии представленной сегодня видеокарты Radeon RX 580, отличающихся друг от друга, как системами охлаждения, так и устройством и характеристиками подсистем питания.

Архитектурные особенности

Графический процессор Polaris 10/20 относится к четвертому поколению архитектуры Graphics Core Next, самому совершенному по сей день. Архитектура Polaris изменилась по сравнению с предыдущими поколениями GPU не слишком сильно, в список улучшений входит: улучшенная обработка геометрии, поддержка нескольких проекций при рендеринге VR с разным разрешением, обновленный контроллер памяти с улучшенным сжатием данных, модифицированная предвыборка инструкций и улучшенная буферизация, планирование и приоритизация вычислительных задач в асинхронном режиме, поддержка операций над данными в формате FP16/Int16 и др.

Базовым блоком архитектуры является вычислительный блок Compute Unit (CU), из которых собраны все графические процессоры AMD. Вычислительный блок CU имеет выделенное локальное хранилище данных для обмена данными или расширения локального регистрового стека, а также кэш-память первого уровня с возможностью чтения и записи и полноценный текстурный конвейер с блоками выборки и фильтрации, он разделен на подразделы, каждый из которых работает над своим потоком команд. Каждый из таких блоков занимается планированием и распределением работы самостоятельно. Схема графического процессора (по клику на изображении доступна увеличенная версия иллюстрации):

 

В состав полноценного графического процессора Polaris 10/20 входит один командный процессор Graphics Command Processor, четыре асинхронных вычислительных движка Asynchronous Compute Engines (ACE), два планировщика задач Hardware Scheduler (HWS), 36 вычислительных блоков Compute Unit (CU), четыре геометрических процессора, 144 текстурных модуля TMU (включающих по четыре блока загрузки и сохранения данных LSU на каждый TMU) и 32 блоков ROP. Подсистема памяти рассматриваемого графического процессора компании AMD включает восемь 32-битных контроллеров GDDR5-памяти, дающих общую 256-битную шину памяти, и кэш-память второго уровня объемом в 2 МБ.

Обо всех улучшениях семейства графических процессоров Polaris, включая увеличенный объём кэш-памяти второго уровня и улучшенное кэширование данных, модифицированные геометрические движки, ускоритель отбрасывания геометрических примитивов Primitive Discard Accelerator, новый индексный кэш для дублированной (instanced) геометрии, предвыборку инструкций и их кэширование, поддержку операций над данными в форматах FP16 и Int16, улучшения планировщика заданий для асинхронных вычислений, вы можете прочитать в обзоре видеокарты Radeon RX 480.

Мы же остановимся на отличиях Radeon RX 580 от RX 480. Их не очень много — по сути, это только частоты GPU, которые выросли с 1120/1266 МГц до 1257/1340 МГц для базовой и турбо-частоты, соответственно. Это даёт повышение почти всех цифр пиковой производительности на 6-12%, что не так уж плохо для одного и того же графического процессора, пусть и оптимизированного. Увы, но GDDR5-память неизменного объёма работает с всё той же эффективной тактовой частотой 8 ГГц, что означает пропускную способность шины памяти в 256 ГБ/с, и это в некоторых случаях может служить ограничителем общей производительности, несмотря на все улучшения по внутреннему сжатию данных. Больше из GDDR5 не выжать, а GDDR5X, вероятно, слишком дорога для решений с ценой ниже $250.

По возможностям и поддержке новых технологий, в графическом чипе Polaris 20 нет никаких изменений, и новая видеокарта Radeon RX 580 поддерживает ровно всё то же, что и Radeon RX 480 и другие представители предыдущей серии. В том числе имеется поддержка самых последних стандартов DisplayPort и HDMI. Видеокарты семейства Radeon RX 400 стали одними из первых решений с поддержкой DisplayPort 1.3 HBR3 и DisplayPort 1.4-HDR, отличающихся увеличенной пропускной способностью и поддержкой HDR-дисплеев, и Radeon RX 580 ничем от них не отличается. То же самое касается и поддержки аппаратного кодирования и декодирования видеоданных — в Polaris были сделаны кое-какие улучшения в этой сфере, о которых мы уже писали. Но есть и кое-что новенькое — новый режим пониженного энергопотребления.

Режим пониженного энергопотребления

Все видеокарты серии Radeon RX 500 не только имеют лучшие характеристики по энергоэффективности, но и получили улучшенный режим низкого энергопотребления для видеопамяти, помогающий улучшить энергоэффективность при подключении к двум дисплеям и при просмотре мультимедийного контента. Предыдущие GPU компании поддерживают только два состояния для частот видеопамяти: максимальной производительности и простоя. Подключение второго дисплея к ним автоматически задействует выбор производительного режима, что ведёт к повышенному потреблению энергии.

 

В семействе Radeon RX 500 ввели третий, промежуточный режим работы видеопамяти, и теперь Radeon RX 580 потребляет заметно меньше энергии в таких условиях, по сравнению с Radeon RX 480. Так, при подключении двух 4К-дисплеев по DisplayPort, RX 580 требует всего лишь на 1.5 Вт больше энергии, по сравнению с конфигурацией из одного подключенного дисплея, а RX 480 в таких условиях расходует почти на 8 Вт больше. Про Radeon R9 380 и не говорим, он черпает энергию большими ложками.

 

То же самое касается и энергопотребления при просмотре видеоданных — новые решения, включая Radeon RX 580, потребляют гораздо меньше энергии, чем их предшественники в таком режиме. Рассматриваемая сегодня видеокарта при просмотре потокового 1080p-видео c Youtube потребляет лишь 14 Вт, по сравнению с почти 39 Вт для Radeon RX 480. Может такие достижения и кажутся не слишком значительными, но если учесть, что большую часть времени наши ПК находятся в подобных режимах, то становится понятно, что именно в них и можно сэкономить больше всего энергии.

Программные технологии

Компания AMD продолжает улучшения и программной составляющей своих продуктов. В частности, можно отметить выход нового издания пакета драйверов в декабре 2016 года — ReLive Edition. Это издание уже было загружено пользователями более 10 млн. раз, оно принесло новые возможности, вроде поддержки аппаратного кодирования 4К-видео в форматах HEVC и H.264 для записи игрового процесса и стриминга на популярных сервисах типа Twitch. Естественно, что поддерживается и аппаратное декодирование этих форматов.

Также в новом ReLive Edition появилась поддержка технологии Radeon Chill, позволяющей при сохранении комфортного игрового процесса немного снизить задержки вывода изображения в некоторых случаях, и во всех поддерживаемых играх получить большую энергоэффективность, снизив потребление энергии и температуру нагрева GPU (а значит, и шум от кулера видеокарты). В дополнение к массе игровых приложений, недавно поддержка технологии Chill появилась и в двух самых популярных играх: League of Legends и DOTA 2.

 

Технология постоянно отслеживает ввод данных от пользователя, чтобы определить степень активности его действий. И если он ничего не делает, то Chill немного снижает частоту кадров, чтобы не потреблять излишнюю энергию. Но как только пользователь начинает действовать, Chill тут же повышает FPS до высокого уровня, чтобы сохранить комфорт при игре. И делается это мгновенно, пользователь ничего и не чувствует. Кроме этого, технология устраняет и слишком высокую кадровую частоту, которая тупо жрёт энергию и не даёт никаких преимуществ. Логично, что наибольшую пользу технология может принести в играх, используемых в киберспорте.

 

Кстати, если говорить о технологии Radeon Chill применительно конкретно к Radeon RX 580, то рассматриваемая сегодня новинка при её включении обеспечивает в игре Overwatch при разрешении 1920x1080 пикселей и настройках ультра-качества меньшую задержку вывода (6,1 мс против 16,7 мс) и потребление энергии (91 Вт против 126 Вт) при сохранении приемлемой частоты кадров в 91 FPS, по сравнению с 155 FPS в обычном режиме. Также применение Chill снижает температуру GPU на несколько градусов.

 

А вот такое снижение потребления энергии в AMD измерили в нескольких типичных киберспортивных играх. В зависимости от требовательности игры к мощности графического процессора, включение технологии Chill позволяет сэкономить до 50-70% энергии! Конечно, не каждая игра способна получить преимущество от рассмотренной технологии снижения энергопотребления, она работает только в жёстко определённом специалистами компании списке приложений, но таких проектов уже довольно много и самые важные там есть.

Краткие выводы

Новая модель видеокарты Radeon RX 580 предназначена для самых современных игр при высоких разрешениях и высоких настройках качества, она поддерживает новые графические API: DirectX 12 и Vulkan, способна обеспечить максимальный комфорт в приложениях виртуальной реальности, а также поддерживает программные технологии компании AMD, включая FreeSync, ReLive и Chill.

Но самый интересный вопрос — производительность новинки, ведь она не так уж сильно отличается от Radeon RX 480 даже по своим теоретическим характеристикам. AMD сравнивает обновленную модель не с предыдущим поколением, а с более старыми, так как разницы почти никакой позиционирует Radeon RX 580 в качестве модели для апгрейда старых решений, чтобы решившиеся на него игроки могли получить достойный комфорт в разрешении 2560x1440 при высоких настройках. И новинка — в целом неплохой вариант для апгрейда видеосистем уровня GeForce GTX 960 и Radeon R9 380, например — производительность в некоторых случаях может почти удвоиться.

И даже если сравнивать новинку с GeForce GTX 970, которая до сих пор неплоха в играх, то Radeon RX 580 имеет явное преимущество в играх, применяющих современные графические API: DirectX 12 и Vulkan, а с учётом наличия 8 ГБ видеопамяти у новой модели AMD, её преимущество в будущем лишь усугубится. Если говорить о позиционировании продукта и сравнении с решениями конкурента, то модель Radeon RX 580 позиционируется на рынке против GeForce GTX 1060 и выглядит неплохо в этом сравнении — чаще всего они идут примерно на равных, но иногда видеокарта AMD имеет небольшое преимущество.

Видеокарта Radeon RX 580 является самым мощным представителем обновленного семейства Polaris, основанной на оптимизированном графическом процессоре, произведенном при помощи улучшенного технологического процесса 14 нм FinFET. По сравнению с предыдущими поколениями, архитектурные оптимизации и техпроцесс позволил значительно повысить энергоэффективность новинки, а вот по сравнению с Radeon RX 480 изменений очень немного, прямо скажем. Хотя они и есть — из-за повышенных частот GPU, можно ожидать роста производительности на 5-10% в случаях, когда она не упирается в пропускную способность видеопамяти.

Старший Polaris остаётся лучшим на данный момент графическим процессором компании AMD, список функциональных изменений и улучшений довольно длинный, но... лишь по сравнению с устаревшими GPU давних лет. Ведь Polaris 20 — это тот же Polaris 10, но с минорными изменениями в виде улучшенной системы питания (только для референсной карты, партнёры и на Radeon RX 480 использовали усиленные и улучшенные схемы), нового режима пониженного энергопотребления и некоторых программных технологий, применимых ко всем решениям компании. В остальном, это всё тот же Polaris, который мы знаем уже целый год.

Главное в представленной видеокарте Radeon RX 580 — то, что это хороший в своём классе продукт, вполне подходящий для того, чтобы сделать модернизацию игрового ПК для тех пользователей, кто этого ещё по какой-то причине не сделал. Новинка отлично подходит для всех современных игр при условии установки высоких и близких к максимальным настройкам качества и сравнительно высоких разрешений, да и в составе систем виртуальной реальности будет смотреться на уровне.

Сочетание привлекательной цены и достаточно высокой производительности, немного увеличенной за счёт повышения тактовой частоты графического процессора, делает Radeon RX 580 одной из самых удачных в среднем ценовом сегменте видеокарт, привлекающем большое количество потенциальных покупателей. Именно такими решениями компания AMD обычно и отыгрывает рыночную долю. Хотя конкуренты у новинки сильные, но они стоят несколько дороже при схожих показателях производительности, а вопрос функциональности спорный, у всех есть свои преимущества.

Графический ускоритель Radeon RX 550

Параметр Значение
Кодовое имя чипа Polaris 12
Технология производства 14 нм FinFET
Количество транзисторов 2,2 млрд.
Площадь ядра 101 мм²
Архитектура Унифицированная, с массивом общих процессоров для потоковой обработки многочисленных видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectX DirectX 12, с поддержкой уровня возможностей Feature Level 12_0
Шина памяти 128-битная: два независимых 64-битных контроллера памяти с поддержкой GDDR5-памяти
Частота графического процессора 1100 (1183) МГц
Вычислительные блоки 8 (из 10 имеющихся) вычислительных блока GCN, состоящих в целом из 512 (из 640 имеющихся) ALU для расчетов с плавающей запятой (поддерживаются целочисленные и плавающие форматы с различной точностью)
Блоки текстурирования 32 (из 40) текстурных блоков, с поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
Блоки растеризации (ROP) 16 блоков ROP с поддержкой режимов сглаживания с возможностью программируемой выборки более чем 16 сэмплов на пиксель, в том числе при FP16- или FP32-формате буфера кадра. Пиковая производительность до 16 отсчетов за такт, а в режиме без цвета (Z only) — 64 отсчетов за такт
Поддержка мониторов Интегрированная поддержка до шести мониторов, подключенных по интерфейсам DVI, HDMI 2.0b и DisplayPort 1.3/1.4 HDR Ready
 
Спецификации референсной видеокарты Radeon RX 550
 
Параметр Значение
Частота ядра 1100 (1183) МГц
Количество универсальных процессоров 512
Количество текстурных блоков 32
Количество блоков блендинга 16
Эффективная частота памяти 7000 (4×1750) МГц
Тип памяти GDDR5
Шина памяти 128-бит
Объем памяти 2/4 ГБ
Пропускная способность памяти 112 ГБ/с
Вычислительная производительность (FP32) до 1,2 терафлопс
Теоретическая максимальная скорость закраски 19 гигапикселей/с
Теоретическая скорость выборки текстур 38 гигатекселей/с
Шина PCI Express 3.0 x8
Энергопотребление до 50 Вт
Дополнительное питание -
Число слотов, занимаемых в системном корпусе 1-2
Рекомендуемая цена $79

Название недорогой видеокарты семейства Radeon 500 соответствует текущей системе наименований компании AMD. Цифровая часть имени модели отличается от решений современной же линейки цифрой, отвечающей за уровень производительности — RX 550. А вот первая цифра семейства вызывает у нас некоторое недоумение, ведь никакого нового поколения GPU на самом деле не было, это всё тот же Polaris, просто самый младший. Впрочем, конкретно видеокарта RX 550 основана на действительно новом GPU Polaris 12, которого не было в предыдущем «поколении», и это её оправдывает.

К слову, именно поэтому, в отличие от других видеокарт текущей линейки Radeon RX 500, модель RX 550 не предназначена для замены какого-либо решения AMD из предыдущего семейства RX 400. Не сказать, чтобы рекомендованная цена на Radeon RX 550 была слишком привлекательной, ведь чуть дороже выйдет уже куда более производительная RX 560, да и RX 460 ещё продаются. Но и у таких решений есть своя ниша, а из конкурентов на рынке для новой видеокарты AMD можно назвать, наверное, свежую GeForce GTX 1030 — примерно столь же слабую, если говорить о серьёзных играх и нагрузках, и столь же достаточную, если говорить о нетребовательных применениях.

Видеокарты Radeon RX 550 поставляются в версиях с 2 ГБ и 4 ГБ GDDR5-памяти, хотя больший объём имеет мало смысла, так как относительно слабый GPU просто не даст возможности почувствовать реальную разницу. Младший вариант позволит сэкономить, так как 2 ГБ для таких видеокарт достаточно, всё равно высокие настройки современных игр они не потянут. Но если хочется 4 ГБ, то это — оптимальный объём видеопамяти для чуть более дорогих видеокарт, который даёт некоторый запас, ведь требования к объему VRAM у игр постоянно растут.

Базовая тактовая частота GPU для референсного варианта Radeon RX 550 равна 1100 МГц, а турбо-частота доходит до 1183 МГц, но партнёры компании AMD выпустили решения и с отличающимися в большую сторону частотами, если это кому-то нужно. Потребление энергии новой бюджетной видеокартой AMD не должно превышать 50 Вт, поэтому Radeon RX 550 вовсе не требует установки разъёмов для дополнительного питания, и даже при условии некоторого разгона, у него не будет никаких проблем с питанием, получаемым исключительно по слоту PCI Express.

Архитектурные особенности

Видеокарта Radeon RX 550 основана на графическом процессоре Polaris 12, который относится к четвёртому поколению архитектуры GCN, до сих пор самому совершенному у AMD. Архитектура Polaris изменилась по сравнению с предыдущими поколениями GPU не слишком сильно, в список улучшений входит: улучшенная обработка геометрии, поддержка нескольких проекций при рендеринге VR с разным разрешением, обновленный контроллер памяти с улучшенным сжатием данных, модифицированная предвыборка инструкций и улучшенная буферизация, планирование и приоритизация вычислительных задач в асинхронном режиме, поддержка операций над данными в формате FP16/Int16 и др.

Базовым блоком архитектуры является вычислительный блок Compute Unit (CU), из которых собраны все графические процессоры AMD. Вычислительный блок CU имеет выделенное локальное хранилище для обмена данными или расширения локального регистрового стека, а также кэш-память первого уровня с возможностью чтения и записи и полноценный текстурный конвейер с блоками выборки и фильтрации, он разделен на подразделы, каждый из которых работает над своим потоком команд. Каждый из таких блоков занимается планированием и распределением работы самостоятельно.

Polaris 12 состоит из 10 вычислительных блоков CU, организованных в два шейдерных движка Shader Engine, обрабатывающих по два треугольника за такт. Устройство GPU аналогично Polaris 11, но с меньшим количеством блоков CU на шейдерный движок. Интересно, что модель Radeon RX 550 использует не полноценный, а урезанный по характеристикам вариант Polaris 12, с 8 активными CU из 10 существующих в чипе. Что даёт 512 потоковых процессоров и 32 текстурных модулей в целом, что по современным меркам маловато, мягко говоря.

Зато Polaris 12 имеет те же 16 блоков ROP, что и старший GPU, и такую же 128-битную шину памяти. Правда, в отличие от Polaris 11 был снижен и объём кэш-памяти второго уровня, если старший чип имеет 1 МБ L2-кэша, то в Polaris 12 он был уполовинен до 512 КБ. В качестве локальной видеопамяти используется достаточно быстрая GDDR5-память с эффективной частотой в 7 ГГц, обеспечивающая высокую для этого класса пропускную способность в 112 ГБ/с. Так что уж чего-чего, а ПСП у нового решения более чем достаточно и в её недостаток GPU упираться точно не будет.

Новый бюджетный GPU состоит из 2,2 млрд. транзисторов и имеет размер кристалла в 101 мм2 — удивительно, что он получился не особенно то и меньше размером, чем Polaris 11. Получается, что AMD уменьшила GPU лишь на 0,8 млрд. транзисторов и 22 мм2, то есть около 20%, а по количеству функциональных блоков разница велика. Так что CU занимают не такую уж и большую часть от всего чипа, много уходит на остальную обвязку. Но, вероятно, для нижнего ценового диапазона есть смысл даже в столь небольшом снижении сложности, энергопотребления и себестоимости.

Зато с функциональной точки зрения Polaris 12 ничем не отличается от других графических процессоров Polaris, и в состав архитектурных улучшений входит улучшенное кэширование данных, предвыборка инструкций и их кэширование, модифицированные геометрические движки, ускоритель отбрасывания геометрических примитивов, новый индексный кэш для дублированной геометрии, поддержка операций над данными в форматах FP16 и Int16, улучшения планировщика заданий для асинхронных вычислений. Обо всём этом вы можете прочитать в обзоре видеокарты Radeon RX 480.

Новая видеокарта Radeon RX 550 поддерживает всё то же самое, что и Radeon RX 580 и другие представители предыдущей и текущей серии. В том числе имеется поддержка самых последних стандартов DisplayPort и HDMI. Видеокарты семейства Radeon RX 400 стали одними из первых решений с поддержкой DisplayPort 1.3 HBR3 и DisplayPort 1.4-HDR, отличающихся увеличенной пропускной способностью и поддержкой HDR-дисплеев, и Radeon RX 550 ничем от них не отличается. То же самое касается и поддержки аппаратного кодирования и декодирования видеоданных — в Polaris были сделаны кое-какие улучшения в этой сфере, о которых мы уже писали.

Технология Radeon Chill

Также мы писали и о технологии Radeon Chill, которая появилась в новых драйверах AMD. Эта технология позволяет чуть-чуть снизить задержки вывода изображения и в поддерживаемых играх получить большую энергоэффективность, снизив потребление энергии, температуру нагрева GPU и шум от кулера видеокарты, при сохранении необходимого комфорта в игре. Наибольшую пользу технология приносит как раз в играх, используемых в киберспорте (Counter Strike: Global Offensive, Dota 2, League of Legends, Overwatch и другие), на которые и рассчитана видеокарта Radeon RX 550.

Технология AMD постоянно отслеживает ввод данных от пользователя, определяя степень его активности. Если пользователь пассивен, то Chill снижает частоту кадров для того, чтобы снизить потребление энергии, но как только игрок начинает действовать, Chill тут же повышает FPS до высокого уровня, чтобы сохранить комфорт игрового процесса. Важно, что делается это мгновенно и пользователь ничего не чувствует. Технология снижает слишком высокую частоту вывода кадров на экран, которая просто бесполезна и впустую потребляет энергию, не давая никаких преимуществ.

Если говорить о технологии Radeon Chill применительно конкретно к Radeon RX 550, то бюджетная модель при её включении в типичной киберспортивной игре Counter Strike: Global Offensive, обеспечивает снижение среднего потребления энергии на 37% (19 Вт вместо 29 Вт), обеспечивает на 15 градусов меньшую температуру GPU и пониженную задержку вывода (5 мс против 8 мс).

 

В киберспортивных играх Radeon RX 550 способен обеспечить более чем играбельную частоту кадров при разрешении FullHD. И вместо того, чтобы тратить энергию на лишние FPS, технология Chill позволяет сэкономить энергию, понизить температуру GPU и т.д. Собственные тесты компании AMD в серии мультиплеерных матчей показали значительный эффект от включения технологии — Chill помогает снизить энергопотребление в некоторых случаях более чем вдвое!

 

Но не каждая игра способна получить преимущество от технологии снижения энергопотребления Chill, она работает только в жёстко определённом специалистами компании списке приложений. Впрочем, таких проектов уже довольно много и самые важные из киберспортивных игр там точно есть.

Краткие выводы

Особое внимание компания AMD уделяет тому, что Radeon RX 550 даёт отличную возможность апгрейда с интегрированных GPU — новинка компании значительно быстрее как встроенных в CPU видеоядер Intel, так и предыдущих решений компании, относящихся к этому же ценовому сегменту. Да, AMD сравнивает обновленную модель не с предыдущим поколением, а с более старыми, так как позиционирует Radeon RX 550 в качестве подходящего варианта для апгрейда именно очень старых решений, вроде Radeon R7 250. Новый GPU примерно более чем вдвое быстрее GPU одного из предыдущих поколений Oland. Также в своих оценках AMD уделяет много внимания тому, что новая модель Radeon RX 550 отлично подходит для киберспортивных развлечений, в которые играют сотни миллионов пользователей по всему миру.

Кроме киберспортивных игр, которые не являются требовательными к мощности GPU, пользователи Radeon RX 550 будут запускать и обычные одиночные игры, использующие современные графические API, такие как DirectX 11/12 и Vulkan. Новинка способна обеспечить приемлемую скорость рендеринга даже в современных проектах при среднем (иногда низком, но иногда и высоком) качестве графики — чаще всего достигается частота кадров от 30 до 50 FPS, что вполне комфортно для большинства однопользовательских игр.

Radeon RX 550 действительно выглядит любопытным вариантом для недорогого апгрейда устаревших видеосистем или встроенных в CPU видеоядер. По сравнению с устаревшими решениями, архитектурные оптимизации и 14 нм FinFET техпроцесс позволили значительно повысить энергоэффективность GPU, а вместе с ними и скорость рендеринга. 3D-производительность в некоторых случаях увеличилась в несколько раз. Radeon RX 550 имеет явное преимущество в играх, применяющих современные графические API, а наличие 2 или 4 ГБ очень быстрой GDDR5-видеопамяти у новой модели AMD лишь увеличивает её преимущество во многих задачах.

Видеокарты вроде Radeon RX 550 важны для рынка потому, что для многих пользователей их возможностей и производительности будет вполне достаточно. Если требуется начальный уровень 3D или функциональность домашнего кинотеатра, то это — почти идеальный вариант, который точно будет быстрее и функциональнее любого интегрированного GPU и даст вполне достаточную производительность для MOBA и других аналогичных игр. Так как AMD позиционирует новинку, как вариант для апгрейда, то понятны и её потенциальные покупатели — владельцы решений вроде Radeon R7 250 и более старых.

А если говорить о функциональности HTPC, то у Radeon RX 550 также есть всё необходимое: поддержка HDMI 2.0 (вывод изображения в 4K-разрешении при 60 Гц частоте обновления) и отличный блок для обработки видеоданных с поддержкой аппаратного декодирования формата HEVC в 4K-разрешении, поддержка HDR-дисплеев, относительно низкое энергопотребление в 50 Вт максимум и наличие низкопрофильных дизайнов с малошумным охлаждением для применения в миниатюрных системах домашних кинотеатров.

Radeon RX 550 — это хороший для своего класса продукт, вполне подходящий для модернизации теми пользователями, кто этого ещё по какой-то причине не сделал. Такие недорогие видеокарты чаще всего покупают те, кто не нуждается в большей скорости 3D-рендеринга, но кому нужны какие-то другие функции дискретных GPU. Те, кому не хватает возможностей и производительности интегрированных видеоядер, желающих потратить минимум средств на дискретную видеокарту. Правда, рекомендованная цена в $79 для Radeon RX 550 выглядит несколько завышенной — получается не слишком большая экономия, по сравнению с $99 за куда более производительный Radeon RX 560.

Так что если речь идёт о современных играх, пусть и при не самых высоких настройках, то вполне вероятно, есть смысл добавить немного денег к выделенному на видеокарту бюджету, получив куда большую отдачу, а не довольствоваться самым дешёвым GPU. Но в остальных случаях, требующих экономии и минимальных возможностей, Radeon RX 550 — это вполне достойная замена интегрированным и устаревшим GPU. Тем более, что функционально это всё тот же Polaris, который мы знаем уже второй год и который обладает поддержкой всех современных технологий.

Справочная информация о семействе видеокарт Radeon X
Справочная информация о семействе видеокарт Radeon X1000
Справочная информация о семействе видеокарт Radeon HD 2000
Справочная информация о семействе видеокарт Radeon HD 4000
Справочная информация о семействе видеокарт Radeon HD 5000
Справочная информация о семействе видеокарт Radeon HD 6000
Справочная информация о семействе видеокарт Radeon HD 7000
Справочная информация о семействе видеокарт Radeon 200
Справочная информация о семействе видеокарт Radeon 300
Справочная информация о семействе видеокарт Radeon 400
Справочная информация о семействе видеокарт Radeon 500 и Vega
 

 

 

29 октября 2017 Г.

AMD Radeon —

AMD Radeon



Radeon X
Radeon X1000
Radeon HD 2000
Radeon HD 4000
Radeon HD 5000
Radeon HD 6000
Radeon HD 7000
Radeon 200
Radeon 300
Radeon 400
Radeon 500 Vega

Radeon 500

Vega 10 Polaris 10/20 Polaris 11/21 Polaris 12
-
() 14
() 12,5 5,7 3,0 2,2
4096 2304 1024 512
256 144 64 32
64 32 16
2048 256 128
HBM2 GDDR5
PCI Express 3.0 x16
DVI Dual-Link
HDMI 2.0b
DisplayPort 1.4
D3D Feature Level 12_1 12_0
FP16/FP32/FP64 FP32/FP64




Radeon 500

ALU/TMU/ROP , , , , /c
()
-
,
, TDP,
Radeon RX Vega 64 Vega 10 4096/256/64 1247(1546) 945(1890) 8 HBM2 484 (2048) 320-396 80-100 295
Radeon RX Vega 56 Vega 10 3584/224/64 1156(1471) 800(1600) 8 HBM2 410 (2048) 260-330 74-94 210
Radeon RX 580 Polaris 10/20 2304/144/32 1257(1340) 2000(8000) 4/8 GDDR5 256 (256) 181-193 40-43 185
Radeon RX 570 Polaris 10/20 2048/128/32 1168(1244) 1750(7000) 4/8 GDDR5 224 (256) 150-160 37-40 150
Radeon RX 560 Polaris 11 1024/64/16 1175(1275) 1750(7000) 2/4 GDDR5 112 (128) 75-82 18-20 80
Radeon RX 550 Polaris 12 512/32/16 1100(1183) 1750(7000) 2/4 GDDR5 112 (128) 35-38 18-19 50


Radeon RX Vega 64 ( )

Vega 10
14 FinFET LPP
12,5 .
486 ²
, : , .
DirectXDirectX 12, Feature Level 12_1
2048- High Bandwidth Memory
1274 (1546)
64 GCN, 4096 ALU ( INT8, INT16, FP16, FP32 FP64)
256 ,
(ROP)64 ROP 16 , FP16- FP32- . 64 , (Z only) — 256
, DVI, HDMI 2.0b DisplayPort 1.4




Radeon RX Vega 64

1274 (1546)
4096
256
64
1890 (2×945)
HBM2
2048-
8
484 /
(FP32) 12,7
99 /
396 /
PCI Express 3.0
HDMI DisplayPort
295
8-
, 2
$499 ( )


Radeon RX Vega 56

1156 (1471)
3584
224
64
1600 (2×800)
HBM2
2048-
8
410 /
(FP32) 10,5
94 /
330 /
PCI Express 3.0
HDMI DisplayPort
210
8-
, 2
$399 ( )

AMD . -, ( Fury ) — Vega, -, GCN — 64 56 . 560, 570 580 . RX , . : R7 , R9, . , AMD RX, .

Vega , Polaris (Radeon 500) . Vega 64 56 , Liquid Cooled Edition ( , ). :

— $399 RX Vega 56 $699 . , , . AMD $100? , , , . , .

, $200 Samsung CF791 34" FreeSync, $100 Ryzen 7 X370 — $300, , ( $120).

. , , , , , Radeon RX Vega, . — -, (- , ), - — , , - .

, , : , , . , , . , ( , ).

Radeon RX Vega 64 $499, , , GeForce GTX 1080, . .

, Radeon RX Vega 64 8 HBM2, Vega 56 . 8 GPU . 4 , Fury , 16 HBM2-. 8 « », , , , Vega ( . ).

8- , Radeon RX Vega 64 Vega 10 295 (210 Vega 56). , , — . , Vega 10 ( , ).

Vega

AMD Vega, 14 FinFET LPP 12,5 . Vega 10 45 SRAM-, 1,7 ( ), Infinity Fabric. 486 2 Vega (), Fiji ( Fury):

Vega 10 Graphics Core Next, . Compute Unit (CU), AMD. CU , - , , . .

Vega 10 4 , 4 64 Compute Unit — , , AMD. 4096 , 256 64 ROP. , , GPU, : , , .. ( ):

Vega 10 Fiji, , , . , Radeon RX Vega 64 Liquid Cooled Edition 13,7 27,4 16- , Vega.

AMD Zen, 8% , 18% . , ALU , , ( ) Vega 10 1,7 , 28 1,0-1,3 .

Vega 10 , Infinity Fabric, . AMD, , . GPU Infinity Fabric , , PCI Express, , . Infinity Fabric , Vega ( APU?) .

Vega 10 HBM2- ECC, , GPU. HBM2-, 2048- , 1 , 484 /. HBM2-, . HBM ( Vega ). , HBM1-, Fiji, Fury.

HBM2 GDDR5-, , , Radeon R9 Nano RX Vega Nano ( , ). AMD , , Vega, - , GDDR5-.

32 , . AMD 8 HBM2-, — 16 . , , 8 . , Vega , .

Vega , HBM2- - , . , HBM2 Vega - . AMD, 512 , . 512 — 49- , ? , 48- CPU GPU, CPU GPU, .

, GPU , , . PCI Express , . , , — , , .

AMD, The Witcher Wild Hunt Fallout 4 4K- - , . , 8 , , . , 8 , 4 . , , . , -, , .

, , , - . , , , AMD , , . , - , - , , .

, , -. , , , -. , , , .

, HBM2- , ( SSD-) , — GPU . Vega - High Bandwidth Cache Controller (HBCC).

Vega ( , , ), , . , () . . , , , .

GPU , , PCI Express, ( HBM2-), , (, ) . , , . , , HBM2.

AMD . , Vega, , . , Radeon Pro SSG SSD- , (!), . 8- .

, HBM2: inclusive exclusive, , , : .

, , . , AMD , , Bethesda, , - HBCC.

Vega, GPU - (L2), GCN, . , , ( , . , L2- - (.), AMD — 4 , 2 GPU .

Vega , GPU ( ), RBE (render back-end) - . , (deferred shading), .

Vega , . GPU , , . , 3D- overdraw , , , .

, , , , . , Z- , , , .

Vega 10 , AMD, GPU , . Fiji , GPU Vega 17 ( ). AMD .

, AMD . , GPU, . Primitive Shaders — , , .

(, , ), , : , , , .. Vega Fiji , -! Vega 10 , , 17 .

, . API , , . , AMD .

, ( ). - . , , Polaris. .

Vega — . GPU — intelligent workload distributor (IWD), , (draw calls), . IWD , , wavefront 64 , .

NCU 16-

Vega 10 , , Vega NCU — Next-Generation Compute Unit. Rapid Packed Math — , INT16 FP16 ( FP32).

Vega NCU 128 32- (FP32) , 256 16- (FP16 INT16) , packed-. 8- , — .

INT16 FP16 , , , FP32, , GPU, . , 32- , 16- , . , AMD .

, AMD Nvidia FP16- , ... , GPU, . Vega , , INT16 FP16 . , , Nvidia .

, , . 16- «» , . AMD, FP16 INT16, 3DMark Serra 20-25% , FP32- — . 16- , 25% , 16- Bloom, 20% .

, 16- API, , - , 16- , . , , , 16- .

Vega 40 . 16- , , 32- , , , ADD/SUB , .

NCU 8- SAD (Sum of Absolute Differences), QSAD ( SAD), SAD , «» MQSAD, . , , , .

, , (). 4K, 5K, 8K-, , 240 , . , FullHD-. , Vega , , .

, Draw Stream Binning Rasterizer (DSBR), , Nvidia Maxwell . , . , (binning), (draw stream) , , , .

, , . , . Vega 10 GPU , . , , , .

, . , , . , , .

Draw Stream Binning Rasterizer , . Vega 10, 10-15% ( ) .

, , Vega 10, . , 10-15% . , , . , energy01 SPECviewperf 12 DSBR .

— , . Vega 10 DirectX 12 Feature Level 12_1, Vulkan 1.0. , AMD Feature Level 12_1 , GPU , — Pascal NVIDIA.

, Vega Raster Ordered Views, Conservative Rasterization Tier 3 Tiled Resources Tier 3, , GPU . , (occlusion culling).

, AMD. DX12- The Division 13%, DOOM PS4, AMD, 43% .

, Vega 10 , , , . Wolfenstein II: The New Colossus id Tech 6, , Rapid Packed Math, , .

Vega 10 , Polaris. GPU DisplayPort 1.4 HBR3, MST HDR, HDMI 2.0 4K 60 , 12- 4:2:0 . HDCP HDMI DisplayPort . , FreeSync, FreeSync, HDR- .

, Radeon FreeSync , AMD. FreeSync-: 1440p 144 , 3440x1440 100 4K- 60 .

Polaris, Vega , , . HDR- - , . Vega 10 4K 60 64- HDR-, , Polaris.

Vega 10 . GPU, Vega HEVC/H.265 Main 10 3840x2160 60 FPS, 10- HDR. H.264 4K- 60 , VP9 3840x2160 , GPU, .

, Vega, , HEVC/H.265 FullHD- 240 FPS, 1440p- 120 FPS 4- 60 FPS. H.264 1920x1080 120 FPS, 1440p 4K — 60 FPS ( Polaris, 30 FPS 4K-).

Vega 10 SR-IOV, GPU . Vega 10 16 . , .

. , Radeon Chill, , , , . AMD ( , DOTA 2, , Battlefield 1) 50-75%, .

, Radeon — Enhanced Sync. , . FreeSync-, LFC 68% DOTA 2. :

Radeon WattMan , . Vega 10 /: power save, balance, turbo custom, :

power save , , . , 25-35% . , . . , , , AMD BIOS, ( , ) : primary secondary.

, Vega High Bandwidth Cache Controller. , GPU. , 4 8 HBCC, 12 .

8 , Vega, . , HBCC , , 8 . AMD . , Unigine Heaven 7%.

3D-, Vega GPU , GPU , — Fiji. GPU , , FP16- Rapid Packed Math .

Radeon RX Vega 64 RX Vega 56 Vega, , 14 FinFET LPP. AMD , , .

Vega 10 , GCN , AMD GPU . Vega 10 , , Polaris Fiji. , , .

- Vega AMD. Radeon Instinct, Radeon Pro Vega 10. RX Vega 56 Vega 10, .

, Radeon RX Vega 56 , GeForce GTX 1070, . , NVIDIA , AMD, , . Radeon RX Vega 56 , . , , , GeForce GTX 1070 Ti .

Radeon RX 580

Polaris 20
14 FinFET
5,7 .
232 ²
, : , .
DirectXDirectX 12, Feature Level 12_0
256-: 32- GDDR5-
1257 (1340)
36 GCN, 144 SIMD-, 2304 ALU ( , FP16, FP32 FP64)
144 ,
(ROP)32 ROP 16 , FP16- FP32- . 32 , (Z only) — 128
, DVI, HDMI 2.0b DisplayPort 1.3/1.4 Ready


Radeon RX 580

1257 (1340)
2304
144
32
8000 (4×2000)
GDDR5
256-
4/8
256 /
(FP32) 6,2
43 /
193 /
PCI Express 3.0
HDMI DisplayPort
185
8-
, 2
13449/15299

AMD. RX 480 — RX 580. , , , Polaris. Radeon RX 485, , ? , AMD , GPU - , - .

, Radeon RX 500 RX 480, , . Radeon RX 580 , . , AMD GeForce GTX 1060 6 , .

, Radeon RX 580 4 8 GDDR5-, . , 4 — . 8 , , . 8 , VRAM , FPS.

8- , 6- Radeon RX 480, 185 , 150 , — . GPU , Radeon RX 480, PCI Express , 6- GPU .

, , . , «» Polaris 20 Polaris 10 (, ) , AMD Radeon RX 580, , , .

Polaris 10/20 Graphics Core Next, . Polaris GPU , : , VR , , , , FP16/Int16 .

Compute Unit (CU), AMD. CU , - , , . . ( ):

Polaris 10/20 Graphics Command Processor, Asynchronous Compute Engines (ACE), Hardware Scheduler (HWS), 36 Compute Unit (CU), , 144 TMU ( LSU TMU) 32 ROP. AMD 32- GDDR5-, 256- , - 2 .

Polaris, - , , Primitive Discard Accelerator, (instanced) , , FP16 Int16, , Radeon RX 480.

Radeon RX 580 RX 480. — , GPU, 1120/1266 1257/1340 -, . 6-12%, , . , GDDR5- 8 , 256 /, , . GDDR5 , GDDR5X, , $250.

, Polaris 20 , Radeon RX 580 , Radeon RX 480 . DisplayPort HDMI. Radeon RX 400 DisplayPort 1.3 HBR3 DisplayPort 1.4-HDR, HDR-, Radeon RX 580 . — Polaris - , . - — .

Radeon RX 500 , , . GPU : . , .

Radeon RX 500 , , Radeon RX 580 , Radeon RX 480. , 4- DisplayPort, RX 580 1.5 , , RX 480 8 . Radeon R9 380 , .

— , Radeon RX 580, , . 1080p- c Youtube 14 , 39 Radeon RX 480. , , , , .

AMD . , 2016 — ReLive Edition. 10 . , , 4- HEVC H.264 Twitch. , .

ReLive Edition Radeon Chill, , , GPU ( , ). , Chill : League of Legends DOTA 2.

, . , Chill , . , Chill FPS , . , . , , . , , .

, Radeon Chill Radeon RX 580, Overwatch 1920x1080 - (6,1 16,7 ) (91 126 ) 91 FPS, 155 FPS . Chill GPU .

AMD . , Chill 50-70% ! , , , .

Radeon RX 580 , API: DirectX 12 Vulkan, , AMD, FreeSync, ReLive Chill.

— , Radeon RX 480 . AMD , , Radeon RX 580 , 2560x1440 . — GeForce GTX 960 Radeon R9 380, — .

GeForce GTX 970, , Radeon RX 580 , API: DirectX 12 Vulkan, 8 AMD, . , Radeon RX 580 GeForce GTX 1060 — , AMD .

Radeon RX 580 Polaris, , 14 FinFET. , , Radeon RX 480 , . — - GPU, 5-10% , .

Polaris AMD, , ... GPU . Polaris 20 — Polaris 10, ( , Radeon RX 480 ), , . , Polaris, .

Radeon RX 580 — , , , , - . , .

, , Radeon RX 580 , . AMD . , , , .

Radeon RX 550

Polaris 12
14 FinFET
2,2 .
101 ²
, : , .
DirectXDirectX 12, Feature Level 12_0
128-: 64- GDDR5-
1100 (1183)
8 ( 10 ) GCN, 512 ( 640 ) ALU ( )
32 ( 40) ,
(ROP)16 ROP 16 , FP16- FP32- . 16 , (Z only) — 64
, DVI, HDMI 2.0b DisplayPort 1.3/1.4 HDR Ready


Radeon RX 550

1100 (1183)
512
32
16
7000 (4×1750)
GDDR5
128-
2/4
112 /
(FP32) 1,2
19 /
38 /
PCI Express 3.0 x8
50
-
, 1-2
$79

Radeon 500 AMD. , — RX 550. , GPU , Polaris, . , RX 550 GPU Polaris 12, «», .

, , Radeon RX 500, RX 550 - AMD RX 400. , Radeon RX 550 , RX 560, RX 460 . , AMD , , GeForce GTX 1030 — , , , .

Radeon RX 550 2 4 GDDR5-, , GPU . , 2 , . 4 , — , , VRAM .

GPU Radeon RX 550 1100 , - 1183 , AMD , - . AMD 50 , Radeon RX 550 , , , PCI Express.

Radeon RX 550 Polaris 12, GCN, AMD. Polaris GPU , : , VR , , , , FP16/Int16 .

Compute Unit (CU), AMD. CU , - , , . .

Polaris 12 10 CU, Shader Engine, . GPU Polaris 11, CU . , Radeon RX 550 , Polaris 12, 8 CU 10 . 512 32 , , .

Polaris 12 16 ROP, GPU, 128- . , Polaris 11 - , 1 L2-, Polaris 12 512 . GDDR5- 7 , 112 /. -, GPU .

GPU 2,2 . 101 2 — , , Polaris 11. , AMD GPU 0,8 . 22 2, 20%, . CU , . , , , .

Polaris 12 Polaris, , , , , , FP16 Int16, . Radeon RX 480.

Radeon RX 550 , Radeon RX 580 . DisplayPort HDMI. Radeon RX 400 DisplayPort 1.3 HBR3 DisplayPort 1.4-HDR, HDR-, Radeon RX 550 . — Polaris - , .

Radeon Chill

Radeon Chill, AMD. - , , GPU , . , (Counter Strike: Global Offensive, Dota 2, League of Legends, Overwatch ), Radeon RX 550.

AMD , . , Chill , , , Chill FPS , . , . , , .

Radeon Chill Radeon RX 550, Counter Strike: Global Offensive, 37% (19 29 ), 15 GPU (5 8 ).

Radeon RX 550 FullHD. , FPS, Chill , GPU .. AMD — Chill !

Chill, . , .

AMD , Radeon RX 550 GPU — CPU Intel, , . , AMD , , Radeon RX 550 , Radeon R7 250. GPU GPU Oland. AMD , Radeon RX 550 , .

, GPU, Radeon RX 550 , API, DirectX 11/12 Vulkan. ( , ) — 30 50 FPS, .

Radeon RX 550 CPU . , 14 FinFET GPU, . 3D- . Radeon RX 550 , API, 2 4 GDDR5- AMD .

Radeon RX 550 , . 3D , — , GPU MOBA . AMD , , — Radeon R7 250 .

HTPC, Radeon RX 550 : HDMI 2.0 ( 4K- 60 ) HEVC 4K-, HDR-, 50 .

Radeon RX 550 — , , - . , 3D-, - GPU. , , . , $79 Radeon RX 550 — , $99 Radeon RX 560.

, , , , , GPU. , , Radeon RX 550 — GPU. , Polaris, .



Radeon X
Radeon X1000
Radeon HD 2000
Radeon HD 4000
Radeon HD 5000
Radeon HD 6000
Radeon HD 7000
Radeon 200
Radeon 300
Radeon 400
Radeon 500 Vega