Семейства видеокарт AMD Radeon
Справочная информация




Справочная информация о семействе видеокарт Radeon X
Справочная информация о семействе видеокарт Radeon X1000
Справочная информация о семействе видеокарт Radeon HD 2000
Справочная информация о семействе видеокарт Radeon HD 4000
Справочная информация о семействе видеокарт Radeon HD 5000
Справочная информация о семействе видеокарт Radeon HD 6000
Справочная информация о семействе видеокарт Radeon HD 7000
Справочная информация о семействе видеокарт Radeon 200
Справочная информация о семействе видеокарт Radeon 300
Справочная информация о семействе видеокарт Radeon 400

Спецификации графических процессоров семейства Radeon 400

кодовое имя Polaris 10 Polaris 11
базовая статья здесь -
технология (нм) 14
транзисторов (млрд) 5,7 ?
универсальных процессоров 2304 896
текстурных блоков 144 56
блоков блендинга 32 16
шина памяти 256 128
типы памяти DDR3
GDDR5
системная шина PCI Express 3.0 x16 PCI Express 3.0 x8
интерфейсы DVI Dual-Link
HDMI 2.0b
DisplayPort 1.4
D3D Feature Level 12_0
точность вычислений FP32/FP64




Спецификации референсных карт семейства Radeon 400

карта чип блоков ALU/TMU/ROP частота ядра, МГц частота памяти, МГц объем памяти, ГБ ПСП, ГБ/c
(бит)
текстури-
рование, Гтекс
филлрейт, Гпикс TDP, Вт
Radeon RX 480 Polaris 10 XT 2304/144/32 1120(1266) 2000(8000) 4/8 GDDR5 256 (256) 182 41 150
Radeon RX 470 Polaris 10 Pro 2048/128/32 926(1206) 1650(6600) 4 GDDR5 211 (256) 154 38 120
Radeon RX 460 Polaris 11 896/56/16 1090(1200) 1750(7000) 2/4 GDDR5 112 (128) 67 19 75


Графический ускоритель AMD Radeon RX 480

ПараметрЗначение
Кодовое имя чипаPolaris 10 XT (Ellesmere)
Технология производства14 нм FinFET
Количество транзисторов5,7 млрд.
Площадь ядра232 мм²
АрхитектураУнифицированная, с массивом общих процессоров для потоковой обработки многочисленных видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectXDirectX 12, с поддержкой уровня возможностей Feature Level 12_0
Шина памяти256-битная: восемь независимых 32-битных контроллеров памяти с поддержкой GDDR5-памяти
Частота графического процессора1120 (1266) МГц
Вычислительные блоки36 вычислительных блоков GCN, включающих 144 SIMD-ядер, состоящих в целом из 2304 ALU для расчетов с плавающей запятой (поддерживаются целочисленные и плавающие форматы, с точностью FP16, FP32 и FP64)
Блоки текстурирования144 текстурных блока, с поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
Блоки растеризации (ROP)32 блока ROP с поддержкой режимов сглаживания с возможностью программируемой выборки более чем 16 сэмплов на пиксель, в том числе при FP16- или FP32-формате буфера кадра. Пиковая производительность до 32 отсчетов за такт, а в режиме без цвета (Z only) — 128 отсчетов за такт
Поддержка мониторовИнтегрированная поддержка до шести мониторов, подключенных по интерфейсам DVI, HDMI 2.0b и DisplayPort 1.3/1.4 Ready




Спецификации референсной видеокарты Radeon RX 480

ПараметрЗначение
Частота ядра1120 (1266) МГц
Количество универсальных процессоров2304
Количество текстурных блоков144
Количество блоков блендинга32
Эффективная частота памяти7000-8000 (4×1750-2000) МГц
Тип памятиGDDR5
Шина памяти256-бит
Объем памяти4/8 ГБ
Пропускная способность памяти224-256 ГБ/с
Вычислительная производительность (FP32)до 5,8 терафлопс
Теоретическая максимальная скорость закраски41 гигапиксел/с
Теоретическая скорость выборки текстур182 гигатекселя/с
ШинаPCI Express 3.0
РазъемыОдин разъем HDMI и три DisplayPort
Энергопотреблениедо 150 Вт
Дополнительное питаниеОдин 6-контактный разъем
Число слотов, занимаемых в системном корпусе2
Рекомендуемая цена$199/$229 (для рынка США)

Название первой модели видеокарты компании AMD нового поколения соответствует их текущей системе наименований. Ее имя отличается от предшественников измененным символом в первой части индекса и цифрой поколения — RX 480. Если со вторым изменением все понятно, ведь поколение действительно новое, то замена R9 на RX не совсем логична, на наш взгляд, ведь эта цифра раньше показывала уровень видеокарты: R7 были медленнее, чем R9, но все они выпускались в рамках одного поколения.

Первая модель в новом семействе Radeon 400 становится в текущей линейке компании на место предыдущих решений, аналогичных по позиционированию. Так как выпущенная видеокарта относится скорее к среднему уровню по цене и скорости с учетом нового поколения, то для будущих решений на GPU еще большей мощности решили оставить индекс 490.

Референсный вариант Radeon RX 480 будет предлагаться по рекомендованной цене в $199 в случае 4 ГБ варианта и $229 для 8-гигабайтной модели, и эти цены весьма и весьма привлекательны! По сравнению с топовыми видеокартами предыдущего поколения, это очень хороший ценник, так как Radeon RX 480 по скорости не должна уступать таким моделям, как Radeon R9 390 и GeForce GTX 970. Но конкурировать новинке приходится еще и с GeForce GTX 1060, выпущенной через несколько дней. Впрочем, RX 480 в любом случае стала одним из лучших предложений по производительности в своем классе.

Референсные видеокарты Radeon RX 480 будут поставляться в версиях с 4 ГБ памяти GDDR5 с эффективной частотой в 7 ГГц, и с 8 ГБ памяти с частотой в 8 ГГц. Но по мере поступления в продажу видеокарт собственного производства партнеров AMD, появятся и другие варианты, но все они будут оснащены GDDR5-памятью с частотой как минимум 7 ГГц — такова воля AMD.

Решение по установке 4 и 8 ГБ памяти очень мудрое. Младший вариант позволит немного сэкономить, ведь 4 ГБ на данный момент можно считать «золотой серединой», а преимущество от 8 ГБ памяти у второго варианта Radeon RX 480 раскроется в перспективе. Хотя и 4-гигабайтный вариант видеокарты обеспечит приемлемую производительность в современных играх, но 8 ГБ памяти позволят иметь приличный запас на будущее, так как требования к объему видеопамяти у игр постоянно растут. В качестве примера, преимущество в котором уже заметно, можно привести игру Rise of the Tomb Raider в DirectX 12-версии, при очень высоких настройках и разрешении 2560x1440 пикселей:

Больший объем видеопамяти у Radeon RX 480 8 ГБ и Radeon R9 390 помогает избежать крайне неприятных падений производительности и рывков FPS, по сравнению с 4-гигабайтными вариантами, включая решения конкурентов GeForce GTX 970 и GTX 960. Именно Radeon RX 480 8 ГБ дает возможность получения плавного игрового процесса с отсутствием притормаживаний, связанных с подгрузкой данных, не помещающихся в локальную видеопамять. И так как игровые консоли нынешнего поколения имеют по 8 ГБ общей памяти, то преимущество от большего объема памяти будет только расти со временем, и 8-гигабайтный вариант Radeon RX 480 отлично подойдет для игр, которые будут выходить в следующие несколько лет.

Для дополнительного питания платой используется один 6-контактный разъем, а значение типичного энергопотребления у модели Radeon RX 480 на графическом процессоре Polaris 10 установлено на уровне 150 Вт. Партнеры AMD выпускают и фабрично разогнанные версии этой видеокарты, отличающиеся и системами охлаждения и питания, хотя по скорости они не слишком далеко ушли от референсного варианта.

Архитектурные особенности

Графический процессор Polaris 10 относится к четвертому поколению архитектуры Graphics Core Next, самому совершенному на данный момент. Базовым блоком архитектуры является вычислительный блок Compute Unit (CU), из которых собраны все графические процессоры AMD. Вычислительный блок CU имеет выделенное локальное хранилище данных для обмена данными или расширения локального регистрового стека, а также кэш-память первого уровня с возможностью чтения и записи и полноценный текстурный конвейер с блоками выборки и фильтрации, он разделен на подразделы, каждый из которых работает над своим потоком команд. Каждый из таких блоков занимается планированием и распределением работы самостоятельно.

В своей основе, архитектура Polaris изменилась не слишком сильно, хотя не основные блоки видеочипа изменились заметнее — были серьезно улучшены блоки кодирования и декодирования видеоданных и вывода информации на устройства отображения. В остальном, это очередное поколение известной архитектуры Graphics Core Next (GCN), уже четвертое по счету. Пока что в состав семейства вошли два чипа: Polaris 10 (ранее известный как Ellesmere) и Polaris 11 (ранее известный как Baffin).

И все же некоторые аппаратные изменения в GPU были внесены. В список улучшений и изменений входит: улучшенная обработка геометрии, поддержка нескольких проекций при рендеринге VR с разным разрешением, обновленный контроллер памяти с улучшенным сжатием данных, модифицированная предвыборка инструкций и улучшенная буферизация, планирование и приоритезация вычислительных задач в асинхронном режиме, поддержка операций над данными в формате FP16/Int16. Рассмотрим схему нового графического процессора (по клику на изображении доступна увеличенная версия иллюстрации):

В состав полноценного графического процессора Polaris 10 входит один командный процессор Graphics Command Processor, четыре асинхронных вычислительных движка Asynchronous Compute Engines (ACE), два планировщика задач Hardware Scheduler (HWS), 36 вычислительных блоков Compute Unit (CU), четыре геометрических процессора, 144 текстурных модуля TMU (включающих по четыре блока загрузки и сохранения данных LSU на каждый TMU) и 32 блоков ROP. Подсистема памяти нового графического процессора компании AMD включает восемь 32-битных контроллеров GDDR5-памяти, дающих общую 256-битную шину памяти, и кэш-память второго уровня объемом в 2 МБ.

Заявлено улучшение геометрических движков в Polaris — в частности, появился так называемый ускоритель отбрасывания геометрических примитивов Primitive Discard Accelerator, который работает в самом начале графического конвейера, отбрасывая невидимые треугольники (например, с нулевой площадью). Также в новом GPU был введен новый индексный кэш для дублированной (instanced) геометрии, который оптимизирует перемещения данных и освобождает ресурсы внутренних шин передачи данных и увеличивает эффективность использования ПСП при дублировании геометрии (instancing).

Ускоритель отбрасывания геометрических примитивов помогает увеличить скорость обработки геометрии, особенно в задачах вроде тесселяции с мультисэмплингом. На диаграмме видно, что в разных условиях новый блок позволяет увеличить производительность до трех раз. Впрочем, это синтетические данные заинтересованной стороны, лучше смотреть по игровым результатам независимых тестов.

Также в четвертом поколении GCN была улучшена эффективность исполнения шейдеров — введена предвыборка инструкций, улучшающая кэширование инструкций, снижающая простои конвейера и увеличивающая общую вычислительную эффективность. Еще был увеличен размер буфера инструкций для массива инструкций (wavefront), увеличивающий однопоточную производительность, введена поддержка операций над данными в форматах FP16 и Int16, помогающая снизить нагрузку на память, повысить скорость вычислений и улучшить энергоэффективность. Последнюю возможность можно применять в широком круге задач графики, машинного зрения и обучения.

В очередной раз был улучшен и планировщик заданий hardware scheduler (HWS), использующийся при асинхронных вычислениях. В его задачи входит: разгрузка CPU от задач планирования, приоритезация задач реального времени (виртуальная реальность или обработка звука), параллельное выполнение задач и процессов, менеджмент ресурсов, координация и балансирование загрузки исполнительных блоков. Функциональность этих блоков можно обновить при помощи микрокода.

Кроме того, что объем кэш-памяти второго уровня был увеличен вдвое до 2 МБ, была изменена обработка и кэширование данных в L2-кэше и увеличена общая эффективность работы подсистемы кэш-памяти и локальной видеопамяти. Контроллер памяти получил поддержку GDDR5-памяти с эффективной тактовой частотой до 8 ГГц, что в случае Polaris означает пропускную способность шины памяти до 256 ГБ/с. Но и на этом в AMD не остановились, дополнительно улучшив алгоритмы сжатия данных без потерь (Delta Color Compression — DCC), которым поддерживаются режимы сжатия с соотношением 2:1, 4:1 и 8:1.

Внутричиповое сжатие данных увеличивает общую эффективность работы, обеспечивает более полное использование шины данных и сказывается на энергоэффективности. В частности, если в Radeon R9 290X внутреннего сжатия информации не было и эффективная ПСП равна его физической ПСП, то в случае решения на чипе Fiji сжатие позволило сэкономить почти 20% ПСП, а в случае Polaris и до 35-40%.

Если сравнивать Radeon RX 480 с Radeon R9 290, то новое решение потребляет заметно меньше энергии для обеспечения той же эффективной пропускной способности, по сравнению с видеокартой предыдущего поколения. В результате, у новинки заметно выше и производительность в пересчете на бит — хотя у Radeon R9 290 выше пиковая ПСП, но она куда энергоэффективнее используется в Polaris 10 — общее потребление энергии интерфейсом памяти составляет 58% от потребления старого GPU.

В целом, изменения четвертого поколения GCN в графическом процессоре Polaris связаны с применением продвинутого технологического процесса 14 нм FinFET, микроархитектурными изменениями, оптимизациями физического дизайна и техник управления питанием. Все это принесло свои плоды в виде значительного прироста производительности и эффективности, по сравнению с предыдущими решениями. Если брать самый низкий уровень, то вычислительные блоки CU в Polaris 10 (Radeon RX 480) примерно на 15% производительнее блоков чипа Hawaii (Radeon R9 290).

Сложно судить, насколько велик вклад той или иной оптимизации в общий прирост скорости, но если брать все оптимизации в комплексе, то разница в энергоэффективности между Radeon RX 470 и Radeon R9 270X, по оценке специалистов компании AMD, достигает 2,8-кратной. Причем, они оценивают вклад FinFET-техпроцесса меньше вклада своих оптимизаций. Вероятно, было выбрано самое выгодное сравнение, а для других моделей прирост по энергоэффективности несколько меньше. Например, если сравнить показатели RX 480 и R9 290, то разница по энергоэффективности будет ближе к двукратной. В любом случае, такие огромные приросты бывают раз в несколько лет, и уже поэтому у нас нет никаких сомнений в том, что продажи Radeon RX 480 будут успешными.

Технологический процесс и его оптимизация

Как мы уже говорили, главное в Polaris — это не изменения в аппаратных блоках, а большой шаг вперед из-за применения в производстве этого GPU нового техпроцесса 14 нм с использованием транзисторов с вертикально расположенным затвором (FinFET — Fin Field Effect Transistor), также известных как транзисторы с трехмерной структурой затвора или 3D-транзисторы.

Динамическое энергопотребление растет линейно с ростом количества вычислительных блоков, и кубически при повышении частоты при помощи повышения напряжения (так, прирост частоты и напряжения на 15% увеличивает потребление более чем наполовину!), и в результате графические процессоры зачастую работают на более низких тактовых частотах, зато используют чипы большей плотности, чтобы поместить в них большее количество вычислительных устройств, которые работают параллельно.

Последние пять лет графические процессоры выпускались при помощи 28 нм техпроцессов, а промежуточный 20 нм не дал требуемых параметров. Освоения еще более совершенных техпроцессов пришлось ждать довольно долго, и вот, для производства графических процессоров семейства Polaris, компания AMD выбрала производства компаний Samsung Electronics и GlobalFoundries с их 14 нм FinFET-техпроцессом, который обеспечивает производство одних из самых плотных микропроцессоров. Применение FinFET-транзисторов имеет решающее значение для снижения энергопотребления и снижения напряжения GPU примерно на 150 мВ, по сравнению с предыдущим поколением, сокращая мощность на треть.

На иллюстрации схематично показано условное изменение размеров одного и того же GPU, произведенного с применением различных техпроцессов. Компании Samsung Electronics и GlobalFoundries разделяют заказы на выпуск 14 нм центральных и графических процессоров компании AMD, так как техпроцесс у них одинаковый и наладить одновременное производство несложно, разделяя между ними заказы исходя из выхода годных чипов и других параметров, что должно позволить решить потенциальные проблемы с недостаточными объемами производства.

Архитектура Polaris изначально разрабатывалась под возможности FinFET-техпроцессов, и должна использовать все их возможности. Если описывать вкратце, то FinFET-транзистор — это транзистор с каналом, окруженным затвором через прослойку в виде изолятора с трех сторон — по сравнению с планарным, где поверхность сопряжения — это одна плоскость. FinFET-транзисторы имеют более сложное устройство, и трудностей при реализации новой технологии было предостаточно, для освоения соответствующих техпроцессов потребовалось пять лет.

Зато новая форма транзисторов обеспечивает больший выход годных, меньшие утечки и заметно лучшую энергоэффективность, что является основной задачей современной микроэлектроники. Количество транзисторов в графических процессорах на квадратный миллиметр площади удваивалось примерно каждые два года, вместе с этим удвоились и статические утечки (static leakage). Для решения части этих проблем использовались специальные средства, вроде островков из транзисторов с разным напряжением питания и схем управления тактовыми сигналами (clock gating), которые помогали снизить токи утечек в режимах простоя или сна. Но эти техники не помогают при активных состояниях работы и способны снизить максимальную производительность.

В FinFET-процессах многие проблемы решены, что позволяет добиться революционного улучшения в производительности и потреблении энергии, по сравнению с предыдущими чипами, произведенными при помощи традиционных технологий. Новые техпроцессы позволяют не просто повысить производительность, но и снизить вариативность характеристик (разницу в характеристиках всех произведенных чипов одной модели) — сравните разброс параметров для FinFET-техпроцесса 14 нм и привычного 28 нм у TSMC:

На этой диаграмме видны как большая средняя производительность для FinFET-продуктов, так и меньшие утечки в среднем, и меньший разброс в показателях производительности и величине утечек для разных образцов. Улучшение вариативности этих характеристик для GPU в случае FinFET означает, что можно повысить итоговую частоту для всех продуктов, в то время как для планарных транзисторов приходилось обращать большее внимание на худшие показатели и снижать референсные характеристики для всех конечных продуктов.

В итоге графические процессоры, произведенные при помощи техпроцессов с применением FinFET-транзисторов, обеспечивают фундаментальный рост характеристик производительности и энергоэффективности, по сравнению с аналогами, в производстве которых были использованы традиционные планарные транзисторы. По оценке специалистов AMD, применение FinFET-техпроцессов позволяет обеспечить или на 50-60% меньшее потребление энергии, или на 20-35% большую производительность при прочих равных.

Новые техпроцессы с применением FinFET-транзисторов помогают не только снизить потребление энергии и значительно улучшить энергоэффективность, но и открыть новые форм-факторы и форматы для применения будущих графических процессоров. Так, в будущем возможно появление относительно тонких и легких игровых ноутбуков, которые не будут требовать значительного снижения настроек качества 3D-графики, достаточно мощных настольных ПК ультракомпактного размера, ну а привычные игровые видеокарты смогут обходиться меньшим количеством разъемов питания.

Но для того, чтобы добиться большей энергоэффективности, недостаточно просто перевести чип на более «тонкий» техпроцесс, требуются многочисленные изменения в его дизайн. К примеру, в Polaris применяется адаптивное тактирование GPU. Графические процессоры работают при низком напряжении и высокой силе тока, и поставлять качественное напряжение от схем питания довольно сложно. Разброс в напряжении может достигать 10-15% от номинального значения, и среднее напряжение приходится повышать для того, чтобы перекрыть эту разницу, и на это тратится впустую куча энергии.

Адаптивное тактирование в решениях AMD восстанавливает эти потери со снижением энергозатрат на четверть. Для этого, в дополнение к уже существующим сенсорам энергопотребления и температуры добавляется еще и сенсор частоты. В результате работы алгоритма достигается максимальная энергоэффективность для всего чипа.

Также производится калибровка блока питания при загрузке системы. При испытаниях процессора запускается специальный код для анализа напряжения, и интегрированными мониторами питания записывается значение напряжение. Затем при загрузке ПК запускается тот же код и замеряется полученное напряжение, и регуляторы напряжения на плате устанавливают такое же напряжение, какое было при тестировании. Это исключает затраты энергии, которая расходуется из-за разницы в системах.

Есть в Polaris и адаптивная компенсация старения транзисторов — обычно графические процессоры требуют запаса тактовой частоты порядка 2-3% для приспособления к старению транзисторов чипа, да и другие компоненты также демонстрируют старение (например, GPU получает более низкое напряжение от системы). Современные решения AMD умеют делать самостоятельную калибровку и адаптироваться к изменяющимся условиям со временем, что обеспечивает надежную работу видеокарты в течение продолжительного времени и немного повышенную производительность.

Radeon WattMan — новые возможности разгона и мониторинга

Важной составляющей любого современного видеодрайвера являются настройки для разгона, позволяющие выжать из GPU все его возможности. Ранее этим заведовал раздел AMD Overdrive в драйверах решений этой компании, а вместе с выходом новых решений в AMD решили кардинально обновить и этот раздел драйвера, назвав его Radeon WattMan.

Radeon WattMan — это новая утилита AMD для разгона, позволяющая изменять напряжение GPU, частоту графического процессора и видеопамяти, скорость вращения вентилятора системы охлаждения и целевую температуру. Radeon WattMan основан на возможностях, виденных ранее в Radeon Software, но предлагает несколько новых функций по тонкому разгону — с иными возможностями по управлению напряжением и частотой GPU. Также в WattMan появился удобный мониторинг активности GPU, тактовых частот, температур и скорости вентилятора.

Удобно сделано то, что как и в других настройках Radeon Software Crimson Edition, можно задать собственный профиль разгона для каждого приложения или игры, который будет применен при их запуске. А после завершения работы приложения, настройки вернутся к глобальным по умолчанию. Radeon WattMan можно найти в Radeon Settings, он заместил текущую панель AMD OverDrive, и совместим с серией AMD Radeon RX 400.

Возможно как простое управление частотой GPU, так и тонкая настройка кривой частот. Простая настройка частоты работает по умолчанию и позволяет изменять заданные инженерами AMD значения, оптимальные для каждого состояния GPU. Изменение кривой частоты возможно с точностью в 0,5%. Есть и динамическое изменение кривой частоты, когда тактовая частота ядра GPU и видеопамяти может изменяться для каждого состояния вместе с изменением напряжения для каждого из них. Напряжения для GPU и памяти устанавливаются независимо друг от друга.

Есть в WattMan и продвинутое управление скоростью вращения вентилятора в системе охлаждения, когда устанавливается минимальная скорость, целевая скорость и минимальный акустический предел. При этом целевая скорость вращения — это максимум, при котором будет вращаться вентилятор при температуре не выше целевой. Улучшенное управление температурой позволяет выставить максимальное и целевое значения температуры. Вместе с пределом потребления энергии, это позволяет выставить более тонкие настройки.

Максимальная температура — это абсолютный максимум, при котором частота графического чипа не снижается, но после ее достижения, частота начнет снижаться. А целевая температура — значение, по достижению которого будет расти скорость вращения вентилятора. Предельное значение питания для GPU можно повысить или понизить в пределах до 50% (в случае модели Radeon RX 480).

Кажется, мы где-то уже видели возможность тонкого изменения кривой частот и напряжений, причем совсем недавно, правда? Но чего мы еще точно не видели, так это удобного интерфейса мониторинга и настроек в самих драйверах, а не сторонних утилитах, и AMD можно лишь похвалить за такую заботу о пользователях.

Новый интерфейс мониторинга позволяет записывать и просматривать активность графического процессора, его температуру, скорость вентилятора и частоты. Причем, есть как глобальный мониторинг (Global WattMan), так и отдельный мониторинг для пользовательских профилей, который мониторит пиковые и средние данные только когда приложение открыто. Данные собираются и в фоновом режиме, утилите Radeon Settings не обязательно быть запущенной, данные собираются максимум до 20 минут работы приложения.

В целом, AMD есть еще над чем работать для улучшения удобства интерфейса WattMan, так как он не предназначен для управления с клавиатуры, например, но саму по себе инициативу можно лишь приветствовать — удобные инструменты настройки и мониторинга прямо в драйверах могут стать дополнительным плюсом новых решений семейства Radeon RX 400.

Новые возможности по выводу изображения

Мы уже рассказывали ранее о том, что новые решения компании AMD будут отличаться поддержкой самых последних стандартов DisplayPort и HDMI. Новые видеокарты семейства Radeon RX стали одними из первых решений с поддержкой DisplayPort 1.3 HBR3 и DisplayPort 1.4-HDR. Новые версии этого стандарта используют существующие кабели и разъемы, но могут накладываться дополнительные ограничения на их длину.

Главным преимуществом стандарта DisplayPort 1.3 HBR3 является увеличение пропускной способности до 32,4 Гбит/с (на 80% больше, чем у HDMI 2.0b), что отодвигает предел по пропускной способности, имеющийся в предыдущем поколении DisplayPort 1.2. Новый стандарт позволяет подключать 5K-мониторы в RGB-формате при 60 Гц, используя единственный кабель (сейчас приходится подключать пару разъемов и кабелей), а также UHDTV-телевизоры с разрешением 8K (7680×4320), используя цветовую субдискретизацию 4:2:0 при 60 Гц. Также по DisplayPort 1.3 можно подключать и стереодисплеи с 120 Гц и 4K-разрешением. Появление 5K-дисплеев, рассчитанных на один кабель, и 4K-дисплеев с поддержкой HDR, ожидается ближе к концу этого года.

Также Polaris готов к внедрению стандарта DisplayPort 1.4-HDR, поддерживающего вывод изображения с глубиной цвета до 10-bit в разрешении 4K и с частотой обновления до 96 Гц. Новинкой компании поддерживаются Рекомендации ITU Rec.2020 по цветовому пространству для UHDTV, а также стандарты CTA-861.3 и SMPTE 2084 EOTF для передачи HDR-данных.

Новый стандарт DisplayPort 1.3 будет полезен и для продвижения технологии FreeSync для 4K-мониторов. Компания AMD ожидает появления первых таких устройств с поддержкой технологии динамического обновления до 120 Гц к концу 2016 года. Такие мониторы будут способны работать в 4K-разрешении с применением технологий FreeSync при 30-120 FPS и будут поддерживать компенсацию низкой частоты кадров Low Framerate Compensation.

Вот список характеристик для мониторов нового поколения, которые становятся возможными при использовании новой версии стандарта DisplayPort 1.3 с расширенной пропускной способностью: мониторы с разрешением 1920×1080 пикселей: 240 Гц SDR и 240 Гц HDR, мониторы с разрешением 2560×1440: 240 Гц SDR и 170 Гц HDR, 4K-мониторы: 120 Гц SDR и 60 Гц HDR, 5K-мониторы: 60 Гц SDR.

Если уж мы начали говорить про FreeSync, то нужно упомянуть, что в решениях архитектуры Polaris эта технология будет работать и с мониторами, имеющими разъемы HDMI 2.0b. На данный момент компания работает со своими партнерами, в числе которых Acer, LG, Mstar, Novatek, Realtek и Samsung, для обеспечения работы технологии динамического частоты обновления, в том числе и при помощи HDMI. Список планируемых к выпуску мониторов включает изделия с размерами экрана от 20 до 34 дюймов и различным разрешением.

Одной из самых интересных и перспективных возможностей Polaris по выводу информации является поддержка HDR-дисплеев с расширенным динамическим диапазоном. Для получения качественной картинки нужен вывод изображений в широком цветовом охвате с увеличенной контрастностью и максимальной яркостью, а на нынешних дисплеях человек видит лишь малую часть того, что может наблюдать своими глазами в окружающем мире. Диапазон воспринимаемых нами яркостей и цветов куда больше того, что могут дать нам текущие устройства вывода.

Внедрения High Dynamic Range во все стадии конвейера обработки изображения ждут многие энтузиасты качественного изображения. Для того чтобы хоть приблизиться к возможностям человеческого зрения, был введен новый индустриальный стандарт для телевизоров — HDR UHDTV, обеспечивающий диапазон яркости от 0.005 до 10000 нт. Первые HDR-устройства имеют яркость до 600-1200 кд/м2, а ЖК-мониторы с поддержкой High Dynamic Range (HDR) и локальной подсветкой в будущем смогут обеспечить до 2000 нт, а OLED-дисплеи — до 1000 нт, но при идеальном черном цвете и большей контрастности.

При использовании HDR пользователям будет демонстрироваться и расширенный цветовой диапазон, так как распространенное сейчас цветовое пространство sRGB сильно отстает от возможностей зрения человека. Нынешний контент почти весь создан в рамках стандартов BT.709, sRGB, SMPTE 1886 (Gamma 2.4), а новый стандарт HDR-10, Rec.2020 (BT.2020), SMPTE 2084 способен обеспечить отображение более миллиарда цветов при 10-бит на компонент, что приближает качество цветопередачи к естественному для человека.

Не нужно путать тему устройств отображения с HDR-возможностями с тем, что давно появилось в играх и называется HDR-рендерингом. Действительно, многие современные игровые движки используют рендеринг с расширенным динамическим диапазоном, чтобы сохранить данные в тенях и светах, но делается это исключительно до вывода информации на дисплей. А далее изображение все равно приводится к обычному динамическому диапазону, чтобы вывести его на SDR-монитор.

Для этого используются специальные алгоритмы тонального отображения (tone mapping) — преобразования тональных значений из широкого диапазона в узкий. С учетом появления HDR-устройств нужны как улучшенные алгоритмы tone mapping, так и ориентация их уже на HDR-дисплеи. Аппаратный движок обработки цветовых данных в Polaris имеет программируемые возможности по управлению гаммой и преобразования цветового охвата (gamut remapping), все расчеты идут с высокой точностью, и результат будет полностью соответствовать возможностям дисплея.

Хотя даже нынешние видеокарты Radeon в определенной мере готовы для работы с HDR-мониторами, вышедшие новые модели обеспечивают заметно более высокую частоту обновления и глубину цвета. Графические процессоры Polaris готовы к HDR-мониторам с глубиной цвета в 10-бит и 12-бит на компоненту, хотя первые такие дисплеи будут поддерживать только 10-бит, но затем последуют и более продвинутые, которые превзойдут возможности человеческого зрения.

Для того, чтобы получить качественное HDR-изображение в игровых приложениях, необходимо переделывать не только графическую часть игрового движка, но и часть контента: те же текстуры должны также храниться в форматах, позволяющих использовать широкий цветовой и яркостный охват. Компания AMD работает с игровыми разработчиками для того, чтобы будущие игры уже могли полноценно использовать возможности HDR-дисплеев, и для этого они выпустили специальный Radeon Photon SDK.

И тут есть над чем поработать. Тональное отображение (tone mapping) в играх должно делаться графическим движком, так как этот процесс, производимый дисплеем добавляет значительные задержки. AMD предлагает делать так: монитор опрашивается на предмет его возможностей по цвету, контрасту и яркости, затем с учетом этой информации игровой движок делает tone mapping и выводит его на дисплей в готовом виде. Так как игровые движки уже делают tone mapping в SDR, им просто нужно добавить возможность вывода в HDR.

Photon SDK уже доступен для разработчиков, поддержка HDR для видеоданных и рендеринга в DirectX 11-приложениях в драйвере уже готова, а поддержка DirectX 12 планируется с будущим его обновлением. Остается добавить, что Polaris поддерживает HDR-дисплеи, соединенные при помощи разъема HDMI 2.0b (с HDCP 2.2) в разрешении 1920×1080 при 192 Гц, в разрешении 2560×1440 при 96 Гц и 3840×2160 при 60 Гц и кодировании цвета 4:2:2. В случае присоединения по DisplayPort 1.4-HDR (также с HDCP 2.2) возможности шире: 1920×1080 при 240 Гц, 2560×1440 при 192 Гц и 3840×2160 при 96 Гц. Осталось дождаться таких мониторов в продаже.

Улучшенное кодирование и декодирование видеоданных

Как часто бывает, в новых поколениях графических процессоров заодно улучшают и блоки аппаратной обработки видеоданных. Ведь время не стоит на месте, появляются все новые форматы и условия их использования (частота кадров, глубина цвета и т.п.) Поэтому неудивительно, что в Polaris были проведены кое-какие улучшения по декодированию и кодированию видеоданных.

Если кодировать видеоряд в формат H.264 вплоть до 4K-разрешения при 30 или даже 60 FPS умели и предыдущие решения, то кодирование видео в формат HEVC (H.265) Polaris научился впервые. Аппаратным блоком кодирования видео в новом GPU поддерживаются следующие разрешения и частоты кадров: 1080p при 240 FPS, 1440p при 120 FPS и 4K при 60 FPS.

Мало того, на видеокартах серии Radeon RX была добавлена поддержка и высококачественного кодирования потокового видео из игр. Ведь качество кодирования всегда было слабым местом потокового видео, и при быстро меняющемся изображении его качество серьезно страдало. Высокого же качества картинки можно добиться при двухпроходном кодировании с анализом картинки в первом проходе, которое и было внедрено в Polaris. Аппаратное двухпроходное кодирование работает как с H.264, так и с форматом HEVC, и подобный подход дает заметно более высокое качество видеопотока.

Чтобы раскрыть аппаратные возможности архитектуры Polaris, нужна поддержка и со стороны программного обеспечения. Качественный аппаратный кодер для игр поддерживается следующими утилитами: Plays.TV, AMD Gaming Evolved, Open Broadcaster Software.

Также Polaris оснащен и самым продвинутым аппаратным блоком, декодирующий видеоданные. Видеодекодер компании AMD умеет работать с форматом HEVC и профилем кодирования Main-10 в разрешениях до 4K с частотой кадров в 60 FPS, MJPEG в 4K-разрешении с 30 FPS, H.264 в разрешении 4K до 120 FPS, MP4-P2 до 1080p при 60 FPS и VC1 до 1080p при 60 FPS.

Поддержка систем виртуальной реальности

За несколько последних лет текущая реинкарнация шлемов виртуальной реальности прошла немалую дорогу, постоянно улучшая свои потребительские характеристики (хотя до идеала все равно еще очень далеко). Если начиналось все с менее чем Full HD-разрешения на оба глаза в 2014 году при не более чем 30 FPS, то теперь дело дошло до разрешения 1080×1200 пикселей на каждый глаз при 90 FPS и 10 мс задержками. И сейчас ощущения от VR куда комфортнее и реалистичнее.

Компания AMD также со своей стороны занимается улучшением характеристик, связанных с VR. Так, технология LiquidVR предполагает реализацию некоторых возможностей, улучшающих VR на решениях компании. В числе последних изменений поддержка аудиотехнологии TrueAudio Next, резервирование вычислительных блоков под конкретные задачи, технология асинхронных вычислений Quick Response Queue, переменное разрешение и качество рендеринга для VR, поддержка DirectX 12 и Vulkan.

Так, технология продвинутой обработки звука TrueAudio Next включает всю работу со звуками на GPU в реальном времени — с соблюдением физических законов распространения звуковых волн и применением просчета лучей (рейтрейсинг) для множества источников звука. Это позволяет получить качественный звук с низкими задержками и при помощи настроек (количество обрабатываемых источников и количество отражений звуковых волн) получить хорошо масштабируемое решение.

Еще одной возможностью по работе с VR, которая недавно появилась, стало выделение нескольких вычислительных устройств Compute Unit под различные задачи, вроде обработки звука — в таком случае, эти CU будут заниматься исключительно этими задачами, чтобы избежать проблем, связанных с одновременным исполнением различных задач на GPU в реальном времени — это решение обеспечивает немедленное исполнение критичного кода и работает с любыми типами шейдеров, вычислительными или графическими.

А архитектуре Polaris был улучшен командный процессор — появилась новая техника качества обслуживания (QoS — quality of service) под названием Quick Response Queue. Эта техника позволяет разработчикам через API назначать высокоприоритетными некоторые вычислительные задачи. Оба типа задач (обычные и приоритетные) разделяют те же ресурсы GPU, но высший приоритет позволяет удостовериться, что такие задачи будут использовать большее количество ресурсов и завершатся первыми, без переключения командного процессора на низкоприоритетные задачи.

Конкретно в LiquidVR эта техника используется при асинхронном искажении времени (Asynchronous Time Warp), используемом в системах виртуальной реальности для того, чтобы избежать отброшенных кадров, ухудшающих плавность процесса — в VR это очень требовательная к задержкам задача, и приоритезация задач поможет удостовериться, что искажение времени происходит ровно тогда, когда нужно. Техника Quick Response Queue (QRQ) дает четкое управление над таймингами, минимизируя их.

Без использования техники асинхронного искажения времени в системах виртуальной реальности получается так, что графический процессор при работе отбрасывает около 5% кадров, а с Asynchronous Time Warp эти кадры не отбрасываются, что снижает «дрожание» (разное время рендеринга соседних кадров) в десятки раз. На данный момент возможность уже входит в состав библиотеки, доступной на сайте GPUOpen.

Мы уже знаем еще об одной оптимизации, связанной с VR — использование нескольких проекций при рендеринге сцены виртуальной реальности с разным разрешением. Мы уже не один раз рассказывали об этой возможности, которая оптимизирует VR-рендеринг, используя независимые настройки разрешения и качества разрешения для нескольких проекциях, которыми имитируется воронкообразный тип рендеринга, используемый в VR-шлемах. В этом случае для центра кадра применяется рендеринг в высоком разрешении, а на периферии оно снижается для оптимизации производительности.

В составе LiquidVR есть поддержка DirectX 12 — идеального графического API для виртуальной среды, так как он позволяет повысить количество функций вызовов отрисовки в сцене, помогает снизить нагрузку на CPU, имеет родную поддержку для асинхронного исполнения вычислений и многочипового рендеринга, а также дает некоторые возможности для низкоуровневого доступа к GPU. Примеры использования DirectX 12 в составе LiquidVR, а также соответствующая документация доступны на сайте GPUOpen.com.

Программные технологии Radeon Software

В компании AMD продолжают улучшать не только аппаратную составляющую своих продуктов, но и программные компоненты. В очередной раз они решили оптимизировать частоту выпуска новых версий видеодрайверов, так как некоторые пользователи оставались недовольны тем, что было в прошлом году. Долгие годы они ежемесячно выпускали обновленные WHQL-драйверы, но некоторым пользователям казалось, что это слишком часто. После того, как они снизили частоту выпуска релизов драйверов, другие пользователи оказались недовольны уже редкими выходами.

Так, в 2015 году было выпущено три WHQL драйвера и 9 бета-версий, а план на 2016 такой: шесть полноценных драйверов с WHQL-сертификацией за год + такое количество специальных версий с оптимизациями для игр, какое понадобится (в идеале — также WHQL). Пока что у них получается почти всегда, с момента выхода игр были доступны драйверы Radeon Software Crimson Edition для игр The Division, Far Cry Primal, Hitman, Quantum Break и других. С игрой Doom и видеокартами на чипах предыдущих поколений GCN вышла небольшая заминка, правда, но с кем не бывает?

Продолжают в AMD обращать внимание на оптимизацию драйверов, предназначенную для плавной смены кадров, особенно в многочиповых конфигурациях. Так, CrossFire API для DirectX 11 был включен в состав GPUOpen, а для некоторых DirectX 12-приложений планируется поддержка многочипового рендеринга с плавной сменой кадров и малой разницей во времени рендеринга соседних кадров, а не только с высоким FPS.

В будущих драйверах Radeon Software для DX12–игр планируется специальная поддержка AFR frame pacing — технология, которая специальным образом добавляет задержки перед тем, как вывести изображение на экран, что улучшает плавность и устраняет рывки при многочиповом рендеринге.

Очень важно, что все большее внимание уделяется операционным системам, отличным от Windows. Так, представлена поддержка Polaris для дистрибутивов Linux на основе открытого кода — в этих драйверах уже есть поддержка Vulkan-версии игры Dota 2, например.

Из любопытного отметим специальную программу для бета-тестирования Radeon Software Beta Program. Эта программа работает под управлением отдела обеспечения качества (Quality Assurance — QA), и в нее может вступить любой пользователь, написав по адресу RadeonSoftwareBeta@amd.com для получения дополнительной информации.

Самые важные изменения произошли с настройками Radeon Settings, включенными в состав нового драйвера. Там появилась глобальная поддержка Crossfire и энергоэффективности, масштабирование HDMI и масштабирование в зависимости от конкретного приложения, изменение цветовой температуры, выбор языка пользовательского интерфейса и многое другое — о возможностях разгона и мониторинга мы уже рассказали выше.

Все это касается конечных пользователей, но постоянно происходят и изменения в программной поддержке, предназначенные для разработчиков. Открытая инициатива GPUOpen давно известна как удобный метод для обеспечения разработчиков SDK, библиотеками и примерами с открытым кодом. Только за последний месяц на портале появилось 14 больших обновлений, за четыре месяца разработчиками было написано 41 блогов, а всего с момента запуска инициативы в конце января было размещено более 60 примеров кода, SDK, библиотек и утилит.

Из последних примеров отметим ShadowFX с поддержкой DirectX 12, улучшения GeometryFX для DirectX 11, обновленный TressFX 3.1 (DirectX 11). Появились новые библиотеки, SDK и примеры для многочипового рендеринга в DirectX 12, пример out of order растеризации для Vulkan, FireRays для Vulkan и OpenCL, поддержка CrossFire API для DirectX 11. Также AMD стала первым производителем аппаратного обеспечения, выпустившим расширение для SPIR-V — шейдерного языка в графическом API Vulkan с поддержкой инструкций GCN). Также появилась поддержка Radeon для OpenVX — открытого кроссплатформенного стандарта для ускорения приложений машинного зрения.

А недавно AMD представила расширение Shader Intrinsic Functions для библиотеки GPUOpen, которое облегчит оптимизацию ПК-версий игр, облегчив разработку многоплатформенных приложений и портирование игр с консолей. При использовании Shader Intrinsic Functions разработчик может получить прямой доступ к низкоуровневым инструкциям, как на консолях — при помощи вставок низкоуровневого кода в исходники высокого уровня. Эту возможность можно использовать в приложениях с поддержкой DirectX 11, DirectX 12 и Vulkan.



Видеокарта модели Radeon RX 480 стала первенцем семейства Polaris, первой вышедшей на рынок моделью в новой линейке компании AMD, основанной на графических процессорах, спроектированных и произведенных при помощи технологического процесса 14 нм FinFET. Вместе с архитектурными оптимизациями, это позволило серьезно повысить энергоэффективность нового решения, и в результате по этому показателю новинка в разы лучше предыдущих видеокарт компании AMD.

Хотя графический процессор Polaris 10 архитектурно весьма схож с предыдущими чипами и во многом повторяет их решения, и графические архитектуры разных поколений GCN не слишком сильно отличаются друг от друга, в новом графическом процессоре было сделано множество улучшений для более эффективных вычислений различных типов, в том числе при асинхронном исполнении кода, были серьезно улучшены возможности вывода изображения на дисплеи и функциональность блоков кодирования и декодирования видео.

Polaris 10 — лучшее графическое ядро компании AMD, которое принесло новые функциональные возможности, но главное — стало значительно более эффективным. Так, улучшения в вычислительных ядрах привели к 15%-ному росту производительности математических вычислений, по сравнению с архитектурой GCN предыдущих поколений. Вместе с применением нового техпроцесса 14 нм FinFET и другими оптимизациями, это позволило заметно улучшить энергоэффективность — вплоть до 2,8 раз, по оценке компании. А это, в свою очередь, означает лучшие пользовательские характеристики по тепловыделению и шуму от системы охлаждения.

В список функциональных изменений и улучшений входит поддержка кодирования и декодирования современных видеоформатов с новыми возможностями: поддержка более высоких битрейтов и продвинутых форматов, готовность к декодированию потокового HDR-видео с онлайновых сервисов, запись игрового процесса на лету без участия мощностей CPU, качественный режим кодирования видео с двумя проходами, и т.д. Также можно отметить появление поддержки стандартов вывода изображения, которые станут весьма важными в будущем: 10- и 12-битные форматы вывода для HDR-телевизоров и мониторов, а также поддержка дисплеев с высокими разрешением и частотами обновления.

Но все же самое главное в представленном продукте Radeon RX 480 — его низкая цена. Пусть некоторым покажется, что функциональных нововведений и оптимизаций в Polaris не так уж много, зато этот новый продукт, использующий современный технологический процесс, позволил серьезно снизить цену видеокарты, вполне достаточной как для запуска последних игр с высокими настройками качества, так и для применения в составе систем виртуальной реальности, весьма требовательной к мощности графической части.

Сочетание сравнительно низкой цены и достаточно высокой производительности делает Radeon RX 480 одной из самых удачных по соотношению цены и производительности видеокарт на момент ее выпуска, если не самой выгодной. Важно, что она ориентирована на средний ценовой сегмент, привлекающий куда большее количество потенциальных покупателей, чем топовые решения, и выпуск именно такой модели в первую очередь может положительно сказаться на рыночной доле компании AMD в сегменте игровых видеокарт.



Справочная информация о семействе видеокарт Radeon X
Справочная информация о семействе видеокарт Radeon X1000
Справочная информация о семействе видеокарт Radeon HD 2000
Справочная информация о семействе видеокарт Radeon HD 4000
Справочная информация о семействе видеокарт Radeon HD 5000
Справочная информация о семействе видеокарт Radeon HD 6000
Справочная информация о семействе видеокарт Radeon HD 7000
Справочная информация о семействе видеокарт Radeon 200
Справочная информация о семействе видеокарт Radeon 300
Справочная информация о семействе видеокарт Radeon 400




Дополнительно

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.