Видеоускоритель AMD Radeon RX 480

Новый середнячок, догоняющий топовые ускорители предыдущего поколения

Содержание


Представляем базовый детальный материал с исследованием AMD Radeon RX 480.

Объект исследования: Ускоритель трехмерной графики (видеокарта) AMD Radeon RX 480 8 ГБ 256-битной GDDR5 PCI-E

Сведения о разработчике: Компания ATI Technologies (торговая марка ATI) основана в 1985 году в Канаде как Array Technology Inc. В том же году была переименована в ATI Technologies. Штаб-квартира в г. Маркхам (Торонто). C 1987 года компания сконцентрировалась на выпуске графических решений для ПК. Начиная с 2000 года основным брендом графических решений ATI становится Radeon, под которым выпускаются GPU как для настольных ПК, так и для ноутбуков. В 2006 году компанию ATI Technologies покупает компания AMD, в которой образуется подразделение AMD Graphics Products Group (AMD GPG). C 2010 года AMD отказывается от бренда ATI, оставив лишь Radeon. Штаб-квартира AMD в Саннивейл (Калифорния), а у AMD GPG остается главным офисом бывший офис AMD в Маркхаме (Канада). Своего производства нет. Общая численность сотрудников AMD GPG (включая региональные офисы) около 2000 человек.

Часть 1: Теория и архитектура

В своих прошлых статьях мы неоднократно сетовали на застой в области графических процессоров, связанный с задержками производства GPU по новым технологическим процессам и фактическим пропуском одного из них — 20 нм техпроцесса, который оказался непригодным для массового выпуска сложных видеочипов. На протяжении долгих пяти (!) лет обе компании, являющиеся производителями GPU, выпускали решения на основе уже весьма старого 28 нм техпроцесса.

Производители микроэлектронных чипов смогли наладить массовое производство с применением новых FinFET-техпроцессов (14 и 16 нм, в зависимости от производителя) таких сложных и крупных чипов лишь ближе к середине года. Не так давно «отстрелялась» компания Nvidia, выпустившая довольно дорогие видеокарты, предназначенные для верхней части их линейки, а теперь настало время компании AMD, которая пошла своим путем, выпустив сначала не самые дорогие видеокарты, примерно аналогичные моделям Radeon HD 4850 и HD 4870, ставшими достаточно популярными в свое время.

Вот уже который раз компания AMD предлагает потребителю хоть и менее производительные видеокарты, чем конкурент, зато по значительно меньшей цене. Как и в случае с упомянутыми видеокартами серии Radeon HD 4800, в этот раз они также поставили себе задачу сделать графический процессор для недорогих решений ценового сегмента около $200, достаточно мощных для современных задач и игр, но не слишком дорогих и очень энергоэффективных. Мы уже раскрывали часть информации о планируемых к запуску решениях семейства Polaris, а сегодня уже готовы поделиться всеми подробностями.

Чтобы лучше понять ход мысли представителей AMD, отличающийся от такового у их конкурентов, давайте рассмотрим их представления о наиболее востребованных на рынке видеокартах. По данным AMD, довольно малая доля игроков на ПК покупает дорогие видеокарты, обеспечивающие комфорт при высоких разрешениях и максимальных настройках, а большинство из них использует сильно устаревшие GPU. 84% игроков покупают видеокарты по цене от $100 до $300 по данным AMD, и лишь остальные игроки выбирают то, что дороже.

Понятно, что большинство не сможет даже попробовать столь популярную сейчас тему виртуальной реальности при таковом желании, ведь VR требует очень приличных вычислительных мощностей. Кроме этого, по мнению AMD, не все пользователи желают вкладываться в то оборудование, что устареет уже через пару лет. Правда, вряд ли все они кинутся покупать VR-шлемы... С другой стороны, с устаревшими видеокартами у них и возможности то опробовать виртуальную реальность не появится. Всего 13 миллионов ПК по всему миру имеют достаточно мощную конфигурацию для запуска VR-приложений — это всего 1% из почти полутора миллиардов компьютеров, имеющихся у пользователей на руках.

По данным опросов, приводимых AMD, две трети пользователей не планируют приобрести оборудование для VR именно из-за дороговизны такой конфигурации. Это в дополнение к вполне разумным доводам вроде тех, что шлемы пока что слишком громоздкие и с мешающими проводами, а виртуальная реальность в принципе применима лишь к малой части игровых применений. Все же, самой важной преградой для распространения VR является цена оборудования. И AMD считает для себя перспективной возможность обеспечить миллионы ПК графическими процессорами необходимой мощности в следующие несколько лет. Правда, остается непонятным, почему AMD считает недоступным компонентом именно видеокарту, если VR-шлем и контроллеры сами по себе стоят дороже? Впрочем, порог входа в VR они действительно могут немного снизить, предложив решения достаточной производительности за сравнительно малые деньги.

И AMD продвигает свои новые решения во многом именно как производительные и энергоэффективные видеокарты, призванные «демократизировать» довольно дорогую виртуальную реальность, обеспечив желающих достаточной мощью GPU. А еще одной целью новых графических решений компании являются как компактные ПК со сверхнизким потреблением энергии, так и игровые ноутбуки, для которых сейчас можно легко обеспечить мощность, аналогичную или даже превосходящую возможности игровых консолей. К примеру, младший чип Polaris имеет не только низкое энергопотребление, но и специально предназначен для компактных ноутбуков — общая высота упаковки этого GPU составляет всего 1,5 мм по сравнению с 1,9 мм у Bonaire, что поможет AMD выиграть конкурсы на поставку решений для мобильных ПК.

Для четкого попадания в такие требования, в AMD решили спроектировать две модели графических процессоров: Polaris 10 и Polaris 11, соответствующие определенным уровням возможностей и производительности. Старший чип серии Polaris обеспечит ПК-игроков достаточной мощностью для VR-приложений и всех современных игр, а менее производительный младший GPU предназначен для тонких и легких ноутбуков, но предлагает возможности и производительность, превосходящие параметры игровых приставок.

Соответственно, на момент анонса, AMD предлагает следующие решения для настольных компьютеров:
Radeon RX 460 — энергоэффективная видеокарта с низким потреблением энергии для нетребовательных игр и будущих мобильных решений, с мощностью в более чем 2 терафлопа, имеющая 2 ГБ видеопамяти, соединенной по 128-битной шине;
Radeon RX 470 — весьма выгодная видеокарта среднего уровня за приемлемую цену, обладающая достаточной мощностью для игр в Full HD-разрешении, с мощностью более чем 4 терафлопа, 4 ГБ видеопамяти и 256-битной шиной;
Radeon RX 480 — пока что самое производительное решение нового семейства, предназначенное для VR и современных игр с производительностью более чем 5 терафлопа, 4 или 8 гигабайтами памяти с 256-битной шиной, потребляющее менее чем 150 Вт.

Сегодня мы рассмотрим как раз модель Radeon RX 480, которая предлагает премиальные возможности для игроков — Premium HD Gaming. Что это за термин в понимании AMD? Сюда включены как возможности новых графических API, вроде асинхронного исполнения в DirectX 12, так и технологии FreeSync и CrossFire. Но главное — преимущество над аналогичными по цене решениями конкурента, в современных играх с поддержкой DirectX 12:

В большинстве игр текущего года с поддержкой DirectX 12 (Ashes of the Singularity, Hitman, Total War: Warhammer, Quantum Break, Gears of War и Forza APEX) даже видеокарты предыдущего поколения AMD Radeon зачастую превосходят аналоги по цене у Nvidia: мы отмечали преимущество Fury X против 980 Ti, R9 390 против GTX 970 и R9 380 против GTX 960, а уж свежая модель на базе Polaris 10 просто обязана выступить еще лучше.

Кроме DirectX 12 можно отметить и еще один API — Vulkan. В соответствующей версии игры Doom компания AMD заявляет прирост до 45% на Radeon RX 480 по сравнению с OpenGL-версией игры, хотя на старых видеокартах разница ожидается несколько меньше — порядка 20-25%.

А что с виртуальной реальностью, действительно ли новинка AMD способна на достаточную производительность для VR-приложений? Благодаря высокой мощности GPU и поддержке таких возможностей как Asynchronos Time Warp, обеспечивается комфортный просмотр соответствующих VR-приложений, да еще при невысоком потреблении энергии. Так, общепринятый тест для оценки производительности SteamVR Performance Test показывает явное превосходство над решениями предыдущего поколения (непонятно, правда, почему сравнивали именно с Radeon R9 380?):

Так как основой модели Radeon RX 480 является графический процессор Polaris 10, имеющий архитектуру GCN четвертого поколения, которая во многих деталях схожа с ранее вышедшими решениями компании AMD, то перед прочтением теоретической части статьи будет полезно ознакомиться и с нашими предыдущими материалами по прошлым видеокартам компании, основанным на архитектуре GCN предыдущих поколений:

Рассмотрим подробные характеристики видеоплаты Radeon RX 480, основанной на полной версии графического процессора нового поколения Polaris 10.

Графический ускоритель Radeon RX 480
ПараметрЗначение
Кодовое имя чипаPolaris 10 XT (Ellesmere)
Технология производства14 нм FinFET
Количество транзисторов5,7 млрд.
Площадь ядра232 мм²
АрхитектураУнифицированная, с массивом общих процессоров для потоковой обработки многочисленных видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectXDirectX 12, с поддержкой уровня возможностей Feature Level 12_0
Шина памяти256-битная: восемь независимых 32-битных контроллеров памяти с поддержкой GDDR5-памяти
Частота графического процессора1120 (1266) МГц
Вычислительные блоки36 вычислительных блоков GCN, включающих 144 SIMD-ядер, состоящих в целом из 2304 ALU для расчетов с плавающей запятой (поддерживаются целочисленные и плавающие форматы, с точностью FP16, FP32 и FP64)
Блоки текстурирования144 текстурных блока, с поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
Блоки растеризации (ROP)32 блока ROP с поддержкой режимов сглаживания с возможностью программируемой выборки более чем 16 сэмплов на пиксель, в том числе при FP16- или FP32-формате буфера кадра. Пиковая производительность до 32 отсчетов за такт, а в режиме без цвета (Z only) — 128 отсчетов за такт
Поддержка мониторовИнтегрированная поддержка до шести мониторов, подключенных по интерфейсам DVI, HDMI 2.0b и DisplayPort 1.3/1.4 Ready




Спецификации референсной видеокарты Radeon RX 480

ПараметрЗначение
Частота ядра1120 (1266) МГц
Количество универсальных процессоров2304
Количество текстурных блоков144
Количество блоков блендинга32
Эффективная частота памяти7000-8000 (4×1750-2000) МГц
Тип памятиGDDR5
Шина памяти256-бит
Объем памяти4/8 ГБ
Пропускная способность памяти224-256 ГБ/с
Вычислительная производительность (FP32)до 5,8 терафлопс
Теоретическая максимальная скорость закраски41 гигапиксел/с
Теоретическая скорость выборки текстур182 гигатекселя/с
ШинаPCI Express 3.0
РазъемыОдин разъем HDMI и три DisplayPort
Энергопотреблениедо 150 Вт
Дополнительное питаниеОдин 6-контактный разъем
Число слотов, занимаемых в системном корпусе2
Рекомендуемая цена$199/$229 (для рынка США)

Название выпущенной сегодня модели видеокарты компании AMD вполне соответствует их текущей системе наименований. Ее имя отличается от предшественников измененным символом в первой части индекса и цифрой поколения — RX 480. Если со вторым изменением все понятно, ведь поколение действительно новое, то замена R9 на RX не совсем логична, на наш взгляд, ведь эта цифра раньше показывала уровень видеокарты: R7 были медленнее, чем R9, но все они выпускались в рамках одного поколения. А теперь непонятно, во-первых, почему у RX 480 эта цифра больше, чем у R9 390X, к примеру, и какие цифры после R в имени будут у младших решений, основанных на новых GPU.

Первая модель в новом семействе Radeon 400 становится в текущей линейке компании на место предыдущих решений, аналогичных по позиционированию, замещая их на рынке. Так как выпущенная видеокарта относится скорее к среднему уровню по цене и скорости с учетом нового поколения, то для будущих решений на GPU еще большей мощности решили оставить индекс 490.

Референсный вариант Radeon RX 480 будет предлагаться по рекомендованной цене в $199 в случае 4 ГБ варианта и $229 для 8-гигабайтной модели, и эти цены ну очень привлекательны! По сравнению с топовыми видеокартами предыдущего поколения, это очень хороший ценник, так как Radeon RX 480 по скорости не должна уступать таким моделям, как Radeon R9 390 и GeForce GTX 970. Именно с ними и будет конкурировать новинка, по крайней мере, в начале своего жизненного пути, до выхода планируемой к скорому выпуску GeForce GTX 1060. Но на момент своего выхода, сегодняшняя новинка абсолютно точно становится лучшим предложением по производительности в своем классе.

Референсные видеокарты Radeon RX 480 будут поставляться в версиях с 4 ГБ памяти GDDR5 с эффективной частотой в 7 ГГц, и с 8 ГБ памяти с частотой в 8 ГГц. Но по мере поступления в продажу видеокарт собственного производства партнеров AMD, появятся и другие варианты, но все они будут оснащены GDDR5-памятью с частотой как минимум 7 ГГц — такова воля AMD.

Решение по установке 4 и 8 ГБ памяти очень мудрое. Младший вариант позволит немного сэкономить, ведь 4 ГБ на данный момент можно считать «золотой серединой», а преимущество от 8 ГБ памяти у второго варианта Radeon RX 480 раскроется в перспективе. Хотя и 4-гигабайтный вариант видеокарты обеспечит приемлемую производительность в современных играх, но 8 ГБ памяти позволят иметь приличный запас на будущее, так как требования к объему видеопамяти у игр постоянно растут. В качестве примера, преимущество в котором уже заметно, можно привести игру Rise of the Tomb Raider в DirectX 12-версии, при очень высоких настройках и разрешении 2560x1440 пикселей:

Больший объем видеопамяти у Radeon RX 480 8 ГБ и Radeon R9 390 помогает избежать крайне неприятных падений производительности и рывков FPS, по сравнению с 4-гигабайтными вариантами, включая решения конкурентов GeForce GTX 970 и GTX 960. Именно Radeon RX 480 8 ГБ дает возможность получения плавного игрового процесса с отсутствием притормаживаний, связанных с подгрузкой данных, не помещающихся в локальную видеопамять. И так как игровые консоли нынешнего поколения имеют по 8 ГБ общей памяти, то преимущество от большего объема памяти будет только расти со временем, и 8-гигабайтный вариант Radeon RX 480 отлично подойдет для игр, который будут выходить в следующие несколько лет.

Для дополнительного питания платой используется один 6-контактный разъем, а значение типичного энергопотребления у модели Radeon RX 480 на графическом процессоре Polaris 10 установлено на уровне 150 Вт. В реальности без разгона плата потребляет даже еще меньше, порядка 120 Вт энергии, но небольшой запас по питанию позволит улучшить оверклокерский потенциал. К слову, партнерами AMD планируется скорый выход фабрично разогнанных версий этой видеокарты, отличающихся и системами охлаждения и питания.

Архитектурные особенности

Графический процессор Polaris 10 относится к четвертому поколению архитектуры Graphics Core Next, самому совершенному на данный момент. Базовым блоком архитектуры является вычислительный блок Compute Unit (CU), из которых собраны все графические процессоры AMD. Вычислительный блок CU имеет выделенное локальное хранилище данных для обмена данными или расширения локального регистрового стека, а также кэш-память первого уровня с возможностью чтения и записи и полноценный текстурный конвейер с блоками выборки и фильтрации, он разделен на подразделы, каждый из которых работает над своим потоком команд. Каждый из таких блоков занимается планированием и распределением работы самостоятельно.

В своей основе, архитектура Polaris изменилась не слишком сильно, хотя не основные блоки видеочипа изменились заметнее — были серьезно улучшены блоки кодирования и декодирования видеоданных и вывода информации на устройства отображения. В остальном, это очередное поколение известной архитектуры Graphics Core Next (GCN), уже четвертое по счету. Пока что в состав семейства вошли два чипа: Polaris 10 (ранее известный как Ellesmere) и Polaris 11 (ранее известный как Baffin).

И все же некоторые аппаратные изменения в GPU были внесены. В список улучшений и изменений входит: улучшенная обработка геометрии, поддержка нескольких проекций при рендеринге VR с разным разрешением, обновленный контроллер памяти с улучшенным сжатием данных, модифицированная предвыборка инструкций и улучшенная буферизация, планирование и приоритезация вычислительных задач в асинхронном режиме, поддержка операций над данными в формате FP16/Int16. Рассмотрим схему нового графического процессора (по клику на изображении доступна увеличенная версия иллюстрации):

В состав полноценного графического процессора Polaris 10 входит один командный процессор Graphics Command Processor, четыре асинхронных вычислительных движка Asynchronous Compute Engines (ACE), два планировщика задач Hardware Scheduler (HWS), 36 вычислительных блоков Compute Unit (CU), четыре геометрических процессора, 144 текстурных модуля TMU (включающих по четыре блока загрузки и сохранения данных LSU на каждый TMU) и 32 блоков ROP. Подсистема памяти нового графического процессора компании AMD включает восемь 32-битных контроллеров GDDR5-памяти, дающих общую 256-битную шину памяти, и кэш-память второго уровня объемом в 2 МБ.

Заявлено улучшение геометрических движков в Polaris — в частности, появился так называемый ускоритель отбрасывания геометрических примитивов Primitive Discard Accelerator, который работает в самом начале графического конвейера, отбрасывая невидимые треугольники (например, с нулевой площадью). Также в новом GPU был введен новый индексный кэш для дублированной (instanced) геометрии, который оптимизирует перемещения данных и освобождает ресурсы внутренних шин передачи данных и увеличивает эффективность использования ПСП при дублировании геометрии (instancing).

Ускоритель отбрасывания геометрических примитивов помогает увеличить скорость обработки геометрии, особенно в задачах вроде тесселяции с мультисэмплингом. На диаграмме видно, что в разных условиях новый блок позволяет увеличить производительность до трех раз. Впрочем, это синтетические данные заинтересованной стороны, лучше смотреть по игровым результатам независимых тестов.

Также в четвертом поколении GCN была улучшена эффективность исполнения шейдеров — введена предвыборка инструкций, улучшающая кэширование инструкций, снижающая простои конвейера и увеличивающая общую вычислительную эффективность. Еще был увеличен размер буфера инструкций для массива инструкций (wavefront), увеличивающий однопоточную производительность, введена поддержка операций над данными в форматах FP16 и Int16, помогающая снизить нагрузку на память, повысить скорость вычислений и улучшить энергоэффективность. Последнюю возможность можно применять в широком круге задач графики, машинного зрения и обучения.

В очередной раз был улучшен и планировщик заданий hardware scheduler (HWS), использующийся при асинхронных вычислениях. В его задачи входит: разгрузка CPU от задач планирования, приоритезация задач реального времени (виртуальная реальность или обработка звука), параллельное выполнение задач и процессов, менеджмент ресурсов, координация и балансирование загрузки исполнительных блоков. Функциональность этих блоков можно обновить при помощи микрокода.

Кроме того, что объем кэш-памяти второго уровня был увеличен вдвое до 2 МБ, была изменена обработка и кэширование данных в L2-кэше и увеличена общая эффективность работы подсистемы кэш-памяти и локальной видеопамяти. Контроллер памяти получил поддержку GDDR5-памяти с эффективной тактовой частотой до 8 ГГц, что в случае Polaris означает пропускную способность шины памяти до 256 ГБ/с. Но и на этом в AMD не остановились, дополнительно улучшив алгоритмы сжатия данных без потерь (Delta Color Compression — DCC), которым поддерживаются режимы сжатия с соотношением 2:1, 4:1 и 8:1.

Внутричиповое сжатие данных увеличивает общую эффективность работы, обеспечивает более полное использование шины данных и сказывается на энергоэффективности. В частности, если в Radeon R9 290X внутреннего сжатия информации не было и эффективная ПСП равна его физической ПСП, то в случае решения на чипе Fiji сжатие позволило сэкономить почти 20% ПСП, а в случае Polaris и до 35-40%.

Если сравнивать Radeon RX 480 с Radeon R9 290, то новое решение потребляет заметно меньше энергии для обеспечения той же эффективной пропускной способности, по сравнению с видеокартой предыдущего поколения. В результате, у новинки заметно выше и производительность в пересчете на бит — хотя у Radeon R9 290 выше пиковая ПСП, но она куда энергоэффективнее используется в Polaris 10 — общее потребление энергии интерфейсом памяти составляет 58% от потребления старого GPU.

В целом, изменения четвертого поколения GCN в графическом процессоре Polaris связаны с применением продвинутого технологического процесса 14 нм FinFET, микроархитектурными изменениями, оптимизациями физического дизайна и техник управления питанием. Все это принесло свои плоды в виде значительного прироста производительности и эффективности, по сравнению с предыдущими решениями. Если брать самый низкий уровень, то вычислительные блоки CU в Polaris 10 (Radeon RX 480) примерно на 15% производительнее блоков чипа Hawaii (Radeon R9 290).

Сложно судить, насколько велик вклад той или иной оптимизации в общий прирост скорости, но если брать все оптимизации в комплексе, то разница в энергоэффективности между Radeon RX 470 и Radeon R9 270X, по оценке специалистов компании AMD, достигает 2,8-кратной. Причем, они оценивают вклад FinFET-техпроцесса меньше вклада своих оптимизаций. Вероятно, было выбрано самое выгодное сравнение, а для других моделей прирост по энергоэффективности несколько меньше. Например, если сравнить показатели RX 480 и R9 290, то разница по энергоэффективности будет ближе к двукратной. В любом случае, такие огромные приросты бывают раз в несколько лет, и уже поэтому у нас нет никаких сомнений в том, что продажи Radeon RX 480 будут успешными.

Технологический процесс и его оптимизация

Как мы уже говорили, главное в Polaris — это не изменения в аппаратных блоках, а большой шаг вперед из-за применения в производстве этого GPU нового техпроцесса 14 нм с использованием транзисторов с вертикально расположенным затвором (FinFET — Fin Field Effect Transistor), также известных как транзисторы с трехмерной структурой затвора или 3D-транзисторы.

Динамическое энергопотребление растет линейно с ростом количества вычислительных блоков, и кубически при повышении частоты при помощи повышения напряжения (так, прирост частоты и напряжения на 15% увеличивает потребление более чем наполовину!), и в результате графические процессоры зачастую работают на более низких тактовых частотах, зато используют чипы большей плотности, чтобы поместить в них большее количество вычислительных устройств, которые работают параллельно.

Последние пять лет графические процессоры выпускались при помощи 28 нм техпроцессов, а промежуточный 20 нм не дал требуемых параметров. Освоения еще более совершенных техпроцессов пришлось ждать довольно долго, и вот, для производства графических процессоров семейства Polaris, компания AMD выбрала производства компаний Samsung Electronics и GlobalFoundries с их 14 нм FinFET-техпроцессом, который обеспечивает производство одних из самых плотных микропроцессоров. Применение FinFET-транзисторов имеет решающее значение для снижения энергопотребления и снижения напряжения GPU примерно на 150 мВ, по сравнению с предыдущим поколением, сокращая мощность на треть.

На иллюстрации схематично показано условное изменение размеров одного и того же GPU, произведенного с применением различных техпроцессов. Компании Samsung Electronics и GlobalFoundries разделяют заказы на выпуск 14 нм центральных и графических процессоров компании AMD, так как техпроцесс у них одинаковый и наладить одновременное производство несложно, разделяя между ними заказы исходя из выхода годных чипов и других параметров, что должно позволить решить потенциальные проблемы с недостаточными объемами производства.

Архитектура Polaris изначально разрабатывалась под возможности FinFET-техпроцессов, и должна использовать все их возможности. Если описывать вкратце, то FinFET-транзистор — это транзистор с каналом, окруженным затвором через прослойку в виде изолятора с трех сторон — по сравнению с планарным, где поверхность сопряжения — это одна плоскость. FinFET-транзисторы имеют более сложное устройство, и трудностей при реализации новой технологии было предостаточно, для освоения соответствующих техпроцессов потребовалось пять лет.

Зато новая форма транзисторов обеспечивает больший выход годных, меньшие утечки и заметно лучшую энергоэффективность, что является основной задачей современной микроэлектроники. Количество транзисторов в графических процессорах на квадратный миллиметр площади удваивалось примерно каждые два года, вместе с этим удвоились и статические утечки (static leakage). Для решения части этих проблем использовались специальные средства, вроде островков из транзисторов с разным напряжением питания и схем управления тактовыми сигналами (clock gating), которые помогали снизить токи утечек в режимах простоя или сна. Но эти техники не помогают при активных состояниях работы и способны снизить максимальную производительность.

В FinFET-процессах многие проблемы решены, что позволяет добиться революционного улучшения в производительности и потреблении энергии, по сравнению с предыдущими чипами, произведенными при помощи традиционных технологий. Новые техпроцессы позволяют не просто повысить производительность, но и снизить вариативность характеристик (разницу в характеристиках всех произведенных чипов одной модели) — сравните разброс параметров для FinFET-техпроцесса 14 нм и привычного 28 нм у TSMC:

На этой диаграмме видны как большая средняя производительность для FinFET-продуктов, так и меньшие утечки в среднем, и меньший разброс в показателях производительности и величине утечек для разных образцов. Улучшение вариативности этих характеристик для GPU в случае FinFET означает, что можно повысить итоговую частоту для всех продуктов, в то время как для планарных транзисторов приходилось обращать большее внимание на худшие показатели и снижать референсные характеристики для всех конечных продуктов.

В итоге графические процессоры, произведенные при помощи техпроцессов с применением FinFET-транзисторов, обеспечивают фундаментальный рост характеристик производительности и энергоэффективности, по сравнению с аналогами, в производстве которых были использованы традиционные планарные транзисторы. По оценке специалистов AMD, применение FinFET-техпроцессов позволяет обеспечить или на 50-60% меньшее потребление энергии, или на 20-35% большую производительность при прочих равных.

Новые техпроцессы с применением FinFET-транзисторов помогают не только снизить потребление энергии и значительно улучшить энергоэффективность, но и открыть новые форм-факторы и форматы для применения будущих графических процессоров. Так, в будущем возможно появление относительно тонких и легких игровых ноутбуков, которые не будут требовать значительного снижения настроек качества 3D-графики, достаточно мощных настольных ПК ультракомпактного размера, ну а привычные игровые видеокарты смогут обходиться меньшим количеством разъемов питания.

Но для того, чтобы добиться большей энергоэффективности, недостаточно просто перевести чип на более «тонкий» техпроцесс, требуются многочисленные изменения в его дизайн. К примеру, в Polaris применяется адаптивное тактирование GPU. Графические процессоры работают при низком напряжении и высокой силе тока, и поставлять качественное напряжение от схем питания довольно сложно. Разброс в напряжении может достигать 10-15% от номинального значения, и среднее напряжение приходится повышать для того, чтобы перекрыть эту разницу, и на это тратится впустую куча энергии.

Адаптивное тактирование в решениях AMD восстанавливает эти потери со снижением энергозатрат на четверть. Для этого, в дополнение к уже существующим сенсорам энергопотребления и температуры добавляется еще и сенсор частоты. В результате работы алгоритма достигается максимальная энергоэффективность для всего чипа.

Также производится калибровка блока питания при загрузке системы. При испытаниях процессора запускается специальный код для анализа напряжения, и интегрированными мониторами питания записывается значение напряжение. Затем при загрузке ПК запускается тот же код и замеряется полученное напряжение, и регуляторы напряжения на плате устанавливают такое же напряжение, какое было при тестировании. Это исключает затраты энергии, которая расходуется из-за разницы в системах.

Есть в Polaris и адаптивная компенсация старения транзисторов — обычно графические процессоры требуют запаса тактовой частоты порядка 2-3% для приспособления к старению транзисторов чипа, да и другие компоненты также демонстрируют старение (например, GPU получает более низкое напряжение от системы). Современные решения AMD умеют делать самостоятельную калибровку и адаптироваться к изменяющимся условиям со временем, что обеспечивает надежную работу видеокарты в течение продолжительного времени и немного повышенную производительность.

Radeon WattMan — новые возможности разгона и мониторинга

Важной составляющей любого современного видеодрайвера являются настройки для разгона, позволяющие выжать из GPU все его возможности. Ранее этим заведовал раздел AMD Overdrive в драйверах решений этой компании, а вместе с выходом новых решений в AMD решили кардинально обновить и этот раздел драйвера, назвав его Radeon WattMan.

Radeon WattMan — это новая утилита AMD для разгона, позволяющая изменять напряжение GPU, частоту графического процессора и видеопамяти, скорость вращения вентилятора системы охлаждения и целевую температуру. Radeon WattMan основан на возможностях, виденных ранее в Radeon Software, но предлагает несколько новых функций по тонкому разгону — с иными возможностями по управлению напряжением и частотой GPU. Также в WattMan появился удобный мониторинг активности GPU, тактовых частот, температур и скорости вентилятора.

Удобно сделано то, что как и в других настройках Radeon Software Crimson Edition, можно задать собственный профиль разгона для каждого приложения или игры, который будет применен при их запуске. А после завершения работы приложения, настройки вернутся к глобальным по умолчанию. Radeon WattMan можно найти в Radeon Settings, он заместил текущую панель AMD OverDrive, и совместим с серией AMD Radeon RX 400.

Возможно как простое управление частотой GPU, так и тонкая настройка кривой частот. Простая настройка частоты работает по умолчанию и позволяет изменять заданные инженерами AMD значения, оптимальные для каждого состояния GPU. Изменение кривой частоты возможно с точностью в 0,5%. Есть и динамическое изменение кривой частоты, когда тактовая частота ядра GPU и видеопамяти может изменяться для каждого состояния вместе с изменением напряжения для каждого из них. Напряжения для GPU и памяти устанавливаются независимо друг от друга.

Есть в WattMan и продвинутое управление скоростью вращения вентилятора в системе охлаждения, когда устанавливается минимальная скорость, целевая скорость и минимальный акустический предел. При этом целевая скорость вращения — это максимум, при котором будет вращаться вентилятор при температуре не выше целевой. Улучшенное управление температурой позволяет выставить максимальное и целевое значения температуры. Вместе с пределом потребления энергии, это позволяет выставить более тонкие настройки.

Максимальная температура — это абсолютный максимум, при котором частота графического чипа не снижается, но после ее достижения, частота начнет снижаться. А целевая температура — значение, по достижению которого будет расти скорость вращения вентилятора. Предельное значение питания для GPU можно повысить или понизить в пределах до 50% (в случае модели Radeon RX 480).

Кажется, мы где-то уже видели возможность тонкого изменения кривой частот и напряжений, причем совсем недавно, правда? Но чего мы еще точно не видели, так это удобного интерфейса мониторинга и настроек в самих драйверах, а не сторонних утилитах, и AMD можно лишь похвалить за такую заботу о пользователях.

Новый интерфейс мониторинга позволяет записывать и просматривать активность графического процессора, его температуру, скорость вентилятора и частоты. Причем, есть как глобальный мониторинг (Global WattMan), так и отдельный мониторинг для пользовательских профилей, который мониторит пиковые и средние данные только когда приложение открыто. Данные собираются и в фоновом режиме, утилите Radeon Settings не обязательно быть запущенной, данные собираются максимум до 20 минут работы приложения.

В целом, AMD есть еще над чем работать для улучшения удобства интерфейса WattMan, так как он не предназначен для управления с клавиатуры, например, но саму по себе инициативу можно лишь приветствовать — удобные инструменты настройки и мониторинга прямо в драйверах могут стать дополнительным плюсом новых решений семейства Radeon RX 400.

Новые возможности по выводу изображения

Мы уже рассказывали ранее о том, что новые решения компании AMD будут отличаться поддержкой самых последних стандартов DisplayPort и HDMI. Новые видеокарты семейства Radeon RX стали одними из первых решений с поддержкой DisplayPort 1.3 HBR3 и DisplayPort 1.4-HDR. Новые версии этого стандарта используют существующие кабели и разъемы, но могут накладываться дополнительные ограничения на их длину.

Главным преимуществом стандарта DisplayPort 1.3 HBR3 является увеличение пропускной способности до 32,4 Гбит/с (на 80% больше, чем у HDMI 2.0b), что отодвигает предел по пропускной способности, имеющийся в предыдущем поколении DisplayPort 1.2. Новый стандарт позволяет подключать 5K-мониторы в RGB-формате при 60 Гц, используя единственный кабель (сейчас приходится подключать пару разъемов и кабелей), а также UHDTV-телевизоры с разрешением 8K (7680×4320), используя цветовую субдискретизацию 4:2:0 при 60 Гц. Также по DisplayPort 1.3 можно подключать и стереодисплеи с 120 Гц и 4K-разрешением. Появление 5K-дисплеев, рассчитанных на один кабель, и 4K-дисплеев с поддержкой HDR, ожидается ближе к концу этого года.

Также Polaris готов к внедрению стандарта DisplayPort 1.4-HDR, поддерживающего вывод изображения с глубиной цвета до 10-bit в разрешении 4K и с частотой обновления до 96 Гц. Новинкой компании поддерживаются Рекомендации ITU Rec.2020 по цветовому пространству для UHDTV, а также стандарты CTA-861.3 и SMPTE 2084 EOTF для передачи HDR-данных.

Новый стандарт DisplayPort 1.3 будет полезен и для продвижения технологии FreeSync для 4K-мониторов. Компания AMD ожидает появления первых таких устройств с поддержкой технологии динамического обновления до 120 Гц к концу 2016 года. Такие мониторы будут способны работать в 4K-разрешении с применением технологий FreeSync при 30-120 FPS и будут поддерживать компенсацию низкой частоты кадров Low Framerate Compensation.

Вот список характеристик для мониторов нового поколения, которые становятся возможными при использовании новой версии стандарта DisplayPort 1.3 с расширенной пропускной способностью: мониторы с разрешением 1920×1080 пикселей: 240 Гц SDR и 240 Гц HDR, мониторы с разрешением 2560×1440: 240 Гц SDR и 170 Гц HDR, 4K-мониторы: 120 Гц SDR и 60 Гц HDR, 5K-мониторы: 60 Гц SDR.

Если уж мы начали говорить про FreeSync, то нужно упомянуть, что в решениях архитектуры Polaris эта технология будет работать и с мониторами, имеющими разъемы HDMI 2.0b. На данный момент компания работает со своими партнерами, в числе которых Acer, LG, Mstar, Novatek, Realtek и Samsung, для обеспечения работы технологии динамического частоты обновления, в том числе и при помощи HDMI. Список планируемых к выпуску мониторов включает изделия с размерами экрана от 20 до 34 дюймов и различным разрешением.

Одной из самых интересных и перспективных возможностей Polaris по выводу информации является поддержка HDR-дисплеев с расширенным динамическим диапазоном. Для получения качественной картинки нужен вывод изображений в широком цветовом охвате с увеличенной контрастностью и максимальной яркостью, а на нынешних дисплеях человек видит лишь малую часть того, что может наблюдать своими глазами в окружающем мире. Диапазон воспринимаемых нами яркостей и цветов куда больше того, что могут дать нам текущие устройства вывода.

Внедрения High Dynamic Range во все стадии конвейера обработки изображения ждут многие энтузиасты качественного изображения. Для того чтобы хоть приблизиться к возможностям человеческого зрения, был введен новый индустриальный стандарт для телевизоров — HDR UHDTV, обеспечивающий диапазон яркости от 0.005 до 10000 нт. Первые HDR-устройства имеют яркость до 600-1200 кд/м2, а ЖК-мониторы с поддержкой High Dynamic Range (HDR) и локальной подсветкой в будущем смогут обеспечить до 2000 нт, а OLED-дисплеи — до 1000 нт, но при идеальном черном цвете и большей контрастности.

При использовании HDR пользователям будет демонстрироваться и расширенный цветовой диапазон, так как распространенное сейчас цветовое пространство sRGB сильно отстает от возможностей зрения человека. Нынешний контент почти весь создан в рамках стандартов BT.709, sRGB, SMPTE 1886 (Gamma 2.4), а новый стандарт HDR-10, Rec.2020 (BT.2020), SMPTE 2084 способен обеспечить отображение более миллиарда цветов при 10-бит на компонент, что приближает качество цветопередачи к естественному для человека.

Не нужно путать тему устройств отображения с HDR-возможностями с тем, что давно появилось в играх и называется HDR-рендерингом. Действительно, многие современные игровые движки используют рендеринг с расширенным динамическим диапазоном, чтобы сохранить данные в тенях и светах, но делается это исключительно до вывода информации на дисплей. А далее изображение все равно приводится к обычному динамическому диапазону, чтобы вывести его на SDR-монитор.

Для этого используются специальные алгоритмы тонального отображения (tone mapping) — преобразования тональных значений из широкого диапазона в узкий. С учетом появления HDR-устройств нужны как улучшенные алгоритмы tone mapping, так и ориентация их уже на HDR-дисплеи. Аппаратный движок обработки цветовых данных в Polaris имеет программируемые возможности по управлению гаммой и преобразования цветового охвата (gamut remapping), все расчеты идут с высокой точностью, и результат будет полностью соответствовать возможностям дисплея.

Хотя даже нынешние видеокарты Radeon в определенной мере готовы для работы с HDR-мониторами, вышедшие новые модели обеспечивают заметно более высокую частоту обновления и глубину цвета. Графические процессоры Polaris готовы к HDR-мониторам с глубиной цвета в 10-бит и 12-бит на компоненту, хотя первые такие дисплеи будут поддерживать только 10-бит, но затем последуют и более продвинутые, которые превзойдут возможности человеческого зрения.

Для того, чтобы получить качественное HDR-изображение в игровых приложениях, необходимо переделывать не только графическую часть игрового движка, но и часть контента: те же текстуры должны также храниться в форматах, позволяющих использовать широкий цветовой и яркостный охват. Компания AMD работает с игровыми разработчиками для того, чтобы будущие игры уже могли полноценно использовать возможности HDR-дисплеев, и для этого они выпустили специальный Radeon Photon SDK.

И тут есть над чем поработать. Тональное отображение (tone mapping) в играх должно делаться графическим движком, так как этот процесс, производимый дисплеем добавляет значительные задержки. AMD предлагает делать так: монитор опрашивается на предмет его возможностей по цвету, контрасту и яркости, затем с учетом этой информации игровой движок делает tone mapping и выводит его на дисплей в готовом виде. Так как игровые движки уже делают tone mapping в SDR, им просто нужно добавить возможность вывода в HDR.

Photon SDK уже доступен для разработчиков, поддержка HDR для видеоданных и рендеринга в DirectX 11-приложениях в драйвере уже готова, а поддержка DirectX 12 планируется с будущим его обновлением. Остается добавить, что Polaris поддерживает HDR-дисплеи, соединенные при помощи разъема HDMI 2.0b (с HDCP 2.2) в разрешении 1920×1080 при 192 Гц, в разрешении 2560×1440 при 96 Гц и 3840×2160 при 60 Гц и кодировании цвета 4:2:2. В случае присоединения по DisplayPort 1.4-HDR (также с HDCP 2.2) возможности шире: 1920×1080 при 240 Гц, 2560×1440 при 192 Гц и 3840×2160 при 96 Гц. Осталось дождаться таких мониторов с ценой ниже, чем у чугунного моста.

Улучшенное кодирование и декодирование видеоданных

Как часто бывает, в новых поколениях графических процессоров заодно улучшают и блоки аппаратной обработки видеоданных. Ведь время не стоит на месте, появляются все новые форматы и условия их использования (частота кадров, глубина цвета и т.п.) Поэтому неудивительно, что в Polaris были проведены кое-какие улучшения по декодированию и кодированию видеоданных.

Если кодировать видеоряд в формат H.264 вплоть до 4K-разрешения при 30 или даже 60 FPS умели и предыдущие решения, то кодирование видео в формат HEVC (H.265) Polaris научился впервые. Аппаратным блоком кодирования видео в новом GPU поддерживаются следующие разрешения и частоты кадров: 1080p при 240 FPS, 1440p при 120 FPS и 4K при 60 FPS.

Мало того, на видеокартах серии Radeon RX была добавлена поддержка и высококачественного кодирования потокового видео из игр. Ведь качество кодирования всегда было слабым местом потокового видео, и при быстро меняющемся изображении его качество серьезно страдало. Высокого же качества картинки можно добиться при двухпроходном кодировании с анализом картинки в первом проходе, которое и было внедрено в Polaris. Аппаратное двухпроходное кодирование работает как с H.264, так и с форматом HEVC, и подобный подход дает заметно более высокое качество видеопотока.

Чтобы раскрыть аппаратные возможности архитектуры Polaris, нужна поддержка и со стороны программного обеспечения. Качественный аппаратный кодер для игр поддерживается следующими утилитами: Plays.TV, AMD Gaming Evolved, Open Broadcaster Software.

Также Polaris оснащен и самым продвинутым аппаратным блоком, декодирующий видеоданные. Видеодекодер компании AMD умеет работать с форматом HEVC и профилем кодирования Main-10 в разрешениях до 4K с частотой кадров в 60 FPS, MJPEG в 4K-разрешении с 30 FPS, H.264 в разрешении 4K до 120 FPS, MP4-P2 до 1080p при 60 FPS и VC1 до 1080p при 60 FPS.

Поддержка систем виртуальной реальности

За несколько последних лет текущая реинкарнация шлемов виртуальной реальности прошла немалую дорогу, постоянно улучшая свои потребительские характеристики (хотя до идеала все равно еще очень далеко). Если начиналось все с менее чем Full HD-разрешения на оба глаза в 2014 году при не более чем 30 FPS, то теперь дело дошло до разрешения 1080×1200 пикселей на каждый глаз при 90 FPS и 10 мс задержками. И сейчас ощущения от VR куда комфортнее и реалистичнее.

Компания AMD также со своей стороны занимается улучшением характеристик, связанных с VR. Так, технология LiquidVR предполагает реализацию некоторых возможностей, улучшающих VR на решениях компании. В числе последних изменений поддержка аудиотехнологии TrueAudio Next, резервирование вычислительных блоков под конкретные задачи, технология асинхронных вычислений Quick Response Queue, переменное разрешение и качество рендеринга для VR, поддержка DirectX 12 и Vulkan.

Так, технология продвинутой обработки звука TrueAudio Next включает всю работу со звуками на GPU в реальном времени — с соблюдением физических законов распространения звуковых волн и применением просчета лучей (рейтрейсинг) для множества источников звука. Это позволяет получить качественный звук с низкими задержками и при помощи настроек (количество обрабатываемых источников и количество отражений звуковых волн) получить хорошо масштабируемое решение.

Еще одной возможностью по работе с VR, которая недавно появилась, стало выделение нескольких вычислительных устройств Compute Unit под различные задачи, вроде обработки звука — в таком случае, эти CU будут заниматься исключительно этими задачами, чтобы избежать проблем, связанных с одновременным исполнением различных задач на GPU в реальном времени — это решение обеспечивает немедленное исполнение критичного кода и работает с любыми типами шейдеров, вычислительными или графическими.

А архитектуре Polaris был улучшен командный процессор — появилась новая техника качества обслуживания (QoS — quality of service) под названием Quick Response Queue. Эта техника позволяет разработчикам через API назначать высокоприоритетными некоторые вычислительные задачи. Оба типа задач (обычные и приоритетные) разделяют те же ресурсы GPU, но высший приоритет позволяет удостовериться, что такие задачи будут использовать большее количество ресурсов и завершатся первыми, без переключения командного процессора на низкоприоритетные задачи.

Конкретно в LiquidVR эта техника используется при асинхронном искажении времени (Asynchronous Time Warp), используемом в системах виртуальной реальности для того, чтобы избежать отброшенных кадров, ухудшающих плавность процесса — в VR это очень требовательная к задержкам задача, и приоритезация задач поможет удостовериться, что искажение времени происходит ровно тогда, когда нужно. Техника Quick Response Queue (QRQ) дает четкое управление над таймингами, минимизируя их.

Без использования техники асинхронного искажения времени в системах виртуальной реальности получается так, что графический процессор при работе отбрасывает около 5% кадров, а с Asynchronous Time Warp эти кадры не отбрасываются, что снижает «дрожание» (разное время рендеринга соседних кадров) в десятки раз. На данный момент возможность уже входит в состав библиотеки, доступной на сайте GPUOpen.

Мы уже знаем еще об одной оптимизации, связанной с VR — использование нескольких проекций при рендеринге сцены виртуальной реальности с разным разрешением. Мы уже не один раз рассказывали об этой возможности, которая оптимизирует VR-рендеринг, используя независимые настройки разрешения и качества разрешения для нескольких проекциях, которыми имитируется воронкообразный тип рендеринга, используемый в VR-шлемах. В этом случае для центра кадра применяется рендеринг в высоком разрешении, а на периферии оно снижается для оптимизации производительности.

В составе LiquidVR есть поддержка DirectX 12 — идеального графического API для виртуальной среды, так как он позволяет повысить количество функций вызовов отрисовки в сцене, помогает снизить нагрузку на CPU, имеет родную поддержку для асинхронного исполнения вычислений и многочипового рендеринга, а также дает некоторые возможности для низкоуровневого доступа к GPU. Примеры использования DirectX 12 в составе LiquidVR, а также соответствующая документация доступны на сайте GPUOpen.com.

Программные технологии Radeon Software

В компании AMD продолжают улучшать не только аппаратную составляющую своих продуктов, но и программные компоненты. В очередной раз они решили оптимизировать частоту выпуска новых версий видеодрайверов, так как некоторые пользователи оставались недовольны тем, что было в прошлом году. Долгие годы они ежемесячно выпускали обновленные WHQL-драйверы, но некоторым пользователям казалось, что это слишком часто. После того, как они снизили частоту выпуска релизов драйверов, другие пользователи оказались недовольны уже редкими выходами.

Так, в 2015 году было выпущено три WHQL драйвера и 9 бета-версий, а план на 2016 такой: шесть полноценных драйверов с WHQL-сертификацией за год + такое количество специальных версий с оптимизациями для игр, какое понадобится (в идеале — также WHQL). Пока что у них получается почти всегда, с момента выхода игр были доступны драйверы Radeon Software Crimson Edition для игр The Division, Far Cry Primal, Hitman, Quantum Break и других. С игрой Doom и видеокартами на чипах предыдущих поколений GCN вышла небольшая заминка, правда, но с кем не бывает?

Продолжают в AMD обращать внимание на оптимизацию драйверов, предназначенную для плавной смены кадров, особенно в многочиповых конфигурациях. Так, CrossFire API для DirectX 11 был включен в состав GPUOpen, а для некоторых DirectX 12-приложений планируется поддержка многочипового рендеринга с плавной сменой кадров и малой разницей во времени рендеринга соседних кадров, а не только с высоким FPS.

В будущих драйверах Radeon Software для DX12–игр планируется специальная поддержка AFR frame pacing — технология, которая специальным образом добавляет задержки перед тем, как вывести изображение на экран, что улучшает плавность и устраняет рывки при многочиповом рендеринге.

Очень важно, что все большее внимание уделяется операционным системам, отличным от Windows. Так, представлена поддержка Polaris для дистрибутивов Linux на основе открытого кода — в этих драйверах уже есть поддержка Vulkan-версии игры Dota 2, например.

Из любопытного отметим специальную программу для бета-тестирования Radeon Software Beta Program. Эта программа работает под управлением отдела обеспечения качества (Quality Assurance — QA), и в нее может вступить любой пользователь, написав по адресу RadeonSoftwareBeta@amd.com для получения дополнительной информации.

Самые важные изменения произошли с настройками Radeon Settings, включенными в состав нового драйвера. Там появилась глобальная поддержка Crossfire и энергоэффективности, масштабирование HDMI и масштабирование в зависимости от конкретного приложения, изменение цветовой температуры, выбор языка пользовательского интерфейса и многое другое — о возможностях разгона и мониторинга мы уже рассказали выше.

Все это касается конечных пользователей, но постоянно происходят и изменения в программной поддержке, предназначенные для разработчиков. Открытая инициатива GPUOpen давно известна как удобный метод для обеспечения разработчиков SDK, библиотеками и примерами с открытым кодом. Только за последний месяц на портале появилось 14 больших обновлений, за четыре месяца разработчиками было написано 41 блогов, а всего с момента запуска инициативы в конце января было размещено более 60 примеров кода, SDK, библиотек и утилит.

Из последних примеров отметим ShadowFX с поддержкой DirectX 12, улучшения GeometryFX для DirectX 11, обновленный TressFX 3.1 (DirectX 11). Появились новые библиотеки, SDK и примеры для многочипового рендеринга в DirectX 12, пример out of order растеризации для Vulkan, FireRays для Vulkan и OpenCL, поддержка CrossFire API для DirectX 11. Также AMD стала первым производителем аппаратного обеспечения, выпустившим расширение для SPIR-V — шейдерного языка в графическом API Vulkan с поддержкой инструкций GCN). Также появилась поддержка Radeon для OpenVX — открытого кроссплатформенного стандарта для ускорения приложений машинного зрения.

А недавно AMD представила расширение Shader Intrinsic Functions для библиотеки GPUOpen, которое облегчит оптимизацию ПК-версий игр, облегчив разработку многоплатформенных приложений и портирование игр с консолей. При использовании Shader Intrinsic Functions разработчик может получить прямой доступ к низкоуровневым инструкциям, как на консолях — при помощи вставок низкоуровневого кода в исходники высокого уровня. Эту возможность можно использовать в приложениях с поддержкой DirectX 11, DirectX 12 и Vulkan.

Выводы по теоретической части

Видеокарта модели Radeon RX 480 стала первенцем семейства Polaris, первой вышедшей на рынок моделью в новой линейке компании AMD, основанной на графических процессорах, спроектированных и произведенных при помощи технологического процесса 14 нм FinFET. Вместе с архитектурными оптимизациями, это позволило серьезно повысить энергоэффективность нового решения, и в результате по этому показателю новинка вдвое-втрое лучше предыдущих видеокарт компании AMD.

Хотя графический процессор Polaris 10 архитектурно весьма схож с предыдущими чипами и во многом повторяет их решения, и графические архитектуры разных поколений GCN не слишком сильно отличаются друг от друга, в новом графическом процессоре было сделано множество улучшений для более эффективных вычислений различных типов, в том числе при асинхронном исполнении кода, были серьезно улучшены возможности вывода изображения на дисплеи и функциональность блоков кодирования и декодирования видео.

Polaris 10 — лучшее графическое ядро компании AMD, которое принесло новые функциональные возможности, но главное — стало значительно более эффективным. Так, улучшения в вычислительных ядрах привели к 15%-ному росту производительности математических вычислений, по сравнению с архитектурой GCN предыдущих поколений. Вместе с применением нового техпроцесса 14 нм FinFET и другими оптимизациями, это позволило заметно улучшить энергоэффективность — вплоть до 2,8 раз, по оценке компании. А это, в свою очередь, означает лучшие пользовательские характеристики по тепловыделению и шуму от системы охлаждения.

В списке функциональных изменений и улучшений — поддержка кодирования и декодирования современных видеоформатов с новыми возможностями: поддержка более высоких битрейтов и продвинутых форматов, готовность к декодированию потокового HDR-видео с онлайновых сервисов, запись игрового процесса на лету без участия мощностей CPU, качественный режим кодирования видео с двумя проходами, и т.д. Также можно отметить появление поддержки стандартов вывода изображения, которые станут весьма важными в будущем: 10- и 12-битные форматы вывода для HDR-телевизоров и мониторов, а также поддержка дисплеев с высокими разрешением и частотами обновления.

Но главное в представленном сегодня продукте Radeon RX 480 — его цена. Пусть некоторым покажется, что функциональных нововведений и оптимизаций в Polaris не так уж много, зато этот новый продукт, использующий современный технологический процесс, позволил серьезно снизить цену видеокарты, вполне достаточной как для последних игр с высокими настройками качества, так и для применения в составе систем виртуальной реальности, довольно требовательной к мощности GPU.

Сочетание сравнительно низкой цены и достаточно высокой производительности делает Radeon RX 480 одной из самых удачных по соотношению цены и производительности видеокарт на момент ее выпуска, если не самой выгодной. Важно, что она ориентирована на средний ценовой сегмент, привлекающий куда большее количество потенциальных покупателей, чем топовые решения, и выпуск именно такой модели в первую очередь может положительно сказаться на рыночной доле компании AMD в сегменте игровых видеокарт.

В следующих частях нашей статьи мы оценим производительность новой видеокарты AMD Radeon RX 480 на практике, сравнив ее скорость с показателями близких по цене ускорителей компаний Nvidia и AMD. Сначала мы рассмотрим данные, полученные в нашем наборе синтетических тестов, а затем перейдем и к самому интересному — игровым тестам.



Средняя текущая цена (количество предложений) в московской рознице:
Рассматриваемые картыКонкуренты
RX 480 8 ГБ — $270 (на 01.07.16) GTX 970 — $331 (на 01.07.16)
RX 480 8 ГБ — $270 (на 01.07.16) GTX 960 4 ГБ — $211 (на 01.07.16)
RX 480 8 ГБ — $270 (на 01.07.16) R9 390 — $388 (на 01.07.16)


Благодарим компанию AMD Russia
и лично Кирилла Погорелова
за предоставленную на тестирование видеокарту

Блок питания Thermaltake DPS G 1050W для тестового стенда предоставлены компанией Thermaltake

Корпус Corsair Obsidian 800D Full Tower для тестового стенда предоставлен компанией Corsair

Модули памяти G.Skill Ripjaws4 F4-2800C16Q-16GRK для тестового стенда предоставлены компанией G.Skill

Corsair Hydro SeriesT H100i CPU Cooler для тестового стенда предоставлен компанией Corsair

Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт

Системная плата ASRock Fatal1ty X99X Killer для тестового стенда предоставлена компанией ASRock

Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate

2 накопителя SSD Corsair Neutron SeriesT 120 ГБ для тестового стенда предоставлены компанией Corsair




29 июня 2016 Г.

AMD Radeon RX 480. 1:

AMD Radeon RX 480

,


AMD Radeon RX 480.

: () AMD Radeon RX 480 8 256- GDDR5 PCI-E

: ATI Technologies ( ATI) 1985 Array Technology Inc. ATI Technologies. - . (). C 1987 . 2000 ATI Radeon, GPU , . 2006 ATI Technologies AMD, AMD Graphics Products Group (AMD GPG). C 2010 AMD ATI, Radeon. - AMD (), AMD GPG AMD (). . AMD GPG ( ) 2000 .

1:

, GPU — 20 , . (!) , GPU, 28 .

FinFET- (14 16 , ) . «» Nvidia, , , AMD, , , Radeon HD 4850 HD 4870, .

AMD , , . Radeon HD 4800, $200, , . Polaris, .

AMD, , . AMD, , , GPU. 84% $100 $300 AMD, , .

, , VR . , AMD, , . , VR-... , . 13 VR- — 1% , .

, AMD, VR - . , , . , VR . AMD . , , AMD , VR- ? , VR , .

AMD , «» , GPU. , , , . , Polaris , — GPU 1,5 1,9 Bonaire, AMD .

, AMD : Polaris 10 Polaris 11, . Polaris - VR- , GPU , , .

, , AMD :
Radeon RX 460 — , 2 , 2 , 128- ;
Radeon RX 470 — , Full HD-, 4 , 4 256- ;
Radeon RX 480 — , VR 5 , 4 8 256- , 150 .

Radeon RX 480, — Premium HD Gaming. AMD? API, DirectX 12, FreeSync CrossFire. — , DirectX 12:

DirectX 12 (Ashes of the Singularity, Hitman, Total War: Warhammer, Quantum Break, Gears of War Forza APEX) AMD Radeon Nvidia: Fury X 980 Ti, R9 390 GTX 970 R9 380 GTX 960, Polaris 10 .

DirectX 12 API — Vulkan. Doom AMD 45% Radeon RX 480 OpenGL- , — 20-25%.

, AMD VR-? GPU Asynchronos Time Warp, VR-, . , SteamVR Performance Test (, , Radeon R9 380?):

Radeon RX 480 Polaris 10, GCN , AMD, , GCN :

Radeon RX 480, Polaris 10.

Radeon RX 480
Polaris 10 XT (Ellesmere)
14 FinFET
5,7 .
232 ²
, : , .
DirectXDirectX 12, Feature Level 12_0
256-: 32- GDDR5-
1120 (1266)
36 GCN, 144 SIMD-, 2304 ALU ( , FP16, FP32 FP64)
144 ,
(ROP)32 ROP 16 , FP16- FP32- . 32 , (Z only) — 128
, DVI, HDMI 2.0b DisplayPort 1.3/1.4 Ready




Radeon RX 480

1120 (1266)
2304
144
32
7000-8000 (4×1750-2000)
GDDR5
256-
4/8
224-256 /
(FP32) 5,8
41 /
182 /
PCI Express 3.0
HDMI DisplayPort
150
6-
, 2
$199/$229 ( )

AMD . — RX 480. , , R9 RX , , : R7 , R9, . , -, RX 480 , R9 390X, , R , GPU.

Radeon 400 , , . , GPU 490.

Radeon RX 480 $199 4 $229 8- , ! , , Radeon RX 480 , Radeon R9 390 GeForce GTX 970. , , , GeForce GTX 1060. , .

Radeon RX 480 4 GDDR5 7 , 8 8 . AMD, , GDDR5- 7 — AMD.

4 8 . , 4 « », 8 Radeon RX 480 . 4- , 8 , . , , Rise of the Tomb Raider DirectX 12-, 2560x1440 :

Radeon RX 480 8 Radeon R9 390 FPS, 4- , GeForce GTX 970 GTX 960. Radeon RX 480 8 , , . 8 , , 8- Radeon RX 480 , .

6- , Radeon RX 480 Polaris 10 150 . , 120 , . , AMD , .

Polaris 10 Graphics Core Next, . Compute Unit (CU), AMD. CU , - , , . .

, Polaris , — . , Graphics Core Next (GCN), . : Polaris 10 ( Ellesmere) Polaris 11 ( Baffin).

GPU . : , VR , , , , FP16/Int16. ( ):

Polaris 10 Graphics Command Processor, Asynchronous Compute Engines (ACE), Hardware Scheduler (HWS), 36 Compute Unit (CU), , 144 TMU ( LSU TMU) 32 ROP. AMD 32- GDDR5-, 256- , - 2 .

Polaris — , Primitive Discard Accelerator, , (, ). GPU (instanced) , (instancing).

, . , . , , .

GCN — , , . (wavefront), , FP16 Int16, , . , .

hardware scheduler (HWS), . : CPU , ( ), , , . .

, - 2 , L2- - . GDDR5- 8 , Polaris 256 /. AMD , (Delta Color Compression — DCC), 2:1, 4:1 8:1.

, . , Radeon R9 290X , Fiji 20% , Polaris 35-40%.

Radeon RX 480 Radeon R9 290, , . , — Radeon R9 290 , Polaris 10 — 58% GPU.

, GCN Polaris 14 FinFET, , . , . , CU Polaris 10 (Radeon RX 480) 15% Hawaii (Radeon R9 290).

, , , Radeon RX 470 Radeon R9 270X, AMD, 2,8-. , FinFET- . , , . , RX 480 R9 290, . , , , Radeon RX 480 .

, Polaris — , - GPU 14 (FinFET — Fin Field Effect Transistor), 3D-.

, (, 15% !), , , , .

28 , 20 . , , Polaris, AMD Samsung Electronics GlobalFoundries 14 FinFET-, . FinFET- GPU 150 , , .

GPU, . Samsung Electronics GlobalFoundries 14 AMD, , , .

Polaris FinFET-, . , FinFET- — , — , — . FinFET- , , .

, , . , (static leakage). , (clock gating), . .

FinFET- , , , . , ( ) — FinFET- 14 28 TSMC:

FinFET-, , . GPU FinFET , , .

, FinFET-, , , . AMD, FinFET- 50-60% , 20-35% .

FinFET- , - . , , 3D-, , .

, , «» , . , Polaris GPU. , . 10-15% , , , .

AMD . , . .

. , . , , . , - .

Polaris — 2-3% , (, GPU ). AMD , .

Radeon WattMan —

, GPU . AMD Overdrive , AMD , Radeon WattMan.

Radeon WattMan — AMD , GPU, , . Radeon WattMan , Radeon Software, — GPU. WattMan GPU, , .

, Radeon Software Crimson Edition, , . , . Radeon WattMan Radeon Settings, AMD OverDrive, AMD Radeon RX 400.

GPU, . AMD , GPU. 0,5%. , GPU . GPU .

WattMan , , . — , . . , .

— , , , . — , . GPU 50% ( Radeon RX 480).

, - , , ? , , , AMD .

, , . , (Global WattMan), , . , Radeon Settings , 20 .

, AMD WattMan, , , — Radeon RX 400.

, AMD DisplayPort HDMI. Radeon RX DisplayPort 1.3 HBR3 DisplayPort 1.4-HDR. , .

DisplayPort 1.3 HBR3 32,4 / ( 80% , HDMI 2.0b), , DisplayPort 1.2. 5K- RGB- 60 , ( ), UHDTV- 8K (7680×4320), 4:2:0 60 . DisplayPort 1.3 120 4K-. 5K-, , 4K- HDR, .

Polaris DisplayPort 1.4-HDR, 10-bit 4K 96 . ITU Rec.2020 UHDTV, CTA-861.3 SMPTE 2084 EOTF HDR-.

DisplayPort 1.3 FreeSync 4K-. AMD 120 2016 . 4K- FreeSync 30-120 FPS Low Framerate Compensation.

, DisplayPort 1.3 : 1920×1080 : 240 SDR 240 HDR, 2560×1440: 240 SDR 170 HDR, 4K-: 120 SDR 60 HDR, 5K-: 60 SDR.

FreeSync, , Polaris , HDMI 2.0b. , Acer, LG, Mstar, Novatek, Realtek Samsung, , HDMI. 20 34 .

Polaris HDR- . , , . , .

High Dynamic Range . , — HDR UHDTV, 0.005 10000 . HDR- 600-1200 /2, - High Dynamic Range (HDR) 2000 , OLED- — 1000 , .

HDR , sRGB . BT.709, sRGB, SMPTE 1886 (Gamma 2.4), HDR-10, Rec.2020 (BT.2020), SMPTE 2084 10- , .

HDR- , HDR-. , , , . , SDR-.

(tone mapping) — . HDR- tone mapping, HDR-. Polaris (gamut remapping), , .

Radeon HDR-, . Polaris HDR- 10- 12- , 10-, , .

, HDR- , , : , . AMD , HDR-, Radeon Photon SDK.

. (tone mapping) , , . AMD : , , tone mapping . tone mapping SDR, HDR.

Photon SDK , HDR DirectX 11- , DirectX 12 . , Polaris HDR-, HDMI 2.0b ( HDCP 2.2) 1920×1080 192 , 2560×1440 96 3840×2160 60 4:2:2. DisplayPort 1.4-HDR ( HDCP 2.2) : 1920×1080 240 , 2560×1440 192 3840×2160 96 . , .

, . , ( , ..) , Polaris - .

H.264 4K- 30 60 FPS , HEVC (H.265) Polaris . GPU : 1080p 240 FPS, 1440p 120 FPS 4K 60 FPS.

, Radeon RX . , . , Polaris. H.264, HEVC, .

Polaris, . : Plays.TV, AMD Gaming Evolved, Open Broadcaster Software.

Polaris , . AMD HEVC Main-10 4K 60 FPS, MJPEG 4K- 30 FPS, H.264 4K 120 FPS, MP4-P2 1080p 60 FPS VC1 1080p 60 FPS.

, ( ). Full HD- 2014 30 FPS, 1080×1200 90 FPS 10 . VR .

AMD , VR. , LiquidVR , VR . TrueAudio Next, , Quick Response Queue, VR, DirectX 12 Vulkan.

, TrueAudio Next GPU — () . ( ) .

VR, , Compute Unit , — , CU , , GPU — , .

Polaris — (QoS — quality of service) Quick Response Queue. API . ( ) GPU, , , .

LiquidVR (Asynchronous Time Warp), , , — VR , , , . Quick Response Queue (QRQ) , .

, 5% , Asynchronous Time Warp , «» ( ) . , GPUOpen.

, VR — . , VR-, , , VR-. , .

LiquidVR DirectX 12 — API , , CPU, , GPU. DirectX 12 LiquidVR, GPUOpen.com.

Radeon Software

AMD , . , , . WHQL-, , . , , .

, 2015 WHQL 9 -, 2016 : WHQL- + , ( — WHQL). , Radeon Software Crimson Edition The Division, Far Cry Primal, Hitman, Quantum Break . Doom GCN , , ?

AMD , , . , CrossFire API DirectX 11 GPUOpen, DirectX 12- , FPS.

Radeon Software DX12 AFR frame pacing — , , , .

, , Windows. , Polaris Linux — Vulkan- Dota 2, .

- Radeon Software Beta Program. (Quality Assurance — QA), , RadeonSoftwareBeta@amd.com .

Radeon Settings, . Crossfire , HDMI , , — .

, , . GPUOpen SDK, . 14 , 41 , 60 , SDK, .

ShadowFX DirectX 12, GeometryFX DirectX 11, TressFX 3.1 (DirectX 11). , SDK DirectX 12, out of order Vulkan, FireRays Vulkan OpenCL, CrossFire API DirectX 11. AMD , SPIR-V — API Vulkan GCN). Radeon OpenVX — .

AMD Shader Intrinsic Functions GPUOpen, - , . Shader Intrinsic Functions , — . DirectX 11, DirectX 12 Vulkan.

Radeon RX 480 Polaris, AMD, , 14 FinFET. , , - AMD.

Polaris 10 , GCN , , , .

Polaris 10 — AMD, , — . , 15%- , GCN . 14 FinFET , — 2,8 , . , , .

— : , HDR- , CPU, , .. , : 10- 12- HDR- , .

Radeon RX 480 — . , Polaris , , , , , , GPU.

Radeon RX 480 , . , , , , AMD .


AMD Radeon RX 480 , Nvidia AMD. , , — .



( ) :
RX 480 8 — GTX 970 —
RX 480 8 — GTX 960 4 —
RX 480 8 — R9 390 —



Thermaltake DPS G 1050W Thermaltake

Corsair Obsidian 800D Full Tower Corsair

G.Skill Ripjaws4 F4-2800C16Q-16GRK G.Skill

Corsair Hydro SeriesT H100i CPU Cooler Corsair

Dell UltraSharp U3011

ASRock Fatal1ty X99X Killer ASRock

Seagate Barracuda 7200.14 3 Seagate

2 SSD Corsair Neutron SeriesT 120 Corsair