Видеоускоритель AMD Radeon RX 470

Техпроцесс 14 нм спускается в более дешевый сегмент ускорителей


Содержание


Представляем базовый детальный материал с исследованием AMD Radeon RX 470.

Объект исследования: Ускоритель трехмерной графики (видеокарта) Asus Strix RX 470 4 ГБ 256-битной GDDR5 PCI-E (STRIX-RX470-O4G-GAMING)

Сведения о разработчике: Компания ATI Technologies (торговая марка ATI) основана в 1985 году в Канаде как Array Technology Inc. В том же году была переименована в ATI Technologies. Штаб-квартира в г. Маркхам (Торонто). C 1987 года компания сконцентрировалась на выпуске графических решений для ПК. Начиная с 2000 года основным брендом графических решений ATI становится Radeon, под которым выпускаются GPU как для настольных ПК, так и для ноутбуков. В 2006 году компанию ATI Technologies покупает компания AMD, в которой образуется подразделение AMD Graphics Products Group (AMD GPG). C 2010 года AMD отказывается от бренда ATI, оставив лишь Radeon. Штаб-квартира AMD в Саннивейл (Калифорния), а у AMD GPG остается главным офисом бывший офис AMD в Маркхаме (Канада). Своего производства нет. Общая численность сотрудников AMD GPG (включая региональные офисы) около 2000 человек.

Часть 1: Теория и архитектура

Сегодня мы рассмотрим еще одну долгожданную видеокарту компании AMD, которая технически весьма похожа на рассмотренную нами ранее Radeon RX 480, но для многих более привлекательную уже потому, что она за меньшие деньги предлагает вполне приемлемую производительность в современных играх, если ограничиться Full HD-разрешением. Некоторая информация о модели видеокарты Radeon RX 470, которую мы сегодня рассматриваем, стала известна еще весной, когда была анонсирована новая линейка компании AMD, но с тех пор вышло только старшее решение, а технические характеристики менее мощного GPU до последнего времени оставались тайной.

Несмотря на то, что Radeon RX 480 оказалась очень неплохим и весьма выгодным вариантом для многих потенциальных покупателей, наши читатели ждали выхода менее производительной модели за меньшие деньги. И не только потому, что она стоит дешевле, а предлагает приемлемую скорость в играх, но и потому, что некоторые особенности лишают ее части проблем старшего решения, которое явно упирается в максимально возможное энергопотребление и возможности GPU по его разгону. И вот, сегодня мы рассмотрим эту интересную модель Radeon RX 470 во всех подробностях.

Как мы уже писали, к лету нынешнего года компания AMD спроектировала и выпустила две модели графических процессоров: Polaris 10 и Polaris 11, имеющих разную производительность. Старший чип серии Polaris обеспечивает ПК-игроков достаточной мощностью для VR-приложений и всех современных игр, а менее производительный младший GPU предназначен для не таких мощных домашних систем, предназначенных для нетребовательных игр, а также тонких и легких ноутбуков. Среднее же по мощности решение хоть и имеет в основе тот же GPU, что и старшее, но с меньшим количеством активных исполнительных блоков, и оно предназначено для игровых систем средней производительности.

Radeon RX 470 кажется довольно удачной видеокартой, основанной на урезанном по количеству функциональных блоков процессоре Polaris 10. Это модель среднего уровня с приемлемой ценой, обладающая достаточной мощностью для игр в Full HD-разрешении, с вычислительной производительностью более чем 4 терафлопа, имеющая 4 ГБ видеопамяти и 256-битную шину с высокой пропускной способностью. Все это выгодно отличает новинку от устаревших решений предыдущих поколений AMD и Nvidia, которые до сих пор продаются на рынке.

В пользу решений компании AMD выступает и то, что в большинстве игр текущего года с поддержкой DirectX 12 (Ashes of the Singularity, Hitman, Total War: Warhammer, Quantum Break, Gears of War и Forza APEX) видеокарты AMD Radeon на чипах архитектуры GCN чаще всего превосходят аналоги по цене из стана Nvidia: мы ранее уже отмечали преимущество Fury X против 980 Ti, R9 390 против GTX 970 и R9 380 против GTX 960 в таких играх, а модели видеокарт на базе Polaris 10 выступают еще сильнее. То же самое касается и игр, использующих новый графический API — Vulkan. В соответствующей версии игры Doom на решениях Radeon наблюдается очень большой прирост по сравнению с OpenGL-версией игры, что позволяет им с легкостью обходить конкурирующие видеокарты GeForce.

Так как основой модели Radeon RX 470 является графический процессор Polaris 10, уже рассмотренный нами ранее и имеющий архитектуру GCN четвертого поколения, которая во многих деталях схожа с ранее вышедшими решениями компании AMD, то перед прочтением теоретической части статьи будет полезно ознакомиться и с предыдущими материалами по прошлым видеокартам компании, основанным на архитектуре GCN текущего и предыдущих поколений:

Рассмотрим подробные характеристики видеоплаты Radeon RX 470, основанной на урезанной версии графического процессора нового поколения Polaris 10 Pro.

Графический ускоритель Radeon RX 470
ПараметрЗначение
Кодовое имя чипаPolaris 10 Pro (Ellesmere Pro)
Технология производства14 нм FinFET
Количество транзисторов5,7 млрд.
Площадь ядра232 мм²
АрхитектураУнифицированная, с массивом общих процессоров для потоковой обработки многочисленных видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectXDirectX 12, с поддержкой уровня возможностей Feature Level 12_0
Шина памяти256-битная: восемь независимых 32-битных контроллеров памяти с поддержкой GDDR5-памяти
Частота графического процессора926 (1206) МГц
Вычислительные блоки32 (из 36 имеющихся) вычислительных блока GCN, включающих 128 (из 144) SIMD-ядер, состоящих в целом из 2048 (из 2304) ALU для расчетов с плавающей запятой (поддерживаются целочисленные и плавающие форматы, с точностью FP16, FP32 и FP64)
Блоки текстурирования128 (из 144) текстурных блоков, с поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
Блоки растеризации (ROP)32 блока ROP с поддержкой режимов сглаживания с возможностью программируемой выборки более чем 16 сэмплов на пиксель, в том числе при FP16- или FP32-формате буфера кадра. Пиковая производительность до 32 отсчетов за такт, а в режиме без цвета (Z only) — 128 отсчетов за такт
Поддержка мониторовИнтегрированная поддержка до шести мониторов, подключенных по интерфейсам DVI, HDMI 2.0b и DisplayPort 1.3/1.4 HDR Ready




Спецификации референсной видеокарты Radeon RX 470

ПараметрЗначение
Частота ядра926 (1206) МГц
Количество универсальных процессоров2048
Количество текстурных блоков128
Количество блоков блендинга32
Эффективная частота памяти6600 (4×1650) МГц
Тип памятиGDDR5
Шина памяти256-бит
Объем памяти4 ГБ
Пропускная способность памяти211 ГБ/с
Вычислительная производительность (FP32)4-4,9 терафлопс
Теоретическая максимальная скорость закраскидо 38 гигапикселей/с
Теоретическая скорость выборки текстурдо 154 гигатекселей/с
ШинаPCI Express 3.0
Разъемы1 разъем HDMI и 3 DisplayPort
Энергопотреблениедо 120 Вт
Дополнительное питаниеОдин 6-контактный разъем
Число слотов, занимаемых в системном корпусе2
Рекомендуемая цена$179 (для рынка США) и 15 999  (для рынка России)

Название рассматриваемой модели видеокарты AMD Radeon соответствует принятой компанией системе наименований. Имя новинки отличается от предшественников измененным символом в первой части индекса и цифрой поколения — RX 470. Второе изменение было ожидаемо, так как поколение действительно новое, а замена R7/R9 на RX слегка странная, так как раньше эта цифра показывала уровень видеокарты (R7 медленнее, чем R9), а теперь все решения будут выпускаться с таким суффиксом, означающим непонятно что.

Вторая модель семейства Radeon 400 становится в текущей линейке компании чуть ниже старшей Radeon RX 480 — на место решений предыдущего поколения, аналогичных по позиционированию. Референсный вариант Radeon RX 470 будет предлагаться на североамериканском рынке по рекомендованной цене от $179, что хоть и выгодно для покупателей, но изначально мы ожидали цен еще ниже (порядка $149), ведь RX 480 предлагается по ценам от $199 и может оказаться удачнее по соотношению цены и производительности. Остается надеяться на существенное снижение цен в дальнейшем.

В любом случае, сегодняшняя новинка становится претендентом на звание лучшего предложения по производительности в своем классе. По скорости рендеринга Radeon RX 470 не так уж много уступит Radeon R9 390, а стоит заметно дешевле. Прямого конкурента у Nvidia новинке пока нет, так как GeForce GTX 1060 стоит дороже, а ничего менее производительного из нового поколения они еще не выпустили. Остается сравнивать ее c GeForce GTX 960, которая имеет существенно меньшую производительность.

Вероятно, видеокарты Radeon RX 470 будут поставляться в версиях с 4 ГБ и 8 ГБ памяти GDDR5 с эффективной частотой в 6600 МГц. Выбор из двух вариантов весьма удобен, так как младший вариант позволит сэкономить, а 4 ГБ на данный момент можно считать идеальным объемом видеопамяти, достаточным для Full HD-разрешения в большинстве случаев. Но преимущество варианта Radeon RX 470 с 8 ГБ может стать явным уже в недалеком будущем. Хотя сейчас и 4-гигабайтный вариант обеспечит приемлемую производительность даже в современных играх, 8 ГБ памяти позволят иметь приличный запас на будущее, так как требования к объему видеопамяти у игр постоянно растут, а больший объем видеопамяти помогает избежать неприятных падений производительности и проседаний FPS по сравнению с 4-гигабайтными вариантами, включая решения конкурентов вроде GeForce GTX 960.

Как и у старшего решения, для дополнительного питания платой используется один 6-контактный разъем, а вот значение типичного энергопотребления для модели Radeon RX 470 на урезанной версии графического процессора Polaris 10 установлено ниже — на уровне 120 Вт, поэтому есть надежда на то, что получение питания по слоту PCI Express не будет превышать установленное стандартами. Для вывода информации на дисплеи и другие устройства отображения на референсной плате используется один разъем HDMI 2.0b и три штуки DisplayPort 1.4 HDR Ready, но ничто не мешает партнерам компании менять этот набор по мере необходимости.

Архитектурные особенности

Графический процессор Polaris 10, ранее известный как Ellesmere, относится к четвертому поколению архитектуры Graphics Core Next, самому совершенному из архитектур компании AMD. Базовым блоком архитектуры является вычислительный блок Compute Unit (CU), из которых собраны все графические процессоры AMD. Вычислительный блок CU имеет выделенное локальное хранилище данных для обмена данными или расширения локального регистрового стека, а также кэш-память первого уровня с возможностью чтения и записи и полноценный текстурный конвейер с блоками выборки и фильтрации, он разделен на подразделы, каждый из которых работает над своим потоком команд. Каждый из таких блоков занимается планированием и распределением работы самостоятельно.

В своей основе, архитектура Polaris изменилась по сравнению с предыдущими поколениями не слишком сильно, больше изменений произошло в не основных блоках видеочипа — к примеру, были серьезно улучшены блоки кодирования и декодирования видеоданных и вывода информации на устройства отображения. В остальном, это просто еще одно поколение известной архитектуры Graphics Core Next (GCN). И все же некоторые аппаратные изменения в GPU были сделаны: улучшена обработка геометрии, поддерживается нескольких проекций с разным разрешением при VR-рендеринге, обновлен контроллер памяти с применением улучшенного сжатия данных, модифицирована предвыборка инструкций и улучшена буферизация, планирование и приоритезация вычислительных задач в асинхронном режиме, внедрена поддержка операций над данными в формате FP16/Int16.

Рассмотрим схему младшей версии графического процессора Polaris 10 Pro (по клику на изображении доступна увеличенная версия иллюстрации):

В состав урезанного графического процессора Polaris 10 входит один командный процессор Graphics Command Processor, четыре асинхронных вычислительных движка Asynchronous Compute Engines (ACE), два планировщика задач Hardware Scheduler (HWS), 32 вычислительных блока Compute Unit (CU) из 36 физически присутствующих в чипе, четыре геометрических процессора, 128 (из 144 в полной версии) текстурных модуля TMU (включающих по четыре блока загрузки и сохранения данных LSU на каждый TMU) и 32 блока ROP. Подсистема памяти графического процессора Polaris 10 Pro не была урезана и включает все те же восемь 32-битных контроллеров GDDR5-памяти, дающих общую 256-битную шину памяти, а кэш-память второго уровня имеет объем в 2 МБ.

Заявлено улучшение геометрических движков — в Polaris появился ускоритель отбрасывания геометрических примитивов Primitive Discard Accelerator, который работает в самом начале графического конвейера, отбрасывая невидимые треугольники, а также был внедрен новый индексный кэш для дублированной (instanced) геометрии, который оптимизирует перемещения данных и освобождает ресурсы внутренних шин передачи данных и увеличивает эффективность использования ПСП при дублировании геометрии (instancing).

Геометрические движки в чипах семейства Polaris используют новый алгоритм для фильтрации и отбрасывания геометрических примитивов. В современных играх плотность и количество треугольников порой так высока, что некоторые из них настолько малы, что не выводятся на экран, хоть и обрабатываются на GPU, как полноценные. Новые блоки для отбрасывания таких невидимых примитивов определяют и отбрасывают треугольники до отправки на растеризацию, что снижает объем требуемой работы и повышает эффективность. По данным компании AMD, новый алгоритм фильтрации и отбрасывания треугольников может повысить производительность геометрических блоков до 3-3,5 раз.

К примеру, в игре Batman: Arkham Origins используются очень высокие уровни тесселяции для плаща Бэтмена, и отбрасывание части треугольников, не попадающих на пиксели экрана, может улучшить общую производительность и улучшить энергоэффективность. Специальные блоки в составе чипов Polaris определяют треугольники, не имеющие площади на плоскости экрана (например, вырожденные треугольники, имеющие одинаковые координаты для двух или трех вершин) и отбрасывают их еще на ранней стадии обработки до того, как передать данные в вершинные шейдеры.

Геометрические движки в Polaris умеют работать гибче, они быстрее обрабатывают списки и группы треугольников (lists и strips), эффективнее кэшируют наборы вершин и многоугольников (mesh) при дублировании геометрии (instancing). Все эти улучшения не просто повышают пропускную способность блоков растеризации, но экономят энергию, тратящуюся ранее на бесполезную работу, что помогает повысить общую эффективность работы графического процессора.

Также в четвертом поколении GCN была улучшена эффективность исполнения шейдеров — введена предвыборка инструкций, улучшающая кэширование инструкций, снижающая простои конвейера и увеличивающая общую вычислительную эффективность. Еще был увеличен размер буфера инструкций для массива инструкций (wavefront), увеличивающий однопоточную производительность, введена поддержка операций над данными в форматах FP16 и Int16, помогающая снизить нагрузку на память, повысить скорость вычислений и улучшить энергоэффективность. Последнюю возможность можно применять в широком круге задач графики, машинного зрения и обучения. Также в улучшенной графической архитектуре GCN четвертого поколения были добавлены такие новые возможности, как техника качества обслуживания Quick Response Queue, которая позволяет назначать приоритет разным вычислительным задачам, позволяя выбирать наиболее важные.

Кроме увеличения объема кэш-памяти второго уровня до 2 МБ, изменен процесс обработки и кэширования данных в L2-кэше и увеличена общая эффективность работы подсистемы кэш-памяти и локальной видеопамяти. Контроллер памяти Polaris 10 получил поддержку GDDR5-памяти с эффективной тактовой частотой до 8 ГГц, но в случае младшей версии GPU было решено ограничить пропускную способность шины памяти на значении 211 ГБ/с, что довольно много для его класса.

Дополнительно были улучшены алгоритмы сжатия данных без потерь (Delta Color Compression — DCC), которым поддерживаются режимы сжатия с соотношением 2:1, 4:1 и 8:1. Внутричиповое сжатие данных увеличивает общую эффективность работы, обеспечивает более полное использование шины данных и сказывается на энергоэффективности. В частности, если в Radeon R9 290X внутреннего сжатия информации не было и эффективная ПСП равна его физической ПСП, то в случае решения на чипе Fiji сжатие позволило сэкономить почти 20% ПСП, а в случае Polaris и вовсе до 35-40%.

Самые важные изменения в графических процессорах Polaris связаны с применением продвинутого технологического процесса 14 нм FinFET, микроархитектурными изменениями, оптимизациями физического дизайна и новыми техниками управления питанием. Все это принесло свои плоды в виде значительного прироста производительности и эффективности, по сравнению с предыдущими решениями. В основном, высокая эффективность графических процессоров поколения Polaris стала возможной благодаря новому техпроцессу 14 нм FinFET компаний Samsung и Global Foundries, выбранному для производства обновленной и подтянутой архитектуре GCN, а также некоторым техникам по оптимизации дизайна GPU, которые доступны благодаря большому опыту компании по разработке центральных процессоров.

Новый техпроцесс 14 нм с применением FinFET является самым продвинутым и плотным среди подходящих для контрактного производства больших чипов (до 10-15% плотнее, чем 16 нм у TSMC), он заметно снижает потребление энергии в активном режиме и дает возможность размещения большего количества транзисторов на той же площади. Дополнительно, для достижения высокой тактовой частоты GPU, в архитектуре Polaris были проведены многочисленные изменения на низком уровне. Сложно судить, насколько велик вклад нового техпроцесса в общий прирост скорости, но если брать все оптимизации в комплексе, то комбинация всех улучшений позволила добиться вдвое-втрое лучшей энергоэффективности по сравнению с решениями из предыдущей линейки Radeon 300.

Из других важных функциональных изменений и нововведений в Polaris 10 мы можем отметить новые возможности по выводу изображения на дисплеи и улучшенное кодирование и декодирование видеоданных, о которых мы подробно рассказывали в обзоре Radeon RX 480. Новые видеокарты семейства Radeon RX стали одними из первых решений с поддержкой DisplayPort 1.3 HBR3 Ready и DisplayPort 1.4 HDR Ready. Новые стандарты позволяют подключать мониторы высокого разрешения и дисплеи с поддержкой HDR с расширенным динамическим диапазоном.

В новом поколении графических процессоров AMD улучшили и блоки аппаратной обработки видеоданных. Так, Polaris научили кодированию видеоданных в формат HEVC (H.265) с параметрами 1080p при 240 FPS, 1440p при 120 FPS и 4K при 60 FPS. Была добавлена поддержка двухпроходного кодирования потокового видео, и такой подход дает заметно более высокое качество динамического изображения — подробности обо всем этом читайте в статье о Radeon RX 480.

Выводы по теоретической части

Видеокарта модели Radeon RX 470 стала второй видеокартой семейства Polaris — новой линейки компании AMD, основанной на графических процессорах, спроектированных и произведенных при помощи технологического процесса 14 нм FinFET. Вместе с архитектурными оптимизациями это позволило в разы улучшить энергоэффективность новых видеокарт, и по этому показателю Radeon RX 470 выгодно отличается от видеокарт компании AMD из предыдущих поколений. Улучшения в вычислительных ядрах привели к 15%-ному росту производительности математических вычислений по сравнению с архитектурой GCN предыдущих поколений, а вместе с применением нового техпроцесса и другими оптимизациями это позволило улучшить энергоэффективность в разы, что означает лучшие пользовательские характеристики по тепловыделению и шуму системы охлаждения.

Архитектурных изменений в графическом процессоре Polaris 10 не очень много, но в нем все же были сделаны улучшения для более эффективных вычислений различных типов, в том числе при асинхронном исполнении кода, были улучшены возможности вывода изображения на дисплеи и функциональность блоков кодирования и декодирования видео. В списке функциональных изменений и улучшений — поддержка кодирования и декодирования современных видеоформатов с новыми возможностями: поддержка более высоких битрейтов и продвинутых форматов, готовность к декодированию потокового HDR-видео с онлайновых сервисов, качественный режим кодирования видео с двумя проходами. Появилась поддержка новых стандартов вывода изображения, которые станут весьма важными в будущем: 10- и 12-битные форматы вывода для HDR-телевизоров и мониторов, а также поддержка дисплеев с высокими разрешением и частотами обновления.

Но главное в видеокарте Radeon RX 470 — даже не энергоэффективность и производительность, а ее цена. Новый GPU, использующий самый современный технологический процесс, позволил заметно снизить цену видеокарт на его основе, включая модели RX 480 и RX 470. И при демократичной цене новая модель видеокарты AMD дает вполне достаточную скорость даже для современных игр с высокими и максимальными настройками качества в самом распространенном разрешении Full HD. Другое дело, что RX 480 за $199 может быть еще предпочтительнее — с учетом урезания графического процессора в RX 470...

Впрочем, как вы можете видеть на диаграмме AMD, главной цели они добились: их новинка серьезно опережает не только Radeon R9 380, но и видеокарту конкурента в виде GeForce GTX 960. И приличная скорость рендеринга при достаточно низкой цене делает Radeon RX 470 самой выгодной по соотношению цены и производительности видеокартой в своем ценовом сегменте (менее $200). Новая модель ориентирована на нижнюю часть среднеценового сегмента, привлекающего большое количество покупателей, и выпуск таких решений поможет укрепить рыночные позиции компании AMD в сегменте игровых видеокарт.

Ведь большинство пользователей покупает видеокарту даже не раз в год, а реже — раз в 2-3 года, и для них очень важно, чтобы она не просто была высокопроизводительной, но и поддерживала все современные стандарты и технологии. Это в полной мере относится к Radeon RX 470, которая взяла все самое лучшее от архитектуры Polaris, в том числе обширные возможности по поддержке важных особенностей DirectX 12 и Vulkan, по кодированию и декодированию видеороликов, а также подключению к современным и перспективным дисплеям.


В следующих частях нашей статьи мы определим производительность новой видеокарты AMD Radeon RX 470 на практике при помощи набора собственных тестов, сравнив скорость рендеринга новинки с показателями схожих по цене и позиционированию видеокарт компаний Nvidia и AMD. Сначала мы традиционно рассмотрим данные, полученные в наборе синтетических тестов, а затем перейдем и к игровым тестам.



Средняя текущая цена (количество предложений) в московской рознице:
Рассматриваемые карты Конкуренты
RX 470 4 ГБ — $261 (на 05.09.16) GTX 960 2 ГБ — $202 (на 05.09.16)
RX 470 4 ГБ — $261 (на 05.09.16) GTX 960 4 ГБ — $218 (на 05.09.16)
RX 470 4 ГБ — $261 (на 05.09.16) R9 380 2 ГБ — $197 (на 05.09.16)
RX 470 4 ГБ — $261 (на 05.09.16) R9 380 4 ГБ — $220 (на 05.09.16)
RX 470 4 ГБ — $261 (на 05.09.16) R9 380X 4 ГБ — $231 (на 05.09.16)
Asus Strix RX 470 4 ГБ — $261 (на 01.08.16) RX 470 4 ГБ — $261 (на 05.09.16)


Благодарим компанию AMD Russia
и лично Павла Подольского
за предоставленную на тестирование видеокарту

Блок питания Thermaltake DPS G 1050W для тестового стенда предоставлены компанией Thermaltake

Корпус Corsair Obsidian 800D Full Tower для тестового стенда предоставлен компанией Corsair

Модули памяти G.Skill Ripjaws4 F4-2800C16Q-16GRK для тестового стенда предоставлены компанией G.Skill

Corsair Hydro SeriesT H100i CPU Cooler для тестового стенда предоставлен компанией Corsair

Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт

Системная плата ASRock Fatal1ty X99X Killer для тестового стенда предоставлена компанией ASRock

Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate

2 накопителя SSD Corsair Neutron SeriesT 120 ГБ для тестового стенда предоставлены компанией Corsair




Дополнительно

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.