Семейства видеокарт AMD Radeon Справочная информация

Спецификации графических процессоров

кодовое имя	«Fiji»	«Grenada» «Hawaii»	«Antigua» «Tonga»	«Trinidad» «Curacao» «Pitcairn»	«Tobago» «Bonaire»
базовая статья	здесь	здесь	здесь	здесь	здесь
технология (нм)	28
транзисторов (млрд)	8,9	6,2	5,0	2,8	2,1
универсальных процессоров	4096	2816	2048	1280	896
текстурных блоков	256	176	128	80	56
блоков блендинга	64		32		16
шина памяти	4096	512	384	256	128
типы памяти	HBM	DDR3 GDDR5
системная шина	PCI Express 3.0
интерфейсы	DVI Dual-Link HDMI DisplayPort
вершинные шейдеры	5.0
пиксельные шейдеры	5.0
точность вычислений	FP32/FP64
Сглаживание	MSAA CFAA SSAA EQAA MLAA

Спецификации референсных карт семейства Radeon 300

карта	чип	блоков ALU/TMU/ROP	частота ядра, МГц	частота памяти, МГц	объем памяти, ГБ	ПСП, ГБ/c (бит)	текстури- рование, Гтекс	филлрейт, Гпикс	TDP, Вт
Radeon R9 Fury X	«Fiji»	4096/256/64	1050	1000	4 HBM	512 (4096)	269	67	275
Radeon R9 Fury	«Fiji»	3584/224/64	1000	1000	4 HBM	512 (4096)	224	64	275
Radeon R9 Nano	«Fiji»	4096/256/64	до 1000	1000	4 HBM	512 (4096)	256	64	175
Radeon R9 390X	«Hawaii»	2816/176/64	1050	1500(6000)	8 GDDR5	384 (512)	185	67	275
Radeon R9 390	«Hawaii»	2560/160/64	1000	1500(6000)	8 GDDR5	384 (512)	160	64	275
Radeon R9 380X	«Tonga»	2048/128/32	970	1425(5700)	4 GDDR5	182 (256)	124,2	31,0	190
Radeon R9 380	«Tonga»	1792/112/32	970	1425(5700)	2-4 GDDR5	182 (256)	108,6	31,0	190
Radeon R7 370	«Pitcairn»	1024/64/32	975	1400(5600)	2-4 GDDR5	179 (256)	62,4	31,2	110
Radeon R7 360	«Bonaire»	768/48/16	1050	1625(6500)	2 GDDR5	104 (128)	50,4	16,8	100

Графический ускоритель AMD Radeon R9 Fury X

Кодовое имя	«Fiji»
Технология производства	28 нм
Количество транзисторов	8,9 млрд.
Архитектура	Унифицированная, с массивом общих процессоров для потоковой обработки многочисленных видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectX	Уровень возможностей Feature Level 12_0 и шейдерной модели Shader Model 5.0
Шина памяти	4096-битная: восемь контроллеров памяти с поддержкой стандарта High Bandwidth Memory
Частота графического процессора, МГц	1050
Вычислительные блоки	64 вычислительных блока GCN, включающих 256 SIMD-ядер, состоящих в общем из 4096 ALU для расчетов с плавающей запятой (поддерживаются целочисленные и плавающие форматы, с точностью FP32 и FP64)
Блоки текстурирования	256 текстурных блоков, с поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
Блоки растеризации (ROP)	64 блока ROP с поддержкой режимов сглаживания с возможностью программируемой выборки более чем 16 сэмплов на пиксель, в том числе при FP16- или FP32-формате буфера кадра. Пиковая производительность до 64 отсчетов за такт, а в режиме без цвета (Z only) — 256 отсчетов за такт
Поддержка мониторов	Интегрированная поддержка до шести мониторов, подключенных по интерфейсам DVI, HDMI и DisplayPort

Спецификации видеокарты Radeon R9 Fury X
Частота ядра, МГц	1050
Количество универсальных процессоров	4096
Количество текстурных блоков	256
Количество блоков блендинга	64
Эффективная частота памяти, МГц	1000 (2×500)
Тип памяти	HBM 4096-бит
Объем памяти, ГБ	4
Пропускная способность памяти, ГБ/с	512
Вычислительная производительность (FP32), Терафлопс	8,6
Теоретическая максимальная скорость закраски, Гигапикселей/с	67,2
Теоретическая скорость выборки текстур, Гигатекселей/с	268,8
Шина	PCI Express 3.0
Разъемы	один HDMI 1.4a и три DisplayPort 1.2a
Типичное энергопотребление, Вт	275
Дополнительное питание	Два 8-контактных разъема
Число слотов, занимаемых в системном корпусе	2
Рекомендуемая цена	для рынка США — $649

Этой моделью компания AMD открыла новое подсемейство элитных видеокарт Fury, номинально входящих в линейку Radeon 300. Топовое решение подсемейства получило наименование Fury X — суффикс «X» указывает на экстремальное (в данном случае — одночиповое) решение. Выбор имени Fury компания не пыталась как-то обосновать. Вероятно, это имя взяли от успешных в свое время видеокарт семейства ATI Rage Fury, вышедших в конце 1990-х годов. Кроме того, Фурии — это богини мести в древнеримской мифологии, а Титаны — боги из древнегреческой мифологии.

Модель Radeon R9 Fury X заняла свое положение в самой верхней части продуктовой линейки компании, а установленная рекомендованная цена Radeon R9 Fury X равна $649 — ровно на уровне прямого конкурента в лице GeForce GTX 980 Ti от Nvidia, который был анонсирован в конце мая в виде превентивного удара по будущему (на тот момент) решению AMD. Конкурирующее решение предложило производительность, близкую к той, что имеет элитная модель GeForce GTX Titan X, за куда меньшие деньги, и Fury X теперь приходится соперничать именно с игровой GTX 980 Ti.

Один из самых спорных моментов в характеристиках новой модели — наличие лишь 4 ГБ видеопамяти, чего пока что хватает даже для высоких разрешений при максимальных настройках качества, но в ряде современных игр при 4K-разрешении рендеринга, а также включении полноэкранного сглаживания и высоких настройках качества, уже сейчас требуется еще больший объем. И AMD была бы рада предложить вариант с 8 ГБ, но увы — первое поколение HBM-памяти просто не позволяет сделать его. Подробнее обо всех тонкостях, связанных с HBM-памятью, читайте ниже.

Сама по себе видеокарта очень компактна по размерам — длина печатной платы Radeon R9 Fury X равна всего лишь 7.5 дюймов (около 190 мм), что значительно меньше типичных референсных карт верхнего ценового диапазона. Небольшая плата сочетается с большим радиатором системы водяного охлаждения. Сочетание СВО с HBM-памятью позволило уменьшить физические размеры и число компонентов на плате (в схеме питания, в частности). Можно сравнить площади GPU и RAM на Radeon R9 290X и R9 Fury X:

В типичных игровых условиях видеокарта Radeon R9 Fury X потребляет около 275 Вт, но так как она оснащена парой 8-контактных разъемов питания PCI-E, то может получать от блока питания до 375 Вт, то есть, намного больше. С точки зрения интерфейсов ввода-вывода, Radeon R9 Fury X способен выводить информацию на шесть дисплеев (при использовании хаба DisplayPort 1.2 MST), подключенных по разъемам DVI (требуется переходник), HDMI 1.4a и DisplayPort 1.2a.

Среди разъемов на плате есть один видеовыход формата HDMI и три DisplayPort. От устаревшего разъема DVI решили избавиться совсем, хотя в Radeon HD 7970 и Radeon R9 290X они ещё были, а иногда и по два. И пользователям старых мониторов с DVI-интерфейсами теперь придется использовать переходники: пассивные, если достаточно Single Link, и более дорогие для Dual Link соединений.

Увы, но по причине отсутствия поддержки HDMI 2.0, новинка поддерживает вывод изображения в разрешении 4K при 60 Гц только по DisplayPort. Вероятно, со временем также появится возможность применения активных переходников с DisplayPort на HDMI 2.0, но пока что такие конфигурации не работают.

Архитектурные и функциональные особенности

Так как модель Radeon R9 Fury X основана на графическом процессоре Fiji, который принадлежит к давно известной архитектуре Graphics Core Next (GCN), то о многих деталях вы можете узнать из наших ранних материалов. Указанная архитектура лежит в основе всех современных решений компании AMD, и даже последние GPU отличаются лишь некоторыми модификациями в вычислительных способностях и дополнительными графическими возможностями, важными для поддержки DirectX 12.

Как и предыдущий топовый чип Hawaii, новый GPU не является первенцем полностью новой архитектуры, а лишь использует последнюю версию нынешней Graphics Core Next (ее можно назвать GCN 1.2 или GCN третьего поколения). В Fiji было сделано небольшое количество изменений по сравнению с тем же прошлогодним Tonga, и новинку вполне можно отнести к поколению GCN 1.2. Из базовых изменений, появившихся в Fiji, основанном на последней версии архитектуры Graphics Core Next, можно отметить все то, что мы уже видели в чипе Tonga, на котором базируется видеокарта модели Radeon R9 285.

Новый топовый графический процессор включает в себя все доработки GCN 1.2, в том числе улучшенную производительность обработки геометрии и тесселяции (по этим показателям Fiji на уровне с Hawaii и Tonga и быстрее чем Tahiti), новые методы сжатия данных без потерь в кадровом буфере, некоторые мультимедийные 16-битные инструкции, а также увеличенный объем кэш-памяти второго уровня до 2 МБ. С точки зрения вычислительных возможностей, новый GPU получил улучшенное планирование и распределение задач и несколько новых инструкций для параллельной обработки данных.

Наиболее «громким» архитектурным улучшением является появление значительно улучшенных алгоритмов сжатия данных кадрового буфера без потерь — для этого блоки ROP были специальным образом модифицированы. Именно операции (в основном записи) с кадровым буфером являются наиболее требовательными к пропускной способности памяти, ведь GPU записывает в буфер очень большое количество пикселей каждый кадр. Так что увеличение эффективности этой работы приводит к меньшей требовательности к ПСП и увеличивает так называемую эффективную ПСП.

В случае чипов архитектуры GCN 1.2, новые методы сжатия данных буфера кадров обеспечивают степень сжатия до 8:1, а в среднем это выливается в 40% улучшения по эффективности использования ПСП. Так, Radeon R9 285 с 256-битной шиной имеет схожую эффективную ПСП с Radeon R9 280, имеющим 384-битную шину памяти. Ну а в случае топового чипа Fiji, эффективная ПСП выросла до сверхвысоких значений, так как чип содержит 4096-битную память стандарта HBM, но об этом — чуть позже.

Также в рамках архитектуры GCN 1.2 были сделаны некоторые изменения и в вычислительных блоках: улучшения планирования и распределения задач между исполнительными блоками в рамках гетерогенной архитектуры HSA, внедрение новых 16-битных инструкций, позволяющих повысить скорость и снизить энергопотребление, а также улучшения по параллельной обработке данных, что наиболее важно в случае топового графического процессора Fiji. Как и другие продукты архитектуры GCN 1.2, новый GPU имеет возможность ограниченного обмена данными между разными линиями SIMD, открывающую возможность для новых эффективных алгоритмов в OpenCL-программах.

Ну а для простых энтузиастов самыми важными архитектурными изменениями стали уже упомянутое сжатие данных кадрового буфера и ускорение геометрической обработки и тесселяции. Это улучшение было сделано еще в Hawaii, ничего не изменилось и в Tonga. А вот теперь в случае Fiji работа геометрического конвейера была дополнительно оптимизирована, что должно положительно сказаться в задачах с большим количеством геометрии и с применением тесселяции.

Общая схема графического процессора Fiji весьма схожа с той, что мы видели еще в чипе Hawaii, вышедшем в далеком уже 2013 году. Оба этих GPU разделены на четыре шейдерных движка Shader Engine, каждый из которых имеет свой собственный процессор для обработки геометрических данных и растеризатор, а также по четыре укрупненных блока ROP, способных обработать по 16 пикселей за такт (всего получается 64 блока ROP в каждом из этих чипов). GPU имеет единый командный процессор и восемь движков асинхронных вычислений Asynchronous Compute Engine, которые были модифицированы с учетом изменений в GCN 1.2.

По сравнению с Hawaii, в плане организации инженеры компании AMD в чипе Fiji не тронули ничего, просто разместив большее количество вычислительных блоков Compute Unit в каждом движке Shader Engine (16 вместо 11), но оставили без изменений количество самих движков (вероятно, это — архитектурное ограничение GCN в ее нынешнем виде) и количество других исполнительных блоков в их составе.

С учетом того, что каждый CU содержит по 64 ALU, получается 1024 ALU на каждый Shader Engine и 4096 потоковых процессора на весь Fiji. Соответственно же было увеличено и количество текстурных блоков, ведь на каждый CU в видеочипах архитектуры GCN приходится по четыре блока TMU, поэтому всего в новом GPU их стало 256 штук, в отличие от 176 TMU в Hawaii.

Соответственно, теоретические значения скорости вычислений и обработки текстур в Fiji выросли, а вот пиковые значения скорости обработки геометрии и скорости заполнения (филлрейт, производительность блоков ROP) остались практически на том же уровне, с поправкой лишь на разную частоту GPU. Возможно, в некоторых случаях может наблюдаться упор общей производительности в скорость заполнения сцены или обработки геометрии, но это сильно зависит от условий (сложности сцены и значения overdraw для нее, а также разрешения и полноэкранного сглаживания и т.д.).

Но представители AMD уверяют, что в случае Hawaii ограничителем чаще всего служит пропускная способность памяти (ПСП), а производительности блоков ROP вполне достаточно в большинстве случаев, и скорость рендеринга в их возможности упирается крайне редко. Но ведь в Fiji применяется более быстрая HBM-память с широкой шиной, а также внедрены новые методы сжатия данных в экранном буфере, да и сами блоки ROP в Fiji получили более широкие возможности по работе с данными формата 16-бит на цвет. Так что, скорее всего, количество случаев упора общей производительности в возможности блоков ROP только увеличится. А повысить количество блоков ROP в новом чипе не представлялось возможным, так как GPU и так получился достаточно крупным.

Исходя из количества ALU в 4096 штуки, а также максимальной частоты GPU, равной 1050 МГц, можно получить теоретическую производительность вычислений одиночной точности (FP32) в 8,6 терафлопс. А вот с вычислениями двойной точности в новом чипе дела обстоят значительно хуже, чем в том же Hawaii — тут AMD пришлось пойти примерно в том же направлении, что выбрала Nvidia для своего старшего Maxwell, сместив акцент в сторону игрового применения в ущерб профессиональным вычислениям.

Хотя разные чипы архитектуры GCN умеют исполнять FP64-вычисления с темпом от 1/2 до 1/16 от скорости FP32-вычислений, для Fiji компания AMD выбрала минимальное значение (1/16), что дает скорость FP64 около 538 мегафлопс. Сравните это с возможностями Hawaii, который выполняет вычисления с двойной точностью лишь вдвое медленнее вычислений одинарной точности. Даже менее сложные дешевые чипы GCN имеют темп в 1/8! Так что Fiji стал таким же «игровым», как и GM200. Похоже, что AMD взяла пример (хороший или нет — зависит от точки зрения) с Nvidia, обрезавшей свой топовый GPU еще сильнее. И в итоге, оба топовых игровых чипа от AMD и Nvidia являются больше игровыми, чем профессионально-вычислительными.

Да и в остальном графический процессор Fiji является не совсем типичным видеочипом для AMD. В этот раз компания выпустила довольно большой GPU — площадью почти 600 мм²! А ведь они вот уже несколько лет стараются избегать подобных больших и сверхгорячих видеочипов, так как они слишком дороги в разработке и производстве, да и времени от начала разработки до выхода на рынок требуют больше из-за сложностей и проектирования и сниженного выхода годных чипов. Не говоря уже о том, что с большими GPU и риск неудач выше. Хотя, конечно же, сейчас 28 нм техпроцесс уже отлично отработан и особых проблем производителям видеочипов не доставляет.

Но даже Hawaii в свое время уже был немаленьким с его 438 мм², а уж в виде Fiji впервые за несколько лет у AMD получился GPU, лишь незначительно менее сложный, по сравнению с конкурирующим чипом Nvidia по количеству транзисторов и размеру кристалла. Так, Fiji имеет размер ядра в 596 мм², что лишь на 5 мм² меньше размера GM200 разработки компании Nvidia. Кстати, цифра около 600 мм² весьма интересна — похоже, что тайваньская TSMC просто не способна массово производить еще большие чипы, и обе компании рассчитывали получить максимум с учетом этого ограничения. Тем более интересно, каких успехов они достигли в итоге по скорости и функциональности по сравнению друг с другом.

Снижение темпа FP64-вычислений позволило значительно упростить вычислительные блоки в Fiji, и количество блоков CU увеличилось с 44 до 64, поэтому вместо 2816 вычислительных блоков ALU в новом GPU их стало ровно 4096. С ростом вычислительной и текстурной производительности, по сравнению с Hawaii, остальные параметры производительности изменились не сильно. К примеру, количество геометрических движков, равно как и теоретическая скорость обработки геометрии, остались прежними (чуть больше из-за повышенной частоты видеочипа в Radeon R9 Fury X по сравнению с Radeon R9 290X). Но в архитектуре GCN 1.2 также были сделаны улучшения, предназначенные для ускорения обработки геометрии, и Fiji по этому показателю должен быть быстрее Hawaii даже при равных пиковых показателях. Мы обязательно проверим это в наших синтетических тестах.

Хотя сам по себе GPU архитектурно изменился очень мало, в нем есть несколько изменений, связанных с применением нового типа памяти. Графический процессор Fiji включает восемь контроллеров памяти HBM, каждый из которых обслуживает половину HBM-стека (всего их на чипе четыре), и каждый контроллер связан со своими восемью блоками ROP и разделом кэш-памяти второго уровня объемом 256 КБ.

Fury X получил на 60% большую пропускную способность видеопамяти, по сравнению с R9 290X (4096-битная шина с 512 ГБ/с против 512-битной шины с 320 ГБ/с). Вместе с улучшениями по сжатию цветовой информации кадрового буфера, это дает вдвое большую эффективную ПСП — а этот показатель является одним из ключевых для современных графических процессоров в рамках реальных приложений. Конечно, сжатие будет хорошо работать в 3D-рендеринге, но вряд ли в вычислительных задачах, но в любом случае применение HBM-памяти дает неплохой прирост в ПСП. Но даже при такой высокой ПСП, кэш-память все равно в разы быстрее, и поэтому в новом GPU был увеличен и объем кэш-памяти второго уровня: Fiji имеет 2 МБ L2-кэша, по сравнению с 1 МБ у предшествующего топового решения.

Важные изменения произошли в плане обработки видеоданных — соответствующий блок Unified Video Decoder (UVD) имеет те же возможности, что и блоки APU семейства «Carrizo» и умеют аппаратно ускорять декодирование видеоданных в формате H.265 (HEVC). По части кодирования видеоданных, возможности блока VCE в Fiji не изменились, он все также умеет кодировать визуальный ряд в формат H.264, а вот блок декодирования видео получил полную аппаратную поддержку декодирования видеоданных в формате H.265, став первым дискретным GPU с подобной поддержкой.

Также AMD отмечает улучшенный скейлер и технологию Eyefinity — возможность вывода картинки на шесть устройств вывода изображения. К сожалению, ожидаемая многими поддержка HDMI 2.0 в новом GPU отсутствует. И это — довольно существенный недостаток, ведь самые доступные устройства с 4K-разрешением — это телевизоры, в которых чаще всего есть HDMI 2.0 порты и нет DisplayPort. Напомним, что конкурирующие видеокарты Nvidia получили поддержку HDMI 2.0 во всех GPU второго поколения архитектуры Maxwell.

Среди достоинств Fiji остается отметить поддержку технологии TrueAudio, которой также обладает чип Fiji. Эта технология появилась в графических процессорах семейства GCN 1.1, она предлагает аппаратное ускорение обработки аудиоданных на нескольких DSP от Tensilica, аналогичных тем, что включены в состав основного чипа консоли Sony PlayStation 4. Несмотря на все прелести аппаратной обработки звука в виде разгрузки основного CPU от этих задач, поддержка TrueAudio в играх ограничивается несколькими играми, вышедшими под эгидой специальной технической и маркетинговой программы AMD, а вероятность увидеть ее в других играх не слишком велика.

Конструктивные особенности и система охлаждения

Неудивительно, что компания AMD решила использовать при создании Radeon R9 Fury X такие же высокие стандарты для своей элитной серии Fury, как и Nvidia в Titan. Корпус видеокарты выполнен из нескольких частей, собранных вокруг печатной платы, а при его изготовлении применяются алюминиевые сплавы с разной обработкой поверхности, в итоге она выглядит и ощущается солидно, как и требуется от топового решения.

Фронтальная панель платы Radeon R9 Fury X, закрывающая компоненты на плате — съемная. Она закреплена четырьмя винтами и может заменяться панелью, сделанной из другого материала и с собственным рисунком — для возможности придания карте персонализированного вида. В случае видеокарты, которая обычно помещена внутрь корпуса так, что ее фронтальная поверхность не будет видна, это не так уж важно, но в целом — идея оригинальная и интересная.

Для большего визуального эффекта на плату решили поместить несколько светодиодов, а также красный светящийся логотип — аналогично двухчиповой модели прошлого поколения Radeon R9 295X2, новинка имеет на борту красную светящуюся надпись RADEON. Также новая топовая видеокарта компании AMD содержит несколько светодиодов, сигнализирующих о режиме работы GPU и размещенных над разъемами дополнительного питания PCI Express.

Линейка из восьми светодиодов GPU Tach показывает интенсивность загрузки графического процессора работой в данный момент. То есть, в игровом режиме все восемь светодиодов будут гореть, а в режиме рабочего стола горит лишь один из них. Цвет этих светодиодов выбирается пользователем из красного или голубого при помощи переключателя на задней стороне платы. А еще один зеленый светодиод, расположенный рядом с ними, показывает активность режима пониженного энергопотребления AMD ZeroCore.

Для обеспечения охлаждения мощнейшего графического процессора компании AMD было решено применить систему водяного охлаждения, которая обеспечивает работу GPU при типичной игровой нагрузке при температуре около 50 градусов. Системы водяного охлаждения уже давно стали нормой в системах, предназначенных для энтузиастов, а модель Radeon R9 295X2 стала первой видеокартой с референсным кулером такого типа — с системой водяного охлаждения замкнутого цикла.

Так как новый GPU очень требователен к питанию и выделяет много тепла, то немудрено, что и для Radeon R9 Fury X была выбрана аналогичная система производства компании Cooler Master. Кулер имеет радиатор и вентилятор размера 120 мм, а их совместная толщина равна 60 мм, что довольно много. В результате, СВО спокойно отводит до 500 Вт тепла, что намного превышает указанную цифру типичного энергопотребления для Fury X, равную 275 Вт — запас оставлен очень большой.

Хотя ранее мы уже видели не одну видеокарту с системами водяного охлаждения, но именно сочетание ее с памятью типа HBM позволило заметно уменьшить физические размеры печатной платы и корпуса видеокарты. Новая память также позволила снизить число компонентов в системе питания платы. Поэтому новинка сильно отличается от привычных топовых видеокарт с воздушным охлаждением, занимающих пару-тройку слотов по всей длине. Длина печатной платы Radeon R9 Fury X равна всего лишь 7.5 дюймов (порядка 190 мм), что значительно меньше типичных референсных карт верхнего ценового диапазона.

Все компоненты на плате (GPU, VRM и чипы памяти) охлаждаются единой системой, укомплектованной 120 мм радиатором и качественным вентилятором соответствующего размера производства Nidec. Кулер охлаждает сам GPU и соответствующие компоненты, в том числе MOSFET в модуле регулятора напряжения (VRM) — для этого проложена специальная трубка. Сам видеочип с помещенными на него микросхемами HBM охлаждается основным блоком помпы.

Применяемый кулер способен отвести до 500 Вт тепла, хотя модель получает питание по паре 8-контактных разъемов PCI-E, позволяющих передать до 375 Вт, а шестифазный модуль регулятора напряжения VRM способен обеспечить схемы током до 400 А — здесь виден большой запас для энтузиастов разгона, так как типичная величина энергопотребления платы Fury X, указанная компанией AMD, гораздо ниже — всего лишь 275 Вт.

Так как в системе охлаждения Radeon R9 Fury X применяется качественный вентилятор большого размера, то кулер обеспечивает довольно низкий уровень шума в 32 дБА — это значительно меньше, чем у воздушного охлаждения с типичными 40-45 дБА. Хотя от первых пользователей видеокарт Fury X появились претензии к шуму, исходящему от помпы, а не вентилятора — но эту проблему AMD обещала решить в следующих партиях производимых для рынка плат.

Большинство энтузиастов, покупающих подобные видеокарты, интересуются разгоном, в том числе и экстремальным. И компания AMD облегчила часть задачи, укомплектовав свою топовую одночиповую карту мощным кулером и системой питания с большим запасом. Чаще всего разгон ограничивает именно недостаток охлаждения или питания, а Radeon R9 Fury X была спроектирована так, чтобы минимизировать эти ограничения, что должно порадовать любителей разгона.

Используя страницу AMD Overdrive в панели управления AMD Catalyst Control Center, пользователю дается возможность установки тактовых частот, целевой температуры, скорости вращения вентилятора и пределов по питанию — чтобы регулировать скорость видеокарты. Пока что с разгоном видеопамяти нового стандарта HBM не все понятно, но зато ее разгон с 500 до 600 МГц дает ощутимое ускорение в играх:

Надо сказать, что на момент выхода карты ее возможности для оверклокинга были серьезно ограничены, компания AMD не дала возможности повышения напряжения и разгона HBM-памяти, можно повысить только частоту GPU и предел общего потребления энергии, но задел имеется весьма серьезный. Этому поможет и переключатель Dual BIOS, как и в топовых картах предыдущего поколения, позволяющий выбирать между фиксированным референсным образом BIOS и модифицированным.

Новый стандарт памяти High Bandwidth Memory

Как мы уже упоминали, главным нововведением видеокарты AMD Radeon R9 Fury X стало применение видеопамяти нового стандарта — High Bandwidth Memory (HBM). До сих пор в видеокартах применялась лишь GDDR5-память, которая является эволюционным развитием давно известных стандартов, и хотя и имеет улучшенные характеристики по производительности и энергопотреблению по сравнению с GDDR3/GDDR4, но улучшения эти не столь значительны.

Основам ранее применяемых стандартов DRAM уже много лет, и модификации позволили повысить пропускную способность далеко не настолько, насколько выросла производительность GPU за это время. За двадцать лет улучшения стандартов позволили поднять пропускную способность памяти (ПСП) всего лишь примерно в 50 раз, в то время как скорость вычислений графических процессоров за это время выросла много больше. Поэтому индустрии потребовались новые типы памяти, которые дадут совершенно иные возможности.

В стандарте GDDR5 тот тип памяти достиг своего предела, и хотя небольшие возможности для роста ПСП еще есть, но они требуют больших усилий и не изменят ситуацию кардинально. При этом вопрос высокого потребления не решится, а ведь энергоэффективность — главный параметр для любого современного чипа. Уже текущие поколения GDDR5-памяти потребляют слишком много энергии из-за сложных механизмов тактования и работы на очень высокой частоте, а любые улучшения производительности GDDR5 связаны с дальнейшим повышением частоты и сложности, а значит, и энергопотребления.

Также GDDR5-чипы занимают слишком много места на плате и требуют применения нескольких каналов памяти, что усложняет и сам графический процессор. Особенно если говорить о топовых GPU с 384-битной или даже 512-битной шиной памяти. Хотя сам по себе размер видеокарт не имеет слишком большое значение для игровых ПК, но в последнее время появляется много компактных корпусов в новых форм-факторах, применять в которых нынешние видеокарты не получится.

Чтобы решить все эти проблемы, компании AMD и Hynix еще в 2011 году анонсировали совместные планы по разработке и внедрению нового стандарта памяти — High Bandwidth Memory. Новый тип памяти стал огромным шагом вперед по сравнению с применяющейся до сих пор GDDR5-памятью, и среди главных преимуществ HBM значатся серьезное увеличение пропускной способности и увеличение энергетической эффективности (снижение потребления вместе с ростом производительности).

Напомним, что компания AMD, как и компания ATI в прошлые годы, в последнее время является лидером по освоению новых типов графической памяти. Хотя продукты с поддержкой GDDR2 и GDDR3 первыми выпустили не они, именно эта компания первой оснастила свои решения видеопамятью последних двух существующих стандартов: GDDR4 и GDDR5. Соответственно, в 2011 году в партнерстве с Hynix они решили продолжить инициативу по приоритетной разработке и внедрению новых стандартов видеопамяти в будущих GPU. И вот, после четырех лет разработки компании наконец-то представили графический процессор, оснащенный совершенно новым типом графической памяти.

Стандарт HBM отличается тем, что вместо массива очень быстрых чипов памяти (7 ГГц и выше), соединенных с графическим процессором по сравнительно узкой шине от 128 до 512 бит, применяются очень медленные чипы памяти (порядка 1 ГГц эффективной частоты), но ширина шины памяти при этом получается шире в несколько раз. Как и в случае с GDDR5, ширина шины для различных GPU будет разной и она зависит как от поколения стандарта HBM (первого или второго на данный момент), так и конкретного воплощения.

В случае Radeon R9 Fury X применяются четыре стека (stacks, стопок или пачек) чипов памяти, каждый из которых состоит из четырех микросхем и дает 1024-битный интерфейс памяти. То есть в итоге на GPU получаются широченная по меркам GDDR5-памяти шина в 4096 бит. Естественно, что при этом чипам памяти не обязательно работать на таких же высоких частотах, как в случае GDDR5 — сравнительно низкой частоты будет достаточно, чтобы по полосе пропускания памяти (ПСП) обойти привычные интерфейсы.

4096-битная шина памяти требует значительно большее количество соединений, по сравнению с привычной GDDR5, и все они должны поместиться физически, чтобы такая шина работала. Именно эти параллельные соединения и являются главной проблемой в соединении GPU с HBM-памятью, и для успешного решения задач по их размещению в новом типе памяти применяется несколько новых технологий.

Самым важным вопросом является эффективная разводка 4096-битной шины памяти. Ведь даже самые последние технологии производства чипов имеют свои ограничения, и графические процессоры никогда не переходили предел в 512 бит, даже в самых последних топовых графических чипах вроде Hawaii. Организовать еще более широкую шину памяти на больших GPU теоретически возможно, но решение этой сложной задачи будут ограничивать физические возможности по размещению такого количества соединений и на печатной плате и в самом чипе, не говоря уже о необходимом количестве контактов на корпусах типа BGA.

Решением части этой задачи стала разработка специального слоя, который способен вместить соединения большой плотности — кремниевой подложки (interposer). Этот слой похож на обычный кремниевый кристалл, в котором вместо некоей внутренней логики размещены металлические слои для передачи сигналов и питания между различными компонентами — получается некий переходник. При производстве interposer используются возможности современных литографических процессов, позволяющих разместить очень тонкие проводники, которые практически невозможно вместить на традиционных печатных платах.

Использование слоя-переходника решает часть фундаментальных проблем по размещению широкой шины памяти, а также дает и другие преимущества. Так, вместе с решением проблемы маршрутизации проводников, эта кремниевая подложка позволяет разместить чипы памяти очень близко к GPU, но не прямо на кристалле, как применяется в случаях некоторых мобильных систем-на-чипе. А если поместить микросхемы памяти близко к графическому чипу, то и длинных соединений между ними не требуется, что упрощает конструкцию и предъявляет менее жесткие требования по питанию.

Помещение чипов памяти вместе с основной логикой также выигрывает в повышении степени интеграции — большее количество функциональной логики можно собрать в одной упаковке, что уменьшает количество необходимой внешней обвязки. В итоге, компания AMD выпустила первый массовый продукт, использующий слой interposer, и стала первой компанией, выпустившей решение с применением stacked DRAM и интеграцией чипов HBM и GPU.

Конечно, у решения с промежуточным слоем есть и свои недостатки — усложнение конструкции и повышение себестоимости производства. Естественно, что никто из AMD не говорит о стоимости производства первых чипов с HBM, но очевидно, что добавление дополнительного слоя, а также его соединение и тестирование всего продукта, включающего сложнейшую логику, может лишь увеличить его себестоимость, особенно в самом начале его производства. И особенно — по сравнению с давно отработанными технологиями производства традиционных печатных плат и чипов без кучи слоев, соединенных друг с другом.

Рассматривая весь «бутерброд» в разрезе, можно увидеть, что интерпозер становится новым слоем между традиционной упаковкой и чипами DRAM с дополнительной управляющей логикой, смонтированными прямо на интерпозере. Для связи чипов памяти и логики с интерпозером используются специальные соединения типа microbump и TSV (through-silicon vias), далее интерпозер соединяется с основным кристаллом, а тот уже привычно соединен с печатной платой контактами BGA.

Само по себе присоединение чипа с HBM-памятью к печатной плате несколько упрощается, так как в данном случае на PCB не будет никаких соединительных линий к микросхемам памяти, остаются только линии для передачи данных (по шине PCI Express и т. п.), а также для питания графического процессора и микросхем памяти. Часть этих сложностей переходит на слой интерпозера, поэтому его тестирование при производстве становится одной из самых важных задач.

Еще один важный технологический момент в присоединении чипов HBM-памяти друг к другу заключается в создании соединений типа through-silicon vias (TSV). Обычные типы соединений позволяют соединить два слоя вместе, а TSV расширяет эти возможности, соединяя и дальнейшие кремниевые слои. С точки зрения производственного процесса, соединения типа TSV сложнее в производстве и объединение чипов DRAM в стеки является непростой технологической задачей. К стопке чипов памяти снизу присоединено еще и логическое ядро, которое отвечает за работу всех чипов DRAM в стеке и управляет шиной HBM между стеком и GPU.

Главным ограничителем для дальнейшего роста производительности сейчас являются возможности по изготовлению слоя интерпозера — в нем нужно сделать много очень маленьких соединений для нескольких слоев памяти. Именно поэтому количество слоев пока что ограничено четырьмя, а размещения восьми слоев придется немного подождать — в HBM второго поколения уже будет восемь слоев (и вдвое больше ПСП при прочих равных условиях, соответственно). В остальном HBM2 будет мало отличаться от HBM1, разве что еще ожидается поддержка коррекции ошибок ECC, важная для применения в профессиональных решениях.

Но второе поколение появится лишь в следующем году, а что дает применение HBM в Radeon R9 Fury X? Первое поколение HBM, которое применяется в новом топовом GPU от AMD, позволяет использовать 1024-битные стеки из четырех чипов, работающих с частотой до 500 МГц, которая соответствует эффективной частоте в 1 ГГц для DDR-памяти. То есть каждый стек способен обеспечить до 128 ГБ/с полосы пропускания видеопамяти. Это дает нам итоговую пропускную способность в 512 ГБ/с.

Конечно же, это заметно больше, чем 320 ГБ/с у Radeon R9 290X и 336 ГБ/с у лучшей карты конкурента GeForce GTX Titan X, но обеспечивает лишь до 60% прироста в ПСП — не слишком много для абсолютно нового типа памяти с такой широкой шиной, ведь чисто теоретически можно предположить появление GPU с 512-битной шиной и применением очень быстрой GDDR5-памяти, которая по ПСП не уступит первому варианту HBM-памяти. Представители AMD также утверждают, что и задержки доступа к памяти в случае с HBM получаются чуть ниже — на 15-20% по сравнению с GDDR5. Это не так уж важно для графических задач, но очень важно для CPU и некоторых вычислительных задач на GPU.

Но, кроме повышения ПСП и небольшого снижения задержек, применение HBM обеспечивает и снижение потребления энергии всей подсистемой памяти. В текущем топовом решении Radeon R9 290X до 15-20% из 250 Вт общего потребления энергии, расходуется на питание чипов GDDR5 — то есть, до 37,5-50 Вт в абсолютных цифрах. По другим данным AMD следует, что GDDR5 обеспечивает 10,66 ГБ/с ПСП на 1 Вт, и потребление GDDR5-памяти получается несколько ниже — 30 Вт. HBM же память дает более 35 ГБ/с на ватт, то есть обеспечивает более чем втрое лучшую энергоэффективность, по сравнению с GDDR5.

Преимущество в энергоэффективности позволяет улучшить производительность и/или сэкономить энергию. Последнее важно для мобильных решений, а для топового GPU можно повысить его мощность при отсутствии роста потребления энергии. Если взять значение итогового ПСП в 512 ГБ/с при четырех стеках HBM-памяти, то такие чипы будут потреблять около 15 Вт против 30 Вт у 320 ГБ/с GDDR5 в случае Radeon R9 290X. Разницу в 15 или даже 20-25 Вт (с учетом разницы в ПСП) можно потратить на увеличение производительности самого GPU, ведь технология управления питанием PowerTune ограничивает общее потребление видеокартой, и большая доля питания, выделенная для GPU, позволяет компании AMD повысить тактовые частоты и напряжение для топового графического процессора с применением HBM.

Резкое увеличение ПСП будет полезно в любом случае, и применение HBM лишь улучшит итоговую производительность. Но тут есть одна оговорка — даже имея преимущество по ПСП, предшествующие решения компании AMD были или не быстрее соперничающих видеокарт Nvidia, или даже несколько медленнее их. Но так как новый GPU компании AMD основан на архитектуре GCN 1.2, то ситуация заметно улучшилась, так как именно в этой версии архитектуры были внедрены новые методы сжатия данных буфера кадра, исправляющие ситуацию с недостаточной эффективностью использования имеющейся ПСП. И новый топовый графический процессор AMD получил не только высокую ПСП, но и улучшенную эффективность ее использования, что особенно важно в высоких разрешениях.

А еще одним преимуществом памяти стандарта HBM, отмечаемым компанией AMD в своих материалах, является компактный физический размер всего устройства — GPU вместе с чипами DRAM занимает очень мало места, по сравнению с привычными для нас форм-факторами с большой печатной платой, отдельным GPU и микросхемами памяти, размещенными на ней на некотором отдалении. Замена чипов GDDR5-памяти на маленькие HBM-стеки дает уменьшение размеров всей видеоплаты.

Так, каждый гигабайт GDDR5-памяти, состоящий из четырех двухгигабитных микросхем, занимает до 672 мм², а такое же количество HBM-памяти в виде HBM-стеке займет лишь 35 мм² — почти в 20 раз меньше! Даже если пересчитать цифры с применением четырехгигабитных микросхем, то разница по занимаемой площади останется почти на порядок.

Даже если брать площадь, занимаемую на PCB всеми микросхемами, то получается, что упаковка GPU с HBM-памятью займет порядка 4900 мм² против 9900 мм² у видеокарты Radeon R9 290X предыдущего поколения. Дополнительную экономию места можно использовать в разных целях, особенно учитывая еще и то, что стеки HBM-памяти не нуждаются в отдельной сложной подсистеме питания — разница на практике будет еще больше.

Вроде бы все замечательно, но есть некоторые вопросы к обеспечению охлаждения, так как в случае подобного решения чипы DRAM и сам GPU будут в одной упаковке, которая накрыта единой теплоотводящей крышкой, покрывающей и HBM-стеки и ядро GPU. Обеспечивается ли достаточно эффективное охлаждение для всей системы в таком случае, и как повлияет на работу чипов памяти соседство с крайне горячим ядром графического процессора?

Ну а главным предположительным минусом предполагаемой конфигурации из четырех стеков HBM-памяти может стать общий объем видеопамяти — ведь четыре стека по 1 ГБ дают лишь 4 ГБ в целом. Оснащение нового топового продукта AMD лишь 4 ГБ памяти, пусть и очень быстрой, потенциально может стать проблемным, ведь решения конкурента имеют больше видеопамяти, хотя и медленной GDDR5. Судя по всему, текущий дизайн позволяет разместить вокруг GPU всего лишь четыре стека, что и ограничивает общий объем четырьмя гигабайтами.

Правда, объем видеопамяти в 4 ГБ до сих пор очень часто применяется даже в топовых решениях, и его пока что вполне достаточно в большинстве игр при любых настройках. Но самые современные игры, вроде GTA V и Call of Duty: Black Ops 3, уже частенько могут использовать больше видеопамяти, особенно в самых высоких разрешениях типа 4K. И при нехватке видеопамяти под буферы, игровые текстуры будут то загружаться в память, то освобождать ее, что вызовет снижение производительности и неплавность в частоте кадров. А ведь сейчас именно 4K и VR являются главными двигателями индустрии, и все они лишь увеличивают требования к объему видеопамяти, как и многомониторные конфигурации, поддержкой которых славятся решения компании AMD.

Получается, что даже для игрового решения наличие лишь 4 ГБ HBM-памяти может быть спорным, не говоря уже о профессиональном применении. Хотя пока что ситуации с нехваткой этого объема видеопамяти весьма редки, топовая видеокарта с такой ценой должна иметь некий запас прочности, чтобы не устареть за пару следующих лет. А с учетом наличия 8 ГБ общей памяти у главных игровых консолей текущего поколения, объема видеопамяти в 4 ГБ может вскоре не хватить в ещё большем количестве игр.

Возможно, в AMD решились на применение такой памяти несколько рановато, и нужно было подождать коммерческой доступности второго поколения HBM-памяти, ведь его главное отличие в том, что будет удвоено число чипов DRAM на стек, а значит возрастет объем до 2 ГБ на стек, что позволит выпустить графический чип с 8 ГБ видеопамяти. Но это будет возможно лишь в будущем году, и второе поколение будет доступно не только для AMD, а они явно хотели стать первыми в освоении новой памяти.

Мало того, компания AMD стала не просто первым производителем графического процессора с памятью стандарта HBM, но и единственным производителем, освоившим HBM-память первого поколения. Ведь стандартом, одобренным комитетом JEDEC, станет лишь второе поколение — HBM2, а HBM первого поколения будет использоваться исключительно совместно AMD и Hynix. И до появления продуктов, использующих второе поколение HBM, у AMD есть около года форы по применению этой технологии. Вполне возможно, что и второе поколение HBM2 они освоят быстрее конкурента — ведь опыт по работе с HBM-стеками у них уже довольно большой.

Программные технологии

Поговорим о программных технологиях, улучшенных и появившихся с выходом Radeon R9 Fury X. Мы писали о некоторых из них еще в декабре прошлого года, когда вышли драйверы с кодовым именем Omega, именно в них появилась поддержка виртуального разрешения Virtual Super Resolution — рендеринг в более высоком разрешении и последующее приведение картинки к меньшему разрешению устройства вывода.

Хотя это был ответ на аналогичную решению конкурента технологию DSR, они заметно отличаются друг от друга подходом. Nvidia применяет для изменения разрешения специальный шейдер, дающий более гибкий подход, позволяющий изменять качество фильтрации, но при некотором падении производительности. Технология VSR от AMD же работает прямо через контроллеры дисплея, поэтому не приводит к падению производительности, но не дает таких гибких возможностей по фильтрации и настройке качества картинки, как DSR.

Так как возможности VSR ограничены применяемыми контроллерами дисплея, то именно последние поколения графических процессоров AMD имеют лучшие возможности для использования виртуальных разрешений. Так, контроллеры прошлого поколения (семейства GCN 1.1) не могут работать в разрешении 4K, и тот же Radeon R9 290X ограничен максимальным виртуальным разрешением в 3200×1800 пикселей, а вот GCN 1.2 чипы (Tonga и Fiji) поддерживают снижение разрешения с 4K-разрешения, что будет востребовано именно в Radeon R9 Fury X, так как Radeon R9 285 слишком слаб для подобных фокусов.

В случае Radeon R9 Fury X и 1080p-мониторов поддерживаются режимы 3200×1800 и 3840×2160 пикселей, 2560×1600 и 3840×2400 для мониторов с разрешением 1200p, и только 3200×1800 для разрешения 1440p. Так что тут хорошо заметен недостаток гибкости VSR, по сравнению с DSR, позволяющей менять виртуальное разрешение в куда более широких пределах. Ну хоть аналог 2×2 суперсэмплинга (правда, с прямой пиксельной решеткой) есть, в виде виртуального разрешения 4K для FullHD-мониторов — один из самых качественных вариантов.

Из новых программных технологий можно отметить возможность ограничения частоты кадров при рендеринге — Frame Rate Targeting Control (FRTC). Эта новая возможность появилась в свежих драйверах компании AMD и она позволяет пользователю установить максимальную частоту кадров для 3D-приложений, запущенных в полноэкранном режиме. Хотя утилиты вроде MSI Afterburner уже давно предлагают подобную функциональность, официальная поддержка в драйверах AMD для большинства пользователей будет удобнее.

В результате ограничения FPS, плата будет работать со сниженной нагрузкой, обеспечивая снижение энергопотребления, тепловыделения и шума от системы охлаждения. При установленном ограничении FPS в не слишком требовательных играх, графический процессор будет потреблять меньше энергии, так как станет простаивать часть времени, что также вызовет и снижение потребления энергии с тепловыделением — а это, в свою очередь, приведет к снижению шума от системы охлаждения. На диаграмме приведены реальные примеры из пары игр:

Причем, FRTC работает не только именно для 3D-сцен, но и в случае игровых заставок, загрузочных экранов и меню, когда FPS зачастую составляет сотни кадров в секунду. При помощи ограничителя FPS можно установить достаточно высокий предел частоты кадров, чтобы не терять в «отзывчивости» игры, но снизить FPS в случае заставок и меню, когда ресурсы расходуются бессмысленно.

В текущем виде технология Frame Rate Targeting Control работает только в DirectX 10 и DirectX 11 приложениях, а максимальную частоту кадров можно установить в рамках от 55 до 95 FPS. AMD пока что рекламирует поддержку FRTC лишь для новой серии своих видеокарт, так что пока точно неизвестно, будет ли она включена для решений предыдущего поколения Radeon 200, хотя они основаны ровно на тех же чипах, что и Radeon 300.

В своих материалах компания AMD также старательно упоминает поддержку графического API от компании Microsoft новой версии — DirectX 12. Это — последняя версия известного графического API, детали которой схожи с тем, что было сделано в «консольных» графических API какое-то время назад — обеспечение прямого контроля за ресурсами GPU. Такой подход позволяет лучше раскрыть все возможности CPU, GPU и гибридных чипов вроде APU, и, в конечном итоге, повысить производительность 3D-приложений и/или улучшить качество картинки.

Видеокарты нового семейства AMD Radeon полностью поддерживают все новые возможности Microsoft DirectX 12 — что входят в так называемый уровень возможностей Feature Level 12.0, включая тайловые ресурсы, которые используются для наложения виртуальных текстур с динамической загрузкой в больших 3D-сценах с уникальными поверхностями. Да и сам API в новой инкарнации стал проще и понятнее, плюс, в этой версии DirectX появилась многопоточная запись буфера команд, позволяющая лучше использовать возможности многоядерных CPU.

Напомним, что в DirectX 11 производительность 3D-рендеринга при большом количестве вызовов функций отрисовки часто ограничена скоростью вычислений одного ядра CPU. В случае же DirectX 12 работа распараллелена на несколько ядер CPU, и в целом скорость рендеринга ограничена возможностями GPU, и практически не упирается в возможности CPU. В результате, появляется возможность использовать больше вызовов draw calls, получая более высокую детализацию сцены и объектов. Ну а освободившиеся ресурсы CPU можно использовать игровым кодом (AI и т.п.).

С DirectX 12 вся работа игрового движка и графического API может быть заметно лучше распределена по всем имеющимся ядрам, что позволяет повысить сложность 3D-сцен. Что касается производительности нового графического API, по сравнению с предыдущей версией, то ее можно оценить в специальном тесте 3DMark API Overhead feature test, измеряющем эффективность API при большом количестве вызовов функции отрисовки:

Как видите, при использовании DirectX 12 и Windows 10, новая топовая видеокарта компании AMD обеспечивает огромный прирост в количестве вызовов draw calls за секунду, по сравнению с DirectX 11 и Windows 8.1, а также почти в полтора раза опережает решение конкурента в DirectX 12 режиме.

Из изменений в DirectX 12 можно упомянуть и асинхронное исполнение шейдеров, когда сложные задачи разбиваются на несколько простых, исполняющихся параллельно. В предыдущей версии DirectX 11 задачи отрисовки теней, просчета освещения, чтения/записи данных и неграфические вычисления выполняются последовательно, при этом зачастую используются разные ресурсы GPU, а остальные простаивают. Задачи могли бы исполняться параллельно, что и было поддержано в DirectX 12. Это позволяет добиться лучшего использования ресурсов GPU, повысить производительность и детализацию и усложнить визуальные эффекты.

К слову, современная графическая архитектура Graphics Core Next включает специальные блоки Asynchronous Compute Engines (ACE), которые помогают выполнять работу по асинхронному выполнению шейдеров на максимальной скорости, поэтому с новым API графические решения компании AMD должны справляться отлично.

Появилась в DirectX 12 и родная поддержка многочиповых конфигураций, состоящих из нескольких GPU. В предыдущих версиях API не было предусмотрено существование подобных конфигураций, состоящих из нескольких GPU, и разработчикам приходилось заниматься распределением работы между GPU в драйверах и играх самостоятельно. Но отсутствие управления аппаратным обеспечением, ограниченные комбинации из нескольких GPU и сложности по распределению работы между несколькими GPU приводили к недостаточно оптимизированной работе таких систем.

А в DirectX 12 появился контроль за использованием ресурсов разработчиками для лучшего распределения работы между GPU, а также стандартная поддержка для конфигураций, состоящих из APU и GPU — разработчики смогут отдавать часть работы в APU. Появление поддержки нескольких видеокарт в DirectX 12 позволяет получить большую производительность от мультичиповых систем и эффективно использовать такие конфигурации, которые просто было невозможно применять ранее в DirectX 11.

Отдельно выделим и поддержку «нового» (относительно, потому что несколько лет назад он был вполне известен и применялся многочиповыми видеосистемами) метода рендеринга — SFR (split-frame rendering). Такой метод отличается тем, что кадр при рендеринге делится на несколько областей (тайлов), отрисовкой которых занимаются разные GPU. В результате получается, что над каждым кадром работают все имеющиеся GPU как будто один более мощный чип, что приводит к снижению задержек при выводе изображения, хотя и не обеспечивается столь эффективное удвоение частоты кадров, как в привычном Alternate Frame Rendering (AFR), известном по существующим видеосистемам CrossFire и SLI.

Среди игр, которые получат применение некоторых из возможностей новой версии API, компания AMD выделяет пару игр, выходящих с их поддержкой: Deus Ex: Mankind Divided и Ashes of the Singularity.

Краткая теоретическая оценка производительности

Чтобы сделать предварительную оценку производительности нового топового решения компании AMD, рассмотрим некоторые цифры и собственные результаты тестов этой компании. Имея 4096 потоковых вычислительных ядер и быстрейшую память стандарта High Bandwidth Memory на борту, Radeon R9 Fury X явно целится в самый верхний ценовой диапазон игровых видеокарт. С непревзойденными параметрами производительности математических вычислений и пропускной способности памяти, новинка от AMD предлагает максимальную производительность в своем классе.

Хотя пиковые значения скорости блоков ROP и геометрических блоков почти не увеличились, оба типа исполнительных блоков должны работать заметно эффективнее в случае Fiji. Исходя из теории, Radeon R9 Fury X должен быть заметно быстрее Radeon R9 290X и R9 390X, основанных на графическом процессоре Hawaii, но разница в скорости будет зависеть от типа нагрузки — больший упор в вычисления, текстурирование, геометрические расчеты или скорость заполнения.

В случае чисто вычислительных нагрузок, 45%-ное увеличение количества ALU и 5% дополнения в тактовой частоте дают Fury X более чем 50% преимущества перед R9 290X (да и R9 390X). В случае же упора в производительность блоков ROP, разница может быть как 5%, если данные в кадровом буфере плохо сжимаются и нет упора в ПСП, так и более 100%, если новые алгоритмы сжатия сработают максимально эффективно. В среднем можно ожидать примерно трети прироста в скорости по сравнению с флагманом предыдущей линейки компании AMD, ну а в высоких разрешениях новая модель Radeon R9 Fury X должна показать еще большую силу.

Так как новая топовая видеокарта Radeon R9 Fury X предназначена для энтузиастов и имеет очень высокую производительность, неудивительно, что AMD сравнивает новинку по скорости с конкурентом в самом высоком разрешении — 4K (3840×2160 пикселей). Сначала рассмотрим скорость 3D-рендеринга Radeon R9 Fury X и GeForce GTX 980 Ti в 3DMark Fire Strike Ultra, традиционно благоволящем к архитектуре GCN:

Как видно на диаграмме, преимущество новой топовой видеокарты AMD есть, хотя и небольшое. Но это был синтетический тест, а что получается в реальных игровых приложениях? На следующей диаграмме Radeon R9 Fury X сражается все с тем же соперником в лице GeForce GTX 980 Ti, в условиях рендеринга в 4K-разрешении при максимальном качестве в самых популярных играх.

Ну что же, по крайней мере по измерениям AMD получается так, что Radeon R9 Fury X оказался в среднем чуть быстрее своего конкурента в играх и 4K-разрешении, а что получилось у нас — смотрите в нашем обзоре.

Краткие выводы

В лице анонсированной недавно модели Radeon R9 Fury X компания AMD предлагает весьма интересный вариант топовой видеокарты. Что особенно важно, они смогли предоставить полноценный продукт из верхнего ценового диапазона, в то время, как предыдущее одночиповое топовое решение в виде Radeon R9 290X явно проигрывало конкуренту. С выпуском же Fury X компания решила перейти в сегмент элитных решений, отличающихся не только высочайшей производительностью и сложностью, но и повышенной ценой. Основанная на сложнейшем графическом процессоре Fiji первая видеокарта элитной подсерии Fury получилась весьма интересной по многим параметрам.

Новинка интересна и с рыночной и с технической точек зрения. Технически, в AMD было сделано очень много интересного, достаточно отметить даже одно лишь первое в мире применение новейшего типа памяти HBM, которое не просто значительно повышает пропускную способность памяти и снижает потребление энергии, но и дает новые возможности по миниатюризации форм-фактора будущих видеокарт. Но не только сам по себе GPU с HBM получился интересным, качество материалов и сборки видеокарты также отличное, а системы питания и водяного охлаждения весьма эффективны и имеют огромный запас прочности.

В Fury X инженеры компании сделали все возможное в рамках архитектуры GCN, чтобы успешно конкурировать с топовыми решениями Nvidia на чипах архитектуры Maxwell, включая даже элитное решение GeForce GTX Titan X — если бы калифорнийская компания не выпустила GeForce GTX 980 Ti, то в сражении топов точно победило бы решение AMD — но не по абсолютной производительности, а по соотношению цены и скорости видеокарт. К сожалению для AMD, конкурент чуть раньше выпустил GTX 980 Ti с ровно той же ценой, и новинке предстоит длительная рыночная борьба с этим решением.

При высоких разрешениях вроде 4K, и при условии достаточности 4 ГБ видеопамяти, Fury X предположительно может быть чуть быстрее соперника из-за высочайшей ПСП, но разница между ними в целом не должна быть слишком велика в любых условиях. В меньших разрешениях при снижении влияния значения ПСП очень быстрой HBM-памяти и упоре в производительность других блоков GPU или CPU, новое топовое решение от AMD может быть уже несколько медленнее, чем GTX 980 Ti. Увы, этого недостаточно для явной победы, тем более что современные игры в 4K-разрешении начинают упираться в ограничение объема памяти в 4 ГБ, не обеспечивая достаточно высокой частоты кадров.

На наш взгляд, единственный важный потенциальный недостаток Radeon R9 Fury X — именно в жестко ограниченном объеме видеопамяти типа HBM. На данный момент ее просто нельзя установить больше, ведь первое поколение HBM по сути ограничивает общий объем этой величиной. Впрочем, на данный момент объема в 4 ГБ вполне достаточно в 99% случаев, лишь редкие игры вроде Grand Theft Auto V, Call of Duty: Black Ops 3 или Far Cry 4 при максимальных настройках начинают страдают от недостатка памяти для стриминга текстур. Но топовые видеокарты покупаются не на полгода, а за год-полтора-два примеров таких игр может стать куда больше, и это настораживает.

При сравнении двух прямых конкурентов, среди явных достоинств GeForce GTX 980 Ti можно выделить больший объем видеопамяти и меньшее общее энергопотребление. Но и у Radeon R9 Fury X есть свои плюсы: огромная вычислительная производительность, высочайшая ПСП, небольшой физический размер платы, а также очень эффективная и тихая (за минусом шума от помпы у первых экземпляров) система водяного охлаждения. Выбор остается за пользователем, ведь обе платы весьма достойны и имеют свои особенности.

Графический ускоритель AMD Radeon R9 Fury

Графический ускоритель Radeon R9 Fury
Кодовое имя	«Fiji»
Технология производства	28 нм
Количество транзисторов	8,9 млрд.
Архитектура	Унифицированная, с массивом общих процессоров для потоковой обработки многочисленных видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectX	Уровень возможностей Feature Level 12_0 и шейдерной модели Shader Model 5.0
Шина памяти	4096-битная: восемь контроллеров памяти с поддержкой стандарта High Bandwidth Memory
Частота графического процессора, МГц	1000
Вычислительные блоки	56 (из 64 в чипе) вычислительных блоков GCN, включающих 224 (из 256) SIMD-ядер, состоящих в общем из 3584 (из 4096) ALU для расчетов с плавающей запятой (поддерживаются целочисленные и плавающие форматы, с точностью FP32 и FP64)
Блоки текстурирования	224 (из 256) текстурных блока, с поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
Блоки растеризации (ROP)	64 блока ROP с поддержкой режимов сглаживания с возможностью программируемой выборки более чем 16 сэмплов на пиксель, в том числе при FP16- или FP32-формате буфера кадра. Пиковая производительность до 64 отсчетов за такт, а в режиме без цвета (Z only) — 256 отсчетов за такт
Поддержка мониторов	Интегрированная поддержка до шести мониторов, подключенных по интерфейсам DVI, HDMI и DisplayPort

Спецификации видеокарты Radeon R9 Fury
Частота ядра, МГц	1000
Количество универсальных процессоров	3584
Количество текстурных блоков	224
Количество блоков блендинга	64
Эффективная частота памяти, МГц	1000 (2×500)
Тип памяти	HBM 4096-бит
Объем памяти, ГБ	4
Пропускная способность памяти, ГБ/с	512
Вычислительная производительность (FP32), Терафлопс	7,2
Теоретическая максимальная скорость закраски, Гигапикселей/с	64,0
Теоретическая скорость выборки текстур, Гигатекселей/с	224,0
Шина	PCI Express 3.0
Разъемы	один HDMI 1.4a и три DisplayPort 1.2a
Типичное энергопотребление, Вт	275
Дополнительное питание	Два 8-контактных разъема
Число слотов, занимаемых в системном корпусе	2
Рекомендуемая цена	для рынка США — $549

Если топовое решение премиального подсемейства, имеющее на борту систему водяного охлаждения, получило наименование Fury X («экстремальное»), то обычная «воздушная» модель стала называться просто Fury. И Radeon R9 Fury заняла свое положение в верхней части продуктовой линейки компании AMD, на ступень ниже Fury X.

Radeon R9 Fury имеет рекомендованную цену в $549, то есть, на сотню долларов меньше, чем у Fury X. Такое решение поставило новую модель AMD между двумя видеокартами от конкурирующей компании Nvidia: GeForce GTX 980 Ti и GTX 980, но ближе по позиционированию к новинке именно младшая модель GeForce GTX 980 с официальной рекомендованной ценой на североамериканском рынке в $499.

Получается, что анонсированная Radeon R9 Fury чуть дороже своего ближайшего конкурента, но должна обеспечить производительность несколько выше, по сравнению с GeForce GTX 980. Впрочем, новинку от AMD можно сравнивать и с фабрично разогнанными вариантами этой платы Nvidia, ведь партнеры этой компании выпустили несколько таких вариантов GTX 980, которые как раз имеют близкую к $650 цену.

Как мы уже упоминали, самым спорным решением в характеристиках всех моделей Fury является наличие лишь 4 ГБ видеопамяти, которых хоть пока и хватает даже для высоких разрешений при максимальных настройках качества, но в ряде современных игр при 4K-разрешении и включении полноэкранного сглаживания с высокими настройками качества требуется еще больший объем. Первое поколение HBM-памяти просто не позволяет сделать плату с 8 ГБ такой памяти. Впрочем, для цены $550 такой объем более-менее оправдан, так как ближайший конкурент в виде GeForce GTX 980 с GDDR5-памятью имеет такой же объём видеопамяти.

Сама по себе видеокарта Radeon R9 Fury уже не столь компактна по размеру, как Fury X, она соответствует габаритам типичных карт верхнего ценового диапазона с воздушным охлаждением, так что сама по себе память стандарта HBM не позволяет уменьшить физические размеры видеокарты, даже несмотря на меньшее число компонентов на плате, в том числе и в схеме питания. Применение очень мощного GPU с чипами HBM на нём приводит к необходимости эффективного охлаждения при помощи воздушного кулера немаленького размера, чаще всего с тремя крупными вентиляторами.

Интересно, что показатель типичной потребляемой энергии (Typical Board Power) для Radeon R9 Fury остался ровно таким же, как и в случае Fury X — 275 Вт. По идее, Fury должен был получить некоторое снижение потребления, так как часть функциональных блоков GPU в нём отключена, а остальное работает на слегка сниженной частоте. Вероятно, так получается потому, что для видеокарт с урезанным GPU используются чипы с худшими разгонными характеристиками, да ещё и работающие в условиях более высокой температуры, что приводит к большим потерям энергии и худшей энергоэффективности в целом.

В отличие от модели Fury X, имеющей референсный дизайн, единый для всех производителей и отличающийся компактными размерами и системой водяного охлаждения, «простая» Fury даже не имеет полноценного референсного дизайна. Партнёры компании занимаются этим самостоятельно, и печатные платы для Fury имеют традиционный для топовых видеокарт размер и мощное воздушное охлаждение. Вероятно, именно поэтому и обозреватели получили сэмплы Radeon R9 Fury не столь оперативно, как в случае референсных карт, да и в продажу эта модель поступила позже официального анонса.

Первыми компаниями, которым было позволено выпустить новинку, стали самые солидные партнеры AMD в виде компаний Sapphire и ASUS. Компания Sapphire выпустила сразу пару решений: модель с референсными частотами и фабрично разогнанную видеокарту на основе печатной платы от AMD и кулера собственного дизайна Tri-X.

Этот кулер оснащён умной системой управления частотой вращения вентиляторов, которая обеспечивает максимальную производительность при целевой температуре в 75 градусов. Эффективная система охлаждения обеспечивает уровень шума менее 25 дБ при частоте вращения вентиляторов 1200 об/мин, а при низкой нагрузке на графический процессор, когда температура GPU не превышает 50 градусов, они и вовсе останавливаются.

Компания ASUS решила выпустить полностью собственный вариант печатной платы, снабдив его фирменным кулером DirectCU III — модель ASUS STRIX Radeon R9 Fury, которая также имеет три эффективных вентилятора в системе охлаждения. Со временем, возможность выпуска видеокарт модели Radeon R9 Fury получили и другие производители.

Архитектурные и функциональные особенности

Так как модель Radeon R9 Fury основана на том же графическом процессоре Fiji, который мы уже рассматривали в обзоре Radeon R9 Fury X, то многие данные можно узнать из соответствующего материала, в том числе: архитектурные особенности, краткий обзор памяти стандарта HBM, новые программные возможности, включающие продвинутую поддержку DirectX 12 и многое другое. Также полезно прочитать и материал о давно известной архитектуре Graphics Core Next (GCN), которая лежит в основе всех современных решений компании AMD.

Хотя в графическом процессоре Fiji были сделаны некоторые изменения по сравнению с прошлогодним Tonga, он относится к третьему поколению GCN — его можно условно назвать версией 1.2. Новый топовый графический процессор включает в себя все доработки GCN 1.2, в том числе улучшенную производительность обработки геометрии и тесселяции, новые методы сжатия данных без потерь в кадровом буфере, некоторые мультимедийные 16-битные инструкции, а также увеличенный объем кэш-памяти второго уровня до 2 МБ. С точки зрения вычислительных возможностей, новый GPU получил улучшенное планирование и распределение задач и несколько новых инструкций для параллельной обработки данных — обо всём этом подробно написано в обзоре Radeon R9 Fury X.

Схематично графический процессор Fiji схож с Hawaii, вышедшем в далеком 2013 году — оба GPU разделены на четыре шейдерных движка Shader Engine, каждый из которых имеет свой собственный процессор для обработки геометрических данных и растеризатор, а также по четыре укрупненных блока ROP, способных обработать по 16 пикселей за такт (всего получается 64 блока ROP в каждом из этих чипов). GPU имеет единый командный процессор и восемь движков асинхронных вычислений Asynchronous Compute Engine, которые были модифицированы с учетом изменений в GCN 1.2.

Но в Fury применяется усеченный вариант видеочипа, и из спецификаций Radeon R9 Fury видно, насколько сильно был урезан графический процессор Fiji относительно его полноценного варианта в Fury X. AMD сделала типичную для чуть менее дорогих топовых видеокарт модификацию, заблокировав аппаратно часть исполнительных блоков, а также чуть-чуть снизив тактовую частоту GPU — это позволяет использовать в деле бракованные процессоры, не подошедшие для производства Fury X — с частично неработоспособными потоковыми процессорами или обладающие несколько худшими возможностями по работе на высокой частоте. Рассмотрим схему модификации чипа Fiji для модели Radeon R9 Fury:

В состав графического процессора Fiji, который установлен на Radeon R9 Fury, входит 56 рабочих вычислительных блоков Compute Unit (CU) из 64 физически существующих в GPU. То есть, общее число потоковых процессоров в этой модели снижено с 4096 до 3584. Вместе с количеством ALU уменьшилось и число текстурных блоков, так как они находятся в составе блоков CU в количестве 4 штук на каждый. Соответственно, в Fury осталось 224 из 256 имеющихся физически блоков TMU.

Традиционно для решений AMD, не были тронуты другие блоки графического процессора, поэтому количество геометрических блоков и блоков ROP не было снижено. Как остались ровно такими же характеристики подсистемы памяти, включая и объём кэш-памяти. Обе вышедшие на данный момент видеокарты на основе чипа Fiji имеют по 4 ГБ памяти стандарта HBM, присоединённой прямо к GPU при помощи 4096-битной шины памяти. Похоже, что именно сравнительно малый объём видеопамяти для топовых решений не позволяет урезать младшие решения ещё и по характеристикам HBM — было бы странно иметь столь дорогую плату с меньшим объёмом памяти.

Естественно, не обошлось без снижения тактовой частоты GPU, но в случае модели Radeon R9 Fury она снизилась несущественно — всего лишь с 1050 до 1000 МГц, то есть всего на 5% меньше, чем у топовой модели Fury X. А вот частоту видеопамяти не тронули, она составляет всё те же 500(1000) МГц, что и в случае Fury X — то есть, по ПСП никакой разницы между этой парой моделей нет.

Во всём остальном, чип Fiji точно такой же, что и в Fury X, он оснащён памятью стандарта HBM, имеет улучшенные блоки обработки видеоданных и т.д. В частности, блок декодирования Unified Video Decoder умеет аппаратно ускорять декодирование видеоданных в формате H.265 (HEVC), и чип Fiji стал первым дискретным GPU с такими возможностями. Среди других достоинств Fiji отметим поддержку технологий TrueAudio, LiquidVR, Mantle, Eyefinity и FreeSync, о которых мы неоднократно писали в своих статьях.

Теоретическая оценка производительности и выводы

Чтобы сделать краткую предварительную оценку производительности нового решения, мы рассмотрим теоретические параметры и собственные результаты тестов этой компании. Имея большое количество потоковых вычислительных ядер и быстрейшую память стандарта High Bandwidth Memory на борту, модель Radeon R9 Fury явно является типичным представителем верхнего ценового диапазона игровых видеокарт, предназначенным для игры в самых высоких разрешениях при максимальных настройках качества.

Исходя из теоретических показателей, разница в производительности между Fury и Fury X составляет до 20% (3584 ALU, работающие на частоте 1000 МГц медленнее, чем 4096 на 1050 МГц). То есть, если производительность рендеринга зависит именно от скорости ALU или TMU, то Fury будет медленнее примерно настолько. А вот если производительность в 3D-задаче будет ограничена пропускной способностью памяти, тогда Fury вовсе не отстанет от Fury X, имея те же 512 ГБ/с. Ну и если скорость рендеринга упрётся в возможности геометрических блоков или филлрейт (блоки ROP), то разница в скорости не должна превысить 5%. В реальных же играх разница между Fury и Fury X должна быть где-то 7-10% — где-то между 0% и 20%.

Так как новая топовая видеокарта Radeon R9 Fury предназначена для энтузиастов и имеет очень высокую производительность, неудивительно, что AMD сравнивает новинку по скорости с конкурентом в самом высоком разрешении — 4K (3840×2160 пикселей). На следующей диаграмме от данной компании, мы видим сравнение Radeon R9 Fury с главным соперником в лице GeForce GTX 980, в некоторых популярных играх при условии рендеринга в 4K-разрешении с максимальным качеством, но без включения полноэкранного сглаживания:

Отказ от полноэкранного сглаживания понятен — в таких условиях нехватка объёма в 4 ГБ видеопамяти при разрешении рендеринга 4K стала бы весьма заметной, и для Radeon R9 Fury и для конкурента. Если же сглаживание не включать, то новинка компании AMD по их же собственным данным оказывается заметно быстрее GeForce GTX 980 в подобных условиях при высоких настройках качества.

Подводя итоги, в первую очередь нужно отметить, что новинка не слишком сильно отстает от Radeon R9 Fury X с точки зрения производительности — оцениваем предположительную разницу в скорости двух топовых моделей около 7-10%. И так как графический процессор Fiji имеет очень много блоков ALU и TMU, большая часть разницы в производительности будет результатом не урезанного по функциональным блокам GPU, а из-за разницы в тактовых частотах между Radeon R9 Fury и Fury X.

При столь небольших отличиях в производительности и меньшей на $100 цене, «воздушная» модель Fury становится даже более выгодной видеокартой для приобретения, по сравнению с «водяной» Fury X, если речь идёт о топовом ценовом диапазоне, разумеется. Впрочем, если ещё учитывать решения конкурента, то однозначный вывод по теоретическим цифрам сделать сложно, нужно подождать подробного сравнения нового Radeon и пары топовых GeForce в играх.

Если Radeon R9 Fury X соперничает с GeForce GTX 980 Ti с переменным успехом, то Fury нужно победить уже куда более слабую GTX 980, хотя и имеющую более низкую рекомендованную цену. Да и объём видеопамяти у этих моделей одинаковый, что играет на руку новинке от компании AMD, нивелируя ограничение HBM первого поколения. В любом случае, для успеха на рынке Fury должна быть быстрее GTX 980 настолько, чтобы покрывалась разница в цене между этими моделями. По соотношению цены и производительности, новинка близка к GTX 980.

То есть, с рыночной точки зрения всё неплохо, Fury является сильным конкурентом для соответствующего решения Nvidia. А вот с технической у Fiji есть явный недостаток в виде заметно худшей энергоэффективности, ведь мы сравниваем уже не с GTX 980 Ti, основанной на чипе GM200, а с GTX 980 на базе GM204. И в этом решение калифорнийцев ощутимо лучше, ведь GeForce GTX 980 лишь чуть медленнее Radeon R9 Fury, но при этом она потребляет заметно меньше энергии. Если исходить из заявленных цифр типичного энергопотребления, разница между ними по этому показателю более чем полуторакратная (275 Вт против 165 Вт)! Соответственно, решение AMD при прочих равных будет проигрывать и по шумности системы охлаждения. Правда, на вышедшие видеокарты модели Radeon R9 Fury от компаний ASUS и Sapphire установлены весьма эффективные воздушные кулеры, которые не особенно шумны.

Графический ускоритель AMD Radeon R9 Nano

Графический ускоритель Radeon R9 Nano
Кодовое имя	«Fiji»
Технология производства	28 нм
Количество транзисторов	8,9 млрд.
Архитектура	Унифицированная, с массивом общих процессоров для потоковой обработки многочисленных видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectX	Уровень возможностей Feature Level 12_0 и шейдерной модели Shader Model 5.0
Шина памяти	4096-битная: восемь контроллеров памяти с поддержкой стандарта High Bandwidth Memory
Частота графического процессора, МГц	до 1000 (см.далее)
Вычислительные блоки	64 вычислительных блока GCN, включающих 256 SIMD-ядер, состоящих в общем из 4096 ALU для расчетов с плавающей запятой (поддерживаются целочисленные и плавающие форматы, с точностью FP32 и FP64)
Блоки текстурирования	256 текстурных блоков, с поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
Блоки растеризации (ROP)	64 блока ROP с поддержкой режимов сглаживания с возможностью программируемой выборки более чем 16 сэмплов на пиксель, в том числе при FP16- или FP32-формате буфера кадра. Пиковая производительность до 64 отсчетов за такт, а в режиме без цвета (Z only) — 256 отсчетов за такт
Поддержка мониторов	Интегрированная поддержка до шести мониторов, подключенных по интерфейсам DVI, HDMI и DisplayPort

Спецификации видеокарты Radeon R9 Nano
Частота ядра, МГц	до 1000
Количество универсальных процессоров	4096
Количество текстурных блоков	256
Количество блоков блендинга	64
Эффективная частота памяти, МГц	1000 (2×500)
Тип памяти	HBM 4096-бит
Объем памяти, ГБ	4
Пропускная способность памяти, ГБ/с	512
Вычислительная производительность (FP32), Терафлопс	до 8,2
Теоретическая максимальная скорость закраски, Гигапикселей/с	64,0
Теоретическая скорость выборки текстур, Гигатекселей/с	256,0
Шина	PCI Express 3.0
Разъемы	один HDMI 1.4a и три DisplayPort 1.2a
Типичное энергопотребление, Вт	175
Дополнительное питание	Один 8-контактный разъем
Число слотов, занимаемых в системном корпусе	2
Рекомендуемая цена	для рынка США — $649

Компактная видеокарта на основе чипа Fiji получила наименование, отражающее её суть — Nano. Radeon R9 Nano заняла совершенно особое положение в верхней части продуктовой линейки компании AMD, с рекомендованной ценой в $649 — то есть, ровно как у Fury X, и на сотню долларов больше, чем у просто Fury. Соответственно, соперники от конкурирующей компании Nvidia по цене у новинки вроде бы и есть, но они явно мощнее и главное — вовсе не предназначены для рынка mini-ITX, поэтому и сравнивать их друг с другом очень трудно.

Если же рассматривать технические параметры, а не цену, то ближе всего по размерам и производительности к новинке компании AMD подошли некоторые из компактных моделей GeForce GTX 970, вроде видеокарты производства ASUS, но они, в свою очередь, имеют уже заметно меньшую цену при уступающей же скорости 3D-рендеринга. Получается, что прямых конкурентов у R9 Nano просто нет, эта модель уникальна и выступает на рынке обособленно.

Как и у видеокарт элитного семейства Fury, в характеристиках Nano отмечается наличие 4 ГБ видеопамяти, которых пока что хватает даже для высоких разрешений при максимальных настройках качества, хотя в ряде современных игр при 4K-разрешении и включении полноэкранного сглаживания с высокими настройками качества требуется еще больший объем. Но первое поколение HBM-памяти просто не позволяет сделать плату с 8 ГБ такой памяти, и тут ничего не поделать. Впрочем, для миниатюрной mini-ITX платы это не так уж важно, да и ближайший конкурент в виде GeForce GTX 970 с GDDR5-памятью имеет такой же объем видеопамяти, да ещё и с некоторыми ограничениями (можно обратиться с полной скоростью лишь к разделу объёмом в 3,5 ГБ).

Сама по себе видеокарта модели R9 Nano очень компактна по размерам, применение HBM-памяти позволило уменьшить её физические размеры и число компонентов на плате — в частности, в схеме питания. Так как рассматриваемая видеоплата Radeon R9 Nano уникальна и имеет множество интересных конструктивных особенностей, их подробное описание мы вывели в отдельную главу.

Архитектурные особенности

Модель видеокарты Radeon R9 Nano основана на полноценном графическом процессоре Fiji, который мы уже рассматривали в обзоре Radeon R9 Fury X, и многие данные можно узнать из соответствующего материала, в том числе: архитектурные особенности, краткий обзор памяти стандарта HBM, новые программные возможности, включающие продвинутую поддержку DirectX 12 и многое другое. Также полезно прочитать и материал о давно известной архитектуре Graphics Core Next (GCN), которая лежит в основе всех современных решений компании AMD.

Хотя в графическом процессоре Fiji были сделаны некоторые изменения по сравнению с прошлогодним Tonga, он относится к третьему поколению GCN — его можно условно назвать версией 1.2. Новый топовый графический процессор включает в себя все доработки GCN 1.2, в том числе улучшенную производительность обработки геометрии и тесселяции, новые методы сжатия данных без потерь в кадровом буфере, некоторые мультимедийные 16-битные инструкции, а также увеличенный объем кэш-памяти второго уровня до 2 МБ. С точки зрения вычислительных возможностей, новый GPU получил улучшенное планирование и распределение задач и несколько новых инструкций для параллельной обработки данных — обо всем этом подробно написано в обзоре Radeon R9 Fury X.

Конкретно в модели Nano применяется полноценный вариант видеочипа Fiji — со всеми активными блоками, разве что со сниженной тактовой частотой работы GPU:

В состав графического процессора Fiji, который установлен на Radeon R9 Fury, входит 64 вычислительных блока Compute Unit (CU), а общее число потоковых процессоров в этой модели равно 4096, как и у старшей модели Fury X. Число текстурных блоков такое же — 256 штук, как и количество геометрических блоков и блоков ROP — последних в чипе 64 штуки. Все вышедшие на данный момент видеокарты на основе чипа Fiji имеют по 4 ГБ памяти стандарта HBM, присоединенной прямо к GPU при помощи 4096-битной шины памяти. У нас выходил отдельный материал по этой памяти, в котором максимально подробно рассмотрены все её особенности.

Раз видеочип Fiji в R9 Nano точно такой же, что и в R9 Fury X, то он имеет улучшенные блоки обработки видеоданных и т.д. В частности, блок декодирования Unified Video Decoder умеет аппаратно ускорять декодирование видеоданных в формате H.265 (HEVC) — чип Fiji стал первым дискретным GPU с такими возможностями. Среди других достоинств Fiji отметим поддержку технологий TrueAudio, LiquidVR, Mantle, Eyefinity и FreeSync, о которых мы неоднократно писали в своих статьях.

С точки зрения технических характеристик, модель Nano весьма впечатляет. Так как применяется полноценный чип Fiji, работающий на частоте до 1 ГГц, то R9 Nano теоретически может достигать почти той же производительности, что и топовая модель Fury X, так как они обе имеют почти идентичные характеристики, включающие 4096 потоковых процессоров, 256 текстурных модулей, 64 блока ROP и 4096-битную HBM-память. На бумаге единственной разницей между R9 Fury X и R9 Nano являются максимальная частота и типичное энергопотребление. Если для R9 Nano максимальная частота установлена на весьма высоком уровне 1000 МГц, то для топовой R9 Fury X турбо-частота абсолютно без проблем достигает 1050 МГц.

Похоже, что для применения в Nano отбираются самые лучшие чипы Fiji, которые способны работать на относительно высоких частотах при сравнительно низком напряжении GPU и потреблении энергии, соответственно. При этом, функциональные блоки в Fiji не были урезаны абсолютно! Что весьма удивительно при системе питания для R9 Nano, дополнительно подпитанной лишь от одного 8-контактного разъёма, и рассчитанной на типичное потребление всего лишь 175 Вт энергии.

Вроде бы, исходя из цифр, R9 Nano должна почти не отставать от Fury X. Но на практике подобное возможно лишь в том случае, если потребление платой энергии не превосходит предел в 175 Вт, ведь у Fury X он гораздо выше — 275 Вт. Исходя из принципа работы PowerTune, ограничивать производительность в случае Nano будет именно предел по потреблению энергии. Даже специально отобранные графические процессоры Fiji не могут работать на частоте 1000 МГц в серьёзных задачах при ограниченном до 175 Вт потреблении — это слишком жёсткое ограничение для столь мощного GPU.

Поэтому графический процессор модели R9 Nano в требовательных 3D-приложениях чаще всего будет работать на частоте около 900-920 МГц, что подтверждает и сама AMD. Они добились типичной частоты GPU в играх на уровне 900 МГц, а реальное значение будет зависеть от приложения и условий его работы. Так что, несмотря на красивую цифру в 1000 МГц, видеоплата Radeon R9 Nano не способна поддерживать такую частоту, и в реальности будет примерно на 10% медленнее.

Зачем же тогда специалисты выставили столь высокое значение турбо-частоты? В AMD уверяют, что это сделано для того, чтобы плата в любых условиях всегда упиралась только в предел по потреблению, обеспечивая максимальную скорость рендеринга в его пределах. Не очень понятно, правда, зачем видеочипу работать на частоте 1000 МГц в нетребовательных 3D-приложениях, и значительно снижать частоту там, где было бы неплохо её прибавить. Зато цифра в 1 ГГц красива в любом случае — особенно для такой миниатюрной платы с мощным GPU.

Конструктивные особенности платы

Дизайн Radeon R9 Nano представляет собой комбинацию всех самых современных технологий компании AMD, позволивших поместить солидную мощь в столь малую коробочку. И выглядит новая плата солидно, в её конструкции применяются качественные материалы, как и в случае с R9 Fury X. Многие детали R9 Nano также выполнены из металла, как принято на рынке премиальных моделей, а ещё она имеет матовую чёрную печатную плату.

И всё же, главной отличительной особенностью Radeon R9 Nano является её размер. Неудивительно, что компактная плата Radeon R9 Nano идеально подходит для демонстрации одного из преимуществ памяти стандарта HBM. Так как четыре гигабайта компактных чипов установлены в пачках прямо на ядро GPU в Fiji, общая площадь, занимаемая этими микросхемами на печатной плате очень мала — втрое меньше, чем у распространённых ранее решений.

И если даже в топовой модели Radeon R9 Fury X мы увидели преимущество от отсутствия больших чипов GDDR5-памяти на плате, выраженное в сравнительно скромных габаритах, то модель R9 Nano отличается ещё меньшим размером — она предназначена для установки платы в системы формата mini-ITX (6.7×6.7 дюймов).

Общая длина печатной платы новинки весьма впечатляет — всего лишь 6 дюймов (около 15 см), что и позволяет использовать R9 Nano в системных платах и корпусах этого формата. Это на 40% короче, чем топовая плата предыдущего поколения — Radeon R9 290X, имеющая длину в 11 дюймов:

Чтобы уложиться в столь малый размер, в AMD переместили часть элементов системы питания на заднюю сторону PCB. Дополнительное питание для Radeon R9 Nano обеспечивает единственный 8-контактный разъём PCI-Express, который применяется вместо пары 6-контактных разъёмов также из-за сравнительной компактности.

Скромный размер Radeon R9 Nano позволяет использовать эту видеоплату в ПК малых форм-факторов, набирающих популярность в том числе и среди игроков, желающих получить ту же мощь в маленьком корпусе, не потеряв в возможности игры в самых высоких разрешениях и максимальных настройках. И 6-дюймовая плата Radeon R9 Nano отлично подходит для таких целей, входя в такие корпуса, в которые ни за что не засунуть любую другую видеокарту схожей производительности.

Приведём лишь пару примеров корпусов малого форм-фактора (Small Form Factor — SFF), которые компания AMD рекомендует для использования совместно с их новым решением: Lian Li PC-Q33 (на иллюстрации) и Cooler Master Elite 110. На наш взгляд, весьма интересный вариант для домашнего игрового ПК для энтузиастов игр (не путать с ультраэнтузиастами и любителями разгона):

Охлаждением видеокарты Radeon R9 Nano занимается воздушный кулер, специально разработанный для отвода 175 Вт тепла от такой маленькой платы. Единственный вентилятор расположен по центру мощного радиатора. Дизайн кулера комбинированный: хотя применяется открытый вентилятор, он также выдувает воздух и сбоку. Благодаря такому решению, примерно половина тепла от платы выносится наружу корпуса, хотя остальное тепло остаётся внутри — его выводом будет заниматься система охлаждения корпуса.

Радиатор в модели Nano состоит из двух частей. Основная его часть составлена из испарительной камеры и тепловых трубок. Испарительная камера сделана из медного сплава, она отводит тепло от ядра Fiji и установленных на него стопок HBM-памяти, а тепловые трубки эффективно распространяют его по всей площади радиатора. Вторая часть — маленький радиатор с ещё одной тепловой трубкой, смонтированный отдельно и охлаждающий исключительно MOSFET в модуле регулятора напряжения (VRM).

Использование испарительной камеры в модели R9 Nano объясняется тем, что такие решения эффективнее простых радиаторов, в данном же случае применяется и испарительная камера и тепловые трубки, что в совместном решении встречается нечасто. AMD уверяет, что применяемая система охлаждения весьма эффективна, и производительность R9 Nano не должна упираться в ограничитель по температуре GPU.

Миниатюрная видеокарта предназначена для работы при целевой температуре графического процессора около 75 градусов, что на 20 градусов меньше целевой температуры, установленной для модели прошлого поколения Radeon R9 290X, а снижение частоты и напряжения (так называемый троттлинг) начнётся лишь при 85 градусах.

Кроме этого, AMD уверяет, что у R9 Nano очень тихая система охлаждения — они даже сравнивают шум от неё с естественным звуковым фоном в библиотеках. По измерениям самой компании, эффективный воздушный кулер R9 Nano обеспечивает работу современного топового GPU при уровне шума 42 дБА — на целых 16 дБА ниже, чем шумит довольно громкий кулер модели Radeon R9 290X.

Краткая оценка производительности, позиционирование и выводы

Сама компания AMD часто сравнивает новинку с Radeon R9 290X — топовой платой предыдущего поколения на основе чипа Hawaii, которая не отличается особенно хорошими показателями энергоэффективности и имеет громкий кулер. Понятно, что на таком фоне R9 Nano будет выглядеть её полной противоположностью.

К примеру, в бенчмарке 3DMark Fire Strike Ultra и разрешении 4K, модель R9 Nano обеспечивает заметно лучшую производительность, по сравнению с Radeon R9 290X и GeForce GTX 970:

По данным компании AMD, R9 Nano и в играх на 30% быстрее, чем Radeon R9 290X, при этом потребляет на 30% меньше энергии (175 Вт против 250 Вт), да и кулер у новинки значительно тише, чем у топовой платы предыдущего поколения. Вместе это даёт R9 Nano двукратное преимущество по энергоэффективности перед Radeon R9 290X, не говоря уже о куда большей компактности новинки.

Даже если сравнивать Nano против других моделей линейки Fury, то её производительность должна быть весьма близкой, учитывая примерно на 15% меньшую типичную рабочую частоту GPU, по сравнению с Fury X. То есть, миниатюрная R9 Nano обеспечит примерно 85% скорости топовой платы в современной линейке AMD, а «воздушная» Fury на урезанном Fiji обгоняет её всего на 8%, исходя из теории. Так что по скорости новинка должна быть где-то между Radeon R9 390X и R9 Fury.

Однако явно не эти модели были главной целью для AMD при выпуске R9 Nano. Миниатюрная модель сделана для того, чтобы стать самой мощной видеокартой формата mini-ITX на рынке. Среди её компактных конкурентов самыми производительными моделями являются Radeon R9 280 и GeForce GTX 970, есть и ещё GTX 960, но она значительно медленнее.

В частности, у компании ASUS в линейке есть компактный вариант GeForce GTX 970, который ближе всего к R9 Nano по размеру и производительности. Но эта видеокарта от Nvidia основана на не топовом чипе GM204, и явно уступает даже в теории полноценному Fiji, пусть в реальности и работающему на частоте лишь около 900 МГц. В среднем, в AMD оценивают преимущество своего решения в 30% при условии рендеринга в 4K-разрешении, разумеется (когда у GeForce начинает сказываться нехватка видеопамяти):

Практически во всех играх в замерах AMD, GeForce GTX 970 и Radeon R9 290X весьма близки, а R9 Nano значительно быстрее их обеих. Хотя в различных условиях преимущество Nano будет отличаться, в среднем Radeon R9 Nano можно смело назвать мощнейшей среди mini-ITX видеокарт. Интересно, что в условиях тесных корпусов у R9 Nano преимущество даже ещё выше — за счёт низкого тепловыделения и продуманного охлаждения она не снижает частоты при перегреве.

На данных слайдах оранжевым цветом указана потеря при переходе от тестирования на открытом пространстве к закрытому тесному мини-корпусу. И, судя по паре игровых тестов компании AMD, производительность их новинки в условиях небольших SFF-корпусов практически не уменьшается, тогда как mini-ITX вариант GTX 970 заметно снижает частоту GPU, что выливается в потерю драгоценных кадров в секунду.

В общем, по вычислительной и игровой производительности у новинки всё отлично, R9 Nano просто лучшая в своём классе, но остаётся немаловажный вопрос цены. Особенно учитывая специальный отбор лучших видеочипов Fiji, и так то весьма недёшево обходящихся в производстве, особенно из-за HBM-памяти. Кроме этого, на плату установлен продвинутый кулер с испарительной камерой, также немало добавляющий к себестоимости.

И поэтому неудивительно, что компания AMD позиционирует R9 Nano в виде очередной видеокарты премиальной серии, аналогично Titan от Nvidia. Ведь R9 Nano имеет уникальные характеристики, предлагая доселе недостижимую производительность в рамках рынка mini-ITX-решений. Поэтому и цену на новинку установили довольно высокую — целых $649 для американского рынка, ровно как у старшей Fury X с водяным охлаждением. Будем надеяться, что это позволит компании AMD поправить свое финансовое положение. Правда, пока что рынок mini-ITX-решений довольно мал, по сравнению с рынком больших игровых ПК, но есть надежда на его дальнейший рост.

Исходя из вопроса сложности отбора годных для работы в R9 Nano видеочипов, появляется и вопрос доступности решения на рынке — сможет ли AMD поставить достаточное количество таких плат в розничные сети? И тут R9 Nano уже поможет то, что рынок игровых мини-ПК не слишком велик, и с поставками рассматриваемой видеокарты за $650 они должны справиться. Тем более, что ситуация с производством чипов Fiji постоянно улучшается, их выпускают всё больше, и жёсткого дефицита на рынке уже нет.

Модель Radeon R9 Nano открывает новый класс мощнейших видеокарт небольшого размера, походящего для установки в миниатюрные корпуса формата mini-ITX. Вместе с тем, новинка до 30% быстрее при потреблении на 30% меньшей энергии, по сравнению с топовой моделью предыдущего поколения Radeon R9 290X. Да и топовой R9 Fury X по скорости она уступит совсем немного. В общем, потребляющая всего лишь 175 Вт модель Radeon R9 Nano является самой энергоэффективной и мощной платой для сегмента рынка mini-ITX-видеокарт. Также она отличается минимальным размером и весьма эффективным воздушным кулером. Всё вместе это позволяет создать мощнейшие игровые ПК малого форм-фактора, просто невозможные ранее.

Графические ускорители серии Radeon R9 390(X)

Кодовое имя	«Grenada»(«Hawaii»)
Технология производства	28 нм
Количество транзисторов	6,2 млрд.
Архитектура	Унифицированная, с массивом общих процессоров для потоковой обработки многочисленных видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectX	Уровень возможностей Feature Level 12_0 и шейдерная модель Shader Model 5.0
Шина памяти	512-битная: восемь контроллеров шириной по 64 бита с поддержкой памяти GDDR5
Частота графического процессора, МГц	до 1050
Вычислительные блоки	44 вычислительных блока GCN, включающих 176 SIMD-ядер, состоящих в целом из 2816 ALU для расчетов с плавающей запятой (поддерживаются целочисленные и плавающие форматы, с точностью FP32 и FP64)
Блоки текстурирования	176 текстурных блоков, с поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
Блоки растеризации (ROP)	64 блока ROP с поддержкой режимов сглаживания с возможностью программируемой выборки более чем 16 сэмплов на пиксель, в том числе при FP16- или FP32-формате буфера кадра. Пиковая производительность до 64 отсчетов за такт, а в режиме без цвета (Z only) — 256 отсчетов за такт
Поддержка мониторов	Интегрированная поддержка до шести устройств, подключенных по интерфейсам DVI, HDMI и DisplayPort

Спецификации видеокарты Radeon R9 390X
Частота ядра, МГц	до 1050
Количество универсальных процессоров	2816
Количество текстурных блоков	176
Количество блоков блендинга	64
Эффективная частота памяти, МГц	6000 (4×1500)
Тип памяти	GDDR5
Объем памяти, ГБ	8
Пропускная способность памяти, ГБ/с	384
Вычислительная производительность, Терафлопс	5,9
Теоретическая максимальная скорость закраски, Гигапикселей/с	67
Теоретическая скорость выборки текстур, Гигатекселей/с	185
Шина	PCI Express 3.0
Разъемы	два DVI Dual Link, HDMI 1.4, DisplayPort 1.2
Энергопотребление, Вт	до 275
Дополнительное питание	Один 8-контактный и один 6-контактный разъемы
Число слотов, занимаемых в системном корпусе	2

Спецификации видеокарты Radeon R9 390
Частота ядра, МГц	до 1000
Количество универсальных процессоров	2560
Количество текстурных блоков	160
Количество блоков блендинга	64
Эффективная частота памяти, МГц	6000 (4×1500)
Тип памяти	GDDR5
Объем памяти, ГБ	8
Пропускная способность памяти, ГБ/с	384
Вычислительная производительность, Терафлопс	5,1
Теоретическая максимальная скорость закраски, Гигапикселей/с	64
Теоретическая скорость выборки текстур, Гигатекселей/с	160
Шина	PCI Express 3.0
Разъемы	два DVI Dual Link, HDMI 1.4, DisplayPort 1.2
Энергопотребление, Вт	до 275
Дополнительное питание	Один 8-контактный и один 6-контактный разъемы
Число слотов, занимаемых в системном корпусе	2

Так как компания AMD решила не выпускать абсолютно нового поколения на техпроцессе 28 нм, а с 20 нм у тайваньского производителя микроэлектронных схем TSMC получилось не очень, мягко говоря, AMD не оставалось ничего, кроме как перевыпустить почти все свои решения ещё раз, но с изменённым названием. Из новых видеокарт в серии R9 300 можно отметить только модели Fury, Fury X и Nano, а остальные мы уже знали по прошлому поколению.

По сути, пара видеокарт подсемейства Radeon R9 390(X) мало чем отличается от аналогичных моделей предыдущей серии в лице Radeon R9 290(X). Система наименований у видеокарт AMD давно устоялась и новые видеокарты были названы так же, кроме первой цифры, указывающей на новое поколение серии. За исключением некоторых характеристик новинок 2015 года, в них практически ничего не изменилось — это всё те же видеокарты на основе давно известного нам графического процессора Hawaii (теперь он называется Grenada, но это мало что поменяло).

Из изменений можно отметить слегка повышенную частоту графического процессора: с 1000 до 1050 МГц для Radeon R9 390X и примерно те же 50 МГц у младшей модели R9 390. Это изменение нельзя назвать серьёзным, учитывая то, что многие производители видеокарт выпускали фабрично разогнанные версии R9 290(X). Из более важных изменений выделяем изменённые объём и частоту видеопамяти. Если предыдущие аналогичные модели видеокарт AMD имели GDDR5-память объёмом в четыре гигабайта и частотой 5000 МГц, то нынешняя серия удвоила объём до 8 ГБ, а частота повысилась до 6 ГГц.

С одной стороны, объёма GDDR5-памяти в 4 ГБ пока что хватает в абсолютном большинстве игр даже при максимальных настройках качества, и даже у топовых Fury и Fury X именно такой объём памяти, хотя уже другого типа — HBM. Но, с другой стороны, уже выходят проекты, в которых 4 ГБ мало, если речь идёт о разрешении рендеринга выше FullHD и максимальных настройках, вроде Call of Duty: Black Ops 3 — в этой игре при ультравысоких настройках Radeon R9 390 даже быстрее, чем R9 Fury X именно из-за нехватки видеопамяти у последнего. Так что решение оснастить эту пару видеокарт удвоенным объёмом можно лишь приветствовать.

Что касается повышения тактовой частоты памяти на 20%, то это тоже можно назвать неплохой прибавкой, так как Hawaii в современных играх иногда упирается в пропускную способность памяти и не показывает производительности, на которую способны видеокарты на его основе. В остальном, более никаких отличий нет, даже типичное энергопотребление этих «новых« моделей не выросло — осталось на уровне 275 Вт. Все остальные подробности об этих видеокартах вы можете узнать в статьях по моделям Radeon R9 290(X).

Графические ускорители серии Radeon R9 380(X)

Кодовое имя	«Antigua»
Технология производства	28 нм
Количество транзисторов	5,0 млрд.
Архитектура	Унифицированная, с массивом общих процессоров для потоковой обработки многочисленных видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectX	Уровень возможностей Feature Level 12_0 и шейдерная модель Shader Model 5.0
Шина памяти	256-битная: четыре контроллера шириной по 64 бита с поддержкой памяти GDDR5
Частота графического процессора, МГц	до 970
Вычислительные блоки	32 вычислительных блока GCN, включающих 128 SIMD-ядер, состоящих в целом из 2048 ALU для расчетов с плавающей запятой (поддерживаются целочисленные и плавающие форматы, с точностью FP32 и FP64)
Блоки текстурирования	128 текстурных блока, с поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
Блоки растеризации (ROP)	32 блока ROP с поддержкой режимов сглаживания с возможностью программируемой выборки более чем 16 сэмплов на пиксель, в том числе при FP16- или FP32-формате буфера кадра. Пиковая производительность до 32 отсчетов за такт, а в режиме без цвета (Z only) — 128 отсчетов за такт
Поддержка мониторов	Интегрированная поддержка до шести мониторов, подключенных по интерфейсам DVI, HDMI и DisplayPort

Спецификации видеокарты Radeon R9 380X
Частота ядра, МГц	до 970
Количество универсальных процессоров	2048
Количество текстурных блоков	128
Количество блоков блендинга	32
Эффективная частота памяти, МГц	5700 (4×1425)
Тип памяти	GDDR5
Объем памяти, ГБ	4
Пропускная способность памяти, ГБ/с	182,4
Вычислительная производительность, Терафлопс	3,97
Теоретическая максимальная скорость закраски, Гигапикселей/с	31,0
Теоретическая скорость выборки текстур, Гигатекселей/с	124,3
Шина	PCI Express 3.0
Разъемы	два DVI Dual Link, HDMI 1.4, DisplayPort 1.2
Энергопотребление, Вт	до 190
Дополнительное питание	Два 6-контактных разъема
Число слотов, занимаемых в системном корпусе	2
Рекомендуемая цена	для рынка США — $229-239 (для России — 18535-19260 руб)

Спецификации видеокарты Radeon R9 380
Частота ядра, МГц	до 970
Количество универсальных процессоров	1792
Количество текстурных блоков	112
Количество блоков блендинга	32
Эффективная частота памяти, МГц	5700 (4×1425)
Тип памяти	GDDR5
Объем памяти, ГБ	2-4
Пропускная способность памяти, ГБ/с	182,4
Вычислительная производительность, Терафлопс	3,5
Теоретическая максимальная скорость закраски, Гигапикселей/с	31,0
Теоретическая скорость выборки текстур, Гигатекселей/с	108,6
Шина	PCI Express 3.0
Разъемы	два DVI Dual Link, HDMI 1.4, DisplayPort 1.2
Энергопотребление, Вт	до 190
Дополнительное питание	Два 6-контактных разъема
Число слотов, занимаемых в системном корпусе	2

Имена данных решений компании AMD вполне соответствуют их текущей системе наименований. Старшую видеокарту назвали Radeon R9 380X, добавив суффикс «X», что вполне логично, ведь обе модификации R9 380(X) основаны на чипе Antigua/Tonga. Понятно, что в линейке компании новинки расположилась между видеокартами Radeon R7 370 и R9 390, да и по скорости они также находятся где-то между ними.

Референсные варианты Radeon R9 380X предлагаются по рекомендованной цене 18535 руб ($229), фабрично разогнанные платы имеют рекомендованную цену в 19260 руб ($239), а самые продвинутые варианты будут даже ещё дороже. Интересно, что эти цены находятся как раз примерно между ценами GeForce GTX 960 и GTX 970, так что единственного прямого ценового конкурента у новинки нет.

В отличие от Radeon R9 380, новинка имеет локальную GDDR5-память объёмом уже не два гигабайта, а четыре. Шина памяти составляет 256-бит, и на неё можно поставить 1, 2 или 4 ГБ. Одного гигабайта уже давно слишком мало, а в последних играх при максимальных настройках качества даже в самом распространённом разрешении FullHD не хватает уже и двух гигабайт. Поэтому было принято совершенно логичное и оправданное решение по установке 4 ГБ видеопамяти на Radeon R9 380X — сейчас это значение можно считать «золотой серединой».

Для дополнительного питания платой используется два 6-контактных разъёма, как и в младшей модели. Да и с точки зрения типичного энергопотребления никакой разницы между младшей моделью на графическом процессоре Antigua/Tonga и вышедшей на прошлой неделе Radeon R9 380X нет — обе они потребляют порядка 190 Вт, хотя в реальности небольшая разница всё же может быть — в варианте R9 380X и памяти больше и GPU применяется полностью разблокированный.

Так как конструктивно Radeon R9 380X во многом схожа с соответствующим решением на основе видеочипа Tonga из предыдущей линейки Radeon 200, а также Radeon R9 380, то все производители видеокарт (см. иллюстрацию ниже), являющиеся партнёрами компании AMD, сразу же предложили модели собственного дизайна, что относится и к печатной плате и к системе охлаждения. Большинство производителей видеокарт использует дизайн аналогичных карт младшей модели Radeon R9 380, так как они очень похожи.

Можно ожидать большого количества фабрично разогнанных модификаций, так как графический процессор Antigua/Tonga неплохо разгоняется. Сразу же после анонса вышли и видеокарты модели Radeon R9 380X, имеющие заводской разгон — большинство партнёров AMD не упустило возможности выпустить такие варианты. Они также отличаются оригинальным дизайном плат и кулеров, но обеспечивают ещё и большую производительность — типичным разгоном для подобных моделей является выросшая примерно до 1030 МГц частота графического процессора.

Архитектурные особенности

Графический процессор Antigua/Tonga можно назвать одним из самых богатых по функциональности среди решений компании AMD, ведь он относится к третьему поколению архитектуры Graphics Core Next (GCN 1.2), самому совершенному на данный момент. Хотя архитектурно этот GPU вовсе не радикально отличается от чипов первого поколения, но многие полезные улучшения в нём были сделаны. Так, в новой архитектуре появились инструкции для гетерогенной архитектуры (Heterogeneous System Architecture — HSA), поддержка большего количества одновременно исполняемых потоков команд, в DirectX 12 появилась поддержка уровня возможностей Feature Level 12_0, также была внедрена и новая версия технологии AMD PowerTune, о которой мы уже рассказывали.

Как мы уже многократно и максимально подробно описывали и архитектуру Graphics Core Next на примере чипов Tahiti, Hawaii и многих других. Применяемый в Radeon R9 380X графический процессор Antigua/Tonga основан на последней версии этой архитектуры, он получил все улучшения от чипов Bonaire и Hawaii, и по своим основам не отличается от них. Напомним, что базовым блоком архитектуры является вычислительный блок Compute Unit (CU), из которых собраны все графические процессоры AMD.

Вычислительный блок CU имеет выделенное локальное хранилище данных для обмена данными или расширения локального регистрового стека, а также кэш-память первого уровня с возможностью чтения и записи и полноценный текстурный конвейер с блоками выборки и фильтрации, он разделен на подразделы, каждый из которых работает над своим потоком команд. Каждый из таких блоков занимается планированием и распределением работы самостоятельно. Посмотрим, как полноценный вариант Antigua/Tonga выглядит схематично:

Чип в полной версии имеет 32 вычислительных устройства CU, дающих в сумме 2048 потоковых вычислительных ядра (у Radeon R9 380 их 28 и 1792, соответственно). Количество текстурных блоков в этой версии GPU равно 128 блокам, так как каждый блок CU имеет в своем составе по четыре текстурных блока. По количеству блоков ROP никаких изменений не произошло, в этом варианте активны все 32 исполнительных устройства. 64-битных контроллеров памяти в графическом процессоре Antigua/Tonga четыре штуки, что в сумме даёт 256-битную шину памяти (но не забываем о куда более эффективном её использовании, по сравнению с предыдущими GPU).

Рабочие частоты у видеокарты новой модели такие же, что и у Radeon R9 380 — новое решение на графическом процессоре Antigua/Tonga получило максимальную частоту в 970 МГц, но в реальности она может отличаться из-за применения технологии AMD PowerTune, которая появилась ещё в Bonaire и Hawaii. Графическим процессором Antigua/Tonga поддерживается последняя версия PowerTune, обеспечивающая максимально возможную 3D-производительность в рамках определённого потребления энергии. В приложениях с высоким потреблением энергии, GPU может сбросить частоту ниже номинальной, упираясь в предел энергопотребления, а в игровых приложениях обеспечивает более высокую рабочую частоту — максимально возможную в текущих условиях.

Все архитектурные модификации графического процессора Antigua/Tonga мы подробно рассмотрели в обзоре видеокарты Radeon R9 285: изменения в геометрическом конвейере, появление новых инструкций, улучшенное управление работой вычислительных блоков и распределение задач, применение более эффективного метода сжатия буфера кадра без потерь, компенсирующее 256-битную шину памяти по сравнению с 384-битной у Tahiti, полную поддержку технологии аппаратной обработки звука AMD TrueAudio, новые версии блоков по обработке видеоданных и многое другое. А ещё более ранние технологии компании AMD, поддержка которых также есть в Radeon R9 380X, были описаны в соответствующих обзорных статьях: Radeon HD 7970 и Radeon R9 290X.

Краткая оценка производительности, позиционирование и выводы

С точки зрения производительности, в показателях Radeon R9 380X не может быть ничего нового и необычного, ведь мы уже видели в деле несколько моделей видеокарт на полном чипе Tahiti и на урезанном Antigua/Tonga, так что можно предположить, что R9 380X будет побыстрее R9 380 и чуть быстрее самого старшего представителя GCN — модели Radeon HD 7970, которой уже много лет. Давайте рассмотрим отличия между характеристиками моделей видеокарт текущего семейства Radeon 300:

Модель видеокарты	Radeon R9 380	Radeon R9 380X	Radeon R9 390
Цена	$199	$229	$329
Модель GPU	Antigua	Antigua	Grenada
Кол-во ALU	1792	2048	2560
Кол-во TMU	112	128	160
Кол-во ROP	32	32	64
Частота GPU, МГц	970	970	1000
Частота памяти, МГц	5500	5700	6000
Шина памяти, бит	256	256	512
Объем памяти, ГБ	2	4	8
Энергопотребление, Вт	190	190	275

Понятно, что Radeon R9 390 выгодно отличается от плат на основе Antigua/Tonga из-за объёма видеопамяти и заметно большей ПСП, а также количества функциональных блоков. Если сравнивать модель Radeon R9 380X с младшим вариантом R9 380, то их отличия понятны — так как количество блоков CU в младшем урезано с 32 до 28, а количество блоков ROP и шина памяти остались нетронутыми, да и частоты GPU одинаковы, то разница между ними только в математической и текстурной производительности. Некоторая разница есть и по пропускной способности локальной памяти, она повышена с 5500 МГц эффективной частоты до 5700 МГц, но разница невелика.

Но есть и ещё кое-что — разница в объёме видеопамяти, которая начинает играть всё большую роль в последнее время, когда выходит большое количество мультиплатформенных игр, изначально планируемых к выходу на консолях текущего поколения, имеющих по 8 ГБ общей памяти. Последним игровым проектам 2 ГБ явно недостаточно, поэтому на вышедшей Radeon R9 380X решили увеличить объём видеопамяти с 2 ГБ до 4 ГБ, и это — совершенно логичное и правильное решение. И хотя производители предлагают варианты модели R9 380 с 2 и 4 ГБ памяти, но первые встречаются куда чаще.

В среднем, Radeon R9 380X должна быть примерно на 10% быстрее, чем R9 380, при равном объёме видеопамяти. Если брать двухгигабайтный вариант младшей модели, то разница в высоких разрешениях и настройках может значительно увеличиться. А вот старшей плате Radeon R9 390 новинка, исходя из теории, может проигрывать и более 30% из-за разницы в количестве исполнительных блоков (ALU, TMU и ROP) и пропускной способности памяти. Но конкурировать за кошельки покупателей с Radeon R9 390 новинке поможет заметно меньшая цена.

Позиционирование Radeon R9 380X в линейке графических решений компании AMD очень простое — новинка расположилась между моделями R9 380 и R9 390 и по производительности, и по цене. Что касается конкурента от Nvidia, то Radeon R9 380X не имеет прямого соперника по цене, а находится между двумя моделями GeForce: GTX 960 и GTX 970, но чуть ближе к первой. Сравнивать выгоднее с GTX 960, особенно в 3DMark Fire Strike, что AMD и делает:

На диаграмме видно, что по данным компании, в этом бенчмарке Radeon R9 380X серьёзно опережает своего младшего ценового конкурента, имеющего чуть более низкую рекомендуемую цену. Примерно то же самое можно сказать и об устаревших видеокартах обоих производителей GPU, которые AMD считает хорошими кандидатами для апгрейда графической подсистемы до R9 380X:

Но давайте уже перейдём к играм, и для начала рассмотрим преимущество над решениями конкурента в игровых приложениях, использующих новую версию графического API DirectX 12:

Хорошо видно, что за счёт преимущества в производительности и некоторых архитектурных решений (в том числе асинхронного выполнения шейдеров различных типов: пиксельных и вычислительных, к примеру), представленная на прошлой неделе видеокарта Radeon R9 380X опережает как старую уже GeForce GTX 760, так и вполне актуальную модель GTX 960, стоящую чуть меньше, правда.

Остаётся посмотреть, как новинка справляется с самыми современными игровыми проектами, такими как Fallout 4, Mad Max и Star Wars: Battlefront. Сравнивается новая видеокарта от компании AMD снова с младшим из актуальных конкурентов производства Nvidia — GeForce GTX 960.

Если не учитывать то, что тесты были произведены одной из заинтересованных сторон, можно сказать, что Radeon R9 380X во всех представленных играх обеспечивает несколько большую скорость рендеринга, по сравнению с одним из своих ценовых конкурентов.

В текущей линейке видеокарт AMD модель Radeon R9 380X занимает место между R9 390 и R9 380, что логично. Но хотя сама AMD считает новинку достаточной для игры в разрешении 2560×1440 пикселей, самые свежие игры при максимальных настройках потребуют большего. Так, в самых современных играх есть установки качества «ультра», которые могут требовать даже более 4 ГБ видеопамяти и применения самых мощных GPU, вроде Grenada и даже Fiji.

Что касается конкуренции с решениями Nvidia, то новинка соперничает с GeForce GTX 970 и GTX 960, старшая из которых быстрее и дороже, а младшая — медленнее и чуть дешевле. Так что в целом Radeon R9 380X довольно точно соответствует привычной концепции компании AMD, предлагающей свои видеокарты сравнимой производительности немного дешевле соперника, или выпуская видеокарты с близкой ценой, но чуть более быстрые. Это касается исключительно соотношения цены и производительности, по энергоэффективности решения AMD всё так же далеки от последних видеокарт Nvidia.

Пожалуй, причиной анонса видеокарты на основе полноценного чипа Antigua/Tonga стал тот факт, что у AMD оставался небольшой запас в виде заблокированных в R9 380 исполнительных устройств, и они решили слегка освежить свою линейку новой моделью — нужно же как-то напоминать о своём существовании во время, когда ничего действительно нового выпустить пока что нельзя, так как более совершенные техпроцессы ещё слишком сырые. Компания AMD решила разбить пару конкурентов GeForce GTX 970 и GTX 960, выпустив что-то среднее между ними, как они нередко делали подобное ранее. И представленная модель Radeon R9 380X продолжает такой подход, став одним из выгодных предложений в своей ценовой нише.

Графический ускоритель Radeon R7 370

Кодовое имя	«Curacao/Pitcairn»
Технология производства	28 нм
Количество транзисторов	2,8 млрд.
Архитектура	Унифицированная, с массивом общих процессоров для потоковой обработки многочисленных видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectX	Уровень возможностей Feature Level 11_1 и шейдерной модели Shader Model 5.0
Шина памяти	256-битная: четыре контроллера шириной по 64 бита с поддержкой памяти GDDR5
Частота графического процессора, МГц	1050
Вычислительные блоки	16 (из 20 в чипе) вычислительных блоков GCN, включающих 64 (из 80) SIMD-ядер, состоящих в общем из 1024 (из 1280) ALU для расчетов с плавающей запятой (поддерживаются целочисленные и плавающие форматы, с точностью FP32 и FP64)
Блоки текстурирования	64 (из 80) текстурных блока, с поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
Блоки растеризации (ROP)	32 блока ROP с поддержкой режимов сглаживания с возможностью программируемой выборки более чем 16 сэмплов на пиксель, в том числе при FP16- или FP32-формате буфера кадра. Пиковая производительность до 32 отсчетов за такт, а в режиме без цвета (Z only) — 128 отсчетов за такт
Поддержка мониторов	Интегрированная поддержка до шести мониторов, подключенных по интерфейсам DVI, HDMI и DisplayPort

Спецификации видеокарты Radeon R7 370
Частота ядра, МГц	1050
Количество универсальных процессоров	1024
Количество текстурных блоков	64
Количество блоков блендинга	32
Эффективная частота памяти, МГц	5700 (4×1425)
Тип памяти	GDDR5
Объем памяти, ГБ	2
Пропускная способность памяти, ГБ/с	182
Вычислительная производительность, Терафлопс	2,15
Теоретическая максимальная скорость закраски, Гигапикселей/с	33,6
Теоретическая скорость выборки текстур, Гигатекселей/с	67,2
Шина	PCI Express 3.0
Разъемы	два DVI Dual Link, HDMI 1.4, DisplayPort 1.2
Энергопотребление, Вт	до 150
Дополнительное питание	Один 6-контактный разъем
Число слотов, занимаемых в системном корпусе	2
Рекомендуемая цена	для рынка США — $135-149

Любопытно выбранное наименование в новой линейке для рассматриваемой модели — после пересмотра рыночного позиционирования всей серии, данная видеокарта была исключена из серии Radeon R9 и спустилась вниз в подсемейство Radeon R7. Собственно, копия этой модели из семейства Radeon 200 также была в подсемействе R7 (R7 265), но вот модель R9 270 принадлежала уже к более серьёзному подсемейству. Довольно странное решение, так как по производительности в «новинке» ничего не изменилось. Разве что в AMD решили немного «причесать» систему названий для своих видеокарт, сделав её более стройной.

Модель Radeon R7 370 занимает своё положение в нижней части продуктовой линейки компании, её основой является графический процессор Pitcairn, известный также под именем Curacao. Это — один из самых старых GPU, применяемых в новой линейке Radeon 300, на чипе с точно такими же характеристиками основаны такие модели, как Radeon HD 7850 и R7 265. Ну разве что «новинка» слегка разогнана по сравнению с предшественниками — до 1050 МГц для GPU и 5700 МГц для GDDR5-памяти. Но по производительности она остаётся весьма близкой к уже известным нам моделям предыдущих поколений.

Компания AMD позиционирует своё номинально новое решение в качестве соперника для Nvidia GeForce GTX 750 Ti, что неудивительно, учитывая, что Radeon R7 265 также был соперником для этой же модели. Вероятно появление на рынке двух вариантов этой новой модели: с 2 и 4 ГБ видеопамяти, также отличающихся и розничными ценами. Объема в два гигабайта до сих пор чаще всего хватает для разрешений до 1920×1080(1200), но в некоторых современных играх при высоких настройках качества требуется большее её количество. Правда, для столь недорогой видеокарты в установке большего объёма достаточно дорогой GDDR5-памяти просто нет смысла, ведь скорость рендеринга будет ограничиваться возможностями GPU, прежде всего.

Сама по себе видеокарта невелика по размеру и, как и её предшественница Radeon R7 265, оснащена лишь одним шестиконтактным разъёмом дополнительного питания, что означает уровень энергопотребления порядка 150 Вт. Это значение явно указывает на применение устаревшего GPU, не отличающегося особой энергоэффективностью, ведь конкурирующая видеокарта GeForce GTX 750 Ti с весьма энергоэффективным видеочипом архитектуры Maxwell потребляет всего лишь до 60 Вт.

Внешнее оформление кожуха системы охлаждения платы Radeon R7 370 подчеркивает общность с другими моделями новой линейки, а среди разъёмов на ней можно найти два порта DVI и полноразмерные видеовыходы форматов HDMI и DisplayPort. Хотя характеристики референсной платы не особенно важны, так как партнеры компании AMD предлагают собственные варианты с оригинальным дизайном печатных плат и систем охлаждения, которые также могут отличаться и по набору разъемов для вывода изображения.

Особенности новой модели

Так как Radeon R7 370 основана на графическом процессоре Pitcairn/Curacao, о котором мы рассказывали уже не раз и не два, данный раздел будет предельно кратким. Для начала можно прочитать материал о давно известной архитектуре Graphics Core Next (GCN) на примере чипа Tahiti. На этой архитектуре основаны все современные решения компании, и даже более современные GPU отличаются не слишком значительными модификациями в вычислительных способностях, некоторыми дополнительными возможностями DirectX 12 и усовершенствованной технологией AMD PowerTune, а основы остаются неизменными.

Модель Radeon R7 370 основана на урезанном по количеству функциональных блоков чипе Pitcairn/Curacao. В данной модификации графического процессора выключены из работы четыре вычислительных устройства (из 20 вычислительных устройств активными остались 16 штук). Это дает общее количество 1024 потоковых процессоров вместо 1280 ALU у полноценной версии. Это же касается и текстурных блоков: их количество снижено с 80 TMU до 64 TMU, так как каждый блок GCN имеет в своем составе по четыре текстурных блока. По количеству блоков ROP и контроллерам памяти эти чипы одинаковы, они имеют 32 блока ROP и четыре 64-битных контроллера памяти, дающие общую 256-битную шину.

Рабочие частоты видеокарты новой модели Radeon R7 370 несколько выше тех, что были у R7 265 и уж тем более выше частот Radeon HD 7850. Графический процессор в рассматриваемой модели получил частоту в 1050 МГц, а видеопамять новинки работает на частоте в 5.7 ГГц. Применение быстрой GDDR5-памяти дает довольно высокую для этого ценового сегмента пропускную способность в 182 ГБ/с, что может положительно сказываться при рендеринге в высоких разрешениях. Объем памяти у данной модели может быть 2 или 4 ГБ, нижнее значение логично для бюджетной видеоплаты, а верхнее может помочь при использовании 4K-мониторов.

Свежевыпущенная модель видеокарты Radeon R7 370 поддерживает все те же технологии, что и предыдущие модели на основе этого же GPU. Мы уже неоднократно писали обо всех новых технологиях, поддерживаемых графическими чипами компании AMD в соответствующих обзорах. В частности, рассматриваемая видеокарта имеет поддержку нового графического API Mantle, который помогает в эффективном использовании аппаратных возможностей графических процессоров AMD, не будучи ограничен недостатками имеющихся графических API: OpenGL и DirectX. Правда, после скорого выхода DirectX 12 это перестанет быть особым преимуществом.

Что касается производительности новой модели, то старшим моделям на базе того же чипа Pitcairn она может уступать до 20%, что объясняется разным количеством активных исполнительных блоков GCN. Дополнительные четыре CU дают старшему графическому процессору большие теоретические показатели пиковой скорости математических вычислений и производительности текстурных выборок и фильтрации, хотя производительность блоков ROP и пропускная способность видеопамяти у них равна. Ну а в целом — новинка чуть быстрее модели Radeon R7 265, хотя разница между ними весьма невелика.

Что касается конкуренции с компанией Nvidia, то модель Radeon R7 370 мало что меняет на рынке, хотя и остаётся интересным вариантом для своего класса. Традиционно, по этой цене решениям AMD противостоит видеокарта GeForce GTX 750 Ti от калифорнийской компании, имеющая несколько меньшую производительность. Компания AMD говорит о производительности новинки на 20% большей, по сравнению с платой Nvidia, которая продаётся примерно за эти же деньги. Правда, разница в потреблении энергии между GeForce GTX 750 Ti и Radeon R7 370 куда больше, и она уже в пользу решения Nvidia — их плата обходится аж в 2,5 раза меньшим энергопотреблением (60 Вт против 150 Вт).

Совершенно понятно, что видеокарта Radeon R7 370 относится к ряду максимально доступных решений стоимостью до $150, поэтому не нужно требовать от неё каких-то особенных характеристик и высокой производительности. На это указывает и отнесение новой модели компанией AMD к серии Radeon R7. И хотя энтузиастам ПК-игр такого уровня производительности явно не хватит, типичные пользователи будут довольны её скоростью, получаемой за небольшие деньги, ведь представленная модель Radeon R7 370 является одним из самых выгодных предложений в своем ценовом диапазоне.

Другое дело, что интересующимся 3D-графикой хотелось бы от компании AMD уже чего-то реально нового, а не графического процессора трёхлетней давности, выходящего под уже третьим названием. В самом по себе переименовании старых GPU под видом новых моделей нет ничего плохого, когда это оправдано с рыночной точки зрения. Но больше трёх лет использовать решения, которые уступают современным платам соперника по функциональности и энергоэффективности — это явно вынужденное решение из-за недостатка средств. Дела у компании AMD идут не слишком хорошо, чтобы разрабатывать радикально новую линейку GPU по всё тому же 28 нм техпроцессу, придётся ждать следующего года и более совершенных технологий производства.

Графический ускоритель AMD Radeon R7 360

Кодовое имя	«Tobago»
Технология производства	28 нм
Количество транзисторов	2,08 млрд.
Архитектура	Унифицированная, с массивом общих процессоров для потоковой обработки многочисленных видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectX	Уровень возможностей Feature Level 12_0 и шейдерная модель Shader Model 5.0
Шина памяти	128-битная: два контроллера памяти шириной по 64 бита с поддержкой памяти GDDR5
Частота графического процессора, МГц	до 1050
Вычислительные блоки	12 (из 14 физических) вычислительных блоков GCN, включающих 48 (из 56) SIMD-ядер, состоящих в общем из 768 (из 896) ALU для расчетов с плавающей запятой (поддерживаются целочисленные и плавающие форматы, с точностью FP32 и FP64)
Блоки текстурирования	48 (из 56) текстурных блоков, с поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
Блоки растеризации (ROP)	16 блоков ROP с поддержкой режимов сглаживания с возможностью программируемой выборки более чем 16 сэмплов на пиксель, в том числе при FP16- или FP32-формате буфера кадра. Пиковая производительность до 16 отсчетов за такт, а в режиме без цвета (Z only) — 64 отсчета за такт
Поддержка мониторов	Интегрированная поддержка до шести мониторов, подключенных по интерфейсам DVI, HDMI и DisplayPort

Спецификации видеокарты Radeon R7 360
Частота ядра, МГц	до 1050
Количество универсальных процессоров	768
Количество текстурных блоков	48
Количество блоков блендинга	16
Эффективная частота памяти, МГц	6500 (4×1625)
Тип памяти	GDDR5, 128-бит
Объем памяти, ГБ	2
Пропускная способность памяти, ГБ/с	104
Вычислительная производительность (FP32), терафлопс	до 1,61
Теоретическая максимальная скорость закраски, гигапикселей/с	16,8
Теоретическая скорость выборки текстур, гигатекселей/с	50,4
Шина	PCI Express 3.0
Разъемы	один HDMI 1.4a и три DisplayPort 1.2a
Типичное энергопотребление, Вт	100
Дополнительное питание	один 6-контактный разъем
Число слотов, занимаемых в системном корпусе	2
Рекомендуемая цена	для рынка США — $109

Серию Radeon R7 в новой линейке AMD представляют две модели: Radeon R7 360 и R7 370. Рассматриваемая нами модель Radeon R7 360, имеющая рекомендованную стоимость на начало продаж в $109, схожа с видеокартой предыдущей линейки Radeon R7 260, частота графического чипа в которой была увеличена на 50 МГц, а частота памяти — на 125 МГц. Вместе с ростом тактовых частот слегка повысилось и типичное энергопотребление видеокарты (TDP) — с 95 до 100 Вт.

При рекомендованной цене в $109 эта модель является прямой заменой для Radeon R7 260, имеющей схожее ценовое позиционирование в виде нижней модели линейки дискретных GPU. Что касается решений конкурента из этого же ценового сегмента, то модели Radeon R7 360 противостоит Nvidia GeForce GTX 750, основанная на урезанном чипе GM107, а полноценный вариант в виде GTX 750 Ti конкурирует уже с Radeon R7 370.

Так что главным ценовым конкурентом для Radeon R7 360 является видеокарта модели GeForce GTX 750. Действительно, по многим параметрам они схожи, и по скорости Radeon даже имеет некоторое преимущество. Правда, GeForce GTX 750 потребляет всего лишь 55 Вт и даже не требует подключения дополнительного питания — благодаря высочайшей энергоэффективности архитектуры Maxwell, хоть и в виде первого её поколения.

Рассматриваемая модель видеокарты имеет GDDR5 память объёмом в 2 гигабайта, что отлично подходит для неё с учётом ориентации на FullHD-разрешение и бюджетный ценовой сегмент. Так как данный GPU имеет 128-битную шину памяти, на неё теоретически можно было бы поставить и 1 ГБ и 4 ГБ, но меньший объём по современным меркам совсем уже недостаточен, а 4 ГБ быстрой GDDR5 памяти слишком дороги для нижнего ценового сегмента. А объёма 2 ГБ должно быть вполне достаточно в большинстве игр при играбельных настройках.

Дизайн референсной платы Radeon R7 360 от AMD очень прост, в качестве системы охлаждения используется максимально упрощённый кулер с алюминиевым радиатором и вентилятором, хотя система охлаждения всё равно осталась двухслотовой. Для дополнительного питания используется один 6-контактный разъём, а портов вывода изображения на плате установлено два DVI и по одному HDMI и DisplayPort. Впрочем, большинство производителей подобных решений всё равно выпустили свои платы с собственным дизайном как PCB, так и кулеров, так что референсный не так уж и важен.

Архитектурные и конструктивные особенности

В основе видеокарты модели Radeon R7 360 лежит чип Tobago, также ранее известный нам по Radeon HD 7790 как Bonaire, но не в полной конфигурации. Эта модификация чипа содержит 12 активных вычислительных блоков Compute Unit из 14 штук, физически присутствующих в графическом процессоре — всё ровно так же, как и у модели Radeon R7 260. Графический процессор Bonaire относится к давно знакомой нам архитектуре Graphics Core Next (GCN) второго поколения (условно её можно назвать GCN 1.1), в которой были сделаны некоторые изменения.

Чип архитектурно не слишком сильно отличается от первого поколения GCN, но многие полезные улучшения в нём действительно были сделаны. Так, в новой архитектуре появились инструкции для гетерогенной архитектуры (Heterogeneous System Architecture — HSA), поддержка большего количества одновременно исполняемых потоков, в DirectX 12 появилась поддержка уровня возможностей Feature Level 12_0, также была внедрена и новая версия технологии AMD PowerTune, о которой мы уже не раз рассказывали.

Базовые блоки в Tobago остались без изменений, поэтому можно смело знакомиться со статьёй, посвящённой анонсу давнего флагмана компании Radeon HD 7970, в которой были тщательно описаны все особенности новой архитектуры Graphics Core Next. Как известно, базовым блоком архитектуры является блок GCN, из которых собраны все графические процессоры компании. Вычислительный блок GCN разделён на подразделы, каждый из которых работает над своим потоком команд, они имеют выделенное локальное хранилище данных, кэш-память первого уровня и текстурный конвейер с блоками выборки и фильтрации.

Во время своего появления, графический процессор Bonaire с его 14 блоками GCN стал средним между Cape Verde, имеющем 10 вычислительных блоков и Pitcairn с 20-ю блоками GCN. Bonaire заполнил нишу посередине между этими решениями. Позднее чип был перевыпущен под именем Tobago. На схеме показан урезанный графический процессор, который применяется в рассматриваемой модели Radeon R7 360. В его составе есть 12 активных вычислительных блоков архитектуры GCN, которые соответствуют 768 потоковым вычислительным процессорам. И так как каждый активный блок GCN имеет в своём составе по 4 текстурных блока, итоговая цифра количества TMU для рассматриваемой модели составляет 48 блоков выборки и фильтрации текстур.

А вот по количеству блоков ROP и контроллеров памяти чип для Radeon R9 360 не урезали, как и в случае R7 260. Активных блоков ROP оставили 16 штук, и шина памяти у чипа 128-битная, собранная из двух 64-битных каналов. Применение сравнительно быстрой GDDR5 памяти позволило обеспечить достаточно высокую пропускную способность для видеокарты нижнего ценового сегмента, которая ещё и была дополнительно увеличена в решении новой линейки, достигнув значения в 104 ГБ/с.

Аналогично другим моделям из современной линейки Radeon 300, видеокарта Radeon R7 360 обеспечивает несколько большую производительность, по сравнению со своим аналогом из семейства Radeon 200. В данном случае, компания AMD подняла частоты GPU и видеопамяти: с 1000 МГц и 6 ГГц до 1050 МГц и 6.5 ГГц, по сравнению с Radeon R7 260. Надо понимать, что 1050 МГц — это максимальная турбо-частота графического процессора для референсной модели, в видеокартах партнёров и реальных 3D-приложениях значение может быть иным.

Хотя видеочип и не новый, он поддерживает множество технологий компании AMD, вот их неполный список: PowerTune, ZeroCore, Eyefinity, HD3D и т.д. Обо всём этом мы писали ранее в статьях о самых старых чипах семейства GCN, а модель на основе Tobago/Bonaire поддерживает все указанные возможности, в том числе технологию AMD Eyefinity 2.0 с поддержкой шести мониторов со стереорендерингом. Также этот GPU отличается улучшенным блоком декодирования и кодирования видеоданных, хотя по своим возможностям он уже и не нов.

Краткая оценка производительности и выводы

Что касается оценки производительности Radeon R7 360, можно смело утверждать, что она должна быть примерно равна скорости Radeon R7 260, ведь прирост максимальной частоты в 50 МГц вряд ли даст заметное увеличение в средней частоте кадров, учитывая, что это лишь максимальная турбо-частота GPU, да и прирост в ПСП не столь значителен.

Нас скорее больше интересует сравнение с конкурентом, в качестве которого выступает модель видеокарты GeForce GTX 750 от компании Nvidia. Для начала рассмотрим сравнение сразу двух пар: двух моделей подсемейства Radeon R7 300 и конкурирующих с ними видеокарт Nvidia в синтетическом бенчмарке 3DMark Fire Strike в разрешении 1920×1080.

Интересно, что AMD выбрала 4K-разрешение для Radeon R9 390X и R9 390, 1440p для Radeon R9 380, а для линейки R7 300 осталось разрешение 1080p. Причём, старшая Radeon R7 370 должна обеспечивать приемлемую скорость рендеринга при высоких настройках, а R7 360 уже при несколько сниженных. Собственно, разницу между их производительностью хорошо видно на диаграмме:

По оценке компании, Radeon R7 370 ощутимо производительнее рассматриваемой модели, но эта модель и продаётся дороже. Зато обе видеокарты Radeon быстрее своих конкурентов в лице GeForce GTX 750 Ti и GTX 750, соответственно. Несмотря на синтетический характер данного теста, примерно такая же разница в пользу решений Radeon наблюдается и в играх:

По тестам, проведённым специалистами AMD, их модель Radeon R7 360 оказывается в среднем быстрее GeForce GTX 750 в разрешении 1920×1080 и высоких настройках качества в наборе из пяти популярных игр. Ну и снова обратимся к теме многопользовательских игр, популярных в киберспорте, оценив скорость рендеринга Radeon R7 360 и 370 в таких проектах:

Достаточно высокая производительность в этих играх крайне важна для игроков, и по показателям Radeon R7 360 видно, что вся линейка видеокарт компании AMD обеспечивает в таких приложениях достаточную скорость смены кадров. Даже недорогие модели Radeon R7 360 и R7 370 способны на высокую частоту кадров, превышающую 60 FPS в самых популярных онлайн-играх.

Можно отметить, что модель Radeon R7 360 является бюджетной видеокартой компании AMD самого начального уровня. Она направлена на игроков, заинтересованных в многопользовательских играх и использующих не самое высокое разрешение рендеринга до 1920×1080 включительно. Хотя такие игры, как DOTA 2, League of Legends и т. п. обычно неплохо работают и на интегрированной графике, кусок этого пирога откусить хочется и AMD с Nvidia, поэтому они стараются заманить игроков с бюджетными системами на дискретные видеокарты начального уровня, обеспечивающие более высокое качество картинки при лучшей производительности. И для таких задач Radeon R7 360 отлично подходит, обеспечивая отличную функциональность и качество изображения при достаточно высокой скорости рендеринга.

Справочная информация о семействе видеокарт Radeon X
Справочная информация о семействе видеокарт Radeon X1000
Справочная информация о семействе видеокарт Radeon HD 2000
Справочная информация о семействе видеокарт Radeon HD 4000
Справочная информация о семействе видеокарт Radeon HD 5000
Справочная информация о семействе видеокарт Radeon HD 6000
Справочная информация о семействе видеокарт Radeon HD 7000
Справочная информация о семействе видеокарт Radeon 200
Справочная информация о семействе видеокарт Radeon 300