AMD Radeon R9 280

Часть 2: Особенности карты и синтетические тесты


Содержание

Устройство(а)

Sapphire Radeon R9 280 Dual-X OC Edition 3072 МБ 384-битной GDDR5 PCI-E
ПараметрЗначениеНоминальное значение (референс)
GPURadeon R9 280 (Tahiti)
ИнтерфейсPCI Express x16
Частота работы GPU (ROPs), МГц850—940850—933
Частота работы памяти (физическая (эффективная)), МГц1250 (5000)1250 (5000)
Ширина шины обмена с памятью, бит384
Число вычислительных блоков в GPU/частота работы блоков, МГц28/850—94028/850—933
Число операций (ALU) в блоке64
Суммарное число операций (ALU)1792
Число блоков текстурирования (BLF/TLF/ANIS)112
Число блоков растеризации (ROP)32
Размеры, мм270×100×35272×100×33
Количество слотов в системном блоке, занимаемые видеокартой22
Цвет текстолитасинийчерный
Энергопотребление (пиковое в 3D/в режиме 2D/в режиме «сна»), Вт210/68/3197/62/3
Выходные гнезда1×DVI (Dual-Link/HDMI), 1×DVI (Single-Link/VGA), 1×HDMI 1.4a, 1×DisplayPort 1.21×DVI (Dual-Link/VGA), 1×HDMI 1.4a, 2×Mini-DisplayPort 1.2
Поддержка многопроцессорной работыCrossFire
Максимальное количество приемников/мониторов для одновременного вывода изображения43
Дополнительное питание: количество 8-контактных разъемовНетНет
Дополнительное питание: количество 6-контактных разъемов22
Максимальное разрешение 2D/цифровой вывод Dual-Link DVI/DP/HDMI4К (3840×2400), не проверялось
Максимальное разрешение 3D/цифровой вывод Dual-Link DVI/DP/HDMI4К (3840×2400), не проверялось

Комплектация локальной памятью
Карта имеет 3072 МБ памяти GDDR5 SDRAM, размещенной в 12 микросхемах по 2 Гбит (на лицевой стороне PCB).

Микросхемы памяти SK Hynix (GDDR5). Микросхемы рассчитаны на максимальную частоту работы в 1250 (5000) МГц.

Сравнение с эталонным дизайном (reference)
Вид спереди
Sapphire Radeon R9 280 Dual-X OC Edition 3072 МБ 384-битной GDDR5 PCI-E Reference card AMD Radeon HD 7950
Вид сзади
Sapphire Radeon R9 280 Dual-X OC Edition 3072 МБ 384-битной GDDR5 PCI-E Reference card AMD Radeon HD 7950

Дизайн этой карты в целом очень схож с эталонным (мы сравниваем с Radeon HD 7950, так как R9 280 — это, по сути, и есть бывший HD 7950 с измененными частотами работы). Немного изменена система питания, она стала 6-фазной для ядра. Главное изменение: комплект видеовыходов для подключения к мониторам. Если референс-карта имеет всего 1 разъем DVI, 2 разъема DP в мини-формате плюс 1 разъем HDMI, то у Sapphire мы видим более сбалансированный и востребованный набор: два DVI, плюс по одному HDMI и DP в полноформатных вариантах. Следует напомнить, что по умолчанию видеокарты Radeon семейств HD/R обладают способностью вывода картинки на 3 монитора одновременно (AMD Eyefinity), а все последние продукты семейства R9 могут выводить изображение на 4 монитора.

Система охлаждения
Весьма мощный комплект для охлаждения. Состоит из большого радиатора, усиленного тепловыми трубками, равномерно разносящими тепло по ребрам, а также кожуха с двумя вентиляторами. Радиатор имеет медное основание.

Микросхемы памяти охлаждаются основным радиатором, а силовые транзисторы имеют свои небольшие радиаторы.

После 6-часового прогона под нагрузкой максимальная температура не превысила 67 градусов, что для такого рода ускорителей является отличным результатом. Однако тут есть одно но. Такой результат достигнут за счет весьма шумных вентиляторов, максимальная частота вращения которых превысила 2500 оборотов в минуту.
Мониторинг температурного режима (с помощью EVGA PrecisionX (автор А. Николайчук AKA Unwinder)

Комплектация
Базовый комплект поставки должен включать в себя руководство пользователя, диск с драйверами и утилитами и мост CrossFire. Мы видим базовый комплект плюс два переходника для дополнительного питания, HDMI-кабель для подключения к соответствующему монитору, а в качестве бонуса — фирменную наклейку на системный блок.

Упаковка

Установка и драйверы

Конфигурация тестового стенда

  • Компьютеры на базе процессора Intel Core i7-3960X (Socket 2011):
    • 2 процессора Intel Core i7-3960X (o/c 4 ГГц);
    • СО Hydro SeriesT H100i Extreme Performance CPU Cooler;
    • СО Intel Thermal Solution RTS2011LC;
    • системная плата Asus Sabertooth X79 на чипсете Intel X79;
    • системная плата MSI X79A-GD45(8D) на чипсете Intel X79;
    • оперативная память 16 ГБ DDR3 Corsair Vengeance CMZ16GX3M4A1600C9 1600 МГц;
    • жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA2;
    • жесткий диск WD Caviar Blue WD10EZEX 1 TБ SATA2;
    • 2 SSD Corsair Neutron SSD CSSD-N120GB3-BK;
    • 2 блока питания Corsair CMPSU-1200AXEU (1200 Вт);
    • корпус Corsair Obsidian 800D Full-Tower.
  • операционная система Windows 7 64-битная; DirectX 11.1;
  • монитор Dell UltraSharp U3011 (30″);
  • монитор Asus ProArt PA249Q (24″);
  • драйверы AMD версии Catalyst 14.4, Nvidia версии 337.50. VSync отключен.


Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:


Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

В качестве синтетических тестов DirectX 11 мы использовали примеры из пакетов SDK компаний Microsoft и AMD, а также демонстрационную программу Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010). Мы взяли и приложения обоих производителей видеочипов: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain, также известная как Island11.


Синтетические тесты проводились на следующих видеокартах:
  • Radeon R9 280 со стандартными параметрами (далее R9 280)
  • Radeon HD 7970 GHz со стандартными параметрами (далее HD 7970 GHz)
  • Radeon HD 7950 со стандартными параметрами (далее HD 7950)
  • Geforce GTX 770 со стандартными параметрами (далее GTX 770)
  • Geforce GTX 760 со стандартными параметрами (далее GTX 760)


Для сравнительного анализа результатов видеокарты Radeon R9 280 были выбраны именно эти решения по следующим причинам. Radeon HD 7970 GHz и HD 7950 (не Boost!) являются одночиповыми аналогами новой модели AMD из линейки предыдущего поколения, основанными на том же графическом процессоре Tahiti, отличающемся по некоторым характеристикам: количеству функциональных устройств и тактовой частоте. Будет интересно посмотреть, насколько новое решение быстрее HD 7950 и медленнее HD 7970 GHz.

У конкурирующей компании Nvidia для нашего сравнения мы также выбрали две видеоплаты, основанные на одном и том же графическом процессоре GK104, с разным количеством активных блоков. Geforce GTX 760 является игровым решением из этого же ценового диапазона, являющимся прямым конкурентом новинки AMD и имеющим аналогичную рекомендованную цену. А GTX 770 — это решение уже более высокого уровня, которое и стоит дороже, и дает более высокую производительность — вот мы и узнаем, насколько.


Direct3D 9: тесты Pixel Shaders

Тесты текстурирования и заполнения (филлрейта) из пакета 3DMark Vantage мы рассмотрим ниже, а первая группа пиксельных шейдеров, которую мы используем, включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся разве что в старых играх, очень простых для современных видеочипов.

Все современные GPU с этими тестами справляются с легкостью, и производительность даже слабых решений упирается в различные ограничители производительности, не говоря уже о более мощных платах. Эти тесты не способны показать возможности современных видеочипов, и интересны лишь с точки зрения устаревших игровых приложений.

Производительность современных видеокарт в этих задачах ограничена скоростью текстурирования или филлрейта, и в данном случае можно сказать лишь то, что вышедшая в марте видеокарта AMD Radeon R9 280 в этом сравнении уступает только HD 7970 GHz и заметно опережает оригинальную версию Radeon HD 7950. То же самое касается и прямого конкурента в виде Geforce GTX 760, плата AMD явно быстрее в подобных задачах. Посмотрим на результаты более сложных пиксельных программ промежуточных версий:

Тест Cook-Torrance более вычислительно интенсивный, и скорость в нем зависит почти исключительно от количества ALU и их частоты, а также и от скорости TMU. В этом тесте R9 280 не так уж сильно ушла вперед от обычной модели HD 7950 и обе они весьма далеки от HD 7970 GHz.

А вот в тесте Water, скорость в котором больше зависит от текстурирования, новинка отработала чуть лучше, показав прирост в 24%, по сравнению с Radeon HD 7950. Новая модель снова уступила только лидеру в этом тесте, опередив и конкурента со стороны Nvidia, хоть и не слишком сильно. Эти тесты все же лучше подходят для графических решений компании AMD, но новые платы Geforce на базе чипов архитектур Kepler и Maxwell в нем также показывают неплохие результаты.

Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье «Современная терминология 3D-графики».
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

Существует два варианта этих шейдеров: с ориентацией на математические вычисления и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это — универсальные тесты, производительность в которых зависит и от скорости блоков ALU, и от скорости текстурирования, также в них важен общий баланс чипа и эффективность исполнения вычислительных программ. Прошлые наши исследования показывают, что в этих конкретных задачах архитектура AMD GCN выступает значительно лучше графических архитектур Nvidia.

Так и получилось, особенно в тесте «Frozen Glass», где скорость больше зависит от математической производительности. Но даже в тесте «Parallax Mapping» новая видеокарта Radeon показала производительность выше, чем конкурирующая Geforce GTX 760. По сравнению с платами AMD на модификациях чипа Tahiti, мартовская новинка чуть ближе к HD 7950, чем к HD 7970 GHz, что особенно заметно в тесте параллаксмаппинга. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:

Особых изменений не произошло, Radeon R9 280 все так же работает ощутимо быстрее HD 7950, но заметно медленнее HD 7970 GHz, снова ставшей лучшей в сравнении. Любопытна разница в скорости между HD 7950 и R9 280 между тестами — в Frozen Glass она куда выше. Что касается соперничества с Geforce GTX 760, то в данном случае у платы AMD есть явное преимущество в одном из тестов и платы идут почти наравне во втором. В любом случае, в среднем снова побеждает Radeon.

Переходим к другим тестам пиксельных шейдеров, уже версии 3.0 — самым сложным из наших тестов пиксельных шейдеров для Direct3D 9. Они более показательны с точки зрения современных игр на ПК, среди которых много мультиплатформенных. Тесты отличаются тем, что сильно нагружают и ALU, и текстурные модули, обе шейдерные программы сложны и длинны и включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье «Современная терминология 3D-графики».
  • Fur — процедурный шейдер, визуализирующий мех.

Эти тесты уже не ограничены производительностью только текстурных выборок или филлрейтом и скорость в них более всего зависит от эффективности исполнения сложного шейдерного кода. В самых тяжелых DX9-тестах из первой версии пакета RightMark видеокарты производства Nvidia в прошлые годы были несколько сильнее, но архитектура GCN помогла видеокартам AMD вырваться вперед, особенно после тщательной доводки драйверов Catalyst.

Новинка от компании AMD показывает в этих задачах неплохой результат, если сравнивать ее скорость с Radeon HD 7950. В обоих тестах новинка примерно на 20% быстрее своего древнего аналога. И естественно, что обе они прилично уступают HD 7970 GHz, основанной на полноценном чипе Tahiti и работающей на более высокой частоте. Если же сравнивать свежую модель AMD с конкурентом от Nvidia, то новый Radeon все так же уверенно обходит Geforce.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два уже знакомых нам теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также еще два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нем используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в этом тесте зависит от количества и эффективности блоков TMU, влияет и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает еще и эффективный филлрейт и пропускная способность памяти. Результаты при детализации уровня «High» получаются до полутора раза ниже, чем при «Low».

В задачах процедурной визуализации меха с большим количеством текстурных выборок, в последних поколениях графических архитектур компания AMD сократила разницу с платами Nvidia, а с выпуском видеочипов на базе архитектуры GCN даже вырвалась вперед, и теперь именно платы Radeon являются лидерами в этих сравнениях, что говорит о заметно более высокой эффективности выполнения ими данных программ.

Видеоплата модели Radeon R9 280 явно побыстрее аналога из предыдущего поколения (Radeon HD 7950) — на 12-16%. Но от более мощной HD 7970 GHz она отстает еще больше. Новинка опережает и обе соперничающие видеокарты от конкурента, так что для Nvidia в этих тестах все очень печально, ведь даже более мощная и дорогая Geforce GTX 770 отстает от новой среднебюджетной модели Radeon.

Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: возможно, в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

В таких условиях новая модель Radeon R9 280 опережает своего аналога из предыдущего поколения — устаревшую Radeon HD 7950 — уже лишь на 7%, а HD 7970 GHz еще дальше впереди. Преимущество над конкурентами в виде Geforce GTX 770 и GTX 760 лишь упрочилось — превосходство в подобных вычислениях явно у чипов компании AMD, предпочитающих попиксельные вычисления.

Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип еще примерно в два раза — такой режим называется «High».

Диаграмма в целом похожа на предыдущую, также без включения SSAA, и в этот раз новая Radeon R9 280 показала скорость уже на 10-13% выше, чем у Radeon HD 7950. Также она продолжает ощутимо отставать от Radeon HD 7970 GHz. Но если брать сравнение с видеокартами Nvidia, то и в этом случае новинка опережает даже Geforce GTX 770. Платы Nvidia в этом тесте снова справляются с работой заметно хуже конкурирующих решений AMD. Посмотрим, что изменит включение суперсэмплинга:

И в этот раз мало что изменилось. При включении суперсэмплинга и самозатенения задача получается еще более тяжелой и совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьезное падение производительности. Разница между скоростными показателями протестированных видеокарт изменилась слабо, а включение суперсэмплинга сказывается меньше, чем в предыдущем случае.

И снова мы видим, что графические решения Radeon в наших D3D10-тестах пиксельных шейдеров работают более эффективно, по сравнению с конкурирующими Geforce. Поэтому новая плата на урезанном чипе Tahiti неплохую скорость, снова опередив даже старшую из конкурирующих плат Nvidia. А вот если сравнивать с Radeon HD 7950, то преимущество новинки растаяло до 6-7%, а HD 7970 GHz «улетела» вперед еще дальше.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты предельных математических тестов чаще всего лишь примерно соответствуют разнице по частотам и количеству вычислительных блоков, а на результаты также влияет и разная эффективность их использования в конкретных решениях, равно как и оптимизация драйверов. В случае теста Mineral, новая модель Radeon R9 280 оказалась на 16% быстрее своего аналога из предыдущего поколения (HD 7950), что обусловлено достаточно высокой Boost-частотой.

Более мощной плате из предыдущего поколения новинка уступила, конечно же, но это не так уж важно. Зато сравнение с платами Nvidia в очередной раз показало сильные стороны архитектуры AMD, так как она в таких тестах всегда имеет значительное преимущество перед конкурирующими решениями калифорнийцев. В математических тестах конкурирующая с новинкой по цене видеокарта Geforce достаточно сильно уступила новинке от компании AMD, и даже более дорогая GTX 770 вырвалась вперед не так уж далеко.

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нем только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Во втором математическом тесте мы видим несколько иные результаты видеокарт относительно друг друга. Так, разница между Radeon R9 280 и HD 7950 в этом тесте уже ниже — лишь 12%. А от Radeon HD 7970 GHz новинка отстала довольно серьезно. Преимущество более дорогой видеокарты от компании Nvidia снизилось, и теперь даже GTX 770 показала скорость почти на уровне новой модели Radeon. Не говоря уже о GTX 760, заметно уступившей новинке. В общем, с тестами пиковой математической производительности все как обычно — видеочипы Nvidia до сих пор сильно отстают.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трех уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаковое для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близкое к двукратному. Задача эта для современных видеокарт не слишком сложная, и производительность в ней ограничена скоростью обработки геометрии, а иногда — пропускной способностью памяти.

Заметна разница и между результатами видеокарт на чипах Nvidia и AMD, которая обусловлена отличиями в геометрических конвейерах чипов этих компаний. Если в предыдущих тестах с пиксельными шейдерами платы AMD были заметно эффективнее и быстрее, то тесты геометрии показывают, что в таких задачах платы Nvidia оказываются заметно производительнее.

Мартовская новинка Radeon R9 280 основана на чипе Tahiti, который имеет некоторые оптимизации геометрического конвейера, и он не слишком уступает мощному варианту платы прошлого поколения. Ну а HD 7950 отстала от новинки на 15-20%. А вот у видеокарт Geforce с геометрической производительностью дело всегда обстоит лучше, поэтому обе они оказываются быстрее. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры слегка улучшились и для плат AMD и для решений Nvidia. Видеокарты в этом тесте геометрических шейдеров слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, поэтому и выводы остаются прежними. Новинка Radeon R9 280 быстрее аналогичной модели прошлого поколения на 13-18%, и несколько медленнее, чем HD 7970 GHz. И в остальном в выводах ничего не изменилось, обе платы Geforce заметно быстрее — до полутора раз.

К сожалению, «Hyperlight» — наш второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load, в котором используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output, на всех современных видеокартах компании AMD просто не работает. В какой-то момент очередное обновление драйверов Catalyst привело к тому, что данный тест перестал запускаться на платах этой компании, и эта ошибка (?) не исправлена вот уже несколько лет.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Наши предыдущие исследования показали, что на результаты этого теста может влиять и филлрейт и пропускная способность памяти, что особенно заметно в легком режиме. Результаты новой видеокарты компании AMD лежат примерно посередине между скоростями решений предыдущего поколения на чипе Tahiti: Radeon HD 7950 и HD 7970 GHz. Обе представленные в сравнении платы Nvidia превосходят результаты новинки, но посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Ситуация на диаграмме немного изменилась — решения компании AMD в тяжелых режимах потеряли несколько больше, чем Geforce. Новая видеоплата Radeon R9 280 опережает младшую из плат предыдущего поколения на 4-24%, а старшая Radeon HD 7970 GHz впереди обеих. Впрочем, обе представленные на диаграмме Geforce еще быстрее.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нем используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты во втором тесте вершинного текстурирования «Waves» в чем-то схожи с теми, что мы видели на предыдущих диаграммах, но скоростные показатели новой платы во всех режимах уже куда ближе к конкурентам. Новая модель быстрее Radeon HD 7950 до 30%, а старшая HD 7970 GHz еще быстрее. Если сравнивать новинку с платами Nvidia, то она в среднем чуть быстрее прямого конкурента Geforce GTX 760 и уступает в тяжелом режиме GTX 770. Рассмотрим второй вариант этого же теста:

С усложнением задачи во втором тесте текстурных выборок скорость всех решений стала ниже, и больше пострадали видеокарты Geforce. Новая модель Radeon R9 280 оказывается почти на уровне GTX 770, а прямого конкурента она обгоняет. Если сравнивать новинку с HD 7950 и HD 7970 GHz, то тут все так же — она ровно посередине между ними по скорости рендеринга в этом тесте.

3DMark Vantage: тесты Feature

Синтетические тесты из пакета 3DMark Vantage покажут нам то, что мы ранее упустили. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10 и интересны тем, что отличаются от наших и до сих пор актуальны. При анализе результатов свежей видеокарты Radeon R9 280 в этом пакете мы сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark.

Feature Test 1: Texture Fill

Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Эффективность видеокарт AMD и Nvidia в текстурном тесте компании Futuremark достаточно высока и итоговые цифры разных моделей обычно близки к соответствующим теоретическим параметрам. Разница в скорости между моделями нового и предыдущего поколения, созданными на основе урезанных графических процессоров Tahiti равна 8%, что несколько ниже ожидаемого. Новая модель из семейства Radeon R9 по скорости текстурирования серьезно уступает HD 7970 GHz, так что она явно ближе к урезанному аналогу.

Что касается сравнения скорости платы Radeon R9 280 с решениями конкурента, то новинка AMD по текстурной скорости обгоняет прямого конкурента в лице Geforce GTX 760, но уступает старшей GTX 770, близкой к уровню HD 7970 GHz. Тут нужно учитывать, что GTX 770 заметно дороже, и не является прямым конкурентом для рассматриваемой модели Radeon.

Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Цифры второго подтеста 3DMark Vantage показывают производительность блоков ROP с учетом величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), и тест измеряет или пропускную способность или производительность ROP. Результат у выпущенной сегодня видеоплаты AMD получился даже чуть (меньше погрешности измерений) ниже, чем у аналогичной карты предыдущего поколения. Старшая модель Radeon HD 7970 GHz снова впереди, но в этот раз уже не столь ощутимо.

Если сравнивать скорость заполнения сцены видеокартой Radeon R9 280 с видеокартами Nvidia, то рассматриваемая нами сегодня модель AMD показала в этом тесте почти такую же скорость заполнения сцены, что и конкурирующая с ней по цене Geforce GTX 760, ну и GTX 770 вполне ожидаемо стала лидером сравнения в целом — она же и дороже всех.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.

Этот тест пакета 3DMark Vantage отличается от проведенных нами ранее тем, что результаты в нем зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен верный баланс GPU, а также эффективность выполнения сложных шейдеров.

В данном случае, важны и математическая и текстурная производительность, поэтому в этой «синтетике» из 3DMark Vantage новая плата Radeon R9 280 не оказалась быстрее своей предшественницы на том же чипе с близкими характеристиками. Новинка даже уступила ей 3% скорости, что трудно объяснить теорией.

Интересно, что новинка с огромным запасом обгоняет своего прямого конкурента от Nvidia и показывает результат почти на одном уровне с более дорогой GTX 770, так как графические процессоры производства компании AMD являются более эффективными в этой задаче. В качестве ложки дегтя — Radeon HD 7970 GHz слишком далеко впереди.

Feature Test 4: GPU Cloth

Четвертый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте по идее также должна зависеть сразу от нескольких параметров, а основными факторами влияния должны являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. И тут новая среднебюджетная модель из семейства Radeon R9 показала скорость более чем вдвое выше, чем Radeon HD 7950, но это объясняется тестированием последней со старыми драйверами. Впрочем, HD 7970 GHz тоже не ушла слишком далеко от новинки, что не может не радовать.

К слову, несмотря на большее количество соответствующих исполнительных блоков и большую геометрическую производительность видеокарт Nvidia, по сравнению с конкурирующими решениями, обе платы Geforce уступили новой плате Radeon, что снова довольно трудно объяснить с точки зрения теории. Вероятно, что все дело в соответствующих программных оптимизациях.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.

Во втором геометрическом тесте из 3DMark Vantage ситуация изменилась, но и в этот раз новая Radeon R9 280 оказалась значительно производительнее своей предшественницы из предыдущего поколения Radeon 7000. Да и HD 7970 GHz снова недалеко впереди. Вероятно, в этом тесте наблюдается упор не только в геометрическую производительность, а производительность ROP или (что логичнее) пропускную способность видеопамяти.

Если сравнивать новинку с конкурирующими видеокартами от Nvidia, то она показала скорость, близкую к производительности своего прямого конкурента Geforce GTX 760, уступив только более дорогой и мощной GTX 770. Для платы на чипе AMD это очень неплохой результат, ведь ранее в синтетических тестах имитации тканей и частиц из тестового пакета 3DMark Vantage, в которых активно используются геометрические шейдеры, платы Nvidia заметно опережали конкурирующие с ними модели.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических вычислений.

В математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы видим почти такое же распределение результатов, как и в двух аналогичных тестах нашего тестового пакета. В этом случае производительность решений не совсем соответствует теории, но близка к тому, что мы видели в математических тестах и ранее.

Видеокарты Radeon компании AMD, созданные на базе чипов архитектуры GCN, очень хорошо справляются с подобными задачами и показывают отличные результаты в случаях, когда выполняется интенсивная «математика». Неудивительно, что новая модель Radeon R9 280 в этом тесте показала результат почти на уровне Geforce GTX 770, заметно обойдя соперничающую по цене GTX 760. Правда, вышедшая в начале марта видеокарта показала производительность лишь на 6% выше, чем решение прошлого поколения в лице Radeon HD 7950, а HD 7970 GHz вообще оказалась далеко впереди.

Direct3D 11: Вычислительные шейдеры

Чтобы протестировать новое решение компании AMD в задачах, использующих такие свежие возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы воспользовались примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, Nvidia и AMD.

Сначала мы рассмотрим тесты, использующие вычислительные (Compute) шейдеры. Их появление — одно из наиболее важных нововведений в последних версиях DX API, они уже используются в современных играх для выполнения различных задач: постобработки, симуляций и т. п. В первом тесте показан пример HDR-рендеринга с tone mapping из DirectX SDK, с постобработкой, использующей пиксельные и вычислительные шейдеры.

Скорость расчетов в вычислительном и пиксельном шейдерах для всех плат AMD и Nvidia давно уже практически одинакова, хотя у видеокарт с GPU предыдущих архитектур были различия. Судя по нашим предыдущим тестам, результаты в задаче явно зависят не столько от математической мощи и эффективности вычислений, но от других факторов, вроде пропускной способности памяти и производительности ROP.

В данном случае скорость видеокарт упирается в ПСП, и новая плата компании AMD по этому параметру слегка отстает от Radeon HD 7970 GHz (к сожалению, результатов HD 7950 в DirectX 11 тестах нет, и ее частично заменяет HD 7870). Главное, что есть ощутимое превосходство над прямым конкурентом в лице Geforce GTX 760, которую новинка обогнала чуть ли не в полтора раза.

Второй тест вычислительных шейдеров также взят из Microsoft DirectX SDK, в нем показана расчетная задача гравитации N тел (N-body) — симуляция динамической системы частиц, на которую воздействуют физические силы, такие как гравитация.

А вот в этом тесте упор не только в скорость исполнения простых математических вычислений, но и в эффективности выполнения сложного кода с ветвлениями. Во втором DX11-тесте расклад сил между решениями разных компаний оказался иным. Платы Geforce в подобных расчетных задачах всегда весьма неплохо смотрятся, хотя и новые Radeon сносно справляются с ними.

В этом тесте победила единственная видеокарта Nvidia, а Radeon R9 280 оказалась лишь третьей. Даже при том, что ее отставание от Radeon HD 7970 GHz оказалось небольшим в этот раз, мощности не хватило, чтобы достать главного конкурента — Geforce GTX 760.

Direct3D 11: Производительность тесселяции

Вычислительные шейдеры очень важны, но еще одним важным нововведением в Direct3D 11 считается аппаратная тесселяция. Мы очень подробно рассматривали ее в своей теоретической статье про Nvidia GF100. Тесселяцию уже довольно давно начали использовать в DX11-играх, таких как STALKER: Зов Припяти, DiRT 2, Aliens vs Predator, Metro Last Light, Civilization V, Crysis 3, Battlefield 3 и других. В некоторых из них тесселяция используется для моделей персонажей, в других — для имитации реалистичной водной поверхности или ландшафта.

Существует несколько различных схем разбиения графических примитивов (тесселяции). Например, phong tessellation, PN triangles, Catmull-Clark subdivision. Так, схема разбиения PN Triangles используется в STALKER: Зов Припяти, а в Metro 2033 — Phong tessellation. Эти методы сравнительно быстро и просто внедряются в процесс разработки игр и существующие движки, поэтому и стали популярными.

Первым тестом тесселяции будет пример Detail Tessellation из ATI Radeon SDK. В нем реализована не только тесселяция, но и две разные техники попиксельной обработки: простое наложение карт нормалей и parallax occlusion mapping. Что ж, сравним DX11-решения AMD и Nvidia в различных условиях:

В тесте простого бампмаппинга скорость плат AMD чаще всего упирается в какую-то незримую преграду, так как эта задача стала слишком легкой для достаточно мощных решений. Сегодняшний герой обзора — среди лидеров, и уступил только старшей модели предыдущего поколения — HD 7970 GHz. Единственная Geforce в этом подтесте оказалась значительно медленнее.

Во втором подтесте с более сложными попиксельными расчетами новинка уступила Radeon HD 7970 GHz уже куда больше. И преимущество над Geforce GTX 760 никуда не делось, ведь эффективность выполнения таких математических вычислений в пиксельных шейдерах у чипов архитектуры GCN заметно выше, чем у Kepler.

И даже в подтесте с тесселяцией платы AMD выигрывают у единственного представителя лагеря Nvidia — это объясняется тем, что в этом тесте тесселяции разбиение треугольников умеренное и скорость в нем упирается не в производительность блоков обработки геометрии, а все в ту же ПСП. Поэтому чипу архитектуры Kepler просто негде развернуться.

Вторым тестом производительности тесселяции будет еще один пример для 3D-разработчиков из ATI Radeon SDK — PN Triangles. Собственно, оба примера входят также и в состав DX SDK, так что мы уверены, что на их основе создают свой код игровые разработчики. Этот пример мы протестировали с различным коэффициентом разбиения (tessellation factor), чтобы понять, как сильно влияет его изменение на общую производительность.

В этом тесте в самом тяжелом режиме применяется уже более сложная геометрия, поэтому и сравнение геометрической мощи различных решений приносит другие выводы. Все представленные в материале современные решения хорошо справляются с легкой и средней геометрической нагрузкой, показывая достаточно высокую скорость, но в тяжелых условиях графические процессоры Nvidia все-таки оказываются заметно производительнее. Radeon R9 280 в самом сложном режиме серьезно уступает Geforce GTX 760, когда скорость у всех плат AMD сильно падает.

Что касается сравнения плат AMD между собой, то рассматриваемая сегодня модель Radeon R9 280 уступила аналогичной плате на Tahiti из прошлого поколения совсем немного, что можно объяснить меньшей тактовой частотой графического процессора в новом варианте.

Рассмотрим результаты еще одного теста — демонстрационной программы Nvidia Realistic Water Terrain, также известной как Island. В этой демке используется тесселяция и карты смещения (displacement mapping) для рендеринга реалистично выглядящей поверхности океана и ландшафта.

Тест Island не является чисто синтетическим тестом для измерения исключительно геометрической производительности GPU, так как он содержит и сложные пиксельные и вычислительные шейдеры в том числе, и такая нагрузка ближе к реальным играм, в которых используются все блоки GPU, а не только геометрические, как в предыдущих тестах геометрии. Впрочем, основной все равно остается именно нагрузка на блоки обработки геометрии.

Мы тестируем все видеоплаты при четырех разных коэффициентах тесселяции — в данном случае настройка называется Dynamic Tessellation LOD. Если при самом первом коэффициенте разбиения треугольников, когда скорость не ограничена производительностью геометрических блоков, видеокарты Radeon от компании AMD показывают достаточно высокие результаты (Radeon R9 280 почти на уровне Geforce GTX 760), то уже в следующей ступени все они уже не дотягиваются до скорости плат Nvidia. При увеличении геометрической работы платы калифорнийской компании вырываются вперед, а производительность всех Radeon снижается много сильнее.

Но и новинка в лице Radeon R9 280 показывает себя достаточно неплохо, не слишком сильно отставая от более мощной платы Radeon HD 7970 GHz из предыдущего поколения. Понятно, что в сложных условиях представленная в марте видеокарта проигрывает конкурирующей с ней Geforce, но это было ожидаемо. В любом случае, в играх геометрическая нагрузка всегда намного ниже, поэтому можно сделать вывод о том, что возможностей новой видеокарты для них более чем достаточно.


Итак, результаты синтетических тестов представленной в начале марта видеоплаты AMD Radeon R9 280, а также результаты других моделей видеокарт от обоих производителей дискретных видеочипов показали, что рассматриваемая плата по скорости должна быть вполне конкурентоспособна на рынке. Если сравнивать R9 280 с ее главным соперником по цене в виде Geforce GTX 760, то плата AMD почти всегда показывает более высокие результаты в «синтетике», кроме геометрических тестов, разве что.

Соответственно, учитывая то, что в реальных игровых приложениях нагрузка на геометрические блоки всегда не слишком высока, можно сделать такой вывод, что Radeon R9 280 должна оказаться победителем в сражении с Geforce GTX 760 и в игровых тестах. В следующей части нашего материала мы как раз и посмотрим, насколько хорошо Radeon R9 280 справляется с нашим набором игровых приложений.



Средняя текущая цена (количество предложений) в московской рознице:
Рассматриваемые карты Конкуренты
R9 280 — $276(2) HD 7950 — Н/Д(0)
R9 280 — $276(2) GTX 760 — $220 (на 01.11.16)
R9 280 — $276(2) GTX 660 Ti — $309(2)
R9 280 — $276(2) R9 280X — $281 (на 01.08.16)
Sapphire R9 280 Dual-X — Н/Д(0), T-10749440 R9 280 — $276(2)
Предложения Sapphire Radeon R9 280 Dual-X OC Edition
L-10749440-10


Благодарим компанию AMD Russia
и лично Николая Радовского
за предоставленную на тестирование видеокарту

2 блока питания Corsair CMPSU-1200AXEU для тестового стенда предоставлены компанией Corsair

Корпус Corsair Obsidian 800D Full Tower для тестового стенда предоставлен компанией Corsair

Модули памяти Corsair Vengeance CMZ16GX3M4X1600C9 для тестового стенда предоставлены компанией Corsair

Corsair Hydro SeriesT H100i CPU Cooler для тестового стенда предоставлен компанией Corsair

Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт

Системная плата Asus Sabertooth X79 для тестового стенда предоставлена компанией Asustek

Системная плата MSI X79A-GD45(8D) для тестового стенда предоставлена компанией MSI

Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate

Накопитель SSD OCZ Octane 512 ГБ для тестового стенда предоставлен компанией OCZ Russia

2 накопителя SSD Corsair Neutron SeriesT 120 ГБ для тестового стенда предоставлены компанией Corsair

Монитор Asus ProArt PA249Q для рабочего компьютера предоставлен компанией Asustek




Дополнительно

iXBT BRAND 2016

«iXBT Brand 2016» — Выбор читателей в номинации «Процессоры (CPU)»:
Подробнее с условиями участия в розыгрыше можно ознакомиться здесь. Текущие результаты опроса доступны тут.

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.