Видеоускоритель AMD Radeon R7 360

Часть 2: особенности карты, результаты синтетических тестов


Содержание

Данная часть знакомит читателей с особенностями видеокарты, а также с результатами синтетических тестов.

Устройство(а)


Sapphire Nitro R7 360 2048 МБ 128-битной GDDR5 PCI-E
ПараметрЗначениеНоминальное значение (референс)
GPURadeon R7 360 (Tobago/Bonaire)
ИнтерфейсPCI Express x16
Частота работы GPU (ROPs), МГц10601050
Частота работы памяти (физическая (эффективная)), МГц1625 (6500)1625 (6500)
Ширина шины обмена с памятью, бит128
Число вычислительных блоков в GPU12
Число операций (ALU) в блоке64
Суммарное количество блоков ALU768
Число блоков текстурирования (BLF/TLF/ANIS)48
Число блоков растеризации (ROP)16
Размеры, мм175×100×35190×100×35
Количество слотов в системном блоке, занимаемые видеокартой22
Цвет текстолитачерныйчерный
ЭнергопотреблениеПиковое в 3D, Вт9598
В режиме 2D, Вт4151
В режиме «сна», Вт33
Уровень шумаВ режиме 2D, дБА2021
В режиме 2D (просмотр видео), дБА2121,5
В режиме максимального 3D, дБА3335
Выходные гнезда1×DVI (Dual-Link/HDMI), 1×HDMI 1.4a, 1×DisplayPort 1.21×DVI (Dual-Link/HDMI), 1×HDMI 1.4a, 1×DisplayPort 1.2
Поддержка многопроцессорной работыCrossFire
Максимальное количество приемников/мониторов для одновременного вывода изображения33
Дополнительное питание: количество 8-контактных разъемовНетНет
Дополнительное питание: количество 6-контактных разъемов11
Максимальное разрешение 2DDisplay Port4096×2160
HDMI4096×2160
Dual-Link DVI2560×1600
Максимальное разрешение 3DDisplay Port4096×2160
HDMI4096×2160
Dual-Link DVI2560×1600

Комплектация локальной памятью
Карта имеет 2048 МБ памяти GDDR5 SDRAM, размещенной в 4 микросхемах по 4 Гбит на лицевой сторонe PCB.

Микросхемы памяти SK Hynix (GDDR5). Микросхемы рассчитаны на максимальную частоту работы в 1500 (6000) МГц.

Сравнение с эталонным дизайном (reference)
Вид спереди
Sapphire Nitro R7 360 2048 МБ 128-битной GDDR5 PCI-E Reference card AMD Radeon R7 260
Вид сзади
Sapphire Nitro R7 360 2048 МБ 128-битной GDDR5 PCI-E Reference card AMD Radeon R7 260

Поскольку R7 360, так сказать, вышел из R7 260 (ядро, по сути, то же самое), логично будет сравнивать именно с R7 260. Очевидно, что основные отличия карт заключаются в системах питания. У продукта Sapphire схема питания 4+1, управляется цифровым контроллером NCP81174 производства On Semiconductor. В системе питания используются дроссели Sapphire Black Diamond последнего поколения, которые имеют такое название, потому что снабжены радиатором из черного феррита для обеспечения эффективного охлаждения.

Система охлаждения
Видеокарты такого класса не нуждаются в мощном кулере, поэтому перед нами достаточно простое устройство, состоящее из округлого радиатора с ребрами-пластинами и кожуха с одним вентилятором, расположенным прямо над радиатором.

Дизайн кожуха, накрывающего всю карту, выбран, видимо, чисто из эстетических соображений.

Микросхемы памяти не охлаждаются, а силовые транзисторы имеют свой небольшой радиатор.

После 6-часового прогона под нагрузкой максимальная температура GPU не превысила 69 градусов, что очень даже удовлетворительно для такого рода видеокарт.
Мониторинг температурного режима с помощью MSI Afterburner (автор А. Николайчук AKA Unwinder)

Методика измерения шума

  • Помещение шумоизолировано и заглушено, снижены реверберации.
  • Системный блок, в котором исследовался шум видеокарт, не имеет вентиляторов, не является источником механического шума.
  • Фоновый уровень 20 дБА — это уровень шума в комнате и уровень шумов собственно шумомера.
  • Измерения проводились на расстоянии 50 см от видеокарты на уровне системы охлаждения.
  • Режимы измерения:
    1. Режим простоя в 2D: загружен интернет-браузер с сайтом iXBT.com, окно Microsoft Word, ряд интернет-коммуникаторов.
    2. Режим 2D с просмотром фильмов: используется SmoothVideo Project (SVP) — аппаратное декодирование со вставкой промежуточных кадров.
    3. Режим 3D с максимальной нагрузкой на ускоритель: используется тест FurMark.

В режиме простоя в 2D вентилятор работал на частоте 380 оборотов в минуту, при этом температура графического ядра не поднималась выше 36 градусов, а шум был равен фоновому.

При просмотре фильма с аппаратным декодированием температура графического ядра медленно вырастала до 53 градусов, вентилятор работал на частоте вращения 700 оборотов в минуту, шум оставался близким к фоновому.

В режиме максимальной нагрузки в 3D температура достигала уровня 69 °C, частота вращения вентилятора поднималась до 1485 оборотов в минуту, шум вырастал до 33 дБА. СО можно отнести к не слишком шумным.

Термоснимок



Хорошо видно, что наиболее нагретых областей — две: в районе GPU и преобразователей напряжения.


Комплектация
Базовый комплект поставки должен включать в себя руководство пользователя, диск с драйверами и утилитами. Мы видим базовый комплект плюс адаптер DVI-to-VGA и фирменную наклейку.

Упаковка

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

В качестве синтетических тестов DirectX 11 мы использовали примеры из пакетов SDK компаний Microsoft и AMD, а также демонстрационную программу Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010). Мы взяли и приложения обоих производителей видеочипов: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain, также известная, как Island11.

Синтетические тесты проводились на следующих видеокартах:

  • Radeon R7 360 со стандартными параметрами (сокращенно R7 360)
  • Radeon R7 260X со стандартными параметрами (сокращенно R7 260X)
  • Radeon R7 260 со стандартными параметрами (сокращенно R7 260)
  • GeForce GTX 750 Ti со стандартными параметрами (сокращенно GTX 750 Ti)
  • GeForce GTX 750 со стандартными параметрами (сокращенно GTX 750)

Для анализа производительности бюджетной видеокарты AMD Radeon R7 360 мы выбрали эти решения по следующим причинам. Видеокарты моделей Radeon R7 260 и R7 260X взяты в сравнение потому, что они основаны на таком же графическом процессоре, но вышли в рамках предыдущей серии Radeon 200. Модель R7 260 имеет схожие с новинкой характеристики по количеству активных блоков в GPU и отличается только несколько меньшей тактовой частотой видеочипа и GDDR5-памяти. Ну а видеокарта Radeon R7 260X интересна как старшее по позиционированию решение компании AMD из предыдущей линейки — посмотрим, насколько новинка медленнее его.

Из решений конкурирующей компании Nvidia мы взяли пару видеокарт GeForce из этого же ценового сегмента. Более слабая GeForce GTX 750 является прямым соперником для AMD Radeon R7 360 по цене и позиционированию, и мы как раз узнаем, кто из них быстрее. Ну а GeForce GTX 750 Ti интересна потому, что эта несколько более мощная и дорогая видеокарта близка по производительности уже к Radeon R7 370 — следующей модели в линейке AMD, и сравнение с ней также будет любопытным.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два теста PS 3.0, знакомых по ранним Direct3D 9 бенчмаркам, которые были переписаны под DirectX 10, а также еще два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нем используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность видеокарт в этом тесте зависит от количества и эффективности блоков TMU, влияет на результат также и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает еще и эффективный филлрейт и пропускная способность памяти. Результаты при детализации уровня «High» получаются до полутора раза ниже, чем при «Low», в зависимости от модели видеокарты.

В задачах процедурной визуализации меха с большим количеством текстурных выборок, компания AMD перехватила лидерство еще с выпуском самых первых видеочипов на базе архитектуры GCN, и платы семейства Radeon 300 на сегодняшний день являются лучшими в этих сравнениях, что говорит о высокой эффективности выполнения ими этих программ.

В первом Direct3D 10 тесте новая бюджетная видеоплата оказалась чуть медленнее своего аналога из прошлой линейки AMD, что сложно объяснить теоретическими показателями, ведь она должна была показать скорость даже чуть выше. Скорее всего, это связано с изменениями в оптимизации современных версий драйверов. Также Radeon R7 360 в этом тесте уступила и старшей модели прошлой серии, но обе GeForce остались позади: и прямой конкурент GTX 750 и даже более дорогая модель GTX 750 Ti.

Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: в такой ситуации что-то может измениться:

В усложненных условиях видеокарта модели Radeon R7 360 уже не отстает от R7 260, и в одном из режимов даже опережает ее — похоже, что свежие версии драйверов лучше оптимизированы на более тяжелую нагрузку. Отставание от Radeon R7 260X не слишком большое, да и обоих конкурентов в виде GeForce GTX 750 и GTX 750 Ti новинка в этот раз опережает еще больше. В общем, мы еще раз убедились, что все графические процессоры компании AMD в подобных вычислениях весьма сильны.

Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis, Lost Planet и многих других. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип еще примерно в два раза — такой режим называется «High».

Диаграмма в целом схожа с предыдущей, также без включения суперсэмплинга, и в этот раз новая Radeon R7 360 оказалась чуть медленнее аналогичной R7 260 из предыдущей серии. Если рассматривать ее сравнение с обеими видеокартами GeForce, то в этом тесте плата на урезанном чипе Tobago также выступает быстрее обеих представленных моделей текущего поколения компании Nvidia, включая старшую GeForce GTX 750 Ti, имеющую более высокую цену. Посмотрим, что изменит включение суперсэмплинга:

При включении суперсэмплинга и самозатенения задача становится тяжелее, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьезное падение производительности — особенно на видеокартах Nvidia GeForce. Разница между скоростными показателями протестированных видеокарт немного изменилась, хотя включение суперсэмплинга сказывается меньше, чем в предыдущем случае.

Графические решения AMD Radeon и в этом D3D10-тесте пиксельных шейдеров работают явно эффективнее конкурирующих плат GeForce. В этот раз видеоплата на базе графического процессора Tobago все так же серьезно опережает GeForce GTX 750 и GTX 750 Ti в обоих режимах. Новая модель Radeon в этих условиях примерно равна по скорости видеокарте на основе чипа Bonaire — аналогичной по своим характеристикам. Ну и Radeon R7 260X оказалась лишь чуть быстрее рассматриваемой модели, как и должно быть.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты предельных математических тестов чаще всего соответствуют разнице по частотам и количеству вычислительных блоков, но лишь примерно, так как на результаты влияет и разная эффективность их использования в конкретных задачах, и оптимизация драйверов, и новейшие системы управления частотами и питанием, и даже упор в ПСП. В случае теста Mineral, новая модель бюджетной видеокарты из серии Radeon R7 300 снова отстала от своего аналога из серии R7 260, что сложно объяснить теорией, ведь она должна быть чуть быстрее.

Сравнение Radeon R7 360 с платами GeForce в этом тесте также приносит не совсем ожидаемые выводы. Обновление архитектуры Nvidia с Kepler до Maxwell (пусть и первого поколения в случае графического процессора GM107) привело к тому, что новые чипы калифорнийской компании в таких тестах приблизились к конкурирующим решениям AMD или даже обогнали их. В этом сравнении, модели производства компании Nvidia показали высокую скорость, и хотя прямой конкурент в виде модели GeForce GTX 750 уступил новинке AMD, но это отставание совсем небольшое. Да и по сравнению R7 260X и GTX 750 Ti видно, что времена, когда решения AMD были в разы сильнее в таких тестах, уже прошли.

Впрочем, рассмотрим еще один тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нем только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Действительно, во втором математическом тесте из нашего пакета RigthMark мы видим уже несколько иные результаты видеокарт относительно друг друга, особенно это касается сравнения решений AMD и Nvidia. Новая модель Radeon R7 360 и в этот раз оказалась чуть медленнее Radeon R7 260, основанной фактически на таком же графическом чипе, работающем даже на меньшей частоте, да и более дорогой R7 260X уступила довольно много.

Впрочем, зато Radeon R7 360 оказалась заметно быстрее своего прямого ценового конкурента в виде младшей из представленных видеокарт GeForce, хотя более дорогой плате модели GeForce GTX 750 Ti новинка и немного проиграла. В общем, хотя с выпуском графических процессоров архитектуры Maxwell, компания Nvidia и совершила приличный скачок по математической производительности, отыграть отставание от бюджетных конкурентов AMD полностью им не удалось, и Radeon R7 360 явно быстрее, чем GeForce GTX 750.

Direct3D 10: тесты геометрических шейдеров

В составе пакета RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трех уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близкое к двукратному. Задача эта для мощных современных видеокарт очень простая, и производительность в ней ограничена скоростью обработки геометрии, а иногда и пропускной способностью памяти и/или филлрейтом.

Разница между результатами видеокарт на чипах AMD и Nvidia наблюдается явно в пользу решений калифорнийской компании, и, скорее всего, она обусловлена отличиями в геометрических конвейерах чипов этих компаний. В тестах геометрии платы GeForce всегда конкурентоспособнее Radeon, и в данном случае хорошо видно, что видеочипы Nvidia имеют заметное преимущество.

Бюджетная модель Radeon R7 360, основанная на графическом процессоре Tobago, в геометрическом тесте показала себя на уровне Radeon R7 260 и R7 260X, что неудивительно, так как все они основаны фактически на одном и том же GPU (Tobago — Bonaire). А вот сравнение с конкурентом куда менее радостное — все Radeon отстают и от GeForce GTX 750 и от GTX 750 Ti. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры изменились незначительно и для плат AMD и для решений Nvidia, поэтому ничего особенно не меняется, в том числе и наши выводы. Видеокарты в этом тесте геометрических шейдеров слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, поэтому победители и проигравшие остаются неизменными.

К сожалению, «Hyperlight» — второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load, в котором используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output, на всех современных видеокартах компании AMD просто не работает. В какой-то момент очередное обновление драйверов Catalyst привело к тому, что данный тест перестал запускаться на платах этой компании.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Наши предыдущие исследования показали, что на результаты этого теста может влиять и филлрейт и пропускная способность памяти. Удивительно, но новая бюджетная модель компании AMD в этом тесте оказалась медленнее всех, в том числе и по отношению к аналогичной плате из предыдущего поколения в виде Radeon R7 260, серьезно уступив ей, что абсолютно не соответствует теории. Похоже, что новые версии драйверов компании в этом конкретном тесте потеряли какие-то специфические оптимизации, поэтому мы и видим серьезное падение производительности.

Посмотрим на производительность представленных в сравнении видеокарт в этом же тесте, но с увеличенным количеством текстурных выборок — может быть там результат будет вменяемым:

Ситуация на диаграмме мало изменилась, бюджетное решение компании AMD в виде Radeon R7 360 явно страдает от недостатка программной оптимизации в современных драйверах, так как ничем другим объяснить его отставание от R7 260 просто не получится. Остается надежда на следующий тест вершинного текстурирования.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нем используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Увы, результаты Radeon R7 360 и во втором тесте вершинного текстурирования «Waves» явно не соответствуют истинному положению дел, хотя и улучшились для новинки. Впрочем, скоростные показатели плат GeForce в этом тесте довольно слабы, и новая модель AMD в сложных условиях даже с учетом плохой программной оптимизации оказывается быстрее своего прямого соперника в виде GeForce GTX 750. Рассмотрим усложненный вариант этой же задачи:

С усложнением задачи во втором тесте текстурных выборок скорость всех решений стала ниже, а видеокарты Nvidia пострадали сильнее. Но в наших выводах мало что меняется по причине того, что новая плата модели Radeon R7 360 явно не показывает имеющейся у нее производительности из-за недоработок в тестовой версии драйверов. Хотя даже в этом случае новинка AMD оказалась быстрее своего прямого конкурента GeForce GTX 750.

3DMark Vantage: тесты графических возможностей

Синтетические тесты из пакета 3DMark Vantage покажут нам то, что мы ранее упустили. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10, до сих пор актуальны и интересны тем, что отличаются от наших. При анализе результатов видеокарты модели Radeon R7 360 в этом пакете мы сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark.

Feature Test 1: Texture Fill

Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Эффективность видеокарт AMD и Nvidia в текстурном тесте компании Futuremark достаточно высока и итоговые цифры разных моделей близки к соответствующим теоретическим параметрам. Разница в скорости между Radeon R7 360 и R7 260 в этот раз получилась около 6% уже в пользу решения на базе обновленного чипа Tobago, что близко к теории, учитывающей разницу в рабочих частотах. Новая плата также уступила Radeon R7 260X из прошлого поколения по понятным причинам.

Что касается сравнения скорости текстурирования рассматриваемой видеоплаты компании AMD с представленными на диаграмме решениями конкурента, новинка оказалась быстрее пары видеокарт GeForce. Даже GeForce GTX 750 Ti по скорости текстурирования не смог достать Radeon R7 360, не говоря уже о ценовом конкуренте в лице GTX 750, который в полтора раза отстает от бюджетной платы AMD — с текстурированием видеокарты Radeon справляются заметно лучше плат Nvidia.

Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Значения производительности во втором подтесте 3DMark Vantage показывают скорость блоков ROP без учета величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), и тест измеряет именно производительность этой подсистемы. Рассматриваемая нами сегодня плата Radeon R7 360 оказалась на одном уровне с моделью Radeon R7 260X, основанной на полноценном чипе Bonaire, так как они имеют одинаковое количество и эффективность работы блоков ROP. А вот аналогичная модель R7 260 немного им уступила именно из-за меньшей частоты GPU.

Если сравнивать скорость заполнения сцены новой видеокартой Radeon R7 360 с показателями видеокарт компании Nvidia, то можно отметить, что все рассматриваемые сегодня платы AMD в этом тесте показывают худшую скорость заполнения сцены по сравнению с любой из пары видеокарт GeForce. Даже прямой ценовой конкурент новинки обходит все Radeon, не говоря о более дорогой модели GTX 750 Ti, являющейся конкурентом уже скорее для Radeon R7 370.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.

Этот тест из пакета 3DMark Vantage отличается от проведенных нами ранее тем, что результаты в нем зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен верный баланс GPU, а также эффективность выполнения сложных шейдеров.

В данном случае важны и математическая и текстурная производительность, и в этой «синтетике» из 3DMark Vantage новая плата Radeon R7 360 оказалась по скорости примерно между моделями R7 260 и R7 260X, основанными на графическом процессоре Bonaire, но в разных конфигурациях. Интересно, что новинка в этом тесте на целых 10% быстрее аналогичной платы R7 260, что больше теоретической разницы в частотах (скорости TMU и ALU).

Скорее всего, на ее результате сказалась еще и лучшая программная оптимизация. Неудивительно, что новая бюджетная плата AMD в этом тесте показала результат лучше обеих плат Nvidia, которые отстали даже от Radeon R7 260.

Feature Test 4: GPU Cloth

Четвертый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте также зависит сразу от нескольких параметров, но основными факторами влияния в этот раз должны являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. То есть, сильные стороны решений GeForce должны были проявиться, но мы снова отмечаем странный результат, когда видеокарты Nvidia серьезно уступают в этом подтесте всем решениям AMD. Последние, к слову, также показали близкие цифры. Разница между Radeon R7 360 и R7 260 в этот раз составила 7%, что более-менее соответствует теории.

Сравнение с платами GeForce в этом тесте для бюджетной Radeon приятное — несмотря на теоретически меньшее количество геометрических исполнительных блоков и отставание по геометрической производительности чипов AMD, по сравнению с конкурирующими решениями, все платы Radeon в этом тесте работают эффективнее и обгоняют все видеокарты GeForce, представленные в сравнении. Так, прямой конкурент GeForce GTX 750 оказался почти вдвое медленнее рассматриваемой сегодня видеокарты AMD.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.

Во втором «геометрическом» тесте из 3DMark Vantage ситуация совсем другая, хотя и она довольно далека от того, что должно быть по теории. В этот раз рассматриваемая сегодня бюджетная плата Radeon R7 360 оказалась на 3% быстрее Radeon R7 260, уступив старшей R7 260X совсем чуть-чуть — скорость явно ограничена геометрической производительностью.

Любопытно сравнение новинки AMD с парой видеокарт компании Nvidia в этот раз. Оно уже не такое, как было в прошлый раз, когда Radeon R7 360 разгромила обе GeForce. В этом тесте новинка показала результат на 3% лучше своей предшественницы R7 260 и немного уступила R7 260X на основе полноценного чипа Bonaire. Скорость рассматриваемой модели Radeon в этот раз полностью совпала с производительностью прямого конкурента GeForce GTX 750, хотя старшая и дорогая GTX 750 Ti убежала далеко вперед.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических вычислений.

В случае рассматриваемого тесте, производительность решений не совсем соответствует теории, хотя и близка к тому, что мы видели в аналогичных тестах. В математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы видим распределение результатов, сильно отличающееся по сравнению со схожими тестами из нашего тестового пакета.

Мы знаем, что видеочипы компании AMD с архитектурой GCN справляются с задачами лучше решений конкурента в тех случаях, когда выполняется интенсивная «математика», касается это и данного подтеста из Vantage. Лишь старшая модель компании Nvidia, основанная на полноценном графическом процессоре GM107, подтянулась к решениям конкурента, а прямой ценовой соперник сегодняшней новинки отстал от всех плат Radeon довольно серьезно. Плата Radeon R7 360 показала скорость явно выше, чем у GeForce GTX 750, да и GTX 750 Ti.

Direct3D 11: Вычислительные шейдеры

Чтобы протестировать бюджетное решение компании AMD из нового семейства в задачах, использующих такие возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы воспользовались примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, Nvidia и AMD.

Сначала мы рассмотрим тесты, использующие вычислительные шейдеры. Их появление — одно из наиболее важных нововведений в последних версиях DX API, они уже используются в современных играх для выполнения различных задач: постобработки, симуляций и т. п. В первом тесте показан пример HDR-рендеринга с tone mapping из DirectX SDK, с постобработкой, использующей пиксельные и вычислительные шейдеры.

Сравнительная скорость расчетов в вычислительном и пиксельном шейдерах для всех плат AMD и Nvidia приблизительно одинаковая, хотя у видеокарт на основе GPU предыдущих архитектур наблюдались некоторые отличия. Судя по нашим предыдущим тестам, результаты в задаче часто зависят не столько от математической мощи и эффективности вычислений, сколько от других факторов, вроде пропускной способности памяти и эффективности блоков ROP.

В данном случае, вышедшая в июне недорогая видеокарта AMD показала скорость выше всех остальных решений в сравнении. Она обошла обе платы GeForce конкурента, а также пару Radeon на практически том же видеочипе. Впрочем, разница между Radeon R7 360 и R7 260(X) объясняется скорее появившимися оптимизациями в современном драйвере, чем скоростными показателями видеокарт AMD. Но платы Nvidia новинка обгоняет честно, причем прямой ценовой конкурент в виде GeForce GTX 750 отстает очень сильно.

Переходим ко второму тесту вычислительных шейдеров, который также взят из Microsoft DirectX SDK. В нем показана расчетная задача гравитации N тел (N-body) — симуляция динамической системы частиц, на которую воздействуют такие физические силы, как гравитация.

Во втором тесте раздела чаще всего отмечается упор в скорость исполнения сложных математических вычислений, обработки геометрии и эффективность выполнения кода с ветвлениями. И в этом DX11-тесте расклад сил между решениями двух разных компаний всегда получается совершенно иным, по сравнению с любым другим тестом из проведенных в предыдущих подразделах статьи.

Нагрузка в этом тесте явно в пользу видеоплат GeForce, старшая из которых идет впереди всех, да и младшая GeForce GTX 750 уступает только Radeon R7 260X. Похоже, что данная задача несколько эффективнее рассчитывается на графических процессорах архитектуры Maxwell. Бюджетная новинка Radeon R7 360, основанная на графическом процессоре Tobago (он же Bonaire), заметно опередила Radeon R7 260 из предыдущего поколения и чуть отстала от старшей модели R7 260X, что можно объяснить только эффективной оптимизацией в современных драйверах Catalyst.

Direct3D 11: Производительность тесселяции

Еще одним важным нововведением в Direct3D 11 считается аппаратная тесселяция. Мы очень подробно рассматривали ее в своей теоретической статье про Nvidia GF100. Тесселяцию уже довольно давно начали использовать в DX11-играх, таких как STALKER: Зов Припяти, DiRT 2, Aliens vs Predator, Metro Last Light, Civilization V, Crysis 3, Battlefield 3 и более новых. В некоторых из них тесселяция используется для моделей персонажей, в других — для имитации реалистичной водной поверхности или ландшафта.

Существует несколько различных схем разбиения графических примитивов (тесселяции). Например, phong tessellation, PN triangles, Catmull-Clark subdivision. Так, схема разбиения PN Triangles используется в STALKER: Зов Припяти, а в Metro 2033 — Phong tessellation. Эти методы сравнительно быстро и просто внедряются в процесс разработки игр и существующие движки, поэтому и стали популярными.

Первым тестом тесселяции будет пример Detail Tessellation из ATI Radeon SDK. В нем реализована не только тесселяция, но и две разные техники попиксельной обработки: простое наложение карт нормалей и parallax occlusion mapping. Что ж, сравним DX11-решения AMD и Nvidia в различных условиях:

Обычно видеокарты Radeon в этом тесте показывают близкие результаты, так получилось и на этот раз. Новая бюджетная плата компании AMD выступила очень неплохо, на уровне более мощной Radeon R7 260X, за исключением одного подтеста с параллакс-маппингом, где требуется не геометрическая производительность, а математическая. В целом же, новинка опередила и Radeon R7 260 из-за повышенной частоты для GPU и лучшей программной оптимизации, и обе GeForce остались далеко позади.

Вторым тестом производительности тесселяции является еще один пример для 3D-разработчиков из ATI Radeon SDK — PN Triangles. Собственно, оба примера входят также и в состав DX SDK, так что мы уверены, что на их основе создают свой код игровые разработчики. Этот пример мы протестировали с различным коэффициентом разбиения (tessellation factor), чтобы понять, как сильно влияет его изменение на общую производительность.

В этом тесте применяется относительно сложная геометрия, поэтому сравнение геометрической мощи различных решений вполне актуально. Представленные в материале решения неплохо справляются с легкой геометрической нагрузкой, показывая высокую скорость. Хотя в легких условиях графические процессоры в составе плат Radeon работают отлично, в самом тяжелом режиме платы Nvidia все же выходят вперед. И в самом сложном режиме плата модели Radeon R7 360 оказалась чуть медленнее своей соперницы в виде GeForce GTX 750, хотя в легких режимах обошла ее.

Что касается сравнения плат AMD, то рассматриваемая сегодня модель Radeon близка к предшествующей ей R7 260 и обе они немного отстают от старшей модели предыдущего поколения в виде R7 260X. Рассмотрим результаты еще одного теста — демонстрационной программы Nvidia Realistic Water Terrain, также известной как Island. В этой демке используется тесселяция и карты смещения (displacement mapping) для рендеринга реалистично выглядящей поверхности океана и ландшафта.

Тест Island является одним из самых интересных — он не является чисто синтетическим тестом для измерения исключительно геометрической производительности GPU, так как содержит и сложные пиксельные и вычислительные шейдеры в том числе, и такая нагрузка ближе к реальным играм, в которых используются все блоки GPU, а не только геометрические, как в предыдущих тестах геометрии. Хотя основной все равно остается именно нагрузка на блоки обработки геометрии, но на результат может влиять и та же ПСП, например.

Мы тестируем все видеоплаты при четырех разных коэффициентах тесселяции — в данном случае настройка называется Dynamic Tessellation LOD. При первом коэффициенте разбиения треугольников, скорость не ограничена производительностью геометрических блоков, и видеокарты Radeon показывают довольно высокие результаты, но уже на следующих ступенях геометрической нагрузки производительность всех плат Radeon серьезно снижается.

Так что не удивляемся отставанию новой бюджетной платы компании AMD от соперников в виде плат GeForce — в таких тестах прямой конкурент новинки компании AMD обходит Radeon R7 360, не говоря уже о старшей модели Nvidia. Впрочем, разница между рассматриваемой R7 360 и GTX 750 даже в тяжелых условиях не так уж велика, мы ожидали большей.

Больше интересно сравнение платы R7 360 с R7 260(X) из предыдущего семейства. Ведь новинка опережает даже более мощную Radeon R7 260X в двух тяжелых режимах, чего не должно быть, исходя из теории. Вероятно, сказывается как повышенная до 1050 МГц частота GPU, так и (даже в большей степени) программная оптимизация видеодрайверов, в которых тесселяция даже намеренно упрощается — вероятно, в последних версиях драйверов это упрощение только усугубилось.

***

Исходя из результатов синтетических тестов новой бюджетной видеокарты модели AMD Radeon R7 360, основанной на урезанном по функциональным блокам графическом процессоре Tobago, а также результатам других моделей видеокарт обоих производителей дискретных видеочипов, мы делаем вывод о том, что рассматриваемая нами сегодня видеокарта является типичной моделью недорогой видеокарты для своего класса, которая заменила на рынке аналогичную модель Radeon R7 260 — друг от друга они почти не отличаются.

Обновленная видеокарта показывает достаточно хорошие результаты почти во всех синтетических тестах по сравнению со своим главным конкурентом в виде Nvidia GeForce GTX 750, и победа в тестах чаще доставалась именно решению AMD. Но в игровых приложениях нагрузка на исполнительные блоки будет несколько отличаться от «синтетической», хотя в среднем Radeon R7 360 все же должен показать в играх скорость чуть выше конкурента.

И как раз для того, чтобы определить скорость платы AMD в игровых приложениях по сравнению с ее конкурентами, в следующей части нашего материала мы протестируем Radeon R7 360 в нашем наборе игровых тестов и сравним скоростные показатели указанных моделей, заодно определив оправданность установленных для них рекомендованных цен.



Средняя текущая цена (количество предложений) в московской рознице:
Рассматриваемые карты Конкуренты
R7 360 — $106 (на 05.09.16) R7 260 — $115 (на 09.03.16)
R7 360 — $106 (на 05.09.16) R7 260X — $98 (на 01.08.16)
R7 360 — $106 (на 05.09.16) GTX 650 — $95 (на 01.05.16)
R7 360 — $106 (на 05.09.16) GTX 750 — $111 (на 05.09.16)
R7 360 — $106 (на 05.09.16) GT 740 GDDR5 — $80 (на 05.09.16)
Sapphire R7 360 Nitro — Н/Д(0), T-12882941 R7 360 — $106 (на 05.09.16)
Предложения Sapphire R7 360 Nitro
L-12882941-10


Благодарим компанию Sapphire Russia
и лично Елену Зарубину
за предоставленную на тестирование видеокарту

Блок питания Thermaltake DPS G 1050W для тестового стенда предоставлены компанией Thermaltake

Корпус Corsair Obsidian 800D Full Tower для тестового стенда предоставлен компанией Corsair

Модули памяти G.Skill Ripjaws4 F4-2800C16Q-16GRK для тестового стенда предоставлены компанией G.Skill

Corsair Hydro SeriesT H100i CPU Cooler для тестового стенда предоставлен компанией Corsair

Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт

Системная плата ASRock Fatal1ty X99X Killer для тестового стенда предоставлена компанией ASRock

Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate

2 накопителя SSD Corsair Neutron SeriesT 120 ГБ для тестового стенда предоставлены компанией Corsair




Дополнительно

ВИКТОРИНА TT

Материнские платы какого форм-фактора можно устанавливать в корпус Thermaltake Versa C22 RGB Snow Edition?

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.