Видеоускоритель AMD Radeon R9 Nano

Часть 2: особенности карты, результаты синтетических тестов


Содержание

Данная часть знакомит читателей с особенностями видеокарты, а также с результатами синтетических тестов.

Устройство(а)


AMD Radeon R9 Nano 4096 МБ 4096-битной HBM PCI-E
ПараметрЗначениеНоминальное значение (референс)
GPURadeon R9 Nano (Fiji)
ИнтерфейсPCI Express x16
Частота работы GPU (ROPs), МГц900—962900—962
Частота работы памяти (физическая (эффективная)), МГц500 (1000)500 (1000)
Ширина шины обмена с памятью, бит4096
Число вычислительных блоков в GPU64
Число операций (ALU) в блоке64
Суммарное количество блоков ALU4096
Число блоков текстурирования (BLF/TLF/ANIS)256
Число блоков растеризации (ROP)64
Размеры, мм170×100×35170×100×35
Количество слотов в системном блоке, занимаемые видеокартой22
Цвет текстолитачерныйчерный
ЭнергопотреблениеПиковое в 3D, Вт177177
В режиме 2D, Вт8181
В режиме «сна», Вт33
Уровень шумаВ режиме 2D, дБА20,520,5
В режиме 2D (просмотр видео), дБА21,521,5
В режиме максимального 3D, дБА41,541,5
Выходные гнезда1×HDMI 1.4a, 3×DisplayPort 1.21×HDMI 1.4a, 3×DisplayPort 1.2
Поддержка многопроцессорной работыCrossFire
Максимальное количество приемников/мониторов для одновременного вывода изображения44
Дополнительное питание: количество 8-контактных разъемов11
Дополнительное питание: количество 6-контактных разъемовНетНет
Максимальное разрешение 2DDisplay Port3840×2400
HDMI3840×2400
Максимальное разрешение 3DDisplay Port3840×2400
HDMI3840×2400

Комплектация локальной памятью
Картa имеeт 4096 МБ памяти HBM DRAM, размещенной в 4 микросхемах по 8 Гбит в единой упаковке с GPU.

Микросхемы памяти SK Hynix (HBM). Микросхемы рассчитаны на максимальную частоту работы в 500 (1000) МГц.

Сравнение с эталонным дизайном (reference)
Вид спереди
AMD Radeon R9 Nano 4096 МБ 4096-битной HBM PCI-E Reference card AMD Radeon R9 Fury X
Вид сзади
AMD Radeon R9 Nano 4096 МБ 4096-битной HBM PCI-E Reference card AMD Radeon R9 Fury X

Сравнение с Asus GeForce GTX 970 Mini
Вид спереди
AMD Radeon R9 Nano 4096 МБ 4096-битной HBM PCI-E Asus GTX 970 Mini
Вид сзади
AMD Radeon R9 Nano 4096 МБ 4096-битной HBM PCI-E Asus GTX 970 Mini
Вид 3/4
AMD Radeon R9 Nano 4096 МБ 4096-битной HBM PCI-E Asus GTX 970 Mini

Поскольку R9 Nano обладает тем же ядром, что и R9 Fury X, то логично сравнивать именно эти две карты. Прекрасно видно, что плата у R9 Nano стала короче — это стало возможно из-за упрощения системы питания, которая получила меньшее число фаз, но управляется тем же цифровым контроллером. Разъем питания стал единственным и переехал на задний торец. Собственно, отличие от Fury X в том, что жестко зафиксирован верхний предел энергопотребления в 175-180 Вт, и программное обеспечение постоянно регулирует частоту работы GPU с тем, чтобы не выходить за пределы термопакета. Отсюда и плавающая частота 900—962 МГц, и соответствующее снижение производительности относительно Fury X.

Учитывая, что R9 Nano четко позиционируется для малоразмерных ПК-систем, его следует сравнивать с аналогичными конкурентами из стана Nvidia. А ближайшим по производительности является Asus GeForce GTX 970 Mini, обладающий сопоставимыми габаритами. Поэтому стоит обратить внимание и на данное сравнение.

Система охлаждения
Понятно, что если для Fury X требуется сложная жидкостная система охлаждения, то даже снижение частоты работы ядра у R9 Nano не позволит сильно упростить кулер. С другой стороны, есть ограничения в размерах из-за особого форм-фактора ускорителя. Поэтому мы видим довольно большой радиатор, закрывающий собой всю PCB. В конструкции используется испарительная камера, которая прижимается к ядру, однако она не просто припаяна к пластинчатому радиатору, но снабжена тепловыми трубками, обеспечивающими дополнительное охлаждение, равномерно распределяя тепло по ребрам.

Сверху надет кожух с одним большим вентилятором.

Микросхемы памяти встроены в ядро, поэтому также охлаждаются основным радиатором, который имеет выступающую часть подошвы, прижимаемую к силовым транзисторам.

После 6-часового прогона под нагрузкой максимальная температура GPU не превысила 63 градусов, что не только хорошо само по себе (это довольно низкий показатель температуры ядра), но и далеко от «пороговых» для R9 Nano 75 градусов.
Мониторинг температурного режима с помощью MSI Afterburner (автор А. Николайчук AKA Unwinder)

Методика измерения шума

  • Помещение шумоизолировано и заглушено, снижены реверберации.
  • Системный блок, в котором исследовался шум видеокарт, не имеет вентиляторов, не является источником механического шума.
  • Фоновый уровень 20 дБА — это уровень шума в комнате и уровень шумов собственно шумомера.
  • Измерения проводились на расстоянии 50 см от видеокарты на уровне системы охлаждения.
  • Режимы измерения:
    1. Режим простоя в 2D: загружен интернет-браузер с сайтом iXBT.com, окно Microsoft Word, ряд интернет-коммуникаторов.
    2. Режим 2D с просмотром фильмов: используется SmoothVideo Project (SVP) — аппаратное декодирование со вставкой промежуточных кадров.
    3. Режим 3D с максимальной нагрузкой на ускоритель: используется тест FurMark.

В режиме простоя в 2D вентилятор работал на частоте 800 оборотов в минуту, при этом температура графического ядра не поднималась выше 50 градусов, а шум был равен фоновому.

При просмотре фильма с аппаратным декодированием температура графического ядра медленно вырастала до 55 градусов, вентилятор работал на частоте вращения 900 оборотов в минуту, шум оставался близким к фоновому.

В режиме максимальной нагрузки в 3D температура достигала уровня 63 °C, частота вращения вентилятора поднималась до 2630 оборотов в минуту, шум достигал 41,5 дБА. Такую СО трудно назвать не только бесшумной, но и тихой, однако наибольший дискомфорт доставлял свист конденсаторов (причем его частота и длительность сильно меняются в зависимости от нагрузки).

Комплектация
Поскольку это референс-образец, то он поставляется без комплекта.

Упаковка

Конфигурация тестового стенда

  • Компьютер на базе процессора Intel Core i7-5960X (Socket 2011):
    • процессор Intel Core i7-5960X (o/c 4 ГГц);
    • СО Intel Thermal Solution RTS2011LC;
    • системная плата Asrock Fatal1ty X99X Killer на чипсете Intel X99;
    • оперативная память 16 ГБ DDR4 G.Skill Ripjaws4 F4-2800C16Q-16GRK 2800 МГц;
    • жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA2;
    • 2 SSD Corsair Neutron SSD CSSD-N120GB3-BK;
    • блок питания Thermaltake Toughpower DPS G 1050W (1050 Вт);
    • корпус Corsair Obsidian 800D Full Tower.
  • операционная система Windows 7 64-битная; DirectX 11.1;
  • монитор Samsung U28D590D (28″);
  • клавиатура Cougar 700K;
  • драйверы AMD версии Catalyst 15.8 Omega;
  • драйверы Nvidia версии 355.82;
  • VSync отключен.


Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

В качестве синтетических тестов DirectX 11 мы использовали примеры из пакетов SDK компаний Microsoft и AMD, а также демонстрационную программу Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010). Мы взяли и приложения обоих производителей видеочипов: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain, также известная, как Island11.

Синтетические тесты проводились на следующих видеокартах:

  • Radeon R9 Nano со стандартными параметрами (сокращенно R9 Nano)
  • Radeon R9 Fury X со стандартными параметрами (сокращенно R9 Fury X)
  • Radeon R9 290X со стандартными параметрами (сокращенно R9 290X)
  • GeForce GTX 980 со стандартными параметрами (сокращенно GTX 980)
  • GeForce GTX 970 со стандартными параметрами (сокращенно GTX 970)

Для анализа производительности новой компактной видеокарты AMD Radeon R9 Nano мы выбрали именно эти решения по следующим причинам. Видеокарта модели Radeon R9 Fury X взята в сравнение для ориентира — интересно, насколько сильно миниатюрная плата со схожими характеристиками GPU, но сниженной частотой его работы и значительно меньшим энергопотреблением отстанет от такого же GPU в составе топовой модели с водяным охлаждением. Ну а Radeon R9 290X — это верхнее по позиционированию решение компании AMD из предыдущей линейки, с которым они сами постоянно сравнивают новинку.

От конкурирующей компании Nvidia для нашего сравнения мы взяли пару видеокарт GeForce также из верхнего ценового диапазона. Более слабая GeForce GTX 970 интересна тем, что существуют миниатюрные версии такой платы, которые являются соперниками для AMD Radeon R9 Nano по форм-фактору, хотя стоят такие варианты заметно дешевле, но они и медленнее рассматриваемой новинки. А GeForce GTX 980 нам интересна потому, что эта более мощная видеокарта стоит дороже GTX 970, и мы посмотрим, насколько близка к ней по производительности вышедшая сегодня Radeon R9 Nano.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Какое-то время назад мы отказались от устаревших DirectX 9 тестов, так как мощные современные решения показывают в них не показательные результаты, будучи всегда ограничены ПСП, филлрейтом или текстурированием. Кроме того, под такие задачи давно не оптимизируют видеодрайверы, не говоря уже о том, что двухчиповые видеокарты часто работают в таких приложениях некорректно.

Во вторую версию RightMark3D вошли два уже знакомых нам теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также еще два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нем используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность видеокарт в этом тесте зависит от количества и эффективности блоков TMU, влияет также и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает еще и эффективный филлрейт и пропускная способность памяти. Результаты при детализации уровня «High» получаются до полутора раза ниже, чем при «Low», в зависимости от модели видеокарты.

В задачах процедурной визуализации меха с большим количеством текстурных выборок, компания AMD перехватила лидерство еще с выпуском первых видеочипов на базе архитектуры GCN, и именно платы семейства Radeon R9 по сей день являются лучшими в этих сравнениях, что говорит о высокой эффективности выполнения ими этих программ.

В первом Direct3D 10 тесте новая миниатюрная видеоплата оказалась примерно на четверть медленнее старшей модели Fury X, что соответствует теоретическим показателям, если учитывать пониженную до 900 МГц тактовую частоту. Но довольно большое снижение скорости по сравнению с Fury X не привело к проигрышу перед конкурентом. Nano в этом тесте выступила даже лучше GeForce GTX 980, а уж GTX 970 так и вовсе осталась позади.

Что же касается сравнения с Radeon R9 290X, то в данном случае новинка заметно отстала от старого топового решения. Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: в такой ситуации что-то может измениться:

В усложненных условиях новая видеокарта модели Radeon R9 Nano отстает от R9 Fury X уже чуть меньше — на 20-23%, что также близко к теоретической разнице по математической и текстурной мощности. Рассматриваемая модель в этот раз еще больше опережает обоих конкурентов в виде GeForce GTX 980 и GTX 970, а в самом сложном режиме она обогнала и топовую плату модели R9 290X из предыдущего поколения. В общем, все графические процессоры компании AMD в подобных вычислениях весьма сильны.

Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis, Lost Planet и многих других. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип еще примерно в два раза — такой режим называется «High».

Диаграмма в целом схожа с предыдущей, также без включения суперсэмплинга, но в этот раз новая Radeon R9 Nano оказалась медленнее R9 Fury X до 27%, то есть, отстала от старшей модели еще чуть больше — вероятно, сказалась высокая нагрузка на вычислительные блоки и тактовая частота GPU была снижена еще больше. Также новинка снова уступила и топовой видеоплате на чипе Hawaii.

Если рассматривать сравнение Radeon R9 Nano с обеими видеокартами GeForce, то новинка в этом тесте выступает примерно на одном уровне со старшей из представленных моделей текущего поколения компании Nvidia. А GeForce GTX 970, которая в формате Mini-ITX является ее прямым конкурентом, отстала от обеих. Посмотрим, что изменит включение суперсэмплинга:

При включении суперсэмплинга и самозатенения задача становится тяжелее, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьезное падение производительности — особенно на видеокартах Nvidia GeForce. Разница между скоростными показателями протестированных видеокарт немного изменилась, хотя включение суперсэмплинга сказывается меньше, чем в предыдущем случае.

Графические решения AMD Radeon и в этом D3D10-тесте пиксельных шейдеров работают явно эффективнее конкурирующих плат GeForce. В этот раз мини-видеоплата на базе графического процессора Fiji заметно опережает и GeForce GTX 980 и GTX 970 в обоих режимах. Новая модель Radeon R9 Nano примерно на 20% медленнее топовой видеокарты на основе чипа Fiji, что близко к теоретической разнице между ними. В усложненных условиях и видеокарта Radeon R9 290X осталась позади.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты предельных математических тестов чаще всего соответствуют разнице по частотам и количеству вычислительных блоков, но лишь примерно, так как на результаты влияет и разная эффективность их использования в конкретных задачах, и оптимизация драйверов, и новейшие системы управления частотами и питанием, и даже упор в ПСП. В случае теста Mineral, новая модель видеокарты Radeon R9 Nano снова отстала от старшей модели на привычные 24%, что более-менее близко к теории.

А вот сравнение Radeon R9 Nano с платами GeForce в этом конкретном тесте приносит необычные выводы. Обновление архитектуры Nvidia с Kepler до Maxwell привело к тому, что новые чипы компании в таких тестах приблизились к конкурирующим решениям AMD, а то и обогнали их. Обе модели производства компании Nvidia показали высокую скорость, и даже GTX 970 не просто не уступила новинке AMD, а опередила ее с хорошим запасом. Похоже, что видеокарты компании AMD, основанные на чипе Fiji упираются во что-то, что не дает им возможности показать более высокие результаты. Скорее всего, для них тест слишком прост с точки зрения математических вычислений, так как даже Radeon R9 290X оказалась значительно быстрее новинки.

Рассмотрим еще один тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нем только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Во втором математическом тесте из нашего RigthMark мы видим уже несколько иные результаты видеокарт относительно друг друга, особенно это касается сравнения решений AMD и Nvidia. Новая модель Radeon R9 Nano в этот раз уже лишь на 22% медленнее Radeon R9 Fury X, основанной на точно таком же графическом чипе Fiji, работающем на большей частоте. Да и на фоне аналогичного решения из прошлого поколения на чипе Hawaii плата R9 Nano выступила уже лучше.

Модель Radeon R9 Nano оказалась медленнее старшей из видеокарт GeForce, но своего прямого конкурента по форм-фактору в лице GeForce GTX 970 новинка обогнала, хотя и совсем чуть-чуть. Можно лишь повторить, что с выпуском графических процессоров GM204 и GM200 компания Nvidia совершила довольно большой скачок по математической производительности, как минимум, отыграв отставание от конкурента, а местами и опередив его.

Direct3D 10: тесты геометрических шейдеров

В составе пакета RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трех уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близкое к двукратному. Задача эта для мощных современных видеокарт очень простая, и производительность в ней ограничена скоростью обработки геометрии, а иногда и пропускной способностью памяти и/или филлрейтом.

Разница между результатами видеокарт на чипах AMD и Nvidia явно в пользу решений калифорнийской компании, и, скорее всего, она обусловлена отличиями в геометрических конвейерах чипов этих компаний. В тестах геометрии платы GeForce всегда конкурентоспособнее Radeon, и в данном случае хорошо заметно, что видеочипы Nvidia имеют больше блоков по обработке геометрии, поэтому и выигрывают с заметным преимуществом.

Но компактная модель Radeon R9 Nano, основанная на графическом процессоре Fiji, в первом геометрическом тесте показала себя неплохо, оказавшись лишь на 8-15% медленнее Radeon R9 Fury X на базе того же чипа. А Radeon R9 290X из предыдущего поколения остался далеко позади. А вот сравнение с конкурентом менее радостное — новинка отстает и от GeForce GTX 980 и от GTX 970. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры изменились незначительно и для плат AMD и для решений Nvidia, поэтому это ничего особенно не меняет. Видеокарты в этом тесте геометрических шейдеров слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, поэтому и выводы остаются неизменными.

К сожалению, «Hyperlight» — второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load, в котором используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output, на всех современных видеокартах компании AMD просто не работает. В какой-то момент очередное обновление драйверов Catalyst привело к тому, что данный тест перестал запускаться на платах этой компании.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Наши предыдущие исследования показали, что на результаты этого теста может влиять и филлрейт и пропускная способность памяти, что видно по результатам плат Nvidia в простых режимах — они показывают скорость явно ниже, чем должны бы — обе платы GeForce оказываются почти на одном уровне, что явно не соответствует теории. Похоже, что все они во всех режимах упираются во что-то — возможно, нагрузка на GPU в этом тесте слишком слаба.

Новая сверхкомпактная плата компании AMD в этот раз оказалась медленнее всех, в том числе одночиповой топовой платы из предыдущего поколения в виде Radeon R9 290X, а также современной топовой платы на базе чипа Fiji, уступив последней снова примерно четверть, что объяснимо теорией. Зато непонятно, почему новинка уступила плате на Hawaii, так как она по всем параметрам сильнее предшествующей модели.

Также Radeon R9 Nano отстала и от обеих видеокарт Nvidia во всех режимах: GeForce GTX 980 и GTX 970 оказались заметно быстрее новинки в таких условиях. Посмотрим на производительность представленных в сравнении видеокарт в этом же тесте, но с увеличенным количеством текстурных выборок:

Ситуация на диаграмме заметно изменилась, устаревшее одночиповое решение компании AMD из предыдущего поколения потеряло больше всех остальных, но и это не позволило новой модели Radeon R9 Nano нагнать ее — видим небольшое преимущество Radeon R9 290X. R9 Nano показала скорость на 20-24% медленнее, чем Radeon R9 Fury X, что близко к теории. Ну а GeForce GTX 980 и GTX 970 и в этот раз впереди сверхкомпактной платы на чипе Fiji во всех режимах, даже в легком, где они явно не раскрываются полностью.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нем используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты во втором тесте вершинного текстурирования «Waves» не похожи на то, что мы видели на предыдущих диаграммах. Скоростные показатели пары плат GeForce в этом тесте довольно слабы, и новая модель AMD Radeon R9 Nano оказывается примерно на одном уровне с GeForce GTX 980, даже несмотря на отставание от Fury X на 20-22%. А вот если сравнивать новинку с платой на чипе Hawaii, то видно, что Radeon R9 290X во всех режимах быстрее не только R9 Nano, но и R9 Fury X. Рассмотрим второй вариант этой же задачи:

С усложнением задачи во втором тесте текстурных выборок скорость всех решений стала ниже, но видеокарты Nvidia снова пострадали сильнее. Правда, в наших выводах мало что меняется, разве что новая плата формата Mini-ITX модели Radeon R9 Nano в этот раз оказалась уже совершенно точно впереди не только своего прямого конкурента GeForce GTX 970, но и GTX 980.

Nano-модель оказалась медленнее предшественницы на основе чипа Hawaii и до четверти уступила старшей плате Radeon R9 Fury X, что близко к теоретической разнице между этими решениями, с учетом упора в предел потребления энергии и сброса реальной рабочей частоты с максимальных 1000 до 900 МГц.

3DMark Vantage: тесты Feature

Синтетические тесты из пакета 3DMark Vantage покажут нам то, что мы ранее упустили. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10, до сих пор актуальны и интересны тем, что отличаются от наших. При анализе результатов новейшей видеокарты модели Radeon R9 Nano в этом пакете мы сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark.

Feature Test 1: Texture Fill

Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Эффективность видеокарт AMD и Nvidia в текстурном тесте компании Futuremark достаточно высока и итоговые цифры разных моделей близки к соответствующим теоретическим параметрам. Разница в скорости между Radeon R9 Nano и R9 Fury X получилась равной 25% в пользу топового решения на базе чипа Fiji с системой водяного охлаждения, что близко к теории, учитывающей разницу в реальных рабочих частотах. Новая компактная плата показала средний результат между Radeon R9 290X из прошлого поколения и топовой R9 Fury X, но все же ближе к Hawaii.

Что касается сравнения скорости текстурирования новой видеоплаты компании AMD с представленными на диаграмме решениями конкурента, новинка по понятным причинам оказывается заметно быстрее пары GeForce, несмотря на сниженную относительно Fury X производительность. Даже GeForce GTX 980 по скорости текстурирования не достает до Radeon R9 290X, не говоря уже о R9 Nano. А ближайший конкурент в лице GTX 970 и вовсе чуть ли не вдвое отстает от выпущенной сегодня новинки — с текстурированием видеокарты компании AMD справляются заметно лучше плат Nvidia.

Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Значения производительности во втором подтесте 3DMark Vantage показывают скорость блоков ROP без учета величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), и тест измеряет именно производительность этой подсистемы. Рассматриваемая нами сегодня плата Radeon R9 Nano на полноценном чипе Fiji более чем вдвое быстрее модели Radeon R9 290X, основанной на чипе Hawaii, так как эффективность работы блоков ROP серьезно возросло. Топовая модель R9 Fury X оказалась быстрее R9 Nano всего лишь на 8% — в данном тесте частота GPU не падает слишком сильно.

Если сравнивать скорость заполнения сцены новой видеокартой Radeon R9 Nano с показателями видеокарт компании Nvidia, то можно отметить, что рассматриваемая сегодня плата в этом тесте показывает лучшую скорость заполнения сцены даже по сравнению со старшей из пары видеокарт GeForce, не говоря уже о более слабой модели GTX 970, являющейся ее ближайшим конкурентом по размеру и соответствию форм-фактору Mini-ITX.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.

Этот тест из пакета 3DMark Vantage отличается от проведенных нами ранее тем, что результаты в нем зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен верный баланс GPU, а также эффективность выполнения сложных шейдеров.

В данном случае важны и математическая и текстурная производительность, и в этой «синтетике» из 3DMark Vantage новая плата Radeon R9 Nano оказалась по скорости ровно между моделями R9 290X и R9 Fury X, основанными на базе полноценных графических процессоров Hawaii и Fiji, соответственно. Проигрыш перед Fury X составил 20%, что близко к теоретической разнице в скорости TMU и ALU, с учетом более низкой рабочей частоты GPU у Nano. Новая миниатюрная плата AMD в этом тесте снова показала результат лучше обеих плат Nvidia, которые отстали даже от Radeon R9 290X.

Feature Test 4: GPU Cloth

Четвертый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте также зависит сразу от нескольких параметров, но основными факторами влияния в этот раз должны являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. То есть, сильные стороны чипов Nvidia должны были проявиться, но мы традиционно отмечаем странный результат, когда видеокарты Nvidia уступают в этом подтесте всем решениям AMD. Которые также показали схожие цифры, даже Radeon R9 290X. Разница между Radeon R9 Nano и Fury X в этот раз равна 5%, что соответствует теории (разница между 1000 и 1050 МГц).

Сравнение с платами GeForce в этом тесте для новинки приятное — несмотря на теоретически меньшее количество геометрических исполнительных блоков и отставание по геометрической производительности чипов AMD, по сравнению с конкурирующими решениями, платы Radeon в этом тесте работают эффективнее и обгоняют все видеокарты GeForce, представленные в сравнении. Это больше похоже на отсутствие оптимизации в драйверах Nvidia под эту конкретную задачу и недостаточно эффективное ее выполнение.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.

Во втором «геометрическом» тесте из 3DMark Vantage ситуация другая, хотя она все равно довольно далека от того, что должно быть по теории. В этот раз выпущенная сегодня компактная плата Radeon R9 Nano оказалась заметно быстрее Radeon R9 290X, и уступила Fury X около 7%, что также близко к разнице в теоретических показателях.

Сравнение новинки AMD с парой видеокарт компании Nvidia и в этот раз достаточно приятное для нее — Radeon R9 Nano показала результат заметно быстрее конкурента в виде GeForce GTX 970, и даже более мощную одночиповую видеокарту соперника в виде GTX 980 она обогнала. Правда, тут нужно еще учитывать разницу в стоимости, а не только в габаритных размерах.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических вычислений.

В этом случае производительность решений не совсем соответствует теории, хотя и близка к тому, что мы видели в аналогичных тестах. В математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы видим распределение результатов, сильно отличающееся по сравнению со схожими тестами из нашего тестового пакета.

Видеочипы компании AMD с архитектурой GCN справляются с подобными задачами лучше решений конкурента в случаях, когда выполняется интенсивная «математика», касается это и данного подтеста из Vantage. Лишь топовая модель компании Nvidia, основанная на большом и сложном графическом процессоре GM200, в свое время серьезно подтянулась к решениям предыдущего поколения от компании AMD, но другие решения так и отстают от соответствующих Radeon. Что мы видим и в этот раз — мини-новинка показала скорость выше чем у GTX 980 и GTX 970.

Рассматриваемая сегодня видеоплата модели Radeon R9 Nano оказалась аж на 29% медленнее топовой R9 Fury X, что хоть и объяснимо с теоретической точки зрения, но говорит о том, что задача загружает блоки ALU работой так сильно, что частота GPU падает даже ниже 900 МГц. А вот по сравнению с Radeon R9 290X новинка выступила достаточно неплохо, обогнав ее даже при значительно меньшем потреблении энергии.

Direct3D 11: Вычислительные шейдеры

Чтобы протестировать свежевышедшее решение компании AMD в задачах, использующих такие возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы воспользовались примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, Nvidia и AMD.

Сначала мы рассмотрим тесты, использующие вычислительные (Compute) шейдеры. Их появление — одно из наиболее важных нововведений в последних версиях DX API, они уже используются в современных играх для выполнения различных задач: постобработки, симуляций и т. п. В первом тесте показан пример HDR-рендеринга с tone mapping из DirectX SDK, с постобработкой, использующей пиксельные и вычислительные шейдеры.

Сравнительная скорость расчетов в вычислительном и пиксельном шейдерах для всех плат AMD и Nvidia приблизительно одинаковая, хотя у видеокарт на основе GPU предыдущих архитектур наблюдались некоторые отличия. Судя по нашим предыдущим тестам, результаты в задаче часто зависят не столько от математической мощи и эффективности вычислений, сколько от других факторов, вроде пропускной способности памяти и эффективности блоков ROP.

В данном случае, малогабаритная видеокарта AMD показывает скорость примерно явно выше, чем обе платы GeForce от конкурента: GTX 980 и GTX 970. Устаревший Radeon R9 290X также остался далеко позади. Разница между Radeon R9 Nano и R9 Fury X оказалась равна 16-17%, что соответствует теории, учитывающей разницу в энергопотреблении и частоте. Переходим ко второму тесту вычислительных шейдеров, который также взят из Microsoft DirectX SDK. В нем показана расчетная задача гравитации N тел (N-body) — симуляция динамической системы частиц, на которую воздействуют такие физические силы, как гравитация.

В данном тесте чаще всего отмечается упор в скорость исполнения сложных математических вычислений, обработки геометрии и эффективность выполнения кода с ветвлениями. И в этом DX11-тесте расклад сил между решениями двух разных компаний всегда получается совершенно иным, по сравнению с любым другим тестом из предыдущих.

Нагрузка в тесте явно в пользу видеоплат GeForce, которые далеко впереди всех, а старшая GeForce GTX 980 так и вовсе оказывается более чем вдвое быстрее представленных решений компании AMD. Похоже, что данная задача заметно эффективнее рассчитывается на графических процессорах архитектуры Maxwell. Компактная новинка Radeon R9 Nano, основанная на графическом процессоре Fiji, заметно опередила Radeon R9 290X из предыдущего поколения, и лишь на 8% отстала от старшей модели Radeon R9 Fury X.

Direct3D 11: Производительность тесселяции

Еще одним важным нововведением в Direct3D 11 считается аппаратная тесселяция. Мы очень подробно рассматривали ее в своей теоретической статье про Nvidia GF100. Тесселяцию уже довольно давно начали использовать в DX11-играх, таких как STALKER: Зов Припяти, DiRT 2, Aliens vs Predator, Metro Last Light, Civilization V, Crysis 3, Battlefield 3 и более новых. В некоторых из них тесселяция используется для моделей персонажей, в других — для имитации реалистичной водной поверхности или ландшафта.

Существует несколько различных схем разбиения графических примитивов (тесселяции). Например, phong tessellation, PN triangles, Catmull-Clark subdivision. Так, схема разбиения PN Triangles используется в STALKER: Зов Припяти, а в Metro 2033 — Phong tessellation. Эти методы сравнительно быстро и просто внедряются в процесс разработки игр и существующие движки, поэтому и стали популярными.

Первым тестом тесселяции будет пример Detail Tessellation из ATI Radeon SDK. В нем реализована не только тесселяция, но и две разные техники попиксельной обработки: простое наложение карт нормалей и parallax occlusion mapping. Что ж, сравним DX11-решения AMD и Nvidia в различных условиях:

Увы, обычно все видеокарты Radeon показывают близкие результаты, но с момента выхода Radeon R9 Fury производительность плат на чипах Fiji в этом тесте по какой-то странной причине заметно упала, и Radeon R9 Nano показал очень низкие результаты — равные во всех трех режимах. Так что выводов по миниатюрной плате AMD в этом тесте не будет, так как его скорость явно ограничена какими-то недоработками в последних версиях драйверов AMD (Fury X тестировался на другой версии, вышедшей ранее).

Вторым тестом производительности тесселяции является еще один пример для 3D-разработчиков из ATI Radeon SDK — PN Triangles. Собственно, оба примера входят также и в состав DX SDK, так что мы уверены, что на их основе создают свой код игровые разработчики. Этот пример мы протестировали с различным коэффициентом разбиения (tessellation factor), чтобы понять, как сильно влияет его изменение на общую производительность.

В этом тесте применяется достаточно сложная геометрия, поэтому сравнение геометрической мощи различных решений вполне актуально. Представленные в материале решения неплохо справляются с легкой геометрической нагрузкой, показывая достаточно высокую скорость. Хотя в легких условиях графические процессоры Hawaii и Fiji в составе плат Radeon работают отлично, в двух тяжелых режимах платы Nvidia выходят вперед. И в этих самых сложных режимах новая плата модели Radeon R9 Nano оказалась в разы хуже конкурирующих с ней плат GeForce, что вполне объяснимо большим количеством геометрических блоков у последних.

Что же касается сравнения плат AMD, то рассматриваемая сегодня модель Radeon R9 Nano оказалась заметно медленнее одночипового аналога из предыдущего поколения в виде R9 290X — оптимизации геометрического конвейера в этом конкретном тесте не сработали, поэтому маленькая новинка компании во всех режимах уступает плате на основе чипа Hawaii. А от старшей модели Fury X отставание составило 8-19%, что близко к теоретической разнице в реальных тактовых частотах.

Рассмотрим результаты еще одного теста — демонстрационной программы Nvidia Realistic Water Terrain, также известной как Island. В этой демке используется тесселяция и карты смещения (displacement mapping) для рендеринга реалистично выглядящей поверхности океана и ландшафта.

Тест Island является одним из самых интересных — он не является чисто синтетическим тестом для измерения исключительно геометрической производительности GPU, так как содержит и сложные пиксельные и вычислительные шейдеры в том числе, и такая нагрузка ближе к реальным играм, в которых используются все блоки GPU, а не только геометрические, как в предыдущих тестах геометрии. Хотя основной все равно остается именно нагрузка на блоки обработки геометрии, но на результат может влиять и та же ПСП, например.

Мы тестируем все видеоплаты при четырех разных коэффициентах тесселяции — в данном случае настройка называется Dynamic Tessellation LOD. При первом коэффициенте разбиения треугольников, скорость не ограничена производительностью геометрических блоков, и видеокарты Radeon показывают довольно высокие результаты, даже превышающие показатели GeForce. Но уже на следующих ступенях геометрической нагрузки производительность платы Radeon серьезно снижается, и решения Nvidia выходят вперед.

Отставание новой компактной платы компании AMD на видеочипе Fiji от соперников в виде плат GeForce в таких тестах также присутствует. Хотя графический процессор Fiji заметно эффективнее работает в режиме смешанной нагрузки, и Radeon R9 Nano очень серьезно выигрывает у Radeon R9 290X в этом тесте, это не дает новинке догнать даже GeForce GTX 970, не говоря уже о GTX 980, что вполне объяснимо теорией. Впрочем, разница между R9 Nano и GTX 970 даже в тяжелых условиях не так уж велика. А сравнение с R9 Fury X показывает разницу 9-13%, что близко к цифрам из предыдущего теста.

***

Исходя из результатов синтетических тестов новой компактной видеокарты формата Mini-ITX модели AMD Radeon R9 Nano, основанной на полноценном графическом процессоре Fiji, а также результатам других моделей видеокарт обоих производителей дискретных видеочипов, можно сделать вывод, что рассматриваемая нами сегодня видеокарта является лучшей в своем классе — сегменте сверхминиатюрных видеокарт, предназначенных для установки в корпуса небольшого форм-фактора SFF.

Новая видеокарта компании AMD показывает хорошие результаты почти во всех синтетических тестах по сравнению с топовой платой Radeon из предыдущего поколения и с главным конкурентом от Nvidia в виде GeForce GTX 970 — именно такая модель присутствует на рынке в виде Mini-ITX-совместимых решений. Хотя это решение Nvidia и продается дешевле, чем Radeon R9 Nano, оно также имеет и заметно меньшую производительность, в том числе в синтетических тестах.

В игровых приложениях нагрузка на исполнительные блоки будет отличаться от «синтетической», но в среднем Radeon R9 Nano должен показать в играх скорость выше, чем недавняя топовая видеокарта модели Radeon R9 290X, и максимум на пару десятков процентов хуже нынешней топовой Radeon R9 Fury X. Это можно назвать очень высоким уровнем производительности для видеокарты столь компактного размера — по сути, у новинки нет реальных конкурентов.

Для того, чтобы определить скорость вышедшей платы AMD в игровых приложениях по сравнению с ближайшими конкурентами, в следующей части нашего материала мы протестируем Radeon R9 Nano в наборе игровых тестов и сравним скоростные показатели этой модели с конкурирующими. Можно предположить, что по игровой 3D-производительности новинка станет лучшей видеоплатой в своем миниатюрном классе, хотя и не будет обладать высоким соотношением цены и скорости рендеринга из-за достаточно высокой цены.



Средняя текущая цена (количество предложений) в московской рознице:
Рассматриваемые карты Конкуренты
R9 Nano — 23 600  (на 01.04.17) R9 390X — 33 500  (на 03.08.17)
R9 Nano — 23 600  (на 01.04.17) GTX 980 Ti — 32 000  (на 22.06.17)
R9 Nano — 23 600  (на 01.04.17) R9 Fury X — 28 700  (на 03.08.17)
R9 Nano — 23 600  (на 01.04.17) R9 Fury — 27 000  (на 08.09.17)
R9 Nano — 23 600  (на 01.04.17) Asus GTX 970 Mini — Н/Д(0)


Благодарим компанию AMD Russia
и лично Кирилла Погорелова
за предоставленную на тестирование видеокарту

Блок питания Thermaltake DPS G 1050W для тестового стенда предоставлены компанией Thermaltake

Корпус Corsair Obsidian 800D Full Tower для тестового стенда предоставлен компанией Corsair

Модули памяти G.Skill Ripjaws4 F4-2800C16Q-16GRK для тестового стенда предоставлены компанией G.Skill

Corsair Hydro SeriesT H100i CPU Cooler для тестового стенда предоставлен компанией Corsair

Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт

Системная плата Asrock Fatal1ty X99X Killer для тестового стенда предоставлена компанией Asrock

Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate

2 накопителя SSD Corsair Neutron SeriesT 120 ГБ для тестового стенда предоставлены компанией Corsair




Дополнительно

Обзор видеоускорителя AMD Radeon R9 Nano. Часть 2: особенности карты, результаты синтетических тестов

Видеоускоритель AMD Radeon R9 Nano

Часть 2: особенности карты, результаты синтетических тестов

Содержание

Данная часть знакомит читателей с особенностями видеокарты, а также с результатами синтетических тестов.

Устройство(а)


AMD Radeon R9 Nano 4096 МБ 4096-битной HBM PCI-E
ПараметрЗначениеНоминальное значение (референс)
GPURadeon R9 Nano (Fiji)
ИнтерфейсPCI Express x16
Частота работы GPU (ROPs), МГц900—962900—962
Частота работы памяти (физическая (эффективная)), МГц500 (1000)500 (1000)
Ширина шины обмена с памятью, бит4096
Число вычислительных блоков в GPU64
Число операций (ALU) в блоке64
Суммарное количество блоков ALU4096
Число блоков текстурирования (BLF/TLF/ANIS)256
Число блоков растеризации (ROP)64
Размеры, мм170×100×35170×100×35
Количество слотов в системном блоке, занимаемые видеокартой22
Цвет текстолитачерныйчерный
ЭнергопотреблениеПиковое в 3D, Вт177177
В режиме 2D, Вт8181
В режиме «сна», Вт33
Уровень шумаВ режиме 2D, дБА20,520,5
В режиме 2D (просмотр видео), дБА21,521,5
В режиме максимального 3D, дБА41,541,5
Выходные гнезда1×HDMI 1.4a, 3×DisplayPort 1.21×HDMI 1.4a, 3×DisplayPort 1.2
Поддержка многопроцессорной работыCrossFire
Максимальное количество приемников/мониторов для одновременного вывода изображения44
Дополнительное питание: количество 8-контактных разъемов11
Дополнительное питание: количество 6-контактных разъемовНетНет
Максимальное разрешение 2DDisplay Port3840×2400
HDMI3840×2400
Максимальное разрешение 3DDisplay Port3840×2400
HDMI3840×2400

Комплектация локальной памятью
Картa имеeт 4096 МБ памяти HBM DRAM, размещенной в 4 микросхемах по 8 Гбит в единой упаковке с GPU.

Микросхемы памяти SK Hynix (HBM). Микросхемы рассчитаны на максимальную частоту работы в 500 (1000) МГц.

Сравнение с эталонным дизайном (reference)
Вид спереди
AMD Radeon R9 Nano 4096 МБ 4096-битной HBM PCI-E Reference card AMD Radeon R9 Fury X
Вид сзади
AMD Radeon R9 Nano 4096 МБ 4096-битной HBM PCI-E Reference card AMD Radeon R9 Fury X

Сравнение с Asus GeForce GTX 970 Mini
Вид спереди
AMD Radeon R9 Nano 4096 МБ 4096-битной HBM PCI-E Asus GTX 970 Mini
Вид сзади
AMD Radeon R9 Nano 4096 МБ 4096-битной HBM PCI-E Asus GTX 970 Mini
Вид 3/4
AMD Radeon R9 Nano 4096 МБ 4096-битной HBM PCI-E Asus GTX 970 Mini

Поскольку R9 Nano обладает тем же ядром, что и R9 Fury X, то логично сравнивать именно эти две карты. Прекрасно видно, что плата у R9 Nano стала короче — это стало возможно из-за упрощения системы питания, которая получила меньшее число фаз, но управляется тем же цифровым контроллером. Разъем питания стал единственным и переехал на задний торец. Собственно, отличие от Fury X в том, что жестко зафиксирован верхний предел энергопотребления в 175-180 Вт, и программное обеспечение постоянно регулирует частоту работы GPU с тем, чтобы не выходить за пределы термопакета. Отсюда и плавающая частота 900—962 МГц, и соответствующее снижение производительности относительно Fury X.

Учитывая, что R9 Nano четко позиционируется для малоразмерных ПК-систем, его следует сравнивать с аналогичными конкурентами из стана Nvidia. А ближайшим по производительности является Asus GeForce GTX 970 Mini, обладающий сопоставимыми габаритами. Поэтому стоит обратить внимание и на данное сравнение.

Система охлаждения
Понятно, что если для Fury X требуется сложная жидкостная система охлаждения, то даже снижение частоты работы ядра у R9 Nano не позволит сильно упростить кулер. С другой стороны, есть ограничения в размерах из-за особого форм-фактора ускорителя. Поэтому мы видим довольно большой радиатор, закрывающий собой всю PCB. В конструкции используется испарительная камера, которая прижимается к ядру, однако она не просто припаяна к пластинчатому радиатору, но снабжена тепловыми трубками, обеспечивающими дополнительное охлаждение, равномерно распределяя тепло по ребрам.

Сверху надет кожух с одним большим вентилятором.

Микросхемы памяти встроены в ядро, поэтому также охлаждаются основным радиатором, который имеет выступающую часть подошвы, прижимаемую к силовым транзисторам.

После 6-часового прогона под нагрузкой максимальная температура GPU не превысила 63 градусов, что не только хорошо само по себе (это довольно низкий показатель температуры ядра), но и далеко от «пороговых» для R9 Nano 75 градусов.
Мониторинг температурного режима с помощью MSI Afterburner (автор А. Николайчук AKA Unwinder)

Методика измерения шума

  • Помещение шумоизолировано и заглушено, снижены реверберации.
  • Системный блок, в котором исследовался шум видеокарт, не имеет вентиляторов, не является источником механического шума.
  • Фоновый уровень 20 дБА — это уровень шума в комнате и уровень шумов собственно шумомера.
  • Измерения проводились на расстоянии 50 см от видеокарты на уровне системы охлаждения.
  • Режимы измерения:
    1. Режим простоя в 2D: загружен интернет-браузер с сайтом iXBT.com, окно Microsoft Word, ряд интернет-коммуникаторов.
    2. Режим 2D с просмотром фильмов: используется SmoothVideo Project (SVP) — аппаратное декодирование со вставкой промежуточных кадров.
    3. Режим 3D с максимальной нагрузкой на ускоритель: используется тест FurMark.

В режиме простоя в 2D вентилятор работал на частоте 800 оборотов в минуту, при этом температура графического ядра не поднималась выше 50 градусов, а шум был равен фоновому.

При просмотре фильма с аппаратным декодированием температура графического ядра медленно вырастала до 55 градусов, вентилятор работал на частоте вращения 900 оборотов в минуту, шум оставался близким к фоновому.

В режиме максимальной нагрузки в 3D температура достигала уровня 63 °C, частота вращения вентилятора поднималась до 2630 оборотов в минуту, шум достигал 41,5 дБА. Такую СО трудно назвать не только бесшумной, но и тихой, однако наибольший дискомфорт доставлял свист конденсаторов (причем его частота и длительность сильно меняются в зависимости от нагрузки).

Комплектация
Поскольку это референс-образец, то он поставляется без комплекта.

Упаковка

Конфигурация тестового стенда

  • Компьютер на базе процессора Intel Core i7-5960X (Socket 2011):
    • процессор Intel Core i7-5960X (o/c 4 ГГц);
    • СО Intel Thermal Solution RTS2011LC;
    • системная плата Asrock Fatal1ty X99X Killer на чипсете Intel X99;
    • оперативная память 16 ГБ DDR4 G.Skill Ripjaws4 F4-2800C16Q-16GRK 2800 МГц;
    • жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA2;
    • 2 SSD Corsair Neutron SSD CSSD-N120GB3-BK;
    • блок питания Thermaltake Toughpower DPS G 1050W (1050 Вт);
    • корпус Corsair Obsidian 800D Full Tower.
  • операционная система Windows 7 64-битная; DirectX 11.1;
  • монитор Samsung U28D590D (28″);
  • клавиатура Cougar 700K;
  • драйверы AMD версии Catalyst 15.8 Omega;
  • драйверы Nvidia версии 355.82;
  • VSync отключен.


Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

В качестве синтетических тестов DirectX 11 мы использовали примеры из пакетов SDK компаний Microsoft и AMD, а также демонстрационную программу Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010). Мы взяли и приложения обоих производителей видеочипов: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain, также известная, как Island11.

Синтетические тесты проводились на следующих видеокартах:

  • Radeon R9 Nano со стандартными параметрами (сокращенно R9 Nano)
  • Radeon R9 Fury X со стандартными параметрами (сокращенно R9 Fury X)
  • Radeon R9 290X со стандартными параметрами (сокращенно R9 290X)
  • GeForce GTX 980 со стандартными параметрами (сокращенно GTX 980)
  • GeForce GTX 970 со стандартными параметрами (сокращенно GTX 970)

Для анализа производительности новой компактной видеокарты AMD Radeon R9 Nano мы выбрали именно эти решения по следующим причинам. Видеокарта модели Radeon R9 Fury X взята в сравнение для ориентира — интересно, насколько сильно миниатюрная плата со схожими характеристиками GPU, но сниженной частотой его работы и значительно меньшим энергопотреблением отстанет от такого же GPU в составе топовой модели с водяным охлаждением. Ну а Radeon R9 290X — это верхнее по позиционированию решение компании AMD из предыдущей линейки, с которым они сами постоянно сравнивают новинку.

От конкурирующей компании Nvidia для нашего сравнения мы взяли пару видеокарт GeForce также из верхнего ценового диапазона. Более слабая GeForce GTX 970 интересна тем, что существуют миниатюрные версии такой платы, которые являются соперниками для AMD Radeon R9 Nano по форм-фактору, хотя стоят такие варианты заметно дешевле, но они и медленнее рассматриваемой новинки. А GeForce GTX 980 нам интересна потому, что эта более мощная видеокарта стоит дороже GTX 970, и мы посмотрим, насколько близка к ней по производительности вышедшая сегодня Radeon R9 Nano.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Какое-то время назад мы отказались от устаревших DirectX 9 тестов, так как мощные современные решения показывают в них не показательные результаты, будучи всегда ограничены ПСП, филлрейтом или текстурированием. Кроме того, под такие задачи давно не оптимизируют видеодрайверы, не говоря уже о том, что двухчиповые видеокарты часто работают в таких приложениях некорректно.

Во вторую версию RightMark3D вошли два уже знакомых нам теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также еще два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нем используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность видеокарт в этом тесте зависит от количества и эффективности блоков TMU, влияет также и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает еще и эффективный филлрейт и пропускная способность памяти. Результаты при детализации уровня «High» получаются до полутора раза ниже, чем при «Low», в зависимости от модели видеокарты.

В задачах процедурной визуализации меха с большим количеством текстурных выборок, компания AMD перехватила лидерство еще с выпуском первых видеочипов на базе архитектуры GCN, и именно платы семейства Radeon R9 по сей день являются лучшими в этих сравнениях, что говорит о высокой эффективности выполнения ими этих программ.

В первом Direct3D 10 тесте новая миниатюрная видеоплата оказалась примерно на четверть медленнее старшей модели Fury X, что соответствует теоретическим показателям, если учитывать пониженную до 900 МГц тактовую частоту. Но довольно большое снижение скорости по сравнению с Fury X не привело к проигрышу перед конкурентом. Nano в этом тесте выступила даже лучше GeForce GTX 980, а уж GTX 970 так и вовсе осталась позади.

Что же касается сравнения с Radeon R9 290X, то в данном случае новинка заметно отстала от старого топового решения. Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: в такой ситуации что-то может измениться:

В усложненных условиях новая видеокарта модели Radeon R9 Nano отстает от R9 Fury X уже чуть меньше — на 20-23%, что также близко к теоретической разнице по математической и текстурной мощности. Рассматриваемая модель в этот раз еще больше опережает обоих конкурентов в виде GeForce GTX 980 и GTX 970, а в самом сложном режиме она обогнала и топовую плату модели R9 290X из предыдущего поколения. В общем, все графические процессоры компании AMD в подобных вычислениях весьма сильны.

Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis, Lost Planet и многих других. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип еще примерно в два раза — такой режим называется «High».

Диаграмма в целом схожа с предыдущей, также без включения суперсэмплинга, но в этот раз новая Radeon R9 Nano оказалась медленнее R9 Fury X до 27%, то есть, отстала от старшей модели еще чуть больше — вероятно, сказалась высокая нагрузка на вычислительные блоки и тактовая частота GPU была снижена еще больше. Также новинка снова уступила и топовой видеоплате на чипе Hawaii.

Если рассматривать сравнение Radeon R9 Nano с обеими видеокартами GeForce, то новинка в этом тесте выступает примерно на одном уровне со старшей из представленных моделей текущего поколения компании Nvidia. А GeForce GTX 970, которая в формате Mini-ITX является ее прямым конкурентом, отстала от обеих. Посмотрим, что изменит включение суперсэмплинга:

При включении суперсэмплинга и самозатенения задача становится тяжелее, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьезное падение производительности — особенно на видеокартах Nvidia GeForce. Разница между скоростными показателями протестированных видеокарт немного изменилась, хотя включение суперсэмплинга сказывается меньше, чем в предыдущем случае.

Графические решения AMD Radeon и в этом D3D10-тесте пиксельных шейдеров работают явно эффективнее конкурирующих плат GeForce. В этот раз мини-видеоплата на базе графического процессора Fiji заметно опережает и GeForce GTX 980 и GTX 970 в обоих режимах. Новая модель Radeon R9 Nano примерно на 20% медленнее топовой видеокарты на основе чипа Fiji, что близко к теоретической разнице между ними. В усложненных условиях и видеокарта Radeon R9 290X осталась позади.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты предельных математических тестов чаще всего соответствуют разнице по частотам и количеству вычислительных блоков, но лишь примерно, так как на результаты влияет и разная эффективность их использования в конкретных задачах, и оптимизация драйверов, и новейшие системы управления частотами и питанием, и даже упор в ПСП. В случае теста Mineral, новая модель видеокарты Radeon R9 Nano снова отстала от старшей модели на привычные 24%, что более-менее близко к теории.

А вот сравнение Radeon R9 Nano с платами GeForce в этом конкретном тесте приносит необычные выводы. Обновление архитектуры Nvidia с Kepler до Maxwell привело к тому, что новые чипы компании в таких тестах приблизились к конкурирующим решениям AMD, а то и обогнали их. Обе модели производства компании Nvidia показали высокую скорость, и даже GTX 970 не просто не уступила новинке AMD, а опередила ее с хорошим запасом. Похоже, что видеокарты компании AMD, основанные на чипе Fiji упираются во что-то, что не дает им возможности показать более высокие результаты. Скорее всего, для них тест слишком прост с точки зрения математических вычислений, так как даже Radeon R9 290X оказалась значительно быстрее новинки.

Рассмотрим еще один тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нем только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Во втором математическом тесте из нашего RigthMark мы видим уже несколько иные результаты видеокарт относительно друг друга, особенно это касается сравнения решений AMD и Nvidia. Новая модель Radeon R9 Nano в этот раз уже лишь на 22% медленнее Radeon R9 Fury X, основанной на точно таком же графическом чипе Fiji, работающем на большей частоте. Да и на фоне аналогичного решения из прошлого поколения на чипе Hawaii плата R9 Nano выступила уже лучше.

Модель Radeon R9 Nano оказалась медленнее старшей из видеокарт GeForce, но своего прямого конкурента по форм-фактору в лице GeForce GTX 970 новинка обогнала, хотя и совсем чуть-чуть. Можно лишь повторить, что с выпуском графических процессоров GM204 и GM200 компания Nvidia совершила довольно большой скачок по математической производительности, как минимум, отыграв отставание от конкурента, а местами и опередив его.

Direct3D 10: тесты геометрических шейдеров

В составе пакета RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трех уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близкое к двукратному. Задача эта для мощных современных видеокарт очень простая, и производительность в ней ограничена скоростью обработки геометрии, а иногда и пропускной способностью памяти и/или филлрейтом.

Разница между результатами видеокарт на чипах AMD и Nvidia явно в пользу решений калифорнийской компании, и, скорее всего, она обусловлена отличиями в геометрических конвейерах чипов этих компаний. В тестах геометрии платы GeForce всегда конкурентоспособнее Radeon, и в данном случае хорошо заметно, что видеочипы Nvidia имеют больше блоков по обработке геометрии, поэтому и выигрывают с заметным преимуществом.

Но компактная модель Radeon R9 Nano, основанная на графическом процессоре Fiji, в первом геометрическом тесте показала себя неплохо, оказавшись лишь на 8-15% медленнее Radeon R9 Fury X на базе того же чипа. А Radeon R9 290X из предыдущего поколения остался далеко позади. А вот сравнение с конкурентом менее радостное — новинка отстает и от GeForce GTX 980 и от GTX 970. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры изменились незначительно и для плат AMD и для решений Nvidia, поэтому это ничего особенно не меняет. Видеокарты в этом тесте геометрических шейдеров слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, поэтому и выводы остаются неизменными.

К сожалению, «Hyperlight» — второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load, в котором используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output, на всех современных видеокартах компании AMD просто не работает. В какой-то момент очередное обновление драйверов Catalyst привело к тому, что данный тест перестал запускаться на платах этой компании.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Наши предыдущие исследования показали, что на результаты этого теста может влиять и филлрейт и пропускная способность памяти, что видно по результатам плат Nvidia в простых режимах — они показывают скорость явно ниже, чем должны бы — обе платы GeForce оказываются почти на одном уровне, что явно не соответствует теории. Похоже, что все они во всех режимах упираются во что-то — возможно, нагрузка на GPU в этом тесте слишком слаба.

Новая сверхкомпактная плата компании AMD в этот раз оказалась медленнее всех, в том числе одночиповой топовой платы из предыдущего поколения в виде Radeon R9 290X, а также современной топовой платы на базе чипа Fiji, уступив последней снова примерно четверть, что объяснимо теорией. Зато непонятно, почему новинка уступила плате на Hawaii, так как она по всем параметрам сильнее предшествующей модели.

Также Radeon R9 Nano отстала и от обеих видеокарт Nvidia во всех режимах: GeForce GTX 980 и GTX 970 оказались заметно быстрее новинки в таких условиях. Посмотрим на производительность представленных в сравнении видеокарт в этом же тесте, но с увеличенным количеством текстурных выборок:

Ситуация на диаграмме заметно изменилась, устаревшее одночиповое решение компании AMD из предыдущего поколения потеряло больше всех остальных, но и это не позволило новой модели Radeon R9 Nano нагнать ее — видим небольшое преимущество Radeon R9 290X. R9 Nano показала скорость на 20-24% медленнее, чем Radeon R9 Fury X, что близко к теории. Ну а GeForce GTX 980 и GTX 970 и в этот раз впереди сверхкомпактной платы на чипе Fiji во всех режимах, даже в легком, где они явно не раскрываются полностью.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нем используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты во втором тесте вершинного текстурирования «Waves» не похожи на то, что мы видели на предыдущих диаграммах. Скоростные показатели пары плат GeForce в этом тесте довольно слабы, и новая модель AMD Radeon R9 Nano оказывается примерно на одном уровне с GeForce GTX 980, даже несмотря на отставание от Fury X на 20-22%. А вот если сравнивать новинку с платой на чипе Hawaii, то видно, что Radeon R9 290X во всех режимах быстрее не только R9 Nano, но и R9 Fury X. Рассмотрим второй вариант этой же задачи:

С усложнением задачи во втором тесте текстурных выборок скорость всех решений стала ниже, но видеокарты Nvidia снова пострадали сильнее. Правда, в наших выводах мало что меняется, разве что новая плата формата Mini-ITX модели Radeon R9 Nano в этот раз оказалась уже совершенно точно впереди не только своего прямого конкурента GeForce GTX 970, но и GTX 980.

Nano-модель оказалась медленнее предшественницы на основе чипа Hawaii и до четверти уступила старшей плате Radeon R9 Fury X, что близко к теоретической разнице между этими решениями, с учетом упора в предел потребления энергии и сброса реальной рабочей частоты с максимальных 1000 до 900 МГц.

3DMark Vantage: тесты Feature

Синтетические тесты из пакета 3DMark Vantage покажут нам то, что мы ранее упустили. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10, до сих пор актуальны и интересны тем, что отличаются от наших. При анализе результатов новейшей видеокарты модели Radeon R9 Nano в этом пакете мы сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark.

Feature Test 1: Texture Fill

Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Эффективность видеокарт AMD и Nvidia в текстурном тесте компании Futuremark достаточно высока и итоговые цифры разных моделей близки к соответствующим теоретическим параметрам. Разница в скорости между Radeon R9 Nano и R9 Fury X получилась равной 25% в пользу топового решения на базе чипа Fiji с системой водяного охлаждения, что близко к теории, учитывающей разницу в реальных рабочих частотах. Новая компактная плата показала средний результат между Radeon R9 290X из прошлого поколения и топовой R9 Fury X, но все же ближе к Hawaii.

Что касается сравнения скорости текстурирования новой видеоплаты компании AMD с представленными на диаграмме решениями конкурента, новинка по понятным причинам оказывается заметно быстрее пары GeForce, несмотря на сниженную относительно Fury X производительность. Даже GeForce GTX 980 по скорости текстурирования не достает до Radeon R9 290X, не говоря уже о R9 Nano. А ближайший конкурент в лице GTX 970 и вовсе чуть ли не вдвое отстает от выпущенной сегодня новинки — с текстурированием видеокарты компании AMD справляются заметно лучше плат Nvidia.

Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Значения производительности во втором подтесте 3DMark Vantage показывают скорость блоков ROP без учета величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), и тест измеряет именно производительность этой подсистемы. Рассматриваемая нами сегодня плата Radeon R9 Nano на полноценном чипе Fiji более чем вдвое быстрее модели Radeon R9 290X, основанной на чипе Hawaii, так как эффективность работы блоков ROP серьезно возросло. Топовая модель R9 Fury X оказалась быстрее R9 Nano всего лишь на 8% — в данном тесте частота GPU не падает слишком сильно.

Если сравнивать скорость заполнения сцены новой видеокартой Radeon R9 Nano с показателями видеокарт компании Nvidia, то можно отметить, что рассматриваемая сегодня плата в этом тесте показывает лучшую скорость заполнения сцены даже по сравнению со старшей из пары видеокарт GeForce, не говоря уже о более слабой модели GTX 970, являющейся ее ближайшим конкурентом по размеру и соответствию форм-фактору Mini-ITX.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.

Этот тест из пакета 3DMark Vantage отличается от проведенных нами ранее тем, что результаты в нем зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен верный баланс GPU, а также эффективность выполнения сложных шейдеров.

В данном случае важны и математическая и текстурная производительность, и в этой «синтетике» из 3DMark Vantage новая плата Radeon R9 Nano оказалась по скорости ровно между моделями R9 290X и R9 Fury X, основанными на базе полноценных графических процессоров Hawaii и Fiji, соответственно. Проигрыш перед Fury X составил 20%, что близко к теоретической разнице в скорости TMU и ALU, с учетом более низкой рабочей частоты GPU у Nano. Новая миниатюрная плата AMD в этом тесте снова показала результат лучше обеих плат Nvidia, которые отстали даже от Radeon R9 290X.

Feature Test 4: GPU Cloth

Четвертый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте также зависит сразу от нескольких параметров, но основными факторами влияния в этот раз должны являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. То есть, сильные стороны чипов Nvidia должны были проявиться, но мы традиционно отмечаем странный результат, когда видеокарты Nvidia уступают в этом подтесте всем решениям AMD. Которые также показали схожие цифры, даже Radeon R9 290X. Разница между Radeon R9 Nano и Fury X в этот раз равна 5%, что соответствует теории (разница между 1000 и 1050 МГц).

Сравнение с платами GeForce в этом тесте для новинки приятное — несмотря на теоретически меньшее количество геометрических исполнительных блоков и отставание по геометрической производительности чипов AMD, по сравнению с конкурирующими решениями, платы Radeon в этом тесте работают эффективнее и обгоняют все видеокарты GeForce, представленные в сравнении. Это больше похоже на отсутствие оптимизации в драйверах Nvidia под эту конкретную задачу и недостаточно эффективное ее выполнение.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.

Во втором «геометрическом» тесте из 3DMark Vantage ситуация другая, хотя она все равно довольно далека от того, что должно быть по теории. В этот раз выпущенная сегодня компактная плата Radeon R9 Nano оказалась заметно быстрее Radeon R9 290X, и уступила Fury X около 7%, что также близко к разнице в теоретических показателях.

Сравнение новинки AMD с парой видеокарт компании Nvidia и в этот раз достаточно приятное для нее — Radeon R9 Nano показала результат заметно быстрее конкурента в виде GeForce GTX 970, и даже более мощную одночиповую видеокарту соперника в виде GTX 980 она обогнала. Правда, тут нужно еще учитывать разницу в стоимости, а не только в габаритных размерах.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических вычислений.

В этом случае производительность решений не совсем соответствует теории, хотя и близка к тому, что мы видели в аналогичных тестах. В математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы видим распределение результатов, сильно отличающееся по сравнению со схожими тестами из нашего тестового пакета.

Видеочипы компании AMD с архитектурой GCN справляются с подобными задачами лучше решений конкурента в случаях, когда выполняется интенсивная «математика», касается это и данного подтеста из Vantage. Лишь топовая модель компании Nvidia, основанная на большом и сложном графическом процессоре GM200, в свое время серьезно подтянулась к решениям предыдущего поколения от компании AMD, но другие решения так и отстают от соответствующих Radeon. Что мы видим и в этот раз — мини-новинка показала скорость выше чем у GTX 980 и GTX 970.

Рассматриваемая сегодня видеоплата модели Radeon R9 Nano оказалась аж на 29% медленнее топовой R9 Fury X, что хоть и объяснимо с теоретической точки зрения, но говорит о том, что задача загружает блоки ALU работой так сильно, что частота GPU падает даже ниже 900 МГц. А вот по сравнению с Radeon R9 290X новинка выступила достаточно неплохо, обогнав ее даже при значительно меньшем потреблении энергии.

Direct3D 11: Вычислительные шейдеры

Чтобы протестировать свежевышедшее решение компании AMD в задачах, использующих такие возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы воспользовались примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, Nvidia и AMD.

Сначала мы рассмотрим тесты, использующие вычислительные (Compute) шейдеры. Их появление — одно из наиболее важных нововведений в последних версиях DX API, они уже используются в современных играх для выполнения различных задач: постобработки, симуляций и т. п. В первом тесте показан пример HDR-рендеринга с tone mapping из DirectX SDK, с постобработкой, использующей пиксельные и вычислительные шейдеры.

Сравнительная скорость расчетов в вычислительном и пиксельном шейдерах для всех плат AMD и Nvidia приблизительно одинаковая, хотя у видеокарт на основе GPU предыдущих архитектур наблюдались некоторые отличия. Судя по нашим предыдущим тестам, результаты в задаче часто зависят не столько от математической мощи и эффективности вычислений, сколько от других факторов, вроде пропускной способности памяти и эффективности блоков ROP.

В данном случае, малогабаритная видеокарта AMD показывает скорость примерно явно выше, чем обе платы GeForce от конкурента: GTX 980 и GTX 970. Устаревший Radeon R9 290X также остался далеко позади. Разница между Radeon R9 Nano и R9 Fury X оказалась равна 16-17%, что соответствует теории, учитывающей разницу в энергопотреблении и частоте. Переходим ко второму тесту вычислительных шейдеров, который также взят из Microsoft DirectX SDK. В нем показана расчетная задача гравитации N тел (N-body) — симуляция динамической системы частиц, на которую воздействуют такие физические силы, как гравитация.

В данном тесте чаще всего отмечается упор в скорость исполнения сложных математических вычислений, обработки геометрии и эффективность выполнения кода с ветвлениями. И в этом DX11-тесте расклад сил между решениями двух разных компаний всегда получается совершенно иным, по сравнению с любым другим тестом из предыдущих.

Нагрузка в тесте явно в пользу видеоплат GeForce, которые далеко впереди всех, а старшая GeForce GTX 980 так и вовсе оказывается более чем вдвое быстрее представленных решений компании AMD. Похоже, что данная задача заметно эффективнее рассчитывается на графических процессорах архитектуры Maxwell. Компактная новинка Radeon R9 Nano, основанная на графическом процессоре Fiji, заметно опередила Radeon R9 290X из предыдущего поколения, и лишь на 8% отстала от старшей модели Radeon R9 Fury X.

Direct3D 11: Производительность тесселяции

Еще одним важным нововведением в Direct3D 11 считается аппаратная тесселяция. Мы очень подробно рассматривали ее в своей теоретической статье про Nvidia GF100. Тесселяцию уже довольно давно начали использовать в DX11-играх, таких как STALKER: Зов Припяти, DiRT 2, Aliens vs Predator, Metro Last Light, Civilization V, Crysis 3, Battlefield 3 и более новых. В некоторых из них тесселяция используется для моделей персонажей, в других — для имитации реалистичной водной поверхности или ландшафта.

Существует несколько различных схем разбиения графических примитивов (тесселяции). Например, phong tessellation, PN triangles, Catmull-Clark subdivision. Так, схема разбиения PN Triangles используется в STALKER: Зов Припяти, а в Metro 2033 — Phong tessellation. Эти методы сравнительно быстро и просто внедряются в процесс разработки игр и существующие движки, поэтому и стали популярными.

Первым тестом тесселяции будет пример Detail Tessellation из ATI Radeon SDK. В нем реализована не только тесселяция, но и две разные техники попиксельной обработки: простое наложение карт нормалей и parallax occlusion mapping. Что ж, сравним DX11-решения AMD и Nvidia в различных условиях:

Увы, обычно все видеокарты Radeon показывают близкие результаты, но с момента выхода Radeon R9 Fury производительность плат на чипах Fiji в этом тесте по какой-то странной причине заметно упала, и Radeon R9 Nano показал очень низкие результаты — равные во всех трех режимах. Так что выводов по миниатюрной плате AMD в этом тесте не будет, так как его скорость явно ограничена какими-то недоработками в последних версиях драйверов AMD (Fury X тестировался на другой версии, вышедшей ранее).

Вторым тестом производительности тесселяции является еще один пример для 3D-разработчиков из ATI Radeon SDK — PN Triangles. Собственно, оба примера входят также и в состав DX SDK, так что мы уверены, что на их основе создают свой код игровые разработчики. Этот пример мы протестировали с различным коэффициентом разбиения (tessellation factor), чтобы понять, как сильно влияет его изменение на общую производительность.

В этом тесте применяется достаточно сложная геометрия, поэтому сравнение геометрической мощи различных решений вполне актуально. Представленные в материале решения неплохо справляются с легкой геометрической нагрузкой, показывая достаточно высокую скорость. Хотя в легких условиях графические процессоры Hawaii и Fiji в составе плат Radeon работают отлично, в двух тяжелых режимах платы Nvidia выходят вперед. И в этих самых сложных режимах новая плата модели Radeon R9 Nano оказалась в разы хуже конкурирующих с ней плат GeForce, что вполне объяснимо большим количеством геометрических блоков у последних.

Что же касается сравнения плат AMD, то рассматриваемая сегодня модель Radeon R9 Nano оказалась заметно медленнее одночипового аналога из предыдущего поколения в виде R9 290X — оптимизации геометрического конвейера в этом конкретном тесте не сработали, поэтому маленькая новинка компании во всех режимах уступает плате на основе чипа Hawaii. А от старшей модели Fury X отставание составило 8-19%, что близко к теоретической разнице в реальных тактовых частотах.

Рассмотрим результаты еще одного теста — демонстрационной программы Nvidia Realistic Water Terrain, также известной как Island. В этой демке используется тесселяция и карты смещения (displacement mapping) для рендеринга реалистично выглядящей поверхности океана и ландшафта.

Тест Island является одним из самых интересных — он не является чисто синтетическим тестом для измерения исключительно геометрической производительности GPU, так как содержит и сложные пиксельные и вычислительные шейдеры в том числе, и такая нагрузка ближе к реальным играм, в которых используются все блоки GPU, а не только геометрические, как в предыдущих тестах геометрии. Хотя основной все равно остается именно нагрузка на блоки обработки геометрии, но на результат может влиять и та же ПСП, например.

Мы тестируем все видеоплаты при четырех разных коэффициентах тесселяции — в данном случае настройка называется Dynamic Tessellation LOD. При первом коэффициенте разбиения треугольников, скорость не ограничена производительностью геометрических блоков, и видеокарты Radeon показывают довольно высокие результаты, даже превышающие показатели GeForce. Но уже на следующих ступенях геометрической нагрузки производительность платы Radeon серьезно снижается, и решения Nvidia выходят вперед.

Отставание новой компактной платы компании AMD на видеочипе Fiji от соперников в виде плат GeForce в таких тестах также присутствует. Хотя графический процессор Fiji заметно эффективнее работает в режиме смешанной нагрузки, и Radeon R9 Nano очень серьезно выигрывает у Radeon R9 290X в этом тесте, это не дает новинке догнать даже GeForce GTX 970, не говоря уже о GTX 980, что вполне объяснимо теорией. Впрочем, разница между R9 Nano и GTX 970 даже в тяжелых условиях не так уж велика. А сравнение с R9 Fury X показывает разницу 9-13%, что близко к цифрам из предыдущего теста.

***

Исходя из результатов синтетических тестов новой компактной видеокарты формата Mini-ITX модели AMD Radeon R9 Nano, основанной на полноценном графическом процессоре Fiji, а также результатам других моделей видеокарт обоих производителей дискретных видеочипов, можно сделать вывод, что рассматриваемая нами сегодня видеокарта является лучшей в своем классе — сегменте сверхминиатюрных видеокарт, предназначенных для установки в корпуса небольшого форм-фактора SFF.

Новая видеокарта компании AMD показывает хорошие результаты почти во всех синтетических тестах по сравнению с топовой платой Radeon из предыдущего поколения и с главным конкурентом от Nvidia в виде GeForce GTX 970 — именно такая модель присутствует на рынке в виде Mini-ITX-совместимых решений. Хотя это решение Nvidia и продается дешевле, чем Radeon R9 Nano, оно также имеет и заметно меньшую производительность, в том числе в синтетических тестах.

В игровых приложениях нагрузка на исполнительные блоки будет отличаться от «синтетической», но в среднем Radeon R9 Nano должен показать в играх скорость выше, чем недавняя топовая видеокарта модели Radeon R9 290X, и максимум на пару десятков процентов хуже нынешней топовой Radeon R9 Fury X. Это можно назвать очень высоким уровнем производительности для видеокарты столь компактного размера — по сути, у новинки нет реальных конкурентов.

Для того, чтобы определить скорость вышедшей платы AMD в игровых приложениях по сравнению с ближайшими конкурентами, в следующей части нашего материала мы протестируем Radeon R9 Nano в наборе игровых тестов и сравним скоростные показатели этой модели с конкурирующими. Можно предположить, что по игровой 3D-производительности новинка станет лучшей видеоплатой в своем миниатюрном классе, хотя и не будет обладать высоким соотношением цены и скорости рендеринга из-за достаточно высокой цены.



Средняя текущая цена (количество предложений) в московской рознице:
Рассматриваемые карты Конкуренты
R9 Nano — R9 390X —
R9 Nano — GTX 980 Ti —
R9 Nano — R9 Fury X —
R9 Nano — R9 Fury —
R9 Nano — Asus GTX 970 Mini —


Благодарим компанию AMD Russia
и лично Кирилла Погорелова
за предоставленную на тестирование видеокарту

Блок питания Thermaltake DPS G 1050W для тестового стенда предоставлены компанией Thermaltake

Корпус Corsair Obsidian 800D Full Tower для тестового стенда предоставлен компанией Corsair

Модули памяти G.Skill Ripjaws4 F4-2800C16Q-16GRK для тестового стенда предоставлены компанией G.Skill

Corsair Hydro SeriesT H100i CPU Cooler для тестового стенда предоставлен компанией Corsair

Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт

Системная плата Asrock Fatal1ty X99X Killer для тестового стенда предоставлена компанией Asrock

Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate

2 накопителя SSD Corsair Neutron SeriesT 120 ГБ для тестового стенда предоставлены компанией Corsair