Видеоускоритель AMD Radeon RX 460

Часть 2: особенности карты, результаты синтетических тестов


Содержание

Данная часть знакомит читателей с особенностями видеокарты, а также с результатами синтетических тестов.

Устройство(а)

Sapphire Nitro+ Radeon RX 460 4G D5 4 ГБ 128-битной GDDR5
ПараметрЗначениеНоминальное значение (референс)
GPURadeon RX 460 (Polaris 11)
ИнтерфейсPCI Express x16
Частота работы GPU (ROPs), МГц1100—12501096—1200
Частота работы памяти (физическая (эффективная)), МГц1750 (7000)1750 (7000)
Ширина шины обмена с памятью, бит128
Число вычислительных блоков в GPU14
Число операций (ALU) в блоке64
Суммарное количество блоков ALU896
Число блоков текстурирования (BLF/TLF/ANIS)56
Число блоков растеризации (ROP)16
Размеры, мм220×110×35190×100×35
Количество слотов в системном блоке, занимаемые видеокартой22
Цвет текстолитачерныйчерный
ЭнергопотреблениеПиковое в 3D, Вт7274
В режиме 2D, Вт1515
В режиме «сна», Вт33
Уровень шумаВ режиме 2D, дБА20,020,0
В режиме 2D (просмотр видео), дБА20,020,0
В режиме максимального 3D, дБА30,530,5
Выходные гнезда1×DVI (Dual-Link/HDMI), 1×HDMI 2.0b, 1×DisplayPort 1.3/1.41×HDMI 2.0b, 2×DisplayPort 1.3/1.4
Поддержка многопроцессорной работыCrossFire
Максимальное количество приемников/мониторов для одновременного вывода изображения33
Дополнительное питание: количество 8-контактных разъемовНетНет
Дополнительное питание: количество 6-контактных разъемов11
Максимальное разрешение 2DDisplay Port4096×2160
HDMI4096×2160
Dual-Link DVI2560×1600
Single-Link DVI1920×1200
Максимальное разрешение 3DDisplay Port4096×2160
HDMI4096×2160
Dual-Link DVI2560×1600
Single-Link DVI1920×1200

Комплектация локальной памятью
Карта имеет 4 ГБ памяти GDDR5 SDRAM, размещенной в 4 микросхемах по 8 Гбит на лицевой стороне PCB.

Микросхемы памяти Micron (GDDR5). Микросхемы рассчитаны на номинальную частоту работы в 1750 (7000) МГц.

Сравнение с эталонным дизайном (reference)
Вид спереди
Sapphire Nitro+ Radeon RX 460 4G D5 4 ГБ 128-битной GDDR5 Reference card AMD Radeon R7 360
Вид сзади
Sapphire Nitro+ Radeon RX 460 4G D5 4 ГБ 128-битной GDDR5 Reference card AMD Radeon R7 360

Radeon RX 460 является, по сути, наследником R7 360 (R9 260X), поэтому с R7 360 мы и будем сравнивать (к тому же компания AMD не предоставила нам референс-карту новинки). Обе карты имеют 128-битную шину обмена с памятью.

Схема питания имеет 5 фаз и традиционно управляется цифровым контроллером IOR 35678. В системе питания используются дроссели Sapphire Black Diamond Choke последнего поколения, которые, согласно декларации производителя, на 10% холоднее и на 25% экономичнее. Использование таких катушек гарантирует отсутствие многим хорошо известного свиста дросселей при нагрузках.

Регулирование частот и напряжений можно делать с помощью фирменной утилиты Sapphire Trixx 3.0, которая поставляется с картой на диске, а также ее можно скачать с сайта производителя.

Система охлаждения
Главной частью кулера является пластинчатый никелированный радиатор. Две тепловые трубки, впрессованные в медное основание, обеспечивают равномерное распределение тепла по ребрам радиатора.

Поверх радиатора установлен кожух с двумя вентиляторами, работающими на одинаковой частоте вращения. Особенностью данной системы охлаждения является остановка вентиляторов в случае простоя при малом нагреве GPU. Поэтому не стоит пугаться, если при запуске ПК вентиляторы на ускорителе не вращаются.

Микросхемы памяти охлаждаются центральным радиатором, а силовые транзисторы имеют свой небольшой радиатор.

Следует отметить, что оборотная сторона PCB оснащена особой подсветкой логотипа.

После 6-часового прогона под нагрузкой максимальная температура ядра не превысила 64 градусов, что является хорошим результатом для видеокарты такого уровня.
Мониторинг температурного режима с помощью MSI Afterburner (автор А. Николайчук AKA Unwinder).

Методика измерения шума

  • Помещение шумоизолировано и заглушено, снижены реверберации.
  • Системный блок, в котором исследовался шум видеокарт, не имеет вентиляторов, не является источником механического шума.
  • Фоновый уровень 20 дБА — это уровень шума в комнате и уровень шумов собственно шумомера.
  • Измерения проводились на расстоянии 50 см от видеокарты на уровне системы охлаждения.
  • Режимы измерения:
    1. Режим простоя в 2D: загружен интернет-браузер с сайтом iXBT.com, окно Microsoft Word, ряд интернет-коммуникаторов.
    2. Режим 2D с просмотром фильмов: используется SmoothVideo Project (SVP) — аппаратное декодирование со вставкой промежуточных кадров.
    3. Режим 3D с максимальной нагрузкой на ускоритель: используется тест FurMark.

В режиме простоя в 2D вентиляторы не работали, при этом температура графического ядра не поднималась выше 30 градусов, а уровень шума был равен фоновому и составлял 20,0 дБА.

При просмотре фильма с аппаратным декодированием температура графического ядра медленно вырастала до 45 градусов, вентиляторы по-прежнему не работали, уровень шума оставался тем же — 20,0 дБА.

В режиме максимальной нагрузки в 3D температура достигала уровня 64 °C, при этом частота вращения вентиляторов поднималась до 1535 оборотов в минуту, шум вырастал до 30,5 дБА. В результате мы можем говорить о тихой СО при работе в 3D (при меньших нагрузках она просто бесшумная).

Термоснимок



Наиболее нагретая область — в районе преобразователей напряжения и GPU.


Комплектация
Базовый комплект поставки должен включать в себя руководство пользователя, диск с драйверами и утилитами. Перед нами базовый комплект.

Упаковка

Установка и драйверы

Конфигурация тестового стенда

  • Компьютер на базе процессора Intel Core i7-5960X (Socket 2011):
    • процессор Intel Core i7-5960X (o/c 4 ГГц);
    • СО Intel Thermal Solution RTS2011LC;
    • системная плата ASRock Fatal1ty X99X Killer на чипсете Intel X99;
    • оперативная память 16 ГБ DDR4 G.Skill Ripjaws4 F4-2800C16Q-16GRK 2800 МГц;
    • жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA2;
    • 2 SSD Corsair Neutron SSD CSSD-N120GB3-BK;
    • блок питания Thermaltake Toughpower DPS G 1050W (1050 Вт);
    • корпус Corsair Obsidian 800D Full Tower.
  • операционная система Windows 10 Pro 64-битная; DirectX 12;
  • монитор Samsung U28D590D (28″);
  • драйверы AMD версии Crimson Edition 16.7.1 (для Radeon RX 460 — 16.8.1);
  • драйверы Nvidia версии 368.81;
  • VSync отключен.


Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

В качестве синтетических тестов DirectX 11 мы использовали примеры из пакетов SDK компаний Microsoft и AMD, а также демонстрационную программу Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010). Мы взяли и приложения обоих производителей видеочипов: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain, также известная как Island11.

Синтетические тесты проводились на следующих видеокартах:

  • Radeon RX 460 со стандартными параметрами (сокращенно RX 460)
  • Radeon RX 470 со стандартными параметрами (сокращенно RX 470)
  • Radeon R7 370 со стандартными параметрами (сокращенно R7 370)
  • GeForce GTX 950 со стандартными параметрами (сокращенно GTX 950)
  • GeForce GTX 750 Ti со стандартными параметрами (сокращенно GTX 750 Ti)

Как обычно в последнее время, выбрать соперников для анализа производительности новой модели Radeon в синтетических тестах было непросто. Прямых конкурентов из нового поколения Pascal компании Nvidia еще нет, да и какой именно из Radeon предыдущего поколения считать предшественником новинки — тоже непонятно. Мы решили взять близкую по позиционированию видеоплату Radeon R7 370, а также модель нового поколения Radeon RX 470, основанную на урезанной версии графического процессора Polaris 10 — чтобы понять, насколько сильно Polaris 11 отстает от старшего GPU.

Из видеокарт конкурирующей компании Nvidia для нашего сравнения мы также взяли две модели, близкие по скорости и цене к новому решению AMD. Видеокарта GeForce GTX 750 Ti основана еще на архитектуре Maxwell первого поколения и вряд ли сможет тягаться с новинкой на равных. А вот взятая второй GeForce GTX 950 уже на чипе Maxwell второго поколения будет, скорее всего, куда ближе к новинке и в синтетических тестах и играх. Эти две видеокарты сейчас и можно считать относительными конкурентами для Radeon RX 460.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

От DirectX 9 тестов мы давно отказались, а во вторую версию RightMark3D вошли два ранее знакомых теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также еще два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Эти тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нем используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

В этом тесте производительность больше зависит от количества и эффективности блоков TMU, но на результат обычно влияет также и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает еще и эффективный филлрейт и пропускная способность памяти. Результаты при детализации уровня «High» получаются несколько ниже, чем при детализации «Low».

В задачах процедурной визуализации меха с большим количеством текстурных выборок, решения компании AMD давно вышли на лидирующие позиции — еще со времени выпуска первых видеочипов на базе архитектуры GCN. Платы Radeon до сих пор выступают несколько лучше в этих сравнениях, что говорит о высокой эффективности выполнения ими этих программ, хотя конкретно Polaris все же немного сдал позиции, так как вышедшая сегодня видеокарта Radeon RX 460 уступила предшествующему решению в виде Radeon R7 370, чего мы совсем не ожидали. Скорость RX 460 составляет примерно 53-54% от производительности RX 470, что близко к разнице в теоретических показателях.

Но даже при отставании от R7 370, новая видеоплата компании AMD в первом Direct3D 10-тесте хоть и немного, но все же обошла модель GeForce GTX 950 — старшую из пары решений Nvidia, которые мы взяли для сегодняшнего сравнения. А уж младшая GeForce GTX 750 Ti уступила всем остальным видеокартам, ожидаемо став худшей в этом тесте. Посмотрим на результат в этой же задаче, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: в такой ситуации что-то должно измениться, и ПСП с филлрейтом будут влиять меньше:

В усложненных условиях результаты теста почти всегда получаются несколько интереснее. Новая видеокарта модели Radeon RX 460 все так же отстает от аналогичной по позиционированию модели из прошлого поколения Radeon R7 370, уступив старшей RX 470 примерно все те же 50%, как и должно быть, исходя из теоретических параметров GPU. Преимущество перед конкурентами в виде GeForce GTX 950 и GTX 750 Ti возросло еще больше, особенно что касается младшей платы Nvidia из предыдущего поколения, которая уступила новинке даже чуть более чем вдвое.

Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis, Lost Planet и многих других. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип еще примерно в два раза — такой режим называется «High».

Диаграмма в целом схожа с предыдущей, также без учета суперсэмплинга, и в этом тесте новая модель видеокарты Radeon RX 460 также оказалась явно слабее модели Radeon R7 370. Скорость новинки по сравнению со старшей видеокартой на Polaris 10 оказалась примерно на уровне 55%, что очень близко к теоретическим цифрам разницы в скорости блоков ROP и по ПСП.

Если сравнивать новинку с конкурирующими с ней на данный момент времени видеокартами компании Nvidia из предыдущих поколений, то и в этом тесте новинка выступает немного лучше уровня более дорогой GeForce GTX 950, и не заметно впереди GeForce GTX 750 Ti, основанной на GPU первого поколения Maxwell. Посмотрим, что изменит включение суперсэмплинга:

При включении суперсэмплинга и самозатенения задача становится тяжелее, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьезное падение производительности. Разница между скоростными показателями протестированных видеокарт немного изменилась, хотя включение суперсэмплинга и сказывается несколько меньше, чем в предыдущем случае.

Эти условия почти не сказались на соотношении сил в нашем сравнении, графические решения AMD Radeon и в этом D3D10-тесте пиксельных шейдеров всегда работают эффективнее конкурирующих плат GeForce, и только новые модели, основанные на архитектуре Pascal, могут хоть как-то противостоять им, но в данном ценовом сегменте таковых еще нет. А платы предыдущего поколения, вроде GeForce GTX 950, выступают все же несколько слабее конкурентов, не говоря уже о GTX 750 Ti, откровенно не тянущей на уровень соперников. Младшая модель семейства Radeon 400 в этот раз показала результат примерно на уровне Radeon R7 370, а ее скорость относительно старшей Radeon RX 470 составляет все те же привычные 54-55%.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты предельных математических тестов чаще всего лишь примерно соответствуют разнице по частотам и количеству вычислительных блоков, потому что на результаты влияет и разная эффективность их использования в конкретных задачах, и оптимизация драйверов, и новейшие системы управления частотами и питанием, и даже упор в ПСП. Мы ранее отмечали, что в нашем первом тесте Mineral, видеокарты не всегда показывают показательные результаты, и этот тест не полностью отражает реальность.

Видеокарта Radeon RX 460 на новом бюджетном чипе Polaris 11 в этом тесте оказалась самой медленной из представленных в сравнении видеокарт, проиграв не только другим Radeon, но и платам компании Nvidia! Такого раньше просто не было, чтобы Radeon в математических тестах был хуже конкурирующих с ним GeForce, а в этот раз даже GeForce GTX 750 Ti оказалась быстрее — явно тут что-то нечисто. Понятно, что новинка уступила и Radeon R7 370, а ее скорость в сравнении с RX 470 оказалась на уровне 53%, что близко к теоретическим цифрам.

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нем только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Вот во втором математическом тесте из нашего RigthMark соотношение между скоростью видеокарт относительно друг друга уже ближе к теории и другим тестам, свежая модель Radeon RX 460 уже заметно ближе к уровню Radeon R7 370, хотя все равно отстала от этой модели предыдущего поколения. Что касается сравнения с GeForce, то в этот раз она впереди GTX 750 Ti, но всего на 10%, а GTX 950 оказалась снова быстрее. Видеокарта на графическом процессоре Polaris 11 снова показала скорость рендеринга в 53% от модели Radeon RX 470, что близко к соответствующей теоретической разнице, хотя говорит скорее об упоре в ПСП или производительность блоков ROP.

Direct3D 10: тесты геометрических шейдеров

В составе пакета RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трех уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близкое к двукратному. Задача эта для мощных современных видеокарт довольно простая, и производительность в ней ограничена скоростью обработки геометрии, а иногда и пропускной способностью памяти и/или филлрейтом.

Разница между результатами видеокарт Nvidia и AMD почти всегда в пользу решений первой, что обусловлено отличиями в геометрических конвейерах чипов этих компаний. В тестах геометрии старшие платы GeForce всегда конкурентоспособнее Radeon, но в данном случае видеочипы Nvidia бюджетные, а у них не такое уж и большое количество геометрических блоков. Поэтому лучшим в сравнении является самый производительный Radeon RX 470.

Выпущенная же сегодня модель Radeon RX 460 хоть и имеет специальные оптимизации и показывает неплохой результат выше уровня Radeon R7 370, но этого хватает лишь для того, чтобы быть на уровне GTX 750 Ti, а GTX 950 в этом тесте заметно быстрее. Разница между RX 470 и RX 460 снова составила около двух раз, соответственно теории: в Polaris 11 вдвое меньше геометрических блоков, чем в Polaris 10. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры изменились не слишком сильно и для плат AMD и для решений Nvidia. Видеокарты в этом тесте геометрических шейдеров слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, поэтому и наши выводы не изменились. Radeon RX 460 в этом подтесте показала результат быстрее Radeon R7 370, и примерно на уровне с GeForce GTX 750 Ti. Ну а GTX 950 явно быстрее в обработке геометрии. Скорость новой Radeon составила уже привычные 54-56% от производительности старшего решения на Polaris 10.

К сожалению, «Hyperlight» — второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load, в котором используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output, на всех современных видеокартах компании AMD не работает. Этот тест давно перестал запускаться на платах этой компании, и ошибка не исправлена вот уже несколько лет.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Наши предыдущие исследования показали, что на результаты этого теста может влиять и филлрейт и пропускная способность памяти, ограничивающая производительность, что особенно хорошо заметно и по результатам плат Nvidia, которые в простых режимах не сильно быстрее себя же в более тяжелом, и по скорости новых видеокарт компании AMD на чипах семейства Polaris. Особенно это касается новинки на Polaris 11, скорость которой в этом тесте явно ограничена ПСП или блоками ROP.

Лидером в этом тесте стала старшая плата компании AMD — Radeon RX 470. Новинка в этот раз снова уступила Radeon R7 370, а ее производительность составила 53-55% от скорости рендеринга средней модели нового поколения — Radeon RX 470, что близко к теоретической разнице. Посмотрим на производительность представленных в сравнении видеокарт в этом же тесте, но с увеличенным количеством текстурных выборок:

В таких условиях ситуация на диаграмме сильно изменилась, решения компании AMD в тяжелых режимах потеряли значительно больше плат GeForce, хотя Radeon RX 470 и продолжает лидировать. Новая модель Radeon RX 460 в самых сложных условиях показала скорость на уровне Radeon R7 370, уступив ей в легких режимах. Производительность новинки составила 53-54% от скорости старшей платы этого же поколения, ровно по теории. Если сравнивать результаты RX 460 с двумя GeForce, то новинка проиграла им обеим во всех режимах — этот тест явно благоволит GPU производства Nvidia.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нем используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты во втором тесте вершинного текстурирования «Waves» не похожи на то, что мы видели на предыдущих диаграммах, в этот раз решения Nvidia выступили хуже. Хотя главное не это — в этот раз явным аутсайдером сравнения стала выпущенная сегодня на рынок модель Radeon RX 460, отставшая от всех в этом тесте. Лидером тут по понятным причинам является модель Radeon RX 470 на урезанном Polaris 10, а новинка показывает скорость на уровне 52-53% от нее, что соответствует теории. Обеим GeForce новая модель проиграла, хотя в тяжелом режиме отставание и небольшое. Рассмотрим второй вариант этой же задачи:

С усложнением задачи во втором тесте текстурных выборок скорость всех решений стала ниже, а видеокарты Nvidia пострадали чуть больше своих конкурентов. Но в выводах мало что меняется, рассматриваемая сегодня плата Radeon RX 460 находится примерно на одном уровне с GeForce GTX 750 Ti, совсем чуть-чуть уступая GTX 950. Увы, но остальные видеокарты Radeon в нашем сравнении оказались заметно быстрее новинки, что устаревшая Radeon R7 370, что младшая плата на Polaris 10. К слову, скорость RX 460 составила привычные 51-53% от производительности RX 470 — что снова соответствует теории.

3DMark Vantage: тесты Feature

Синтетические тесты из пакета 3DMark Vantage могут показать нам то, что мы ранее упустили. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10, до сих пор актуальны и интересны тем, что отличаются от наших. При анализе результатов видеокарты Radeon RX 460 в этом пакете мы наверняка сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark.

Feature Test 1: Texture Fill

Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Эффективность видеокарт AMD и Nvidia в текстурном тесте компании Futuremark достаточно высока и итоговые цифры разных моделей близки к соответствующим теоретическим параметрам. Разница в скорости между Radeon RX 470 и Radeon RX 460 оказалась близкой к теоретической, младшая плата снова показала около 55% от результата старшей. Интересно, что Radeon R7 370 в этом тесте совсем чуть-чуть отстала от новинки.

Что касается сравнения скорости текстурирования нового бюджетного решения Radeon текущего поколения с присутствующими на рынке решениями конкурента, то RX 460 не только показала результат заметно выше, чем у GeForce GTX 750 Ti, но и смогла с приличным запасом обойти более свежее решение Nvidia на базе чипа Maxwell второго поколения. За такие хорошие показатели в этом тесте можно благодарить сравнительно большое количество блоков текстурирования у решений AMD архитектуры GCN, что явно работает в их пользу.

Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Цифры второго подтеста 3DMark Vantage показывают производительность блоков ROP, без учета величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), и тест измеряет именно производительность ROP. Рассматриваемая нами сегодня видеоплата Radeon RX 460 прилично опередила свою предшественницу R7 370, выступив на уровне остальных решений довольно сильно, имея лишь 16 блоков ROP.

Разница между двумя платами на Polaris 10 и Polaris 11 и в этом тесте оказалась привычной — RX 460 ровно вдвое медленнее RX 470, точно по теории. Если сравнивать скорость заполнения сцены новой видеокартой компании AMD с результатами ускорителей GeForce, то рассматриваемая сегодня плата показала скорость производительность в этом тесте чуть ли не вдвое выше, чем у GeForce GTX 750 Ti, но все же прилично уступила более мощной модели GTX 950. В этом тесте важно не только само по себе большое количество блоков ROP, но и эффективность соответствующих оптимизаций по работе с буфером кадра.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника давно используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.

Данный тест из пакета 3DMark Vantage отличается от проведенных нами ранее тем, что результаты в нем зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен верный баланс GPU, а также эффективность выполнения сложных шейдеров.

Тут важны и математическая и текстурная производительность, и в этой «синтетике» из 3DMark Vantage новая плата Radeon на базе чипа Polaris 11 показала результат точно на уровне предшественницы из предыдущего поколения Radeon R7 370. Разница между RX 470 и RX 460 и в этом тесте не удивила — новинка показала скорость в 53% от старшей модели, что соответствует теории и всем остальным нашим тестам. Показательно, что обе GeForce в этом тесте показали слабые результаты, GeForce GTX 750 Ti ожидаемо стала худшей, но даже и GTX 950 немного уступила рассматриваемой сегодня новинке.

Feature Test 4: GPU Cloth

Четвертый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте зависит сразу от нескольких параметров, и основными факторами влияния в теории должны являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. То есть, сильные стороны чипов Nvidia должны проявляться, но увы — мы давно отмечаем аномально низкие результаты плат GeForce. Да и в целом все цифры довольно странные. К примеру, в этом тесте новая видеокарта компании AMD показала скорость в 78% от уровня Radeon RX 470 — и это единственный синтетический тест, в котором мы увидели что-то отличное от привычных 50-55%.

Скорость RX 460 в этом тесте полностью соответствует производительности Radeon R7 370, зато обе GeForce далеко позади. Несмотря на меньшее количество геометрических исполнительных блоков и отставание по геометрической производительности для чипов компании AMD, по сравнению с конкурирующими решениями, платы Radeon в этом тесте по каким-то причинам работают куда более эффективно, обгоняя абсолютно все видеокарты GeForce, представленные в сравнении. Вышедшая сегодня плата Radeon RX 460 практически вдвое быстрее как GeForce GTX 750 Ti, так и GTX 950.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.

Во втором «геометрическом» тесте из 3DMark Vantage ситуация ближе к той, что мы видели ранее в математических тестах. И в этот раз новая модель видеокарты Radeon RX 460 уже показывает результат хуже, чем у видеокарты Radeon R7 370 прошлого поколения. Если сравнивать Polaris 11 и Polaris 10, то тут все стандартно — скорость младшей модели составила 56% от показателей старшей, что близко к теории. Новая плата компании AMD чуть-чуть не достала по скорости рендеринга до GeForce GTX 950, зато смогла обогнать GeForce GTX 750 Ti на чипе Maxwell первого поколения. В целом, результат в геометрических тестах для чипа Polaris 11 можно признать неплохим.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом для GPU, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических вычислений.

В математическом тесте из пакета компании Futuremark производительность решений хоть и не полностью соответствует теории, но близка к тому, что должно быть, исходя из пиковых показателей. В данном чисто математическом тесте, показывающем пиковую производительность видеочипов в предельных задачах, мы видим распределение результатов, несколько отличающееся от того, что мы получили в схожих тестах из нашего тестового пакета.

Мы помним, что видеочипы компании AMD с архитектурой GCN, включая Polaris, справляются лучше решений конкурента в подобных задачах, когда выполняется интенсивная «математика». Только самые новые модели видеокарт компании Nvidia, основанные на архитектуре Pascal, также показывают высокую скорость, но пока что в бюджетном сегменте таких решений нет. На данный момент Radeon RX 460 по скорости ожидаемо находится ровно между GeForce GTX 750 Ti и GTX 950. Увы, но новинка AMD снова уступила Radeon R7 370 из предыдущего поколения — тягаться с этой моделью непросто. Остается добавить, что скорость Radeon RX 460 составляет 55% от производительности старшей модели RX 470, что снова очень близко к теоретической разнице.

***

По результатам синтетических тестов новой видеокарты AMD Radeon RX 460, основанной на новом графическом процессоре Polaris 11, принадлежащем к бюджетному сегменту, а также результатам других моделей видеокарт обоих производителей видеочипов этого же класса, можно сделать вывод о том, что рассмотренная сегодня видеокарта стала довольно типичным представителем своего ценового диапазона.

Рассмотренная видеокарта AMD Radeon RX 460 в целом показала неплохие результаты в синтетических тестах, оказавшись точно быстрее GeForce GTX 750 Ti, а иногда даже была быстрее GeForce GTX 950. Хотя в некоторых тестах были и проигрыши, но это вошло в привычку — решения компании AMD традиционно отличаются более эффективным исполнением интенсивных вычислительных задач, а графические процессоры Nvidia отыгрываются в геометрических тестах.

Единственное, что настораживает — слишком частые проигрыши новинки своей предшественнице из предыдущего поколения, Radeon R7 370. Понятно, что эти GPU все же сильно отличаются по сложности и немного по позиционированию, но тягаться с R7 370 в играх новинке будет непросто. Да и Nvidia еще не выкатила свой вариант бюджетной видеоплаты на графическом процессоре архитектуры Pascal. Это сейчас у третьей видеокарты семейства Polaris нет равного соперника из стана Nvidia, также использующего преимущество нового FinFET-техпроцесса, а потом будет сложнее. Впрочем, что-то вроде GeForce GTX 1050 наверняка будет и быстрее и дороже, и еще не факт, что Nvidia быстро выпустит видеокарту на замену GeForce GTX 950 на основе Pascal. А в текущем сравнении Radeon RX 460 с GeForce GTX 750 Ti и даже GTX 950 новинка AMD выглядит несколько предпочтительнее. И позволит AMD заработать благодаря своей меньшей себестоимости.

Судя по производительности в синтетических тестах, можно сказать, что Radeon RX 460 по скорости часто находится между GeForce GTX 750 Ti и GTX 950, а также близко к Radeon R7 370 — думаем, что так будет и в игровых приложениях. В следующей части нашего материала мы рассмотрим производительность новинки по сравнению с конкурентами в реальных игровых приложениях, протестировав Radeon RX 460 и другие решения в нашем наборе современных игр.



Средняя текущая цена (количество предложений) в московской рознице:
Рассматриваемые карты Конкуренты
RX 460 4 ГБ — 9200  (на 01.12.16) GTX 950 2 ГБ — 11 700  (на 01.12.16)
RX 460 4 ГБ — 9200  (на 01.12.16) GTX 750 Ti 2 ГБ — 8000  (на 01.12.16)
RX 460 4 ГБ — 9200  (на 01.12.16) R7 360 2 ГБ — 6900  (на 01.12.16)
RX 460 4 ГБ — 9200  (на 01.12.16) R7 370 2 ГБ — 10 500  (на 01.12.16)
Sapphire Nitro+ RX 460 4 ГБ — $152 (на 10.08.16) RX 460 4 ГБ — 9200  (на 01.12.16)


Благодарим компанию AMD Russia
и лично Павла Подольского
за предоставленную на тестирование видеокарту

Блок питания Thermaltake DPS G 1050W для тестового стенда предоставлены компанией Thermaltake

Корпус Corsair Obsidian 800D Full Tower для тестового стенда предоставлен компанией Corsair

Модули памяти G.Skill Ripjaws4 F4-2800C16Q-16GRK для тестового стенда предоставлены компанией G.Skill

Corsair Hydro SeriesT H100i CPU Cooler для тестового стенда предоставлен компанией Corsair

Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт

Системная плата ASRock Fatal1ty X99X Killer для тестового стенда предоставлена компанией ASRock

Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate

2 накопителя SSD Corsair Neutron SeriesT 120 ГБ для тестового стенда предоставлены компанией Corsair




Дополнительно

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.