Содержание
- Часть 1 — Теория и архитектура
- Часть 2 — Практическое знакомство
- Часть 3 — Результаты игровых тестов и выводы
Справочные материалы
Данная часть знакомит читателей с особенностями видеокарты, а также с результатами синтетических тестов.
Устройство(а)
Asus Strix RX 470 4 ГБ 256-битной GDDR5 PCI-E (STRIX-RX470-O4G-GAMING) | |||
---|---|---|---|
Параметр | Значение | Номинальное значение (референс) | |
GPU | Radeon RX 470 (Polaris 10) (P/N 779207-00142 YV09J2-A02) | ||
Интерфейс | PCI Express x16 | ||
Частота работы GPU (ROPs), МГц | 926—1270 | 926—1206 | |
Частота работы памяти (физическая (эффективная)), МГц | 1650 (6600) | 1650 (6600) | |
Ширина шины обмена с памятью, бит | 256 | ||
Число вычислительных блоков в GPU | 32 | ||
Число операций (ALU) в блоке | 64 | ||
Суммарное количество блоков ALU | 2048 | ||
Число блоков текстурирования (BLF/TLF/ANIS) | 128 | ||
Число блоков растеризации (ROP) | 32 | ||
Размеры, мм | 240×120×38 | 220×100×35 | |
Количество слотов в системном блоке, занимаемые видеокартой | 2 | 2 | |
Цвет текстолита | черный | черный | |
Энергопотребление | Пиковое в 3D, Вт | 121 | 118 |
В режиме 2D, Вт | 16 | 18 | |
В режиме «сна», Вт | 3 | 3 | |
Уровень шума | В режиме 2D, дБА | 20,0 | 22,5 |
В режиме 2D (просмотр видео), дБА | 28,0 | 22,5 | |
В режиме максимального 3D, дБА | 35,5 | 42,5 | |
Выходные гнезда | 2×DVI (Dual-Link/HDMI), 1×HDMI 2.0b, 1×DisplayPort 1.3/1.4 | 1×HDMI 2.0b, 3×DisplayPort 1.3/1.4 | |
Поддержка многопроцессорной работы | CrossFire | ||
Максимальное количество приемников/мониторов для одновременного вывода изображения | 4 | 4 | |
Дополнительное питание: количество 8-контактных разъемов | Нет | Нет | |
Дополнительное питание: количество 6-контактных разъемов | 1 | 1 | |
Максимальное разрешение 2D | Display Port | 4096×2160 | |
HDMI | 4096×2160 | ||
Dual-Link DVI | 2560×1600 | ||
Single-Link DVI | 1920×1200 | ||
Максимальное разрешение 3D | Display Port | 4096×2160 | |
HDMI | 4096×2160 | ||
Dual-Link DVI | 2560×1600 | ||
Single-Link DVI | 1920×1200 |
Комплектация локальной памятью | |
---|---|
Карта имеет 4 ГБ памяти GDDR5 SDRAM, размещенной в 8 микросхемах по 4 Гбит на лицевой стороне PCB. Микросхемы памяти SK Hynix (GDDR5). Микросхемы рассчитаны на номинальную частоту работы в 1500 (6000) МГц. |
Как можно догадаться, Radeon RX 470 получается из RX 480 (просто ядро обрезано по блокам и снижены частоты работы ядра и памяти), поэтому PCB у них, по сути, идентичные. Так что сравнивать мы будем как раз с RX 480. Впрочем, у нас сегодня не референс-карта RX 470, а продукт Asus, а там все свое. Плата полностью спроектирована инженерами Asus.
Следует заметить, что на торце в хвостовой части карты имеется 4-контактный разъем питания для корпусного вентилятора. Переключив его с материнской платы либо установив дополнительно, можно заставить его работать в соответствии с нагревом GPU (увеличивая или уменьшая обороты).
Блок питания также переработан. Схема питания имеет 6 фаз (4+2) и управляется цифровым контроллером Digi+ ASP1211. Традиционно для Asus система питания исполнена по технологии Super Alloy Power II, использующей современные твердотельные конденсаторы. Мониторингом состояния управляет контроллер IT8705F/AF производства компании ITE (Integrated Technology Express).
Мониторинг температурного режима с помощью MSI Afterburner (автор А. Николайчук AKA Unwinder). |
---|
Методика измерения шума
- Помещение шумоизолировано и заглушено, снижены реверберации.
- Системный блок, в котором исследовался шум видеокарт, не имеет вентиляторов, не является источником механического шума.
- Фоновый уровень 20 дБА — это уровень шума в комнате и уровень шумов собственно шумомера.
- Измерения проводились на расстоянии 50 см от видеокарты на уровне системы охлаждения.
- Режимы измерения:
- Режим простоя в 2D: загружен интернет-браузер с сайтом iXBT.com, окно Microsoft Word, ряд интернет-коммуникаторов.
- Режим 2D с просмотром фильмов: используется SmoothVideo Project (SVP) — аппаратное декодирование со вставкой промежуточных кадров.
- Режим 3D с максимальной нагрузкой на ускоритель: используется тест FurMark.
В режиме простоя в 2D вентиляторы не работали, при этом температура графического ядра не поднималась выше 34 градусов, а уровень шума был равен фоновому и составлял 20,0 дБА.
При просмотре фильма с аппаратным декодированием температура графического ядра медленно вырастала до 53 градусов, вентилятор работал на частоте вращения 1280 оборотов в минуту, уровень шума вырастал до 28,0 дБА.
В режиме максимальной нагрузки в 3D температура достигала уровня 56 °C, при этом частота вращения поднималась до 1758 оборотов в минуту, шум вырастал до 35,5 дБА. В результате мы можем говорить об относительно шумной СО (при работе в 3D).
Термоснимок
Хорошо видно, что наиболее нагрета область в районе преобразователей напряжения и GPU.
Установка и драйверы
Конфигурация тестового стенда
- Компьютер на базе процессора Intel Core i7-5960X (Socket 2011):
- процессор Intel Core i7-5960X (o/c 4 ГГц);
- СО Intel Thermal Solution RTS2011LC;
- системная плата ASRock Fatal1ty X99X Killer на чипсете Intel X99;
- оперативная память 16 ГБ DDR4 G.Skill Ripjaws4 F4-2800C16Q-16GRK 2800 МГц;
- жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA2;
- 2 SSD Corsair Neutron SSD CSSD-N120GB3-BK;
- блок питания Thermaltake Toughpower DPS G 1050W (1050 Вт);
- корпус Corsair Obsidian 800D Full Tower.
- операционная система Windows 10 Pro 64-битная; DirectX 12;
- монитор Samsung U28D590D (28″);
- драйверы AMD версии Crimson Edition 16.7.1 (для Radeon RX 470 — 16.8.1);
- драйверы Nvidia версии 368.81;
- VSync отключен.
Синтетические тесты
Используемые нами пакеты синтетических тестов можно скачать здесь:
- D3D RightMark Beta 4 (1050) с описанием на сайте 3d.rightmark.org.
- D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 — тесты пиксельных шейдеров версий 2.0 и 3.0, ссылка.
- RightMark3D 2.0 с кратким описанием: под Vista без SP1, под Vista c SP1.
Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.
В качестве синтетических тестов DirectX 11 мы использовали примеры из пакетов SDK компаний Microsoft и AMD, а также демонстрационную программу Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010). Мы взяли и приложения обоих производителей видеочипов: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain, также известная как Island11.
Синтетические тесты проводились на следующих видеокартах:
- Radeon RX 470 со стандартными параметрами (сокращенно RX 470)
- Radeon RX 480 со стандартными параметрами (сокращенно RX 480)
- Radeon R9 380 со стандартными параметрами (сокращенно R9 380)
- GeForce GTX 1060 со стандартными параметрами (сокращенно GTX 1060)
- GeForce GTX 960 со стандартными параметрами (сокращенно GTX 960)
Выбор видеокарт для проведения анализа производительности новой модели Radeon RX 470 в синтетических тестах снова был непрост, так как прямых конкурентов у Nvidia из нового поколения Pascal еще нет, да и какой именно из Radeon предыдущего поколения брать для сравнения, тоже не очень понятно. В общем, мы решили взять близкую по позиционированию видеоплату Radeon R9 380, а также модель нового поколения Radeon RX 480, основанную на полной версии графического процессора Polaris 10 — чтобы понять, насколько сильно был урезан младший вариант.
Из изделий конкурирующей компании Nvidia для нашего сравнения мы также взяли две видеокарты. Первая из них — GeForce GTX 960 — является конкурентом указанной выше модели Radeon из предыдущего поколения, и вряд ли сможет составить новинке достойную конкуренцию. Зато взятая второй относительная новинка GeForce GTX 1060, которая продается гораздо дороже, теоретически должна быть сильнее и в синтетических тестах — это мы и проверим сегодня.
Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)
От DirectX 9 тестов мы давно отказались, а во вторую версию RightMark3D вошли два ранее знакомых теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также еще два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.
Эти тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.
Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нем используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.
Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.
В этом тесте производительность больше зависит от количества и эффективности блоков TMU, но на результат обычно влияет также и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает еще и эффективный филлрейт и пропускная способность памяти. Результаты при детализации уровня «High» получаются несколько ниже, чем при детализации «Low».
В задачах процедурной визуализации меха с большим количеством текстурных выборок, решения компании AMD давно вышли на лидирующие позиции — еще со времени выпуска первых видеочипов на базе архитектуры GCN. Платы Radeon и до сих пор выступают несколько лучше в этих сравнениях, что говорит о высокой эффективности выполнения ими этих программ, хотя конкретно Polaris 10 все же немного сдал позиции, так как анонсированная на днях видеокарта Radeon RX 470явно уступила предшествующему решению в виде Radeon R9 380. Разница между RX 470 и RX 480 составила 12-13%, что близко к теории.
Впрочем, этого вполне хватило, чтобы новая видеоплата компании AMD в первом Direct3D 10-тесте совсем чуть-чуть, но все же обошла даже модель GeForce GTX 1060 — старшую из пары плат Nvidia, которые мы взяли для сегодняшнего сравнения. А младшая GeForce GTX 960 уступает всем довольно серьезно, ожидаемо став худшей в этом тесте. Посмотрим на результат в этой же задаче, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: в такой ситуации что-то должно измениться, и ПСП с филлрейтом будут влиять меньше:
В усложненных условиях результаты теста почти всегда получаются несколько интереснее. Новая видеокарта модели Radeon RX 470 в самом тяжелом режиме уже смогла опередить аналогичную по позиционированию модель из прошлого поколения R9 380, уступив старшей RX 480 все те же 12-14%. Преимущество перед конкурентами в виде GeForce GTX 1060 и GTX 960 лишь возросло, особенно что касается младшей платы Nvidia из предыдущего поколения, которая уступила новинке примерно в два раза.
Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:
Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis, Lost Planet и многих других. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип еще примерно в два раза — такой режим называется «High».
Диаграмма в целом довольно похожа на предыдущую, также без учета суперсэмплинга, и в этом тесте новая модель видеокарты Radeon RX 470 оказалась чуть слабее модели Radeon R9 380, уступив старшей RX 480 ожидаемые исходя из теории 12-13%. Если же сравнивать новинку с конкурирующими с ней на данный момент времени видеокартами Nvidia (одна из которых дешевле, а вторая — дороже), то и в этом тесте новинка выступает чуть лучше уровня более дорогой GeForce GTX 1060 и серьезно обгоняет GeForce из предыдущего поколения Maxwell. Посмотрим, что изменит включение суперсэмплинга:
При включении суперсэмплинга и самозатенения задача становится тяжелее, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьезное падение производительности. Разница между скоростными показателями протестированных видеокарт немного изменилась, хотя включение суперсэмплинга и сказывается несколько меньше, чем в предыдущем случае.
Такие условия изменили соотношение сил в нашем сравнении. Графические решения AMD Radeon и в этом D3D10-тесте пиксельных шейдеров всегда работали эффективнее конкурирующих плат GeForce, и только новая модель GeForce GTX 1060, основанная на архитектуре Pascal, может хоть как-то противостоять им, обладая более высокой ценой при этом. Ну а платы предыдущего поколения, вроде GTX 960, ожидаемо отстали от всех. Вторая модель семейства Radeon 400 показала результат выше уровня Radeon R9 380, уступив старшей Radeon RX 480 около 10-12%.
Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)
Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.
Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.
Результаты предельных математических тестов чаще всего лишь примерно соответствуют разнице по частотам и количеству вычислительных блоков, потому что на результаты влияет и разная эффективность их использования в конкретных задачах, и оптимизация драйверов, и новейшие системы управления частотами и питанием, и даже упор в ПСП. В случае первого нашего теста Mineral, видеокарты показали не слишком показательные результаты — похоже, что этот тест не полностью отражает реальность.
Новая модель Radeon на урезанном чипе Polaris 10 в этом тесте оказалась самой медленной из Radeon, проиграв в том числе и более дорогой плате компании Nvidia нового поколения. Уступила новинка и Radeon R9 380, и RX 480 — около 13%, что вполне объяснимо. Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нем только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:
Во втором математическом тесте из нашего RigthMark соотношение между скоростью видеокарт относительно друг друга почти такое же, но чуть ближе к теории и другим тестам. Свежая модель Radeon RX 470 уже на уровне Radeon R9 380 и отстала лишь от GeForce GTX 1060 и своей старшей сестры. Новая видеокарта на урезанном графическом процессоре Polaris 10 уступила полноценной версии RX 480 около 16%, что также близко к соответствующей теоретической разнице.
Direct3D 10: тесты геометрических шейдеров
В составе пакета RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.
Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.
Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трех уровней геометрической сложности:
Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близкое к двукратному. Задача эта для мощных современных видеокарт довольно простая, и производительность в ней ограничена скоростью обработки геометрии, а иногда и пропускной способностью памяти и/или филлрейтом.
Разница между результатами видеокарт Nvidia и AMD почти всегда в пользу решений первой, что обусловлено отличиями в геометрических конвейерах чипов этих компаний. В тестах геометрии старшие платы GeForce всегда были конкурентоспособнее Radeon, и в данном случае хорошо заметно, что видеочип нового поколения Nvidia выигрывает у всех, хотя GeForce GTX 960 стал слабейшим решением сравнения, имея не слишком большое количество геометрических блоков.
Представленная на днях модель Radeon RX 470 хоть и имеет специальные оптимизации и показывает неплохой результат, но отстает даже от Radeon R9 380, а обе они слегка уступили старшей Radeon RX 480. Разница между RX 470 и RX 480 — около 10%. Плата Nvidia нового поколения в лице GTX 1060 стала явным лидером в этом тесте, но она и стоит дороже всех решений. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:
При изменении нагрузки в этом тесте цифры изменились не слишком сильно и для плат AMD и для решений Nvidia. Видеокарты в этом тесте геометрических шейдеров слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, поэтому и наши выводы не изменились. Radeon RX 470 в этом подтесте показала результат на уровне двух других плат Radeon, явно обогнав только GeForce GTX 960. Отставание новой Radeon от старшей сестры составило все те же 9-10%.
К сожалению, «Hyperlight» — второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load, в котором используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output, на всех современных видеокартах компании AMD не работает. Этот тест давно перестал запускаться на платах этой компании, и ошибка не исправлена вот уже несколько лет.
Direct3D 10: скорость выборки текстур из вершинных шейдеров
В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.
Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:
Наши предыдущие исследования показали, что на результаты этого теста может влиять и филлрейт и пропускная способность памяти, ограничивающая производительность, что особенно хорошо заметно по результатам плат Nvidia, которые в простых режимах не сильно быстрее себя же в более тяжелом. Да и новые видеокарты компании AMD на чипе Polaris 10 в этом тесте также показывают скорость явно ограниченную чем-то.
Лидером в этом тесте традиционно стала уже довольно старая плата компании AMD — в этот раз Radeon R9 380 оказалась сильнее всех представленных в сравнении плат Nvidia и AMD. Новинка в виде Radeon RX 470 уступила R9 380, как и старшей в новом поколении Radeon RX 480 — около 12%, близкие к теоретической разнице. Посмотрим на производительность представленных в сравнении видеокарт в этом же тесте, но с увеличенным количеством текстурных выборок:
Ситуация на диаграмме довольно сильно изменилась, решения компании AMD в тяжелых режимах потеряли значительно больше плат GeForce. И Radeon R9 380 продолжает лидировать только в самом легком режиме. Новая модель Radeon RX 470 в сложных условиях показала скорость в среднем на уровне Radeon R9 380, а старшей плате своего поколения она уступает до 14%. Если сравнивать результаты новинки с обеими GeForce, то она ожидаемо выиграла у младшей платы Nvidia в легких режимах, немного проиграв в тяжелом. Ну а GeForce GTX 1060, конечно же, впереди всех — соответствуя своей цене.
Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нем используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.
Результаты во втором тесте вершинного текстурирования «Waves» не слишком похожи на то, что мы видели на предыдущих диаграммах, в этот раз решения Nvidia сдали свои позиции. Явным аутсайдером сравнения стала младшая GeForce в этом тесте, которая уступила производительности всех остальных решений, да и новая модель Radeon RX 470 показывает не слишком высокую скорость, став второй снизу и уступив обеим моделям Radeon (разница между RX 470 и RX 480 составила привычные уже 10%). Конечно же, GeForce GTX 1060 где-то впереди. Рассмотрим второй вариант этой же задачи:
С усложнением задачи во втором тесте текстурных выборок скорость всех решений стала ниже, а видеокарты Nvidia пострадали несколько больше своих конкурентов. Но в выводах мало что меняется, рассматриваемая сегодня плата серии Radeon RX 400 серьезно обогнала GeForce GTX 960 и уступила GTX 1060, хотя уже значительно меньше. Но другие видеокарты Radeon в сравнении оказались быстрее новинки, младшая плата на Polaris 10 уступила старшей 10-16% — примерно по теории.
3DMark Vantage: тесты Feature
Синтетические тесты из пакета 3DMark Vantage могут показать нам то, что мы ранее упустили. Feature-тесты из этого тестового пакета обладают поддержкой DirectX 10, до сих пор актуальны и интересны тем, что отличаются от наших. При анализе результатов видеокарты Radeon RX 470 в этом пакете мы наверняка сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark. Feature Test 1: Texture Fill
Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.
Эффективность видеокарт AMD и Nvidia в текстурном тесте компании Futuremark достаточно высока и итоговые цифры разных моделей близки к соответствующим теоретическим параметрам. Разница в скорости между Radeon RX 470 и Radeon RX 480 оказалась равной 17%, что близко к теоретической. Ну а Radeon R9 380 в этом тесте немного отстала от новинки, что также вполне ожидаемо.
Что касается сравнения скорости текстурирования второй видеоплаты Radeon текущего поколения с присутствующими на рынке решениями конкурента, то RX 480 показала почти результат заметно выше, чем GeForce GTX 960, да и свежее решение Nvidia из более высокого ценового сегмента смогло опередить новинку лишь совсем чуть-чуть. Довольно большое количество блоков текстурирования у решений AMD архитектуры GCN в этом тесте явно сказывается в их пользу. Feature Test 2: Color Fill
Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.
Цифры второго подтеста 3DMark Vantage показывают производительность блоков ROP, без учета величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), и тест измеряет именно производительность ROP. Рассматриваемая нами сегодня видеоплата Radeon RX 470 опередила свою предшественницу, выступив на уровне остальных решений очень сильно, несмотря на всего лишь 32 блока ROP — явно сработали какие-то оптимизации, появившиеся именно в четвертом поколении GCN.
Разница между двумя вариантами Polaris 10 в этом тесте оказалась равной 10%, а если сравнивать скорость заполнения сцены новой видеокартой компании AMD с результатами ускорителей GeForce, то рассматриваемая плата показала скорость заполнения сцены заметно быстрее по сравнению с GeForce GTX 960, и совсем немного уступила более дорогой модели GTX 1060. В очередной раз подтверждается то, что важно не только само по себе большое количество блоков ROP, но и эффективность оптимизаций. Feature Test 3: Parallax Occlusion Mapping
Один из самых интересных feature-тестов, так как подобная техника давно используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.
Этот тест из пакета 3DMark Vantage отличается от проведенных нами ранее тем, что результаты в нем зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен верный баланс GPU, а также эффективность выполнения сложных шейдеров.
В данном случае важны и математическая и текстурная производительность, и в этой «синтетике» из 3DMark Vantage вторая плата Radeon на базе чипа Polaris 10 показала очень неплохой результат, опередив предшественницу из предыдущего поколения Radeon R9 380. Разница между RX 470 и RX 480 в этом тесте равна 14%, что соответствует теории. GeForce GTX 960 конкурента в этом тесте ожидаемо показала самый слабый результат, а вот GTX 1060 почти не уступила старшей RX 480 и опередила сегодняшнюю новинку. Впрочем, не забываем о разнице в ценах. Feature Test 4: GPU Cloth
Четвертый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.
Скорость рендеринга в этом тесте также зависит сразу от нескольких параметров, и основными факторами влияния должны являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. То есть, сильные стороны чипов Nvidia должны проявляться, но увы — мы снова отмечаем странные результаты плат GeForce. В этом тесте новая видеокарта компании AMD показала скорость на уровне Radeon RX 480, и заметно выше, чем Radeon R9 380 — вероятно, сказываются оптимизации геометрического конвейера.
Несмотря на меньшее количество геометрических исполнительных блоков и отставание по геометрической производительности для чипов компании AMD, по сравнению с конкурирующими решениями, платы Radeon в этом тесте по каким-то причинам работают куда более эффективно, обгоняя абсолютно все видеокарты GeForce, представленные в сравнении. Так, вышедшая на днях плата Radeon RX 470 обогнала в этом тесте GeForce GTX 960 более чем вдвое! Да и GTX 1060 не ушла далеко от GTX 960, проиграв новинке в полтора раза. Feature Test 5: GPU Particles
Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.
Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.
Во втором «геометрическом» тесте из 3DMark Vantage ситуация ближе к той, что мы видели в математических тестах. И в этот раз новая модель видеокарты Radeon RX 470 показывает результат выше прошлого решения Radeon R9 380, уступив старшей RX 480 около 11% — близко к теории. Новая плата компании AMD хоть и не достала по скорости рендеринга до GeForce GTX 1060, но с большим запасом обогнала модель GeForce из предыдущего поколения. В целом, результат в геометрических тестах для архитектуры Polaris можно назвать неплохим. Feature Test 6: Perlin Noise
Последний feature-тест пакета Vantage является математически-интенсивным тестом для GPU, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических вычислений.
В пакет компании Futuremark включен математический тест, в котором производительность решений хоть и не полностью соответствует теории, но близка к тому, что должно быть, исходя из пиковых показателей. В данном математическом тесте, показывающем пиковую производительность видеочипов в предельных задачах, мы видим распределение результатов, серьезно отличающееся от того, что мы получили в схожих тестах нашего тестового пакета.
Видеочипы компании AMD с архитектурой GCN, включая Polaris, справляются с подобными задачами лучше решений конкурента в случаях, когда выполняется интенсивная «математика». Только самые новые модели видеокарт компании Nvidia, основанные на архитектуре Pascal, также показали высокую скорость, та же GeForce GTX 1060 находится по скорости между Radeon RX 480 и RX 470. А вот GTX 960 из предыдущего поколения тут выглядит явным аутсайдером. Рассматриваемая новинка AMD по скорости находится между R9 380 и RX 480, уступив старшей сестре на Polaris 10 XT примерно 15%, что близко к теоретической разнице.
По результатам синтетических тестов новой видеокарты AMD Radeon RX 470, основанной на новом графическом процессоре Polaris 10 в урезанной версии Pro, а также результатам других моделей видеокарт обоих производителей видеочипов, можно сделать вывод о том, что рассмотренная нами сегодня видеокарта вполне может стать одним из самых выгодных приобретений на рынке в своем классе.
Новая видеокарта компании AMD показала очень неплохие результаты в наших синтетических тестах, оказавшись в целом быстрее Radeon R9 380 и ближе к уровню более дорогих и сложных Radeon R9 390 и GeForce GTX 970 из предыдущих поколений. Да что говорить, во многих из тестов новинка опережает даже GeForce GTX 1060, что весьма впечатляет, учитывая разницу в ценах. Хотя в некоторых тестах были и проигрыши, но это нормально — решения компании AMD традиционно отличаются более эффективным исполнением интенсивных вычислительных задач, а графические процессоры Nvidia отыгрываются в геометрических тестах.
Впрочем, пока что у второй платы семейства Polaris для сравнения в равных условиях нет соперника из стана Nvidia, также использующего преимущества новых FinFET-техпроцессов. Вышедшая недавно на рынок видеокарта GeForce GTX 1060 дороже даже Radeon RX 480, поэтому прямое сравнение с новинкой невозможно. Нужно подождать выхода чего-то вроде GeForce GTX 1050, которая наверняка будет куда ближе к новинке AMD по производительности и цене. Правда, ждать ее придется еще какое-то время, судя по всему — до сентября, а то и октября. Ну а пока что приходится сравнивать Radeon RX 470 с GeForce GTX 960, что ставит решения разных поколений в неравное положение, так как новинка AMD выглядит явно предпочтительнее.
Судя по производительности в синтетических тестах можно сделать такой вывод, что Radeon RX 470 в играх будет чуть выше уровня Radeon R9 380X, и немного уступит Radeon R9 390 и GeForce GTX 970. В следующей части нашего материала мы как раз и рассмотрим производительность новинки по сравнению с конкурентами в реальных игровых приложениях, протестировав Radeon RX 470 и другие решения в нашем наборе современных игровых приложений.
Средняя текущая цена (количество предложений) в московской рознице: | |
---|---|
Рассматриваемые карты | Конкуренты |
RX 470 4 ГБ — $261 (на 05.09.16) | GTX 960 2 ГБ — $202 (на 05.09.16) |
RX 470 4 ГБ — $261 (на 05.09.16) | GTX 960 4 ГБ — $218 (на 05.09.16) |
RX 470 4 ГБ — $261 (на 05.09.16) | R9 380 2 ГБ — $197 (на 05.09.16) |
RX 470 4 ГБ — $261 (на 05.09.16) | R9 380 4 ГБ — $220 (на 05.09.16) |
RX 470 4 ГБ — $261 (на 05.09.16) | R9 380X 4 ГБ — $231 (на 05.09.16) |
Asus Strix RX 470 4 ГБ — $261 (на 01.08.16) | RX 470 4 ГБ — $261 (на 05.09.16) |
и лично Павла Подольского
за предоставленную на тестирование видеокарту
Блок питания Thermaltake DPS G 1050W для тестового стенда предоставлены компанией Thermaltake | Корпус Corsair Obsidian 800D Full Tower для тестового стенда предоставлен компанией Corsair | Модули памяти G.Skill Ripjaws4 F4-2800C16Q-16GRK для тестового стенда предоставлены компанией G.Skill | Corsair Hydro SeriesT H100i CPU Cooler для тестового стенда предоставлен компанией Corsair |
Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт | Системная плата ASRock Fatal1ty X99X Killer для тестового стенда предоставлена компанией ASRock | Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate | 2 накопителя SSD Corsair Neutron SeriesT 120 ГБ для тестового стенда предоставлены компанией Corsair |