AMD Radeon R7 265:

описание видеокарты и результаты синтетических тестов


Содержание

В этой части мы изучим видеокарту, а также познакомимся с результатами синтетических тестов. В нашей лаборатории побывала карта Sapphire.

Платa

AMD Radeon R7 265 2048 МБ 256-битной GDDR5 PCI-E
  • GPU: Radeon R9 265 (Curacao)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs): 925 МГц (номинал — 925 МГц)
  • Частота работы памяти (физическая (эффективная)): 1400 (5600) МГц (номинал — 1400 (5600) МГц)
  • Ширина шины обмена с памятью: 256 бит
  • Число вычислительных блоков в GPU/частота работы блоков: 16/925 МГц (номинал — 16/925 МГц)
  • Число операций (ALU) в блоке: 64
  • Суммарное число операций (ALU): 1024
  • Число блоков текстурирования: 64 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 32
  • Размеры: 205×100×33 мм (видеокарта занимает 2 слота в системном блоке)
  • Цвет текстолита: черный
  • Энергопотребление (пиковое в 3D/в режиме 2D/в режиме «сна»): 149/51/3 Вт
  • Выходные гнезда: 1×DVI (Dual-Link/HDMI), 1×DVI (Single-Link/VGA), 1×HDMI 1.4a, 1×DisplayPort 1.2
  • Поддержка многопроцессорной работы: CrossFire X

AMD Radeon R7 265 2048 МБ 256-битной GDDR5 PCI-E
Карта имеет 2048 МБ памяти GDDR5 SDRAM, размещенной в 8 микросхемах 2Gb (на лицевой стороне PCB).

Микросхемы памяти Elpida (GDDR5). Микросхемы рассчитаны на номинальную частоту работы в 1500 (6000) МГц.

Сравнение с эталонным дизайном, вид спереди
AMD Radeon R7 265 2048 МБ 256-битной GDDR5 PCI-E Reference card AMD Radeon R9 270

Сравнение с эталонным дизайном, вид сзади
AMD Radeon R7 265 2048 МБ 256-битной GDDR5 PCI-E Reference card AMD Radeon R9 270

Поскольку предоставленный AMD образец является картой Sapphire, то и дизайн у него сильно отличается от эталонного. Впрочем, это и понятно, ведь эталонный расчитан аж на R9 270X, а тут все и по частотам ниже, и по блокам урезано. Так что перед нами сильно упрощенный вариант 270Х. Схема питания также упростилась и стала 4-фазной. Карта требует дополнительного питания, но обходится одним 6-контактным разъемом, хотя схема питания предусматривает возможность установки второго такого разъема.

Ускоритель имеет следующий набор гнезд вывода: 2 DVI (один Dual-Link и совместим с выводом на HDMI, второй Single-Link с совместим с выводом на VGA), один порт HDMI и один DP (суммарно можно подключить 2 приемника с HDMI или 3 с DVI при наличии соответствующих переходников). Напомним, что ускорители AMD достаточно давно обладают собственными звуковыми кодеками для вывода звука по HDMI.

Максимальные разрешения и частоты в 3D: 2560×1600@60 Гц по цифровому интерфейсу (для DVI-гнезд с Dual-Link/HDMI).

Что касается возможностей по ускорению декодирования видео — в 2007 году мы проводили такое исследование, с ним можно ознакомиться здесь.

О системе охлаждения.

AMD Radeon R7 265 2048 МБ 256-битной GDDR5 PCI-E
Основой СО является большой радиатор с медным основанием и теплопроводящими трубками, разносящими тепло по ребрам радиатора.

Сверху — кожух с двумя вентиляторами. К сожалению, эффективности такого охлаждения даже для урезанной версии R7 270 чуть-чуть не хватает, поэтому вентиляторы немного шумят.

Микросхемы памяти охлаждаются основным радиатором, а силовые транзисторы — без охлаждения.

Мы провели исследование температурного режима с помощью версии 4.2.1 утилиты EVGA PrecisionX (автор А. Николайчук AKA Unwinder) и получили следующие результаты.

AMD Radeon R7 265 2048 МБ 256-битной GDDR5 PCI-E

После 6 часов прогона карты под игровой нагрузкой максимальная температура ядра составила 63 градуса, что для такого рода ускорителей очень хороший результат. С другой стороны, СО здесь далеко не бесшумная.

Комплектация. Kарта прибыла к нам в ОЕМ-упаковке, поэтому комплекта нет.

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютеры на базе процессора Intel Core i7-3960X (Socket 2011):
    • 2 процессора Intel Core i7-3960X (o/c 4 ГГц);
    • СО Hydro SeriesT H100i Extreme Performance CPU Cooler;
    • СО Intel Thermal Solution RTS2011LC;
    • системная плата Asus Sabertooth X79 на чипсете Intel X79;
    • системная плата MSI X79A-GD45(8D) на чипсете Intel X79;
    • оперативная память 16 ГБ DDR3 Corsair Vengeance CMZ16GX3M4A1600C9 1600 МГц;
    • жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA2;
    • жесткий диск WD Caviar Blue WD10EZEX 1 TБ SATA2;
    • 2 SSD Corsair Neutron SSD CSSD-N120GB3-BK;
    • 2 блока питания Corsair CMPSU-1200AXEU (1200 Вт);
    • корпус Corsair Obsidian 800D Full Tower.
  • операционная система Windows 7 64-битная; DirectX 11;
  • монитор Dell UltraSharp U3011 (30″);
  • монитор Asus ProArt PA249Q (24″);
  • драйверы AMD версии Catalyst 14.1; Nvidia версии 334.89.

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:


Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

В качестве синтетических тестов DirectX 11 мы использовали примеры из пакетов SDK компаний Microsoft и AMD, а также демонстрационную программу Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010). Мы взяли и приложения обоих производителей видеочипов: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain, также известная как Island11.

Синтетические тесты проводились на следующих видеокартах:

  • Radeon R7 265 со стандартными параметрами (далее R7 265)
  • Radeon R9 270 со стандартными параметрами (далее R9 270)
  • Radeon R7 260X со стандартными параметрами (далее R7 260X)
  • Geforce GTX 750 Ti со стандартными параметрами (далее GTX 750 Ti)
  • Geforce GTX 650 Ti Boost со стандартными параметрами (далее GTX 650 Ti+)

Для анализа результатов новой видеокарты Radeon R7 265 были выбраны именно эти решения по следующим причинам. Radeon R7 260X является моделью компании из новой линейки, которая стоит в ней на ступень ниже рассматриваемой платы R7 265, и будет интересно посмотреть, насколько новинка быстрее. А Radeon R9 270 основана на том же графическом процессоре Pitcairn, но в полноценной модификации, и сравнение с этой видеокартой интересно потому, что характеристики двух моделей отличаются только по производительности математических вычислений и операций с текстурами.

От конкурирующей компании Nvidia для нашего текущего сравнения были выбраны две видеоплаты, основанные на разных графических процессорах, да ещё и разных поколений. Geforce GTX 750 Ti на время выхода Radeon R7 265 является её прямым конкурентом по цене, так как имеет ту же рекомендованную цену, хотя GPU проще и потребляет значительно меньше энергии. А несколько более производительная видеоплата с длинным названием Geforce GTX 650 Ti Boost взята исключительно для теоретического сравнения схожих по времени выхода GPU, так как данная модель уже не производится.

Direct3D 9: тесты Pixel Shaders

Тесты текстурирования и заполнения (филлрейта) из пакета 3DMark Vantage мы рассмотрим чуть позже, а первая группа пиксельных шейдеров, которую мы используем, включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся разве что в старых играх, очень простых для современных видеочипов.

Все современные GPU с такими тестами справляются легко, и скорость даже сравнительно слабых решений в них упирается в различные ограничители производительности. Эти тесты не способны показать возможности современных видеочипов, и интересны лишь с точки зрения устаревших игровых приложений. Производительность современных видеокарт в них ограничена скоростью текстурирования или филлрейта, что мы сейчас и проверим.

Вышедшая не так давно модель видеокарты AMD Radeon R7 265 в этом сравнении уступает старшей модели Radeon R9 270 порядка 12-17%, в зависимости от теста, что почти соответствует теоретической разнице по текстурированию и математическим вычислениям. Младшую же модель в виде Radeon R7 260X новинка во всех тестах обходит лишь слегка (на 3-10%). Единственная видеоплата от Nvidia в этом сравнении серьёзно уступает всем моделям Radeon, даже самой слабой R7 260X, не говоря уже о более мощной новой R7 265. Посмотрим на результаты более сложных пиксельных программ промежуточных версий:

Тест Cook-Torrance вычислительно интенсивный, и скорость в нем зависит почти исключительно от количества ALU и их частоты, а также и от скорости TMU. Поэтому нет ничего удивительного в том, что от своей старшей сестры R9 270 новинка отстала ровно настолько, насколько отличаются их теоретические показатели скорости вычислений и текстурирования — 20%. Такая разница получилась и в тесте освещения, больше зависящем от скорости ALU, и в тесте Water, скорость в котором больше зависит от текстурирования. Интересно, что рассматриваемая сегодня плата лишь на 5% быстрее R7 260X в одном из тестов, а во втором их результат оказался почти равным.

Этот тест исторически лучше подходит для графических решений компании AMD, но новые платы Geforce на базе архитектур Kepler и Maxwell в нём также показывают неплохие результаты, что мы и видим по показателям Geforce GTX 750 Ti в тесте освещения Cook-Torrance. А вот в тесте процедурного текстурирования плата Nvidia отстала почти в полтора раза. Geforce GTX 750 Ti подвела сравнительно низкая производительность блоков TMU.

Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье «Современная терминология 3D-графики».
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

Существует два варианта этих шейдеров: с ориентацией на математические вычисления и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это — универсальные тесты, производительность в которых зависит и от скорости блоков ALU, и от скорости текстурирования, также в них важен общий баланс чипа и эффективность исполнения вычислительных программ. Прошлые наши исследования показывают, что в этих конкретных задачах архитектура GCN от AMD выступает значительно лучше графических архитектур Nvidia.

В тесте «Frozen Glass» скорость больше зависит от математической производительности и в случае всех плат Geforce всегда есть непонятная преграда, из-за которой они проигрывают аналогичным по цене платам Radeon, что мы и видим в случае Geforce GTX 750 Ti. Модель Radeon R7 265 оказывается между Radeon R7 260X и R9 270, но всё же ближе к младшей плате в этом тесте, что согласуется с теорией, ведь она по математической производительности на 20% медленнее.

Во втором тесте «Parallax Mapping» новая видеокарта Radeon также показала производительность выше, чем у конкурента, отстав от старшей модели на 14%, что довольно близко к теоретической разнице в 20%. В этом тесте новинка показала скорость ровно между соседними по цене моделями Radeon. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:

В этих условиях положение единственной видеоплаты Nvidia немного улучшилось в одном из тестов и ухудшилась в другом, так как хоть у Geforce текстурные выборки и выполняются эффективнее, но блоков TMU у нового чипа GM107 слишком мало. Ну а Radeon R7 265 в этот раз показал скорость лишь на 2-7% лучше, чем у R7 260X, и уступил старшей плате на Pitcairn целых 20%, что полностью соответствует теории.

Это были давно устаревшие задачи, с упором в текстурирование, чего почти не встречается в играх. Дальше мы рассмотрим результаты еще двух тестов пиксельных шейдеров, но уже версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9. Они более показательны с точки зрения современных игр на ПК, среди которых много мультиплатформенных. Тесты отличаются тем, что сильно нагружают и ALU, и текстурные модули, обе шейдерные программы сложны и длинны и включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье «Современная терминология 3D-графики».
  • Fur — процедурный шейдер, визуализирующий мех.

Эти тесты не ограничены производительностью только текстурных выборок или филлрейтом и скорость в них более всего зависит от эффективности исполнения сложного шейдерного кода. В самых тяжелых DX9-тестах из первой версии пакета RightMark видеокарты производства Nvidia в предыдущие годы были несколько сильнее, но архитектура GCN помогла видеокартам AMD вырваться вперед, особенно после тщательной доводки драйверов Catalyst.

Новинка от компании AMD показывает в этих задачах неплохой результат, если сравнивать её скорость с производительностью прямого конкурента — Geforce GTX 750 Ti. Решение AMD явно быстрее представительницы Nvidia, ведь в тесте продвинутого параллакс-маппинга новинка почти в полтора раза опередила соперницу, а в тесте Fur разница по производительности между GTX 750 Ti и R7 265 составляет 13%.

А вот если сравнивать свежую модель на базе чипа Pitcairn с младшей моделью этого же поколения на базе чипа Bonaire и с самой мощной видеокартой на базе того же GPU, то новинка показала слабый результаты, объяснимые 20% отставанием по теоретическим цифрам пиковой математической и текстурной производительности. В реальности отставание получилось даже чуть большим — 22%. Да и разницы между скоростью R7 260X и R7 265 в этих конкретных тестах просто нет.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два уже знакомых нам теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также еще два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нем используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в этом тесте зависит от количества и эффективности блоков TMU, влияет и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает еще и эффективный филлрейт и пропускная способность памяти. Результаты при детализации уровня «High» получаются до полутора раза ниже, чем при «Low».

В задачах процедурной визуализации меха с большим количеством текстурных выборок, за пару поколений графических архитектур компания AMD сократила разницу с платами Nvidia, а с выпуском видеочипов на базе архитектуры GCN и вовсе вырвалась вперед, и теперь именно платы Radeon являются лидерами в этих сравнениях, что говорит о высокой эффективности выполнения ими данных программ.

Новая видеоплата Radeon R7 265 отстала разве что от старшей сестры R9 270 на 12-14%, обойдя остальные представленные на диаграмме решения. Преимущество над R7 260X ещё более существенное, новинка расположилась почти ровно между R9 270 и R7 260X. Что касается сравнения новинки с двумя моделями от конкурента, то для Nvidia тут всё печально, ведь даже самая слабая плата AMD опережает обе Geforce, поэтому рассматривать пару R7 265 и GTX 750 Ti в этом тесте нет смысла — новинка от AMD более чем вдвое быстрее.

Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: возможно, в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

Ситуация похожа на ту, что мы видели на предыдущей диаграмме. Свежая модель Radeon R7 265 оказывается заметно (более 20%) быстрее младшей R7 260X и проигрывает R9 270 почти те же 15-17%, что чуть меньше теоретической разницы. Преимущество над прямым конкурентом в виде Geforce GTX 750 Ti лишь упрочилось. В общем, превосходство в подобных вычислениях явно у чипов компании AMD, предпочитающих попиксельные вычисления.

Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип еще примерно в два раза — такой режим называется «High».

Диаграмма похожа на предыдущую, также без включения SSAA, но в этот раз Radeon R7 265 показала даже более высокую относительную скорость. Она опережает младшую модель Radeon R7 260X более чем на 20%, а плате R9 270 новинка уступает лишь 10-15%. А так как видеокарты Nvidia в этом тесте снова справляются с работой заметно хуже конкурирующих решений AMD, то модели Geforce GTX 750 Ti и GTX 650 Ti Boost в обновленном D3D10-варианте теста без суперсэмплинга показывают результат хуже, чем все представленные в сравнении платы Radeon. Посмотрим, что изменит включение суперсэмплинга:

Мало что изменилось, хотя при включении суперсэмплинга и самозатенения задача получается еще более тяжелой и совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьезное падение производительности. Разница между скоростными показателями протестированных видеокарт изменилась совсем немного, а включение суперсэмплинга сказывается меньше, чем в предыдущем случае.

В очередной раз мы видим, что графические решения Radeon в наших D3D10-тестах пиксельных шейдеров работают более эффективно, по сравнению с конкурирующими Geforce, и младшая плата на чипе Pitcairn показала весьма неплохую скорость, отставая от старшей Radeon R9 270 на те же 15-18% — то есть чуть меньше, чем должна по теории. Хотя младшая R7 260X уступила новинке уже меньше — лишь 3-11%. Впрочем, главное, что оба конкурента от Nvidia остались далеко позади, и остаётся надеяться, что они возьмут реванш в каком-то из следующих разделов.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты предельных математических тестов чаще всего лишь примерно соответствуют разнице по частотам и количеству вычислительных блоков, на них влияет и разная эффективность их использования в конкретных решениях, равно как и оптимизация драйверов. В случае теста Mineral, новая модель Radeon R7 265 отстаёт от старшего решения R9 270 на 18%, что чуть меньше теоретической разницы по математической производительности между этими моделями, равной 20%.

Плату R7 260X новинка обогнала на 12%, что можно объяснить более высокой реальной производительностью, по сравнению с теоретическим превосходством платы на Bonaire. Видимо, это объясняется работой технологии PowerTune, когда оба GPU работают на частоте, которую им позволяет текущее энергопотребление, которое у Pitcairn выше.

Архитектуры AMD в таких тестах всегда имели значительное преимущество перед конкурирующими решениями Nvidia, но в архитектуре Kepler (и тем более Maxwell) калифорнийской компании удалось увеличить число потоковых процессоров, и пиковая математическая производительность моделей Geforce серьёзно возросла. Но в первом же математическом тесте обе видеокарты Geforce всё так же уступают новинке компании AMD. Прямой конкурент модели R7 265 по цене в лице Geforce GTX 750 Ti отстаёт от неё на 17%. Правда, если сравнивать энергоэффективность, то плата Nvidia побеждает с огромным запасом.

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нем только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Во втором математическом тесте мы видим несколько иные результаты видеокарт относительно друг друга. Разница между Radeon R9 270 и новинкой R7 265 в этом тесте уже равна теоретической разнице в 20%. А Radeon R7 260X отстал от новинки совсем ненамного — лишь на 5%. Хотя это всё же отличается от 4% обратной разницы, исходя из теории.

Оба ценовых конкурента от компании Nvidia не могут всерьёз противостоять Radeon R7 265. Даже более новая и мощная Geforce GTX 750 Ti не может догнать новинку от компании AMD, которая оказывается быстрее неё во втором математическом тесте уже почти на четверть. В общем, с тестами пиковой математической производительности всё как всегда — если сравнивать решения равной цены, то видеочипы Nvidia всё так же отстают.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трех уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близкое к двукратному. Задача эта для современных видеокарт не слишком сложная, и производительность в ней ограничена скоростью обработки геометрии, а иногда — пропускной способностью памяти, что хорошо заметно по разнице между скоростью трёх плат Radeon — младшая на Bonaire чуть ли не вдвое отстаёт от пары Pitcairn.

Заметна разница и между результатами видеокарт на чипах Nvidia и AMD, которая обусловлена отличиями в геометрических конвейерах чипов этих компаний. Если в предыдущих тестах с пиксельными шейдерами платы AMD были заметно эффективнее и быстрее, то первые же тесты геометрии показывают, что в таких задачах платы Nvidia оказываются несколько производительнее.

Недавняя новинка Radeon R7 265 имеет некоторые оптимизации геометрического конвейера, но всё же уступает обеим платам от соперничающей компании Nvidia. У решений Nvidia с геометрической производительностью дела всегда были лучше, и поэтому они оказываются быстрее. Новая модель Radeon уступает в этом тесте и Geforce GTX 750 Ti и GTX 650 Ti Boost. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры слегка улучшились и для плат AMD и для решений Nvidia. Видеокарты в этом тесте геометрических шейдеров слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, поэтому и выводы остаются прежними. Новая модель Radeon R7 265 всё так же заметно быстрее младшей модели Radeon R7 260X и даже немного превосходит R9 270, но в остальном в выводах ничего не изменилось.

К сожалению, но «Hyperlight» — наш второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load, в котором используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output, на всех современных видеокартах компании AMD просто не работает. В какой-то момент очередное обновление драйверов Catalyst привело к тому, что данный тест перестал запускаться на платах этой компании и ошибка не исправлена уже пару лет точно.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Наши предыдущие исследования показали, что на результаты этого теста может влиять и филлрейт и пропускная способность памяти, что особенно заметно в легком режиме на примере плат Nvidia. Результаты видеокарт этой компании (а также Radeon R7 260X, как ни странно) ограничены еще чем-то странным, и слабая разница между скоростью рендеринга в разных режимах лишь подтверждает эту аномалию.

Самой быстрой в сравнении стала Radeon R9 270, а сразу же за ней идет выпущенная недавно новая модель Radeon R7 265, которая отстает лишь на 3-5% от старшей сестры. Результаты новинки превосходят производительность представленных в сравнении плат Nvidia, и GTX 750 Ti и GTX 650 Ti Boost уступают новинке, хотя в тяжёлом режиме не так уж и много. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Ситуация на диаграмме заметно изменилась — решения компании AMD в тяжёлых режимах потеряли заметно больше, чем обе Geforce. И теперь в тяжёлом режиме лидируют платы Nvidia. Новая видеоплата Radeon R7 265 отстаёт от старшей модели на 7-14%, что несколько меньше теоретической разницы. А младшая R7 260X отстала незначительно, кроме лёгкого режима. Новинка от AMD уступает своей прямой сопернице Geforce GTX 750 Ti в сложных режимах, опередив её в самом простом.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нем используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты во втором тесте вершинного текстурирования «Waves» в целом схожи с теми, что мы видели на предыдущих диаграммах. Но по каким-то причинам показатели плат Geforce во всех режимах весьма низки и сравнимы лишь результатами Radeon R7 260X. Скорость же новой платы Radeon R7 265 в этом тесте очень неплохая, эта видеокарта оказалась медленнее старшей модели R9 270 лишь на 2-5%. Рассмотрим второй вариант этого же теста:

Во втором тесте текстурных выборок с усложнением задачи скорость всех решений стала ниже, и особенно серьезно пострадали видеокарты Geforce в легких режимах. Платы на чипах Nvidia во всех режимах могут конкурировать максимум с Radeon R7 260X, которая сильно отстаёт от старших моделей на чипах Pitcairn. Результаты сегодняшней новинки R7 265 оказались заметно выше, ведь производительность блоков ROP и пропускная способность памяти у неё гораздо выше. Разница между R9 270 и R7 265 получилась традиционной — до 5%.

3DMark Vantage: тесты Feature

Синтетические тесты из пакета 3DMark Vantage покажут нам то, что мы ранее упустили. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10 и интересны тем, что отличаются от наших и до сих пор актуальны. При анализе результатов новой видеокарты Radeon R7 265 в этом пакете мы сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark.

Feature Test 1: Texture Fill

Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Эффективность видеокарт AMD и Nvidia в текстурном тесте компании Futuremark достаточно высока и сравнительные цифры моделей близки к соответствующим теоретическим параметрам. Младшая модель на чипе Pitcairn из семейства Radeon R7 явно медленнее не только старшей R9 270 на том же чипе на 22%, что чуть больше теоретической разницы в 20% по скорости текстурирования, но уступает даже и R7 265 около 3%, что очень близко к теории.

Что касается сравнения скорости платы Radeon R7 265 с решениями конкурента, то новинка AMD по текстурной скорости обгоняет только прямую соперницу Geforce GTX 750 Ti, имеющую малое количество блоков TMU. А с уже отправленной в отставку GTX 650 Ti Boost они показывают равную скорость. В целом, всё ожидаемо и соответствует теоретическим показателям.

Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

В тесте производительности блоков ROP, результат у недавно выпущенной видеоплаты AMD получился почти таким же, что и у старшей модели Radeon R9 270, даже чуть выше. На практике, цифры этого подтеста из 3DMark Vantage показывают производительность блоков ROP с учетом величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), и тест измеряет скорее пропускную способность, а не производительность ROP. Впрочем, по обоим показателям R7 265 и R9 270 равны, что и подтвердилось.

А вот между R7 265 и R7 260X по ПСП теоретическая разница просто огромна, поэтому и разгромный для младшей модели результат в тесте легко объясним. Что касается сравнения скорости заполнения сцены новинки с видеокартами Nvidia, то рассматриваемая модель AMD Radeon показала в этом тесте более высокую скорость заполнения сцены, чем её прямой конкурент Geforce GTX 750 Ti, да и GTX 650 Ti Boost она обошла.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.

Этот тест пакета 3DMark Vantage отличается от проведенных нами ранее тем, что результаты в нем зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен верный баланс GPU, а также эффективность выполнения сложных шейдеров.

В данном случае, важны и математическая и текстурная производительность, поэтому в этой «синтетике» из 3DMark Vantage новая плата Radeon R7 265 сильно отстаёт от более мощной модели на том же чипе — на 20%, что равно теоретической разнице. Зато она хоть и чуть-чуть, но всё же обгоняет плату младшего семейства в виде R7 260X (разница составила 4%, но не в пользу платы на Bonaire, как должно быть по теории), а также обе представленные в сравнении платы Nvidia. Графические процессоры производства компании AMD являются явно более эффективными в этой конкретной задаче.

Feature Test 4: GPU Cloth

Четвертый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте по идее также должна зависеть сразу от нескольких параметров, но основными факторами влияния должны являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. Но картина на диаграмме получилась несколько странная, видеокарты Radeon и Geforce упираются в какие-то свои пределы.

Младшая модель на чипе Pitcairn семейства Radeon R7 показала скорость лишь на 3% хуже, чем старшая R9 270, хотя и плата R7 260X, основанная на менее сложном чипе, от них отстала не слишком сильно, что подтверждает упор в производительность обработки геометрии (для плат AMD).

Удивительно, но несмотря на большее количество соответствующих исполнительных блоков и большую геометрическую производительность видеокарт Nvidia, по сравнению с конкурирующими решениями, и Geforce GTX 750 Ti и GTX 650 Ti Boost явно уступили всем платам Radeon, что сложно объяснить с точки зрения теории. Вероятно, данная задача выполняется на них не оптимально.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.

Во втором геометрическом тесте из 3DMark Vantage ситуация заметно изменилась, но и в этот раз новая Radeon R7 265 почти не отстает от старшей сестры на Pitcairn, но они обе значительно производительнее младшей Radeon R7 260X. Вероятно, в этом тесте наблюдается упор не только в геометрическую производительность, а производительность ROP или (что логичнее) пропускную способность видеопамяти.

Если сравнивать скорость новинки от AMD с конкурирующими платами Geforce, то новая модель от AMD близка к недавно ушедшей с рынка модели в виде GTX 650 Ti Boost, но заметно опережает потребляющую в 2.5 раза меньше энергии GTX 750 Ti. Для платы AMD это очень неплохой результат, ведь ранее в синтетических тестах имитации тканей и частиц из тестового пакета 3DMark Vantage, в которых активно используются геометрические шейдеры, платы Nvidia опережали конкурирующие с ними модели.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических расчетов.

В чисто математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы видим почти такое же распределение результатов, как и в двух аналогичных тестах нашего тестового пакета. В этом случае производительность решений не совсем соответствует теории, но близка к тому, что мы видели ранее в математических тестах из пакета RightMark 2.0.

Видеокарты Radeon от компании AMD, созданные на базе чипов архитектуры GCN, очень хорошо справляются с подобными задачами и показывают лучшие результаты в случаях, когда выполняется интенсивная «математика». Даже младшая модель Radeon R7 260X в этом тесте показала отличный результат, опередив и Geforce GTX 750 Ti и GTX 650 Ti Boost, поэтому неудивительно, что R7 265 сделала это с той же лёгкостью. С той же — потому что недавно вышедшая на рынок видеокарта модели Radeon R7 265 показала производительность лишь на 8% выше, а старшей модели R9 270 уступила 19%, что полностью соответствует теории.

Direct3D 11: Вычислительные шейдеры

Чтобы протестировать новое решение компании AMD в задачах, использующих такие свежие возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы воспользовались примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, Nvidia и AMD.

Сначала мы рассмотрим тесты, использующие вычислительные (Compute) шейдеры. Их появление — одно из наиболее важных нововведений в последних версиях DX API, они уже используются в современных играх для выполнения различных задач: постобработки, симуляций и т. п. В первом тесте показан пример HDR-рендеринга с tone mapping из DirectX SDK, с постобработкой, использующей пиксельные и вычислительные шейдеры.

Скорость расчётов в вычислительном и пиксельном шейдерах для всех плат AMD и Nvidia давно почти одинаковая, хотя у видеокарт с GPU предыдущих архитектур были различия (любопытно, что у обеих плат на чипе Pitcairn она также есть, хоть и небольшая). Судя по нашим предыдущим тестам, результаты в задаче явно зависят не столько от математической мощи и эффективности вычислений, но от других факторов, вроде пропускной способности памяти и производительности ROP.

В данном случае скорость видеокарт упирается скорее в ПСП, это подтверждается тем, что новая плата компании AMD в этом тесте оказалась весьма близка к своей старшей сестре — почти не уступив ей. А вот модель R7 260X обе они серьёзно обогнали. Также, как и конкурирующую с R7 265 видеокарту от Nvidia — Geforce GTX 750 Ti.

Второй тест вычислительных шейдеров также взят из Microsoft DirectX SDK, в нем показана расчетная задача гравитации N тел (N-body) — симуляция динамической системы частиц, на которую воздействуют физические силы, такие как гравитация.

В случае второго DX11-теста расклад сил между решениями разных компаний совершенно иной. Решения Nvidia в подобных расчетных задачах весьма неплохо смотрятся, но и новые платы Radeon также прилично справляются с ними. Похоже, что в этом тесте упор не только в скорость исполнения простых математических вычислений, но и в эффективности выполнения сложного кода с ветвлениями.

Победила в этом тесте мощнейшая из плат AMD, но следом за ней идёт не рассматриваемая сегодня Radeon R7 265, как можно было бы подумать, а Geforce GTX 750 Ti. Мало того, что новинка проиграла плате Nvidia почти 25%, так она и вовсе стала самой медленной в этом тесте. Отставание от R9 270 объясняется меньшим количеством ALU, причём настолько меньшим, что даже R7 260X чуть-чуть опередила новинку.

Direct3D 11: Производительность тесселяции

Вычислительные шейдеры очень важны, но еще одним важным нововведением в Direct3D 11 считается аппаратная тесселяция. Мы очень подробно рассматривали ее в своей теоретической статье про Nvidia GF100. Тесселяцию уже довольно давно начали использовать в DX11-играх, таких как STALKER: Зов Припяти, DiRT 2, Aliens vs Predator, Metro Last Light, Civilization V, Crysis 3, Battlefield 3 и других. В некоторых из них тесселяция используется для моделей персонажей, в других — для имитации реалистичной водной поверхности или ландшафта.

Существует несколько различных схем разбиения графических примитивов (тесселяции). Например, phong tessellation, PN triangles, Catmull-Clark subdivision. Так, схема разбиения PN Triangles используется в STALKER: Зов Припяти, а в Metro 2033 — Phong tessellation. Эти методы сравнительно быстро и просто внедряются в процесс разработки игр и существующие движки, поэтому и стали популярными.

Первым тестом тесселяции будет пример Detail Tessellation из ATI Radeon SDK. В нем реализована не только тесселяция, но и две разные техники попиксельной обработки: простое наложение карт нормалей и parallax occlusion mapping. Что ж, сравним DX11-решения AMD и Nvidia в различных условиях:

В тесте простого бампмаппинга скорость плат AMD чаще всего упирается в ПСП, и результат новой видеокарты подтверждает это — он весьма близок к скорости Radeon R9 270 и обе они далеко впереди модели R7 260X из младшего подсемейства. Единственная плата Geforce в этом подтесте оказалась ещё медленнее, так как она имеет лишь 128-битную шину памяти. Естественно, что она далеко позади сегодняшнего героя обзора, имеющего 256-бит доступ к видеопамяти.

Во втором подтесте с более сложными попиксельными расчетами всё сложилось уже иначе. Эффективность выполнения таких математических вычислений в пиксельных шейдерах у чипов архитектуры GCN выше, чем у Maxwell, поэтому единственная плата Nvidia проиграла даже Radeon R7 260X, не говоря о более мощных решениях. Radeon R7 265 оказался заметно быстрее конкурирующей платы и в этом подтесте, уступив старшей модели 22%, что даже чуть больше теоретически объяснимых 20%.

А вот в подтесте с тесселяцией новинка снова показала неплохой результат. Модель R7 265 выступила на уровне R9 270 и заметно опередила как младшую модель R7 260X, так и своего прямого конкурента в виде Geforce GTX 750 Ti. Это объясняется тем, что в этом тесте тесселяции разбиение треугольников умеренное и скорость в нем упирается не в производительность блоков обработки геометрии, а снова в ПСП.

Вторым тестом производительности тесселяции будет еще один пример для 3D-разработчиков из ATI Radeon SDK — PN Triangles. Собственно, оба примера входят также и в состав DX SDK, так что мы уверены, что на их основе создают свой код игровые разработчики. Этот пример мы протестировали с различным коэффициентом разбиения (tessellation factor), чтобы понять, как сильно влияет его изменение на общую производительность.

В этом примере в тяжёлых режимах применяется уже куда более сложная геометрия, поэтому и сравнение геометрической мощи различных решений приносит совсем другие выводы. Все представленные в материале современные решения хорошо справляются с легкой и средней геометрической нагрузкой, показывая достаточно высокую скорость, но в тяжёлых условиях графический процессор Nvidia всё-таки намного производительнее.

Рассматриваемая сегодня модель Radeon R7 265 отстала от R9 270 совсем немного, что соответствует теории, и они обе ненамного опередили младшую модель в трёх конфигурациях теста, кроме самой сложной, где R7 260X оказалась даже быстрее (из-за высокой частоты GPU). Если же сравнивать с конкурирующей платой Nvidia, то Radeon R7 265 заметно уступает Geforce GTX 750 Ti только в самых сложных условиях, когда скорость у всех плат AMD сильно падает.

Рассмотрим результаты еще одного теста — демонстрационной программы Nvidia Realistic Water Terrain, также известной как Island. В этой демке используется тесселяция и карты смещения (displacement mapping) для рендеринга реалистично выглядящей поверхности океана и ландшафта.

Тест Island не является чисто синтетическим тестом для измерения исключительно геометрической производительности GPU, так как он содержит и сложные пиксельные и вычислительные шейдеры в том числе, и такая нагрузка ближе к реальным играм, в которых используются все блоки GPU, а не только геометрические, как в предыдущих тестах геометрии. Впрочем, основной все равно остается именно нагрузка на блоки обработки геометрии.

Мы тестируем все решения при четырех разных коэффициентах тесселяции — в данном случае настройка называется Dynamic Tessellation LOD. Если при самом первом коэффициенте разбиения треугольников, когда скорость не ограничена производительностью геометрических блоков, видеокарты Radeon от компании AMD показывают достаточно высокие результаты, то уже в следующей ступени все они уже не дотягиваются до уровня Geforce GTX 750 Ti. При увеличении геометрической работы единственная плата компании Nvidia вырывается вперёд очень далеко, а производительность всех Radeon значительно снижается.

Видеокарты Geforce в этом тесте всегда очень быстры, и GTX 750 Ti в самых сложных условиях более чем на 60% производительнее новинки в лице Radeon R7 265. В играх геометрическая нагрузка всегда заметно ниже, и возможностей новой видеокарты там вполне хватит. Если сравнивать скорость новинки с платами Radeon, то в этом тесте важна математическая производительность, по которой R7 265 серьёзно уступает R9 270 на том же графическом процессоре. И даже младшую модель новинка еле-еле опережает.


Результаты синтетических тестов младшей видеоплаты из серии AMD Radeon R7 265, а также результаты других моделей видеокарт производства обоих производителей дискретных видеочипов показали, что новая плата по скорости оказалась где-то между R7 260X и R9 270, но всё же ближе к младшей из них. Положение в играх будет зависеть от упора производительности рендеринга в ПСП и филлрейт или в математическую и текстурную производительность. Последнее в играх встречается чаще, поэтому новинка окажется незначительно быстрее R7 260X и уступит R9 270. Впрочем, в условиях высокого разрешения и включенного полноэкранного сглаживания, картина вполне может измениться на обратную и отставание новой модели семейства от старшей окажется совсем небольшим.

Если же сравнивать новинку с главным ценовым конкурентом от компании Nvidia, то новая модель Radeon является очень сильным соперником для Geforce GTX 750 Ti уже потому, что в ней применяется куда более сложный графический процессор с 256-битной шиной, потребляющий в 2,5 раза больше энергии. Естественно, что в таких условиях (но при равной цене!) в большинстве синтетических тестов Radeon R7 265 явно опережает плату от Nvidia, кроме геометрических и пары других тестов. Судя по всему, и по игровой производительности новая плата Radeon R7 265 должна быть заметно быстрее Geforce GTX 750 Ti — в следующей части нашего материала мы как раз это и узнаем.

AMD Radeon R7 265 — Часть 3: производительность в игровых тестах →



2 блока питания Corsair CMPSU-1200AXEU для тестового стенда предоставлены компанией Corsair

Корпус Corsair Obsidian 800D Full Tower для тестового стенда предоставлен компанией Corsair

Модули памяти Corsair Vengeance CMZ16GX3M4X1600C9 для тестового стенда предоставлены компанией Corsair

Corsair Hydro SeriesT H100i CPU Cooler для тестового стенда предоставлен компанией Corsair

Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт

Системная плата Asus Sabertooth X79 для тестового стенда предоставлена компанией Asustek

Системная плата MSI X79A-GD45(8D) для тестового стенда предоставлена компанией MSI

Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate

Накопитель SSD OCZ Octane 512 ГБ для тестового стенда предоставлен компанией OCZ Russia

2 накопителя SSD Corsair Neutron SeriesT 120 ГБ для тестового стенда предоставлены компанией Corsair

Монитор Asus ProArt PA249Q для рабочего компьютера предоставлен компанией Asustek




Дополнительно

Обзор нового видеоускорителя AMD Radeon R7 265. Часть 2 — Особенности видеокарты, результаты синтетических тестов

AMD Radeon R7 265:

описание видеокарты и результаты синтетических тестов

Содержание

В этой части мы изучим видеокарту, а также познакомимся с результатами синтетических тестов. В нашей лаборатории побывала карта Sapphire.

Платa

AMD Radeon R7 265 2048 МБ 256-битной GDDR5 PCI-E
  • GPU: Radeon R9 265 (Curacao)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs): 925 МГц (номинал — 925 МГц)
  • Частота работы памяти (физическая (эффективная)): 1400 (5600) МГц (номинал — 1400 (5600) МГц)
  • Ширина шины обмена с памятью: 256 бит
  • Число вычислительных блоков в GPU/частота работы блоков: 16/925 МГц (номинал — 16/925 МГц)
  • Число операций (ALU) в блоке: 64
  • Суммарное число операций (ALU): 1024
  • Число блоков текстурирования: 64 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 32
  • Размеры: 205×100×33 мм (видеокарта занимает 2 слота в системном блоке)
  • Цвет текстолита: черный
  • Энергопотребление (пиковое в 3D/в режиме 2D/в режиме «сна»): 149/51/3 Вт
  • Выходные гнезда: 1×DVI (Dual-Link/HDMI), 1×DVI (Single-Link/VGA), 1×HDMI 1.4a, 1×DisplayPort 1.2
  • Поддержка многопроцессорной работы: CrossFire X

AMD Radeon R7 265 2048 МБ 256-битной GDDR5 PCI-E
Карта имеет 2048 МБ памяти GDDR5 SDRAM, размещенной в 8 микросхемах 2Gb (на лицевой стороне PCB).

Микросхемы памяти Elpida (GDDR5). Микросхемы рассчитаны на номинальную частоту работы в 1500 (6000) МГц.

Сравнение с эталонным дизайном, вид спереди
AMD Radeon R7 265 2048 МБ 256-битной GDDR5 PCI-E Reference card AMD Radeon R9 270

Сравнение с эталонным дизайном, вид сзади
AMD Radeon R7 265 2048 МБ 256-битной GDDR5 PCI-E Reference card AMD Radeon R9 270

Поскольку предоставленный AMD образец является картой Sapphire, то и дизайн у него сильно отличается от эталонного. Впрочем, это и понятно, ведь эталонный расчитан аж на R9 270X, а тут все и по частотам ниже, и по блокам урезано. Так что перед нами сильно упрощенный вариант 270Х. Схема питания также упростилась и стала 4-фазной. Карта требует дополнительного питания, но обходится одним 6-контактным разъемом, хотя схема питания предусматривает возможность установки второго такого разъема.

Ускоритель имеет следующий набор гнезд вывода: 2 DVI (один Dual-Link и совместим с выводом на HDMI, второй Single-Link с совместим с выводом на VGA), один порт HDMI и один DP (суммарно можно подключить 2 приемника с HDMI или 3 с DVI при наличии соответствующих переходников). Напомним, что ускорители AMD достаточно давно обладают собственными звуковыми кодеками для вывода звука по HDMI.

Максимальные разрешения и частоты в 3D: 2560×1600@60 Гц по цифровому интерфейсу (для DVI-гнезд с Dual-Link/HDMI).

Что касается возможностей по ускорению декодирования видео — в 2007 году мы проводили такое исследование, с ним можно ознакомиться здесь.

О системе охлаждения.

AMD Radeon R7 265 2048 МБ 256-битной GDDR5 PCI-E
Основой СО является большой радиатор с медным основанием и теплопроводящими трубками, разносящими тепло по ребрам радиатора.

Сверху — кожух с двумя вентиляторами. К сожалению, эффективности такого охлаждения даже для урезанной версии R7 270 чуть-чуть не хватает, поэтому вентиляторы немного шумят.

Микросхемы памяти охлаждаются основным радиатором, а силовые транзисторы — без охлаждения.

Мы провели исследование температурного режима с помощью версии 4.2.1 утилиты EVGA PrecisionX (автор А. Николайчук AKA Unwinder) и получили следующие результаты.

AMD Radeon R7 265 2048 МБ 256-битной GDDR5 PCI-E

После 6 часов прогона карты под игровой нагрузкой максимальная температура ядра составила 63 градуса, что для такого рода ускорителей очень хороший результат. С другой стороны, СО здесь далеко не бесшумная.

Комплектация. Kарта прибыла к нам в ОЕМ-упаковке, поэтому комплекта нет.

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютеры на базе процессора Intel Core i7-3960X (Socket 2011):
    • 2 процессора Intel Core i7-3960X (o/c 4 ГГц);
    • СО Hydro SeriesT H100i Extreme Performance CPU Cooler;
    • СО Intel Thermal Solution RTS2011LC;
    • системная плата Asus Sabertooth X79 на чипсете Intel X79;
    • системная плата MSI X79A-GD45(8D) на чипсете Intel X79;
    • оперативная память 16 ГБ DDR3 Corsair Vengeance CMZ16GX3M4A1600C9 1600 МГц;
    • жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA2;
    • жесткий диск WD Caviar Blue WD10EZEX 1 TБ SATA2;
    • 2 SSD Corsair Neutron SSD CSSD-N120GB3-BK;
    • 2 блока питания Corsair CMPSU-1200AXEU (1200 Вт);
    • корпус Corsair Obsidian 800D Full Tower.
  • операционная система Windows 7 64-битная; DirectX 11;
  • монитор Dell UltraSharp U3011 (30″);
  • монитор Asus ProArt PA249Q (24″);
  • драйверы AMD версии Catalyst 14.1; Nvidia версии 334.89.

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:


Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

В качестве синтетических тестов DirectX 11 мы использовали примеры из пакетов SDK компаний Microsoft и AMD, а также демонстрационную программу Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010). Мы взяли и приложения обоих производителей видеочипов: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain, также известная как Island11.

Синтетические тесты проводились на следующих видеокартах:

  • Radeon R7 265 со стандартными параметрами (далее R7 265)
  • Radeon R9 270 со стандартными параметрами (далее R9 270)
  • Radeon R7 260X со стандартными параметрами (далее R7 260X)
  • Geforce GTX 750 Ti со стандартными параметрами (далее GTX 750 Ti)
  • Geforce GTX 650 Ti Boost со стандартными параметрами (далее GTX 650 Ti+)

Для анализа результатов новой видеокарты Radeon R7 265 были выбраны именно эти решения по следующим причинам. Radeon R7 260X является моделью компании из новой линейки, которая стоит в ней на ступень ниже рассматриваемой платы R7 265, и будет интересно посмотреть, насколько новинка быстрее. А Radeon R9 270 основана на том же графическом процессоре Pitcairn, но в полноценной модификации, и сравнение с этой видеокартой интересно потому, что характеристики двух моделей отличаются только по производительности математических вычислений и операций с текстурами.

От конкурирующей компании Nvidia для нашего текущего сравнения были выбраны две видеоплаты, основанные на разных графических процессорах, да ещё и разных поколений. Geforce GTX 750 Ti на время выхода Radeon R7 265 является её прямым конкурентом по цене, так как имеет ту же рекомендованную цену, хотя GPU проще и потребляет значительно меньше энергии. А несколько более производительная видеоплата с длинным названием Geforce GTX 650 Ti Boost взята исключительно для теоретического сравнения схожих по времени выхода GPU, так как данная модель уже не производится.

Direct3D 9: тесты Pixel Shaders

Тесты текстурирования и заполнения (филлрейта) из пакета 3DMark Vantage мы рассмотрим чуть позже, а первая группа пиксельных шейдеров, которую мы используем, включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся разве что в старых играх, очень простых для современных видеочипов.

Все современные GPU с такими тестами справляются легко, и скорость даже сравнительно слабых решений в них упирается в различные ограничители производительности. Эти тесты не способны показать возможности современных видеочипов, и интересны лишь с точки зрения устаревших игровых приложений. Производительность современных видеокарт в них ограничена скоростью текстурирования или филлрейта, что мы сейчас и проверим.

Вышедшая не так давно модель видеокарты AMD Radeon R7 265 в этом сравнении уступает старшей модели Radeon R9 270 порядка 12-17%, в зависимости от теста, что почти соответствует теоретической разнице по текстурированию и математическим вычислениям. Младшую же модель в виде Radeon R7 260X новинка во всех тестах обходит лишь слегка (на 3-10%). Единственная видеоплата от Nvidia в этом сравнении серьёзно уступает всем моделям Radeon, даже самой слабой R7 260X, не говоря уже о более мощной новой R7 265. Посмотрим на результаты более сложных пиксельных программ промежуточных версий:

Тест Cook-Torrance вычислительно интенсивный, и скорость в нем зависит почти исключительно от количества ALU и их частоты, а также и от скорости TMU. Поэтому нет ничего удивительного в том, что от своей старшей сестры R9 270 новинка отстала ровно настолько, насколько отличаются их теоретические показатели скорости вычислений и текстурирования — 20%. Такая разница получилась и в тесте освещения, больше зависящем от скорости ALU, и в тесте Water, скорость в котором больше зависит от текстурирования. Интересно, что рассматриваемая сегодня плата лишь на 5% быстрее R7 260X в одном из тестов, а во втором их результат оказался почти равным.

Этот тест исторически лучше подходит для графических решений компании AMD, но новые платы Geforce на базе архитектур Kepler и Maxwell в нём также показывают неплохие результаты, что мы и видим по показателям Geforce GTX 750 Ti в тесте освещения Cook-Torrance. А вот в тесте процедурного текстурирования плата Nvidia отстала почти в полтора раза. Geforce GTX 750 Ti подвела сравнительно низкая производительность блоков TMU.

Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье «Современная терминология 3D-графики».
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

Существует два варианта этих шейдеров: с ориентацией на математические вычисления и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это — универсальные тесты, производительность в которых зависит и от скорости блоков ALU, и от скорости текстурирования, также в них важен общий баланс чипа и эффективность исполнения вычислительных программ. Прошлые наши исследования показывают, что в этих конкретных задачах архитектура GCN от AMD выступает значительно лучше графических архитектур Nvidia.

В тесте «Frozen Glass» скорость больше зависит от математической производительности и в случае всех плат Geforce всегда есть непонятная преграда, из-за которой они проигрывают аналогичным по цене платам Radeon, что мы и видим в случае Geforce GTX 750 Ti. Модель Radeon R7 265 оказывается между Radeon R7 260X и R9 270, но всё же ближе к младшей плате в этом тесте, что согласуется с теорией, ведь она по математической производительности на 20% медленнее.

Во втором тесте «Parallax Mapping» новая видеокарта Radeon также показала производительность выше, чем у конкурента, отстав от старшей модели на 14%, что довольно близко к теоретической разнице в 20%. В этом тесте новинка показала скорость ровно между соседними по цене моделями Radeon. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:

В этих условиях положение единственной видеоплаты Nvidia немного улучшилось в одном из тестов и ухудшилась в другом, так как хоть у Geforce текстурные выборки и выполняются эффективнее, но блоков TMU у нового чипа GM107 слишком мало. Ну а Radeon R7 265 в этот раз показал скорость лишь на 2-7% лучше, чем у R7 260X, и уступил старшей плате на Pitcairn целых 20%, что полностью соответствует теории.

Это были давно устаревшие задачи, с упором в текстурирование, чего почти не встречается в играх. Дальше мы рассмотрим результаты еще двух тестов пиксельных шейдеров, но уже версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9. Они более показательны с точки зрения современных игр на ПК, среди которых много мультиплатформенных. Тесты отличаются тем, что сильно нагружают и ALU, и текстурные модули, обе шейдерные программы сложны и длинны и включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье «Современная терминология 3D-графики».
  • Fur — процедурный шейдер, визуализирующий мех.

Эти тесты не ограничены производительностью только текстурных выборок или филлрейтом и скорость в них более всего зависит от эффективности исполнения сложного шейдерного кода. В самых тяжелых DX9-тестах из первой версии пакета RightMark видеокарты производства Nvidia в предыдущие годы были несколько сильнее, но архитектура GCN помогла видеокартам AMD вырваться вперед, особенно после тщательной доводки драйверов Catalyst.

Новинка от компании AMD показывает в этих задачах неплохой результат, если сравнивать её скорость с производительностью прямого конкурента — Geforce GTX 750 Ti. Решение AMD явно быстрее представительницы Nvidia, ведь в тесте продвинутого параллакс-маппинга новинка почти в полтора раза опередила соперницу, а в тесте Fur разница по производительности между GTX 750 Ti и R7 265 составляет 13%.

А вот если сравнивать свежую модель на базе чипа Pitcairn с младшей моделью этого же поколения на базе чипа Bonaire и с самой мощной видеокартой на базе того же GPU, то новинка показала слабый результаты, объяснимые 20% отставанием по теоретическим цифрам пиковой математической и текстурной производительности. В реальности отставание получилось даже чуть большим — 22%. Да и разницы между скоростью R7 260X и R7 265 в этих конкретных тестах просто нет.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два уже знакомых нам теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также еще два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нем используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в этом тесте зависит от количества и эффективности блоков TMU, влияет и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает еще и эффективный филлрейт и пропускная способность памяти. Результаты при детализации уровня «High» получаются до полутора раза ниже, чем при «Low».

В задачах процедурной визуализации меха с большим количеством текстурных выборок, за пару поколений графических архитектур компания AMD сократила разницу с платами Nvidia, а с выпуском видеочипов на базе архитектуры GCN и вовсе вырвалась вперед, и теперь именно платы Radeon являются лидерами в этих сравнениях, что говорит о высокой эффективности выполнения ими данных программ.

Новая видеоплата Radeon R7 265 отстала разве что от старшей сестры R9 270 на 12-14%, обойдя остальные представленные на диаграмме решения. Преимущество над R7 260X ещё более существенное, новинка расположилась почти ровно между R9 270 и R7 260X. Что касается сравнения новинки с двумя моделями от конкурента, то для Nvidia тут всё печально, ведь даже самая слабая плата AMD опережает обе Geforce, поэтому рассматривать пару R7 265 и GTX 750 Ti в этом тесте нет смысла — новинка от AMD более чем вдвое быстрее.

Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: возможно, в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

Ситуация похожа на ту, что мы видели на предыдущей диаграмме. Свежая модель Radeon R7 265 оказывается заметно (более 20%) быстрее младшей R7 260X и проигрывает R9 270 почти те же 15-17%, что чуть меньше теоретической разницы. Преимущество над прямым конкурентом в виде Geforce GTX 750 Ti лишь упрочилось. В общем, превосходство в подобных вычислениях явно у чипов компании AMD, предпочитающих попиксельные вычисления.

Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип еще примерно в два раза — такой режим называется «High».

Диаграмма похожа на предыдущую, также без включения SSAA, но в этот раз Radeon R7 265 показала даже более высокую относительную скорость. Она опережает младшую модель Radeon R7 260X более чем на 20%, а плате R9 270 новинка уступает лишь 10-15%. А так как видеокарты Nvidia в этом тесте снова справляются с работой заметно хуже конкурирующих решений AMD, то модели Geforce GTX 750 Ti и GTX 650 Ti Boost в обновленном D3D10-варианте теста без суперсэмплинга показывают результат хуже, чем все представленные в сравнении платы Radeon. Посмотрим, что изменит включение суперсэмплинга:

Мало что изменилось, хотя при включении суперсэмплинга и самозатенения задача получается еще более тяжелой и совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьезное падение производительности. Разница между скоростными показателями протестированных видеокарт изменилась совсем немного, а включение суперсэмплинга сказывается меньше, чем в предыдущем случае.

В очередной раз мы видим, что графические решения Radeon в наших D3D10-тестах пиксельных шейдеров работают более эффективно, по сравнению с конкурирующими Geforce, и младшая плата на чипе Pitcairn показала весьма неплохую скорость, отставая от старшей Radeon R9 270 на те же 15-18% — то есть чуть меньше, чем должна по теории. Хотя младшая R7 260X уступила новинке уже меньше — лишь 3-11%. Впрочем, главное, что оба конкурента от Nvidia остались далеко позади, и остаётся надеяться, что они возьмут реванш в каком-то из следующих разделов.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты предельных математических тестов чаще всего лишь примерно соответствуют разнице по частотам и количеству вычислительных блоков, на них влияет и разная эффективность их использования в конкретных решениях, равно как и оптимизация драйверов. В случае теста Mineral, новая модель Radeon R7 265 отстаёт от старшего решения R9 270 на 18%, что чуть меньше теоретической разницы по математической производительности между этими моделями, равной 20%.

Плату R7 260X новинка обогнала на 12%, что можно объяснить более высокой реальной производительностью, по сравнению с теоретическим превосходством платы на Bonaire. Видимо, это объясняется работой технологии PowerTune, когда оба GPU работают на частоте, которую им позволяет текущее энергопотребление, которое у Pitcairn выше.

Архитектуры AMD в таких тестах всегда имели значительное преимущество перед конкурирующими решениями Nvidia, но в архитектуре Kepler (и тем более Maxwell) калифорнийской компании удалось увеличить число потоковых процессоров, и пиковая математическая производительность моделей Geforce серьёзно возросла. Но в первом же математическом тесте обе видеокарты Geforce всё так же уступают новинке компании AMD. Прямой конкурент модели R7 265 по цене в лице Geforce GTX 750 Ti отстаёт от неё на 17%. Правда, если сравнивать энергоэффективность, то плата Nvidia побеждает с огромным запасом.

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нем только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Во втором математическом тесте мы видим несколько иные результаты видеокарт относительно друг друга. Разница между Radeon R9 270 и новинкой R7 265 в этом тесте уже равна теоретической разнице в 20%. А Radeon R7 260X отстал от новинки совсем ненамного — лишь на 5%. Хотя это всё же отличается от 4% обратной разницы, исходя из теории.

Оба ценовых конкурента от компании Nvidia не могут всерьёз противостоять Radeon R7 265. Даже более новая и мощная Geforce GTX 750 Ti не может догнать новинку от компании AMD, которая оказывается быстрее неё во втором математическом тесте уже почти на четверть. В общем, с тестами пиковой математической производительности всё как всегда — если сравнивать решения равной цены, то видеочипы Nvidia всё так же отстают.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трех уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близкое к двукратному. Задача эта для современных видеокарт не слишком сложная, и производительность в ней ограничена скоростью обработки геометрии, а иногда — пропускной способностью памяти, что хорошо заметно по разнице между скоростью трёх плат Radeon — младшая на Bonaire чуть ли не вдвое отстаёт от пары Pitcairn.

Заметна разница и между результатами видеокарт на чипах Nvidia и AMD, которая обусловлена отличиями в геометрических конвейерах чипов этих компаний. Если в предыдущих тестах с пиксельными шейдерами платы AMD были заметно эффективнее и быстрее, то первые же тесты геометрии показывают, что в таких задачах платы Nvidia оказываются несколько производительнее.

Недавняя новинка Radeon R7 265 имеет некоторые оптимизации геометрического конвейера, но всё же уступает обеим платам от соперничающей компании Nvidia. У решений Nvidia с геометрической производительностью дела всегда были лучше, и поэтому они оказываются быстрее. Новая модель Radeon уступает в этом тесте и Geforce GTX 750 Ti и GTX 650 Ti Boost. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры слегка улучшились и для плат AMD и для решений Nvidia. Видеокарты в этом тесте геометрических шейдеров слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, поэтому и выводы остаются прежними. Новая модель Radeon R7 265 всё так же заметно быстрее младшей модели Radeon R7 260X и даже немного превосходит R9 270, но в остальном в выводах ничего не изменилось.

К сожалению, но «Hyperlight» — наш второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load, в котором используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output, на всех современных видеокартах компании AMD просто не работает. В какой-то момент очередное обновление драйверов Catalyst привело к тому, что данный тест перестал запускаться на платах этой компании и ошибка не исправлена уже пару лет точно.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Наши предыдущие исследования показали, что на результаты этого теста может влиять и филлрейт и пропускная способность памяти, что особенно заметно в легком режиме на примере плат Nvidia. Результаты видеокарт этой компании (а также Radeon R7 260X, как ни странно) ограничены еще чем-то странным, и слабая разница между скоростью рендеринга в разных режимах лишь подтверждает эту аномалию.

Самой быстрой в сравнении стала Radeon R9 270, а сразу же за ней идет выпущенная недавно новая модель Radeon R7 265, которая отстает лишь на 3-5% от старшей сестры. Результаты новинки превосходят производительность представленных в сравнении плат Nvidia, и GTX 750 Ti и GTX 650 Ti Boost уступают новинке, хотя в тяжёлом режиме не так уж и много. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Ситуация на диаграмме заметно изменилась — решения компании AMD в тяжёлых режимах потеряли заметно больше, чем обе Geforce. И теперь в тяжёлом режиме лидируют платы Nvidia. Новая видеоплата Radeon R7 265 отстаёт от старшей модели на 7-14%, что несколько меньше теоретической разницы. А младшая R7 260X отстала незначительно, кроме лёгкого режима. Новинка от AMD уступает своей прямой сопернице Geforce GTX 750 Ti в сложных режимах, опередив её в самом простом.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нем используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты во втором тесте вершинного текстурирования «Waves» в целом схожи с теми, что мы видели на предыдущих диаграммах. Но по каким-то причинам показатели плат Geforce во всех режимах весьма низки и сравнимы лишь результатами Radeon R7 260X. Скорость же новой платы Radeon R7 265 в этом тесте очень неплохая, эта видеокарта оказалась медленнее старшей модели R9 270 лишь на 2-5%. Рассмотрим второй вариант этого же теста:

Во втором тесте текстурных выборок с усложнением задачи скорость всех решений стала ниже, и особенно серьезно пострадали видеокарты Geforce в легких режимах. Платы на чипах Nvidia во всех режимах могут конкурировать максимум с Radeon R7 260X, которая сильно отстаёт от старших моделей на чипах Pitcairn. Результаты сегодняшней новинки R7 265 оказались заметно выше, ведь производительность блоков ROP и пропускная способность памяти у неё гораздо выше. Разница между R9 270 и R7 265 получилась традиционной — до 5%.

3DMark Vantage: тесты Feature

Синтетические тесты из пакета 3DMark Vantage покажут нам то, что мы ранее упустили. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10 и интересны тем, что отличаются от наших и до сих пор актуальны. При анализе результатов новой видеокарты Radeon R7 265 в этом пакете мы сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark.

Feature Test 1: Texture Fill

Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Эффективность видеокарт AMD и Nvidia в текстурном тесте компании Futuremark достаточно высока и сравнительные цифры моделей близки к соответствующим теоретическим параметрам. Младшая модель на чипе Pitcairn из семейства Radeon R7 явно медленнее не только старшей R9 270 на том же чипе на 22%, что чуть больше теоретической разницы в 20% по скорости текстурирования, но уступает даже и R7 265 около 3%, что очень близко к теории.

Что касается сравнения скорости платы Radeon R7 265 с решениями конкурента, то новинка AMD по текстурной скорости обгоняет только прямую соперницу Geforce GTX 750 Ti, имеющую малое количество блоков TMU. А с уже отправленной в отставку GTX 650 Ti Boost они показывают равную скорость. В целом, всё ожидаемо и соответствует теоретическим показателям.

Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

В тесте производительности блоков ROP, результат у недавно выпущенной видеоплаты AMD получился почти таким же, что и у старшей модели Radeon R9 270, даже чуть выше. На практике, цифры этого подтеста из 3DMark Vantage показывают производительность блоков ROP с учетом величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), и тест измеряет скорее пропускную способность, а не производительность ROP. Впрочем, по обоим показателям R7 265 и R9 270 равны, что и подтвердилось.

А вот между R7 265 и R7 260X по ПСП теоретическая разница просто огромна, поэтому и разгромный для младшей модели результат в тесте легко объясним. Что касается сравнения скорости заполнения сцены новинки с видеокартами Nvidia, то рассматриваемая модель AMD Radeon показала в этом тесте более высокую скорость заполнения сцены, чем её прямой конкурент Geforce GTX 750 Ti, да и GTX 650 Ti Boost она обошла.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.

Этот тест пакета 3DMark Vantage отличается от проведенных нами ранее тем, что результаты в нем зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен верный баланс GPU, а также эффективность выполнения сложных шейдеров.

В данном случае, важны и математическая и текстурная производительность, поэтому в этой «синтетике» из 3DMark Vantage новая плата Radeon R7 265 сильно отстаёт от более мощной модели на том же чипе — на 20%, что равно теоретической разнице. Зато она хоть и чуть-чуть, но всё же обгоняет плату младшего семейства в виде R7 260X (разница составила 4%, но не в пользу платы на Bonaire, как должно быть по теории), а также обе представленные в сравнении платы Nvidia. Графические процессоры производства компании AMD являются явно более эффективными в этой конкретной задаче.

Feature Test 4: GPU Cloth

Четвертый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте по идее также должна зависеть сразу от нескольких параметров, но основными факторами влияния должны являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. Но картина на диаграмме получилась несколько странная, видеокарты Radeon и Geforce упираются в какие-то свои пределы.

Младшая модель на чипе Pitcairn семейства Radeon R7 показала скорость лишь на 3% хуже, чем старшая R9 270, хотя и плата R7 260X, основанная на менее сложном чипе, от них отстала не слишком сильно, что подтверждает упор в производительность обработки геометрии (для плат AMD).

Удивительно, но несмотря на большее количество соответствующих исполнительных блоков и большую геометрическую производительность видеокарт Nvidia, по сравнению с конкурирующими решениями, и Geforce GTX 750 Ti и GTX 650 Ti Boost явно уступили всем платам Radeon, что сложно объяснить с точки зрения теории. Вероятно, данная задача выполняется на них не оптимально.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.

Во втором геометрическом тесте из 3DMark Vantage ситуация заметно изменилась, но и в этот раз новая Radeon R7 265 почти не отстает от старшей сестры на Pitcairn, но они обе значительно производительнее младшей Radeon R7 260X. Вероятно, в этом тесте наблюдается упор не только в геометрическую производительность, а производительность ROP или (что логичнее) пропускную способность видеопамяти.

Если сравнивать скорость новинки от AMD с конкурирующими платами Geforce, то новая модель от AMD близка к недавно ушедшей с рынка модели в виде GTX 650 Ti Boost, но заметно опережает потребляющую в 2.5 раза меньше энергии GTX 750 Ti. Для платы AMD это очень неплохой результат, ведь ранее в синтетических тестах имитации тканей и частиц из тестового пакета 3DMark Vantage, в которых активно используются геометрические шейдеры, платы Nvidia опережали конкурирующие с ними модели.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических расчетов.

В чисто математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы видим почти такое же распределение результатов, как и в двух аналогичных тестах нашего тестового пакета. В этом случае производительность решений не совсем соответствует теории, но близка к тому, что мы видели ранее в математических тестах из пакета RightMark 2.0.

Видеокарты Radeon от компании AMD, созданные на базе чипов архитектуры GCN, очень хорошо справляются с подобными задачами и показывают лучшие результаты в случаях, когда выполняется интенсивная «математика». Даже младшая модель Radeon R7 260X в этом тесте показала отличный результат, опередив и Geforce GTX 750 Ti и GTX 650 Ti Boost, поэтому неудивительно, что R7 265 сделала это с той же лёгкостью. С той же — потому что недавно вышедшая на рынок видеокарта модели Radeon R7 265 показала производительность лишь на 8% выше, а старшей модели R9 270 уступила 19%, что полностью соответствует теории.

Direct3D 11: Вычислительные шейдеры

Чтобы протестировать новое решение компании AMD в задачах, использующих такие свежие возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы воспользовались примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, Nvidia и AMD.

Сначала мы рассмотрим тесты, использующие вычислительные (Compute) шейдеры. Их появление — одно из наиболее важных нововведений в последних версиях DX API, они уже используются в современных играх для выполнения различных задач: постобработки, симуляций и т. п. В первом тесте показан пример HDR-рендеринга с tone mapping из DirectX SDK, с постобработкой, использующей пиксельные и вычислительные шейдеры.

Скорость расчётов в вычислительном и пиксельном шейдерах для всех плат AMD и Nvidia давно почти одинаковая, хотя у видеокарт с GPU предыдущих архитектур были различия (любопытно, что у обеих плат на чипе Pitcairn она также есть, хоть и небольшая). Судя по нашим предыдущим тестам, результаты в задаче явно зависят не столько от математической мощи и эффективности вычислений, но от других факторов, вроде пропускной способности памяти и производительности ROP.

В данном случае скорость видеокарт упирается скорее в ПСП, это подтверждается тем, что новая плата компании AMD в этом тесте оказалась весьма близка к своей старшей сестре — почти не уступив ей. А вот модель R7 260X обе они серьёзно обогнали. Также, как и конкурирующую с R7 265 видеокарту от Nvidia — Geforce GTX 750 Ti.

Второй тест вычислительных шейдеров также взят из Microsoft DirectX SDK, в нем показана расчетная задача гравитации N тел (N-body) — симуляция динамической системы частиц, на которую воздействуют физические силы, такие как гравитация.

В случае второго DX11-теста расклад сил между решениями разных компаний совершенно иной. Решения Nvidia в подобных расчетных задачах весьма неплохо смотрятся, но и новые платы Radeon также прилично справляются с ними. Похоже, что в этом тесте упор не только в скорость исполнения простых математических вычислений, но и в эффективности выполнения сложного кода с ветвлениями.

Победила в этом тесте мощнейшая из плат AMD, но следом за ней идёт не рассматриваемая сегодня Radeon R7 265, как можно было бы подумать, а Geforce GTX 750 Ti. Мало того, что новинка проиграла плате Nvidia почти 25%, так она и вовсе стала самой медленной в этом тесте. Отставание от R9 270 объясняется меньшим количеством ALU, причём настолько меньшим, что даже R7 260X чуть-чуть опередила новинку.

Direct3D 11: Производительность тесселяции

Вычислительные шейдеры очень важны, но еще одним важным нововведением в Direct3D 11 считается аппаратная тесселяция. Мы очень подробно рассматривали ее в своей теоретической статье про Nvidia GF100. Тесселяцию уже довольно давно начали использовать в DX11-играх, таких как STALKER: Зов Припяти, DiRT 2, Aliens vs Predator, Metro Last Light, Civilization V, Crysis 3, Battlefield 3 и других. В некоторых из них тесселяция используется для моделей персонажей, в других — для имитации реалистичной водной поверхности или ландшафта.

Существует несколько различных схем разбиения графических примитивов (тесселяции). Например, phong tessellation, PN triangles, Catmull-Clark subdivision. Так, схема разбиения PN Triangles используется в STALKER: Зов Припяти, а в Metro 2033 — Phong tessellation. Эти методы сравнительно быстро и просто внедряются в процесс разработки игр и существующие движки, поэтому и стали популярными.

Первым тестом тесселяции будет пример Detail Tessellation из ATI Radeon SDK. В нем реализована не только тесселяция, но и две разные техники попиксельной обработки: простое наложение карт нормалей и parallax occlusion mapping. Что ж, сравним DX11-решения AMD и Nvidia в различных условиях:

В тесте простого бампмаппинга скорость плат AMD чаще всего упирается в ПСП, и результат новой видеокарты подтверждает это — он весьма близок к скорости Radeon R9 270 и обе они далеко впереди модели R7 260X из младшего подсемейства. Единственная плата Geforce в этом подтесте оказалась ещё медленнее, так как она имеет лишь 128-битную шину памяти. Естественно, что она далеко позади сегодняшнего героя обзора, имеющего 256-бит доступ к видеопамяти.

Во втором подтесте с более сложными попиксельными расчетами всё сложилось уже иначе. Эффективность выполнения таких математических вычислений в пиксельных шейдерах у чипов архитектуры GCN выше, чем у Maxwell, поэтому единственная плата Nvidia проиграла даже Radeon R7 260X, не говоря о более мощных решениях. Radeon R7 265 оказался заметно быстрее конкурирующей платы и в этом подтесте, уступив старшей модели 22%, что даже чуть больше теоретически объяснимых 20%.

А вот в подтесте с тесселяцией новинка снова показала неплохой результат. Модель R7 265 выступила на уровне R9 270 и заметно опередила как младшую модель R7 260X, так и своего прямого конкурента в виде Geforce GTX 750 Ti. Это объясняется тем, что в этом тесте тесселяции разбиение треугольников умеренное и скорость в нем упирается не в производительность блоков обработки геометрии, а снова в ПСП.

Вторым тестом производительности тесселяции будет еще один пример для 3D-разработчиков из ATI Radeon SDK — PN Triangles. Собственно, оба примера входят также и в состав DX SDK, так что мы уверены, что на их основе создают свой код игровые разработчики. Этот пример мы протестировали с различным коэффициентом разбиения (tessellation factor), чтобы понять, как сильно влияет его изменение на общую производительность.

В этом примере в тяжёлых режимах применяется уже куда более сложная геометрия, поэтому и сравнение геометрической мощи различных решений приносит совсем другие выводы. Все представленные в материале современные решения хорошо справляются с легкой и средней геометрической нагрузкой, показывая достаточно высокую скорость, но в тяжёлых условиях графический процессор Nvidia всё-таки намного производительнее.

Рассматриваемая сегодня модель Radeon R7 265 отстала от R9 270 совсем немного, что соответствует теории, и они обе ненамного опередили младшую модель в трёх конфигурациях теста, кроме самой сложной, где R7 260X оказалась даже быстрее (из-за высокой частоты GPU). Если же сравнивать с конкурирующей платой Nvidia, то Radeon R7 265 заметно уступает Geforce GTX 750 Ti только в самых сложных условиях, когда скорость у всех плат AMD сильно падает.

Рассмотрим результаты еще одного теста — демонстрационной программы Nvidia Realistic Water Terrain, также известной как Island. В этой демке используется тесселяция и карты смещения (displacement mapping) для рендеринга реалистично выглядящей поверхности океана и ландшафта.

Тест Island не является чисто синтетическим тестом для измерения исключительно геометрической производительности GPU, так как он содержит и сложные пиксельные и вычислительные шейдеры в том числе, и такая нагрузка ближе к реальным играм, в которых используются все блоки GPU, а не только геометрические, как в предыдущих тестах геометрии. Впрочем, основной все равно остается именно нагрузка на блоки обработки геометрии.

Мы тестируем все решения при четырех разных коэффициентах тесселяции — в данном случае настройка называется Dynamic Tessellation LOD. Если при самом первом коэффициенте разбиения треугольников, когда скорость не ограничена производительностью геометрических блоков, видеокарты Radeon от компании AMD показывают достаточно высокие результаты, то уже в следующей ступени все они уже не дотягиваются до уровня Geforce GTX 750 Ti. При увеличении геометрической работы единственная плата компании Nvidia вырывается вперёд очень далеко, а производительность всех Radeon значительно снижается.

Видеокарты Geforce в этом тесте всегда очень быстры, и GTX 750 Ti в самых сложных условиях более чем на 60% производительнее новинки в лице Radeon R7 265. В играх геометрическая нагрузка всегда заметно ниже, и возможностей новой видеокарты там вполне хватит. Если сравнивать скорость новинки с платами Radeon, то в этом тесте важна математическая производительность, по которой R7 265 серьёзно уступает R9 270 на том же графическом процессоре. И даже младшую модель новинка еле-еле опережает.


Результаты синтетических тестов младшей видеоплаты из серии AMD Radeon R7 265, а также результаты других моделей видеокарт производства обоих производителей дискретных видеочипов показали, что новая плата по скорости оказалась где-то между R7 260X и R9 270, но всё же ближе к младшей из них. Положение в играх будет зависеть от упора производительности рендеринга в ПСП и филлрейт или в математическую и текстурную производительность. Последнее в играх встречается чаще, поэтому новинка окажется незначительно быстрее R7 260X и уступит R9 270. Впрочем, в условиях высокого разрешения и включенного полноэкранного сглаживания, картина вполне может измениться на обратную и отставание новой модели семейства от старшей окажется совсем небольшим.

Если же сравнивать новинку с главным ценовым конкурентом от компании Nvidia, то новая модель Radeon является очень сильным соперником для Geforce GTX 750 Ti уже потому, что в ней применяется куда более сложный графический процессор с 256-битной шиной, потребляющий в 2,5 раза больше энергии. Естественно, что в таких условиях (но при равной цене!) в большинстве синтетических тестов Radeon R7 265 явно опережает плату от Nvidia, кроме геометрических и пары других тестов. Судя по всему, и по игровой производительности новая плата Radeon R7 265 должна быть заметно быстрее Geforce GTX 750 Ti — в следующей части нашего материала мы как раз это и узнаем.

AMD Radeon R7 265 — Часть 3: производительность в игровых тестах →



2 блока питания Corsair CMPSU-1200AXEU для тестового стенда предоставлены компанией Corsair

Корпус Corsair Obsidian 800D Full Tower для тестового стенда предоставлен компанией Corsair

Модули памяти Corsair Vengeance CMZ16GX3M4X1600C9 для тестового стенда предоставлены компанией Corsair

Corsair Hydro SeriesT H100i CPU Cooler для тестового стенда предоставлен компанией Corsair

Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт

Системная плата Asus Sabertooth X79 для тестового стенда предоставлена компанией Asustek

Системная плата MSI X79A-GD45(8D) для тестового стенда предоставлена компанией MSI

Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate

Накопитель SSD OCZ Octane 512 ГБ для тестового стенда предоставлен компанией OCZ Russia

2 накопителя SSD Corsair Neutron SeriesT 120 ГБ для тестового стенда предоставлены компанией Corsair

Монитор Asus ProArt PA249Q для рабочего компьютера предоставлен компанией Asustek