AMD Radeon R9 290X:

описание видеокарты и результаты синтетических тестов


Содержание

В этой части мы изучим видеокарту, а также познакомимся с результатами синтетических тестов. В нашей лаборатории побывала референс карта AMD.

Платa

AMD Radeon R9 290X 4096 МБ 512-битной GDDR5 PCI-E
  • GPU: Radeon R9 290X (Hawaii)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs): 1000 МГц (номинал — 1000 МГц)
  • Частота работы памяти (физическая (эффективная)): 1250 (5000) МГц (номинал — 1250 (5000) МГц)
  • Ширина шины обмена с памятью: 512 бит
  • Число вычислительных блоков в GPU/частота работы блоков: 44/1000 МГц (номинал — 44/1000 МГц)
  • Число операций (ALU) в блоке: 64
  • Суммарное число операций (ALU): 2816
  • Число блоков текстурирования: 176 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 64
  • Размеры: 280×100×37 мм (видеокарта занимает 2 слота в системном блоке)
  • Цвет текстолита: черный
  • Энергопотребление (пиковое в 3D (Uber)/3D (Quiet)/в режиме 2D/в режиме «сна»): 298/246/49/3 Вт
  • Выходные гнезда: 2×DVI (Dual-Link/HDMI), 1×HDMI 1.4a, 1×DisplayPort 1.2
  • Поддержка многопроцессорной работы: CrossFire X (Hardware)

AMD Radeon R9 290X 4096 МБ 512-битной GDDR5 PCI-E
Карта имеет 4096 МБ памяти GDDR5 SDRAM, размещенной в 16 микросхемах (на лицевой стороне PCB).

Микросхемы памяти Hynix (GDDR5). Микросхемы рассчитаны на максимальную частоту работы в 1500 (6000) МГц.

Сравнение с эталонным дизайном, вид спереди
AMD Radeon R9 290X 4096 МБ 512-битной GDDR5 PCI-E Reference card AMD Radeon HD 7970

Сравнение с эталонным дизайном, вид сзади
AMD Radeon R9 290X 4096 МБ 512-битной GDDR5 PCI-E Reference card AMD Radeon HD 7970

Мы выбрали Radeon HD 7970 для сравнения только потому, что этот ускоритель также был флагманом у AMD. Понятно, что карты сильно отличаются прежде всего шинами обмена с памятью, поэтому различия PCB существенные. Ядро здесь окружено очень плотным кольцом микросхем памяти (как ореолом) — 16 микросхем на одной стороне PCB! Казалось бы, можно было половину разместить на обороте. Но тогда создались бы проблемы для партнеров, которым пришлось бы искать варианты охлаждения микросхем памяти не только на лицевой, но и на оборотной стороне карты.

Ядро — весьма большое, выполнено в виде прямоугольника. Кристалл изготовлен на 31й неделе этого года, то есть в августе.

Система питания — 6-фазная, управляется цифровым контроллером IR 3567B, который обеспечивает работу PowerTune. 5 фаз отводится на питание ядра, а шестая — для микросхем памяти и прочей логики. Про PowerTune мы уже писали в первой части статьи. Стоит еще раз заметить, что видеокарта имеет переключатель BIOS, подобный тому, что мы видели на Radeon серии HD 69xx. По умолчанию установлен режим Quiet (тихий), который обеспечивает более тихую работу СО, однако с потерями в производительности (впрочем, явно не существенными). Можно переключиться на режим Uber (полноценный). Более детально рассмотрим эти варианты ниже.

Ускоритель имеет следующий набор гнезд вывода: 2 DVI (совместимы с выводом на HDMI) и по одному DisplayPort и HDMI (суммарно можно подключить 3 приемника с HDMI). Напомним, что ускорители AMD достаточно давно обладают собственными звуковыми кодеками для вывода звука по HDMI. А R9 290X к тому же поддерживает программируемый движок TrueAudio, который, впрочем, пока трудно назвать актуальным, так как нужна поддержка со стороны разработчиков игр. А будут ли они это делать, учитывая крайне малую распространенность этого движка, — неизвестно.

Максимальные разрешения и частоты в 3D:

  • 240 Гц — максимальная частота обновления;
  • 2048×1536@85 Гц — по аналоговому интерфейсу;
  • 2560×1600@60 Гц — по цифровому интерфейсу (для DVI-гнезд с Dual-Link/HDMI). Теоретически существует поддержка 4К, однако пока это лишь декларация.

Что касается возможностей по ускорению декодирования видео — в 2007 году мы проводили такое исследование, с ним можно ознакомиться здесь.

Карта требует дополнительного питания в виде двух разъемов: 8- и 6-контактного.

О системе охлаждения.

AMD Radeon R9 290X 4096 МБ 512-битной GDDR5 PCI-E
Система охлаждения — под стать очень мощному ускорителю. Основана на испарительной камере, которая лежит в основе большого радиатора без тепловых трубок. Способ охлаждения последнего также традиционен: с помощью цилиндрического вентилятора, расположенного в конце кулера.

Микросхемы памяти, как и силовые транзисторы, охлаждаются основным радиатором.

А вот с шумом кулера — история сложная. Понятно, что в Uber-режиме вентилятор шумит весьма ощутимо (частота вращения достигает 2900 и выше оборотов в минуту), однако и в Quiet-режиме шум кулера весьма ощутим.

Мы провели исследование температурного режима с помощью новой версии 4.2.1 утилиты EVGA PrecisionX (автор А. Николайчук AKA Unwinder) и получили следующие результаты.

AMD Radeon R9 290X 4096 МБ 512-битной GDDR5 PCI-E (Uber mode/Режим полной мощности)
AMD Radeon R9 290X 4096 МБ 512-битной GDDR5 PCI-E (Quiet mode/Тихий режим)

После 6 часов прогона карты под максимальной игровой нагрузкой максимальная температура ядра составила 95 градусов, что для такого рода ускорителя почти предельный результат, хотя AMD уверяет, что такой нагрев никак не повредит ни ядро, ни карту.

Что же мы видим? Понятно, что в Uber-режиме из ускорителя выжимается все, что можно, поэтому частота вращения вентилятора находится почти на максимуме того, что дозволено этим режимом (55% от максимально возможных оборотов, заложенных конструкцией вентилятора). Причем даже 55% — это выше 2900 оборотов в минуту и с весьма ощутимым ревом. Страшно даже представить себе, как будет орать СО при достижении 100%. Учитывая, что мало кто из партнеров AMD будет использовать референс-кулер, им придется хорошо поломать голову над тем, как обеспечить относительную тишину кулера и при этом не сильно принизить частотный потенциал ускорителя — особенно это будет касаться всякого рода OC-версий.

А вот режим Quiet ограничивает работу кулера на 40% от максимально возможных оборотов. Однако в данном случае технология PowerTune вынуждена весьма часто понижать частоту работы GPU, чтобы сохранить карту в разрешенных пределах температуры. Это уравнение с двумя переменными, которое системе необходимо решать каждую секунду работы, и мы прекрасно видим результат по зубчатой диаграмме мониторинга частоты работы GPU. И подчеркну еще раз: даже в таком режиме СО все равно производит весьма ощутимый шум.

Комплектация. Референс-карта прибыла к нам в ОЕМ-упаковке, поэтому комплекта нет.

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютеры на базе процессора Intel Core i7-3960X (Socket 2011):
    • 2 процессора Intel Core i7-3960X (o/c 4 ГГц);
    • СО Hydro SeriesT H100i Extreme Performance CPU Cooler;
    • СО Intel Thermal Solution RTS2011LC;
    • системная плата Asus Sabertooth X79 на чипсете Intel X79;
    • системная плата MSI X79A-GD45(8D) на чипсете Intel X79;
    • оперативная память 16 ГБ DDR3 Corsair Vengeance CMZ16GX3M4A1600C9 1600 МГц;
    • жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA2;
    • жесткий диск WD Caviar Blue WD10EZEX 1 TБ SATA2;
    • 2 SSD Corsair Neutron SSD CSSD-N120GB3-BK;
    • 2 блока питания Corsair CMPSU-1200AXEU (1200 Вт);
    • корпус Corsair Obsidian 800D Full-Tower.
  • операционная система Windows 7 64-битная; DirectX 11;
  • монитор Dell UltraSharp U3011 (30″);
  • драйверы AMD версии Catalyst 13.11beta5; Nvidia версии 331.58

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

В качестве синтетических тестов DirectX 11 мы использовали примеры из пакетов SDK компаний Microsoft и AMD, а также демонстрационную программу Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010). Мы взяли и приложения обоих производителей видеочипов: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain, также известная как Island11.

Синтетические тесты проводились на следующих видеокартах:

  • Radeon R9 290X со стандартными параметрами в режиме «Uber Mode»(далее R9 290X)
  • Radeon HD 7970 GHz со стандартными параметрами (далее HD 7970 GHz)
  • Radeon HD 7990 со стандартными параметрами (далее HD 7990)
  • Geforce GTX Titan со стандартными параметрами (далее GTX Titan)
  • Geforce GTX 780 со стандартными параметрами (далее GTX 780)

Для анализа результатов новой топовой видеокарты Radeon R9 290X были выбраны именно эти решения по следующим причинам. Radeon HD 7970 GHz является предыдущей моделью компании, относящейся к самой верхней ступеньке среди одночиповых решений — будет интересно посмотреть, насколько инженеры смогли повысить производительность новинки по сравнению с платой на Tahiti. Сравнение с Radeon HD 7990 будет интересно потому, что это — мощнейшая двухчиповая видеокарта от AMD, основанная на двух Tahiti и имеющая очень высокое энергопотребление.

От конкурирующей компании Nvidia для сравнения также были выбраны две видеоплаты. Хотя обе они основаны на топовом чипе GK110, но их скоростные характеристики слегка отличаются. Geforce GTX 780 на время выхода Radeon R9 290X является (как минимум, пока что) её основным конкурентом по цене, а ещё более производительная видеоплата Geforce GTX Titan стоит дороже и показывает максимальную производительность среди одночиповых решений на данный момент, а также может служить как бы прообразом ожидаемой вскоре Geforce GTX 780 Ti.

Direct3D 9: тесты Pixel Shaders

Тесты текстурирования и заполнения (филлрейта) из пакета 3DMark Vantage мы рассмотрим чуть позже, а первая группа пиксельных шейдеров, которую мы используем, включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся разве что в старых играх, очень простых для современных видеочипов.

С этими тестами современные GPU справляются «одной левой», а скорость самых мощных решений в них всегда упирается в различные ограничители. Тесты не способны показать возможности современных видеочипов, и интересны лишь с точки зрения устаревших игровых приложений. Производительность современных видеокарт в этих тестах часто ограничена текстурированием или филлрейтом, а обе видеокарты Nvidia показывают чуть ли не идентичные цифры.

Новая модель видеокарты AMD в этом сравнении стала лучшей (при отсутствии двухчиповой платы из предыдущей линейки), опередив своего предшественника в лице Radeon HD 7970 GHz на 17-25%, как и должно быть по теории. Обе платы Nvidia уступают новинке Radeon, которая стала мощнейшей в сравнении и лидирует во всех подтестах. Посмотрим на результаты более сложных пиксельных программ промежуточных версий:

Тест Cook-Torrance более интенсивен вычислительно, и скорость в нём сильнее зависит от количества ALU и их частоты, но также и от скорости TMU. Этот тест исторически лучше подходит для графических решений компании AMD, хотя новые топовые платы Geforce на базе архитектуры Kepler в нём также показывают сильные результаты.

Мощнейшая плата семейства Radeon R9 290X также ожидаемо оказалась быстрее предшествующей HD 7970 GHz на 24-28%, как и должно быть, исходя из теории. Что в тесте освещения, больше зависящем от скорости ALU, что в тесте Water, скорость в котором больше зависит от текстурирования, мы видим примерно одно и то же — ведь скорость текстурирования и математических расчётов выросла на примерно 30%. Своего главного конкурента новинка от AMD обошла в обоих тестах, но незначительно уступила дорогущей GTX Titan в одном из них.

Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье «Современная терминология 3D-графики».
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

Существует два варианта этих шейдеров: с ориентацией на математические вычисления и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это универсальные тесты, производительность в которых зависит и от скорости блоков ALU, и от скорости текстурирования, также в них важен общий баланс чипа и эффективность исполнения вычислительных программ. Прошлые наши исследования показывают, что в этих конкретных задачах архитектура GCN от AMD выступает значительно лучше графической архитектуры Nvidia Kepler.

В тесте «Frozen Glass» скорость больше зависит от математической производительности и в случае Geforce явно заметен непонятный упор производительности. ПА вот Radeon R9 290X оказывается заметно быстрее обеих плат Nvidia, да и Radeon HD 7970 GHz в этом тесте обгоняет даже GTX Titan. Разница между R9 290X и HD 7970 GHz чуть меньше теоретической — 19%.

Во втором тесте «Parallax Mapping» новая видеокарта Radeon также показала производительность выше всех остальных представленных решений, и обогнала предшествующую модель Radeon HD 7970 GHz на те же 19%. А вот конкуренты от Nvidia, и GTX Titan и GTX 780 снова уступают обеим Radeon. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:

В этих условиях положение плат на чипах производства Nvidia несколько улучшилось, они справляются с текстурными выборками чуть лучше, чем в предыдущих тестах. Но это помогает не сильно, Radeon R9 290X всё равно на 19-20% быстрее HD 7970 GHz, которая справляется и с Titan и с GTX 780. Так что, анонсированная недавно видеокарта на чипе Hawaii справилась со всеми этими задачами весьма неплохо, явно лучше, чем Radeon HD 7970 GHz и все конкуренты.

Впрочем, это были давно устаревшие задачи, с упором в текстурирование, чего почти не встречается в играх. Дальше мы рассмотрим результаты ещё двух тестов пиксельных шейдеров, но уже версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9. Они более показательны с точки зрения современных игр на ПК, среди которых много мультиплатформенных. Тесты отличаются тем, что сильно нагружают и ALU, и текстурные модули, обе шейдерные программы сложны и длинны и включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье «Современная терминология 3D-графики».
  • Fur — процедурный шейдер, визуализирующий мех.

Данные тесты уже не ограничены производительностью только текстурных выборок или филлрейтом и больше всего зависят от эффективности исполнения сложного шейдерного кода. В самых тяжёлых DX9-тестах из первой версии пакета RightMark видеокарты производства Nvidia в предыдущие годы были сильнее, чем AMD, но архитектура GCN помогла видеокартам AMD вырваться вперёд, особенно после доводки драйверов.

Топовая новинка компании AMD показала отличный результат, обогнав свою предшественницу на базе чипа Tahiti на всё те же 20-24%, полностью соответствующие теории. Что касается сравнения с видеокартами Nvidia, то тут тоже всё прекрасно. Пусть в тесте Fur плата Radeon R9 290X и уступила GTX Titan, но совсем мизер, и результаты решений близки. Зато в тесте продвинутого параллакс-маппинга даже Titan отстаёт от сегодняшнего героя более чем на 40%.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два уже знакомых нам теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в этом тесте зависит от количества и эффективности блоков TMU, влияет и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает ещё и эффективный филлрейт и пропускная способность памяти. Результаты при детализации уровня «High» получаются до полутора раза ниже, чем при «Low».

В задачах процедурной визуализации меха с большим количеством текстурных выборок, за пару поколений графических архитектур компания AMD сократила разницу с платами Nvidia, а с выпуском GCN и вовсе вырвалась вперёд, и теперь именно платы Radeon являются лидерами таких сравнений, что говорит о высокой эффективности выполнения ими данных программ.

Если не брать в расчёт результат двухчиповой Radeon HD 7990, которая взята исключительно из теоретического интереса, то новый одночиповый топ в лице Radeon R9 290X обходит все остальные решения. Так, преимущество над Radeon HD 7970 GHz составляет 25-30%, а с учётом того, что и плата предыдущего поколения опережает даже Geforce GTX Titan, рассматриваемая сегодня модель компании AMD по сравнению с обеими Geforce показала очень высокий результат, на котором явно сказалось усиление блоков TMU и ALU.

Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: возможно, в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

Ситуация похожа на ту, что мы видели на предыдущей диаграмме, но обе видеокарты Nvidia уступают своим соперникам от AMD даже ещё больше. Новинка Radeon R9 290X оказывается быстрее модели HD 7970 GHz снова на 24-32%, что также близко к теоретической разнице. А уж преимущество над прямым конкурентом Geforce GTX 780 так и вовсе более чем двукратное! Даже GTX Titan сильно отстаёт от новинки. Преимущество в подобных вычислениях явно у чипов компании AMD, предпочитающих попиксельные вычисления.

Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип ещё примерно в два раза — такой режим называется «High».

Диаграмма в целом довольно похожа на предыдущую, также без включения SSAA, и Radeon R9 290X снова опережает предшествующую модель Radeon HD 7970 GHz на привычные 22-24%. Так как платы Nvidia в этом тесте справляются с работой всё так же хуже конкурирующих от AMD, то конкурирующая модель Geforce GTX 780 в обновленном D3D10-варианте теста без суперсэмплинга снова показывает результат хуже, чем даже Radeon HD 7970 GHz, не говоря уже о представленной на днях новинке от AMD, которая снова стала быстрейшим решением. Посмотрим, что изменит включение суперсэмплинга:

Всё снова примерно так же, что и в «Fur» — при включении суперсэмплинга и самозатенения, задача получается ещё более тяжёлой, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьёзное падение производительности. Разница между скоростными показателями протестированных видеокарт изменилась лишь немного, включение суперсэмплинга сказывается меньше, чем в предыдущем случае.

Графические решения от AMD в наших D3D10-тестах пиксельных шейдеров работают явно более эффективно, чем конкурирующие с ними Geforce, и новая топовая плата на чипе Hawaii становится очевидным лидером, если не рассматривать двухчиповую Radeon HD 7990, которая всё же быстрее из-за двух GPU. Героиня же сегодняшнего обзора показывает отличную скорость, опережая Radeon предыдущего поколения примерно настолько, насколько должна по теории. Далее мы посмотрим, что будет в чисто вычислительных задачах.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты наших предельных математических тестов лишь примерно соответствуют разнице в частотах и количестве вычислительных блоков, на них влияет разная эффективность их использования в конкретных решениях, а также отмечено влияние разной оптимизации драйверов. В случае теста Mineral, новая модель Radeon R9 290X обгоняет предшествующую HD 7970 GHz на 28%, что весьма близко к теоретической разнице в математической производительности между ними. Обе видеокарты Geforce уступают плате на основе Hawaii, хотя GTX Titan в своё время и справилась с HD 7970 GHz.

Отметим ещё раз, что архитектуры AMD в таких тестах ранее имели значительное преимущество перед конкурирующими видеокартами Nvidia, но в архитектуре Kepler компании Nvidia удалось увеличить число потоковых процессоров, и пиковая математическая производительность моделей Geforce, начиная с GTX 680, серьёзно возросла, что мы видим по результатам нашего первого математического теста. Но даже в таком случае рассматриваемая Radeon R9 290X опередила свою соперницу Geforce GTX 780 почти на 40%.

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нём только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Во втором математическом тесте мы видим слегка иные относительные результаты. Разница между Radeon HD 7970 GHz и новинкой в этом тесте стала ещё ближе к теоретической — 30%. И хотя новый одночиповый топ всё равно отстаёт от двухчиповой карты AMD предыдущего поколения, но даже более сложное и дорогое решение от Nvidia не может ничего противопоставить новинке от компании AMD, которая оказывается заметно быстрее в математических тестах.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близкое к двукратному. Задача эта для современных видеокарт не слишком сложная, и производительность в ней ограничена скоростью обработки геометрии, а иногда — пропускной способностью памяти.

Явная разница между результатами видеокарт на чипах Nvidia и AMD (при одинаковом количестве GPU, поэтому Radeon HD 7990 можно не учитывать) обусловлена отличиями в геометрических конвейерах чипах этих компаний. Если в предыдущих тестах с пиксельными шейдерами платы AMD были заметно эффективнее и быстрее, то тесты геометрии всегда показывают, что в таких задачах платы Nvidia оказываются производительнее.

Сегодняшняя новинка Radeon R9 290X на чипе Hawaii имеет большое количество геометрических блоков, по сравнению с Radeon HD 7970 GHz на базе Tahiti, но в данном случае ограничителем стала скорее математическая производительность, так как разница между указанными решениями составила 30%, а не 90%. У решений Nvidia с геометрической производительностью дела получше, поэтому они оказываются быстрее. Впрочем, новый Radeon не так уж сильно уступает Geforce GTX 780, а GTX Titan не является прямым конкурентом новинки. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры слегка улучшились и для плат AMD и для решений Nvidia. Видеокарты в первом тесте геометрических шейдеров слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, а поэтому и все выводы остаются прежними. Новая модель Radeon R9 290X всё так же примерно на треть быстрее одночипового предшественника из семейства Radeon HD 7000, так что в выводах ничего не изменилось.

К сожалению, но «Hyperlight» — второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load, в котором используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output, на всех современных видеокартах компании AMD, включая и представленную топовую Radeon R9 290X, просто не работает. В какой-то момент обновление драйверов Catalyst привело к тому, что данный тест просто не запускается.

Так что самый интересный геометрический тест, который предполагает большую нагрузку именно на геометрические шейдеры, в котором Radeon R9 290X мог показать своё преимущество по сравнению с HD 7970 GHz, платы AMD снова проваливают, а ведь именно в нём и нужно было исправлять проигрыш видеокарт Radeon... В этом тесте единственно важным параметром является производительность геометрических блоков, с которой дела у Nvidia обстоят заметно лучше. Впрочем, какие-то выводы о скорости обработки геометрии мы ещё сделаем в разделе DirectX 11 тестов.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Наши предыдущие исследования показали, что на результаты этого теста может влиять и филлрейт и пропускная способность памяти (особенно это заметно в лёгком режиме). Результаты видеокарт Nvidia зачастую ограничены ещё чем-то странным, а единственная двухчиповая плата от AMD в этом тесте получает очень приличный прирост от CrossFire-рендеринга.

Самой быстрой в сравнении стала двухчиповая Radeon HD 7990, которая идёт сегодня вне конкурса, а остальные платы расположились ближе друг к другу по скорости. Хотя именно новая модель Radeon R9 290X побеждает во всех режимах, причём её преимущество над HD 7970 GHz говорит о том, что скорость плат Radeon тут ограничена производительностью блоков ROP.

Результаты новинки превышают производительность обеих плат Nvidia на чипе GK110, и GTX Titan и GTX 780 уступают новинке достаточно много, чуть ли не двукратно. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Ситуация на диаграмме полностью изменилась — результаты решений компании AMD в тяжёлых режимах заметно ухудшились, а Geforce почти не ухудшили их. Теперь даже Radeon HD 7990 в тяжёлом режиме показывает результат, схожий со скоростью топовой платы Nvidia. Новая видеоплата Radeon R9 290X остаётся лидером среди одночиповых карт в двух их трёх подтестов, и чуть уступает только GTX Titan в самом сложном. Разница же с HD 7970 GHz снова достигает 90%, говорящих об упоре платы на Tahiti в филлрейт (скорость ROP).

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты во втором тесте вершинного текстурирования «Waves» в целом схожи с теми, что мы видели на предыдущих диаграммах. По каким-то странным причинам показатели обеих плат Geforce в лёгком режиме остаются довольно слабыми и сравнимы разве что с Radeon HD 7970 GHz. Скорость новой платы Radeon в этом тесте очень неплохая, одночиповый топ R9 290X быстрее HD 7970 GHz на 40-100%. Рассмотрим второй вариант этого же теста:

А вот в этом тесте с усложнением задачи скорость всех решений стала ниже, а не только Radeon. Особенно серьёзно пострадали видеокарты Geforce в лёгких режимах, которые уступили даже Radeon HD 7970 GHz. Результаты же сегодняшней новинки R9 290X снова оказались до двух раз лучше, чем у предшественницы, поэтому она снова стала лучшей одночиповой видеокартой, что стало ожидаемым результатом, ведь скорость текстурирования и особенно блоков ROP у неё серьёзно выросли.

3DMark Vantage: тесты Feature

Синтетические тесты из пакета 3DMark Vantage покажут нам то, что мы ранее упустили. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10 и интересны тем, что отличаются от наших и до сих пор актуальны. При анализе результатов новой видеокарты Radeon R9 290X в этом пакете мы сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark.

Feature Test 1: Texture Fill

Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Эффективность видеокарт AMD и Nvidia в текстурном тесте компании Futuremark достаточно высока и сравнительные цифры моделей близки к соответствующим теоретическим параметрам. Топовая модель нового поколения Radeon R9 290X на 27% быстрее HD 7970 GHz из предыдущего поколения, что примерно соответствует теоретической разнице по скорости текстурирования между ними. Новинка от AMD уступила двухчиповой плате предыдущего семейства по текстурированию, но отставание не такое уж большое.

Что касается сравнения скорости платы R9 290X с решениями от конкурента, то новинка от AMD по текстурной скорости слегка обгоняет своего прямого конкурента Geforce GTX 780 и при этом немного уступает GTX Titan — заметно более дорогой модели на базе того же видеочипа GK110. В целом, это ожидаемые цифры для новинки, полностью соответствующие теории.

Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нём используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Удивительно, но в тесте производительности блоков ROP, результат у свежеанонсированной платы AMD получился явно слабее, чем мы могли ожидать. По теории, если в тесте измерялась бы именно скорость ROP, то Radeon R9 290X должен был оказаться заметно быстрее своего предшественника. Но, как мы ранее определили, цифры этого подтеста из 3DMark Vantage показывают производительность блоков ROP с учётом величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), и тест измеряет пропускную способность памяти, а не производительность ROP.

А вот разнице в ПСП эти самые 17% между R9 290X и HD 7970 GHz соответствуют, так что всё в порядке. Что касается сравнения скорости новинки с платами от компании Nvidia, то представленная недавно модель Radeon показала примерно такую же скорость заполнения сцены, что и более дорогой одночиповый конкурент с большей ценой и сложностью чипа — GTX Titan, а прямого конкурента GTX 780 новинка всё же опередила на 20% — неплохой результат, который обязательно скажется в играх.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нём рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоёмкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжёлого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчёты освещения по Strauss.

Этот тест отличается от проведённых нами ранее тем, что результаты в нём зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен верный баланс GPU, а также эффективность выполнения сложных шейдеров.

В данном случае, важны и математическая и текстурная производительность, поэтому в синтетике из 3DMark Vantage новая плата Radeon R9 290X с 24%-ным преимуществом обгоняет свою предшественницу HD 7970 GHz — всё ровно по теоретической разнице по скорости текстурирования и скорости вычислений.

И раз даже Radeon HD 7970 GHz немного опережает обе платы Nvidia на базе чипов GK110 в этом тесте, так как GPU производства AMD являются более эффективными в этой задаче, то неудивительно, что лучшей одночиповой платой в сравнении снова стала новая модель Radeon, причём от карты на базе двух чипов Tahiti она отстала не так уж сильно.

Feature Test 4: GPU Cloth

Четвёртый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте зависит сразу от нескольких параметров и основными факторами влияния является производительность обработки геометрии и эффективность выполнения геометрических шейдеров. Но картина на диаграмме получилась весьма странная, все видеокарты Radeon показывают частоту кадров около 130 FPS, а результаты обеих Geforce также упёрлись в предел, но на уровне около 95 FPS.

Хотя такие результаты довольно странны для того, чтобы делать по ним глобальные выводы, но всё же новая одночиповая модель Radeon R9 290X показывает скорость выше, чем Geforce GTX 780 и GTX Titan и не уступает обеим платам предыдущего поколения, основанным на чипах Tahiti. Это очень странно, так как геометрическая производительность у карт Nvidia должна быть выше, чем у решения конкурента, так как первые не просто имеют распараллеленный геометрический конвейер, но большее количество соответствующих исполнительных блоков. Мы ещё проверим это в DirectX 11-тестах.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчётами, также тестируется stream out.

Во втором геометрическом тесте из 3DMark Vantage ситуация иная. В этот раз лидирует двухчиповая Radeon HD 7990, а новая Radeon R9 290X оказалась на треть производительнее предшественницы — HD 7970 GHz, что говорит скорее об упоре в математическую производительность, нежели геометрическую.

Если сравнивать скорость новинки с Geforce GTX 780 и GTX Titan, то новый GPU от AMD оказался весьма эффективным в этой задаче и позволил новой плате почти догнать самый дорогой (на текущий момент) вариант Geforce, основанный на чипе GK110. А ведь раньше синтетические тесты имитации тканей и частиц из тестового пакета 3DMark Vantage, в которых активно используются геометрические шейдеры, показывали, что платы Nvidia в них опережают соперников от AMD. Очень хороший результат для Hawaii!

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических расчётов.

В чисто математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы видим отличающееся распределение результатов, по сравнению с двумя аналогичными тестами из нашего тестового пакета. В этом случае производительность решений не полностью соответствует теории и расходится с тем, что мы видели ранее в математических тестах из пакета RightMark 2.0.

Видеокарты Radeon компании AMD, созданные на базе чипов архитектуры GCN, всегда очень хорошо справляются с подобными задачами, и показывают лучшие результаты в случаях, когда выполняется интенсивная «математика». Даже видеоплата Radeon HD 7970 GHz в этом тесте показала отличный результат на уровне Geforce GTX Titan, обогнав GTX 780, что уж говорить о более мощной плате Radeon R9 290X?

Рассматриваемая сегодня видеокарта показала скорость на 17% выше, чем предшествующая одночиповая модель HD 7970 GHz и лишь немного не дотянулась до двухчиповой HD 7990. Соответственно, она превзошла как близкую по цене Geforce GTX 780, так и более дорогую GTX Titan. Хотя возросшая эффективность видеокарт на основе чипов архитектуры Kepler в этой задаче позволила им улучшить свои показатели, но успешно бороться с соответствующими по стоимости решениям Radeon они не могут.

Direct3D 11: Вычислительные шейдеры

Чтобы протестировать новое решение компании AMD в задачах, использующих такие новые возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы воспользовались примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, Nvidia и AMD.

Сначала мы рассмотрим тесты, использующие вычислительные (Compute) шейдеры. Их появление — одно из наиболее важных нововведений в последних версиях DX API, они уже используются в современных играх для выполнения различных задач: постобработки, симуляций и т. п. В первом тесте показан пример HDR-рендеринга с tone mapping из DirectX SDK, с постобработкой, использующей пиксельные и вычислительные шейдеры.

Хоть это и не самый удачный пример задачи с применением вычислительных шейдеров, но разницу в производительности в конкретной задаче он показывает. Скорость расчётов в вычислительном и пиксельном шейдерах для всех плат давно одинаковая, хотя у видеокарт с GPU предыдущих архитектур были различия. Судя по нашим предыдущим тестам, результаты в задаче явно зависят не только от математической мощи и эффективности вычислений, но и от других факторов, вроде пропускной способности памяти и производительности ROP.

И в данном случае именно в ПСП скорость видеокарт и упирается. Новая плата от компании AMD в этом тесте оказалась лишь на 10-15% быстрее своей одночиповой предшественницы из семейства Radeon HD 7000 и сильно уступила двухчиповой HD 7990. Впрочем, новинка всё же опережает обе конкурирующие модели от Nvidia, даже эксклюзивную одночиповую модель GTX Titan, которая стоит заметно дороже. Что касается сравнения с настоящим конкурентом в лице GTX 780, то новинка впереди на 20-25%.

Второй тест вычислительных шейдеров также взят из Microsoft DirectX SDK, в нём показана расчётная задача гравитации N тел (N-body) — симуляция динамической системы частиц, на которую воздействуют физические силы, такие как гравитация.

В этом случае расклад сил между решениями разных компаний получился иной. Мы видим, что у решений Nvidia есть явное преимущество в подобных сложных расчётных задачах, а любые Radeon пасуют перед ними, тем более, что преимущества от работы двух GPU в данном случае просто нет. Поэтому в этом тесте совершенно логично побеждает мощнейшая Geforce GTX Titan, а следом за ней идёт конкурент новинки ещё одна плата на GK110.

Похоже на то, что в этом тесте упор не в скорость исполнения простых математических вычислений, но и в эффективности выполнения сложного кода с ветвлениями и т.п. Тем более удивительно, что представленный на днях Radeon R9 290X в этой задаче оказался между Radeon HD 7970 GHz и HD 7990, на предпоследнем месте, уступив своим конкурентам. Но он уступил не HD 7990, а своему одночиповому предшественнику! Получается, что в этой конкретной задаче эффективность Hawaii даже ухудшилась, по сравнению с Tahiti. И виноваты в этом то ли недоработанные драйверы, то ли меньшая тактовая частота новинки.

Direct3D 11: Производительность тесселяции

Вычислительные шейдеры очень важны, но ещё одним важным нововведением в Direct3D 11 считается аппаратная тесселяция. Мы очень подробно рассматривали её в своей теоретической статье про Nvidia GF100. Тесселяцию уже довольно давно начали использовать в DX11-играх, таких как STALKER: Зов Припяти, DiRT 2, Aliens vs Predator, Metro Last Light, Civilization V, Crysis 3, Battlefield 3 и других. В некоторых из них тесселяция используется для моделей персонажей, в других — для имитации реалистичной водной поверхности или ландшафта.

Существует несколько различных схем разбиения графических примитивов (тесселяции). Например, phong tessellation, PN triangles, Catmull-Clark subdivision. Так, схема разбиения PN Triangles используется в STALKER: Зов Припяти, а в Metro 2033 — Phong tessellation. Эти методы сравнительно быстро и просто внедряются в процесс разработки игр и существующие движки, поэтому и стали популярными.

Первым тестом тесселяции будет пример Detail Tessellation из ATI Radeon SDK. В нём реализована не только тесселяция, но и две разные техники попиксельной обработки: простое наложение карт нормалей и parallax occlusion mapping. Что ж, сравним DX11-решения AMD и Nvidia в различных условиях:

В тесте простого бампмаппинга скорость чаще всего упирается в ПСП, и результат новой видеокарты AMD примерно на 25% выше скорости предшествующей модели — Radeon HD 7970 GHz. Естественно, что двухчиповый HD 7990 в этом тесте производительнее, но зато новинка опережает обе топовые платы конкурента с приличным запасом.

Во втором подтесте с более сложными попиксельными расчётами всё несколько интереснее. Эффективность выполнения таких математических вычислений в пиксельных шейдерах у чипов архитектуры GCN выше, чем у Kepler. Обе платы Nvidia показали почти идентичный результат, и GTX 780 и Titan, но и HD 7970 GHz недалеко. А вот новый Radeon R9 290X на базе графического процессора Hawaii оказался быстрее них почти на треть, что соответствует теории.

Да и в самом интересном тесте с тесселяцией результат новинки очень неплох — она показала также более высокую скорость, чем Titan и GTX 780. В данном тесте тесселяции разбиение треугольников весьма умеренное и скорость в нём совсем не упирается в производительность блоков обработки геометрии, поэтому скорости обработки треугольников у платы компании AMD вполне хватает, чтобы показывать высокие результаты.

Вторым тестом производительности тесселяции будет ещё один пример для 3D-разработчиков из ATI Radeon SDK — PN Triangles. Собственно, оба примера входят также и в состав DX SDK, так что мы уверены, что на их основе создают свой код игровые разработчики. Этот пример мы протестировали с различным коэффициентом разбиения (tessellation factor), чтобы понять, как сильно влияет его изменение на общую производительность.

В этом примере применяется куда более сложная геометрия, поэтому и сравнение геометрической мощи различных решений по этому тесту приносит другие выводы. Все представленные в материале современные решения хорошо справляются с лёгкой и средней геометрической нагрузкой, показывая высокую скорость, но в тяжёлых условиях графические процессоры Nvidia оказываются заметно более производительными.

Анонсированная недавно модель Radeon R9 290X основана на чипе Hawaii, который имеет вдвое большее количество геометрических блоков, по сравнению с Tahiti, поэтому она становится лучшей в зачёте одночиповых видеокарт AMD и почти на одном уровне с HD 7990. Разница между R9 290X и HD 7970 GHz составляет до 50%, что хоть и меньше обещанных 90%, но всё же весьма неплохо. Ну а если брать все решения в целом, то R9 290X уступает только видеокартам Nvidia и в более сложных условиях, когда скорость всех Radeon серьёзно падает, а у плат Geforce остаётся сравнительно высокой.

Рассмотрим результаты ещё одного теста — демонстрационной программы Nvidia Realistic Water Terrain, также известной как Island. В этой демке используется тесселяция и карты смещения (displacement mapping) для рендеринга реалистично выглядящей поверхности океана и ландшафта.

Тест Island не является чисто синтетическим тестом для измерения исключительно геометрической производительности GPU, так как он содержит и сложные пиксельные и вычислительные шейдеры в том числе, и такая нагрузка ближе к реальным играм, в которых используются все блоки GPU, а не только геометрические, как в предыдущих тестах геометрии. Впрочем, основной всё равно остаётся именно нагрузка на блоки обработки геометрии.

Как обычно, мы протестировали решения при четырёх разных коэффициентах тесселяции — в данном случае настройка называется Dynamic Tessellation LOD. Если при самом первом коэффициенте разбиения треугольников, когда скорость не ограничена производительностью геометрических блоков, новая одночиповая видеокарта компании AMD показывает достаточно высокий результат почти на уровне Geforce GTX 780, то при увеличении геометрической работы платы компании Nvidia вырываются далеко вперёд, а производительность всех плат Radeon заметно снижается.

Обе видеокарты на базе чипов GK110 в этом тесте весьма быстры, и примерно вдвое производительнее новинки от конкурента в лице Radeon R9 290X. Новая плата от AMD хотя и показывает во всех режимах неплохие результаты (для решений AMD), обгоняя предыдущую модель Radeon HD 7970 GHz на 30-50%, но этого явно не хватает для равной борьбы с Geforce GTX 780 и Titan. Хотя, нужно отметить, что результаты новинки AMD в тестах тесселяции очень хороши, чип Hawaii кажется неплохо сбалансированным и сдают позиции в геометрических тестах только в экстремальных условиях, которых в играх просто нет.

Выводы по синтетическим тестам

Результаты синтетических тестов топовой видеокарты Radeon R9 290X, основанной на новом мощнейшем графическом процессоре Hawaii, а также результаты других моделей видеокарт производства обоих производителей дискретных видеочипов показали, что новое решение компании AMD является одной из самых мощных видеокарт из одночиповых решений и успешно сражается не только с близкой по цене платой Geforce GTX 780, но и с заметно более дорогой GTX Titan. Новинка от AMD является наиболее выгодным предложением на рынке в верхнем ценовом диапазоне и будет успешно конкурировать с ранее представленными в нём решениями Nvidia.

Превосходство новой модели в производительности перед предшествующей ей Radeon HD 7970 GHz из предыдущего поколения было вполне ожидаемым и подтвердилось нашими результатами в «синтетике». За исключением редких задач, недавно анонсированная модель Radeon отлично выступила и по сравнению с самыми мощными моделями конкурента: Geforce GTX 780 и Titan даже при том, что последняя не является прямым конкурентом для неё. Наш набор синтетических тестов показал, что по производительности новый Radeon должен поспорить с Geforce GTX 780 и в играх.

Среди наиболее сильных сторон Radeon R9 290X — математическая и текстурная производительность, но особенно — производительность блоков ROP, которая выросла почти вдвое. В сравнительно слабые характеристики можно записать меньшую геометрическую производительность, но только по сравнению с конкурентами от Nvidia, а также увеличившуюся лишь на 20% пропускную способность памяти, которой может быть мало в самых сложных условиях. Впрочем, не нужно забывать, что ПСП у Radeon R9 290X выше, чем у любых моделей Geforce конкурента, а в реальных играх просто нет столько геометрии, чтобы слабость чипов AMD стала заметна.

В целом, новая модель Radeon является очень интересным предложением для ультраэнтузиастов, которые хотят играть при максимальных настройках в высочайших разрешениях и получить при этом максимальную 3D-производительность. Теперь можно не отдавать кучу денег за Geforce GTX Titan, а отдать лишь половину её за Radeon R9 290X. Новая видеоплата AMD стоит заметно дешевле, а разница между ними по скорости будет очень небольшой в большинстве случаев, а то и вовсе не будет заметна. В общем, рынок получил очередное мощнейшее решение, и нам будет очень интересно оценить его реальную производительность в играх в следующей части статьи.

AMD Radeon R9 290X — Часть 3: производительность в игровых тестах →

2 блока питания Corsair CMPSU-1200AXEU для тестового стенда предоставлены компанией Corsair

Корпус Corsair Obsidian 800D-Full Tower для тестового стенда предоставлен компанией Corsair

Модули памяти Corsair Vengeance CMZ16GX3M4X1600C9 для тестового стенда предоставлены компанией Corsair

Corsair Hydro SeriesT H100i CPU Cooler для тестового стенда предоставлен компанией Corsair

Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт

Системная плата Asus Sabertooth X79 для тестового стенда предоставлена компанией AsusTeK

Системная плата MSI X79A-GD45(8D) для тестового стенда предоставлена компанией MSI

Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate

Накопитель SSD OCZ Octane 512 ГБ для тестового стенда предоставлен компанией OCZ Russia

2 накопителя SSD Corsair Neutron SeriesT 120 ГБ для тестового стенда предоставлены компанией Corsair

Монитор Asus ProArt PA249Q для рабочего компьютера предоставлен компанией AsusTeK




Дополнительно

Обзор нового видеоускорителя AMD Radeon R9 290X. Часть 2 — Особенности видеокарты, результаты синтетических тестов

AMD Radeon R9 290X:

описание видеокарты и результаты синтетических тестов

Содержание

В этой части мы изучим видеокарту, а также познакомимся с результатами синтетических тестов. В нашей лаборатории побывала референс карта AMD.

Платa

AMD Radeon R9 290X 4096 МБ 512-битной GDDR5 PCI-E
  • GPU: Radeon R9 290X (Hawaii)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs): 1000 МГц (номинал — 1000 МГц)
  • Частота работы памяти (физическая (эффективная)): 1250 (5000) МГц (номинал — 1250 (5000) МГц)
  • Ширина шины обмена с памятью: 512 бит
  • Число вычислительных блоков в GPU/частота работы блоков: 44/1000 МГц (номинал — 44/1000 МГц)
  • Число операций (ALU) в блоке: 64
  • Суммарное число операций (ALU): 2816
  • Число блоков текстурирования: 176 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 64
  • Размеры: 280×100×37 мм (видеокарта занимает 2 слота в системном блоке)
  • Цвет текстолита: черный
  • Энергопотребление (пиковое в 3D (Uber)/3D (Quiet)/в режиме 2D/в режиме «сна»): 298/246/49/3 Вт
  • Выходные гнезда: 2×DVI (Dual-Link/HDMI), 1×HDMI 1.4a, 1×DisplayPort 1.2
  • Поддержка многопроцессорной работы: CrossFire X (Hardware)

AMD Radeon R9 290X 4096 МБ 512-битной GDDR5 PCI-E
Карта имеет 4096 МБ памяти GDDR5 SDRAM, размещенной в 16 микросхемах (на лицевой стороне PCB).

Микросхемы памяти Hynix (GDDR5). Микросхемы рассчитаны на максимальную частоту работы в 1500 (6000) МГц.

Сравнение с эталонным дизайном, вид спереди
AMD Radeon R9 290X 4096 МБ 512-битной GDDR5 PCI-E Reference card AMD Radeon HD 7970

Сравнение с эталонным дизайном, вид сзади
AMD Radeon R9 290X 4096 МБ 512-битной GDDR5 PCI-E Reference card AMD Radeon HD 7970

Мы выбрали Radeon HD 7970 для сравнения только потому, что этот ускоритель также был флагманом у AMD. Понятно, что карты сильно отличаются прежде всего шинами обмена с памятью, поэтому различия PCB существенные. Ядро здесь окружено очень плотным кольцом микросхем памяти (как ореолом) — 16 микросхем на одной стороне PCB! Казалось бы, можно было половину разместить на обороте. Но тогда создались бы проблемы для партнеров, которым пришлось бы искать варианты охлаждения микросхем памяти не только на лицевой, но и на оборотной стороне карты.

Ядро — весьма большое, выполнено в виде прямоугольника. Кристалл изготовлен на 31й неделе этого года, то есть в августе.

Система питания — 6-фазная, управляется цифровым контроллером IR 3567B, который обеспечивает работу PowerTune. 5 фаз отводится на питание ядра, а шестая — для микросхем памяти и прочей логики. Про PowerTune мы уже писали в первой части статьи. Стоит еще раз заметить, что видеокарта имеет переключатель BIOS, подобный тому, что мы видели на Radeon серии HD 69xx. По умолчанию установлен режим Quiet (тихий), который обеспечивает более тихую работу СО, однако с потерями в производительности (впрочем, явно не существенными). Можно переключиться на режим Uber (полноценный). Более детально рассмотрим эти варианты ниже.

Ускоритель имеет следующий набор гнезд вывода: 2 DVI (совместимы с выводом на HDMI) и по одному DisplayPort и HDMI (суммарно можно подключить 3 приемника с HDMI). Напомним, что ускорители AMD достаточно давно обладают собственными звуковыми кодеками для вывода звука по HDMI. А R9 290X к тому же поддерживает программируемый движок TrueAudio, который, впрочем, пока трудно назвать актуальным, так как нужна поддержка со стороны разработчиков игр. А будут ли они это делать, учитывая крайне малую распространенность этого движка, — неизвестно.

Максимальные разрешения и частоты в 3D:

  • 240 Гц — максимальная частота обновления;
  • 2048×1536@85 Гц — по аналоговому интерфейсу;
  • 2560×1600@60 Гц — по цифровому интерфейсу (для DVI-гнезд с Dual-Link/HDMI). Теоретически существует поддержка 4К, однако пока это лишь декларация.

Что касается возможностей по ускорению декодирования видео — в 2007 году мы проводили такое исследование, с ним можно ознакомиться здесь.

Карта требует дополнительного питания в виде двух разъемов: 8- и 6-контактного.

О системе охлаждения.

AMD Radeon R9 290X 4096 МБ 512-битной GDDR5 PCI-E
Система охлаждения — под стать очень мощному ускорителю. Основана на испарительной камере, которая лежит в основе большого радиатора без тепловых трубок. Способ охлаждения последнего также традиционен: с помощью цилиндрического вентилятора, расположенного в конце кулера.

Микросхемы памяти, как и силовые транзисторы, охлаждаются основным радиатором.

А вот с шумом кулера — история сложная. Понятно, что в Uber-режиме вентилятор шумит весьма ощутимо (частота вращения достигает 2900 и выше оборотов в минуту), однако и в Quiet-режиме шум кулера весьма ощутим.

Мы провели исследование температурного режима с помощью новой версии 4.2.1 утилиты EVGA PrecisionX (автор А. Николайчук AKA Unwinder) и получили следующие результаты.

AMD Radeon R9 290X 4096 МБ 512-битной GDDR5 PCI-E (Uber mode/Режим полной мощности)
AMD Radeon R9 290X 4096 МБ 512-битной GDDR5 PCI-E (Quiet mode/Тихий режим)

После 6 часов прогона карты под максимальной игровой нагрузкой максимальная температура ядра составила 95 градусов, что для такого рода ускорителя почти предельный результат, хотя AMD уверяет, что такой нагрев никак не повредит ни ядро, ни карту.

Что же мы видим? Понятно, что в Uber-режиме из ускорителя выжимается все, что можно, поэтому частота вращения вентилятора находится почти на максимуме того, что дозволено этим режимом (55% от максимально возможных оборотов, заложенных конструкцией вентилятора). Причем даже 55% — это выше 2900 оборотов в минуту и с весьма ощутимым ревом. Страшно даже представить себе, как будет орать СО при достижении 100%. Учитывая, что мало кто из партнеров AMD будет использовать референс-кулер, им придется хорошо поломать голову над тем, как обеспечить относительную тишину кулера и при этом не сильно принизить частотный потенциал ускорителя — особенно это будет касаться всякого рода OC-версий.

А вот режим Quiet ограничивает работу кулера на 40% от максимально возможных оборотов. Однако в данном случае технология PowerTune вынуждена весьма часто понижать частоту работы GPU, чтобы сохранить карту в разрешенных пределах температуры. Это уравнение с двумя переменными, которое системе необходимо решать каждую секунду работы, и мы прекрасно видим результат по зубчатой диаграмме мониторинга частоты работы GPU. И подчеркну еще раз: даже в таком режиме СО все равно производит весьма ощутимый шум.

Комплектация. Референс-карта прибыла к нам в ОЕМ-упаковке, поэтому комплекта нет.

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютеры на базе процессора Intel Core i7-3960X (Socket 2011):
    • 2 процессора Intel Core i7-3960X (o/c 4 ГГц);
    • СО Hydro SeriesT H100i Extreme Performance CPU Cooler;
    • СО Intel Thermal Solution RTS2011LC;
    • системная плата Asus Sabertooth X79 на чипсете Intel X79;
    • системная плата MSI X79A-GD45(8D) на чипсете Intel X79;
    • оперативная память 16 ГБ DDR3 Corsair Vengeance CMZ16GX3M4A1600C9 1600 МГц;
    • жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA2;
    • жесткий диск WD Caviar Blue WD10EZEX 1 TБ SATA2;
    • 2 SSD Corsair Neutron SSD CSSD-N120GB3-BK;
    • 2 блока питания Corsair CMPSU-1200AXEU (1200 Вт);
    • корпус Corsair Obsidian 800D Full-Tower.
  • операционная система Windows 7 64-битная; DirectX 11;
  • монитор Dell UltraSharp U3011 (30″);
  • драйверы AMD версии Catalyst 13.11beta5; Nvidia версии 331.58

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

В качестве синтетических тестов DirectX 11 мы использовали примеры из пакетов SDK компаний Microsoft и AMD, а также демонстрационную программу Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010). Мы взяли и приложения обоих производителей видеочипов: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain, также известная как Island11.

Синтетические тесты проводились на следующих видеокартах:

  • Radeon R9 290X со стандартными параметрами в режиме «Uber Mode»(далее R9 290X)
  • Radeon HD 7970 GHz со стандартными параметрами (далее HD 7970 GHz)
  • Radeon HD 7990 со стандартными параметрами (далее HD 7990)
  • Geforce GTX Titan со стандартными параметрами (далее GTX Titan)
  • Geforce GTX 780 со стандартными параметрами (далее GTX 780)

Для анализа результатов новой топовой видеокарты Radeon R9 290X были выбраны именно эти решения по следующим причинам. Radeon HD 7970 GHz является предыдущей моделью компании, относящейся к самой верхней ступеньке среди одночиповых решений — будет интересно посмотреть, насколько инженеры смогли повысить производительность новинки по сравнению с платой на Tahiti. Сравнение с Radeon HD 7990 будет интересно потому, что это — мощнейшая двухчиповая видеокарта от AMD, основанная на двух Tahiti и имеющая очень высокое энергопотребление.

От конкурирующей компании Nvidia для сравнения также были выбраны две видеоплаты. Хотя обе они основаны на топовом чипе GK110, но их скоростные характеристики слегка отличаются. Geforce GTX 780 на время выхода Radeon R9 290X является (как минимум, пока что) её основным конкурентом по цене, а ещё более производительная видеоплата Geforce GTX Titan стоит дороже и показывает максимальную производительность среди одночиповых решений на данный момент, а также может служить как бы прообразом ожидаемой вскоре Geforce GTX 780 Ti.

Direct3D 9: тесты Pixel Shaders

Тесты текстурирования и заполнения (филлрейта) из пакета 3DMark Vantage мы рассмотрим чуть позже, а первая группа пиксельных шейдеров, которую мы используем, включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся разве что в старых играх, очень простых для современных видеочипов.

С этими тестами современные GPU справляются «одной левой», а скорость самых мощных решений в них всегда упирается в различные ограничители. Тесты не способны показать возможности современных видеочипов, и интересны лишь с точки зрения устаревших игровых приложений. Производительность современных видеокарт в этих тестах часто ограничена текстурированием или филлрейтом, а обе видеокарты Nvidia показывают чуть ли не идентичные цифры.

Новая модель видеокарты AMD в этом сравнении стала лучшей (при отсутствии двухчиповой платы из предыдущей линейки), опередив своего предшественника в лице Radeon HD 7970 GHz на 17-25%, как и должно быть по теории. Обе платы Nvidia уступают новинке Radeon, которая стала мощнейшей в сравнении и лидирует во всех подтестах. Посмотрим на результаты более сложных пиксельных программ промежуточных версий:

Тест Cook-Torrance более интенсивен вычислительно, и скорость в нём сильнее зависит от количества ALU и их частоты, но также и от скорости TMU. Этот тест исторически лучше подходит для графических решений компании AMD, хотя новые топовые платы Geforce на базе архитектуры Kepler в нём также показывают сильные результаты.

Мощнейшая плата семейства Radeon R9 290X также ожидаемо оказалась быстрее предшествующей HD 7970 GHz на 24-28%, как и должно быть, исходя из теории. Что в тесте освещения, больше зависящем от скорости ALU, что в тесте Water, скорость в котором больше зависит от текстурирования, мы видим примерно одно и то же — ведь скорость текстурирования и математических расчётов выросла на примерно 30%. Своего главного конкурента новинка от AMD обошла в обоих тестах, но незначительно уступила дорогущей GTX Titan в одном из них.

Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье «Современная терминология 3D-графики».
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

Существует два варианта этих шейдеров: с ориентацией на математические вычисления и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это универсальные тесты, производительность в которых зависит и от скорости блоков ALU, и от скорости текстурирования, также в них важен общий баланс чипа и эффективность исполнения вычислительных программ. Прошлые наши исследования показывают, что в этих конкретных задачах архитектура GCN от AMD выступает значительно лучше графической архитектуры Nvidia Kepler.

В тесте «Frozen Glass» скорость больше зависит от математической производительности и в случае Geforce явно заметен непонятный упор производительности. ПА вот Radeon R9 290X оказывается заметно быстрее обеих плат Nvidia, да и Radeon HD 7970 GHz в этом тесте обгоняет даже GTX Titan. Разница между R9 290X и HD 7970 GHz чуть меньше теоретической — 19%.

Во втором тесте «Parallax Mapping» новая видеокарта Radeon также показала производительность выше всех остальных представленных решений, и обогнала предшествующую модель Radeon HD 7970 GHz на те же 19%. А вот конкуренты от Nvidia, и GTX Titan и GTX 780 снова уступают обеим Radeon. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:

В этих условиях положение плат на чипах производства Nvidia несколько улучшилось, они справляются с текстурными выборками чуть лучше, чем в предыдущих тестах. Но это помогает не сильно, Radeon R9 290X всё равно на 19-20% быстрее HD 7970 GHz, которая справляется и с Titan и с GTX 780. Так что, анонсированная недавно видеокарта на чипе Hawaii справилась со всеми этими задачами весьма неплохо, явно лучше, чем Radeon HD 7970 GHz и все конкуренты.

Впрочем, это были давно устаревшие задачи, с упором в текстурирование, чего почти не встречается в играх. Дальше мы рассмотрим результаты ещё двух тестов пиксельных шейдеров, но уже версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9. Они более показательны с точки зрения современных игр на ПК, среди которых много мультиплатформенных. Тесты отличаются тем, что сильно нагружают и ALU, и текстурные модули, обе шейдерные программы сложны и длинны и включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье «Современная терминология 3D-графики».
  • Fur — процедурный шейдер, визуализирующий мех.

Данные тесты уже не ограничены производительностью только текстурных выборок или филлрейтом и больше всего зависят от эффективности исполнения сложного шейдерного кода. В самых тяжёлых DX9-тестах из первой версии пакета RightMark видеокарты производства Nvidia в предыдущие годы были сильнее, чем AMD, но архитектура GCN помогла видеокартам AMD вырваться вперёд, особенно после доводки драйверов.

Топовая новинка компании AMD показала отличный результат, обогнав свою предшественницу на базе чипа Tahiti на всё те же 20-24%, полностью соответствующие теории. Что касается сравнения с видеокартами Nvidia, то тут тоже всё прекрасно. Пусть в тесте Fur плата Radeon R9 290X и уступила GTX Titan, но совсем мизер, и результаты решений близки. Зато в тесте продвинутого параллакс-маппинга даже Titan отстаёт от сегодняшнего героя более чем на 40%.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два уже знакомых нам теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в этом тесте зависит от количества и эффективности блоков TMU, влияет и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает ещё и эффективный филлрейт и пропускная способность памяти. Результаты при детализации уровня «High» получаются до полутора раза ниже, чем при «Low».

В задачах процедурной визуализации меха с большим количеством текстурных выборок, за пару поколений графических архитектур компания AMD сократила разницу с платами Nvidia, а с выпуском GCN и вовсе вырвалась вперёд, и теперь именно платы Radeon являются лидерами таких сравнений, что говорит о высокой эффективности выполнения ими данных программ.

Если не брать в расчёт результат двухчиповой Radeon HD 7990, которая взята исключительно из теоретического интереса, то новый одночиповый топ в лице Radeon R9 290X обходит все остальные решения. Так, преимущество над Radeon HD 7970 GHz составляет 25-30%, а с учётом того, что и плата предыдущего поколения опережает даже Geforce GTX Titan, рассматриваемая сегодня модель компании AMD по сравнению с обеими Geforce показала очень высокий результат, на котором явно сказалось усиление блоков TMU и ALU.

Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: возможно, в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

Ситуация похожа на ту, что мы видели на предыдущей диаграмме, но обе видеокарты Nvidia уступают своим соперникам от AMD даже ещё больше. Новинка Radeon R9 290X оказывается быстрее модели HD 7970 GHz снова на 24-32%, что также близко к теоретической разнице. А уж преимущество над прямым конкурентом Geforce GTX 780 так и вовсе более чем двукратное! Даже GTX Titan сильно отстаёт от новинки. Преимущество в подобных вычислениях явно у чипов компании AMD, предпочитающих попиксельные вычисления.

Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип ещё примерно в два раза — такой режим называется «High».

Диаграмма в целом довольно похожа на предыдущую, также без включения SSAA, и Radeon R9 290X снова опережает предшествующую модель Radeon HD 7970 GHz на привычные 22-24%. Так как платы Nvidia в этом тесте справляются с работой всё так же хуже конкурирующих от AMD, то конкурирующая модель Geforce GTX 780 в обновленном D3D10-варианте теста без суперсэмплинга снова показывает результат хуже, чем даже Radeon HD 7970 GHz, не говоря уже о представленной на днях новинке от AMD, которая снова стала быстрейшим решением. Посмотрим, что изменит включение суперсэмплинга:

Всё снова примерно так же, что и в «Fur» — при включении суперсэмплинга и самозатенения, задача получается ещё более тяжёлой, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьёзное падение производительности. Разница между скоростными показателями протестированных видеокарт изменилась лишь немного, включение суперсэмплинга сказывается меньше, чем в предыдущем случае.

Графические решения от AMD в наших D3D10-тестах пиксельных шейдеров работают явно более эффективно, чем конкурирующие с ними Geforce, и новая топовая плата на чипе Hawaii становится очевидным лидером, если не рассматривать двухчиповую Radeon HD 7990, которая всё же быстрее из-за двух GPU. Героиня же сегодняшнего обзора показывает отличную скорость, опережая Radeon предыдущего поколения примерно настолько, насколько должна по теории. Далее мы посмотрим, что будет в чисто вычислительных задачах.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты наших предельных математических тестов лишь примерно соответствуют разнице в частотах и количестве вычислительных блоков, на них влияет разная эффективность их использования в конкретных решениях, а также отмечено влияние разной оптимизации драйверов. В случае теста Mineral, новая модель Radeon R9 290X обгоняет предшествующую HD 7970 GHz на 28%, что весьма близко к теоретической разнице в математической производительности между ними. Обе видеокарты Geforce уступают плате на основе Hawaii, хотя GTX Titan в своё время и справилась с HD 7970 GHz.

Отметим ещё раз, что архитектуры AMD в таких тестах ранее имели значительное преимущество перед конкурирующими видеокартами Nvidia, но в архитектуре Kepler компании Nvidia удалось увеличить число потоковых процессоров, и пиковая математическая производительность моделей Geforce, начиная с GTX 680, серьёзно возросла, что мы видим по результатам нашего первого математического теста. Но даже в таком случае рассматриваемая Radeon R9 290X опередила свою соперницу Geforce GTX 780 почти на 40%.

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нём только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Во втором математическом тесте мы видим слегка иные относительные результаты. Разница между Radeon HD 7970 GHz и новинкой в этом тесте стала ещё ближе к теоретической — 30%. И хотя новый одночиповый топ всё равно отстаёт от двухчиповой карты AMD предыдущего поколения, но даже более сложное и дорогое решение от Nvidia не может ничего противопоставить новинке от компании AMD, которая оказывается заметно быстрее в математических тестах.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близкое к двукратному. Задача эта для современных видеокарт не слишком сложная, и производительность в ней ограничена скоростью обработки геометрии, а иногда — пропускной способностью памяти.

Явная разница между результатами видеокарт на чипах Nvidia и AMD (при одинаковом количестве GPU, поэтому Radeon HD 7990 можно не учитывать) обусловлена отличиями в геометрических конвейерах чипах этих компаний. Если в предыдущих тестах с пиксельными шейдерами платы AMD были заметно эффективнее и быстрее, то тесты геометрии всегда показывают, что в таких задачах платы Nvidia оказываются производительнее.

Сегодняшняя новинка Radeon R9 290X на чипе Hawaii имеет большое количество геометрических блоков, по сравнению с Radeon HD 7970 GHz на базе Tahiti, но в данном случае ограничителем стала скорее математическая производительность, так как разница между указанными решениями составила 30%, а не 90%. У решений Nvidia с геометрической производительностью дела получше, поэтому они оказываются быстрее. Впрочем, новый Radeon не так уж сильно уступает Geforce GTX 780, а GTX Titan не является прямым конкурентом новинки. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры слегка улучшились и для плат AMD и для решений Nvidia. Видеокарты в первом тесте геометрических шейдеров слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, а поэтому и все выводы остаются прежними. Новая модель Radeon R9 290X всё так же примерно на треть быстрее одночипового предшественника из семейства Radeon HD 7000, так что в выводах ничего не изменилось.

К сожалению, но «Hyperlight» — второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load, в котором используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output, на всех современных видеокартах компании AMD, включая и представленную топовую Radeon R9 290X, просто не работает. В какой-то момент обновление драйверов Catalyst привело к тому, что данный тест просто не запускается.

Так что самый интересный геометрический тест, который предполагает большую нагрузку именно на геометрические шейдеры, в котором Radeon R9 290X мог показать своё преимущество по сравнению с HD 7970 GHz, платы AMD снова проваливают, а ведь именно в нём и нужно было исправлять проигрыш видеокарт Radeon... В этом тесте единственно важным параметром является производительность геометрических блоков, с которой дела у Nvidia обстоят заметно лучше. Впрочем, какие-то выводы о скорости обработки геометрии мы ещё сделаем в разделе DirectX 11 тестов.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Наши предыдущие исследования показали, что на результаты этого теста может влиять и филлрейт и пропускная способность памяти (особенно это заметно в лёгком режиме). Результаты видеокарт Nvidia зачастую ограничены ещё чем-то странным, а единственная двухчиповая плата от AMD в этом тесте получает очень приличный прирост от CrossFire-рендеринга.

Самой быстрой в сравнении стала двухчиповая Radeon HD 7990, которая идёт сегодня вне конкурса, а остальные платы расположились ближе друг к другу по скорости. Хотя именно новая модель Radeon R9 290X побеждает во всех режимах, причём её преимущество над HD 7970 GHz говорит о том, что скорость плат Radeon тут ограничена производительностью блоков ROP.

Результаты новинки превышают производительность обеих плат Nvidia на чипе GK110, и GTX Titan и GTX 780 уступают новинке достаточно много, чуть ли не двукратно. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Ситуация на диаграмме полностью изменилась — результаты решений компании AMD в тяжёлых режимах заметно ухудшились, а Geforce почти не ухудшили их. Теперь даже Radeon HD 7990 в тяжёлом режиме показывает результат, схожий со скоростью топовой платы Nvidia. Новая видеоплата Radeon R9 290X остаётся лидером среди одночиповых карт в двух их трёх подтестов, и чуть уступает только GTX Titan в самом сложном. Разница же с HD 7970 GHz снова достигает 90%, говорящих об упоре платы на Tahiti в филлрейт (скорость ROP).

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты во втором тесте вершинного текстурирования «Waves» в целом схожи с теми, что мы видели на предыдущих диаграммах. По каким-то странным причинам показатели обеих плат Geforce в лёгком режиме остаются довольно слабыми и сравнимы разве что с Radeon HD 7970 GHz. Скорость новой платы Radeon в этом тесте очень неплохая, одночиповый топ R9 290X быстрее HD 7970 GHz на 40-100%. Рассмотрим второй вариант этого же теста:

А вот в этом тесте с усложнением задачи скорость всех решений стала ниже, а не только Radeon. Особенно серьёзно пострадали видеокарты Geforce в лёгких режимах, которые уступили даже Radeon HD 7970 GHz. Результаты же сегодняшней новинки R9 290X снова оказались до двух раз лучше, чем у предшественницы, поэтому она снова стала лучшей одночиповой видеокартой, что стало ожидаемым результатом, ведь скорость текстурирования и особенно блоков ROP у неё серьёзно выросли.

3DMark Vantage: тесты Feature

Синтетические тесты из пакета 3DMark Vantage покажут нам то, что мы ранее упустили. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10 и интересны тем, что отличаются от наших и до сих пор актуальны. При анализе результатов новой видеокарты Radeon R9 290X в этом пакете мы сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark.

Feature Test 1: Texture Fill

Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Эффективность видеокарт AMD и Nvidia в текстурном тесте компании Futuremark достаточно высока и сравнительные цифры моделей близки к соответствующим теоретическим параметрам. Топовая модель нового поколения Radeon R9 290X на 27% быстрее HD 7970 GHz из предыдущего поколения, что примерно соответствует теоретической разнице по скорости текстурирования между ними. Новинка от AMD уступила двухчиповой плате предыдущего семейства по текстурированию, но отставание не такое уж большое.

Что касается сравнения скорости платы R9 290X с решениями от конкурента, то новинка от AMD по текстурной скорости слегка обгоняет своего прямого конкурента Geforce GTX 780 и при этом немного уступает GTX Titan — заметно более дорогой модели на базе того же видеочипа GK110. В целом, это ожидаемые цифры для новинки, полностью соответствующие теории.

Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нём используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Удивительно, но в тесте производительности блоков ROP, результат у свежеанонсированной платы AMD получился явно слабее, чем мы могли ожидать. По теории, если в тесте измерялась бы именно скорость ROP, то Radeon R9 290X должен был оказаться заметно быстрее своего предшественника. Но, как мы ранее определили, цифры этого подтеста из 3DMark Vantage показывают производительность блоков ROP с учётом величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), и тест измеряет пропускную способность памяти, а не производительность ROP.

А вот разнице в ПСП эти самые 17% между R9 290X и HD 7970 GHz соответствуют, так что всё в порядке. Что касается сравнения скорости новинки с платами от компании Nvidia, то представленная недавно модель Radeon показала примерно такую же скорость заполнения сцены, что и более дорогой одночиповый конкурент с большей ценой и сложностью чипа — GTX Titan, а прямого конкурента GTX 780 новинка всё же опередила на 20% — неплохой результат, который обязательно скажется в играх.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нём рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоёмкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжёлого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчёты освещения по Strauss.

Этот тест отличается от проведённых нами ранее тем, что результаты в нём зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен верный баланс GPU, а также эффективность выполнения сложных шейдеров.

В данном случае, важны и математическая и текстурная производительность, поэтому в синтетике из 3DMark Vantage новая плата Radeon R9 290X с 24%-ным преимуществом обгоняет свою предшественницу HD 7970 GHz — всё ровно по теоретической разнице по скорости текстурирования и скорости вычислений.

И раз даже Radeon HD 7970 GHz немного опережает обе платы Nvidia на базе чипов GK110 в этом тесте, так как GPU производства AMD являются более эффективными в этой задаче, то неудивительно, что лучшей одночиповой платой в сравнении снова стала новая модель Radeon, причём от карты на базе двух чипов Tahiti она отстала не так уж сильно.

Feature Test 4: GPU Cloth

Четвёртый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте зависит сразу от нескольких параметров и основными факторами влияния является производительность обработки геометрии и эффективность выполнения геометрических шейдеров. Но картина на диаграмме получилась весьма странная, все видеокарты Radeon показывают частоту кадров около 130 FPS, а результаты обеих Geforce также упёрлись в предел, но на уровне около 95 FPS.

Хотя такие результаты довольно странны для того, чтобы делать по ним глобальные выводы, но всё же новая одночиповая модель Radeon R9 290X показывает скорость выше, чем Geforce GTX 780 и GTX Titan и не уступает обеим платам предыдущего поколения, основанным на чипах Tahiti. Это очень странно, так как геометрическая производительность у карт Nvidia должна быть выше, чем у решения конкурента, так как первые не просто имеют распараллеленный геометрический конвейер, но большее количество соответствующих исполнительных блоков. Мы ещё проверим это в DirectX 11-тестах.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчётами, также тестируется stream out.

Во втором геометрическом тесте из 3DMark Vantage ситуация иная. В этот раз лидирует двухчиповая Radeon HD 7990, а новая Radeon R9 290X оказалась на треть производительнее предшественницы — HD 7970 GHz, что говорит скорее об упоре в математическую производительность, нежели геометрическую.

Если сравнивать скорость новинки с Geforce GTX 780 и GTX Titan, то новый GPU от AMD оказался весьма эффективным в этой задаче и позволил новой плате почти догнать самый дорогой (на текущий момент) вариант Geforce, основанный на чипе GK110. А ведь раньше синтетические тесты имитации тканей и частиц из тестового пакета 3DMark Vantage, в которых активно используются геометрические шейдеры, показывали, что платы Nvidia в них опережают соперников от AMD. Очень хороший результат для Hawaii!

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических расчётов.

В чисто математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы видим отличающееся распределение результатов, по сравнению с двумя аналогичными тестами из нашего тестового пакета. В этом случае производительность решений не полностью соответствует теории и расходится с тем, что мы видели ранее в математических тестах из пакета RightMark 2.0.

Видеокарты Radeon компании AMD, созданные на базе чипов архитектуры GCN, всегда очень хорошо справляются с подобными задачами, и показывают лучшие результаты в случаях, когда выполняется интенсивная «математика». Даже видеоплата Radeon HD 7970 GHz в этом тесте показала отличный результат на уровне Geforce GTX Titan, обогнав GTX 780, что уж говорить о более мощной плате Radeon R9 290X?

Рассматриваемая сегодня видеокарта показала скорость на 17% выше, чем предшествующая одночиповая модель HD 7970 GHz и лишь немного не дотянулась до двухчиповой HD 7990. Соответственно, она превзошла как близкую по цене Geforce GTX 780, так и более дорогую GTX Titan. Хотя возросшая эффективность видеокарт на основе чипов архитектуры Kepler в этой задаче позволила им улучшить свои показатели, но успешно бороться с соответствующими по стоимости решениям Radeon они не могут.

Direct3D 11: Вычислительные шейдеры

Чтобы протестировать новое решение компании AMD в задачах, использующих такие новые возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы воспользовались примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, Nvidia и AMD.

Сначала мы рассмотрим тесты, использующие вычислительные (Compute) шейдеры. Их появление — одно из наиболее важных нововведений в последних версиях DX API, они уже используются в современных играх для выполнения различных задач: постобработки, симуляций и т. п. В первом тесте показан пример HDR-рендеринга с tone mapping из DirectX SDK, с постобработкой, использующей пиксельные и вычислительные шейдеры.

Хоть это и не самый удачный пример задачи с применением вычислительных шейдеров, но разницу в производительности в конкретной задаче он показывает. Скорость расчётов в вычислительном и пиксельном шейдерах для всех плат давно одинаковая, хотя у видеокарт с GPU предыдущих архитектур были различия. Судя по нашим предыдущим тестам, результаты в задаче явно зависят не только от математической мощи и эффективности вычислений, но и от других факторов, вроде пропускной способности памяти и производительности ROP.

И в данном случае именно в ПСП скорость видеокарт и упирается. Новая плата от компании AMD в этом тесте оказалась лишь на 10-15% быстрее своей одночиповой предшественницы из семейства Radeon HD 7000 и сильно уступила двухчиповой HD 7990. Впрочем, новинка всё же опережает обе конкурирующие модели от Nvidia, даже эксклюзивную одночиповую модель GTX Titan, которая стоит заметно дороже. Что касается сравнения с настоящим конкурентом в лице GTX 780, то новинка впереди на 20-25%.

Второй тест вычислительных шейдеров также взят из Microsoft DirectX SDK, в нём показана расчётная задача гравитации N тел (N-body) — симуляция динамической системы частиц, на которую воздействуют физические силы, такие как гравитация.

В этом случае расклад сил между решениями разных компаний получился иной. Мы видим, что у решений Nvidia есть явное преимущество в подобных сложных расчётных задачах, а любые Radeon пасуют перед ними, тем более, что преимущества от работы двух GPU в данном случае просто нет. Поэтому в этом тесте совершенно логично побеждает мощнейшая Geforce GTX Titan, а следом за ней идёт конкурент новинки ещё одна плата на GK110.

Похоже на то, что в этом тесте упор не в скорость исполнения простых математических вычислений, но и в эффективности выполнения сложного кода с ветвлениями и т.п. Тем более удивительно, что представленный на днях Radeon R9 290X в этой задаче оказался между Radeon HD 7970 GHz и HD 7990, на предпоследнем месте, уступив своим конкурентам. Но он уступил не HD 7990, а своему одночиповому предшественнику! Получается, что в этой конкретной задаче эффективность Hawaii даже ухудшилась, по сравнению с Tahiti. И виноваты в этом то ли недоработанные драйверы, то ли меньшая тактовая частота новинки.

Direct3D 11: Производительность тесселяции

Вычислительные шейдеры очень важны, но ещё одним важным нововведением в Direct3D 11 считается аппаратная тесселяция. Мы очень подробно рассматривали её в своей теоретической статье про Nvidia GF100. Тесселяцию уже довольно давно начали использовать в DX11-играх, таких как STALKER: Зов Припяти, DiRT 2, Aliens vs Predator, Metro Last Light, Civilization V, Crysis 3, Battlefield 3 и других. В некоторых из них тесселяция используется для моделей персонажей, в других — для имитации реалистичной водной поверхности или ландшафта.

Существует несколько различных схем разбиения графических примитивов (тесселяции). Например, phong tessellation, PN triangles, Catmull-Clark subdivision. Так, схема разбиения PN Triangles используется в STALKER: Зов Припяти, а в Metro 2033 — Phong tessellation. Эти методы сравнительно быстро и просто внедряются в процесс разработки игр и существующие движки, поэтому и стали популярными.

Первым тестом тесселяции будет пример Detail Tessellation из ATI Radeon SDK. В нём реализована не только тесселяция, но и две разные техники попиксельной обработки: простое наложение карт нормалей и parallax occlusion mapping. Что ж, сравним DX11-решения AMD и Nvidia в различных условиях:

В тесте простого бампмаппинга скорость чаще всего упирается в ПСП, и результат новой видеокарты AMD примерно на 25% выше скорости предшествующей модели — Radeon HD 7970 GHz. Естественно, что двухчиповый HD 7990 в этом тесте производительнее, но зато новинка опережает обе топовые платы конкурента с приличным запасом.

Во втором подтесте с более сложными попиксельными расчётами всё несколько интереснее. Эффективность выполнения таких математических вычислений в пиксельных шейдерах у чипов архитектуры GCN выше, чем у Kepler. Обе платы Nvidia показали почти идентичный результат, и GTX 780 и Titan, но и HD 7970 GHz недалеко. А вот новый Radeon R9 290X на базе графического процессора Hawaii оказался быстрее них почти на треть, что соответствует теории.

Да и в самом интересном тесте с тесселяцией результат новинки очень неплох — она показала также более высокую скорость, чем Titan и GTX 780. В данном тесте тесселяции разбиение треугольников весьма умеренное и скорость в нём совсем не упирается в производительность блоков обработки геометрии, поэтому скорости обработки треугольников у платы компании AMD вполне хватает, чтобы показывать высокие результаты.

Вторым тестом производительности тесселяции будет ещё один пример для 3D-разработчиков из ATI Radeon SDK — PN Triangles. Собственно, оба примера входят также и в состав DX SDK, так что мы уверены, что на их основе создают свой код игровые разработчики. Этот пример мы протестировали с различным коэффициентом разбиения (tessellation factor), чтобы понять, как сильно влияет его изменение на общую производительность.

В этом примере применяется куда более сложная геометрия, поэтому и сравнение геометрической мощи различных решений по этому тесту приносит другие выводы. Все представленные в материале современные решения хорошо справляются с лёгкой и средней геометрической нагрузкой, показывая высокую скорость, но в тяжёлых условиях графические процессоры Nvidia оказываются заметно более производительными.

Анонсированная недавно модель Radeon R9 290X основана на чипе Hawaii, который имеет вдвое большее количество геометрических блоков, по сравнению с Tahiti, поэтому она становится лучшей в зачёте одночиповых видеокарт AMD и почти на одном уровне с HD 7990. Разница между R9 290X и HD 7970 GHz составляет до 50%, что хоть и меньше обещанных 90%, но всё же весьма неплохо. Ну а если брать все решения в целом, то R9 290X уступает только видеокартам Nvidia и в более сложных условиях, когда скорость всех Radeon серьёзно падает, а у плат Geforce остаётся сравнительно высокой.

Рассмотрим результаты ещё одного теста — демонстрационной программы Nvidia Realistic Water Terrain, также известной как Island. В этой демке используется тесселяция и карты смещения (displacement mapping) для рендеринга реалистично выглядящей поверхности океана и ландшафта.

Тест Island не является чисто синтетическим тестом для измерения исключительно геометрической производительности GPU, так как он содержит и сложные пиксельные и вычислительные шейдеры в том числе, и такая нагрузка ближе к реальным играм, в которых используются все блоки GPU, а не только геометрические, как в предыдущих тестах геометрии. Впрочем, основной всё равно остаётся именно нагрузка на блоки обработки геометрии.

Как обычно, мы протестировали решения при четырёх разных коэффициентах тесселяции — в данном случае настройка называется Dynamic Tessellation LOD. Если при самом первом коэффициенте разбиения треугольников, когда скорость не ограничена производительностью геометрических блоков, новая одночиповая видеокарта компании AMD показывает достаточно высокий результат почти на уровне Geforce GTX 780, то при увеличении геометрической работы платы компании Nvidia вырываются далеко вперёд, а производительность всех плат Radeon заметно снижается.

Обе видеокарты на базе чипов GK110 в этом тесте весьма быстры, и примерно вдвое производительнее новинки от конкурента в лице Radeon R9 290X. Новая плата от AMD хотя и показывает во всех режимах неплохие результаты (для решений AMD), обгоняя предыдущую модель Radeon HD 7970 GHz на 30-50%, но этого явно не хватает для равной борьбы с Geforce GTX 780 и Titan. Хотя, нужно отметить, что результаты новинки AMD в тестах тесселяции очень хороши, чип Hawaii кажется неплохо сбалансированным и сдают позиции в геометрических тестах только в экстремальных условиях, которых в играх просто нет.

Выводы по синтетическим тестам

Результаты синтетических тестов топовой видеокарты Radeon R9 290X, основанной на новом мощнейшем графическом процессоре Hawaii, а также результаты других моделей видеокарт производства обоих производителей дискретных видеочипов показали, что новое решение компании AMD является одной из самых мощных видеокарт из одночиповых решений и успешно сражается не только с близкой по цене платой Geforce GTX 780, но и с заметно более дорогой GTX Titan. Новинка от AMD является наиболее выгодным предложением на рынке в верхнем ценовом диапазоне и будет успешно конкурировать с ранее представленными в нём решениями Nvidia.

Превосходство новой модели в производительности перед предшествующей ей Radeon HD 7970 GHz из предыдущего поколения было вполне ожидаемым и подтвердилось нашими результатами в «синтетике». За исключением редких задач, недавно анонсированная модель Radeon отлично выступила и по сравнению с самыми мощными моделями конкурента: Geforce GTX 780 и Titan даже при том, что последняя не является прямым конкурентом для неё. Наш набор синтетических тестов показал, что по производительности новый Radeon должен поспорить с Geforce GTX 780 и в играх.

Среди наиболее сильных сторон Radeon R9 290X — математическая и текстурная производительность, но особенно — производительность блоков ROP, которая выросла почти вдвое. В сравнительно слабые характеристики можно записать меньшую геометрическую производительность, но только по сравнению с конкурентами от Nvidia, а также увеличившуюся лишь на 20% пропускную способность памяти, которой может быть мало в самых сложных условиях. Впрочем, не нужно забывать, что ПСП у Radeon R9 290X выше, чем у любых моделей Geforce конкурента, а в реальных играх просто нет столько геометрии, чтобы слабость чипов AMD стала заметна.

В целом, новая модель Radeon является очень интересным предложением для ультраэнтузиастов, которые хотят играть при максимальных настройках в высочайших разрешениях и получить при этом максимальную 3D-производительность. Теперь можно не отдавать кучу денег за Geforce GTX Titan, а отдать лишь половину её за Radeon R9 290X. Новая видеоплата AMD стоит заметно дешевле, а разница между ними по скорости будет очень небольшой в большинстве случаев, а то и вовсе не будет заметна. В общем, рынок получил очередное мощнейшее решение, и нам будет очень интересно оценить его реальную производительность в играх в следующей части статьи.

AMD Radeon R9 290X — Часть 3: производительность в игровых тестах →

2 блока питания Corsair CMPSU-1200AXEU для тестового стенда предоставлены компанией Corsair

Корпус Corsair Obsidian 800D-Full Tower для тестового стенда предоставлен компанией Corsair

Модули памяти Corsair Vengeance CMZ16GX3M4X1600C9 для тестового стенда предоставлены компанией Corsair

Corsair Hydro SeriesT H100i CPU Cooler для тестового стенда предоставлен компанией Corsair

Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт

Системная плата Asus Sabertooth X79 для тестового стенда предоставлена компанией AsusTeK

Системная плата MSI X79A-GD45(8D) для тестового стенда предоставлена компанией MSI

Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate

Накопитель SSD OCZ Octane 512 ГБ для тестового стенда предоставлен компанией OCZ Russia

2 накопителя SSD Corsair Neutron SeriesT 120 ГБ для тестового стенда предоставлены компанией Corsair

Монитор Asus ProArt PA249Q для рабочего компьютера предоставлен компанией AsusTeK