AMD Radeon R9 290:

описание видеокарты и результаты синтетических тестов


Содержание

В этой части мы изучим видеокарту, а также познакомимся с результатами синтетических тестов. В нашей лаборатории побывала референсная карта AMD.

Платa

AMD Radeon R9 290 4096 МБ 512-битной GDDR5 PCI-E
  • GPU: Radeon R9 290X (Hawaii)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs): 947 МГц (номинал — 947 МГц)
  • Частота работы памяти (физическая (эффективная)): 1250 (5000) МГц (номинал — 1250 (5000) МГц)
  • Ширина шины обмена с памятью: 512 бит
  • Число вычислительных блоков в GPU/частота работы блоков: 40/947 МГц (номинал — 40/947 МГц)
  • Число операций (ALU) в блоке: 64
  • Суммарное число операций (ALU): 2560
  • Число блоков текстурирования: 160 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 64
  • Размеры: 280×100×37 мм (видеокарта занимает 2 слота в системном блоке)
  • Цвет текстолита: черный
  • Энергопотребление (пиковое в 3D (Uber)/3D (Quiet)/в режиме 2D/в режиме «сна»): 272/248/48/3 Вт
  • Выходные гнезда: 2×DVI (Dual-Link/HDMI), 1×HDMI 1.4a, 1×DisplayPort 1.2
  • Поддержка многопроцессорной работы: CrossFire X (Hardware)

AMD Radeon R9 290 4096 МБ 512-битной GDDR5 PCI-E
Карта имеет 4096 МБ памяти GDDR5 SDRAM, размещенной в 16 микросхемах (на лицевой стороне PCB).

Микросхемы памяти Hynix (GDDR5). Микросхемы рассчитаны на максимальную частоту работы в 1500 (6000) МГц.

Сравнение с эталонным дизайном, вид спереди
AMD Radeon R9 290 4096 МБ 512-битной GDDR5 PCI-E Reference card AMD Radeon R9 290X

Сравнение с эталонным дизайном, вид сзади
AMD Radeon R9 290 4096 МБ 512-битной GDDR5 PCI-E Reference card AMD Radeon R9 290X

Как видите, здесь даже нечего рассказать, ибо R9 290 с точки зрения PCB и СО полностью копирует своего старшего собрата R9 290X, а его мы уже детально рассматривали. Да и зачем менять PCB, если у R9 290 подсистема памяти точно такая же? Потребляет новинка меньше, чем R9 290Х, однако разница не настолько велика, чтобы вносить какие-либо изменения в блок питания. Впрочем, впереди выпуск R9 290Х и R9 290 партнерами AMD, с их собственными вариациями плат, поэтому очень может быть, что у них R9 290 и R9 290Х будут отличаться не только количеством ядер в GPU.

Напомним, что система питания карты — 6-фазная, управляется цифровым контроллером IR 3567B, который обеспечивает работу PowerTune. 5 фаз отводится на питание ядра, а шестая — для микросхем памяти и прочей логики.

Ускоритель имеет следующий набор гнезд вывода: 2 DVI (совместимы с выводом на HDMI) и по одному DisplayPort и HDMI (суммарно можно подключить 3 приемника с HDMI). Напомним, что ускорители AMD достаточно давно обладают собственными звуковыми кодеками для вывода звука по HDMI. А R9 290X к тому же поддерживает программируемый движок TrueAudio, который, впрочем, пока трудно назвать актуальным, так как нужна поддержка со стороны разработчиков игр.

Максимальные разрешения и частоты в 3D: 2560×1600@60 Гц — по цифровому интерфейсу (для DVI-гнезд с Dual-Link/HDMI). Также декларирована поддержка разрешения 4К, однако работоспособность на такого рода мониторах нами еще не проверялась.

Что касается возможностей по ускорению декодирования видео — в 2007 году мы проводили такое исследование, с ним можно ознакомиться здесь.

Карта требует дополнительного питания в виде двух разъемов: 8- и 6-контактного.

О системе охлаждения.

AMD Radeon R9 290 4096 МБ 512-битной GDDR5 PCI-E
Система охлаждения полностью повторяет предшественницу от R9 290X, но повторим ее описание. Основана она на испарительной камере, на которую напаян большой радиатор без тепловых трубок. Способ охлаждения последнего традиционен: с помощью цилиндрического вентилятора, расположенного в конце кулера.

Микросхемы памяти, как и силовые транзисторы, охлаждаются основным радиатором.

СО получилась далеко не тихой, хотя в целом чуть тише, чем у R9 290X. Максимальный шум получается при работе вентилятора с частотой вращения 2600 оборотов в минуту.

Мы провели исследование температурного режима с помощью новой версии 4.2.1 утилиты EVGA PrecisionX (автор А. Николайчук AKA Unwinder) и получили следующие результаты.

AMD Radeon R9 290 4096 МБ 512-битной GDDR5 PCI-E (Uber Mode/Режим полной мощности)

После 6 часов прогона карты под максимальной игровой нагрузкой максимальная температура ядра составила 93 градуса, что никак нельзя назвать слабым нагревом, хотя AMD уверяет, что такой нагрев никак не повредит ни ядро, ни карту.

Комплектация. Референс-карта прибыла к нам в ОЕМ-упаковке, поэтому комплекта нет.

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютеры на базе процессора Intel Core i7-3960X (Socket 2011):
    • 2 процессора Intel Core i7-3960X (o/c 4 ГГц);
    • СО Hydro SeriesT H100i Extreme Performance CPU Cooler;
    • СО Intel Thermal Solution RTS2011LC;
    • системная плата Asus Sabertooth X79 на чипсете Intel X79;
    • системная плата MSI X79A-GD45(8D) на чипсете Intel X79;
    • оперативная память 16 ГБ DDR3 Corsair Vengeance CMZ16GX3M4A1600C9 1600 МГц;
    • жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA2;
    • жесткий диск WD Caviar Blue WD10EZEX 1 TБ SATA2;
    • 2 SSD Corsair Neutron SSD CSSD-N120GB3-BK;
    • 2 блока питания Corsair CMPSU-1200AXEU (1200 Вт);
    • корпус Corsair Obsidian 800D Full Tower.
  • операционная система Windows 7 64-битная; DirectX 11;
  • монитор Dell UltraSharp U3011 (30″);
  • монитор Asus ProArt PA249Q (24″);
  • драйверы AMD версии Catalyst 13.11beta8; Nvidia версии 331.58

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

В качестве синтетических тестов DirectX 11 мы использовали примеры из пакетов SDK компаний Microsoft и AMD, а также демонстрационную программу Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010). Мы взяли и приложения обоих производителей видеочипов: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain, также известная как Island11.

Синтетические тесты проводились на следующих видеокартах:

  • Radeon R9 290 со стандартными параметрами (далее R9 290)
  • Radeon R9 290X со стандартными параметрами в режиме «Uber Mode»(далее R9 290X)
  • Radeon HD 7970 GHz со стандартными параметрами (далее HD 7970 GHz)
  • Geforce GTX 780 со стандартными параметрами (далее GTX 780)
  • Geforce GTX 770 со стандартными параметрами (далее GTX 770)

Для анализа результатов новой топовой видеокарты Radeon R9 290 были выбраны именно эти решения по следующим причинам. Radeon HD 7970 GHz является предыдущей моделью компании, относящейся к самой верхней ступеньке среди одночиповых решений — будет интересно посмотреть, насколько быстрее получилась новинка по отношению к плате на базе Tahiti. Кроме того, HD 7970 GHz можно признать условно равной модели R9 280X из текущего поколения. А сравнение с Radeon R9 290X будет интересно потому, что это мощнейшая видеокарта AMD, основанная на таком же чипе Hawaii, но имеющая более высокую цену и производительность.

От конкурирующей компании Nvidia для нашего сравнения были выбраны две видеоплаты, основанные на разных графических процессорах. Geforce GTX 780 на время выхода Radeon R9 290 является, пожалуй, ее ближайшим конкурентом по цене, так как продается несколько дороже ее, а менее производительная видеоплата Geforce GTX 770 основана на видеочипе GK104 и стоит дешевле, поэтому ее можно отнести к среднему решению между R9 280X и R9 290.

Забегая вперед, сделаем небольшое отступление, связанное с важностью доработки драйверов даже для синтетических предельных тестов. Когда мы протестировали рассматриваемую сегодня модель на версии драйверов, предназначенной для Radeon R9 290X, то результаты новинки оказались неожиданно низкими во многих тестах, что явно не соответствовало теории. И лишь тестирование на последней версии Catalyst, спешно выпущенной к выходу конкретно Radeon R9 290, показало верные цифры — примерно на 10-15% большие, по сравнению с неоптимизированным драйвером.

Direct3D 9: тесты Pixel Shaders

Тесты текстурирования и заполнения (филлрейта) из пакета 3DMark Vantage мы рассмотрим чуть позже, а первая группа пиксельных шейдеров, которую мы используем, включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся разве что в старых играх, очень простых для современных видеочипов.

Мы не устаем напоминать, что с этими тестами современные GPU справляются с легкостью, и скорость мощных решений в них всегда упирается в различные ограничители. Тесты не способны показать возможности современных видеочипов, и интересны лишь с точки зрения устаревших игровых приложений. Производительность современных видеокарт в них зачастую ограничена скоростью текстурирования или филлрейта, а видеокарты Nvidia давно перестали оптимизироваться для них, что отлично доказывают результаты единственной взятой видеокарта этой компании.

Неудивительно, что вышедшая сегодня модель видеокарты AMD в этом сравнении лишь чуть уступает своей старшей сестре в виде Radeon R9 290X, которая впереди на 5-10%, в зависимости от теста, как и должно быть в теории. Своего предшественника в лице Radeon HD 7970 GHz новинка успешно обходит во всех тестах, находясь примерно посередине между HD 7970 GHz (R9 280X) и R9 290X, что также согласуется с теорией. Плата от Nvidia уступает всем Radeon, даже устаревшей HD 7970 GHz. Посмотрим на результаты более сложных пиксельных программ промежуточных версий:

Тест Cook-Torrance более интенсивен вычислительно, и скорость в нем больше зависит от количества ALU и их частоты, но также и от скорости TMU. Этот тест исторически лучше подходит для графических решений компании AMD, хотя новые топовые платы Geforce на базе архитектуры Kepler в нем также показывают сильные результаты, что мы и видим по неплохим в целом цифрам Geforce GTX 780.

Младшая плата из семейства Radeon R9 290 ожидаемо оказалась быстрее предшествующей ей HD 7970 GHz, но медленнее модели R9 290X на 10-13%, как и должно быть, исходя из теории. И в тесте освещения, больше зависящем от скорости ALU, и в тесте Water, скорость в котором больше зависит от текстурирования, мы видим примерно одно и то же — по скорости текстурирования и математических расчетов модели серии отличаются где-то на 14%.

Своего главного конкурента новинка от компании AMD обошла лишь в одном из тестов — в тесте освещения, где важнее математическая производительность, по которой у плат AMD есть явное преимущество. В другом тесте результаты Geforce GTX 780 и Radeon R9 290 получились практически равные.

Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье «Современная терминология 3D-графики».
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

Существует два варианта этих шейдеров: с ориентацией на математические вычисления и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это универсальные тесты, производительность в которых зависит и от скорости блоков ALU, и от скорости текстурирования, также в них важен общий баланс чипа и эффективность исполнения вычислительных программ. Прошлые наши исследования показывают, что в этих конкретных задачах архитектура GCN от AMD выступает значительно лучше графической архитектуры Nvidia Kepler.

В тесте «Frozen Glass» скорость больше зависит от математической производительности и в случае всех плат Geforce всегда заметна непонятна преграда, из-за которой плата Nvidia проигрывает вдвое почти всем Radeon. Модель Radeon R9 290 оказывается ровно посередине между Radeon HD 7970 GHz (R9 280X) и R9 290X в этом тесте, что согласуется с теорией.

А вот втором тесте «Parallax Mapping» новая видеокарта Radeon показала производительность выше конкурента, и отстала от старшей сестры на 14%, полностью согласно теории, но сопоставление с предшествующей моделью Radeon HD 7970 GHz (R9 280X) не столь радужное — преимущество новинки совсем невелико. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:

В этих условиях положение единственной видеоплаты производства Nvidia несколько улучшилось, ведь она справляется с текстурными выборками лучше. Но Radeon R9 290 все равно опережает ее с хорошим запасом, особенно в тесте Frozen Glass. Новинка на 13-17% медленнее чем R9 290X, что примерно соответствует теории. Что касается сравнения с HD 7970 GHz (R9 280X), то она идет с R9 290 на равных в Parallax Mapping, немного отставая в другом тесте.

В итоге, вторая видеокарта на чипе Hawaii справилась с этими задачами неплохо, но опережение Radeon HD 7970 GHz было не слишком впечатляющим в некоторых из тестов. Впрочем, это были давно устаревшие задачи, с упором в текстурирование, чего почти не встречается в играх. Дальше мы рассмотрим результаты еще двух тестов пиксельных шейдеров, но уже версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9. Они более показательны с точки зрения современных игр на ПК, среди которых много мультиплатформенных. Тесты отличаются тем, что сильно нагружают и ALU, и текстурные модули, обе шейдерные программы сложны и длинны и включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье «Современная терминология 3D-графики».
  • Fur — процедурный шейдер, визуализирующий мех.

А вот эти тесты уже совсем не ограничены производительностью только текстурных выборок или филлрейтом и скорость в них более всего зависит от эффективности исполнения сложного шейдерного кода. В самых тяжелых DX9-тестах из первой версии пакета RightMark видеокарты производства Nvidia в предыдущие годы были несколько сильнее, но архитектура GCN помогла видеокартам AMD вырваться вперед, особенно после тщательной доводки драйверов Catalyst.

Сегодняшняя новинка от компании AMD показывает в этих задачах очень неплохой результат, обогнав предшественницу на базе чипа Tahiti (аналогичную плате R9 280X из нового поколения). Что касается сравнения с самой мощной топовой видеокартой на базе Hawaii, то новинка отстает от нее на 11-12%, что вполне соответствует теоретическим цифрам разницы в математической производительности.

Сравнение с платой от Nvidia не приводит к однозначным выводам, хотя для решения AMD дело выглядит лучше, чем для представительницы от конкурента. Пусть в тесте Fur плата Radeon R9 290 чуть проиграла Geforce GTX 780, но разница минимальна, и результаты решений близки. Зато в тесте продвинутого параллакс-маппинга GTX 780 отстает от героя сегодняшнего анонса более чем на 40%.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два уже знакомых нам теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также еще два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нем используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в этом тесте зависит от количества и эффективности блоков TMU, влияет и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает еще и эффективный филлрейт и пропускная способность памяти. Результаты при детализации уровня «High» получаются до полутора раза ниже, чем при «Low».

В задачах процедурной визуализации меха с большим количеством текстурных выборок, за пару поколений графических архитектур компания AMD сократила разницу с платами Nvidia, а с выпуском видеочипов на базе архитектуры GCN и вовсе вырвалась вперед, и теперь именно платы Radeon являются лидерами в этих сравнениях, что говорит о высокой эффективности выполнения ими данных программ.

Новая топовая плата в лице Radeon R9 290 отстает только от старшей модели R9 290X — на 8-10%, обходя все остальные решения. Преимущество над Radeon HD 7970 GHz (R9 280X) очень неплохое, новинка явно ближе к R9 290X, чем к младшему решению. С учетом того, что даже плата AMD предыдущего поколения с запасом опережает Geforce GTX 780, рассматривать пару R9 290 и GTX 780 просто нет смысла — модель компании AMD по сравнению с обеими платами Geforce показывает очень высокий результат, на котором сказалось увеличение количества блоков TMU и ALU.

Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: возможно, в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

И здесь ситуация похожа на ту, что мы видели на предыдущей диаграмме, но обе видеокарты Nvidia уступают своим соперникам от AMD даже еще больше. Новинка Radeon R9 290 оказывается заметно быстрее младшей модели HD 7970 GHz (R9 280X) и проигрывает R9 290X те же 10%, что близко к теоретической разнице. Преимущество над прямым конкурентом в виде Geforce GTX 780 чуть ли не двукратное! В общем, подтверждаем то, что преимущество в подобных вычислениях явно у чипов компании AMD, предпочитающих попиксельные вычисления.

Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип еще примерно в два раза — такой режим называется «High».

Диаграмма в целом похожа на предыдущую (также без включения SSAA), и в этот раз Radeon R9 290 опережает предшествующую модель Radeon HD 7970 GHz, хотя в этот раз ее преимущество слегка снизилось. Да и Radeon R9 290X новинка уступает уже не 10%, а до 13%. Что, впрочем, все так же прекрасно соотносится с теоретической разницей между двумя видеокартами на основе чипа Hawaii.

Так как видеоплаты Nvidia в этом тесте справляются с работой заметно хуже конкурирующих решений от AMD, то модель Geforce GTX 780 в обновленном D3D10-варианте теста без суперсэмплинга снова показывает результат хуже, чем все Radeon, даже HD 7970 GHz, не говоря уже о представленной сегодня R9 290. Посмотрим, что изменит включение суперсэмплинга:

Все снова примерно так же, что и в «Fur» — при включении суперсэмплинга и самозатенения, задача получается еще более тяжелой, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьезное падение производительности. Разница между скоростными показателями протестированных видеокарт изменилась лишь немного, включение суперсэмплинга сказывается меньше, чем в предыдущем случае.

Мы снова видим, что графические решения Radeon в наших D3D10-тестах пиксельных шейдеров работают более эффективно, по сравнению с конкурирующими Geforce, и младшая топовая плата на чипе Hawaii хоть и обгоняет Radeon HD 7970 GHz совсем немного, но показывает неплохую скорость, отставая от старшей Radeon R9 290X уже до 16% — настолько, насколько должна и по теории. Естественно, что конкуренты от Nvidia остались далеко позади. Посмотрим, что будет в чисто вычислительных задачах.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты предельных математических тестов обычно лишь примерно соответствуют разнице в частотах и количестве вычислительных блоков, на них влияет разная эффективность их использования в конкретных решениях, также важна и оптимизация драйверов. В случае теста Mineral, новая модель Radeon R9 290 снова находится на диаграмме ровно посередине между R9 290X и HD 7970 GHz, и отстает от старшего решения на 14%, что очень близко к теоретической разнице в математической производительности между ними.

Мы уже знаем, что архитектуры AMD в таких тестах всегда имели значительное преимущество перед конкурирующими решениями Nvidia, но в архитектуре Kepler калифорнийской компании удалось увеличить число потоковых процессоров, и пиковая математическая производительность моделей Geforce, начиная с GTX 680, серьезно возросла. Это мы видим по результатам нашего первого математического теста, ведь хотя видеокарты Geforce все еще уступают платам на основе чипа Hawaii, прямой конкурент GTX 780 отстает от R9 290 уже лишь на 20%.

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нем только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Во втором математическом тесте мы видим иные результаты видеокарт, относительно друг друга. Разница между Radeon R9 290 и новинкой в этом тесте стала чуть больше теоретической — 16%, но 2% входят в предел погрешности измерений. Radeon HD 7970 GHz (и аналогичная ей R9 280X) осталась позади, хоть и не так далеко.

Второй одночиповый топ новой серии легко справляется со своим конкурентом по цене от Nvidia. Geforce GTX 780 не может ничего противопоставить новинке компании AMD, которая оказывается быстрее нее в математических тестах на все те же привычные 20%.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трех уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близкое к двукратному. Задача эта для современных видеокарт не слишком сложная, и производительность в ней ограничена скоростью обработки геометрии, а иногда — пропускной способностью памяти.

Налицо явная разница между результатами видеокарт на чипах Nvidia и AMD, которая обусловлена отличиями в геометрических конвейерах чипов этих компаний. Если в предыдущих тестах с пиксельными шейдерами платы AMD были заметно эффективнее и быстрее, то тесты геометрии показывают, что в таких задачах платы Nvidia оказываются производительнее, даже несмотря на все изменения в Hawaii.

Сегодняшняя новинка Radeon R9 290 на основе этого GPU хоть и имеет немалое количество геометрических блоков (четыре), по сравнению с Radeon HD 7970 GHz и R9 280X на базе Tahiti, но в данном случае для плат AMD ограничителем стала скорее математическая производительность. Впрочем, в сравнении R9 290 и R9 290X разницы почти совсем нет (1%).

У решений Nvidia с геометрической производительностью дела всегда были лучше, и поэтому они оказываются быстрее. Новая модель Radeon не уступает в этом тесте Geforce GTX 770, но GTX 780, прямой конкурент новинки, оказывается явно сильнее ее. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры слегка улучшились и для плат AMD и для решений Nvidia. Видеокарты в этом тесте геометрических шейдеров слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, поэтому и все выводы остаются прежними. Новая модель Radeon R9 290 все так же заметно быстрее одночипового предшественника из семейства Radeon HD 7000, и не отстает от R9 290X, так что в выводах не изменилось вообще ничего.

К сожалению, но «Hyperlight» — второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load, в котором используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output, на всех современных видеокартах компании AMD, включая и топовую Radeon R9 290, просто не работает. В какой-то момент очередное обновление драйверов Catalyst привело к тому, что данный тест просто не запускается на платах этой компании.

Поэтому самый интересный геометрический тест нашего пакета, который предполагает большую нагрузку именно на геометрические шейдеры, в котором Radeon R9 290 мог показать свое преимущество, нам ничего не дает, а ведь в нем мы могли видеть реальную работу над ошибками от AMD, с исправлением проигрыша видеокарт Radeon. То ли его до сих пор не исправили, то ли... на этом мысль останавливается. Спасает только то, что дополнительные выводы о скорости обработки геометрии мы сделаем в разделе DirectX 11.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Наши предыдущие исследования показали, что на результаты этого теста может влиять и филлрейт и пропускная способность памяти, что особенно заметно в легком режиме. Результаты видеокарт Nvidia зачастую ограничены еще чем-то странным, и отставание Geforce GTX 780 от GTX 770 явно указывает на эту аномалию.

Самой быстрой в сравнении ожидаемо стала топовая Radeon R9 290X, но сразу за ней идет представленная сегодня новая модель Radeon R9 290, которая отстает до 11% от старшей сестры. Результаты новинки превышают производительность обеих плат Nvidia на чипах GK110 и GK104, и GTX 780 и GTX 770 уступают новинке тут достаточно много. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Ситуация на диаграмме заметно изменилась — результаты решений компании AMD в тяжелых режимах ухудшились, а Geforce почти остались на тех же позициях. Теперь лишь Radeon R9 290X показывает результат заметно выше скорости двух плат от Nvidia, а новая видеоплата Radeon R9 290 отстает от нее до 14%, что полностью соответствует теории. Новинка чуть-чуть опередила свою прямую соперницу GTX 780 в двух сложных режимах, заметно обогнав ее в самом простом.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нем используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты во втором тесте вершинного текстурирования «Waves» в целом схожи с теми, что мы видели на предыдущих диаграммах. По каким-то причинам показатели обеих плат Geforce в легком режиме остаются весьма заниженными, и они сравнимы лишь результатами Radeon HD 7970 GHz (полным аналогом которой является также и современная R9 280X).

Скорость же новой топовой платы Radeon R9 290 в этом тесте очень неплоха, второй одночиповый топ на базе Hawaii оказался медленнее старшего лишь на 7-11%. Рассмотрим второй вариант этого же теста:

Во втором тесте текстурных выборок с усложнением задачи скорость всех решений стала ниже, и особенно серьезно пострадали видеокарты Geforce в легких режимах, уступив там даже Radeon HD 7970 GHz (R9 280X). Результаты сегодняшней новинки R9 290 значительно лучше, чем у предшественницы на Tahiti, что неудивительно, ведь скорость текстурирования и блоков ROP у нее серьезно возросли.

3DMark Vantage: тесты Feature

Синтетические тесты из пакета 3DMark Vantage покажут нам то, что мы ранее упустили. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10 и интересны тем, что отличаются от наших и до сих пор актуальны. При анализе результатов новой видеокарты Radeon R9 290 в этом пакете мы сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark.

Feature Test 1: Texture Fill

Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Эффективность видеокарт AMD и Nvidia в текстурном тесте компании Futuremark достаточно высока и сравнительные цифры моделей близки к соответствующим теоретическим параметрам. Младшая топовая модель из нового семейства Radeon R9 на 12% медленнее старшей R9 290X, и быстрее HD 7970 GHz из предыдущего поколения, что соответствует теоретической разнице по скорости текстурирования между ними.

Что касается сравнения скорости платы Radeon R9 290 с решениями конкурента, то новинка AMD по текстурной скорости хоть и обгоняет Geforce GTX 770, основанную на графическом процессоре GK104, но уступает своему прямому конкуренту GTX 780 — лишь чуть более дорогой модели на базе графического процессора GK110. В целом, все это было ожидаемо, исходя из теоретических показателей.

Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

В тесте производительности блоков ROP, результат у анонсированной сегодня платы AMD получился ровно таким же, что и у старшей Radeon R9 290X. Если в тесте измерялась бы именно пиковая скорость блоков ROP, то Radeon R9 290 должен был оказаться медленнее R9 290X и заметно быстрее своего предшественника HD 7970 GHz (R9 280X). Но мы уже определили ранее, что цифры этого подтеста 3DMark Vantage показывают производительность блоков ROP с учетом величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), и тест измеряет именно пропускную способность, а не производительность ROP.

А раз теоретической разницы в ПСП между R9 290 и R9 290X нет, то и их идентичный результат в тесте объясним. Что же касается сравнения скорости новинки с платами Geforce, то представленная сегодня модель AMD Radeon показала чуть большую скорость заполнения сцены, что и несколько более дорогой конкурент на GK110. Интересно, что плата GTX 770 на чипе GK104 в данном тесте оказалась впереди GTX 780.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.

Этот тест пакета 3DMark Vantage отличается от проведенных нами ранее тем, что результаты в нем зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен верный баланс GPU, а также эффективность выполнения сложных шейдеров.

В данном случае, важны и математическая и текстурная производительность, поэтому в этой «синтетике» из 3DMark Vantage новая плата Radeon R9 290 отстает на 12% от более мощной модели семейства, но все же обгоняет топовую плату предшествующей серии HD 7970 GHz, что соответствует теоретической разнице в скорости текстурирования и вычислительной производительности.

В этом тесте даже Radeon HD 7970 GHz опережает обе представленные платы Nvidia, так как GPU производства AMD являются более эффективными в этой конкретной задаче. Неудивительно, что они отстают и от представленной Radeon R9 290, причем GTX 780 проиграла новинке более 30%.

Feature Test 4: GPU Cloth

Четвертый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте по идее должна зависеть сразу от нескольких параметров и основными факторами влияния должна являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. Но картина на диаграмме получилась весьма странная, видеокарты Radeon показывают частоту кадров в 125-130 FPS, а результаты обеих Geforce также уперлись в предел, но на уровне около 95-100 FPS.

Вторая модель топового семейства Radeon R9 290 показывает скорость лишь на 4% хуже, чем старшая R9 290X, а плата предыдущего поколения, основанная на чипе Tahiti, расположилась между ними. Еще удивительнее то, что несмотря на то, что геометрическая производительность видеокарт Nvidia должна быть выше, чем у решений конкурента, так как они имеют большее количество соответствующих исполнительных блоков, но и Geforce GTX 780 и GTX 770 уступают всем Radeon. Придется проверять геометрическую производительность в DirectX 11-тестах.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.

А вот во втором геометрическом тесте из 3DMark Vantage ситуация изменилась. В этот раз лидирует новая Radeon R9 290 все так же на 3% отстает от старшей сестры, но уже значительно производительнее своей предшественницы — HD 7970 GHz (она же R9 280X), что говорит об упоре скорее в математическую производительность, нежели геометрическую.

Впрочем, если сравнивать скорость новинки от AMD с конкурирующими Geforce, то новая плата от AMD весьма близка к своему прямому конкуренту в виде GTX 780, и заметно опережает GTX 770. Это — очень хороший результат, ведь ранее синтетические тесты имитации тканей и частиц из тестового пакета 3DMark Vantage, в которых активно используются геометрические шейдеры, показывали, что платы Nvidia значительно опережают конкурирующие модели компании AMD.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических расчетов.

В чисто математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы видим отличающееся распределение результатов, по сравнению с двумя аналогичными тестами из нашего тестового пакета. В этом случае производительность решений явно не соответствует теории и также расходится с тем, что мы видели ранее в математических тестах из пакета RightMark 2.0.

Видеокарты Radeon компании AMD, созданные на базе чипов архитектуры GCN, очень хорошо справляются с подобными задачами и показывают лучшие результаты в случаях, когда выполняется интенсивная «математика». Даже видеоплата Radeon HD 7970 GHz в этом тесте показала отличный результат выше чем Geforce GTX 780, поэтому R9 290 должна легко обойти конкурента.

Впрочем, получилось не так уж легко. Вышедшая сегодня на рынок видеокарта модели Radeon R9 290 показала скорость на 12% медленнее старшей модели R9 290X, что более-менее соответствует теории. Но, если сравнивать результат с лучшей одночиповой моделью предшествующей серии Radeon HD 7970 GHz, то разница совсем невелика. Впрочем, R9 290 все-таки превзошла на 15% чуть более дорогую Geforce GTX 780, не говоря уже о GTX 770, которая и вовсе провалилась, став худшей.

Direct3D 11: Вычислительные шейдеры

Чтобы протестировать новое решение компании AMD в задачах, использующих такие свежие возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы воспользовались примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, Nvidia и AMD.

Сначала мы рассмотрим тесты, использующие вычислительные (Compute) шейдеры. Их появление — одно из наиболее важных нововведений в последних версиях DX API, они уже используются в современных играх для выполнения различных задач: постобработки, симуляций и т. п. В первом тесте показан пример HDR-рендеринга с tone mapping из DirectX SDK, с постобработкой, использующей пиксельные и вычислительные шейдеры.

Скорость расчетов в вычислительном и пиксельном шейдерах для всех плат AMD и Nvidia давно одинаковая, хотя у видеокарт с GPU предыдущих архитектур были различия (любопытно, что у обеих плат на Hawaii она тоже есть, хоть и небольшая). Судя по нашим предыдущим тестам, результаты в задаче явно зависят не только от математической мощи и эффективности вычислений, но и от других факторов, вроде пропускной способности памяти и производительности ROP.

В данном случае скорость видеокарт упирается именно в ПСП. Это понятно уже потому, что новая плата от компании AMD в этом тесте оказалась точно на уровне своей старшей сестры и лишь на 10-15% быстрее одночиповой предшественницы из семейства Radeon HD 7000. Но, новинка от AMD все же опережает конкурирующие модели от Nvidia, особенно важно это в случае прямой конкурентки Geforce GTX 780, которая стоит чуть дороже.

Второй тест вычислительных шейдеров также взят из Microsoft DirectX SDK, в нем показана расчетная задача гравитации N тел (N-body) — симуляция динамической системы частиц, на которую воздействуют физические силы, такие как гравитация.

В случае этого теста расклад сил между решениями разных компаний получился совершенно иной. У решений Nvidia наблюдается явное преимущество в подобных расчетных задачах, а все платы Radeon плохо справляются с ними. Совершенно логично, что в этом тесте побеждает мощнейшая из плат Nvidia карта модели Geforce GTX 780 на топовом GK110, а следом за ней идет вторая плата, уже на базе чипа GK104.

Похоже, что в этом тесте упор не на скорость исполнения простых математических вычислений, а в эффективности выполнения сложного кода с ветвлениями. Удивительно, что обе платы семейства Radeon R9 290 в этой задаче оказались явно слабее Radeon HD 7970 GHz — все-таки в этой задаче эффективность графического чипа Hawaii даже немного ухудшилась, по сравнению с Tahiti, и виновата в этом меньшая тактовая частота более сложного чипа.

Direct3D 11: Производительность тесселяции

Вычислительные шейдеры очень важны, но еще одним важным нововведением в Direct3D 11 считается аппаратная тесселяция. Мы очень подробно рассматривали ее в своей теоретической статье про Nvidia GF100. Тесселяцию уже довольно давно начали использовать в DX11-играх, таких как STALKER: Зов Припяти, DiRT 2, Aliens vs Predator, Metro Last Light, Civilization V, Crysis 3, Battlefield 3 и других. В некоторых из них тесселяция используется для моделей персонажей, в других — для имитации реалистичной водной поверхности или ландшафта.

Существует несколько различных схем разбиения графических примитивов (тесселяции). Например, phong tessellation, PN triangles, Catmull-Clark subdivision. Так, схема разбиения PN Triangles используется в STALKER: Зов Припяти, а в Metro 2033 — Phong tessellation. Эти методы сравнительно быстро и просто внедряются в процесс разработки игр и существующие движки, поэтому и стали популярными.

Первым тестом тесселяции будет пример Detail Tessellation из ATI Radeon SDK. В нем реализована не только тесселяция, но и две разные техники попиксельной обработки: простое наложение карт нормалей и parallax occlusion mapping. Что ж, сравним DX11-решения AMD и Nvidia в различных условиях:

В тесте простого бампмаппинга скорость чаще всего упирается в ПСП, и результат новой видеокарты AMD подтверждает это — он идентичен скорости Radeon R9 290X и примерно на 25% выше скорости модели HD 7970 GHz из предшествующей линейки. Обе Geforce в этом подтесте далеко позади и вряд ли из-за ПСП.

Во втором подтесте с заметно более сложными попиксельными расчетами все несколько интереснее. Эффективность выполнения таких математических вычислений в пиксельных шейдерах у чипов архитектуры GCN выше, чем у Kepler. Обе платы Nvidia проигрывают даже HD 7970 GHz, не говоря уже о новых решениях на Hawaii. Radeon R9 290 на базе нового графического процессора оказался заметно быстрее них, уступив менее 10% старшей модели, что примерно соответствует теории.

В самом интересном тесте с тесселяцией результат новинки также неплохой. Модель R9 290 показала одинаковую с R9 290X очень высокую скорость, опередив прямого соперника Geforce GTX 780. В этом тесте тесселяции разбиение треугольников умеренное и скорость в нем не упирается в производительность блоков обработки геометрии, поэтому скорости обработки треугольников у платы компании AMD вполне хватает, чтобы показывать высокие результаты.

Вторым тестом производительности тесселяции будет еще один пример для 3D-разработчиков из ATI Radeon SDK — PN Triangles. Собственно, оба примера входят также и в состав DX SDK, так что мы уверены, что на их основе создают свой код игровые разработчики. Этот пример мы протестировали с различным коэффициентом разбиения (tessellation factor), чтобы понять, как сильно влияет его изменение на общую производительность.

В этом примере применяется уже более сложная геометрия, поэтому и сравнение геометрической мощи различных решений по этому тесту приносит другие выводы. Все представленные в материале современные решения хорошо справляются с легкой и средней геометрической нагрузкой, показывая высокую скорость, но в тяжелых условиях графические процессоры Nvidia намного производительнее.

Анонсированная сегодня модель Radeon R9 290 основана на таком же чипе Hawaii, что и R9 290X. Он имеет вдвое большее количество геометрических блоков, по сравнению с Tahiti, поэтому обе платы гораздо быстрее карты предыдущего поколения. Разница между R9 290 и HD 7970 GHz составляет чуть ли не 50%, что весьма много. Если сравнивать с платами Nvidia, то R9 290 уступает им только в сложных условиях, когда скорость всех Radeon серьезно падает, в то время как у плат Geforce она остается достаточно высокой.

Рассмотрим результаты еще одного теста — демонстрационной программы Nvidia Realistic Water Terrain, также известной как Island. В этой демке используется тесселяция и карты смещения (displacement mapping) для рендеринга реалистично выглядящей поверхности океана и ландшафта.

Тест Island не является чисто синтетическим тестом для измерения исключительно геометрической производительности GPU, так как он содержит и сложные пиксельные и вычислительные шейдеры в том числе, и такая нагрузка ближе к реальным играм, в которых используются все блоки GPU, а не только геометрические, как в предыдущих тестах геометрии. Впрочем, основной все равно остается именно нагрузка на блоки обработки геометрии.

Мы протестировали решения при четырех разных коэффициентах тесселяции — в данном случае настройка называется Dynamic Tessellation LOD. Если при самом первом коэффициенте разбиения треугольников, когда скорость не ограничена производительностью геометрических блоков, вторая видеокарта из новой топовой серии от компании AMD показывает достаточно высокий результат, но до уровня Geforce GTX 780 не дотягивается даже в этом случае. Ну а при увеличении геометрической работы, платы компании Nvidia вырываются вперед еще дальше, а производительность всех Radeon заметно снижается.

Видеокарты конкурента AMD в этом тесте весьма быстры, и Geforce GTX 780 более чем вдвое производительнее новинки в лице Radeon R9 290 в сложных условиях. Новая же плата Radeon показывает во всех режимах неплохие результаты, прилично обгоняя предыдущую модель Radeon HD 7970 GHz (она же R9 280X), но для соперничества с картами на чипах Nvidia этого все еще не хватает. Впрочем, отметим, что результаты новинки в тестах тесселяции для решения AMD весьма хороши, и в играх с гораздо меньшей геометрической нагрузкой ее возможностей точно хватит.

Выводы по синтетическим тестам

Результаты синтетических тестов видеокарты Radeon R9 290, основанной на мощнейшем графическом процессоре Hawaii и являющейся второй платой топовой серии AMD, а также результаты других моделей видеокарт производства обоих производителей дискретных видеочипов показали, что новая плата Radeon является лишь чуть менее мощной видеокартой по сравнению с более дорогими Radeon R9 290X и Geforce GTX 780. Более того, во многих тестах она не просто успешно сражается с Geforce GTX 780, будучи дешевле, но и опережает ее.

Отставание второй модели семейства Radeon R9 290 от старшей оказалось совсем небольшим, а разница в цене более ощутимая. Неудивительно, что новинка от AMD становится одним из самых выгодных предложений в верхнем ценовом диапазоне по соотношению цены и скорости, и она будет успешно конкурировать с решениями Nvidia. За исключением редких задач, анонсированная сегодня модель отлично выступила по сравнению с Geforce GTX 780, наш набор синтетических тестов показал, что по производительности новый Radeon должен успешно соперничать с Geforce GTX 780 и в играх.

Во второй плате на базе чипа Hawaii никуда не делись сильные стороны этого графического процессора: высокие математическая и текстурная производительность, а особенно — производительность блоков ROP. Более того, при одинаковой с R9 290X пропускной способностью видеопамяти у нее есть явное преимущество по балансу характеристик GPU. Нельзя не упомянуть и серьезно возросшую геометрическую производительность, хотя и не достигшую уровня конкурентов от Nvidia. В играх это не так уж и важно, так как там нет такого объема геометрии, чтобы обнажить эту легкую слабость решений AMD.

В общем, новая модель Radeon R9 290 стала очень интересным предложением для тех энтузиастов, которые хотят играть при максимальных настройках в высоких разрешениях и при этом сэкономить еще немного денег по сравнению с R9 290X. Новая модель видеоплаты от AMD стоит еще дешевле, а разница между ними по скорости вряд ли будет ощутимой в большинстве случаев. Будет очень интересно оценить реальную производительность новинки в играх в следующей части статьи, к которой мы и переходим.

AMD Radeon R9 290 — Часть 3: производительность в игровых тестах →

2 блока питания Corsair CMPSU-1200AXEU для тестового стенда предоставлены компанией Corsair

Корпус Corsair Obsidian 800D Full Tower для тестового стенда предоставлен компанией Corsair

Модули памяти Corsair Vengeance CMZ16GX3M4X1600C9 для тестового стенда предоставлены компанией Corsair

Corsair Hydro SeriesT H100i CPU Cooler для тестового стенда предоставлен компанией Corsair

Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт

Системная плата Asus Sabertooth X79 для тестового стенда предоставлена компанией AsusTeK

Системная плата MSI X79A-GD45(8D) для тестового стенда предоставлена компанией MSI

Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate

Накопитель SSD OCZ Octane 512 ГБ для тестового стенда предоставлен компанией OCZ Russia

2 накопителя SSD Corsair Neutron SeriesT 120 ГБ для тестового стенда предоставлены компанией Corsair

Монитор Asus ProArt PA249Q для рабочего компьютера предоставлен компанией AsusTeK




Дополнительно

Обзор нового видеоускорителя AMD Radeon R9 290. Часть 2 — Особенности видеокарты, результаты синтетических тестов

AMD Radeon R9 290:

описание видеокарты и результаты синтетических тестов

Содержание

В этой части мы изучим видеокарту, а также познакомимся с результатами синтетических тестов. В нашей лаборатории побывала референсная карта AMD.

Платa

AMD Radeon R9 290 4096 МБ 512-битной GDDR5 PCI-E
  • GPU: Radeon R9 290X (Hawaii)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs): 947 МГц (номинал — 947 МГц)
  • Частота работы памяти (физическая (эффективная)): 1250 (5000) МГц (номинал — 1250 (5000) МГц)
  • Ширина шины обмена с памятью: 512 бит
  • Число вычислительных блоков в GPU/частота работы блоков: 40/947 МГц (номинал — 40/947 МГц)
  • Число операций (ALU) в блоке: 64
  • Суммарное число операций (ALU): 2560
  • Число блоков текстурирования: 160 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 64
  • Размеры: 280×100×37 мм (видеокарта занимает 2 слота в системном блоке)
  • Цвет текстолита: черный
  • Энергопотребление (пиковое в 3D (Uber)/3D (Quiet)/в режиме 2D/в режиме «сна»): 272/248/48/3 Вт
  • Выходные гнезда: 2×DVI (Dual-Link/HDMI), 1×HDMI 1.4a, 1×DisplayPort 1.2
  • Поддержка многопроцессорной работы: CrossFire X (Hardware)

AMD Radeon R9 290 4096 МБ 512-битной GDDR5 PCI-E
Карта имеет 4096 МБ памяти GDDR5 SDRAM, размещенной в 16 микросхемах (на лицевой стороне PCB).

Микросхемы памяти Hynix (GDDR5). Микросхемы рассчитаны на максимальную частоту работы в 1500 (6000) МГц.

Сравнение с эталонным дизайном, вид спереди
AMD Radeon R9 290 4096 МБ 512-битной GDDR5 PCI-E Reference card AMD Radeon R9 290X

Сравнение с эталонным дизайном, вид сзади
AMD Radeon R9 290 4096 МБ 512-битной GDDR5 PCI-E Reference card AMD Radeon R9 290X

Как видите, здесь даже нечего рассказать, ибо R9 290 с точки зрения PCB и СО полностью копирует своего старшего собрата R9 290X, а его мы уже детально рассматривали. Да и зачем менять PCB, если у R9 290 подсистема памяти точно такая же? Потребляет новинка меньше, чем R9 290Х, однако разница не настолько велика, чтобы вносить какие-либо изменения в блок питания. Впрочем, впереди выпуск R9 290Х и R9 290 партнерами AMD, с их собственными вариациями плат, поэтому очень может быть, что у них R9 290 и R9 290Х будут отличаться не только количеством ядер в GPU.

Напомним, что система питания карты — 6-фазная, управляется цифровым контроллером IR 3567B, который обеспечивает работу PowerTune. 5 фаз отводится на питание ядра, а шестая — для микросхем памяти и прочей логики.

Ускоритель имеет следующий набор гнезд вывода: 2 DVI (совместимы с выводом на HDMI) и по одному DisplayPort и HDMI (суммарно можно подключить 3 приемника с HDMI). Напомним, что ускорители AMD достаточно давно обладают собственными звуковыми кодеками для вывода звука по HDMI. А R9 290X к тому же поддерживает программируемый движок TrueAudio, который, впрочем, пока трудно назвать актуальным, так как нужна поддержка со стороны разработчиков игр.

Максимальные разрешения и частоты в 3D: 2560×1600@60 Гц — по цифровому интерфейсу (для DVI-гнезд с Dual-Link/HDMI). Также декларирована поддержка разрешения 4К, однако работоспособность на такого рода мониторах нами еще не проверялась.

Что касается возможностей по ускорению декодирования видео — в 2007 году мы проводили такое исследование, с ним можно ознакомиться здесь.

Карта требует дополнительного питания в виде двух разъемов: 8- и 6-контактного.

О системе охлаждения.

AMD Radeon R9 290 4096 МБ 512-битной GDDR5 PCI-E
Система охлаждения полностью повторяет предшественницу от R9 290X, но повторим ее описание. Основана она на испарительной камере, на которую напаян большой радиатор без тепловых трубок. Способ охлаждения последнего традиционен: с помощью цилиндрического вентилятора, расположенного в конце кулера.

Микросхемы памяти, как и силовые транзисторы, охлаждаются основным радиатором.

СО получилась далеко не тихой, хотя в целом чуть тише, чем у R9 290X. Максимальный шум получается при работе вентилятора с частотой вращения 2600 оборотов в минуту.

Мы провели исследование температурного режима с помощью новой версии 4.2.1 утилиты EVGA PrecisionX (автор А. Николайчук AKA Unwinder) и получили следующие результаты.

AMD Radeon R9 290 4096 МБ 512-битной GDDR5 PCI-E (Uber Mode/Режим полной мощности)

После 6 часов прогона карты под максимальной игровой нагрузкой максимальная температура ядра составила 93 градуса, что никак нельзя назвать слабым нагревом, хотя AMD уверяет, что такой нагрев никак не повредит ни ядро, ни карту.

Комплектация. Референс-карта прибыла к нам в ОЕМ-упаковке, поэтому комплекта нет.

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютеры на базе процессора Intel Core i7-3960X (Socket 2011):
    • 2 процессора Intel Core i7-3960X (o/c 4 ГГц);
    • СО Hydro SeriesT H100i Extreme Performance CPU Cooler;
    • СО Intel Thermal Solution RTS2011LC;
    • системная плата Asus Sabertooth X79 на чипсете Intel X79;
    • системная плата MSI X79A-GD45(8D) на чипсете Intel X79;
    • оперативная память 16 ГБ DDR3 Corsair Vengeance CMZ16GX3M4A1600C9 1600 МГц;
    • жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA2;
    • жесткий диск WD Caviar Blue WD10EZEX 1 TБ SATA2;
    • 2 SSD Corsair Neutron SSD CSSD-N120GB3-BK;
    • 2 блока питания Corsair CMPSU-1200AXEU (1200 Вт);
    • корпус Corsair Obsidian 800D Full Tower.
  • операционная система Windows 7 64-битная; DirectX 11;
  • монитор Dell UltraSharp U3011 (30″);
  • монитор Asus ProArt PA249Q (24″);
  • драйверы AMD версии Catalyst 13.11beta8; Nvidia версии 331.58

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

В качестве синтетических тестов DirectX 11 мы использовали примеры из пакетов SDK компаний Microsoft и AMD, а также демонстрационную программу Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010). Мы взяли и приложения обоих производителей видеочипов: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain, также известная как Island11.

Синтетические тесты проводились на следующих видеокартах:

  • Radeon R9 290 со стандартными параметрами (далее R9 290)
  • Radeon R9 290X со стандартными параметрами в режиме «Uber Mode»(далее R9 290X)
  • Radeon HD 7970 GHz со стандартными параметрами (далее HD 7970 GHz)
  • Geforce GTX 780 со стандартными параметрами (далее GTX 780)
  • Geforce GTX 770 со стандартными параметрами (далее GTX 770)

Для анализа результатов новой топовой видеокарты Radeon R9 290 были выбраны именно эти решения по следующим причинам. Radeon HD 7970 GHz является предыдущей моделью компании, относящейся к самой верхней ступеньке среди одночиповых решений — будет интересно посмотреть, насколько быстрее получилась новинка по отношению к плате на базе Tahiti. Кроме того, HD 7970 GHz можно признать условно равной модели R9 280X из текущего поколения. А сравнение с Radeon R9 290X будет интересно потому, что это мощнейшая видеокарта AMD, основанная на таком же чипе Hawaii, но имеющая более высокую цену и производительность.

От конкурирующей компании Nvidia для нашего сравнения были выбраны две видеоплаты, основанные на разных графических процессорах. Geforce GTX 780 на время выхода Radeon R9 290 является, пожалуй, ее ближайшим конкурентом по цене, так как продается несколько дороже ее, а менее производительная видеоплата Geforce GTX 770 основана на видеочипе GK104 и стоит дешевле, поэтому ее можно отнести к среднему решению между R9 280X и R9 290.

Забегая вперед, сделаем небольшое отступление, связанное с важностью доработки драйверов даже для синтетических предельных тестов. Когда мы протестировали рассматриваемую сегодня модель на версии драйверов, предназначенной для Radeon R9 290X, то результаты новинки оказались неожиданно низкими во многих тестах, что явно не соответствовало теории. И лишь тестирование на последней версии Catalyst, спешно выпущенной к выходу конкретно Radeon R9 290, показало верные цифры — примерно на 10-15% большие, по сравнению с неоптимизированным драйвером.

Direct3D 9: тесты Pixel Shaders

Тесты текстурирования и заполнения (филлрейта) из пакета 3DMark Vantage мы рассмотрим чуть позже, а первая группа пиксельных шейдеров, которую мы используем, включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся разве что в старых играх, очень простых для современных видеочипов.

Мы не устаем напоминать, что с этими тестами современные GPU справляются с легкостью, и скорость мощных решений в них всегда упирается в различные ограничители. Тесты не способны показать возможности современных видеочипов, и интересны лишь с точки зрения устаревших игровых приложений. Производительность современных видеокарт в них зачастую ограничена скоростью текстурирования или филлрейта, а видеокарты Nvidia давно перестали оптимизироваться для них, что отлично доказывают результаты единственной взятой видеокарта этой компании.

Неудивительно, что вышедшая сегодня модель видеокарты AMD в этом сравнении лишь чуть уступает своей старшей сестре в виде Radeon R9 290X, которая впереди на 5-10%, в зависимости от теста, как и должно быть в теории. Своего предшественника в лице Radeon HD 7970 GHz новинка успешно обходит во всех тестах, находясь примерно посередине между HD 7970 GHz (R9 280X) и R9 290X, что также согласуется с теорией. Плата от Nvidia уступает всем Radeon, даже устаревшей HD 7970 GHz. Посмотрим на результаты более сложных пиксельных программ промежуточных версий:

Тест Cook-Torrance более интенсивен вычислительно, и скорость в нем больше зависит от количества ALU и их частоты, но также и от скорости TMU. Этот тест исторически лучше подходит для графических решений компании AMD, хотя новые топовые платы Geforce на базе архитектуры Kepler в нем также показывают сильные результаты, что мы и видим по неплохим в целом цифрам Geforce GTX 780.

Младшая плата из семейства Radeon R9 290 ожидаемо оказалась быстрее предшествующей ей HD 7970 GHz, но медленнее модели R9 290X на 10-13%, как и должно быть, исходя из теории. И в тесте освещения, больше зависящем от скорости ALU, и в тесте Water, скорость в котором больше зависит от текстурирования, мы видим примерно одно и то же — по скорости текстурирования и математических расчетов модели серии отличаются где-то на 14%.

Своего главного конкурента новинка от компании AMD обошла лишь в одном из тестов — в тесте освещения, где важнее математическая производительность, по которой у плат AMD есть явное преимущество. В другом тесте результаты Geforce GTX 780 и Radeon R9 290 получились практически равные.

Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье «Современная терминология 3D-графики».
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

Существует два варианта этих шейдеров: с ориентацией на математические вычисления и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это универсальные тесты, производительность в которых зависит и от скорости блоков ALU, и от скорости текстурирования, также в них важен общий баланс чипа и эффективность исполнения вычислительных программ. Прошлые наши исследования показывают, что в этих конкретных задачах архитектура GCN от AMD выступает значительно лучше графической архитектуры Nvidia Kepler.

В тесте «Frozen Glass» скорость больше зависит от математической производительности и в случае всех плат Geforce всегда заметна непонятна преграда, из-за которой плата Nvidia проигрывает вдвое почти всем Radeon. Модель Radeon R9 290 оказывается ровно посередине между Radeon HD 7970 GHz (R9 280X) и R9 290X в этом тесте, что согласуется с теорией.

А вот втором тесте «Parallax Mapping» новая видеокарта Radeon показала производительность выше конкурента, и отстала от старшей сестры на 14%, полностью согласно теории, но сопоставление с предшествующей моделью Radeon HD 7970 GHz (R9 280X) не столь радужное — преимущество новинки совсем невелико. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:

В этих условиях положение единственной видеоплаты производства Nvidia несколько улучшилось, ведь она справляется с текстурными выборками лучше. Но Radeon R9 290 все равно опережает ее с хорошим запасом, особенно в тесте Frozen Glass. Новинка на 13-17% медленнее чем R9 290X, что примерно соответствует теории. Что касается сравнения с HD 7970 GHz (R9 280X), то она идет с R9 290 на равных в Parallax Mapping, немного отставая в другом тесте.

В итоге, вторая видеокарта на чипе Hawaii справилась с этими задачами неплохо, но опережение Radeon HD 7970 GHz было не слишком впечатляющим в некоторых из тестов. Впрочем, это были давно устаревшие задачи, с упором в текстурирование, чего почти не встречается в играх. Дальше мы рассмотрим результаты еще двух тестов пиксельных шейдеров, но уже версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9. Они более показательны с точки зрения современных игр на ПК, среди которых много мультиплатформенных. Тесты отличаются тем, что сильно нагружают и ALU, и текстурные модули, обе шейдерные программы сложны и длинны и включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье «Современная терминология 3D-графики».
  • Fur — процедурный шейдер, визуализирующий мех.

А вот эти тесты уже совсем не ограничены производительностью только текстурных выборок или филлрейтом и скорость в них более всего зависит от эффективности исполнения сложного шейдерного кода. В самых тяжелых DX9-тестах из первой версии пакета RightMark видеокарты производства Nvidia в предыдущие годы были несколько сильнее, но архитектура GCN помогла видеокартам AMD вырваться вперед, особенно после тщательной доводки драйверов Catalyst.

Сегодняшняя новинка от компании AMD показывает в этих задачах очень неплохой результат, обогнав предшественницу на базе чипа Tahiti (аналогичную плате R9 280X из нового поколения). Что касается сравнения с самой мощной топовой видеокартой на базе Hawaii, то новинка отстает от нее на 11-12%, что вполне соответствует теоретическим цифрам разницы в математической производительности.

Сравнение с платой от Nvidia не приводит к однозначным выводам, хотя для решения AMD дело выглядит лучше, чем для представительницы от конкурента. Пусть в тесте Fur плата Radeon R9 290 чуть проиграла Geforce GTX 780, но разница минимальна, и результаты решений близки. Зато в тесте продвинутого параллакс-маппинга GTX 780 отстает от героя сегодняшнего анонса более чем на 40%.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два уже знакомых нам теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также еще два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нем используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в этом тесте зависит от количества и эффективности блоков TMU, влияет и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает еще и эффективный филлрейт и пропускная способность памяти. Результаты при детализации уровня «High» получаются до полутора раза ниже, чем при «Low».

В задачах процедурной визуализации меха с большим количеством текстурных выборок, за пару поколений графических архитектур компания AMD сократила разницу с платами Nvidia, а с выпуском видеочипов на базе архитектуры GCN и вовсе вырвалась вперед, и теперь именно платы Radeon являются лидерами в этих сравнениях, что говорит о высокой эффективности выполнения ими данных программ.

Новая топовая плата в лице Radeon R9 290 отстает только от старшей модели R9 290X — на 8-10%, обходя все остальные решения. Преимущество над Radeon HD 7970 GHz (R9 280X) очень неплохое, новинка явно ближе к R9 290X, чем к младшему решению. С учетом того, что даже плата AMD предыдущего поколения с запасом опережает Geforce GTX 780, рассматривать пару R9 290 и GTX 780 просто нет смысла — модель компании AMD по сравнению с обеими платами Geforce показывает очень высокий результат, на котором сказалось увеличение количества блоков TMU и ALU.

Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: возможно, в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

И здесь ситуация похожа на ту, что мы видели на предыдущей диаграмме, но обе видеокарты Nvidia уступают своим соперникам от AMD даже еще больше. Новинка Radeon R9 290 оказывается заметно быстрее младшей модели HD 7970 GHz (R9 280X) и проигрывает R9 290X те же 10%, что близко к теоретической разнице. Преимущество над прямым конкурентом в виде Geforce GTX 780 чуть ли не двукратное! В общем, подтверждаем то, что преимущество в подобных вычислениях явно у чипов компании AMD, предпочитающих попиксельные вычисления.

Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип еще примерно в два раза — такой режим называется «High».

Диаграмма в целом похожа на предыдущую (также без включения SSAA), и в этот раз Radeon R9 290 опережает предшествующую модель Radeon HD 7970 GHz, хотя в этот раз ее преимущество слегка снизилось. Да и Radeon R9 290X новинка уступает уже не 10%, а до 13%. Что, впрочем, все так же прекрасно соотносится с теоретической разницей между двумя видеокартами на основе чипа Hawaii.

Так как видеоплаты Nvidia в этом тесте справляются с работой заметно хуже конкурирующих решений от AMD, то модель Geforce GTX 780 в обновленном D3D10-варианте теста без суперсэмплинга снова показывает результат хуже, чем все Radeon, даже HD 7970 GHz, не говоря уже о представленной сегодня R9 290. Посмотрим, что изменит включение суперсэмплинга:

Все снова примерно так же, что и в «Fur» — при включении суперсэмплинга и самозатенения, задача получается еще более тяжелой, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьезное падение производительности. Разница между скоростными показателями протестированных видеокарт изменилась лишь немного, включение суперсэмплинга сказывается меньше, чем в предыдущем случае.

Мы снова видим, что графические решения Radeon в наших D3D10-тестах пиксельных шейдеров работают более эффективно, по сравнению с конкурирующими Geforce, и младшая топовая плата на чипе Hawaii хоть и обгоняет Radeon HD 7970 GHz совсем немного, но показывает неплохую скорость, отставая от старшей Radeon R9 290X уже до 16% — настолько, насколько должна и по теории. Естественно, что конкуренты от Nvidia остались далеко позади. Посмотрим, что будет в чисто вычислительных задачах.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты предельных математических тестов обычно лишь примерно соответствуют разнице в частотах и количестве вычислительных блоков, на них влияет разная эффективность их использования в конкретных решениях, также важна и оптимизация драйверов. В случае теста Mineral, новая модель Radeon R9 290 снова находится на диаграмме ровно посередине между R9 290X и HD 7970 GHz, и отстает от старшего решения на 14%, что очень близко к теоретической разнице в математической производительности между ними.

Мы уже знаем, что архитектуры AMD в таких тестах всегда имели значительное преимущество перед конкурирующими решениями Nvidia, но в архитектуре Kepler калифорнийской компании удалось увеличить число потоковых процессоров, и пиковая математическая производительность моделей Geforce, начиная с GTX 680, серьезно возросла. Это мы видим по результатам нашего первого математического теста, ведь хотя видеокарты Geforce все еще уступают платам на основе чипа Hawaii, прямой конкурент GTX 780 отстает от R9 290 уже лишь на 20%.

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нем только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Во втором математическом тесте мы видим иные результаты видеокарт, относительно друг друга. Разница между Radeon R9 290 и новинкой в этом тесте стала чуть больше теоретической — 16%, но 2% входят в предел погрешности измерений. Radeon HD 7970 GHz (и аналогичная ей R9 280X) осталась позади, хоть и не так далеко.

Второй одночиповый топ новой серии легко справляется со своим конкурентом по цене от Nvidia. Geforce GTX 780 не может ничего противопоставить новинке компании AMD, которая оказывается быстрее нее в математических тестах на все те же привычные 20%.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трех уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близкое к двукратному. Задача эта для современных видеокарт не слишком сложная, и производительность в ней ограничена скоростью обработки геометрии, а иногда — пропускной способностью памяти.

Налицо явная разница между результатами видеокарт на чипах Nvidia и AMD, которая обусловлена отличиями в геометрических конвейерах чипов этих компаний. Если в предыдущих тестах с пиксельными шейдерами платы AMD были заметно эффективнее и быстрее, то тесты геометрии показывают, что в таких задачах платы Nvidia оказываются производительнее, даже несмотря на все изменения в Hawaii.

Сегодняшняя новинка Radeon R9 290 на основе этого GPU хоть и имеет немалое количество геометрических блоков (четыре), по сравнению с Radeon HD 7970 GHz и R9 280X на базе Tahiti, но в данном случае для плат AMD ограничителем стала скорее математическая производительность. Впрочем, в сравнении R9 290 и R9 290X разницы почти совсем нет (1%).

У решений Nvidia с геометрической производительностью дела всегда были лучше, и поэтому они оказываются быстрее. Новая модель Radeon не уступает в этом тесте Geforce GTX 770, но GTX 780, прямой конкурент новинки, оказывается явно сильнее ее. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры слегка улучшились и для плат AMD и для решений Nvidia. Видеокарты в этом тесте геометрических шейдеров слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, поэтому и все выводы остаются прежними. Новая модель Radeon R9 290 все так же заметно быстрее одночипового предшественника из семейства Radeon HD 7000, и не отстает от R9 290X, так что в выводах не изменилось вообще ничего.

К сожалению, но «Hyperlight» — второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load, в котором используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output, на всех современных видеокартах компании AMD, включая и топовую Radeon R9 290, просто не работает. В какой-то момент очередное обновление драйверов Catalyst привело к тому, что данный тест просто не запускается на платах этой компании.

Поэтому самый интересный геометрический тест нашего пакета, который предполагает большую нагрузку именно на геометрические шейдеры, в котором Radeon R9 290 мог показать свое преимущество, нам ничего не дает, а ведь в нем мы могли видеть реальную работу над ошибками от AMD, с исправлением проигрыша видеокарт Radeon. То ли его до сих пор не исправили, то ли... на этом мысль останавливается. Спасает только то, что дополнительные выводы о скорости обработки геометрии мы сделаем в разделе DirectX 11.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Наши предыдущие исследования показали, что на результаты этого теста может влиять и филлрейт и пропускная способность памяти, что особенно заметно в легком режиме. Результаты видеокарт Nvidia зачастую ограничены еще чем-то странным, и отставание Geforce GTX 780 от GTX 770 явно указывает на эту аномалию.

Самой быстрой в сравнении ожидаемо стала топовая Radeon R9 290X, но сразу за ней идет представленная сегодня новая модель Radeon R9 290, которая отстает до 11% от старшей сестры. Результаты новинки превышают производительность обеих плат Nvidia на чипах GK110 и GK104, и GTX 780 и GTX 770 уступают новинке тут достаточно много. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Ситуация на диаграмме заметно изменилась — результаты решений компании AMD в тяжелых режимах ухудшились, а Geforce почти остались на тех же позициях. Теперь лишь Radeon R9 290X показывает результат заметно выше скорости двух плат от Nvidia, а новая видеоплата Radeon R9 290 отстает от нее до 14%, что полностью соответствует теории. Новинка чуть-чуть опередила свою прямую соперницу GTX 780 в двух сложных режимах, заметно обогнав ее в самом простом.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нем используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты во втором тесте вершинного текстурирования «Waves» в целом схожи с теми, что мы видели на предыдущих диаграммах. По каким-то причинам показатели обеих плат Geforce в легком режиме остаются весьма заниженными, и они сравнимы лишь результатами Radeon HD 7970 GHz (полным аналогом которой является также и современная R9 280X).

Скорость же новой топовой платы Radeon R9 290 в этом тесте очень неплоха, второй одночиповый топ на базе Hawaii оказался медленнее старшего лишь на 7-11%. Рассмотрим второй вариант этого же теста:

Во втором тесте текстурных выборок с усложнением задачи скорость всех решений стала ниже, и особенно серьезно пострадали видеокарты Geforce в легких режимах, уступив там даже Radeon HD 7970 GHz (R9 280X). Результаты сегодняшней новинки R9 290 значительно лучше, чем у предшественницы на Tahiti, что неудивительно, ведь скорость текстурирования и блоков ROP у нее серьезно возросли.

3DMark Vantage: тесты Feature

Синтетические тесты из пакета 3DMark Vantage покажут нам то, что мы ранее упустили. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10 и интересны тем, что отличаются от наших и до сих пор актуальны. При анализе результатов новой видеокарты Radeon R9 290 в этом пакете мы сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark.

Feature Test 1: Texture Fill

Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Эффективность видеокарт AMD и Nvidia в текстурном тесте компании Futuremark достаточно высока и сравнительные цифры моделей близки к соответствующим теоретическим параметрам. Младшая топовая модель из нового семейства Radeon R9 на 12% медленнее старшей R9 290X, и быстрее HD 7970 GHz из предыдущего поколения, что соответствует теоретической разнице по скорости текстурирования между ними.

Что касается сравнения скорости платы Radeon R9 290 с решениями конкурента, то новинка AMD по текстурной скорости хоть и обгоняет Geforce GTX 770, основанную на графическом процессоре GK104, но уступает своему прямому конкуренту GTX 780 — лишь чуть более дорогой модели на базе графического процессора GK110. В целом, все это было ожидаемо, исходя из теоретических показателей.

Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

В тесте производительности блоков ROP, результат у анонсированной сегодня платы AMD получился ровно таким же, что и у старшей Radeon R9 290X. Если в тесте измерялась бы именно пиковая скорость блоков ROP, то Radeon R9 290 должен был оказаться медленнее R9 290X и заметно быстрее своего предшественника HD 7970 GHz (R9 280X). Но мы уже определили ранее, что цифры этого подтеста 3DMark Vantage показывают производительность блоков ROP с учетом величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), и тест измеряет именно пропускную способность, а не производительность ROP.

А раз теоретической разницы в ПСП между R9 290 и R9 290X нет, то и их идентичный результат в тесте объясним. Что же касается сравнения скорости новинки с платами Geforce, то представленная сегодня модель AMD Radeon показала чуть большую скорость заполнения сцены, что и несколько более дорогой конкурент на GK110. Интересно, что плата GTX 770 на чипе GK104 в данном тесте оказалась впереди GTX 780.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.

Этот тест пакета 3DMark Vantage отличается от проведенных нами ранее тем, что результаты в нем зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен верный баланс GPU, а также эффективность выполнения сложных шейдеров.

В данном случае, важны и математическая и текстурная производительность, поэтому в этой «синтетике» из 3DMark Vantage новая плата Radeon R9 290 отстает на 12% от более мощной модели семейства, но все же обгоняет топовую плату предшествующей серии HD 7970 GHz, что соответствует теоретической разнице в скорости текстурирования и вычислительной производительности.

В этом тесте даже Radeon HD 7970 GHz опережает обе представленные платы Nvidia, так как GPU производства AMD являются более эффективными в этой конкретной задаче. Неудивительно, что они отстают и от представленной Radeon R9 290, причем GTX 780 проиграла новинке более 30%.

Feature Test 4: GPU Cloth

Четвертый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте по идее должна зависеть сразу от нескольких параметров и основными факторами влияния должна являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. Но картина на диаграмме получилась весьма странная, видеокарты Radeon показывают частоту кадров в 125-130 FPS, а результаты обеих Geforce также уперлись в предел, но на уровне около 95-100 FPS.

Вторая модель топового семейства Radeon R9 290 показывает скорость лишь на 4% хуже, чем старшая R9 290X, а плата предыдущего поколения, основанная на чипе Tahiti, расположилась между ними. Еще удивительнее то, что несмотря на то, что геометрическая производительность видеокарт Nvidia должна быть выше, чем у решений конкурента, так как они имеют большее количество соответствующих исполнительных блоков, но и Geforce GTX 780 и GTX 770 уступают всем Radeon. Придется проверять геометрическую производительность в DirectX 11-тестах.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.

А вот во втором геометрическом тесте из 3DMark Vantage ситуация изменилась. В этот раз лидирует новая Radeon R9 290 все так же на 3% отстает от старшей сестры, но уже значительно производительнее своей предшественницы — HD 7970 GHz (она же R9 280X), что говорит об упоре скорее в математическую производительность, нежели геометрическую.

Впрочем, если сравнивать скорость новинки от AMD с конкурирующими Geforce, то новая плата от AMD весьма близка к своему прямому конкуренту в виде GTX 780, и заметно опережает GTX 770. Это — очень хороший результат, ведь ранее синтетические тесты имитации тканей и частиц из тестового пакета 3DMark Vantage, в которых активно используются геометрические шейдеры, показывали, что платы Nvidia значительно опережают конкурирующие модели компании AMD.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических расчетов.

В чисто математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы видим отличающееся распределение результатов, по сравнению с двумя аналогичными тестами из нашего тестового пакета. В этом случае производительность решений явно не соответствует теории и также расходится с тем, что мы видели ранее в математических тестах из пакета RightMark 2.0.

Видеокарты Radeon компании AMD, созданные на базе чипов архитектуры GCN, очень хорошо справляются с подобными задачами и показывают лучшие результаты в случаях, когда выполняется интенсивная «математика». Даже видеоплата Radeon HD 7970 GHz в этом тесте показала отличный результат выше чем Geforce GTX 780, поэтому R9 290 должна легко обойти конкурента.

Впрочем, получилось не так уж легко. Вышедшая сегодня на рынок видеокарта модели Radeon R9 290 показала скорость на 12% медленнее старшей модели R9 290X, что более-менее соответствует теории. Но, если сравнивать результат с лучшей одночиповой моделью предшествующей серии Radeon HD 7970 GHz, то разница совсем невелика. Впрочем, R9 290 все-таки превзошла на 15% чуть более дорогую Geforce GTX 780, не говоря уже о GTX 770, которая и вовсе провалилась, став худшей.

Direct3D 11: Вычислительные шейдеры

Чтобы протестировать новое решение компании AMD в задачах, использующих такие свежие возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы воспользовались примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, Nvidia и AMD.

Сначала мы рассмотрим тесты, использующие вычислительные (Compute) шейдеры. Их появление — одно из наиболее важных нововведений в последних версиях DX API, они уже используются в современных играх для выполнения различных задач: постобработки, симуляций и т. п. В первом тесте показан пример HDR-рендеринга с tone mapping из DirectX SDK, с постобработкой, использующей пиксельные и вычислительные шейдеры.

Скорость расчетов в вычислительном и пиксельном шейдерах для всех плат AMD и Nvidia давно одинаковая, хотя у видеокарт с GPU предыдущих архитектур были различия (любопытно, что у обеих плат на Hawaii она тоже есть, хоть и небольшая). Судя по нашим предыдущим тестам, результаты в задаче явно зависят не только от математической мощи и эффективности вычислений, но и от других факторов, вроде пропускной способности памяти и производительности ROP.

В данном случае скорость видеокарт упирается именно в ПСП. Это понятно уже потому, что новая плата от компании AMD в этом тесте оказалась точно на уровне своей старшей сестры и лишь на 10-15% быстрее одночиповой предшественницы из семейства Radeon HD 7000. Но, новинка от AMD все же опережает конкурирующие модели от Nvidia, особенно важно это в случае прямой конкурентки Geforce GTX 780, которая стоит чуть дороже.

Второй тест вычислительных шейдеров также взят из Microsoft DirectX SDK, в нем показана расчетная задача гравитации N тел (N-body) — симуляция динамической системы частиц, на которую воздействуют физические силы, такие как гравитация.

В случае этого теста расклад сил между решениями разных компаний получился совершенно иной. У решений Nvidia наблюдается явное преимущество в подобных расчетных задачах, а все платы Radeon плохо справляются с ними. Совершенно логично, что в этом тесте побеждает мощнейшая из плат Nvidia карта модели Geforce GTX 780 на топовом GK110, а следом за ней идет вторая плата, уже на базе чипа GK104.

Похоже, что в этом тесте упор не на скорость исполнения простых математических вычислений, а в эффективности выполнения сложного кода с ветвлениями. Удивительно, что обе платы семейства Radeon R9 290 в этой задаче оказались явно слабее Radeon HD 7970 GHz — все-таки в этой задаче эффективность графического чипа Hawaii даже немного ухудшилась, по сравнению с Tahiti, и виновата в этом меньшая тактовая частота более сложного чипа.

Direct3D 11: Производительность тесселяции

Вычислительные шейдеры очень важны, но еще одним важным нововведением в Direct3D 11 считается аппаратная тесселяция. Мы очень подробно рассматривали ее в своей теоретической статье про Nvidia GF100. Тесселяцию уже довольно давно начали использовать в DX11-играх, таких как STALKER: Зов Припяти, DiRT 2, Aliens vs Predator, Metro Last Light, Civilization V, Crysis 3, Battlefield 3 и других. В некоторых из них тесселяция используется для моделей персонажей, в других — для имитации реалистичной водной поверхности или ландшафта.

Существует несколько различных схем разбиения графических примитивов (тесселяции). Например, phong tessellation, PN triangles, Catmull-Clark subdivision. Так, схема разбиения PN Triangles используется в STALKER: Зов Припяти, а в Metro 2033 — Phong tessellation. Эти методы сравнительно быстро и просто внедряются в процесс разработки игр и существующие движки, поэтому и стали популярными.

Первым тестом тесселяции будет пример Detail Tessellation из ATI Radeon SDK. В нем реализована не только тесселяция, но и две разные техники попиксельной обработки: простое наложение карт нормалей и parallax occlusion mapping. Что ж, сравним DX11-решения AMD и Nvidia в различных условиях:

В тесте простого бампмаппинга скорость чаще всего упирается в ПСП, и результат новой видеокарты AMD подтверждает это — он идентичен скорости Radeon R9 290X и примерно на 25% выше скорости модели HD 7970 GHz из предшествующей линейки. Обе Geforce в этом подтесте далеко позади и вряд ли из-за ПСП.

Во втором подтесте с заметно более сложными попиксельными расчетами все несколько интереснее. Эффективность выполнения таких математических вычислений в пиксельных шейдерах у чипов архитектуры GCN выше, чем у Kepler. Обе платы Nvidia проигрывают даже HD 7970 GHz, не говоря уже о новых решениях на Hawaii. Radeon R9 290 на базе нового графического процессора оказался заметно быстрее них, уступив менее 10% старшей модели, что примерно соответствует теории.

В самом интересном тесте с тесселяцией результат новинки также неплохой. Модель R9 290 показала одинаковую с R9 290X очень высокую скорость, опередив прямого соперника Geforce GTX 780. В этом тесте тесселяции разбиение треугольников умеренное и скорость в нем не упирается в производительность блоков обработки геометрии, поэтому скорости обработки треугольников у платы компании AMD вполне хватает, чтобы показывать высокие результаты.

Вторым тестом производительности тесселяции будет еще один пример для 3D-разработчиков из ATI Radeon SDK — PN Triangles. Собственно, оба примера входят также и в состав DX SDK, так что мы уверены, что на их основе создают свой код игровые разработчики. Этот пример мы протестировали с различным коэффициентом разбиения (tessellation factor), чтобы понять, как сильно влияет его изменение на общую производительность.

В этом примере применяется уже более сложная геометрия, поэтому и сравнение геометрической мощи различных решений по этому тесту приносит другие выводы. Все представленные в материале современные решения хорошо справляются с легкой и средней геометрической нагрузкой, показывая высокую скорость, но в тяжелых условиях графические процессоры Nvidia намного производительнее.

Анонсированная сегодня модель Radeon R9 290 основана на таком же чипе Hawaii, что и R9 290X. Он имеет вдвое большее количество геометрических блоков, по сравнению с Tahiti, поэтому обе платы гораздо быстрее карты предыдущего поколения. Разница между R9 290 и HD 7970 GHz составляет чуть ли не 50%, что весьма много. Если сравнивать с платами Nvidia, то R9 290 уступает им только в сложных условиях, когда скорость всех Radeon серьезно падает, в то время как у плат Geforce она остается достаточно высокой.

Рассмотрим результаты еще одного теста — демонстрационной программы Nvidia Realistic Water Terrain, также известной как Island. В этой демке используется тесселяция и карты смещения (displacement mapping) для рендеринга реалистично выглядящей поверхности океана и ландшафта.

Тест Island не является чисто синтетическим тестом для измерения исключительно геометрической производительности GPU, так как он содержит и сложные пиксельные и вычислительные шейдеры в том числе, и такая нагрузка ближе к реальным играм, в которых используются все блоки GPU, а не только геометрические, как в предыдущих тестах геометрии. Впрочем, основной все равно остается именно нагрузка на блоки обработки геометрии.

Мы протестировали решения при четырех разных коэффициентах тесселяции — в данном случае настройка называется Dynamic Tessellation LOD. Если при самом первом коэффициенте разбиения треугольников, когда скорость не ограничена производительностью геометрических блоков, вторая видеокарта из новой топовой серии от компании AMD показывает достаточно высокий результат, но до уровня Geforce GTX 780 не дотягивается даже в этом случае. Ну а при увеличении геометрической работы, платы компании Nvidia вырываются вперед еще дальше, а производительность всех Radeon заметно снижается.

Видеокарты конкурента AMD в этом тесте весьма быстры, и Geforce GTX 780 более чем вдвое производительнее новинки в лице Radeon R9 290 в сложных условиях. Новая же плата Radeon показывает во всех режимах неплохие результаты, прилично обгоняя предыдущую модель Radeon HD 7970 GHz (она же R9 280X), но для соперничества с картами на чипах Nvidia этого все еще не хватает. Впрочем, отметим, что результаты новинки в тестах тесселяции для решения AMD весьма хороши, и в играх с гораздо меньшей геометрической нагрузкой ее возможностей точно хватит.

Выводы по синтетическим тестам

Результаты синтетических тестов видеокарты Radeon R9 290, основанной на мощнейшем графическом процессоре Hawaii и являющейся второй платой топовой серии AMD, а также результаты других моделей видеокарт производства обоих производителей дискретных видеочипов показали, что новая плата Radeon является лишь чуть менее мощной видеокартой по сравнению с более дорогими Radeon R9 290X и Geforce GTX 780. Более того, во многих тестах она не просто успешно сражается с Geforce GTX 780, будучи дешевле, но и опережает ее.

Отставание второй модели семейства Radeon R9 290 от старшей оказалось совсем небольшим, а разница в цене более ощутимая. Неудивительно, что новинка от AMD становится одним из самых выгодных предложений в верхнем ценовом диапазоне по соотношению цены и скорости, и она будет успешно конкурировать с решениями Nvidia. За исключением редких задач, анонсированная сегодня модель отлично выступила по сравнению с Geforce GTX 780, наш набор синтетических тестов показал, что по производительности новый Radeon должен успешно соперничать с Geforce GTX 780 и в играх.

Во второй плате на базе чипа Hawaii никуда не делись сильные стороны этого графического процессора: высокие математическая и текстурная производительность, а особенно — производительность блоков ROP. Более того, при одинаковой с R9 290X пропускной способностью видеопамяти у нее есть явное преимущество по балансу характеристик GPU. Нельзя не упомянуть и серьезно возросшую геометрическую производительность, хотя и не достигшую уровня конкурентов от Nvidia. В играх это не так уж и важно, так как там нет такого объема геометрии, чтобы обнажить эту легкую слабость решений AMD.

В общем, новая модель Radeon R9 290 стала очень интересным предложением для тех энтузиастов, которые хотят играть при максимальных настройках в высоких разрешениях и при этом сэкономить еще немного денег по сравнению с R9 290X. Новая модель видеоплаты от AMD стоит еще дешевле, а разница между ними по скорости вряд ли будет ощутимой в большинстве случаев. Будет очень интересно оценить реальную производительность новинки в играх в следующей части статьи, к которой мы и переходим.

AMD Radeon R9 290 — Часть 3: производительность в игровых тестах →

2 блока питания Corsair CMPSU-1200AXEU для тестового стенда предоставлены компанией Corsair

Корпус Corsair Obsidian 800D Full Tower для тестового стенда предоставлен компанией Corsair

Модули памяти Corsair Vengeance CMZ16GX3M4X1600C9 для тестового стенда предоставлены компанией Corsair

Corsair Hydro SeriesT H100i CPU Cooler для тестового стенда предоставлен компанией Corsair

Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт

Системная плата Asus Sabertooth X79 для тестового стенда предоставлена компанией AsusTeK

Системная плата MSI X79A-GD45(8D) для тестового стенда предоставлена компанией MSI

Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate

Накопитель SSD OCZ Octane 512 ГБ для тестового стенда предоставлен компанией OCZ Russia

2 накопителя SSD Corsair Neutron SeriesT 120 ГБ для тестового стенда предоставлены компанией Corsair

Монитор Asus ProArt PA249Q для рабочего компьютера предоставлен компанией AsusTeK