AMD Radeon HD 7990:

описание видеокарт и результаты синтетических тестов


Содержание

В этой части мы изучим видеокарту, а также познакомимся с результатами синтетических тестов. В нашей лаборатории побывала reference card AMD Radeon HD 7990.

Платы

AMD Radeon HD 7990 2×3072 МБ 2×384-битной GDDR5 PCI-E
  • GPU: 2×Radeon HD 7990 (Tahiti)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs): 1000 МГц (номинал — 1050 МГц)
  • Частота работы памяти (физическая (эффективная)): 1500 (6000) МГц (номинал — 1500 (6000) МГц)
  • Ширина шины обмена с памятью: 2×384 бит
  • Число вычислительных блоков в GPU/частота работы блоков: 2×32/1000 МГц (номинал — 32/1050 МГц)
  • Число операций (ALU) в блоке: 64
  • Суммарное число операций (ALU): 2×2048
  • Число блоков текстурирования: 2×128 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 2×32
  • Размеры: 310×100×36 мм (видеокарта занимает 2 слота в системном блоке)
  • Цвет текстолита: черный
  • Энергопотребление (пиковое в 3D/в режиме 2D/в режиме «сна»): 389/95/3 Вт
  • Выходные гнезда: 1×DVI (Dual-Link/HDMI), 4×mini-DisplayPort 1.2
  • Поддержка многопроцессорной работы: CrossFire X (Hardware)

AMD Radeon HD 7990 2×3072 МБ 2×384-битной GDDR5 PCI-E
Карта имеет 2×3072 МБ памяти GDDR5 SDRAM, размещенной в 24 микросхемах (по 12 на каждой сторонe PCB).

Микросхемы памяти Hynix (GDDR5). Микросхемы рассчитаны на максимальную частоту работы в 1400 (5600) МГц.

Сравнение с эталонным дизайном, вид спереди
AMD Radeon HD 7990 2×3072 МБ 2×384-битной GDDR5 PCI-E Reference card AMD Radeon HD 7970

Сравнение с эталонным дизайном, вид сзади
AMD Radeon HD 7990 2×3072 МБ 2×384-битной GDDR5 PCI-E Reference card AMD Radeon HD 7970

Разумеется, невозможно сравнивать двухпроцессорное решение с однопроцессорным. Однако мы привели эти снимки ради того, чтобы читатели оценили: по сути вот такие две красных карты Radeon HD 7970 содержатся в одном HD 7990. Они уменьшились в размерах, стали компактнее :) и успешно разместились на одной PCB, хоть и весьма длинной. Удивительно, что почему-то Nvidia может умещать два GTX 680 на одной PCB GTX 690, не увеличивая размеров карты, а у AMD это никак не получается. Все предыдущие двухпроцессорные решения компании — HD 5970, HD 6990 — имели такие же длинные PCB. Традиция, однако :) Хотя понятно, что развести две 256-битные шины на одной PCB намного проще, чем две 384-битные шины.

В ускорителе применена композиционная схема питания (общая на всю память и раздельная по ядрам), управляемая цифровыми контроллерами. Это сделано для обеспечения четкого взаимодействия двух GPU в режиме совместной работы в 3D. Кстати, по этой причине нет возможности отключения режима CrossFire (для работы в 3D только одного GPU) в настройках драйверов.

Ускоритель имеет следующий набор гнезд вывода: 1 DVI (Dual-Link, гнездо обладает возможностью через адаптер передавать сигнал на HDMI) и 4 DisplayPort в мини-формате. Напомним, что ускорители AMD достаточно давно обладают собственными звуковыми кодеками, поэтому передача на HDMI-монитор будет полноценной, со звуком. Также уместно напомнить, что возможность одновременного вывода картинки максимально на 3 монитора (каждый до разрешения Full HD), полученная еще серией HD 7xxx, реализована и здесь, и более того, она усилена: можно выводить картинку одновременно на 4 монитора, что может быть востребовано, учитывая высокую производительность данного ускорителя.

Максимальные разрешения и частоты:

  • 240 Гц — максимальная частота обновления;
  • 2048×1536@85 Гц — по аналоговому интерфейсу;
  • 2560×1600@60 Гц — по цифровому интерфейсу (для DVI-гнезд с Dual-Link/HDMI).

Что касается возможностей по ускорению декодирования видео — в 2007 году мы проводили такое исследование, с ним можно ознакомиться здесь.

Карта требует дополнительного питания, причем двумя разъемами с восемью контактами.

О системе охлаждения.

AMD Radeon HD 7990 2×3072 МБ 2×384-битной GDDR5 PCI-E
Основой СО являются испарительные камеры. Две медные камеры прижимаются к каждому из ядер. С другой стороны к ним припаян радиатор из множества ребер, усиленный тепловыми трубками, равномерно распределяющими тепло по радиатору.

Все это объединено единой массивной металлической рамой, служащей радиатором для охлаждения микросхем памяти и транзисторов силового блока.

Сверху радиатор накрыт кожухом с тремя вентиляторами. Казалось бы, СО получилась достаточно мощной и эффективной. Однако опыт показал, что при длительной нагрузке частота вращения вентиляторов поднимается выше 3000 оборотов в минуту, что делает кулер весьма шумным.

Мы провели исследование температурного режима с помощью последней версии утилиты EVGA PrecisionX (автор А. Николайчук AKA Unwinder) и получили следующие результаты.

AMD Radeon HD 7990 2×3072 МБ 2×384-битной GDDR5 PCI-E

После 6 часов прогона карты под максимальной игровой нагрузкой максимальная температура ядра составила 86 градусов, что для такого рода ускорителя неплохой результат. Однако еще раз стоит напомнить, что ценой такого успеха является ощутимый шум СО.

Карта прибыла в ОЕМ-упаковке, поэтому про комплект поставки сказать ничего не можем.

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютеры на базе процессора Intel Core i7-3960X (Socket 2011):
    • 2 процессора Intel Core i7-3960X (o/c 4 ГГц);
    • СО Hydro SeriesT H100i Extreme Performance CPU Cooler;
    • СО Intel Thermal Solution RTS2011LC;
    • системная плата Asus Sabertooth X79 на чипсете Intel X79;
    • системная плата MSI X79A-GD45(8D) на чипсете Intel X79;
    • оперативная память 16 ГБ DDR3 Corsair Vengeance CMZ16GX3M4A1600C9 1600 МГц;
    • жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA2;
    • жесткий диск WD Caviar Blue WD10EZEX 1 TБ SATA2;
    • 2 SSD Corsair Neutron SSD CSSD-N120GB3-BK;
    • 2 блока питания Corsair CMPSU-1200AXEU (1200 Вт);
    • корпус Corsair Obsidian 800D Full-Tower.
  • операционная система Windows 7 64-битная; DirectX 11;
  • монитор Dell UltraSharp U3011 (30″);
  • драйверы AMD версии Catalyst 13.3beta3/13.5; Nvidia версии 314.22

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

В качестве синтетических тестов DirectX 11 мы использовали примеры из пакетов SDK компаний Microsoft и AMD, а также демонстрационную программу Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010). Мы взяли и приложения обоих производителей видеочипов: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain, также известная как Island11.

Синтетические тесты проводились на следующих видеокартах:

  • Radeon HD 7990 со стандартными параметрами (далее HD 7990)
  • Asus ARES II со стандартными параметрами (далее Asus ARES II)
  • Radeon HD 7970 со стандартными параметрами (далее HD 7970)
  • Radeon HD 6990 со стандартными параметрами (далее HD 6990)
  • Geforce GTX Titan со стандартными параметрами (далее GTX Titan)
  • Geforce GTX 690 со стандартными параметрами (далее GTX 690)

Для анализа результатов новой топовой модели видеокарты Radeon HD 7990 именно эти решения были выбраны по следующим причинам. Asus ARES II интересна как более производительный вариант двухчиповой видеокарты на двух GPU, стоящий дороже и потребляющий больше энергии. Radeon HD 7970 интересна, так как это модель на базе одного чипа Tahiti, и по ней мы посмотрим, что даёт нам добавление второго чипа. Ну а Radeon HD 6990 является предшественницей новой модели и покажет разницу между двумя разными поколениями двухчиповых 3D-ускорителей.

От конкурирующей компании Nvidia для сравнения в этот раз были выбраны две видеоплаты — быстрейшие одночиповая и двухчиповая модели. Geforce GTX 690 является основным конкурентом для представленной сегодня Radeon HD 7990, как её полный двухчиповый аналог, а Geforce GTX Titan покажет разницу между лучшей одночиповой платой и быстрейшими двухчиповыми решениями AMD и Nvidia.

Direct3D 9: тесты Pixel Shaders

Тесты текстурирования и заполнения (филлрейта) из пакета 3DMark Vantage мы рассмотрим чуть позже, а первая группа пиксельных шейдеров, которую мы используем, включает в себя различные версии пиксельных программ сравнительно низкой сложности (1.1, 1.4 и 2.0), встречающихся в старых играх, и она очень проста для современных видеочипов.

Тесты довольно простые для современных графических процессоров даже среднебюджетного уровня, а уж про топовые и говорить нечего. Скорость почти всегда упирается в неведомый предел, по крайней мере, на всех двухчиповых видеокартах Radeon, и не всегда она определяется текстурированием или филлрейтом. Эти тесты не способны показать все возможности современных видеокарт и интересны разве что с точки зрения устаревших игровых приложений. Судя по нашим предыдущим сравнениям, производительность в этих тестах часто ограничена филлрейтом.

Новая двухчиповая плата AMD в этом сравнении показала практически максимально возможный результат на уровне ARES II, опередив во всех тестах как обеих соперниц от Nvidia, так и предшественниц в виде HD 7970 и HD 6990. Мощнейшей в сравнении плате Asus она уступила только в одном самом сложном тесте. Посмотрим на результаты более сложных пиксельных программ промежуточных версий:

Тест Cook-Torrance интенсивнее вычислительно, и скорость в нём сильнее зависит от количества ALU и их частоты, но также и от скорости работы TMU. Этот тест исторически лучше подходит для графических решений компании AMD, хотя и платы Geforce на базе GPU архитектуры Kepler в нём также показывают довольно сильные результаты. Но в этот раз двухчиповая новинка AMD слегка обогнала прямого конкурента Geforce GTX 690, не говоря уже об одночиповой Titan.

Так получилось не только в тесте освещения, больше зависящем от скорости ALU, но и в тесте Water, скорость в котором зависит ещё и от текстурирования. Преимущество над решениями Nvidia оказалось ощутимым, а вот ARES II новинка уступила, причём в тесте освещения довольно серьёзно. Вероятно, сказывается разница в оптимизации разных версий драйверов. В любом случае, результат сегодняшней героини от компании AMD весьма неплох, так как конкурирующие решения в этих тестах остались позади.

Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье «Современная терминология 3D-графики».
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

Существует два варианта этих шейдеров: с ориентацией на математические вычисления и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это универсальные тесты, производительность в которых зависит и от скорости блоков ALU, и от скорости текстурирования, также в них важен общий баланс чипа и эффективность исполнения вычислительных программ. Прошлые наши исследования показывают, что в этих конкретных задачах архитектура AMD смотрится несколько лучше графической архитектуры Nvidia.

Так получилось и с Radeon HD 7990, выпущенной сегодня. В тесте «Frozen Glass» скорость больше зависит от математической производительности, поэтому Radeon HD 7990 снова оказывается быстрее обеих видеоплат Nvidia, хотя её скорость явно чем-то ограничена. Интересно, что GTX Titan оказалась быстрее, чем GTX 690 в этом тесте. HD 7990 показывает результат почти на уровне ARES II от Asus, что можно объяснить упором в пропускную способность памяти, к примеру.

Во втором тесте «Parallax Mapping» новая видеокарта Radeon также показала производительность выше, чем у GTX 690 и Titan, причём, разница с последней даже больше — одночиповая карта Nvidia в этом тесте оказалась слабейшей. Что касается сравнения с другими платами на чипах AMD, то тут новинка уступила только аналогичной плате от Asus, имеющей более высокие тактовые частоты. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:

В изменившихся условиях положение плат на чипах производства Nvidia явно чуть улучшилось (особенно это касается двухчиповой GTX 690), и их проигрыш в «математическом» тесте уменьшился. Radeon HD 7990 в одном из тестов показывает результат даже выше уровня теоретически более производительной Asus ARES II, хотя во втором оптимизация драйверов явно подкачала. Так или иначе, но все современные чипы AMD в этих задачах явно работают чуть более эффективно, по сравнению с GPU от Nvidia. Даже HD 6990 обогнал обе Geforce в этих тестах!

Всё это были давно устаревшие задачи, с упором в текстурирование и филлрейт. Далее мы рассмотрим результаты ещё двух тестов пиксельных шейдеров, но уже версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9. Они наиболее показательны с точки зрения современных игр на ПК, среди которых много мультиплатформенных. Тесты отличаются тем, что сильно нагружают и ALU, и текстурные модули, обе шейдерные программы сложны и длинны и включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье «Современная терминология 3D-графики».
  • Fur — процедурный шейдер, визуализирующий мех.

Эти тесты уже не ограничены производительностью текстурных выборок или филлрейтом и больше всего зависят от эффективности исполнения сложного шейдерного кода. В самых тяжёлых DX9-тестах из первой версии пакета RightMark видеокарты производства Nvidia в предыдущие годы были сильнее, но в последних архитектурах решения AMD сильно ускорились (сравните HD 7990 и HD 6990, например), особенно после доводки драйверов.

Поэтому в тесте «Fur», который использует и активное текстурирование, и много математических расчётов, новинка AMD выступила заметно лучше своего основного конкурента в виде GTX 690 и ещё больше обошла одночиповый Titan. В тесте Steep Parallax Mapping разница оказалась ещё значительнее, что объясняется большей математической мощью и явным предпочтением чипами AMD попиксельных вычислений. По сравнению с предыдущими решениями компании, HD 7990 оказалась намного быстрее одночиповой HD 7970 и двухчиповой HD 6990, как и должно было быть, и уступила только ARES II, имеющей большую рабочую частоту и потребление энергии.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два уже знакомых нам теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

В этом тесте производительность зависит в большей степени от количества и эффективности блоков TMU, влияет на скорость и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывают ещё и эффективный филлрейт с пропускной способностью памяти. Результаты при детализации уровня «High» получаются до полутора раз более низкими, чем при «Low».

Ничего не меняется уже который год в задачах процедурной визуализации меха с большим количеством текстурных выборок, в последних поколениях графических архитектур компания AMD сначала сократила разницу с платами Nvidia, а с выпуском GCN вырвалась вперёд. И с тех пор именно платы Radeon являются лидерами таких сравнений, что говорит о высокой эффективности выполнения ими данных шейдерных программ.

Поэтому и результат на диаграмме соответствующий. Новая модель Radeon HD 7990 с большим запасом (более чем двукратным!) обогнала обе модели Geforce, а по сравнению с другими платами на чипах AMD, рассматриваемая нами сегодня модель компании близка к Asus ARES II, немного уступает ей из-за меньшей частоты GPU. HD 7970 и HD 6990 остались далеко позади, вместе с платами Nvidia. Посмотрим на результаты этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: возможно, в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

Ситуация похожа на ту, что мы видели на предыдущей диаграмме, новинка AMD всё так же уступает разве что ARES II, аналогичной по применённой паре графических процессоров. Все остальные решения, включая и обе платы на чипах Nvidia, при включении суперсэмплинга, увеличивающего теоретическую нагрузку вчетверо, заметно отстали — в два раза и более. В подобных вычислениях преимущество явно у чипов компании AMD, предпочитающих попиксельные расчётные задачи.

Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип ещё примерно в два раза — такой режим называется «High».

Диаграмма в целом похожа на предыдущую (также без включения SSAA), но есть и небольшие отличия. Обе платы Geforce смотрятся в этот раз чуть-чуть лучше, разница сократилась, хотя они всё равно справляются с данной задачей хуже конкурирующей видеокарты компании AMD. Новая двухчиповая модель Radeon HD 7990 в обновленном D3D10-варианте теста без суперсэмплинга показала результат, значительно превышающий скорость плат Nvidia. По сравнению с другими платами на чипах Tahiti, новинка снова немного уступила более мощному двухчиповому варианту ARES II, но заметно обогнала одночиповый HD 7970. Посмотрим, что изменит включение суперсэмплинга.

Но и тут всё снова примерно так же, что и в «Fur» — при включении суперсэмплинга и самозатенения задача получается ещё более тяжёлой, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьёзное падение производительности. Разница между скоростными показателями протестированных видеокарт немного изменилась, включение суперсэмплинга сказывается меньше, чем в предыдущем случае.

Asus ARES II так и осталась лидером, но и представленная топовая модель Radeon HD 7990 уступила ей не так уж и много. А вот все графические решения Nvidia в наших D3D10-тестах пиксельных шейдеров работают явно менее эффективно, уступая героине нашего сегодняшнего обзора. Модель HD 7990 показывает скорость вдвое выше, чем одночиповый аналог HD 7970, как и должно быть по теории при эффективной работе CrossFire. Посмотрим, что получится в чисто вычислительных задачах.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты наших предельных математических тестов обычно более-менее соответствуют разнице в частотах и количестве вычислительных блоков, но с влиянием разной эффективности их использования и с учётом оптимизации драйверов. Именно из-за этого, Radeon HD 7990 показал более чем вдвое высокую производительность, по сравнению с одночиповой Radeon HD 7970, которая тестировалась год назад на старых драйверах.

Все архитектуры AMD в этих тестах имеют серьёзное преимущество перед конкурирующими видеокартами Nvidia, разве что в архитектуре Kepler инженеры Nvidia увеличили число потоковых процессоров, несколько сократив отставание по пиковой математической производительности для плат Geforce. И всё же, этого явно недостаточно для того, чтобы даже приблизиться к конкурирующим моделям. Двухчиповая новинка AMD немного отстаёт от «экстремальной» ARES II, но значительно превосходит как GTX 690, так и GTX Titan.

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нём только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Во втором математическом тесте мы видим практически такие же относительные результаты, хотя платы AMD даже ещё немного улучшили своё положение. Рассматриваемая сегодня модель Radeon HD 7990 в этом тесте по скорости также немного не достаёт до изделия Asus, что объясняется разной тактовой частотой установленных GPU. Зато новинка от компании AMD обошла обе конкурирующие платы Geforce и разница между пусть не двукратная, но весьма ощутимая.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаковое для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близкое к двукратному. Задача эта для современных видеокарт не слишком сложная, и производительность в ней ограничена скоростью обработки геометрии и пропускной способностью памяти.

Интересно, что тест геометрии показал совсем иные результаты, чем в предыдущих тестах с попиксельной обработкой. В таких задачах именно видеоплаты Nvidia оказываются несколько производительнее. Но и сегодняшняя новинка в виде Radeon HD 7990 выступила весьма сильно, отстав совсем немного от ARES II и чуть больше уступив двухчиповому конкуренту GTX 690. Одночиповая HD 7970 и устаревшая двухчиповая HD 6990 сильно отстали от всех, а вот одночиповый Titan оказался лишь чуть хуже современных двухчипов по скорости, хотя и имеет лишь один GPU. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры слегка увеличились и для плат AMD, и для решений Nvidia. Видеокарты в данном тесте слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, а поэтому и все выводы остаются прежними. Новая модель Radeon HD 7990 всё так же показывает результаты лишь чуть хуже, чем изделие Asus, и она явно медленнее двухчиповой видеоплаты производства Nvidia, да и Titan в этот раз оказался уже чуть ближе к ней.

К сожалению, но «Hyperlight» — второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load, в котором используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output, вовсе не работает на всех современных видеокартах компании AMD, включая и двухчиповую Radeon HD 7990.

Так что самый интересный геометрический тест, который предполагает большую нагрузку именно на геометрические шейдеры, AMD снова проваливает, а ведь именно в нём всегда наблюдался большой проигрыш видеокарт AMD. В этом тесте единственно важным параметром является производительность геометрических блоков, с которой дела у Nvidia обстоят заметно лучше.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Наши предыдущие исследования показали, что на результаты этого теста может влиять и скорость текстурирования, и пропускная способность памяти, особенно в лёгком режиме. А уж результаты всех представленных в сравнении видеокарт Nvidia ограничены ещё чем-то непонятным, хотя обычно между схожими по классу одночиповыми платами разница в этом тесте зачастую получается весьма небольшой. Но не сейчас, когда двухчиповая GTX 690 показывает явно аномальный результат — похоже, SLI в этом тесте работает плохо.

Собственно, зависимость от качества драйверов видна и по платам AMD. Двухчиповая новинка опередила HD 7970 более чем вдвое именно по причине доработки программной части. Radeon HD 7990 показала близкие к ARES II результаты, и обе они серьёзно обогнали все остальные решения. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Взаимное расположение карт на диаграмме сильно изменилось, особенно в тяжёлом режиме — сравнительные результаты решений компании AMD в нём заметно ухудшились, и одночиповая плата Nvidia Geforce GTX Titan в нём почти догнала Radeon HD 7990! Но что касается среднего и лёгкого режимов, то в них Nvidia продолжает проигрывать. А уж GTX 690 так и вовсе борется лишь с HD 6990 и HD 7970. В целом, можно отметить очень неплохой результат для новинки.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты второго теста вершинного текстурирования «Waves» не похожи на то, что мы видели на предыдущих диаграммах, лишь некоторые тенденции продолжились. Снова по каким-то странным причинам показатели двухчиповой модели Geforce GTX 690 в среднем и тяжёлом режиме оказались крайне низкими, хотя Titan выступила неплохо.

О новинке Radeon HD 7990 можно сказать только хорошее — она почти не отстаёт от Asus ARES II, уступая по тактовой частоте GPU, и заметно опережает одночиповый аналог HD 7970, а также устаревшую двухчиповую модель HD 6990. Причём, новинка AMD хороша во всех режимах, и даже в тяжёлом ушла далеко вперёд от GTX Titan. Рассмотрим второй вариант этого же теста:

С усложнением задачи абсолютная и относительная скорость обеих решений Nvidia стала ещё ниже. Обе Geforce в этих условиях способны конкурировать разве что с Radeon HD 7970 и HD 6990, а обе двухчиповые платы на базе Tahiti не оставляют им никаких шансов. Новая модель Radeon HD 7990 ожидаемо отстала от Asus ARES II, но и только — именно две эти платы оказываются лидерами во всех тестах вершинного текстурирования.

3DMark Vantage: тесты Feature

Синтетические тесты из пакета 3DMark Vantage покажут нам то, что мы ранее упустили. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10 и интересны тем, что отличаются от наших и до сих пор актуальны. При анализе результатов новой видеокарты в этом пакете мы сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark.

Feature Test 1: Texture Fill

Первый тест — тест скорости текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Тест компании Futuremark хоть и не показывает теоретически возможного уровня производительности текстурных выборок, но эффективность видеокарт AMD и Nvidia в нём достаточно высока и сравнительные цифры моделей обычно близки к соответствующим теоретическим параметрам. Пожалуй, только Geforce GTX 690 в этот раз показала результат хуже, чем должна бы, исходя из теории. Скорее всего, дело в низкой эффективности SLI в этом тесте.

Новая двухчиповая видеокарта AMD по текстурированию также отстала от Asus ARES II несколько больше, чем должна бы по теории. Хотя в сравнении с одночиповой Radeon HD 7970 всё в полном порядке. Что касается сравнения скорости Radeon HD 7990 с конкурентами, то она обогнала и прямого соперника Geforce GTX 690, и одночиповую GTX Titan. По скорости блоков TMU новая модель оказалась вполне неплоха и на практике.

Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нём используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

В тесте производительности блоков ROP результат новинки оказался даже несколько сильнее, чем мы ожидали, исходя исключительно из теоретических характеристик. Цифры этого подтеста из 3DMark Vantage показывают производительность блоков ROP с учётом величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), что мы установили в предыдущих сравнениях.

Представленная сегодня модель Radeon HD 7990 по ПСП и филлрейту сильнее, чем соперник в лице Geforce GTX 690, поэтому и результат на практике оказался соответствующим. Про одночиповую GTX Titan и упоминать нет смысла, тут она проигрывает слишком много. Если сравнивать новинку с другими платами на чипах AMD, то она совсем немного уступила Asus ARES II и более чем вдвое опередила одночиповую HD 7970 (видимо, дело в доработанных драйверах последней версии).

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нём рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоёмкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжёлого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчёты освещения по Strauss.

Этот тест отличается от проведённых нами ранее тем, что результаты в нём зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости тут важен верный баланс GPU, а также эффективность выполнения сложных шейдеров. В этом тесте решения AMD обычно выигрывают у видеокарт на чипах производства Nvidia, что получилось и в сегодняшнем сравнении.

Для достижения высокой скорости в тесте важны математическая и текстурная производительность, поэтому в синтетике из 3DMark Vantage новая плата Radeon HD 7990 серьёзно обогнала обеих соперниц производства Nvidia, а также и две предшествующие модели: двухчиповую HD 6990 из старого семейства и одночиповую HD 7970 текущего поколения. А вот сравнение с ARES II обнажило явные проблемы с оптимизацией драйверов для HD 7990 — двухчиповая плата Asus тестировалась на более ранней версии Catalyst и показала заметно лучшую скорость.

Feature Test 4: GPU Cloth

Тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте также зависит сразу от нескольких параметров, но всё же основными факторами влияния являются производительность обработки геометрии и эффективность выполнения геометрических шейдеров, поэтому и картину на диаграмме мы видим обычно такую, что из-за большего количества геометрических блоков видеокарты производства Nvidia чувствуют себя в этом тестировании лучше конкурентов, обгоняя соответствующие по цене платы Radeon.

Но из-за низкой эффективности SLI в этой задаче, Radeon HD 7990 удалось опередить двухчиповую GTX 690 и тут (удивительно, но GTX Titan отстала от GTX 690 совсем немного). А ведь это ранее был один из тех тестов, в которых видно преимущество решений Nvidia, имеющих улучшенный геометрический конвейер. Рассматриваемая нами сегодня модель Radeon опередила почти все представленные в сравнении платы, кроме ARES II, видеочипы в которой работают на повышенной частоте. Одночиповая Radeon HD 7970, кстати, показала сравнительно низкий результат из-за того, что со временем драйверы Catalyst были серьёзно оптимизированы.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчётами, также тестируется stream out.

Рассмотрим ещё один тест из 3DMark Vantage, относящийся к геометрии, но несколько иной. В этот раз Geforce GTX 690 уже ближе к двухчиповым решениям AMD, но всё же плата Nvidia отстаёт от них. Одночиповый Titan снова неплохо себя показал, лишь немного отставая от GTX 690 (но ещё вопрос — то ли GK110 такой хороший, то ли SLI плохо работает).

Главная героиня сегодняшнего сравнения снова оказалась очень близко к двухчиповой же Asus ARES II, уступив ей совсем немного, что легко объяснимо с теоретической точки зрения. Оба варианта Geforce она обошла, да и одночиповый Radeon HD 7970 снова отстал более чем вдвое. Всё-таки видеоплате GTX 690 от Nvidia в таких тестах явно не хватает эффективности SLI, ведь одночиповые варианты сильнее конкурентов и опережают их в подобных задачах.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических расчётов.

В чисто математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных вычислительных задачах, мы видим иное распределение результатов, по сравнению с двумя аналогичными тестами из нашего тестового пакета. В этом случае производительность решений не полностью соответствует теории, да ещё и расходится с тем, что мы видели ранее в математических тестах из пакета RightMark 2.0.

Особенно это касается именно представленной сегодня модели — Radeon HD 7990. В этом тесте обоснованные претензии у нас уже есть не только к эффективности работы SLI, но и к CrossFire. Причём, программисты AMD «сломали» что-то именно в драйверах для HD 7990, так как ARES II показывает ожидаемые результаты, более чем вдвое превосходящие скорость одночипового аналога HD 7970, GPU которого работает на меньшей частоте.

Но даже в этом случае Radeon HD 7990 не уступила соперникам от Nvidia, опередив обе представленные в сравнении платы. Впрочем, она должна быть ещё сильнее в этом тесте, ведь нам давно известно, что все видеокарты Radeon, созданные на базе чипов архитектуры GCN, очень хорошо справляются с подобными задачами и почти всегда показывают лучшие результаты в случаях, когда выполняется сравнительно простая, но весьма интенсивная математика.

Direct3D 11: Вычислительные шейдеры

Чтобы протестировать новое решение компании AMD в задачах, использующих такие новые возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы воспользовались примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, Nvidia и AMD.

Сначала мы рассмотрим тесты, использующие вычислительные (Compute) шейдеры. Их появление — одно из наиболее важных нововведений в последних версиях DX API, они уже используются в современных играх для выполнения различных задач: постобработки, симуляций и т. п. В первом тесте показан пример HDR-рендеринга с tone mapping из DirectX SDK, с постобработкой, использующей пиксельные и вычислительные шейдеры.

Конечно, это не самый удачный пример для вычислительных шейдеров, но разницу в производительности в одной из конкретных задач он показывает. Скорость расчётов в вычислительном и пиксельном шейдерах для всех плат давно одинаковая, это у видеокарт с GPU ранних поколений были различия, которых давно нет. Судя по нашим предыдущим исследованиям, результаты в задаче явно зависят не только от математической мощи и эффективности вычислений, но и от других факторов, вроде ПСП и производительности ROP.

Увы, но полноценного сравнения с Geforce GTX 690 тут не получится — SLI отработала не просто неэффективно, но даже с обратным знаком. А сравнение новой топовой платы от компании AMD в этом тесте с GTX Titan уж больно неравноценное. Кроме того, Titan недалеко ушёл от одночиповой HD 7970, что уж говорить про двухчиповую HD 7990. Которая, кстати, снова лишь чуть-чуть отстала от ARES II. Хороший результат.

Второй тест вычислительных шейдеров также взят из Microsoft DirectX SDK, в нём показана расчётная задача гравитации N тел (N-body) — симуляция динамической системы частиц, на которую воздействуют физические силы, такие как гравитация.

В этом случае сложилась совершенно иная картина. Как мы выяснили ранее, у решений Nvidia есть некоторое преимущество в подобных сложных расчётных задачах. Кроме этого, многочиповые решения в этой задаче работают плохо (а SLI так просто отвратительно) и поэтому в этом тесте Geforce GTX Titan одержала победу со значительным превосходством над всеми решениями.

Все решения AMD выстроились по линейке, согласно частоте GPU. Так как у ARES II она выше, то эта видеокарта и вышла немного вперёд. Но разница между всеми Radeon незначительна, так как CrossFire тут просто не работает. Переходим к тестам производительности в задачах тесселяции — интересно, сможет ли двухчиповая новинка конкурировать с традиционно сильными в этих задачах решениями Nvidia?

Direct3D 11: Производительность тесселяции

Вычислительные шейдеры очень важны, но ещё одним важным нововведением в Direct3D 11 считается аппаратная тесселяция. Мы очень подробно рассматривали её в своей теоретической статье про Nvidia GF100. Тесселяцию уже довольно давно начали использовать в DX11-играх, таких как STALKER: Зов Припяти, DiRT 2, Aliens vs Predator, Metro 2033, Civilization V, Crysis 2, Battlefield 3 и других. В некоторых из них тесселяция используется для моделей персонажей, в других — для имитации реалистичной водной поверхности или ландшафта.

Существует несколько различных схем разбиения графических примитивов (тесселяции). Например, phong tessellation, PN triangles, Catmull-Clark subdivision. Так, схема разбиения PN Triangles используется в STALKER: Зов Припяти, а в Metro 2033 — Phong tessellation. Эти методы сравнительно быстро и просто внедряются в процесс разработки игр и существующие движки, поэтому и стали популярными.

Первым тестом тесселяции будет пример Detail Tessellation из ATI Radeon SDK. В нём реализована не только тесселяция, но и две разные техники попиксельной обработки: простое наложение карт нормалей и parallax occlusion mapping. Что ж, сравним DX11-решения AMD и Nvidia в различных условиях:

В тесте простого бампмаппинга видеоплаты чаще всего упираются в ПСП, что и видно по результатам мощнейших двухчиповых решений на графических процессорах AMD. Новинка из семейства Radeon HD 7000 несильно отстала от ARES II и обходит главного соперника в лице Geforce GTX 690. Одночиповый Titan самый медленный, но тоже неподалёку.

Во втором подтесте со сложными попиксельными расчётами новая плата уже сильнее уступила своей сестре от Asus, зато и опережение GTX 690 стало куда заметнее. А уж одночиповый GTX Titan так и вовсе показал результат лишь на уровне одночиповой же Radeon HD 7970. Снова подтвердили ранее высказанное нами мнение о том, что эффективность выполнения сложных математических вычислений в пиксельных шейдерах у чипов архитектуры GCN несколько выше.

Да и в тесте с тесселяцией результат Radeon HD 7990 также получился очень хорошим — вместе с Asus ARES II они упёрлись в ПСП или производительность ROP, показав почти те же цифры, что и в тесте простого бампмаппинга. А вот у видеокарт производства Nvidia всё не так радужно, они сильно отстали. Это объясняется тем, что в данном тесте тесселяции разбиение треугольников весьма умеренное и скорость в нём не упирается в производительность блоков обработки геометрии.

Вторым тестом производительности тесселяции будет ещё один пример для 3D-разработчиков из ATI Radeon SDK — PN Triangles. Собственно, оба примера входят также и в состав DX SDK, так что мы уверены, что на их основе создают свой код игровые разработчики. Этот пример мы протестировали с различным коэффициентом разбиения (tessellation factor), чтобы понять, как сильно влияет его изменение на общую производительность.

А вот в этом примере применяется уже куда более сложная геометрия, и сравнение геометрической мощи различных решений по этому тесту явно более полезно и приносит совсем другие выводы. Хотя все представленные в материале топовые платы хорошо справляются с лёгкой и средней геометрической нагрузкой, показывая достаточно высокую скорость, в тяжёлых условиях графические процессоры Nvidia всё же остаются непревзойдёнными.

Хотя и новинка показала отличный результат, незначительно отстав от более производительной и дорогой платы Asus. В лёгких условиях она даже обошла обе Geforce, но в двух сложных режимах всё же уступила им. Причём, отставание в самом тяжёлом режиме чуть ли не четырёхкратное. И всё же, можно отметить очень хороший результат для видеокарты на графических процессорах AMD.

Рассмотрим результаты ещё одного теста — демонстрационной программы Nvidia Realistic Water Terrain, также известной как Island. В этой демке используется тесселяция и карты смещения (displacement mapping) для рендеринга реалистично выглядящей поверхности океана и ландшафта.

Тест Island не является чисто синтетическим тестом для измерения исключительно геометрической производительности GPU, так как он содержит и сложные пиксельные и вычислительные шейдеры в том числе, и такая нагрузка ближе к реальным играм, в которых используются все блоки GPU, а не только геометрические, как в предыдущих тестах геометрии.

Мы протестировали данную программу при четырёх разных коэффициентах тесселяции (в данном случае настройка называется Dynamic Tessellation LOD). Если при самом первом коэффициенте разбиения треугольников, когда скорость не ограничена производительностью геометрических блоков, сильнейшими в сравнении оказываются видеокарты на двух чипах Tahiti от компании AMD, то при увеличении геометрической работы платы компании Nvidia вырываются вперёд, а производительность всех плат Radeon заметно падает.

Хотя в текущей архитектуре компании AMD геометрическая производительность чипов была улучшена, в соответствующих синтетических тестах они всё ещё заметно проигрывают решениям Nvidia. И всё же отметим очень хорошее выступление Radeon HD 7990 в тестах тесселяции. Новая плата этой компании показывает довольно сильные результаты даже в задачах со сложнейшей геометрией и шейдерами, лишь немного уступая GTX Titan. Понятно, что у GTX 690 результаты ещё выше — всё точно так, как и должно быть по теории.

Подводя итоги синтетических тестов модели Radeon HD 7990 и её конкурентов, можно сказать, что новое решение компании AMD является одним из самых производительных на рынке, и оно должно успешно конкурировать с соответствующей видеокартой от Nvidia на базе двух чипов GK104. Но у этой компании есть ещё и мощнейшая одночиповая Geforce GTX Titan, которая в некоторых условиях может иметь преимущество, если не по цене, то по производительности в приложениях, недостаточно хорошо оптимизированных для многочиповых решений.

С выпуском Radeon HD 7990 в верхней ценовой категории рынка видеокарт стало на одного игрока больше. Новинка должна стать довольно выгодным приобретением для энтузиастов, производительности которого хватит для всех современных 3D-игр даже в сверхвысоких разрешениях с учётом некоторого запаса на будущее. В следующей части статьи мы проверим производительность новой модели и в игровых приложениях, чтобы подтвердить наши выводы.

AMD Radeon HD 7990 — Часть 3: производительность в игровых тестах →

2 блока питания Corsair CMPSU-1200AXEU для тестового стенда предоставлены компанией Corsair

Корпус Corsair Obsidian 800D-Full Tower для тестового стенда предоставлен компанией Corsair

Модули памяти Corsair Vengeance CMZ16GX3M4X1600C9 для тестового стенда предоставлены компанией Corsair

Corsair Hydro SeriesT H100i CPU Cooler для тестового стенда предоставлен компанией Corsair

Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт

Системная плата Asus Sabertooth X79 для тестового стенда предоставлена компанией AsusTeK

Системная плата MSI X79A-GD45(8D) для тестового стенда предоставлена компанией MSI

Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate

Накопитель SSD OCZ Octane 512 ГБ для тестового стенда предоставлен компанией OCZ Russia

2 накопителя SSD Corsair Neutron SeriesT 120 ГБ для тестового стенда предоставлены компанией Corsair




Дополнительно

Обзор нового видеоускорителя AMD Radeon HD 7990. Часть 2 — Особенности видеокарты, результаты синтетических тестов

AMD Radeon HD 7990:

описание видеокарт и результаты синтетических тестов

Содержание

В этой части мы изучим видеокарту, а также познакомимся с результатами синтетических тестов. В нашей лаборатории побывала reference card AMD Radeon HD 7990.

Платы

AMD Radeon HD 7990 2×3072 МБ 2×384-битной GDDR5 PCI-E
  • GPU: 2×Radeon HD 7990 (Tahiti)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs): 1000 МГц (номинал — 1050 МГц)
  • Частота работы памяти (физическая (эффективная)): 1500 (6000) МГц (номинал — 1500 (6000) МГц)
  • Ширина шины обмена с памятью: 2×384 бит
  • Число вычислительных блоков в GPU/частота работы блоков: 2×32/1000 МГц (номинал — 32/1050 МГц)
  • Число операций (ALU) в блоке: 64
  • Суммарное число операций (ALU): 2×2048
  • Число блоков текстурирования: 2×128 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 2×32
  • Размеры: 310×100×36 мм (видеокарта занимает 2 слота в системном блоке)
  • Цвет текстолита: черный
  • Энергопотребление (пиковое в 3D/в режиме 2D/в режиме «сна»): 389/95/3 Вт
  • Выходные гнезда: 1×DVI (Dual-Link/HDMI), 4×mini-DisplayPort 1.2
  • Поддержка многопроцессорной работы: CrossFire X (Hardware)

AMD Radeon HD 7990 2×3072 МБ 2×384-битной GDDR5 PCI-E
Карта имеет 2×3072 МБ памяти GDDR5 SDRAM, размещенной в 24 микросхемах (по 12 на каждой сторонe PCB).

Микросхемы памяти Hynix (GDDR5). Микросхемы рассчитаны на максимальную частоту работы в 1400 (5600) МГц.

Сравнение с эталонным дизайном, вид спереди
AMD Radeon HD 7990 2×3072 МБ 2×384-битной GDDR5 PCI-E Reference card AMD Radeon HD 7970

Сравнение с эталонным дизайном, вид сзади
AMD Radeon HD 7990 2×3072 МБ 2×384-битной GDDR5 PCI-E Reference card AMD Radeon HD 7970

Разумеется, невозможно сравнивать двухпроцессорное решение с однопроцессорным. Однако мы привели эти снимки ради того, чтобы читатели оценили: по сути вот такие две красных карты Radeon HD 7970 содержатся в одном HD 7990. Они уменьшились в размерах, стали компактнее :) и успешно разместились на одной PCB, хоть и весьма длинной. Удивительно, что почему-то Nvidia может умещать два GTX 680 на одной PCB GTX 690, не увеличивая размеров карты, а у AMD это никак не получается. Все предыдущие двухпроцессорные решения компании — HD 5970, HD 6990 — имели такие же длинные PCB. Традиция, однако :) Хотя понятно, что развести две 256-битные шины на одной PCB намного проще, чем две 384-битные шины.

В ускорителе применена композиционная схема питания (общая на всю память и раздельная по ядрам), управляемая цифровыми контроллерами. Это сделано для обеспечения четкого взаимодействия двух GPU в режиме совместной работы в 3D. Кстати, по этой причине нет возможности отключения режима CrossFire (для работы в 3D только одного GPU) в настройках драйверов.

Ускоритель имеет следующий набор гнезд вывода: 1 DVI (Dual-Link, гнездо обладает возможностью через адаптер передавать сигнал на HDMI) и 4 DisplayPort в мини-формате. Напомним, что ускорители AMD достаточно давно обладают собственными звуковыми кодеками, поэтому передача на HDMI-монитор будет полноценной, со звуком. Также уместно напомнить, что возможность одновременного вывода картинки максимально на 3 монитора (каждый до разрешения Full HD), полученная еще серией HD 7xxx, реализована и здесь, и более того, она усилена: можно выводить картинку одновременно на 4 монитора, что может быть востребовано, учитывая высокую производительность данного ускорителя.

Максимальные разрешения и частоты:

  • 240 Гц — максимальная частота обновления;
  • 2048×1536@85 Гц — по аналоговому интерфейсу;
  • 2560×1600@60 Гц — по цифровому интерфейсу (для DVI-гнезд с Dual-Link/HDMI).

Что касается возможностей по ускорению декодирования видео — в 2007 году мы проводили такое исследование, с ним можно ознакомиться здесь.

Карта требует дополнительного питания, причем двумя разъемами с восемью контактами.

О системе охлаждения.

AMD Radeon HD 7990 2×3072 МБ 2×384-битной GDDR5 PCI-E
Основой СО являются испарительные камеры. Две медные камеры прижимаются к каждому из ядер. С другой стороны к ним припаян радиатор из множества ребер, усиленный тепловыми трубками, равномерно распределяющими тепло по радиатору.

Все это объединено единой массивной металлической рамой, служащей радиатором для охлаждения микросхем памяти и транзисторов силового блока.

Сверху радиатор накрыт кожухом с тремя вентиляторами. Казалось бы, СО получилась достаточно мощной и эффективной. Однако опыт показал, что при длительной нагрузке частота вращения вентиляторов поднимается выше 3000 оборотов в минуту, что делает кулер весьма шумным.

Мы провели исследование температурного режима с помощью последней версии утилиты EVGA PrecisionX (автор А. Николайчук AKA Unwinder) и получили следующие результаты.

AMD Radeon HD 7990 2×3072 МБ 2×384-битной GDDR5 PCI-E

После 6 часов прогона карты под максимальной игровой нагрузкой максимальная температура ядра составила 86 градусов, что для такого рода ускорителя неплохой результат. Однако еще раз стоит напомнить, что ценой такого успеха является ощутимый шум СО.

Карта прибыла в ОЕМ-упаковке, поэтому про комплект поставки сказать ничего не можем.

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютеры на базе процессора Intel Core i7-3960X (Socket 2011):
    • 2 процессора Intel Core i7-3960X (o/c 4 ГГц);
    • СО Hydro SeriesT H100i Extreme Performance CPU Cooler;
    • СО Intel Thermal Solution RTS2011LC;
    • системная плата Asus Sabertooth X79 на чипсете Intel X79;
    • системная плата MSI X79A-GD45(8D) на чипсете Intel X79;
    • оперативная память 16 ГБ DDR3 Corsair Vengeance CMZ16GX3M4A1600C9 1600 МГц;
    • жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA2;
    • жесткий диск WD Caviar Blue WD10EZEX 1 TБ SATA2;
    • 2 SSD Corsair Neutron SSD CSSD-N120GB3-BK;
    • 2 блока питания Corsair CMPSU-1200AXEU (1200 Вт);
    • корпус Corsair Obsidian 800D Full-Tower.
  • операционная система Windows 7 64-битная; DirectX 11;
  • монитор Dell UltraSharp U3011 (30″);
  • драйверы AMD версии Catalyst 13.3beta3/13.5; Nvidia версии 314.22

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

В качестве синтетических тестов DirectX 11 мы использовали примеры из пакетов SDK компаний Microsoft и AMD, а также демонстрационную программу Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010). Мы взяли и приложения обоих производителей видеочипов: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain, также известная как Island11.

Синтетические тесты проводились на следующих видеокартах:

  • Radeon HD 7990 со стандартными параметрами (далее HD 7990)
  • Asus ARES II со стандартными параметрами (далее Asus ARES II)
  • Radeon HD 7970 со стандартными параметрами (далее HD 7970)
  • Radeon HD 6990 со стандартными параметрами (далее HD 6990)
  • Geforce GTX Titan со стандартными параметрами (далее GTX Titan)
  • Geforce GTX 690 со стандартными параметрами (далее GTX 690)

Для анализа результатов новой топовой модели видеокарты Radeon HD 7990 именно эти решения были выбраны по следующим причинам. Asus ARES II интересна как более производительный вариант двухчиповой видеокарты на двух GPU, стоящий дороже и потребляющий больше энергии. Radeon HD 7970 интересна, так как это модель на базе одного чипа Tahiti, и по ней мы посмотрим, что даёт нам добавление второго чипа. Ну а Radeon HD 6990 является предшественницей новой модели и покажет разницу между двумя разными поколениями двухчиповых 3D-ускорителей.

От конкурирующей компании Nvidia для сравнения в этот раз были выбраны две видеоплаты — быстрейшие одночиповая и двухчиповая модели. Geforce GTX 690 является основным конкурентом для представленной сегодня Radeon HD 7990, как её полный двухчиповый аналог, а Geforce GTX Titan покажет разницу между лучшей одночиповой платой и быстрейшими двухчиповыми решениями AMD и Nvidia.

Direct3D 9: тесты Pixel Shaders

Тесты текстурирования и заполнения (филлрейта) из пакета 3DMark Vantage мы рассмотрим чуть позже, а первая группа пиксельных шейдеров, которую мы используем, включает в себя различные версии пиксельных программ сравнительно низкой сложности (1.1, 1.4 и 2.0), встречающихся в старых играх, и она очень проста для современных видеочипов.

Тесты довольно простые для современных графических процессоров даже среднебюджетного уровня, а уж про топовые и говорить нечего. Скорость почти всегда упирается в неведомый предел, по крайней мере, на всех двухчиповых видеокартах Radeon, и не всегда она определяется текстурированием или филлрейтом. Эти тесты не способны показать все возможности современных видеокарт и интересны разве что с точки зрения устаревших игровых приложений. Судя по нашим предыдущим сравнениям, производительность в этих тестах часто ограничена филлрейтом.

Новая двухчиповая плата AMD в этом сравнении показала практически максимально возможный результат на уровне ARES II, опередив во всех тестах как обеих соперниц от Nvidia, так и предшественниц в виде HD 7970 и HD 6990. Мощнейшей в сравнении плате Asus она уступила только в одном самом сложном тесте. Посмотрим на результаты более сложных пиксельных программ промежуточных версий:

Тест Cook-Torrance интенсивнее вычислительно, и скорость в нём сильнее зависит от количества ALU и их частоты, но также и от скорости работы TMU. Этот тест исторически лучше подходит для графических решений компании AMD, хотя и платы Geforce на базе GPU архитектуры Kepler в нём также показывают довольно сильные результаты. Но в этот раз двухчиповая новинка AMD слегка обогнала прямого конкурента Geforce GTX 690, не говоря уже об одночиповой Titan.

Так получилось не только в тесте освещения, больше зависящем от скорости ALU, но и в тесте Water, скорость в котором зависит ещё и от текстурирования. Преимущество над решениями Nvidia оказалось ощутимым, а вот ARES II новинка уступила, причём в тесте освещения довольно серьёзно. Вероятно, сказывается разница в оптимизации разных версий драйверов. В любом случае, результат сегодняшней героини от компании AMD весьма неплох, так как конкурирующие решения в этих тестах остались позади.

Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье «Современная терминология 3D-графики».
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

Существует два варианта этих шейдеров: с ориентацией на математические вычисления и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это универсальные тесты, производительность в которых зависит и от скорости блоков ALU, и от скорости текстурирования, также в них важен общий баланс чипа и эффективность исполнения вычислительных программ. Прошлые наши исследования показывают, что в этих конкретных задачах архитектура AMD смотрится несколько лучше графической архитектуры Nvidia.

Так получилось и с Radeon HD 7990, выпущенной сегодня. В тесте «Frozen Glass» скорость больше зависит от математической производительности, поэтому Radeon HD 7990 снова оказывается быстрее обеих видеоплат Nvidia, хотя её скорость явно чем-то ограничена. Интересно, что GTX Titan оказалась быстрее, чем GTX 690 в этом тесте. HD 7990 показывает результат почти на уровне ARES II от Asus, что можно объяснить упором в пропускную способность памяти, к примеру.

Во втором тесте «Parallax Mapping» новая видеокарта Radeon также показала производительность выше, чем у GTX 690 и Titan, причём, разница с последней даже больше — одночиповая карта Nvidia в этом тесте оказалась слабейшей. Что касается сравнения с другими платами на чипах AMD, то тут новинка уступила только аналогичной плате от Asus, имеющей более высокие тактовые частоты. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:

В изменившихся условиях положение плат на чипах производства Nvidia явно чуть улучшилось (особенно это касается двухчиповой GTX 690), и их проигрыш в «математическом» тесте уменьшился. Radeon HD 7990 в одном из тестов показывает результат даже выше уровня теоретически более производительной Asus ARES II, хотя во втором оптимизация драйверов явно подкачала. Так или иначе, но все современные чипы AMD в этих задачах явно работают чуть более эффективно, по сравнению с GPU от Nvidia. Даже HD 6990 обогнал обе Geforce в этих тестах!

Всё это были давно устаревшие задачи, с упором в текстурирование и филлрейт. Далее мы рассмотрим результаты ещё двух тестов пиксельных шейдеров, но уже версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9. Они наиболее показательны с точки зрения современных игр на ПК, среди которых много мультиплатформенных. Тесты отличаются тем, что сильно нагружают и ALU, и текстурные модули, обе шейдерные программы сложны и длинны и включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье «Современная терминология 3D-графики».
  • Fur — процедурный шейдер, визуализирующий мех.

Эти тесты уже не ограничены производительностью текстурных выборок или филлрейтом и больше всего зависят от эффективности исполнения сложного шейдерного кода. В самых тяжёлых DX9-тестах из первой версии пакета RightMark видеокарты производства Nvidia в предыдущие годы были сильнее, но в последних архитектурах решения AMD сильно ускорились (сравните HD 7990 и HD 6990, например), особенно после доводки драйверов.

Поэтому в тесте «Fur», который использует и активное текстурирование, и много математических расчётов, новинка AMD выступила заметно лучше своего основного конкурента в виде GTX 690 и ещё больше обошла одночиповый Titan. В тесте Steep Parallax Mapping разница оказалась ещё значительнее, что объясняется большей математической мощью и явным предпочтением чипами AMD попиксельных вычислений. По сравнению с предыдущими решениями компании, HD 7990 оказалась намного быстрее одночиповой HD 7970 и двухчиповой HD 6990, как и должно было быть, и уступила только ARES II, имеющей большую рабочую частоту и потребление энергии.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два уже знакомых нам теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

В этом тесте производительность зависит в большей степени от количества и эффективности блоков TMU, влияет на скорость и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывают ещё и эффективный филлрейт с пропускной способностью памяти. Результаты при детализации уровня «High» получаются до полутора раз более низкими, чем при «Low».

Ничего не меняется уже который год в задачах процедурной визуализации меха с большим количеством текстурных выборок, в последних поколениях графических архитектур компания AMD сначала сократила разницу с платами Nvidia, а с выпуском GCN вырвалась вперёд. И с тех пор именно платы Radeon являются лидерами таких сравнений, что говорит о высокой эффективности выполнения ими данных шейдерных программ.

Поэтому и результат на диаграмме соответствующий. Новая модель Radeon HD 7990 с большим запасом (более чем двукратным!) обогнала обе модели Geforce, а по сравнению с другими платами на чипах AMD, рассматриваемая нами сегодня модель компании близка к Asus ARES II, немного уступает ей из-за меньшей частоты GPU. HD 7970 и HD 6990 остались далеко позади, вместе с платами Nvidia. Посмотрим на результаты этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: возможно, в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

Ситуация похожа на ту, что мы видели на предыдущей диаграмме, новинка AMD всё так же уступает разве что ARES II, аналогичной по применённой паре графических процессоров. Все остальные решения, включая и обе платы на чипах Nvidia, при включении суперсэмплинга, увеличивающего теоретическую нагрузку вчетверо, заметно отстали — в два раза и более. В подобных вычислениях преимущество явно у чипов компании AMD, предпочитающих попиксельные расчётные задачи.

Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип ещё примерно в два раза — такой режим называется «High».

Диаграмма в целом похожа на предыдущую (также без включения SSAA), но есть и небольшие отличия. Обе платы Geforce смотрятся в этот раз чуть-чуть лучше, разница сократилась, хотя они всё равно справляются с данной задачей хуже конкурирующей видеокарты компании AMD. Новая двухчиповая модель Radeon HD 7990 в обновленном D3D10-варианте теста без суперсэмплинга показала результат, значительно превышающий скорость плат Nvidia. По сравнению с другими платами на чипах Tahiti, новинка снова немного уступила более мощному двухчиповому варианту ARES II, но заметно обогнала одночиповый HD 7970. Посмотрим, что изменит включение суперсэмплинга.

Но и тут всё снова примерно так же, что и в «Fur» — при включении суперсэмплинга и самозатенения задача получается ещё более тяжёлой, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьёзное падение производительности. Разница между скоростными показателями протестированных видеокарт немного изменилась, включение суперсэмплинга сказывается меньше, чем в предыдущем случае.

Asus ARES II так и осталась лидером, но и представленная топовая модель Radeon HD 7990 уступила ей не так уж и много. А вот все графические решения Nvidia в наших D3D10-тестах пиксельных шейдеров работают явно менее эффективно, уступая героине нашего сегодняшнего обзора. Модель HD 7990 показывает скорость вдвое выше, чем одночиповый аналог HD 7970, как и должно быть по теории при эффективной работе CrossFire. Посмотрим, что получится в чисто вычислительных задачах.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты наших предельных математических тестов обычно более-менее соответствуют разнице в частотах и количестве вычислительных блоков, но с влиянием разной эффективности их использования и с учётом оптимизации драйверов. Именно из-за этого, Radeon HD 7990 показал более чем вдвое высокую производительность, по сравнению с одночиповой Radeon HD 7970, которая тестировалась год назад на старых драйверах.

Все архитектуры AMD в этих тестах имеют серьёзное преимущество перед конкурирующими видеокартами Nvidia, разве что в архитектуре Kepler инженеры Nvidia увеличили число потоковых процессоров, несколько сократив отставание по пиковой математической производительности для плат Geforce. И всё же, этого явно недостаточно для того, чтобы даже приблизиться к конкурирующим моделям. Двухчиповая новинка AMD немного отстаёт от «экстремальной» ARES II, но значительно превосходит как GTX 690, так и GTX Titan.

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нём только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Во втором математическом тесте мы видим практически такие же относительные результаты, хотя платы AMD даже ещё немного улучшили своё положение. Рассматриваемая сегодня модель Radeon HD 7990 в этом тесте по скорости также немного не достаёт до изделия Asus, что объясняется разной тактовой частотой установленных GPU. Зато новинка от компании AMD обошла обе конкурирующие платы Geforce и разница между пусть не двукратная, но весьма ощутимая.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаковое для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близкое к двукратному. Задача эта для современных видеокарт не слишком сложная, и производительность в ней ограничена скоростью обработки геометрии и пропускной способностью памяти.

Интересно, что тест геометрии показал совсем иные результаты, чем в предыдущих тестах с попиксельной обработкой. В таких задачах именно видеоплаты Nvidia оказываются несколько производительнее. Но и сегодняшняя новинка в виде Radeon HD 7990 выступила весьма сильно, отстав совсем немного от ARES II и чуть больше уступив двухчиповому конкуренту GTX 690. Одночиповая HD 7970 и устаревшая двухчиповая HD 6990 сильно отстали от всех, а вот одночиповый Titan оказался лишь чуть хуже современных двухчипов по скорости, хотя и имеет лишь один GPU. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры слегка увеличились и для плат AMD, и для решений Nvidia. Видеокарты в данном тесте слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, а поэтому и все выводы остаются прежними. Новая модель Radeon HD 7990 всё так же показывает результаты лишь чуть хуже, чем изделие Asus, и она явно медленнее двухчиповой видеоплаты производства Nvidia, да и Titan в этот раз оказался уже чуть ближе к ней.

К сожалению, но «Hyperlight» — второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load, в котором используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output, вовсе не работает на всех современных видеокартах компании AMD, включая и двухчиповую Radeon HD 7990.

Так что самый интересный геометрический тест, который предполагает большую нагрузку именно на геометрические шейдеры, AMD снова проваливает, а ведь именно в нём всегда наблюдался большой проигрыш видеокарт AMD. В этом тесте единственно важным параметром является производительность геометрических блоков, с которой дела у Nvidia обстоят заметно лучше.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Наши предыдущие исследования показали, что на результаты этого теста может влиять и скорость текстурирования, и пропускная способность памяти, особенно в лёгком режиме. А уж результаты всех представленных в сравнении видеокарт Nvidia ограничены ещё чем-то непонятным, хотя обычно между схожими по классу одночиповыми платами разница в этом тесте зачастую получается весьма небольшой. Но не сейчас, когда двухчиповая GTX 690 показывает явно аномальный результат — похоже, SLI в этом тесте работает плохо.

Собственно, зависимость от качества драйверов видна и по платам AMD. Двухчиповая новинка опередила HD 7970 более чем вдвое именно по причине доработки программной части. Radeon HD 7990 показала близкие к ARES II результаты, и обе они серьёзно обогнали все остальные решения. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Взаимное расположение карт на диаграмме сильно изменилось, особенно в тяжёлом режиме — сравнительные результаты решений компании AMD в нём заметно ухудшились, и одночиповая плата Nvidia Geforce GTX Titan в нём почти догнала Radeon HD 7990! Но что касается среднего и лёгкого режимов, то в них Nvidia продолжает проигрывать. А уж GTX 690 так и вовсе борется лишь с HD 6990 и HD 7970. В целом, можно отметить очень неплохой результат для новинки.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты второго теста вершинного текстурирования «Waves» не похожи на то, что мы видели на предыдущих диаграммах, лишь некоторые тенденции продолжились. Снова по каким-то странным причинам показатели двухчиповой модели Geforce GTX 690 в среднем и тяжёлом режиме оказались крайне низкими, хотя Titan выступила неплохо.

О новинке Radeon HD 7990 можно сказать только хорошее — она почти не отстаёт от Asus ARES II, уступая по тактовой частоте GPU, и заметно опережает одночиповый аналог HD 7970, а также устаревшую двухчиповую модель HD 6990. Причём, новинка AMD хороша во всех режимах, и даже в тяжёлом ушла далеко вперёд от GTX Titan. Рассмотрим второй вариант этого же теста:

С усложнением задачи абсолютная и относительная скорость обеих решений Nvidia стала ещё ниже. Обе Geforce в этих условиях способны конкурировать разве что с Radeon HD 7970 и HD 6990, а обе двухчиповые платы на базе Tahiti не оставляют им никаких шансов. Новая модель Radeon HD 7990 ожидаемо отстала от Asus ARES II, но и только — именно две эти платы оказываются лидерами во всех тестах вершинного текстурирования.

3DMark Vantage: тесты Feature

Синтетические тесты из пакета 3DMark Vantage покажут нам то, что мы ранее упустили. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10 и интересны тем, что отличаются от наших и до сих пор актуальны. При анализе результатов новой видеокарты в этом пакете мы сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark.

Feature Test 1: Texture Fill

Первый тест — тест скорости текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Тест компании Futuremark хоть и не показывает теоретически возможного уровня производительности текстурных выборок, но эффективность видеокарт AMD и Nvidia в нём достаточно высока и сравнительные цифры моделей обычно близки к соответствующим теоретическим параметрам. Пожалуй, только Geforce GTX 690 в этот раз показала результат хуже, чем должна бы, исходя из теории. Скорее всего, дело в низкой эффективности SLI в этом тесте.

Новая двухчиповая видеокарта AMD по текстурированию также отстала от Asus ARES II несколько больше, чем должна бы по теории. Хотя в сравнении с одночиповой Radeon HD 7970 всё в полном порядке. Что касается сравнения скорости Radeon HD 7990 с конкурентами, то она обогнала и прямого соперника Geforce GTX 690, и одночиповую GTX Titan. По скорости блоков TMU новая модель оказалась вполне неплоха и на практике.

Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нём используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

В тесте производительности блоков ROP результат новинки оказался даже несколько сильнее, чем мы ожидали, исходя исключительно из теоретических характеристик. Цифры этого подтеста из 3DMark Vantage показывают производительность блоков ROP с учётом величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), что мы установили в предыдущих сравнениях.

Представленная сегодня модель Radeon HD 7990 по ПСП и филлрейту сильнее, чем соперник в лице Geforce GTX 690, поэтому и результат на практике оказался соответствующим. Про одночиповую GTX Titan и упоминать нет смысла, тут она проигрывает слишком много. Если сравнивать новинку с другими платами на чипах AMD, то она совсем немного уступила Asus ARES II и более чем вдвое опередила одночиповую HD 7970 (видимо, дело в доработанных драйверах последней версии).

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нём рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоёмкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжёлого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчёты освещения по Strauss.

Этот тест отличается от проведённых нами ранее тем, что результаты в нём зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости тут важен верный баланс GPU, а также эффективность выполнения сложных шейдеров. В этом тесте решения AMD обычно выигрывают у видеокарт на чипах производства Nvidia, что получилось и в сегодняшнем сравнении.

Для достижения высокой скорости в тесте важны математическая и текстурная производительность, поэтому в синтетике из 3DMark Vantage новая плата Radeon HD 7990 серьёзно обогнала обеих соперниц производства Nvidia, а также и две предшествующие модели: двухчиповую HD 6990 из старого семейства и одночиповую HD 7970 текущего поколения. А вот сравнение с ARES II обнажило явные проблемы с оптимизацией драйверов для HD 7990 — двухчиповая плата Asus тестировалась на более ранней версии Catalyst и показала заметно лучшую скорость.

Feature Test 4: GPU Cloth

Тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте также зависит сразу от нескольких параметров, но всё же основными факторами влияния являются производительность обработки геометрии и эффективность выполнения геометрических шейдеров, поэтому и картину на диаграмме мы видим обычно такую, что из-за большего количества геометрических блоков видеокарты производства Nvidia чувствуют себя в этом тестировании лучше конкурентов, обгоняя соответствующие по цене платы Radeon.

Но из-за низкой эффективности SLI в этой задаче, Radeon HD 7990 удалось опередить двухчиповую GTX 690 и тут (удивительно, но GTX Titan отстала от GTX 690 совсем немного). А ведь это ранее был один из тех тестов, в которых видно преимущество решений Nvidia, имеющих улучшенный геометрический конвейер. Рассматриваемая нами сегодня модель Radeon опередила почти все представленные в сравнении платы, кроме ARES II, видеочипы в которой работают на повышенной частоте. Одночиповая Radeon HD 7970, кстати, показала сравнительно низкий результат из-за того, что со временем драйверы Catalyst были серьёзно оптимизированы.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчётами, также тестируется stream out.

Рассмотрим ещё один тест из 3DMark Vantage, относящийся к геометрии, но несколько иной. В этот раз Geforce GTX 690 уже ближе к двухчиповым решениям AMD, но всё же плата Nvidia отстаёт от них. Одночиповый Titan снова неплохо себя показал, лишь немного отставая от GTX 690 (но ещё вопрос — то ли GK110 такой хороший, то ли SLI плохо работает).

Главная героиня сегодняшнего сравнения снова оказалась очень близко к двухчиповой же Asus ARES II, уступив ей совсем немного, что легко объяснимо с теоретической точки зрения. Оба варианта Geforce она обошла, да и одночиповый Radeon HD 7970 снова отстал более чем вдвое. Всё-таки видеоплате GTX 690 от Nvidia в таких тестах явно не хватает эффективности SLI, ведь одночиповые варианты сильнее конкурентов и опережают их в подобных задачах.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических расчётов.

В чисто математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных вычислительных задачах, мы видим иное распределение результатов, по сравнению с двумя аналогичными тестами из нашего тестового пакета. В этом случае производительность решений не полностью соответствует теории, да ещё и расходится с тем, что мы видели ранее в математических тестах из пакета RightMark 2.0.

Особенно это касается именно представленной сегодня модели — Radeon HD 7990. В этом тесте обоснованные претензии у нас уже есть не только к эффективности работы SLI, но и к CrossFire. Причём, программисты AMD «сломали» что-то именно в драйверах для HD 7990, так как ARES II показывает ожидаемые результаты, более чем вдвое превосходящие скорость одночипового аналога HD 7970, GPU которого работает на меньшей частоте.

Но даже в этом случае Radeon HD 7990 не уступила соперникам от Nvidia, опередив обе представленные в сравнении платы. Впрочем, она должна быть ещё сильнее в этом тесте, ведь нам давно известно, что все видеокарты Radeon, созданные на базе чипов архитектуры GCN, очень хорошо справляются с подобными задачами и почти всегда показывают лучшие результаты в случаях, когда выполняется сравнительно простая, но весьма интенсивная математика.

Direct3D 11: Вычислительные шейдеры

Чтобы протестировать новое решение компании AMD в задачах, использующих такие новые возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы воспользовались примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, Nvidia и AMD.

Сначала мы рассмотрим тесты, использующие вычислительные (Compute) шейдеры. Их появление — одно из наиболее важных нововведений в последних версиях DX API, они уже используются в современных играх для выполнения различных задач: постобработки, симуляций и т. п. В первом тесте показан пример HDR-рендеринга с tone mapping из DirectX SDK, с постобработкой, использующей пиксельные и вычислительные шейдеры.

Конечно, это не самый удачный пример для вычислительных шейдеров, но разницу в производительности в одной из конкретных задач он показывает. Скорость расчётов в вычислительном и пиксельном шейдерах для всех плат давно одинаковая, это у видеокарт с GPU ранних поколений были различия, которых давно нет. Судя по нашим предыдущим исследованиям, результаты в задаче явно зависят не только от математической мощи и эффективности вычислений, но и от других факторов, вроде ПСП и производительности ROP.

Увы, но полноценного сравнения с Geforce GTX 690 тут не получится — SLI отработала не просто неэффективно, но даже с обратным знаком. А сравнение новой топовой платы от компании AMD в этом тесте с GTX Titan уж больно неравноценное. Кроме того, Titan недалеко ушёл от одночиповой HD 7970, что уж говорить про двухчиповую HD 7990. Которая, кстати, снова лишь чуть-чуть отстала от ARES II. Хороший результат.

Второй тест вычислительных шейдеров также взят из Microsoft DirectX SDK, в нём показана расчётная задача гравитации N тел (N-body) — симуляция динамической системы частиц, на которую воздействуют физические силы, такие как гравитация.

В этом случае сложилась совершенно иная картина. Как мы выяснили ранее, у решений Nvidia есть некоторое преимущество в подобных сложных расчётных задачах. Кроме этого, многочиповые решения в этой задаче работают плохо (а SLI так просто отвратительно) и поэтому в этом тесте Geforce GTX Titan одержала победу со значительным превосходством над всеми решениями.

Все решения AMD выстроились по линейке, согласно частоте GPU. Так как у ARES II она выше, то эта видеокарта и вышла немного вперёд. Но разница между всеми Radeon незначительна, так как CrossFire тут просто не работает. Переходим к тестам производительности в задачах тесселяции — интересно, сможет ли двухчиповая новинка конкурировать с традиционно сильными в этих задачах решениями Nvidia?

Direct3D 11: Производительность тесселяции

Вычислительные шейдеры очень важны, но ещё одним важным нововведением в Direct3D 11 считается аппаратная тесселяция. Мы очень подробно рассматривали её в своей теоретической статье про Nvidia GF100. Тесселяцию уже довольно давно начали использовать в DX11-играх, таких как STALKER: Зов Припяти, DiRT 2, Aliens vs Predator, Metro 2033, Civilization V, Crysis 2, Battlefield 3 и других. В некоторых из них тесселяция используется для моделей персонажей, в других — для имитации реалистичной водной поверхности или ландшафта.

Существует несколько различных схем разбиения графических примитивов (тесселяции). Например, phong tessellation, PN triangles, Catmull-Clark subdivision. Так, схема разбиения PN Triangles используется в STALKER: Зов Припяти, а в Metro 2033 — Phong tessellation. Эти методы сравнительно быстро и просто внедряются в процесс разработки игр и существующие движки, поэтому и стали популярными.

Первым тестом тесселяции будет пример Detail Tessellation из ATI Radeon SDK. В нём реализована не только тесселяция, но и две разные техники попиксельной обработки: простое наложение карт нормалей и parallax occlusion mapping. Что ж, сравним DX11-решения AMD и Nvidia в различных условиях:

В тесте простого бампмаппинга видеоплаты чаще всего упираются в ПСП, что и видно по результатам мощнейших двухчиповых решений на графических процессорах AMD. Новинка из семейства Radeon HD 7000 несильно отстала от ARES II и обходит главного соперника в лице Geforce GTX 690. Одночиповый Titan самый медленный, но тоже неподалёку.

Во втором подтесте со сложными попиксельными расчётами новая плата уже сильнее уступила своей сестре от Asus, зато и опережение GTX 690 стало куда заметнее. А уж одночиповый GTX Titan так и вовсе показал результат лишь на уровне одночиповой же Radeon HD 7970. Снова подтвердили ранее высказанное нами мнение о том, что эффективность выполнения сложных математических вычислений в пиксельных шейдерах у чипов архитектуры GCN несколько выше.

Да и в тесте с тесселяцией результат Radeon HD 7990 также получился очень хорошим — вместе с Asus ARES II они упёрлись в ПСП или производительность ROP, показав почти те же цифры, что и в тесте простого бампмаппинга. А вот у видеокарт производства Nvidia всё не так радужно, они сильно отстали. Это объясняется тем, что в данном тесте тесселяции разбиение треугольников весьма умеренное и скорость в нём не упирается в производительность блоков обработки геометрии.

Вторым тестом производительности тесселяции будет ещё один пример для 3D-разработчиков из ATI Radeon SDK — PN Triangles. Собственно, оба примера входят также и в состав DX SDK, так что мы уверены, что на их основе создают свой код игровые разработчики. Этот пример мы протестировали с различным коэффициентом разбиения (tessellation factor), чтобы понять, как сильно влияет его изменение на общую производительность.

А вот в этом примере применяется уже куда более сложная геометрия, и сравнение геометрической мощи различных решений по этому тесту явно более полезно и приносит совсем другие выводы. Хотя все представленные в материале топовые платы хорошо справляются с лёгкой и средней геометрической нагрузкой, показывая достаточно высокую скорость, в тяжёлых условиях графические процессоры Nvidia всё же остаются непревзойдёнными.

Хотя и новинка показала отличный результат, незначительно отстав от более производительной и дорогой платы Asus. В лёгких условиях она даже обошла обе Geforce, но в двух сложных режимах всё же уступила им. Причём, отставание в самом тяжёлом режиме чуть ли не четырёхкратное. И всё же, можно отметить очень хороший результат для видеокарты на графических процессорах AMD.

Рассмотрим результаты ещё одного теста — демонстрационной программы Nvidia Realistic Water Terrain, также известной как Island. В этой демке используется тесселяция и карты смещения (displacement mapping) для рендеринга реалистично выглядящей поверхности океана и ландшафта.

Тест Island не является чисто синтетическим тестом для измерения исключительно геометрической производительности GPU, так как он содержит и сложные пиксельные и вычислительные шейдеры в том числе, и такая нагрузка ближе к реальным играм, в которых используются все блоки GPU, а не только геометрические, как в предыдущих тестах геометрии.

Мы протестировали данную программу при четырёх разных коэффициентах тесселяции (в данном случае настройка называется Dynamic Tessellation LOD). Если при самом первом коэффициенте разбиения треугольников, когда скорость не ограничена производительностью геометрических блоков, сильнейшими в сравнении оказываются видеокарты на двух чипах Tahiti от компании AMD, то при увеличении геометрической работы платы компании Nvidia вырываются вперёд, а производительность всех плат Radeon заметно падает.

Хотя в текущей архитектуре компании AMD геометрическая производительность чипов была улучшена, в соответствующих синтетических тестах они всё ещё заметно проигрывают решениям Nvidia. И всё же отметим очень хорошее выступление Radeon HD 7990 в тестах тесселяции. Новая плата этой компании показывает довольно сильные результаты даже в задачах со сложнейшей геометрией и шейдерами, лишь немного уступая GTX Titan. Понятно, что у GTX 690 результаты ещё выше — всё точно так, как и должно быть по теории.

Подводя итоги синтетических тестов модели Radeon HD 7990 и её конкурентов, можно сказать, что новое решение компании AMD является одним из самых производительных на рынке, и оно должно успешно конкурировать с соответствующей видеокартой от Nvidia на базе двух чипов GK104. Но у этой компании есть ещё и мощнейшая одночиповая Geforce GTX Titan, которая в некоторых условиях может иметь преимущество, если не по цене, то по производительности в приложениях, недостаточно хорошо оптимизированных для многочиповых решений.

С выпуском Radeon HD 7990 в верхней ценовой категории рынка видеокарт стало на одного игрока больше. Новинка должна стать довольно выгодным приобретением для энтузиастов, производительности которого хватит для всех современных 3D-игр даже в сверхвысоких разрешениях с учётом некоторого запаса на будущее. В следующей части статьи мы проверим производительность новой модели и в игровых приложениях, чтобы подтвердить наши выводы.

AMD Radeon HD 7990 — Часть 3: производительность в игровых тестах →

2 блока питания Corsair CMPSU-1200AXEU для тестового стенда предоставлены компанией Corsair

Корпус Corsair Obsidian 800D-Full Tower для тестового стенда предоставлен компанией Corsair

Модули памяти Corsair Vengeance CMZ16GX3M4X1600C9 для тестового стенда предоставлены компанией Corsair

Corsair Hydro SeriesT H100i CPU Cooler для тестового стенда предоставлен компанией Corsair

Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт

Системная плата Asus Sabertooth X79 для тестового стенда предоставлена компанией AsusTeK

Системная плата MSI X79A-GD45(8D) для тестового стенда предоставлена компанией MSI

Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate

Накопитель SSD OCZ Octane 512 ГБ для тестового стенда предоставлен компанией OCZ Russia

2 накопителя SSD Corsair Neutron SeriesT 120 ГБ для тестового стенда предоставлены компанией Corsair