AMD Radeon HD 6790

описание видеокарты и результаты синтетических тестов


Содержание

В этой части, как обычно, мы изучим саму видеокарту, а также познакомимся с результатами синтетических тестов.

Плата

AMD Radeon HD 6790 1024 MБ 256-битной GDDR5, PCI-E
  • GPU: Radeon HD 6790 (Barts)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs) (МГц): 840 (номинал — 840)
  • Частоты работы памяти (физическая (эффективная)): 1050 (4200) МГц (номинал — 1050 (4200) МГц)
  • Ширина шины обмена с памятью (бит): 256
  • Число вычислительных блоков в GPU/частота работы блоков (МГц): 200/840 (номинал — 200/840)
  • Число операций (ALU) в блоке: 4
  • Суммарное число операций (ALU): 600
  • Число блоков текстурирования: 40 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 16
  • Размеры (мм): 210×100×33 (последняя величина — максимальная толщина видеокарты)
  • Цвет текстолита: черный
  • RAMDACs/TMDS: интегрированы в GPU
  • Выходные гнезда: 2×DVI (Dual-Link/HDMI), 2×Display Port, 1×HDMI
  • Поддержка многопроцессорной работы: CrossFire (Hardware)

AMD Radeon HD 6790 1024 MБ 256-битной GDDR5, PCI-E
Карта имеет 1024 МБ памяти GDDR5 SDRAM, размещенной в восьми микросхемах на лицевой сторонe PCB.

Микросхемы памяти Hynix (GDDR5). Микросхемы рассчитаны на максимальную частоту работы в 1250 (5000) МГц.

Сравнение с эталонным дизайном, вид спереди
AMD Radeon HD 6790 1024 MБ 256-битной GDDR5, PCI-E Reference card AMD Radeon HD 6850

Сравнение с эталонным дизайном, вид сзади
AMD Radeon HD 6790 1024 MБ 256-битной GDDR5, PCI-E Reference card AMD Radeon HD 6850

Понятно, что из-за равной ширины шины обмена с памятью карты 6790 и 6850 очень похожи. А вообще, открою вам тайну, на 6790 установлен тот же чип под кодовым названием Barts, что и у 6850 и 6870. Просто вырезана часть блоков (ALU, ROP, TMU), а частота поднята почти до уровня 6870. Поэтому, как мы видим, у 6790 два разъема питания, а у 6850 — один. И потребление у 6790 выше. Очевидно, что таким путем избавляются от брака среди выпущенных кристаллов Barts.

Подключение к аналоговым мониторам с d-Sub (VGA) производится через специальные адаптеры-переходники DVI-to-d-Sub. Что касается вывода на HDMI, то продукт также обладает такой возможностью. Кроме того, у карты есть и 2 Display Port (но требуется переходник с mini-DP).

Максимальные разрешения и частоты:

  • 240 Гц максимальная частота обновления
  • 2048×1536@85 Гц — по аналоговому интерфейсу
  • 2560×1600@60 Гц — по цифровому интерфейсу (для DVI-гнезд с Dual-Link/HDMI)

По поводу HDTV. Одно из исследований также проведено, и с ним можно ознакомиться здесь.

Следует еще раз особо упомянуть, что все семейство Radeon HD 6xxx позволяет выводить картинку игры одновременно на три монитора, и даже в стереорежиме (пока это в отладочном режиме). При этом обязательно требуется наличие как минимум одного приемника с Display Port. Впрочем, для карт с такой производительностью, как у 6790, это малоактуально.

Напомню, что карта требует дополнительного питания, причем двумя 6-контактными разъемами.

О системе охлаждения.

AMD Radeon HD 6790 1024 MБ 256-битной GDDR5, PCI-E
СО по своему принципу схожа с той, что мы видели у Radeon HD 6850.

СО состоит из двух частей: центрального кулера, который охлаждает ядро и микросхемы памяти, и кожуха.

Прибор цилиндрического типа — на одном конце закреплен цилиндрический вентилятор, прогоняющий воздух через радиатор, установленный на ядре. Несмотря на медную подошву, сам радиатор небольшой. В целом устройство довольно тихое, и явно говорит о том, что нагрев ядра не столь велик.

Мы провели исследование температурного режима с помощью утилиты MSI Afterburner (автор А. Николайчук AKA Unwinder) и получили следующие результаты:

AMD Radeon HD 6790 1024 MБ 256-битной GDDR5, PCI-E

Как и ожидалось, столь массивная СО прекрасно справилась со своей работой. И ядро после 8-часовой работы под нагрузкой нагрелось лишь до 66 градусов.

Видеокарта прибыла к нам без упаковки и комплекта, потому данный вопрос мы опускаем.

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютер на базе Intel Core i7-975 (Socket 1366)
    • процессор Intel Core i7-975 (3340 МГц);
    • системная плата Asus P6T Deluxe на чипсете Intel X58;
    • оперативная память 6 ГБ DDR3 SDRAM Corsair 1600 МГц;
    • жесткий диск WD Caviar SE WD1600JD 160 ГБ SATA;
    • блок питания Tagan TG900-BZ 900 Вт.
  • операционная система Windows 7 64 бит SP1; DirectX 11;
  • монитор Dell 3007WFP (30″);
  • драйверы ATI версии Catalyst 11.4 beta; Nvidia версии 267.24/267.26/267.59/267.71.

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать по ссылкам:

  • D3D RightMark Beta 4 (1050) с описанием на сайте http://3d.rightmark.org.
  • D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 — тесты пиксельных шейдеров версий 2.0 и 3.0 ссылка.
  • RightMark3D 2.0 с кратким описанием: Vista без SP1, Vista c SP1.

Для работы RightMark3D 2.0 также требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

Синтетические тесты проводились на следующих видеокартах:

  • Radeon HD 6790 со стандартными параметрами (далее HD 6790)
  • Radeon HD 6870 со стандартными параметрами (далее HD 6870)
  • Radeon HD 6850 со стандартными параметрами (далее HD 6850)
  • Radeon HD 5770 со стандартными параметрами (далее HD 5770)
  • Geforce GTX 550 Ti со стандартными параметрами (далее GTX 550 Ti)
  • Geforce GTX 460 со стандартными параметрами, модель с 1 ГБ видеопамяти (далее GTX 460)

Для сравнения результатов новой модели Radeon HD 6790 мы выбрали именно эти видеокарты по следующим причинам: две видеокарты серии Radeon HD 6800 основаны на одном и том же GPU, но в разных версиях с отличающимся количеством исполнительных блоков и частотами. И хотя цены на эти решения выше, чем на представленную модель, будет любопытно увидеть, насколько сильно сказалось усечение чипа. Ну а Radeon HD 5770 выбран потому, что он в линейке компании AMD стоит ниже вышедшей видеокарты.

Выбор из списка видеокарт Nvidia обоснован тем, что Geforce GTX 550 Ti является наиболее близким по цене решением конкурирующей компании, да и GTX 460 с 1 ГБ памяти — это схожее по стоимости и теоретическим характеристикам решение Nvidia из предыдущей линейки, всё ещё широко продающееся на рынке в различных вариантах.

Direct3D 9: тесты Pixel Filling

В тесте определяется пиковая производительность выборки текстур (texel rate) в режиме FFP для разного числа текстур, накладываемых на один пиксель:

В тесте текстурной производительности все видеокарты традиционно показывают цифры, далёкие от теоретически возможных значений, и мы их перепроверим ещё раз в аналогичном тесте из пакета 3DMark Vantage. Результаты нашей синтетики для Radeon HD 6790 не дотягивают до пиковых значений, по ней получается, что новая видеокарта выбирает до 34 текселя за один такт из 32-битных текстур при билинейной фильтрации в этом тесте, что несколько ниже теоретической цифры в 40 отфильтрованных текселей.

А вот по сравнению с другими видеоплатами по скорости текстурирования новый Radeon оказался весьма неплох. Интересно, что результаты Radeon HD 5770, HD 6850 и анонсированной HD 6790 в этом тесте весьма близки, и лишь Radeon HD 6870 вырвалась вперёд. Что немудрено, так как она имеет лучшие теоретические показатели производительности, да и самую высокую цену.

Все чипы AMD работают в этом тесте эффективнее своих конкурентов. Выпущенная сегодня Radeon HD 6790 с большим запасом опережает оба решения Nvidia, в том числе и свежую GTX 550 Ti, во всех режимах с любым количеством накладываемых на пиксель текстур. Рассмотрим тест филлрейта:

Второй синтетический тест показывает скорость заполнения, в нём мы видим всё то же самое, но уже с учётом количества записанных в буфер кадра пикселей. На диаграмме отлично видно ограничение скорости рендеринга у всех решений AMD и Nvidia в условиях вплоть до четырёх текстур включительно.

Понятно, что максимальный результат остаётся за старшим решением линейки Radeon HD 6800, стоящей дороже, но и все остальные видеокарты AMD справляются с задачей отлично. Интересно, что в простых условиях лучший результат показывает Radeon HD 5770, а HD 6870 выходит вперёд лишь в сложных подтестах.

Direct3D 9: тесты Pixel Shaders

Первая группа пиксельных шейдеров, которую мы рассматриваем, очень проста для современных видеочипов, она включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся в старых играх.

Тесты пиксельных шейдеров младших версий весьма и весьма просты для современных GPU, и производительность в них ограничена по большей части скоростью текстурных модулей, с учётом эффективности блоков и кэширования. В предыдущих исследованиях мы отмечали также и некоторое влияние ПСП видеопамяти.

Интересно, что новый Radeon HD 6790 показывает результат на уровне HD 5770, а не HD 6850, что говорит об упоре в текстурирование и филлрейт. Хотя от новой модели мы ожидали несколько большего, чтобы она расположилась хотя бы посередине между HD 5770 и HD 6850. Зато, если брать сравнение с видеокартами Nvidia, то мы снова наблюдаем выигрыш новой платы AMD во всех представленных подтестах.

В самых простых шейдерах разница между GTX 550 Ti и HD 6790 составила 30-50% в пользу новой модели от компании AMD. Мы видим, что в сравнительно лёгких тестах важнее всего скорость текстурирования, и по этому параметру видеокарты Nvidia проигрывают своим конкурентам. Посмотрим на результаты более сложных пиксельных программ промежуточных версий:

В сильно зависящем от скорости текстурирования тесте процедурной визуализации воды «Water» используется зависимая выборка из текстур больших уровней вложенности, и поэтому карты в нём также располагаются по скорости текстурирования, но с большим влиянием эффективности кэширования данных. В этом тесте Radeon HD 6790 показал результат лишь на уровне HD 5770, уступив даже одной из видеокарт Nvidia — GTX 460. Самой быстрой логично стала HD 6870, а наиболее медленной оказалась GTX 550 Ti от Nvidia. В целом, видеокарты AMD всё так же пока что остаются впереди во всех тестах, хотя разница в этот раз уже не столь велика.

Результаты второго подтеста отличаются. Он более интенсивен вычислительно, и в нём уже сказывается ещё и влияние математической производительности. Поэтому тест гораздо лучше подходит для видеокарт AMD, обладающих большим количеством блоков ALU, в дополнение к высокой текстурной производительности. Хотя HD 6790 снова показал скорость лишь на уровне HD 5770, этого хватило для того, чтобы с запасом обогнать обе конкурирующие модели.

Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье Современная терминология 3D графики.
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

Существует два варианта этих шейдеров: с ориентацией на математические вычисления, и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это универсальные тесты, зависящие и от скорости блоков ALU и от скорости текстурирования, в них важен общий баланс чипа. Производительность видеокарт в тесте «Frozen Glass» весьма схожа с той, что мы видели выше в «Cook-Torrance», но новая модель Radeon HD 6790 выступила лучше, опередив не только HD 5770, но и HD 6850 (правда, тут разницей можно пренебречь). Вероятно, в этом тесте прослеживается ещё и влияние ПСП видеопамяти.

Понятно, что GTX 550 Ti и GTX 460 уступили новой плате, да и все решения компании AMD оказались впереди. Результаты второго теста «Parallax Mapping» мало чем отличаются от предыдущих. Новое решение на основе чипа Barts снова опередило Radeon HD 5770, но в этот раз показало вполне оправданный результат между HD 6850 и HD 5770. Оба решения Nvidia остались далеко позади, им не хватает математической и текстурной производительности. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:

Относительное положение на диаграмме почти не изменилось, новое решение в одном из тестов показало результат на уровне HD 6850, а во втором — примерно как HD 5770. Лидером осталась модель HD 6870, а решения Nvidia привычно проигрывают в любых DirectX 9 тестах, так как в скорости текстурирования им особо нечем хвастать.

Но всё это были устаревшие задачи, в основном с упором в текстурирование или филлрейт. А сейчас мы рассмотрим результаты ещё двух тестов пиксельных шейдеров — версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9 API, которые намного показательнее с точки зрения современных игр на ПК. Эти тесты отличаются тем, что сильнее нагружают и ALU, и текстурные модули, обе шейдерные программы сложные и длинные, включают большое количество ветвлений.

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье Современная терминология 3D графики.
  • Fur — процедурный шейдер, визуализирующий мех.

Важно, что именно эти два теста пиксельных шейдеров версии 3.0 из всего подраздела наиболее адекватно показывают примерную расстановку графических решений по скорости рендеринга в играх. И с этими тестами у нового решения Nvidia дела обстоят гораздо лучше. Оба представленных теста довольно сложны, результаты в нём мало зависят от ПСП и текстурирования, и являются математическими, но с большим количеством переходов и ветвлений.

К сожалению, в первом тесте (Fur) представленная сегодня модель Radeon HD 6790 показала результат лишь на уровне HD 5770, а во втором (Steep Parallax Mapping) оказалась чуть сильнее устаревшей модели прошлого поколения. Что касается сравнения с платами Nvidia, то в первом тесте новое решение уступило обоим конкурентам, а во втором успешно соперничает с Geforce GTX 550 Ti. Тягаться с более производительным GTX 460 в этом тесте у Radeon HD 6790 не получается. Хотя результат для нового решения всё равно неплохой, ведь раньше в этом разделе мы чаще всего констатировали успех видеоплат производства компании Nvidia.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два знакомых PS 3.0 теста под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами, при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в этом тесте зависит не только от количества и эффективности блоков TMU, но и от величины филлрейта. Результаты в режиме «High» получаются примерно в полтора раза ниже, чем в «Low», как и должно быть по теории. В Direct3D 10 тестах процедурной визуализации меха с большим количеством текстурных выборок решения Nvidia ранее были весьма сильны, но, начиная с архитектуры Cypress, видеоплаты AMD показывают результаты не хуже, а то и лучше.

Так получилось и в этот раз, новая видеокарта AMD лишь немного отстаёт от лидирующего Radeon HD 6870, идёт вровень с HD 6850 и значительно опережает HD 5770. Видеокарты Nvidia в этом тесте способны конкурировать лишь с младшим решением AMD, поэтому анонсированной сегодня модели они серьёзно уступают. Скорее всего, на скорость рендеринга сильное влияние оказывает ПСП, так как этот показатель у HD 6790 весьма высок.

Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза, возможно в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять иначе:

Включение суперсэмплинга увеличивает теоретическую нагрузку вчетверо, и в таком случае решения Nvidia сдают свои и так хилые позиции, а видеокарты AMD выглядят ещё сильнее. Теперь новый Radeon серии HD 6700 немного уступает модели HD 6850, но всё так же сильно опережает HD 5770. Последнее явственно указывает на то, что производительность в тесте ограничивается не столько производительностью ROP, которая у HD 6790 не слишком высока, по сравнению с HD 5770, а в большей степени пропускной способностью памяти.

Второй тест, измеряющий производительность выполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок, называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением, число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше, по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Этот тест интереснее с практической точки зрения, так как многие разновидности parallax mapping давно применяются в играх, а тяжелые варианты, вроде нашего steep parallax mapping используются во многих проектах, например, в играх серий Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить и самозатенение, увеличивающее нагрузку на видеочип примерно в два раза — такой режим называется «High».

Диаграмма в целом похожа на предыдущую, тоже без сглаживания методом суперсэмплинга, результаты близки и по абсолютным цифрам. В обновленном варианте данного теста без включения суперсэмплинга, новая модель Radeon HD 6790 снова справляется с задачей значительно лучше платы HD 5770, и почти на уровне HD 6850.

Нужно ли вновь упоминать о том, что обе карты Nvidia безнадёжно отстали от всех видеокарт производства AMD, кроме самой слабой Radeon HD 5770, с которой конкурирует только Geforce GTX 460. Лидером по понятным причинам продолжает оставаться HD 6870, основанная на том же чипе Barts, но полноценном. Сразу видно, что данная видеокарта имеет явно более высокую производительность и цену. Посмотрим, что изменит включение суперсэмплинга.

При включении SSAA и самозатенения задача получилась заметно более тяжёлой, совместное включение сразу этих двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая большое падение производительности. Разница между скоростными показателями нескольких видеокарт изменилась, включение суперсэмплинга сказывается как и в предыдущем случае — карты производства компании AMD ещё больше улучшили свои показатели относительно решений Nvidia.

И теперь обе Geforce стали слабейшими. Даже Radeon HD 5770 легко с ними справляется. Но что удивительнее — с ростом нагрузки HD 6790 приближается к HD 5770, а от обеих видеокарт на базе чипа Barts начинает отставать. Вероятно, при сложных условиях ПСП влияет на результаты теста уже гораздо меньше. Сегодняшний герой Radeon HD 6790 всё же чуть-чуть опережает модель HD 5770, и этого хватает, чтобы побить и обе платы Nvidia Geforce.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

В первом из двух чисто математических тестов мы видим небольшое преимущество у Radeon HD 6790 по сравнению с HD 5770, хотя теоретически разница должна быть даже обратной. Вероятно, практическая разница отличается от теории из-за вмешательства влияния ПСП на производительность GPU в данном тесте. Но всё же все решения расположились примерно соответственно теоретическим показателям. К сожалению, HD 6790 в этот раз оказалась ближе к HD 5770, чем к HD 6850, но этого следовало ожидать, исходя из теории.

Нам уже порядком надоело в каждом материале писать о том, что видеокарты AMD в таких синтетических в вычислительно сложных задачах традиционно показывают значительно более высокие результаты, так как современная архитектура AMD имеет огромное преимущество перед конкурирующими видеокартами Nvidia в пиковой производительности, даже несмотря на меньший КПД. В этот раз разница между конкурирующими видеокартами Nvidia и AMD (сравниваем GTX 550 Ti и HD 6790) оказалась почти двукратной.

В прошлых исследованиях мы отмечали, что этот тест не полностью зависит от скорости ALU, некоторые решения ограничиваются ещё и скоростью видеопамяти. Поэтому рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он ещё тяжелее для ALU, и текстурная выборка в нём только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Изменений в расположении карт совсем немного. Во втором математическом подтесте скорость рендеринга ограничена почти исключительно производительностью шейдерных блоков, и разница между GTX 550 Ti и представленным сегодня HD 6790 осталась почти двукратной, что в общем близко к теоретическим показателям.

В общем, тесты производительности блоков математических вычислениям вновь показали ожидаемый результат — у решений компании AMD сейчас есть явное преимущество, объясняемое большим количеством блоков ALU.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующих частицу. Аналогичные алгоритмы должны получить широкое использование в будущих DirectX 10 играх.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений. Производительность соответствует количеству точек, с каждым шагом падение FPS составляет около двух раз. Задача для современных видеокарт не очень сложная, и производительность ограничена не только скоростью геометрической обработки, но и пропускной способностью памяти.

Radeon HD 6790 показал результат примерно посередине между HD 5770 и HD 6850, что совершенно логично. По сравнению с конкурентами, новая видеокарта компании AMD показала результат на уровне более производительной GTX 460, а вот прямой конкурент GTX 550 Ti немного отстал, показав результат точно как у HD 5770. HD 6790 быстрее HD 5770 скорее всего из-за влияния ПСП и оптимизаций в кэшировании геометрических данных, проведённых в Barts. Посмотрим, что изменится при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте, цифры для решений Nvidia и некоторых из Radeon почти не изменились, а вот младшая видеокарта Radeon HD 5770 заметно подтянула свои результаты. Платы с графическими процессорами Nvidia в этом тесте вовсе не замечают изменения параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, и показывают аналогичные предыдущей диаграмме результаты, равно как и старшие платы AMD на чипе Barts. А вот младшие решения ускоряются.

В результате, Radeon HD 5770 в самых сложных условиях даже обгоняет HD 6790, хотя обычно получается так, как и должно быть по теории — в большинстве тестов HD 6790 расположился между HD 5770 и HD 6850. Перейдём к следующему тесту, который предполагает большую нагрузку на геометрические блоки.

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленном в «Heavy» — ещё и для их отрисовки. То есть, в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер. Сначала рассматриваем лёгкий режим:

Относительные результаты в разных режимах снова соответствуют нагрузке: во всех случаях производительность неплохо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть почти в два раза медленней.

В этом тесте при сбалансированной нагрузке скорость рендеринга для всех решений менее явно ограничена геометрической производительностью, а цифры говорят о возможном упоре в пропускную способность видеопамяти. Новый Radeon HD 6790 показывает результат между картой серии HD 5700 и младшей из серии HD 6800. Если сравнивать с платами Nvidia, то новая плата AMD встала точно на уровень Geforce GTX 550 Ti, а GTX 460 немного впереди их обеих.

Цифры должны измениться на следующей диаграмме, в тесте с более активным использованием геометрических шейдеров. Также интересно будет сравнить друг с другом результаты, полученные в «Balanced» и «Heavy» режимах.

У младших чипов Nvidia практически нет преимуществ по скорости исполнения геометрических шейдеров, так как они имеют лишь один-два растеризатора. И оптимизированная обработка геометрии в чипе Barts позволила видеокарте Radeon HD 6790 оказаться почти столь же быстрой, что и Geforce GTX 460. А вот GTX 550 Ti снова идёт на уровне младшей платы AMD — Radeon HD 5770.

В целом, на основе тестов геометрических шейдеров можно сделать вывод о том, что в данном ценовом диапазоне преимущества в скорости растеризации и обработки геометрии у младших чипов Nvidia не отмечено. Вместе с оптимизированным геометрическим конвейером в Barts это привело к примерному равенству соответствующих решений Nvidia и AMD в тестах с обработкой большого количества геометрии. Возможно, в задачах с тесселяцией всё будет несколько иначе.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи по сути и соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Предыдущие исследования показали, что на результаты этого теста влияет и скорость текстурирования и пропускная способность памяти. Разница между всеми решениями не так уж велика, и результаты показаны несколько странные. Например, обе платы Nvidia почти не ускоряются в простых режимах — что-то их ограничивает. Свежая модель Radeon HD 6790 держится почти на уровне HD 6850, заметно выигрывая у старенькой HD 5770.

В сложном режиме обе видеокарты Nvidia обгоняют новинку от AMD, а вот в среднем и лёгком результат плат Nvidia упирается во что-то и вперёд выходит уже Radeon. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Взаимное расположение карт на диаграмме почти не изменилось, но упор видеокарт Nvidia во что-то непонятное ещё более заметен. В среднем и лёгком режиме разницы в скорости и вовсе почти нет. Всё остальное остаётся в силе, решения Nvidia сильнее в тяжёлом режиме (они обгоняют даже HD 6870), в среднем результаты близки, а вот в лёгком обе Geforce сдают позиции и HD 6790 обгоняет обе представленные карты Nvidia.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

А в этом тесте результаты у всех участников сравнения получились иными, и не похожими на то, что мы видели на предыдущих диаграммах. В разных условиях теста «Waves» мы видим явное преимущество решений AMD Radeon, и платы на основе видеочипов Barts показали отличные результаты. HD 6790 явно опережает и HD 5770 и обе Geforce. Вероятно, на результатах теста сказывается эффективность кэширования, которая была повышена в Barts. Рассмотрим второй вариант этого же теста:

С ростом сложности условий теста произошло мало изменений, и ничего нового и интересного мы не увидели. Относительные результаты Radeon HD 6790 во втором тесте вершинных выборок при высокой детализации остались на очень хорошем уровне, и в самых сложных условиях новинка даже обошла своего собрата HD 6850. Radeon HD 5770 получилась самой слабой, и сравнивать её с картами серий Radeon HD 6800 и HD 6700 бессмысленно, так как платы на Barts явно сильнее.

Что касается сравнения Radeon HD 6790 с решениями компании Nvidia, то и тут всё остаётся так же — свежеанонсированный Radeon обогнал и GTX 460 и GTX 550 Ti. Такое впечатление, что производительность в этом тесте почти не зависит от одной скорости текстурирования, а больше всего на неё влияет производительность блоков установки треугольников вместе с кэшированием геометрических данных.

3DMark Vantage: Feature-тесты

Синтетические тесты из пакета 3DMark Vantage хоть уже и не новы, но они обладают поддержкой D3D10 и интересны тем, что отличаются от наших. При анализе результатов нового решения компании AMD в этом пакете мы сможем сделать какие-то полезные выводы, ускользнувшие от нас в тестах семейства RightMark.

Feature Test 1: Texture Fill

Первый тест — тест скорости текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

В тесте текстурной производительности из пакета 3DMark Vantage результаты получились не такими, как в нашем RightMark. Причём, эти цифры больше похожи на реальные, да и к теории они ближе. В текстурной синтетике из этого пакета все видеокарты Nvidia эффективнее используют имеющиеся в их составе текстурные блоки, и поэтому разрыв между конкурирующими моделями от Nvidia и AMD сильно сократился. Radeon HD 6790 показал результат хуже, чем GTX 460, но лучше, чем GTX 550 Ti. Поэтому однозначного победителя назвать непросто.

Что касается сравнения с видеокартами той же компании, то результат вполне объясним — новое решение на чипе Barts отстаёт от обоих решений серии HD 6800 и показывает результат, идентичный Radeon HD 5770, в полном соответствии с теорией. Ведь тут и HD 6850 не очень далеко убежал, и только лидер сравнения — HD 6870 — сильно оторвался от плотной толпы (как было и у нас в соответствующем тесте). Так что новая видеокарта на базе чипа Barts показала вполне ожидаемую текстурную производительность.

Feature Test 2: Color Fill

Это — простой тест скорости заполнения. Используется несложный пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Показатели производительности в тесте в основном соответствуют теоретическим цифрам филлрейта (производительности блоков ROP с учётом частоты работы GPU), но на некоторых результатах сказывается и влияние ПСП видеопамяти. Цифры не похожи на наши потому, что у нас используется целочисленный буфер с 8-бит на компоненту, а в тесте Vantage — 16-битный формат с плавающей точкой.

Относительные результаты анонсированного сегодня Radeon HD 6790 в этом тесте неплохие, и на них явно сказывается влияние большей ПСП, чем у той же Radeon HD 5770, к примеру. А видеокарта GTX 550 Ti ограничена недостатком ПСП, так как она должна быть не медленнее GTX 460 в версии с 1 ГБ видеопамяти.

Новая модель AMD показывает результат несколько лучше чем HD 5770, но до любой из моделей серии HD 6800 ей не достать — ведь число блоков ROP в её варианте видеочипа урезано ровно вдвое. Но даже при таком раскладе она успешно конкурирует с Geforce GTX 460, а уж прямого конкурента GTX 550 Ti и вовсе обгоняет с запасом. Так что решение об урезании половины блоков ROP получилось вполне оправданным.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нём рисуется один четырехугольник (точнее, два треугольника), с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоёмкие операции по трассировке лучей и карта глубины большого разрешения.

Отрисовываемая поверхность затеняется при помощи тяжёлого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчёты освещения по Strauss.

Тест отличается от аналогов тем, что результаты в нём зависят не исключительно от скорости математических вычислений или эффективности исполнения ветвлений или скорости текстурных выборок, а от всего сразу. А для достижения высокой скорости важен грамотный баланс блоков GPU и ПСП видеопамяти. Заметно влияет на скорость и эффективность выполнения ветвлений в шейдерах.

В этом тесте традиционно лучше выступают любые решения компании AMD, и Radeon HD 6790 не стал исключением. А вот чипы Nvidia в данном тесте показывают сравнительно слабые результаты. Сильнейшая из видеокарт калифорнийской компании не достаёт даже Radeon HD 5770, не говоря уже о лидирующем Radeon HD 6870. Хотя, все остальные платы AMD держатся довольно ровно, и HD 6790 даже немного уступает тому же HD 5770, что объясняется чуть меньшей текстурной производительностью. Зато обе платы Nvidia позади.

Feature Test 4: GPU Cloth

Тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Похоже, что на скорость рендеринга в этом тесте также влияет сразу несколько различных параметров. Но всё же, больше всего скорость зависит от производительности обработки геометрии и эффективности исполнения геометрических шейдеров. Раньше мы отмечали, что в тестах физических симуляций решения Nvidia сильнее, но это касается в основном решений более высокого уровня. А вот в диапазоне цен $150—200 преимущества у них уже почти не остаётся.

В этом тесте быстрее всех работает Geforce GTX 460, она же становится и лидером теста. Но даже и GTX 550 Ti обгоняет все видеокарты AMD, кроме старшей модели серии Radeon HD 6800. С выполнением геометрических шейдеров, скоростью обработки геометрии и эффективностью исполнения сложных программ платы Nvidia справляются пусть и не сильно, но всё же лучше конкурирующих. Ну а сегодняшний герой от AMD тоже держится неплохо, показав результат чуть лучше, чем HD 5770 и HD 6850.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующих частицу. Но тест больше всего загружает шейдерные блоки вершинными расчётами, также тестируется stream out.

Результаты схожи с теми, что мы видели на прошлой диаграмме, но в этот раз Radeon HD 5770 сильно откатился назад. Возможно, самой младшей плате компании AMD помешала нехватка ПСП. Интересно, что в данном случае новенький HD 6790 снова расположился ровно между HD 5770 и HD 6850.

В остальном, сразу по двум синтетическим тестам имитации тканей и частиц из рассматриваемого тестового пакета, в которых используются геометрические шейдеры, можно сделать вывод о том, что представленное решение Radeon HD 6790 справляется с работой неплохо, хотя и немного отстаёт от конкурирующей продукции. Но раньше это отставание было ещё более явным.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом GPU, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто используемый в процедурном текстурировании, он использует очень много математических расчётов.

Данный тест из пакета 3DMark Vantage измеряет пиковую математическую производительность видеочипов в предельных задачах. Показанная в нём скорость решений примерно соответствует тому, что должно получаться по теории и получилось в наших математических тестах из пакета RightMark 2.0.

Всё понятно без слов, видеокарты AMD снова на голову быстрее обеих видеокарт Nvidia в очередном математическом тесте. Мы уже не раз убеждались в том, что простые, но интенсивные математические расчёты выполняются на видеокартах Radeon значительно быстрее, чем на Geforce. И в этом математическом тесте новый Radeon HD 6790, основанный на чипе Barts, показал скорость на 85% выше, чем свой основной ценовой конкурент, почти строго по теории.

Интересно, что сразу три видеокарты AMD снова показали практически идентичные результаты: HD 5770, HD 6850 и новая модель HD 6790. Зачем так много видеокарт с почти одинаковой производительностью плодить? Похоже, что ответ прост — в условиях отсутствия возможности выпуска действительно новых продуктов (TSMC надолго застряла на 40 нм техпроцессе) ничего не остаётся, кроме как выпускать и выпускать «новые» решения с повышенной на 5-10% производительностью.

Выводы по синтетическим тестам

По результатам проведённых нами синтетических тестов новой модели Radeon HD 6790, основанной на графическом процессоре Barts, а также результатам других моделей видеокарт обоих производителей видеочипов, можно сделать вывод о том, что данная модификация имеет производительность между ранее выпущенными моделями Radeon HD 5770 и Radeon HD 6850. И успех решения на рынке будет зависеть от реальных розничных цен. Не до конца понятно, зачем делать линейку такой плотной, но рекомендованная цена кажется вполне оправданной.

Во многих синтетических тестах новое решение AMD показало себя с хорошей стороны, порой на уровне более дорогого Radeon HD 6850. Отдельно можно отметить высокую пропускную способность видеопамяти, так как для платы оставили 256-битную шину памяти. Да и остальные параметры, такие как математическая и текстурная производительность, у Radeon HD 6790 вполне на хорошем уровне. А среди слабых сторон отметим только возможный недостаток эффективного филлрейта (производительности блоков ROP, количество которых было урезано вдвое) в некоторых условиях.

Позитивные в целом результаты Radeon HD 6790 в синтетических тестах должны подтвердиться и в следующей части нашего материла, посвящённой тестированию в игровых приложениях. Посмотрим, насколько успешно новое решение компании AMD будет конкурировать и с GTX 550 Ti, и с GTX 460, и даже со своим же собратом в виде Radeon HD 5770. Возможно, старый конь борозды и не испортит?

В реальных игровых приложениях скорость рендеринга часто зависит от математической производительности и текстурирования, и реже от филлрейта, поэтому новое решение должно быть где-то на уровне между GTX 460 и GTX 550 Ti. Хотя непросто предсказать, что получится в сравнении с видеокартами Nvidia, так как и у тех и у других есть свои сильные и слабые стороны. Наверняка будут игры, в которых победит выпущенное решение компании AMD, но также будут и другие игры, где оно уступит конкурентам. Ну что же, давайте посмотрим.



AMD Radeon HD 6790 — Часть 3: Игровые тесты (производительность)



Блок питания для тестового стенда предоставлен компанией TAGAN

Корпус ThermalTake 8430 для тестового стенда предоставлен компанией 3Logic

Монитор Dell 3007WFP для тестовых стендов предоставлен компанией Nvidia




Дополнительно

Обзор видеоускорителя AMD Radeon HD 6790, часть 2: Особенности видеокарт, конфигурация стенда и список тестовых инструментов, производительность в синтетических тестах

AMD Radeon HD 6790

описание видеокарты и результаты синтетических тестов

Содержание

В этой части, как обычно, мы изучим саму видеокарту, а также познакомимся с результатами синтетических тестов.

Плата

AMD Radeon HD 6790 1024 MБ 256-битной GDDR5, PCI-E
  • GPU: Radeon HD 6790 (Barts)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs) (МГц): 840 (номинал — 840)
  • Частоты работы памяти (физическая (эффективная)): 1050 (4200) МГц (номинал — 1050 (4200) МГц)
  • Ширина шины обмена с памятью (бит): 256
  • Число вычислительных блоков в GPU/частота работы блоков (МГц): 200/840 (номинал — 200/840)
  • Число операций (ALU) в блоке: 4
  • Суммарное число операций (ALU): 600
  • Число блоков текстурирования: 40 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 16
  • Размеры (мм): 210×100×33 (последняя величина — максимальная толщина видеокарты)
  • Цвет текстолита: черный
  • RAMDACs/TMDS: интегрированы в GPU
  • Выходные гнезда: 2×DVI (Dual-Link/HDMI), 2×Display Port, 1×HDMI
  • Поддержка многопроцессорной работы: CrossFire (Hardware)

AMD Radeon HD 6790 1024 MБ 256-битной GDDR5, PCI-E
Карта имеет 1024 МБ памяти GDDR5 SDRAM, размещенной в восьми микросхемах на лицевой сторонe PCB.

Микросхемы памяти Hynix (GDDR5). Микросхемы рассчитаны на максимальную частоту работы в 1250 (5000) МГц.

Сравнение с эталонным дизайном, вид спереди
AMD Radeon HD 6790 1024 MБ 256-битной GDDR5, PCI-E Reference card AMD Radeon HD 6850

Сравнение с эталонным дизайном, вид сзади
AMD Radeon HD 6790 1024 MБ 256-битной GDDR5, PCI-E Reference card AMD Radeon HD 6850

Понятно, что из-за равной ширины шины обмена с памятью карты 6790 и 6850 очень похожи. А вообще, открою вам тайну, на 6790 установлен тот же чип под кодовым названием Barts, что и у 6850 и 6870. Просто вырезана часть блоков (ALU, ROP, TMU), а частота поднята почти до уровня 6870. Поэтому, как мы видим, у 6790 два разъема питания, а у 6850 — один. И потребление у 6790 выше. Очевидно, что таким путем избавляются от брака среди выпущенных кристаллов Barts.

Подключение к аналоговым мониторам с d-Sub (VGA) производится через специальные адаптеры-переходники DVI-to-d-Sub. Что касается вывода на HDMI, то продукт также обладает такой возможностью. Кроме того, у карты есть и 2 Display Port (но требуется переходник с mini-DP).

Максимальные разрешения и частоты:

  • 240 Гц максимальная частота обновления
  • 2048×1536@85 Гц — по аналоговому интерфейсу
  • 2560×1600@60 Гц — по цифровому интерфейсу (для DVI-гнезд с Dual-Link/HDMI)

По поводу HDTV. Одно из исследований также проведено, и с ним можно ознакомиться здесь.

Следует еще раз особо упомянуть, что все семейство Radeon HD 6xxx позволяет выводить картинку игры одновременно на три монитора, и даже в стереорежиме (пока это в отладочном режиме). При этом обязательно требуется наличие как минимум одного приемника с Display Port. Впрочем, для карт с такой производительностью, как у 6790, это малоактуально.

Напомню, что карта требует дополнительного питания, причем двумя 6-контактными разъемами.

О системе охлаждения.

AMD Radeon HD 6790 1024 MБ 256-битной GDDR5, PCI-E
СО по своему принципу схожа с той, что мы видели у Radeon HD 6850.

СО состоит из двух частей: центрального кулера, который охлаждает ядро и микросхемы памяти, и кожуха.

Прибор цилиндрического типа — на одном конце закреплен цилиндрический вентилятор, прогоняющий воздух через радиатор, установленный на ядре. Несмотря на медную подошву, сам радиатор небольшой. В целом устройство довольно тихое, и явно говорит о том, что нагрев ядра не столь велик.

Мы провели исследование температурного режима с помощью утилиты MSI Afterburner (автор А. Николайчук AKA Unwinder) и получили следующие результаты:

AMD Radeon HD 6790 1024 MБ 256-битной GDDR5, PCI-E

Как и ожидалось, столь массивная СО прекрасно справилась со своей работой. И ядро после 8-часовой работы под нагрузкой нагрелось лишь до 66 градусов.

Видеокарта прибыла к нам без упаковки и комплекта, потому данный вопрос мы опускаем.

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютер на базе Intel Core i7-975 (Socket 1366)
    • процессор Intel Core i7-975 (3340 МГц);
    • системная плата Asus P6T Deluxe на чипсете Intel X58;
    • оперативная память 6 ГБ DDR3 SDRAM Corsair 1600 МГц;
    • жесткий диск WD Caviar SE WD1600JD 160 ГБ SATA;
    • блок питания Tagan TG900-BZ 900 Вт.
  • операционная система Windows 7 64 бит SP1; DirectX 11;
  • монитор Dell 3007WFP (30″);
  • драйверы ATI версии Catalyst 11.4 beta; Nvidia версии 267.24/267.26/267.59/267.71.

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать по ссылкам:

  • D3D RightMark Beta 4 (1050) с описанием на сайте http://3d.rightmark.org.
  • D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 — тесты пиксельных шейдеров версий 2.0 и 3.0 ссылка.
  • RightMark3D 2.0 с кратким описанием: Vista без SP1, Vista c SP1.

Для работы RightMark3D 2.0 также требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

Синтетические тесты проводились на следующих видеокартах:

  • Radeon HD 6790 со стандартными параметрами (далее HD 6790)
  • Radeon HD 6870 со стандартными параметрами (далее HD 6870)
  • Radeon HD 6850 со стандартными параметрами (далее HD 6850)
  • Radeon HD 5770 со стандартными параметрами (далее HD 5770)
  • Geforce GTX 550 Ti со стандартными параметрами (далее GTX 550 Ti)
  • Geforce GTX 460 со стандартными параметрами, модель с 1 ГБ видеопамяти (далее GTX 460)

Для сравнения результатов новой модели Radeon HD 6790 мы выбрали именно эти видеокарты по следующим причинам: две видеокарты серии Radeon HD 6800 основаны на одном и том же GPU, но в разных версиях с отличающимся количеством исполнительных блоков и частотами. И хотя цены на эти решения выше, чем на представленную модель, будет любопытно увидеть, насколько сильно сказалось усечение чипа. Ну а Radeon HD 5770 выбран потому, что он в линейке компании AMD стоит ниже вышедшей видеокарты.

Выбор из списка видеокарт Nvidia обоснован тем, что Geforce GTX 550 Ti является наиболее близким по цене решением конкурирующей компании, да и GTX 460 с 1 ГБ памяти — это схожее по стоимости и теоретическим характеристикам решение Nvidia из предыдущей линейки, всё ещё широко продающееся на рынке в различных вариантах.

Direct3D 9: тесты Pixel Filling

В тесте определяется пиковая производительность выборки текстур (texel rate) в режиме FFP для разного числа текстур, накладываемых на один пиксель:

В тесте текстурной производительности все видеокарты традиционно показывают цифры, далёкие от теоретически возможных значений, и мы их перепроверим ещё раз в аналогичном тесте из пакета 3DMark Vantage. Результаты нашей синтетики для Radeon HD 6790 не дотягивают до пиковых значений, по ней получается, что новая видеокарта выбирает до 34 текселя за один такт из 32-битных текстур при билинейной фильтрации в этом тесте, что несколько ниже теоретической цифры в 40 отфильтрованных текселей.

А вот по сравнению с другими видеоплатами по скорости текстурирования новый Radeon оказался весьма неплох. Интересно, что результаты Radeon HD 5770, HD 6850 и анонсированной HD 6790 в этом тесте весьма близки, и лишь Radeon HD 6870 вырвалась вперёд. Что немудрено, так как она имеет лучшие теоретические показатели производительности, да и самую высокую цену.

Все чипы AMD работают в этом тесте эффективнее своих конкурентов. Выпущенная сегодня Radeon HD 6790 с большим запасом опережает оба решения Nvidia, в том числе и свежую GTX 550 Ti, во всех режимах с любым количеством накладываемых на пиксель текстур. Рассмотрим тест филлрейта:

Второй синтетический тест показывает скорость заполнения, в нём мы видим всё то же самое, но уже с учётом количества записанных в буфер кадра пикселей. На диаграмме отлично видно ограничение скорости рендеринга у всех решений AMD и Nvidia в условиях вплоть до четырёх текстур включительно.

Понятно, что максимальный результат остаётся за старшим решением линейки Radeon HD 6800, стоящей дороже, но и все остальные видеокарты AMD справляются с задачей отлично. Интересно, что в простых условиях лучший результат показывает Radeon HD 5770, а HD 6870 выходит вперёд лишь в сложных подтестах.

Direct3D 9: тесты Pixel Shaders

Первая группа пиксельных шейдеров, которую мы рассматриваем, очень проста для современных видеочипов, она включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся в старых играх.

Тесты пиксельных шейдеров младших версий весьма и весьма просты для современных GPU, и производительность в них ограничена по большей части скоростью текстурных модулей, с учётом эффективности блоков и кэширования. В предыдущих исследованиях мы отмечали также и некоторое влияние ПСП видеопамяти.

Интересно, что новый Radeon HD 6790 показывает результат на уровне HD 5770, а не HD 6850, что говорит об упоре в текстурирование и филлрейт. Хотя от новой модели мы ожидали несколько большего, чтобы она расположилась хотя бы посередине между HD 5770 и HD 6850. Зато, если брать сравнение с видеокартами Nvidia, то мы снова наблюдаем выигрыш новой платы AMD во всех представленных подтестах.

В самых простых шейдерах разница между GTX 550 Ti и HD 6790 составила 30-50% в пользу новой модели от компании AMD. Мы видим, что в сравнительно лёгких тестах важнее всего скорость текстурирования, и по этому параметру видеокарты Nvidia проигрывают своим конкурентам. Посмотрим на результаты более сложных пиксельных программ промежуточных версий:

В сильно зависящем от скорости текстурирования тесте процедурной визуализации воды «Water» используется зависимая выборка из текстур больших уровней вложенности, и поэтому карты в нём также располагаются по скорости текстурирования, но с большим влиянием эффективности кэширования данных. В этом тесте Radeon HD 6790 показал результат лишь на уровне HD 5770, уступив даже одной из видеокарт Nvidia — GTX 460. Самой быстрой логично стала HD 6870, а наиболее медленной оказалась GTX 550 Ti от Nvidia. В целом, видеокарты AMD всё так же пока что остаются впереди во всех тестах, хотя разница в этот раз уже не столь велика.

Результаты второго подтеста отличаются. Он более интенсивен вычислительно, и в нём уже сказывается ещё и влияние математической производительности. Поэтому тест гораздо лучше подходит для видеокарт AMD, обладающих большим количеством блоков ALU, в дополнение к высокой текстурной производительности. Хотя HD 6790 снова показал скорость лишь на уровне HD 5770, этого хватило для того, чтобы с запасом обогнать обе конкурирующие модели.

Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье Современная терминология 3D графики.
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

Существует два варианта этих шейдеров: с ориентацией на математические вычисления, и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это универсальные тесты, зависящие и от скорости блоков ALU и от скорости текстурирования, в них важен общий баланс чипа. Производительность видеокарт в тесте «Frozen Glass» весьма схожа с той, что мы видели выше в «Cook-Torrance», но новая модель Radeon HD 6790 выступила лучше, опередив не только HD 5770, но и HD 6850 (правда, тут разницей можно пренебречь). Вероятно, в этом тесте прослеживается ещё и влияние ПСП видеопамяти.

Понятно, что GTX 550 Ti и GTX 460 уступили новой плате, да и все решения компании AMD оказались впереди. Результаты второго теста «Parallax Mapping» мало чем отличаются от предыдущих. Новое решение на основе чипа Barts снова опередило Radeon HD 5770, но в этот раз показало вполне оправданный результат между HD 6850 и HD 5770. Оба решения Nvidia остались далеко позади, им не хватает математической и текстурной производительности. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:

Относительное положение на диаграмме почти не изменилось, новое решение в одном из тестов показало результат на уровне HD 6850, а во втором — примерно как HD 5770. Лидером осталась модель HD 6870, а решения Nvidia привычно проигрывают в любых DirectX 9 тестах, так как в скорости текстурирования им особо нечем хвастать.

Но всё это были устаревшие задачи, в основном с упором в текстурирование или филлрейт. А сейчас мы рассмотрим результаты ещё двух тестов пиксельных шейдеров — версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9 API, которые намного показательнее с точки зрения современных игр на ПК. Эти тесты отличаются тем, что сильнее нагружают и ALU, и текстурные модули, обе шейдерные программы сложные и длинные, включают большое количество ветвлений.

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье Современная терминология 3D графики.
  • Fur — процедурный шейдер, визуализирующий мех.

Важно, что именно эти два теста пиксельных шейдеров версии 3.0 из всего подраздела наиболее адекватно показывают примерную расстановку графических решений по скорости рендеринга в играх. И с этими тестами у нового решения Nvidia дела обстоят гораздо лучше. Оба представленных теста довольно сложны, результаты в нём мало зависят от ПСП и текстурирования, и являются математическими, но с большим количеством переходов и ветвлений.

К сожалению, в первом тесте (Fur) представленная сегодня модель Radeon HD 6790 показала результат лишь на уровне HD 5770, а во втором (Steep Parallax Mapping) оказалась чуть сильнее устаревшей модели прошлого поколения. Что касается сравнения с платами Nvidia, то в первом тесте новое решение уступило обоим конкурентам, а во втором успешно соперничает с Geforce GTX 550 Ti. Тягаться с более производительным GTX 460 в этом тесте у Radeon HD 6790 не получается. Хотя результат для нового решения всё равно неплохой, ведь раньше в этом разделе мы чаще всего констатировали успех видеоплат производства компании Nvidia.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два знакомых PS 3.0 теста под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами, при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в этом тесте зависит не только от количества и эффективности блоков TMU, но и от величины филлрейта. Результаты в режиме «High» получаются примерно в полтора раза ниже, чем в «Low», как и должно быть по теории. В Direct3D 10 тестах процедурной визуализации меха с большим количеством текстурных выборок решения Nvidia ранее были весьма сильны, но, начиная с архитектуры Cypress, видеоплаты AMD показывают результаты не хуже, а то и лучше.

Так получилось и в этот раз, новая видеокарта AMD лишь немного отстаёт от лидирующего Radeon HD 6870, идёт вровень с HD 6850 и значительно опережает HD 5770. Видеокарты Nvidia в этом тесте способны конкурировать лишь с младшим решением AMD, поэтому анонсированной сегодня модели они серьёзно уступают. Скорее всего, на скорость рендеринга сильное влияние оказывает ПСП, так как этот показатель у HD 6790 весьма высок.

Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза, возможно в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять иначе:

Включение суперсэмплинга увеличивает теоретическую нагрузку вчетверо, и в таком случае решения Nvidia сдают свои и так хилые позиции, а видеокарты AMD выглядят ещё сильнее. Теперь новый Radeon серии HD 6700 немного уступает модели HD 6850, но всё так же сильно опережает HD 5770. Последнее явственно указывает на то, что производительность в тесте ограничивается не столько производительностью ROP, которая у HD 6790 не слишком высока, по сравнению с HD 5770, а в большей степени пропускной способностью памяти.

Второй тест, измеряющий производительность выполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок, называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением, число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше, по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Этот тест интереснее с практической точки зрения, так как многие разновидности parallax mapping давно применяются в играх, а тяжелые варианты, вроде нашего steep parallax mapping используются во многих проектах, например, в играх серий Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить и самозатенение, увеличивающее нагрузку на видеочип примерно в два раза — такой режим называется «High».

Диаграмма в целом похожа на предыдущую, тоже без сглаживания методом суперсэмплинга, результаты близки и по абсолютным цифрам. В обновленном варианте данного теста без включения суперсэмплинга, новая модель Radeon HD 6790 снова справляется с задачей значительно лучше платы HD 5770, и почти на уровне HD 6850.

Нужно ли вновь упоминать о том, что обе карты Nvidia безнадёжно отстали от всех видеокарт производства AMD, кроме самой слабой Radeon HD 5770, с которой конкурирует только Geforce GTX 460. Лидером по понятным причинам продолжает оставаться HD 6870, основанная на том же чипе Barts, но полноценном. Сразу видно, что данная видеокарта имеет явно более высокую производительность и цену. Посмотрим, что изменит включение суперсэмплинга.

При включении SSAA и самозатенения задача получилась заметно более тяжёлой, совместное включение сразу этих двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая большое падение производительности. Разница между скоростными показателями нескольких видеокарт изменилась, включение суперсэмплинга сказывается как и в предыдущем случае — карты производства компании AMD ещё больше улучшили свои показатели относительно решений Nvidia.

И теперь обе Geforce стали слабейшими. Даже Radeon HD 5770 легко с ними справляется. Но что удивительнее — с ростом нагрузки HD 6790 приближается к HD 5770, а от обеих видеокарт на базе чипа Barts начинает отставать. Вероятно, при сложных условиях ПСП влияет на результаты теста уже гораздо меньше. Сегодняшний герой Radeon HD 6790 всё же чуть-чуть опережает модель HD 5770, и этого хватает, чтобы побить и обе платы Nvidia Geforce.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

В первом из двух чисто математических тестов мы видим небольшое преимущество у Radeon HD 6790 по сравнению с HD 5770, хотя теоретически разница должна быть даже обратной. Вероятно, практическая разница отличается от теории из-за вмешательства влияния ПСП на производительность GPU в данном тесте. Но всё же все решения расположились примерно соответственно теоретическим показателям. К сожалению, HD 6790 в этот раз оказалась ближе к HD 5770, чем к HD 6850, но этого следовало ожидать, исходя из теории.

Нам уже порядком надоело в каждом материале писать о том, что видеокарты AMD в таких синтетических в вычислительно сложных задачах традиционно показывают значительно более высокие результаты, так как современная архитектура AMD имеет огромное преимущество перед конкурирующими видеокартами Nvidia в пиковой производительности, даже несмотря на меньший КПД. В этот раз разница между конкурирующими видеокартами Nvidia и AMD (сравниваем GTX 550 Ti и HD 6790) оказалась почти двукратной.

В прошлых исследованиях мы отмечали, что этот тест не полностью зависит от скорости ALU, некоторые решения ограничиваются ещё и скоростью видеопамяти. Поэтому рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он ещё тяжелее для ALU, и текстурная выборка в нём только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Изменений в расположении карт совсем немного. Во втором математическом подтесте скорость рендеринга ограничена почти исключительно производительностью шейдерных блоков, и разница между GTX 550 Ti и представленным сегодня HD 6790 осталась почти двукратной, что в общем близко к теоретическим показателям.

В общем, тесты производительности блоков математических вычислениям вновь показали ожидаемый результат — у решений компании AMD сейчас есть явное преимущество, объясняемое большим количеством блоков ALU.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующих частицу. Аналогичные алгоритмы должны получить широкое использование в будущих DirectX 10 играх.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений. Производительность соответствует количеству точек, с каждым шагом падение FPS составляет около двух раз. Задача для современных видеокарт не очень сложная, и производительность ограничена не только скоростью геометрической обработки, но и пропускной способностью памяти.

Radeon HD 6790 показал результат примерно посередине между HD 5770 и HD 6850, что совершенно логично. По сравнению с конкурентами, новая видеокарта компании AMD показала результат на уровне более производительной GTX 460, а вот прямой конкурент GTX 550 Ti немного отстал, показав результат точно как у HD 5770. HD 6790 быстрее HD 5770 скорее всего из-за влияния ПСП и оптимизаций в кэшировании геометрических данных, проведённых в Barts. Посмотрим, что изменится при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте, цифры для решений Nvidia и некоторых из Radeon почти не изменились, а вот младшая видеокарта Radeon HD 5770 заметно подтянула свои результаты. Платы с графическими процессорами Nvidia в этом тесте вовсе не замечают изменения параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, и показывают аналогичные предыдущей диаграмме результаты, равно как и старшие платы AMD на чипе Barts. А вот младшие решения ускоряются.

В результате, Radeon HD 5770 в самых сложных условиях даже обгоняет HD 6790, хотя обычно получается так, как и должно быть по теории — в большинстве тестов HD 6790 расположился между HD 5770 и HD 6850. Перейдём к следующему тесту, который предполагает большую нагрузку на геометрические блоки.

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленном в «Heavy» — ещё и для их отрисовки. То есть, в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер. Сначала рассматриваем лёгкий режим:

Относительные результаты в разных режимах снова соответствуют нагрузке: во всех случаях производительность неплохо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть почти в два раза медленней.

В этом тесте при сбалансированной нагрузке скорость рендеринга для всех решений менее явно ограничена геометрической производительностью, а цифры говорят о возможном упоре в пропускную способность видеопамяти. Новый Radeon HD 6790 показывает результат между картой серии HD 5700 и младшей из серии HD 6800. Если сравнивать с платами Nvidia, то новая плата AMD встала точно на уровень Geforce GTX 550 Ti, а GTX 460 немного впереди их обеих.

Цифры должны измениться на следующей диаграмме, в тесте с более активным использованием геометрических шейдеров. Также интересно будет сравнить друг с другом результаты, полученные в «Balanced» и «Heavy» режимах.

У младших чипов Nvidia практически нет преимуществ по скорости исполнения геометрических шейдеров, так как они имеют лишь один-два растеризатора. И оптимизированная обработка геометрии в чипе Barts позволила видеокарте Radeon HD 6790 оказаться почти столь же быстрой, что и Geforce GTX 460. А вот GTX 550 Ti снова идёт на уровне младшей платы AMD — Radeon HD 5770.

В целом, на основе тестов геометрических шейдеров можно сделать вывод о том, что в данном ценовом диапазоне преимущества в скорости растеризации и обработки геометрии у младших чипов Nvidia не отмечено. Вместе с оптимизированным геометрическим конвейером в Barts это привело к примерному равенству соответствующих решений Nvidia и AMD в тестах с обработкой большого количества геометрии. Возможно, в задачах с тесселяцией всё будет несколько иначе.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи по сути и соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Предыдущие исследования показали, что на результаты этого теста влияет и скорость текстурирования и пропускная способность памяти. Разница между всеми решениями не так уж велика, и результаты показаны несколько странные. Например, обе платы Nvidia почти не ускоряются в простых режимах — что-то их ограничивает. Свежая модель Radeon HD 6790 держится почти на уровне HD 6850, заметно выигрывая у старенькой HD 5770.

В сложном режиме обе видеокарты Nvidia обгоняют новинку от AMD, а вот в среднем и лёгком результат плат Nvidia упирается во что-то и вперёд выходит уже Radeon. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Взаимное расположение карт на диаграмме почти не изменилось, но упор видеокарт Nvidia во что-то непонятное ещё более заметен. В среднем и лёгком режиме разницы в скорости и вовсе почти нет. Всё остальное остаётся в силе, решения Nvidia сильнее в тяжёлом режиме (они обгоняют даже HD 6870), в среднем результаты близки, а вот в лёгком обе Geforce сдают позиции и HD 6790 обгоняет обе представленные карты Nvidia.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

А в этом тесте результаты у всех участников сравнения получились иными, и не похожими на то, что мы видели на предыдущих диаграммах. В разных условиях теста «Waves» мы видим явное преимущество решений AMD Radeon, и платы на основе видеочипов Barts показали отличные результаты. HD 6790 явно опережает и HD 5770 и обе Geforce. Вероятно, на результатах теста сказывается эффективность кэширования, которая была повышена в Barts. Рассмотрим второй вариант этого же теста:

С ростом сложности условий теста произошло мало изменений, и ничего нового и интересного мы не увидели. Относительные результаты Radeon HD 6790 во втором тесте вершинных выборок при высокой детализации остались на очень хорошем уровне, и в самых сложных условиях новинка даже обошла своего собрата HD 6850. Radeon HD 5770 получилась самой слабой, и сравнивать её с картами серий Radeon HD 6800 и HD 6700 бессмысленно, так как платы на Barts явно сильнее.

Что касается сравнения Radeon HD 6790 с решениями компании Nvidia, то и тут всё остаётся так же — свежеанонсированный Radeon обогнал и GTX 460 и GTX 550 Ti. Такое впечатление, что производительность в этом тесте почти не зависит от одной скорости текстурирования, а больше всего на неё влияет производительность блоков установки треугольников вместе с кэшированием геометрических данных.

3DMark Vantage: Feature-тесты

Синтетические тесты из пакета 3DMark Vantage хоть уже и не новы, но они обладают поддержкой D3D10 и интересны тем, что отличаются от наших. При анализе результатов нового решения компании AMD в этом пакете мы сможем сделать какие-то полезные выводы, ускользнувшие от нас в тестах семейства RightMark.

Feature Test 1: Texture Fill

Первый тест — тест скорости текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

В тесте текстурной производительности из пакета 3DMark Vantage результаты получились не такими, как в нашем RightMark. Причём, эти цифры больше похожи на реальные, да и к теории они ближе. В текстурной синтетике из этого пакета все видеокарты Nvidia эффективнее используют имеющиеся в их составе текстурные блоки, и поэтому разрыв между конкурирующими моделями от Nvidia и AMD сильно сократился. Radeon HD 6790 показал результат хуже, чем GTX 460, но лучше, чем GTX 550 Ti. Поэтому однозначного победителя назвать непросто.

Что касается сравнения с видеокартами той же компании, то результат вполне объясним — новое решение на чипе Barts отстаёт от обоих решений серии HD 6800 и показывает результат, идентичный Radeon HD 5770, в полном соответствии с теорией. Ведь тут и HD 6850 не очень далеко убежал, и только лидер сравнения — HD 6870 — сильно оторвался от плотной толпы (как было и у нас в соответствующем тесте). Так что новая видеокарта на базе чипа Barts показала вполне ожидаемую текстурную производительность.

Feature Test 2: Color Fill

Это — простой тест скорости заполнения. Используется несложный пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Показатели производительности в тесте в основном соответствуют теоретическим цифрам филлрейта (производительности блоков ROP с учётом частоты работы GPU), но на некоторых результатах сказывается и влияние ПСП видеопамяти. Цифры не похожи на наши потому, что у нас используется целочисленный буфер с 8-бит на компоненту, а в тесте Vantage — 16-битный формат с плавающей точкой.

Относительные результаты анонсированного сегодня Radeon HD 6790 в этом тесте неплохие, и на них явно сказывается влияние большей ПСП, чем у той же Radeon HD 5770, к примеру. А видеокарта GTX 550 Ti ограничена недостатком ПСП, так как она должна быть не медленнее GTX 460 в версии с 1 ГБ видеопамяти.

Новая модель AMD показывает результат несколько лучше чем HD 5770, но до любой из моделей серии HD 6800 ей не достать — ведь число блоков ROP в её варианте видеочипа урезано ровно вдвое. Но даже при таком раскладе она успешно конкурирует с Geforce GTX 460, а уж прямого конкурента GTX 550 Ti и вовсе обгоняет с запасом. Так что решение об урезании половины блоков ROP получилось вполне оправданным.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нём рисуется один четырехугольник (точнее, два треугольника), с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоёмкие операции по трассировке лучей и карта глубины большого разрешения.

Отрисовываемая поверхность затеняется при помощи тяжёлого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчёты освещения по Strauss.

Тест отличается от аналогов тем, что результаты в нём зависят не исключительно от скорости математических вычислений или эффективности исполнения ветвлений или скорости текстурных выборок, а от всего сразу. А для достижения высокой скорости важен грамотный баланс блоков GPU и ПСП видеопамяти. Заметно влияет на скорость и эффективность выполнения ветвлений в шейдерах.

В этом тесте традиционно лучше выступают любые решения компании AMD, и Radeon HD 6790 не стал исключением. А вот чипы Nvidia в данном тесте показывают сравнительно слабые результаты. Сильнейшая из видеокарт калифорнийской компании не достаёт даже Radeon HD 5770, не говоря уже о лидирующем Radeon HD 6870. Хотя, все остальные платы AMD держатся довольно ровно, и HD 6790 даже немного уступает тому же HD 5770, что объясняется чуть меньшей текстурной производительностью. Зато обе платы Nvidia позади.

Feature Test 4: GPU Cloth

Тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Похоже, что на скорость рендеринга в этом тесте также влияет сразу несколько различных параметров. Но всё же, больше всего скорость зависит от производительности обработки геометрии и эффективности исполнения геометрических шейдеров. Раньше мы отмечали, что в тестах физических симуляций решения Nvidia сильнее, но это касается в основном решений более высокого уровня. А вот в диапазоне цен $150—200 преимущества у них уже почти не остаётся.

В этом тесте быстрее всех работает Geforce GTX 460, она же становится и лидером теста. Но даже и GTX 550 Ti обгоняет все видеокарты AMD, кроме старшей модели серии Radeon HD 6800. С выполнением геометрических шейдеров, скоростью обработки геометрии и эффективностью исполнения сложных программ платы Nvidia справляются пусть и не сильно, но всё же лучше конкурирующих. Ну а сегодняшний герой от AMD тоже держится неплохо, показав результат чуть лучше, чем HD 5770 и HD 6850.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующих частицу. Но тест больше всего загружает шейдерные блоки вершинными расчётами, также тестируется stream out.

Результаты схожи с теми, что мы видели на прошлой диаграмме, но в этот раз Radeon HD 5770 сильно откатился назад. Возможно, самой младшей плате компании AMD помешала нехватка ПСП. Интересно, что в данном случае новенький HD 6790 снова расположился ровно между HD 5770 и HD 6850.

В остальном, сразу по двум синтетическим тестам имитации тканей и частиц из рассматриваемого тестового пакета, в которых используются геометрические шейдеры, можно сделать вывод о том, что представленное решение Radeon HD 6790 справляется с работой неплохо, хотя и немного отстаёт от конкурирующей продукции. Но раньше это отставание было ещё более явным.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом GPU, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто используемый в процедурном текстурировании, он использует очень много математических расчётов.

Данный тест из пакета 3DMark Vantage измеряет пиковую математическую производительность видеочипов в предельных задачах. Показанная в нём скорость решений примерно соответствует тому, что должно получаться по теории и получилось в наших математических тестах из пакета RightMark 2.0.

Всё понятно без слов, видеокарты AMD снова на голову быстрее обеих видеокарт Nvidia в очередном математическом тесте. Мы уже не раз убеждались в том, что простые, но интенсивные математические расчёты выполняются на видеокартах Radeon значительно быстрее, чем на Geforce. И в этом математическом тесте новый Radeon HD 6790, основанный на чипе Barts, показал скорость на 85% выше, чем свой основной ценовой конкурент, почти строго по теории.

Интересно, что сразу три видеокарты AMD снова показали практически идентичные результаты: HD 5770, HD 6850 и новая модель HD 6790. Зачем так много видеокарт с почти одинаковой производительностью плодить? Похоже, что ответ прост — в условиях отсутствия возможности выпуска действительно новых продуктов (TSMC надолго застряла на 40 нм техпроцессе) ничего не остаётся, кроме как выпускать и выпускать «новые» решения с повышенной на 5-10% производительностью.

Выводы по синтетическим тестам

По результатам проведённых нами синтетических тестов новой модели Radeon HD 6790, основанной на графическом процессоре Barts, а также результатам других моделей видеокарт обоих производителей видеочипов, можно сделать вывод о том, что данная модификация имеет производительность между ранее выпущенными моделями Radeon HD 5770 и Radeon HD 6850. И успех решения на рынке будет зависеть от реальных розничных цен. Не до конца понятно, зачем делать линейку такой плотной, но рекомендованная цена кажется вполне оправданной.

Во многих синтетических тестах новое решение AMD показало себя с хорошей стороны, порой на уровне более дорогого Radeon HD 6850. Отдельно можно отметить высокую пропускную способность видеопамяти, так как для платы оставили 256-битную шину памяти. Да и остальные параметры, такие как математическая и текстурная производительность, у Radeon HD 6790 вполне на хорошем уровне. А среди слабых сторон отметим только возможный недостаток эффективного филлрейта (производительности блоков ROP, количество которых было урезано вдвое) в некоторых условиях.

Позитивные в целом результаты Radeon HD 6790 в синтетических тестах должны подтвердиться и в следующей части нашего материла, посвящённой тестированию в игровых приложениях. Посмотрим, насколько успешно новое решение компании AMD будет конкурировать и с GTX 550 Ti, и с GTX 460, и даже со своим же собратом в виде Radeon HD 5770. Возможно, старый конь борозды и не испортит?

В реальных игровых приложениях скорость рендеринга часто зависит от математической производительности и текстурирования, и реже от филлрейта, поэтому новое решение должно быть где-то на уровне между GTX 460 и GTX 550 Ti. Хотя непросто предсказать, что получится в сравнении с видеокартами Nvidia, так как и у тех и у других есть свои сильные и слабые стороны. Наверняка будут игры, в которых победит выпущенное решение компании AMD, но также будут и другие игры, где оно уступит конкурентам. Ну что же, давайте посмотрим.



AMD Radeon HD 6790 — Часть 3: Игровые тесты (производительность)



Блок питания для тестового стенда предоставлен компанией TAGAN

Корпус ThermalTake 8430 для тестового стенда предоставлен компанией 3Logic

Монитор Dell 3007WFP для тестовых стендов предоставлен компанией Nvidia