AMD Radeon HD 7950

Описание видеокарты Powercolor Radeon HD 7950 PCS+ и результаты синтетических тестов


Содержание

В этой части, как обычно, мы изучим саму видеокарту, а также познакомимся с результатами синтетических тестов. В качестве впервые рассматриваемого образца Radeon HD 7950 у нас в лаборатории побывал продукт Powercolor Radeon HD 7950 PCS+ 3072 МБ 384-битной GDDR5 PCI-E.

Плата

Powercolor Radeon HD 7950 PCS+ 3072 МБ 384-битной GDDR5 PCI-E
  • GPU: Radeon HD 7950 (Tahiti)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs): 880 МГц (номинал — 800 МГц)
  • Частота работы памяти (физическая (эффективная)): 1250 (5000) МГц (номинал — 1250 (5000) МГц)
  • Ширина шины обмена с памятью: 384 бит
  • Число вычислительных блоков в GPU/частота работы блоков: 28/880 МГц (номинал — 28/800 МГц)
  • Число операций (ALU) в блоке: 64
  • Суммарное число операций (ALU): 1792
  • Число блоков текстурирования: 112 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 32
  • Размеры: 272×100×33 мм (последняя величина — максимальная толщина видеокарты)
  • Цвет текстолита: черный
  • Энергопотребление (пиковое в 3D/в режиме 2D/в режиме «сна»): 197/62/3 Вт
  • Выходные гнезда: 1×DVI (Dual-Link/VGA), 1×HDMI 1.4a, 2×Mini-DisplayPort 1.2
  • Поддержка многопроцессорной работы: CrossFire X (Hardware)

Powercolor Radeon HD 7950 PCS+ 3072 МБ 384-битной GDDR5 PCI-E
Карта имеет 3072 МБ памяти GDDR5 SDRAM, размещенной в 12 микросхемах на лицевой сторонe PCB.

Микросхемы памяти Hynix (GDDR5). Микросхемы рассчитаны на максимальную частоту работы в 1250 (5000) МГц.

Сравнение с эталонным дизайном HD 7950, вид спереди
Powercolor Radeon HD 7950 PCS+ 3072 МБ 384-битной GDDR5 PCI-E Reference card AMD Radeon HD 7950

Сравнение с эталонным дизайном HD 7950, вид сзади
Powercolor Radeon HD 7950 PCS+ 3072 МБ 384-битной GDDR5 PCI-E Reference card AMD Radeon HD 7950

PCB у HD 7950 по сути повторяет собой печатную плату старшего собрата HD 7970, что и ожидалось, поскольку физически ядро (как кристалл или чип) то же, да и шина обмена с памятью не изменилась.

Напомним, что новое ядро, исполненное по 28-нанометровому техпроцессу, потребляет меньше, чем прежние 40-нанометровые ядра, и потому требования к блоку питания изменились, что привело к некоторой эволюции последнего (хотя по-прежнему в основе его цифрового управления лежит ШИМ-контроллер CHiL). Производитель постарался уложиться в стандартные габариты, и PCB получилась привычных размеров: 270×100 мм. Общая длина карты с кулером оказалась всего на пару миллиметров больше (из-за кожуха СО).

Также напомним, что все карты серии HD 79хх оснащены двумя микросхемами BIOS (это новшество было введено в HD 69хх): сделано это во избежание неудачных прошивок новых версий BIOS. Карта имеет сверху небольшой переключатель, который просто регулирует, какую из микросхем BIOS задействовать при запуске видеокарты. По умолчанию — номер один.

Подключение к аналоговым мониторам с d-Sub (VGA) производится через специальные адаптеры-переходники DVI-to-d-Sub. Также не должно быть проблем с HDMI: ускорители поддерживают полноценную передачу видео и звука на HDMI-приемник, поскольку обладают собственным звуковым кодеком.

Отметим особо, что карта имеет видеовыходы DisplayPort версии 1.2, поэтому есть возможность с помощью специальных хабов выводить картинку с каждого порта DP на три монитора (в сумме — на шесть).

Напомним также, что данные продукты AMD обладают поддержкой технологии AMD Eyefinity, обеспечивая вывод картинки игры одновременно на несколько мониторов. И если обычно это три монитора, то данный продукт Powercolor обеспечивает одновременный вывод картинки на 4 монитора (и можно играть в гигантском разрешении, обеспечиваемом суммарно 4 мониторами).

А из нового — мы уже говорили про планы поставлять все ускорители серии 79хх в комплекте с адаптерами DP-to-DVI, что позволит выводить изображение на 2 или 3 монитора со входами DVI, и следовательно, Eyefinity можно будет организовывать не только с помощью мониторов со входами DP, что резко увеличивает привлекательность данной технологии. Так вот, это все правда, и в комплекте поставки Powercolor есть такой адаптер!

Максимальные разрешения и частоты:

  • 240 Гц — максимальная частота обновления
  • 2048×1536@85 Гц — по аналоговому интерфейсу
  • 2560×1600@60 Гц — по цифровому интерфейсу (для DVI-гнезд с Dual-Link/HDMI)

Что касается возможностей по ускорению декодирования видео — в 2007 году мы проводили такое исследование, с ним можно ознакомиться здесь. За эти годы кое-какие изменения и новации случились, но они не настолько революционны, чтобы можно было считать вышеуказанный материал окончательно устаревшим.

Карта требует дополнительного питания, причем двумя 6-контактными разъемами.

И еще напомним про очень интересную особенность: возможность ухода видеокарты в глубокий «сон». В стандартных настройках энергосбережения Windows предусмотрено гашение монитора через некоторое время неактивности системы, и у множества людей по всему миру компьютеры регулярно входят в этот режим. Остальные компоненты системного блока при этом свой режим работы не меняют (кроме, конечно, центрального процессора, уходящего в сон) — в частности, видеокарта продолжает работать в режиме 2D и на заданных для этого режима частотах. Так вот, теперь Radeon HD 79xx при отключении монитора резко сбрасывает частоты работы, потребляя лишь 3 Вт, и при этом останавливается вентилятор! Это позволяет в целом снизить шум системного блока и потребление энергии; кроме того, кулер в это время не всасывает в себя пыль. Но и этого мало. При работе в системе CrossFire из двух или более карт 79хх, как только завершается работа в 3D-режиме (игрок возвращается в 2D), в работе остается только первая карта, а все остальные точно так же уходят в «сон», потребляя 3 Вт и выключая свои вентиляторы.

О системе охлаждения.

Powercolor Radeon HD 7950 PCS+ 3072 МБ 384-битной GDDR5 PCI-E
Устройство состоит из двух частей: главного радиатора и кожуха.

Перед нами фирменный кулер TUL серии PCS+, который мы наблюдаем уже достаточно длительное время. И всегда это устройство весьма эффективно. В данном случае изменения состоят лишь в адаптации подошвы радиатора под новый чип.

Это массивный радиатор с тепловыми трубками, распространяющими тепло от ядра равномерно по ребрам. Сверху он прикрыт кожухом с двумя качественными вентиляторами, которые работают на небольших оборотах, поэтому даже при максимальной нагрузке в 3D шум минимален.

Поскольку продукт изначально работал на повышенных частотах, мы провели эксперимент и протестировали эту карту на частотах работы Radeon HD 7970, в том числе исследовав температурный режим с помощью утилиты MSI Afterburner (автор А. Николайчук AKA Unwinder) на таких частотах:

Powercolor Radeon HD 7950 PCS+ 3072 МБ 384-битной GDDR5 PCI-E

И мы видим просто великолепную эффективность работы кулера PCS+! Всего 67 градусов на ядре после шести часов работы ускорителя на повышенных частотах под нагрузкой!

Теперь о комплектации.

Базовый комплект поставки должен включать в себя руководство пользователя, диск с драйверами и утилитами, адаптер Mini-DP-to-DP и DP-to-DVI.

Powercolor Radeon HD 7950 PCS+ 3072 МБ 384-битной GDDR5 PCI-E
Перед нами базовый комплект и адаптер DVI-to-VGA. Также есть мост CrossFire.

Упаковка.

Powercolor Radeon HD 7950 PCS+ 3072 МБ 384-битной GDDR5 PCI-E
До недавнего времени мы наблюдали упаковки темных тонов с вертикальным расположением рисунков и надписей, однако теперь серию PCS решили обозначить еще и новым дизайном: коробка прибрела глянцевый супер, на котором уже в ярких красках засвидетельствована серия в виде суперавто, а также четко приведены все основные параметры ускорителя.

Внутри суперобложки — картонный бокс, в котором весь комплект размещен в своих отсеках, а сама карта жестко закреплена в отсеке из пенополиуретана, поэтому перевозка такой дорогой карты вполне безопасна.

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютер на базе Intel Core i7-975 (Socket 1366)
    • процессор Intel Core i7-975 (3340 МГц);
    • системная плата Asus P6T Deluxe на чипсете Intel X58;
    • оперативная память 6 ГБ DDR3 SDRAM Corsair 1600 МГц;
    • жесткий диск WD Caviar SE WD1600JD 160 ГБ SATA;
    • блок питания Tagan TG900-BZ 900 Вт.
  • операционная система Windows 7 64-битная; DirectX 11;
  • монитор Dell 3007WFP (30″);
  • драйверы AMD версии Catalyst 12.1; Nvidia версии 295.52

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

Синтетические тесты проводились на следующих видеокартах:

  • Radeon HD 7950 со стандартными параметрами (далее HD 7950)
  • Radeon HD 7970 со стандартными параметрами (далее HD 7970)
  • Radeon HD 6990 со стандартными параметрами (далее HD 6990)
  • Radeon HD 6970 со стандартными параметрами (далее HD 6970)
  • Geforce GTX 590 со стандартными параметрами (далее GTX 590)
  • Geforce GTX 580 со стандартными параметрами (далее GTX 580)

Для сравнения результатов недавно анонсированной видеокарты Radeon HD 7950 именно эти модели были выбраны по следующим причинам. Radeon HD 7970 взята как старшая модель на том же чипе, имеющая лишь количественные отличия. HD 6970 была взята как предшественник из топового сегмента, ну а HD 6990 — как сильнейшее двухчиповое решение компании AMD, основанное на GPU предыдущей архитектуры.

Выбранные решения конкурирующей компании Nvidia были взяты потому, что Geforce GTX 580 до сих пор является быстрейшей одночиповой моделью этой компании, хотя и основана она на устаревающем GPU нынешнего поколения (а ничего новее Nvidia пока не выпустила). Её результаты интересны не только как максимальные для нынешних одночиповых решений Nvidia, но и потому, что она является конкурентом представленной видеокарты AMD по цене. Ну а двухчиповая GTX 590 является ещё одним экстремальным вариантом с более высокой ценой.

Direct3D 9: тесты Pixel Shaders

Мы решили перестать использовать устаревший тест текстурирования и заполнения (филлрейта) 32-битных текстур из RightMark первой версии, так как большинство видеокарт в нём показывают цифры, далёкие от теоретически возможных и явно некорректные в целом. Лучше мы рассмотрим ниже более похожие на правду результаты скорости текстурирования по цифрам из теста 3DMark Vantage, в котором получаются вполне реалистичные цифры.

Итак, первая группа пиксельных шейдеров, которую мы рассматриваем, очень проста для современных видеочипов, она включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся в старых играх.

Эти тесты слишком просты для современных GPU и в основном ограничены производительностью текстурирования, а иногда филлрейтом. Поэтому они показывают далеко не все возможности современных видеочипов, но бывают интересными с точки зрения учёта устаревших игровых приложений, таких как мультиплатформенные игры.

Похоже, что на результатах самых простых тестов сказались оптимизации в драйверах, так как модель Radeon HD 7950 отстаёт от родственной HD 7970 несколько больше, чем должна уступать по теории. Получилось, что новая модель уступила даже старенькой Radeon HD 6970. И даже по сравнению с конкурирующим Geforce GTX 580 результаты получились не такие впечатляющие, как были у HD 7970.

Производительность в тестах ограничена в основном скоростью текстурных модулей и филлрейтом, и поэтому платы AMD в целом опережают конкурирующие модели Nvidia Geforce. В неудачах Nvidia в этих тестах виноват недостаток скорости текстурирования. А вот пиксельный шейдер освещения с тремя источниками по Фонгу, больше зависящий от математической производительности GPU, на Radeon HD 7950 и Geforce GTX 580 выполняется со схожей скоростью.

Посмотрим на результаты более сложных пиксельных программ промежуточных версий:

И в этот раз получилось похожее на Phong с предыдущей диаграммы. Здесь Radeon HD 7950 уступает старшей модели примерно столько, сколько и должен, исходя из теории. Тест Cook-Torrance более интенсивен вычислительно, и разница в нём примерно соответствует разнице в количестве ALU и их частоте, хотя и от скорости TMU тоже зависит. Тест чуть лучше подходит архитектурам компании AMD, чипы которой имеют большее количество математических блоков, поэтому HD 7950 опережает GTX 580, хоть и ненамного. Интересно, что HD 6970 обгоняет HD 7950 из-за лучшей эффективности исполнения этого шейдера на старом чипе с VLIW4 архитектурой.

Во втором, больше зависящем от скорости текстурирования, тесте процедурной визуализации воды «Water» используется зависимая выборка из текстур больших уровней вложенности, и видеокарты в нём располагаются по скорости текстурирования, с поправкой на разную эффективность использования TMU. В этом тесте у решений компании AMD давно всё отлично, и HD 7950 обеспечивает отличный результат, соответствующий теории. Новая плата AMD опередила топовую одночиповую плату Nvidia почти вдвое.

Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье Современная терминология 3D-графики.
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

Существует два варианта этих шейдеров: с ориентацией на математические вычисления и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это — универсальные тесты, зависящие и от скорости блоков ALU, и от скорости текстурирования, в них важен общий баланс чипа, а также эффективность исполнения сложных программ. Немудрено, что производительность новой видеокарты AMD в тесте «Frozen Glass» оказалась очень хорошей, даже несмотря на то, что из-за специфики разных драйверов она уступила старшей модели больше, чем должна была. Тем не менее, даже двухчиповая плата Nvidia показывает близкий к ней результат, а уж Geforce GTX 580 так и вовсе далеко позади.

Во втором тесте «Parallax Mapping» решения Nvidia чувствуют себя несколько лучше, хотя GTX 580 всё равно отстаёт от всех плат на чипах AMD. Новинка этой компании опережает лучшую одночиповую плату Nvidia с запасом, что говорит о влиянии на скорость рендеринга математических расчётов и скорости текстурирования. В этом тесте новая HD 7950 уже обогнала предшественницу HD 6970, что можно объяснить большей эффективностью скалярной архитектуры для данной задачи.

Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:

Для плат на чипах Nvidia всё стало ещё печальнее, так как скорость текстурирования у всех современных чипов AMD намного выше, поэтому в этих тестах они лишь наращивают своё преимущество. Даже двухчиповая Geforce GTX 590 в обоих тестах с упором на текстурирование может соперничать разве что с недавно анонсированной Radeon HD 7950. А уж GTX 580 так и вовсе осталась в аутсайдерах. Разница между HD 7970 и HD 7950 оказалась примерно равна теоретической.

Это были устаревшие задачи, с упором в текстурирование и иногда в филлрейт. Сейчас мы рассмотрим результаты ещё двух тестов пиксельных шейдеров — но уже версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9. Они наиболее показательны с точки зрения современных игр на ПК, среди которых много мультиплатформенных. Тесты отличаются тем, что сильно нагружают и ALU, и текстурные модули, обе шейдерные программы сложны и длинны, и включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье Современная терминология 3D-графики.
  • Fur — процедурный шейдер, визуализирующий мех.

В самых сложных DX9-тестах из первой версии нашего пакета RightMark видеокарты производства Nvidia всегда выступают достаточно сильно, в противоположность всем предыдущим испытаниям из нашего обзора. Эти тесты уже не ограничены производительностью текстурных выборок, а зависят скорее от эффективности исполнения шейдерного кода. Но и у AMD дела явно идут на поправку. Ранее ещё Radeon HD 6970 улучшил позиции AMD в данном тесте, увеличив эффективность при переходе от архитектуры VLIW5 к VLIW4, а потом Tahiti и вовсе вырвал победу.

Сегодня мы снова видим сильные результаты, уже у Radeon HD 7950 — новая одночиповая модель компании AMD с запасом опередила своего прямого конкурента — видеокарту Geforce GTX 580. Представленная новинка Radeon HD 7950 быстрее конкурирующей Geforce GTX 580 на 20-30%. А улучшение реальной производительности сложных вычислений отлично заметно при сравнении HD 6970, имеющего видеочип VLIW4 архитектуры и новой серии HD 7900.

Скорость в обоих тестах PS 3.0 слабо зависит от ПСП и текстурирования, зато код отличается высокой сложностью, с чем очень неплохо справляется и имеющаяся архитектура Nvidia и новейшая скалярная архитектура компании AMD. Ранее решения Nvidia были неоспоримыми лидерами в этой паре тестов, но видеокарты на базе Tahiti смогли их опередить.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два знакомых теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в этом тесте зависит от количества и эффективности блоков TMU, и от эффективности выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает ещё и эффективный филлрейт (производительность блоков ROP) и пропускная способность памяти. Результаты при детализации уровня «High» получаются примерно в полтора раза ниже, чем при «Low», как и должно быть по теории, но для быстрейших решений разница несколько ниже.

Мы уже отмечали, что в тестах процедурной визуализации меха с большим количеством текстурных выборок решения Nvidia раньше были заметно сильнее, но, начиная с предыдущего поколения компании AMD, разница стала сокращаться. А у решений на базе Tahiti дела обстоят ещё лучшеЮ, Radeon HD 7950 показала отличный результат, оказавшись на уровне двухчиповой платы конкурента и заметно опередив прямого соперника — GTX 580. Видно, что одночиповая HD 6970 из предыдущего поколения сильно позади, что снова говорит об увеличении эффективности новой архитектуры компании.

Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: возможно, в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

Включение суперсэмплинга увеличивает теоретическую нагрузку в четыре раза, и результаты решений Nvidia всегда падают, по сравнению с показателями видеокарт AMD. Теперь разница в эффективности выполнения данной задачи ещё более очевидна, и представленная недавно новинка HD 7950 быстрее даже чем GTX 590. Примерно столько же новой Radeon уступает и Geforce GTX 580. Новая плата линейки Radeon HD 7900 только укрепила лидерство AMD.

Второй шейдерный DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, используются во многих проектах, например в играх серий Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип ещё примерно в два раза — такой режим называется «High».

Диаграмма похожа на предыдущую без включения SSAA, и позиции решений Nvidia не смогли улучшить своё положение. В обновленном D3D10-варианте теста без суперсэмплинга HD 7950 снова показывает результат на уровне двухчиповой GTX 590, значительно опережая и HD 6970 и GTX 580. Лидерство остаётся у старшей HD 7970, а сегодняшний герой уступает примерно столько, сколько и должен проиграть по теории. Посмотрим, что изменит включение суперсэмплинга, он обычно вызывает сильное падение скорости на платах Nvidia.

При включении суперсэмплинга и самозатенения, задача получается ещё более тяжёлой, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая большое падение производительности. Разница между скоростными показателями протестированных видеокарт изменилась, включение суперсэмплинга сказывается, как и в предыдущем случае — карты производства AMD ещё больше укрепили свои показатели относительно решений Nvidia.

И в этот раз Radeon HD 7950 снова немного опережает GTX 590, имеющий два GPU на борту. Старшая плата AMD стала лидером сравнения, показывая результаты выше, чем даже HD 6990. Старые одночиповые платы вроде Radeon HD 6990 и Geforce GTX 580 проигрывают новинке почти в полтора раза. В целом, по этим двум шейдерным D3D10 тестам можно сделать вывод, что и второй представитель новой архитектуры компании AMD великолепно справился с «шейдерными» задачами, лучше традиционно сильных в них конкурирующих плат Nvidia.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты предельных математических тестов чаще всего соответствуют разнице в частотах и количестве вычислительных блоков, но с влиянием разной эффективности их использования. Все архитектуры AMD нескольких последних лет в таких случаях имели просто подавляющее преимущество перед конкурирующими видеокартами Nvidia, вот и сегодня ничего не изменилось — новое решение AMD снова оказалось значительно более производительным, по сравнению с основным соперником.

Результаты видеокарт расположились на диаграмме примерно соответственно теории, за некоторыми исключениями, вроде различной эффективности архитектур. Теоретически, Geforce GTX 580 должна быть даже ещё медленнее. Хотя разница в скорости всё равно впечатляет — новая Radeon HD 7950 опережает GTX 580 на 42%. Интересно сравнение с HD 6970, при небольшом теоретическом превосходстве по вычислениям, новая плата AMD лишь на незаметный 1% быстрее старой HD 6970.

Впрочем, как всегда для AMD, возможно и ещё одно объяснение — на результаты плат HD 7900 могла повлиять технология PowerTune, снижающая частоты при достижении установленного предела по энергопотреблению именно в таких задачах. Впрочем, это ничего не меняет при сравнении с конкурентом, ведь даже двухчиповая плата Geforce GTX 590 всего лишь достигла уровня HD 7950.

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нём только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Тут мы снова видим почти идентичную предыдущей картину, только сами цифры поменялись, но не их соотношение. Все GPU остались примерно на тех же позициях, и хотя строгого соответствия теоретическим цифрам пиковой производительности нет, результаты всех решений всё же довольно близки к сухой теории. Разница между HD 7970 и HD 7950 всё такая же, соответствующая пиковым цифрам скорости вычислений.

Скорость рендеринга в этом тесте ограничена исключительно производительностью шейдерных блоков и их эффективностью, поэтому двухчиповая HD 6990 снова стала лидером, а за ней следует топовая одночиповая плата на базе Tahiti. Вторая плата на этом GPU, которую мы сегодня рассматриваем, стала третьей и опережает как Radeon HD 6970, так и обе платы Geforce. Если конкретно, то модель GTX 580 отстала аж на 57%.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаковое для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS почти двукратное. Задача эта для современных видеокарт не слишком сложная, и производительность в ней ограничена в основном скоростью обработки геометрии и пропускной способностью памяти/филлрейтом, в рамках решений одного производителя.

В этом тесте проявились улучшенные возможности новой архитектуры по обработке геометрии — обе новые модели видеокарт AMD неплохо справились с работой, по скорости выполнения геометрических расчётов почти догнали и Geforce GTX 580 и двухчиповый Radeon HD 6990. Новая одночиповая видеокарта HD 7950 оказалась всё же чуть медленнее своего прямого конкурента в лице Geforce GTX 580.

Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры почти не изменились для решений Nvidia и AMD. К сожалению, все видеокарты в данном тесте слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер. Поэтому новых выводов не появилось — всё осталось примерно как и в предыдущий раз. Посмотрим, что изменится в следующем тесте, который предполагает большую нагрузку именно на геометрические шейдеры.

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленным в «Heavy» — ещё и для их отрисовки. То есть в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер. Сначала рассматриваем лёгкий режим:

Относительные результаты в разных режимах снова примерно соответствуют изменению нагрузки: во всех случаях производительность неплохо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть несколько менее чем в два раза медленней.

В этом тесте скорость рендеринга ограничена в основном геометрической производительностью, и оба решения на базе новой архитектуры компании AMD показывают себя просто отлично, а старшее даже обгоняет одночиповую карту Geforce GTX 580. Обе двухчиповые платы показали некорректные результаты, а свежий HD 7950 очень близок к уровню GTX 580, что можно считать явным успехом. Старшей модели HD 7970 новая плата уступает исключительно из-за сниженной тактовой частоты GPU.

Цифры должны измениться на следующей диаграмме, в тесте с более активным использованием геометрических шейдеров. Также будет интересно сравнить друг с другом результаты, полученные в режимах «Balanced» и «Heavy».

На этот раз победу празднует всё-таки Nvidia. Двухчиповые карты снова отбрасываем, и явным лидером становится Geforce GTX 580, имеющая явное преимущество перед чипами AMD с традиционным графическим конвейером, разве что двумя растеризаторами. GPU с архитектурой Fermi имеет распараллеленную обработку геометрии, что даёт столь впечатляющие результаты — Geforce GTX 580 обгоняет младшее решение линейки Radeon HD 7900 на 55-60%.

Подводя итог геометрических тестов, отметим, что возможности по обработке геометрии и скорости исполнения геометрических шейдеров у нового топового чипа AMD явно серьёзно улучшены, и оба решения на базе чипов Tahiti показывают в тестах результаты заметно выше, чем решения на базе предыдущих чипов. И всё же, в наиболее тяжёлых условиях видеочипы Nvidia справляются с такой работой лучше конкурентов.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Предыдущие наши исследования показали, что на результаты этого теста влияет сразу и скорость текстурирования и пропускная способность памяти. И результаты видеокарт тут часто чем-то ограничены — например, между двухчиповой GTX 590 и одночиповым аналогом GTX 580 почти нет разницы. А вот у плат AMD всё в порядке, HD 6990 вдвое быстрее чем HD 6970.

Младшая плата компании AMD из семейства Radeon HD 7900 показала очень хорошие результаты, обогнав своего конкурента GTX 580 в двух из трёх подтестов, уступив только в самом лёгком. Естественно, что старшая модель ещё быстрее, в зависимости от режима, но исключительно из-за сниженной рабочей частоты. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Взаимное расположение карт на диаграмме несколько изменилось, и больше всего это относится к тяжёлому режиму. При малом количестве полигонов скорость рендеринга в тесте упирается в ПСП, и поэтому платы AMD были так сильны и на предыдущей диаграмме.

А вот в тяжёлых режимах одночиповая видеокарта Nvidia показывает результат между двумя моделями серии Radeon HD 7900, и даже ближе к старшей. Но рассматриваемая нами в статье Radeon HD 7950 уступила ей совсем немного.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты во втором тесте вершинного текстурирования «Waves» не похожи на то, что мы видели на предыдущих двух диаграммах. В этом тесте видеокарты AMD и Nvidia разделились на две группы: старые видеокарты AMD и Nvidia, а также новые платы AMD и двухчиповая HD 6990.

Новая модель из семейства Southern Islands с индексом HD 7950 уступила старшей сестре не так уж много, и во всех условиях обогнала конкурента Geforce GTX 580. Двухчиповая HD 6990 тут стала лучшей среди всех, особенно в лёгком режиме. Разница между картами на базе графических процессоров Cayman и Tahiti говорит о явных улучшениях эффективности работы новых GPU. Рассмотрим второй вариант этого же теста:

В этом тесте произошли изменения, аналогичные тем, что мы видели ранее — видеокарты Nvidia ухудшили свои результаты только в лёгком режиме, а большинство решений AMD уступили сразу во всех. Впрочем, это всё-таки не позволило платам на чипах Nvidia обогнать обе свежие платы семейства Radeon HD 7900. Младшая из них обогнала обе платы конкурента, уступив двухчиповой GTX 590 лишь в самом лёгком режиме.

В целом, свежеанонсированная вторая плата из семейства HD 7900 в тестах вершинных выборок показала себя очень неплохо, она почти всегда была впереди конкурирующих видеокартх Nvidia и предшествующей одночиповой модели AMD.

3DMark Vantage: тесты Feature

Синтетические тесты из пакета 3DMark Vantage покажут нам то, что мы ранее упустили. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10 и интересны тем, что отличаются от наших и до сих пор актуальны. При анализе результатов новой видеокарты Radeon HD 7950 в этом пакете мы сможем сделать какие-то новые и полезные выводы, ускользнувшие от нас в тестах семейства RightMark.

Feature Test 1: Texture Fill

Первый тест — тест скорости текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Хотя тест компании Futuremark не показывает теоретически возможный уровень производительности текстурных выборок, но эффективность видеокарт и AMD и Nvidia в нём достаточно высока. Вторая видеокарта из нового семейства Radeon HD 7900 показывает результат, близкий к соответствующему теоретическому параметру. Она справляется с работой несколько эффективнее, чем плата из предыдущего поколения.

Radeon HD 7950 опережает GTX 580 примерно на 80%, что полностью соответствует теории. Новинке проигрывает не только конкурирующая GTX 580, но даже и двухчиповая карта Nvidia. То же самое касается и разницы между двумя моделями на Tahiti — разница между ними полностью соответствует пиковым показателям. Вероятно, текстурные модули нового GPU используются эффективнее из-за улучшений в системе памяти и кэширования.

Feature Test 2: Color Fill

Это тест скорости заполнения. Используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Ситуация в тесте производительности блоков ROP совсем другая. Цифры этого подтеста из 3DMark Vantage показывают производительность блоков ROP, с дополнительным влиянием величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»). И тут новая модель HD 7950 также показывает очень хороший результат, опережая прямого конкурента и карту предыдущего поколения и отставая лишь от двухчиповых видеокарт и топовой модели AMD на том же GPU (и то — лишь на 10%).

Разница по скорости между Radeon HD 7950 и Geforce GTX 580 составляет примерно 25%, что полностью соответствует теоретической разнице в ПСП (36%), а не чистой скорости блоков ROP. То есть, тест всё же измеряет скорее пропускную способность, чем производительность ROP.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нём рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоёмкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжёлого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчёты освещения по Strauss.

Данный тест отличается от остальных тем, что результаты в нём зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от всего понемногу. Для достижения высокой скорости тут важен баланс блоков GPU, также весьма заметно влияет на скорость и эффективность выполнения ветвлений в шейдерах.

Сравнительные результаты видеокарт AMD на диаграмме похожи на то, что мы видели в тесте текстурной производительности, но новые платы серии Radeon HD 7900 заметно эффективнее в этой задаче. Топовая модель серии почти догнала двухчиповую HD 6990, а сегодняшний герой HD 7950 идёт вровень с двухчиповой GTX 590! Платы Nvidia хотя и получили некоторое увеличение производительности, по сравнению с текстурным тестом, но его явно недостаточно.

Сравнительные цифры решений на чипах Cayman и Tahiti явно не соответствуют разнице между ними по чисто теоретическим параметрам и означают улучшенную эффективность исполнения сложных вычислений с ветвлениями у новой архитектуры. Новая видеоплата компании AMD оказалась явно быстрее топовой одночиповой модели из линейки Geforce GTX 500.

Feature Test 4: GPU Cloth

Тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте также может зависеть от нескольких параметров, но основными факторами влияния являются производительность обработки геометрии, эффективность выполнения геометрических шейдеров и, как ни странно, производительность ROP — именно к этому теоретическому показателю ближе всего полученные цифры. И поэтому вполне логично, что видеокарты производства Nvidia чувствуют себя в этом приложении очень хорошо, значительно опережая своих конкурентов.

Даже представленная чуть раньше Radeon HD 7970, несмотря на явное улучшение геометрической производительности и скорости ROP, не смогла составить конкуренцию одночиповой же Geforce GTX 580. Это один из тех тестов, в которых видно преимущество решений Nvidia, которые продолжают тут лидировать. Radeon HD 7950 по вполне понятной причине также не смогла опередить GTX 580, но её отставание не такое уж большое.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующих частицу. Но тест больше всего загружает шейдерные блоки вершинными расчётами, также тестируется stream out.

Результаты очередного теста из пакета 3DMark Vantage весьма похожи на те, что мы видели на предыдущей диаграмме, хотя скорость обработки геометрии и производительность ROP тут стала даже ещё важнее. И видеокарты с чипами Nvidia вывались вперёд ещё дальше, оставив позади даже двухчипового монстра — Radeon HD 6990. Даже GTX 580 обогнала абсолютно все платы AMD, в том числе и обе модели на базе видеочипа Tahiti.

Младшая плата, основанная на новом чипе AMD, показала довольно неплохой результат, по сравнению с решениями на базе Cayman и Cypress, но до Geforce GTX 580 ей тут очень далеко. В общем, в синтетических тестах имитации тканей и частиц из тестового пакета 3DMark Vantage, в которых активно используются геометрические шейдеры, решения AMD продолжают отставать от конкурирующих видеокарт соперника, имеющих весьма высокую скорость обработки геометрии и большую производительность блоков ROP.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует очень много математических расчётов.

В математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы обычно видим другое распределение результатов, по сравнению с аналогичными тестами из нашего тестового пакета. Показанная на диаграмме производительность решений лишь примерно соответствует тому, что должно получаться по теории и точно расходится с тем, что мы видели ранее в математических тестах из пакета RightMark 2.0.

Архитектура нового чипа Tahiti явно лучше справляется с задачей, чем Cayman. При сравнении карт Nvidia и решений линейки HD 7900, имеющих схожие архитектуры, практическое соотношение результатов близко к теоретическому. Эффективность использования имеющихся ALU у этих чипов разных производителей близкая, в отличие от предыдущих решений AMD, имеющих VLIW архитектуру.

Итак, что касается представленной недавно новинки, то можно чётко сказать, что Radeon HD 7950 обходит обе видеоплаты Nvidia, в т. ч. и двухчиповую GTX 590. Калифорнийцам в следующем поколении Kepler обязательно нужно усилить математическую мощь (что, по слухам, и было сделано, к слову). Ну а пока что получается привычная картина — видеокарты Radeon показывают заметно лучшие результаты в случаях, когда выполняется простая и интенсивная математика. Решения на Tahiti тут лишь усугубили ситуацию.

Выводы по синтетическим тестам

По результатам проведённых синтетических тестов новой модели Radeon HD 7950, основанной на графическом процессоре Tahiti Pro, а также результатам других моделей видеокарт производства обоих производителей дискретных видеочипов, можно смело сделать вывод о том, что эта видеокарта стала одним из наиболее мощных одночиповых решений, доступных на сегодняшний день. Это уже вторая модель удачной линейки Radeon HD 7900, которая должна помочь укрепить позиции компании AMD на рынке.

Графический процессор Tahiti Pro выполнен на основе новой архитектуры GCN, с применением последнего технологического процесса 28 нм. «Облегчённая» Pro-версия этого GPU отличается от полноценной лишь несколькими отключенными вычислительными блоками ALU, а также пониженной частотой работы. Новая архитектура несёт важные изменения, направленные на увеличение эффективности вычислений на GPU, а также улучшение производительности обработки геометрических данных. И наши синтетические тесты подтверждают увеличение эффективности в сложных задачах, а также ускорение выполнения геометрических шейдеров и тесселяции.

Благодаря архитектурным изменениям и неплохим характеристикам, вторая видеокарта новой серии во многих синтетических тестах занимает очень хорошую позицию, особенно по сравнению со своим прямым конкурентом Geforce GTX 580. И хотя у нового GPU есть и некоторые недостаточно сильные стороны, вроде проигрыша в самых сложных геометрических тестах, в целом результаты в синтетике были показаны очень хорошие — новая плата AMD явно чуть быстрее решения конкурента.

Вероятно, в нынешних мультиплатформенных играх будет несколько сложнее добиться впечатляющих результатов, но всё же мы уверены, что результаты Radeon HD 7950 в синтетических тестах будут подтверждены отличными показателями и в «игровой» части нашего материала. В играх новая HD 7950 должна показать скорость примерно на уровне Geforce GTX 580, а то и чуть выше. Естественно, всегда будут существовать тесты, где преимущество будет больше, а где-то его может и вовсе не быть. Итак, переходим к следующей части материала — исследованию скорости в играх.

Часть 3 — производительность в игровых тестах →

Блок питания для тестового стенда предоставлен компанией Tagan

Корпус ThermalTake 8430 для тестового стенда предоставлен компанией 3Logic

Монитор Dell 3007WFP для тестовых стендов предоставлен компанией Nvidia




Дополнительно

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.