AMD Radeon HD 7770/7750

Описание видеокарт и результаты синтетических тестов


Содержание

В этой части, как обычно, мы изучим новые видеокарты, а также познакомимся с результатами синтетических тестов. В качестве впервые рассматриваемого образца Radeon HD 7770 у нас в лаборатории побывал продукт Powercolor Radeon HD 7770 1024 МБ 128-битной GDDR5 PCI-E. А продукт Radeon HD 7750 представляет референс-карта.

Плата

Powercolor Radeon HD 7770 1024 МБ 128-битной GDDR5 PCI-E
  • GPU: Radeon HD 7770 (Cape Verde)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs): 1000 МГц (номинал — 1000 МГц)
  • Частота работы памяти (физическая (эффективная)): 1125 (4500) МГц (номинал — 1125 (4500) МГц)
  • Ширина шины обмена с памятью: 128 бит
  • Число вычислительных блоков в GPU/частота работы блоков: 10/1000 МГц (номинал — 10/1000 МГц)
  • Число операций (ALU) в блоке: 64
  • Суммарное число операций (ALU): 640
  • Число блоков текстурирования: 40 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 16
  • Размеры: 215×100×35 мм (последняя величина — максимальная толщина видеокарты)
  • Цвет текстолита: красный
  • Энергопотребление (пиковое в 3D/в режиме 2D/в режиме «сна»): 82/45/3 Вт
  • Выходные гнезда: 1×DVI (Dual-Link/VGA), 1×HDMI 1.4a, 2×Mini-DisplayPort 1.2
  • Поддержка многопроцессорной работы: CrossFire X (Hardware)
AMD Radeon HD 7750 1024 МБ 128-битной GDDR5 PCI-E
  • GPU: Radeon HD 7750 (Cape Verde)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs): 800 МГц (номинал — 800 МГц)
  • Частота работы памяти (физическая (эффективная)): 1125 (4500) МГц (номинал — 1125 (4500) МГц)
  • Ширина шины обмена с памятью: 128 бит
  • Число вычислительных блоков в GPU/частота работы блоков: 8/800 МГц (номинал — 8/800 МГц)
  • Число операций (ALU) в блоке: 64
  • Суммарное число операций (ALU): 512
  • Число блоков текстурирования: 32 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 16
  • Размеры: 170×100×16 мм (последняя величина — максимальная толщина видеокарты)
  • Цвет текстолита: черный
  • Энергопотребление (пиковое в 3D/в режиме 2D/в режиме «сна»): 58/27/3 Вт
  • Выходные гнезда: 1×DVI (Dual-Link/VGA), 1×HDMI 1.4a, 1×DisplayPort 1.2
  • Поддержка многопроцессорной работы: CrossFire X (Software)

Powercolor Radeon HD 7770 1024 МБ 128-битной GDDR5 PCI-E
Карта имеет 1024 МБ памяти GDDR5 SDRAM, размещенной в 4 микросхемах на лицевой сторонe PCB.

Микросхемы памяти Hynix (GDDR5). Микросхемы рассчитаны на максимальную частоту работы в 1250 (5000) МГц.
AMD Radeon HD 7750 1024 МБ 128-битной GDDR5 PCI-E
Карта имеет 1024 МБ памяти GDDR5 SDRAM, размещенной в 4 микросхемах на лицевой сторонe PCB.

Микросхемы памяти Hynix (GDDR5). Микросхемы рассчитаны на максимальную частоту работы в 1250 (5000) МГц.

Сравнение с эталонным дизайном, вид спереди
Powercolor Radeon HD 7770 1024 МБ 128-битной GDDR5 PCI-E Reference card AMD Radeon HD 7770
AMD Radeon HD 7750 1024 МБ 128-битной GDDR5 PCI-E Reference card AMD Radeon HD 7750

Сравнение с эталонным дизайном, вид сзади
Powercolor Radeon HD 7770 1024 МБ 128-битной GDDR5 PCI-E Reference card AMD Radeon HD 7770
AMD Radeon HD 7750 1024 МБ 128-битной GDDR5 PCI-E Reference card AMD Radeon HD 7750

Оба продукта имеют идентичную конфигурацию микросхем памяти и их расположение вокруг GPU. Собственно, ядро, установленое на них, также одно и то же, просто в случае HD 7750 оно урезано по блокам. Однако меньшие частоты, а также меньший вольтаж позволили обойтись без внешнего питания, и потому PCB у HD 7750 значительно упрощена и имеет компактные размеры.

В то же время PCB у HD 7770 выглядит для платы такого уровня, всего с 4 микросхемами памяти, несколько великоватой, однако не будем забывать, что референс-дизайн всегда предусматривает определенный запас стабильности в работе и всяческие перестраховки. Поэтому мы ждем, что партнеры AMD выпустят свои карты HD 7770 с собственным дизайном, у которых размеры печатных плат будут уменьшены. А пока наблюдаем, что в Powercolor полностью повторили эталонный дизайн.

Подключение к аналоговым мониторам с d-Sub (VGA) производится через специальные адаптеры-переходники DVI-to-d-Sub. Также не должно быть проблем с HDMI: ускорители поддерживают полноценную передачу видео и звука на HDMI-приемник.

Отметим особо, что обе карты имеют видеовыходы DisplayPort версии 1.2 (правда, в случае с HD 7750 такой выход всего один, но зато не в формате мини), поэтому есть возможность с помощью специальных хабов выводить картинку с каждого порта DP на три монитора.

Напомним также, что данные продукты AMD обладают поддержкой технологии AMD Eyefinity, обеспечивая вывод картинки игры одновременно на несколько мониторов. Впрочем, для продуктов такого уровня это не актуально, ибо они просто не потянут современную игрушку в сверхвысоком разрешении. Заметим, что продукт Powercolor обладает возможностью подключения к карте одновременно 4 мониторов. Не знаем, кому это может быть интересно.

Максимальные разрешения и частоты:

  • 240 Гц — максимальная частота обновления
  • 2048×1536@85 Гц — по аналоговому интерфейсу
  • 2560×1600@60 Гц — по цифровому интерфейсу (для DVI-гнезд с Dual-Link/HDMI)

Что касается возможностей по ускорению декодирования видео — в 2007 году мы проводили такое исследование, с ним можно ознакомиться здесь. За эти годы кое-какие изменения и новации случились, но они не настолько революционны, чтобы можно было считать вышеуказанный материал окончательно устаревшим.

Карта HD 7770 требует дополнительного питания, причем одним 6-контактным разъемом. HD 7750 внешнего питания не требует. Именно поэтому мы не стали экспериментровать с «переделками HD 7750 в HD 7770».

Мы уже не раз говорили про очень интересную особенность семейства HD 7ххх (которой обладают и карты HD 77хх): возможность ухода видеокарты в глубокий «сон». В стандартных настройках энергосбережения Windows предусмотрено гашение монитора через некоторое время неактивности системы. Остальные компоненты системного блока при этом свой режим работы не меняют (кроме, конечно, центрального процессора, уходящего в сон) — в частности, видеокарта продолжает работать в режиме 2D и на заданных для этого режима частотах. Так вот, теперь Radeon HD 7хxx при отключении монитора резко сбрасывает частоты работы, потребляя лишь 3 Вт, и при этом останавливается вентилятор! Это позволяет в целом снизить шум системного блока и потребление энергии; кроме того, кулер в это время не всасывает в себя пыль. Но и этого мало. При работе в системе CrossFire из двух или более карт HD 7ххх, как только завершается работа в 3D-режиме (игрок возвращается в 2D), в работе остается только первая карта, а все остальные точно так же уходят в «сон», потребляя 3 Вт и выключая свои вентиляторы.

О системах охлаждения.

Powercolor Radeon HD 7770 1024 МБ 128-битной GDDR5 PCI-E
Устройство охлаждения очень простое, несмотря на внешний массивный вид: под кожухом скрывается всего лишь небольшой округлый радиатор из алюминиевых сплавов, над которым в кожухе расположен вентилятор.

Остальное пространство в кожухе — не занято ничем. Вентилятор работает на малых оборотах (при самом большом нагреве достигая 36% от максимальных оборотов), поэтому шума практически не слышно. Что и следовало ожидать от карты с процессором, произведенным по 28-нанометровому техпроцессу.

Полагаем, что данный случай дает шансы партнерам AMD применять огромное количество вариантов СО, поскольку ядро не сильно греется.
AMD Radeon HD 7750 1024 МБ 128-битной GDDR5 PCI-E
А здесь СО вообще банальна как валенок: плоский радиатор, и в нем вентилятор. Очевидно, что при желании можно установить и пассивную СО без вентилятора вообще, и наверное, партнеры AMD так и будут поступать.

Однако подобное упрощение СО сразу же повлекло за собой более высокий нагрев ядра, да и вентилятор уже достигал 58% от максимальных оборотов, и иногда его было слышно, что не очень хорошо для столь дешевого продукта.

Еще раз обращаем внимание, что это лишь референс-карта, партнеры будут устанавливать свои собственные СО, здесь у них поле деятельности очень велико.

Мы исследовали температурный режим с помощью утилиты MSI Afterburner (автор А. Николайчук AKA Unwinder):

Powercolor Radeon HD 7770 1024 МБ 128-битной GDDR5 PCI-E
AMD Radeon HD 7750 1024 МБ 128-битной GDDR5 PCI-E

Что и следовало ожидать: кулер на карте Powercolor (которая представляет собой копию референса) прекрасно справляется с работой, и нагрев всего в рамках 65 градусов, когда как уж слишком упрощенный дизайн СО у HD 7750 привел к нагреву в 78 градусов. Обе карты прогонялись под нагрузкой в течение шести часов.

Теперь о комплектации. Reference card AMD Radeon HD 7750 попала к нам без комплекта.

Базовый комплект поставки должен включать в себя руководство пользователя, диск с драйверами и утилитами, адаптер Mini-DP-to-DP.

Powercolor Radeon HD 7770 1024 МБ 128-битной GDDR5 PCI-E
Перед нами базовый комплект и адаптер DVI-to-VGA.

Упаковка.

Powercolor Radeon HD 7770 1024 МБ 128-битной GDDR5 PCI-E
Упаковка представляет собой бокс из картона, одетый в глянцевую суперобложку в красных тонах, где приведены все основные параметры карты.

Внутри суперобложки — картонный бокс, в котором весь комплект размещен в своих отсеках, сама карта упакована в мягкий пакет и жестко закреплена в отсеке, поэтому перевозка такой дорогой карты вполне безопасна.

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютер на базе Intel Core i7-975 (Socket 1366)
    • процессор Intel Core i7-975 (3340 МГц);
    • системная плата Asus P6T Deluxe на чипсете Intel X58;
    • оперативная память 6 ГБ DDR3 SDRAM Corsair 1600 МГц;
    • жесткий диск WD Caviar SE WD1600JD 160 ГБ SATA;
    • блок питания Tagan TG900-BZ 900 Вт.
  • операционная система Windows 7 64-битная; DirectX 11;
  • монитор Dell 3007WFP (30″);
  • драйверы AMD версии Catalyst 12.1; Nvidia версии 295.52

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

В качестве синтетических тестов DirectX 11 мы использовали примеры из пакетов SDK компаний Microsoft и AMD, а также демонстрационной программой Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010).

Мы взяли и приложения обоих производителей видеочипов: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain, также известная как Island11 (автор — Тимофей Чеблоков, известный специалист 3D-графики).

Синтетические тесты проводились на следующих видеокартах:

  • Radeon HD 7770 со стандартными параметрами (далее HD 7770)
  • Radeon HD 7750 со стандартными параметрами (далее HD 7750)
  • Radeon HD 6870 со стандартными параметрами (далее HD 6870)
  • Radeon HD 6850 со стандартными параметрами (далее HD 6850)
  • Geforce GTX 560 со стандартными параметрами (далее GTX 560)
  • Geforce GTX 550 Ti со стандартными параметрами (далее GTX 550 Ti)

Для сравнения результатов двух анонсированных видеокарт линейки Radeon HD 7700 эти модели были выбраны по следующим причинам. Radeon HD 6870 и HD 6850 взяты, как более старшие модели предыдущего поколения — интересно, насколько они быстрее менее дорогих новинок из семейства HD 7000? Тем более что цены на эти «устаревшие» модели сейчас очень выгодные. Ну а выбранные решения конкурирующей компании Nvidia были взяты потому, что Geforce GTX 560 и GTX 550 Ti имеют близкие к указанным продуктам AMD цены, поэтому являются их конкурентами на данный момент.

Direct3D 9: тесты Pixel Shaders

Мы перестали использовать свой тест текстурирования и заполнения (филлрейта) 32-битных текстур из RightMark первой версии, так как большинство видеокарт в нём показывают цифры, далёкие от теоретически возможных и явно некорректные в целом. Далее мы рассмотрим более похожие на правду результаты скорости текстурирования по цифрам из теста 3DMark Vantage, в котором получаются вполне реалистичные цифры.

А первая группа пиксельных шейдеров, которую мы рассматриваем, очень проста для современных видеочипов, она включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся в старых играх.

Тесты слишком просты для современных GPU и в основном ограничены производительностью текстурирования, но иногда и филлрейтом. Поэтому они показывают далеко не все возможности современных видеочипов, даже если они из бюджетных серий. Но тесты интересны с точки зрения учёта устаревших игровых приложений.

Итак, производительность в тестах ограничена в основном скоростью текстурных модулей и филлрейтом, и поэтому старые видеоплаты AMD из другого ценового диапазона стали победителями. Как ни странно, но с конкурирующими моделями Nvidia Geforce новинки от AMD идут почти вровень, даже немного отстают!

Посмотрим на результаты более сложных пиксельных программ промежуточных версий:

В этот раз снова получилось, что карты серии Radeon HD 7700 весьма близки к своим конкурентам от Nvidia по производительности. Тест Cook-Torrance более интенсивен вычислительно, и разница в нём примерно соответствует разнице в количестве ALU и их частоте, но и от скорости TMU также зависит. Данный тест снова лучше подходит старой VLIW архитектуре компании AMD, и поэтому решения HD 6800 легко опережают и Geforce и новые Radeon.

Во втором, больше зависящем от скорости текстурирования, тесте процедурной визуализации воды «Water» используется зависимая выборка из текстур больших уровней вложенности, и поэтому видеокарты в нём располагаются по скорости текстурирования, с поправкой на разную эффективность использования TMU. В этом тесте свежие решения компании AMD имеют некоторое преимущество перед Geforce, да и к картам линейки HD 6800 они подобрались уже гораздо ближе.

Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье Современная терминология 3D-графики.
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

Существует два варианта этих шейдеров: с ориентацией на математические вычисления и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это — универсальные тесты, производительность в которых зависит и от скорости блоков ALU, и от скорости текстурирования, в них важен общий баланс чипа, а также эффективность исполнения вычислительных программ. И всё же, очередной тест показывает нам, что в устаревших задачах архитектура VLIW неплохо справляется, опережая новые GPU. Производительность новых видеокарт AMD в тесте «Frozen Glass» примерно соответствует результатам конкурентов от Nvidia, хотя обе платы серии HD 6800 далеко впереди.

Во втором тесте «Parallax Mapping» решения Nvidia чувствуют себя немного лучше и они уже опережают представленные платы AMD. Ну а лидерами сравнения в очередной раз стали старые платы Radeon, имеющие больший филлрейт и количество потоковых процессоров. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:

Для плат с GPU производства Nvidia всё стало несколько хуже, так как скорость текстурирования у современных чипов AMD выше. Поэтому Radeon в этих тестах наращивают своё преимущество, и теперь результаты обеих Geforce оказываются между HD 7770 и HD 7750. Впрочем, противопоставить серии более высокого уровня, но предыдущего поколения, всё так же нечего — Radeon HD 6800 тут явно быстрее.

Это были устаревшие задачи, с упором в текстурирование и иногда в филлрейт. Сейчас мы рассмотрим результаты ещё двух тестов пиксельных шейдеров — но уже версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9. Они наиболее показательны с точки зрения современных игр на ПК, среди которых много мультиплатформенных. Тесты отличаются тем, что сильно нагружают и ALU, и текстурные модули, обе шейдерные программы сложны и длинны, и включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье Современная терминология 3D-графики.
  • Fur — процедурный шейдер, визуализирующий мех.

В наших самых сложных DX9-тестах из первой версии пакета RightMark видеокарты производства Nvidia всегда выступают достаточно сильно, в противоположность всем предыдущим испытаниям из нашего обзора. Тем более интересно, что ровно так же ведут себя и решения на чипах архитектуры GCN — если в предыдущих тестах им нечем было хвастать, то в PS 3.0 сравнении они показали свою силу.

Эти тесты уже не ограничены производительностью текстурных выборок, а зависят именно от эффективности исполнения шейдерного кода. Ранее Radeon HD 6970 улучшил позиции AMD в данном тесте, увеличив эффективность при переходе от архитектуры VLIW5 к VLIW4, а затем GCN в лице Tahiti и Cape Verde укрепили результат. Улучшение производительности в сложных вычислениях отлично заметно при сравнении старых и новых плат AMD.

Сегодня мы снова видим хорошие цифры от Radeon HD 7700 — новые модели компании AMD попарно опередили своих предшественников из серии HD 6800. Что касается их конкурентов из стана Geforce, то в целом можно признать победу Radeon с небольшим перевесом. Представленная новинка Radeon HD 7770 быстрее не только GTX 550 Ti, но и более дорогой GTX 560, а HD 7750 опережает младшую Geforce.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два знакомых теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в этом тесте зависит от количества и эффективности блоков TMU, и от эффективности выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает ещё и эффективный филлрейт (производительность блоков ROP) и пропускная способность памяти. Результаты при детализации уровня «High» получаются до полутора раза ниже, чем при «Low».

В тестах процедурной визуализации меха с большим количеством текстурных выборок, решения Nvidia раньше были заметно сильнее, но за пару поколений GPU компания AMD не только сократила разницу, но выпуском GCN вырвалась вперёд. Так, что даже Radeon HD 7750 идёт на уровне GTX 560, не говоря уже про HD 7770, который показал результат между HD 6850 и HD 6870, что очень неплохо. Это говорит об увеличении эффективности новой архитектуры компании в случае более сложных вычислений.

Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: возможно, в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

Включение суперсэмплинга увеличивает теоретическую нагрузку вчетверо, и результаты решений Nvidia очень сильно снизились, по сравнению с показателями видеокарт от AMD. Теперь разница в эффективности выполнения данной задачи стала просто огромной, и обе протестированные видеокарты Nvidia проигрывают всем представителям от AMD. Новинки же серии HD 7700 показали хороший уровень производительности, старшая модель почти не уступила HD 6870 (явно более высокого уровня на момент выхода), и младшая чуть больше проиграла HD 6850.

Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 интереснее для нас с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, используются во многих проектах, например в играх серий Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип ещё примерно в два раза — такой режим называется «High».

Диаграмма похожа на предыдущую (без включения SSAA), и решения Nvidia не смогли улучшить своё незавидное положение. В обновленном D3D10-варианте теста без суперсэмплинга Geforce GTX 560 конкурирует разве что с HD 7750, а GTX 550 Ti и вовсе худшая в данном сравнении. Впрочем, победили снова карты предыдущего поколения, хотя HD 7770 уступила лучшей из них не так уж и много. Посмотрим, что изменит включение суперсэмплинга, он обычно вызывает сильное падение скорости на платах Nvidia.

При включении суперсэмплинга и самозатенения, задача получается ещё более тяжёлой, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьёзное падение производительности. Разница между скоростными показателями протестированных видеокарт изменилась, включение суперсэмплинга сказывается, как и в предыдущем случае — карты производства AMD значительно улучшили относительные показатели, по сравнению с платами на чипах Nvidia.

В этот раз Radeon HD 7770 снова немного не дотянулась до HD 6870, но лишь в условиях меньшей детализации. В более сложном режиме она всё-таки стала лучшей. К сожалению, урезание HD 7750 сказалось настолько сильно, что она не смогла конкурировать ни с одной из плат серии HD 6800. Правда, GTX 560 всё же немного опередила. В целом, по рассмотренным двум шейдерным D3D10 тестам можно подтвердить ранее сделанный нами вывод о том, что новая архитектура компании AMD отлично справилась с «шейдерными» задачами, заметно лучше конкурирующих плат Nvidia.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты предельных математических тестов чаще всего соответствуют разнице в частотах и количестве вычислительных блоков, но с влиянием разной эффективности их использования. Все архитектуры AMD нескольких последних лет в таких случаях имели подавляющее преимущество перед конкурирующими видеокартами Nvidia, но в случае сравнения GCN с Fermi ситуация немного изменилась.

Любопытно, но новые решения AMD даже в теории по скорости математических вычислений оказались близки к соответствующим им по цене платам Nvidia. Что мы и видим на диаграмме — результаты видеокарт расположились там примерно соответственно теории, за небольшими исключениями. Разница в скорости между HD 7750/HD 7770 и GTX 550 Ti/GTX 560 далеко не такая, как была во времена VILW архитектур у AMD. Хотя новые платы серии Radeon HD 7700 продолжают опережать Geforce, но разница уже не столь впечатляющая. Сравните хотя бы с имеющими чуть более сложный GPU решениями серии Radeon HD 6800. Похоже, в AMD намеренно изменили баланс своих чипов в пользу большей реальной производительности, но меньших пиковых показателей.

Что ж, рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нём только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Мы снова видим почти идентичную предыдущей картину, разве что сами цифры поменялись, но не их соотношение. Все графические процессоры остались примерно на тех же позициях. Хотя строгого соответствия теоретическим цифрам пиковой производительности нет, результаты всех решений к ним довольно близки. Так, разница между HD 7770 и HD 7750 близка к соответствующему соотношению пиковых цифра по скорости вычислений.

Скорость рендеринга в этом тесте ограничена исключительно производительностью шейдерных блоков и их эффективностью, поэтому платы из линейки HD 6800 прошлого поколения снова стали лучшими, а HD 7700 им заметно уступают. Не говоря уже о решениях Nvidia — обе их платы конкурируют разве что с HD 7750. Хотя позиции AMD в предельных вычислительных задачах немного пошатнулись, они до сих пор выигрывают прямые сравнения. Будет интересно сравнить GCN с Kepler от Nvidia, который может выйти в течение ближайшего месяца.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаковое для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS почти двукратное. Задача эта для современных видеокарт не слишком сложная, и производительность в ней ограничена или скоростью обработки геометрии или пропускной способностью памяти.

В сегодняшнем случае основным ограничителем стала ПСП — именно поэтому обе видеокарты серии Radeon HD 7700 показали почти одинаковый результат на уровне всего лишь Geforce GTX 550 Ti. Ну а обе карты семейства HD 6800 и GTX 560 — в другой лиге, они показывают более чем в полтора раза лучшую производительность в этом тесте. Всё же урезание шины памяти иногда сказывается...

Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры почти не изменились для решений Nvidia и лишь немного улучшились для новых плат AMD. Все видеокарты в данном тесте слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, поэтому и все выводы остаются прежними. Посмотрим, что изменится в следующем тесте, который предполагает большую нагрузку именно на геометрические шейдеры.

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленным в «Heavy» — ещё и для их отрисовки. То есть в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер. Сначала рассматриваем лёгкий режим:

Относительные результаты в разных режимах также примерно соответствуют изменению нагрузки: во всех случаях производительность неплохо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть чуть менее чем в два раза медленней.

В этом тесте скорость рендеринга также ограничена в основном геометрической производительностью и ПСП, поэтому оба решения на базе новой архитектуры от компании AMD показывают примерно одинаковые цифры. Но, к сожалению, они хуже, чем даже результат Geforce GTX 550 Ti. В этот раз лидирующими решениями стали видеокарты AMD прошлого поколения, и даже GTX 560 отстала от них. Представленные модели семейства HD 7700 уступают остальным из-за меньшей пропускной способности локальной памяти.

Цифры должны измениться на следующей диаграмме, в тесте с более активным использованием геометрических шейдеров. Также будет интересно сравнить друг с другом результаты, полученные в режимах «Balanced» и «Heavy».

В этот раз ситуация меняется сильнее, и победу празднует сильнейшее решение от Nvidia. Пусть оно и не слишком сильно обогнало обе карты семейства Radeon HD 6800, но всё же обогнало. Geforce явно имеют преимущество перед чипами AMD с традиционным графическим конвейером, даже в случае со средними чипами Nvidia. Правда, к GTX 550 Ti это не относится, она как раз где-то на одном уровне с новинками из семейства Radeon HD 7700.

Подводя итоги геометрических тестов, отметим, что хотя возможности по обработке геометрии и скорости исполнения геометрических шейдеров у новых чипов AMD явно улучшены, но оба решения на базе чипа Cape Verde не могут показать в тестах сильные результаты из-за слишком низкой производительности подсистемы памяти, имеющей лишь 128-битную шину.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Наши предыдущие исследования показали, что на результаты этого теста может влиять и скорость текстурирования и пропускная способность памяти. А результаты видеокарт Nvidia в простых режимах ещё чем-то ограничены. Да и вообще, в сложных условиях между всеми платами разница получается очень маленькая — проценты, а не разы.

Но для порядка отметим, что две платы компании AMD из семейства Radeon HD 7700 в сложных режимах показали хорошие результаты на уровне HD 6800 и плат Nvidia, а в лёгком сильно влияет текстурирование или ПСП, и вперёд вырываются платы AMD из предыдущего поколения. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Взаимное расположение карт на диаграмме изменилось в основном за счёт того, что платы Nvidia обеспечили высокую скорость рендеринга в тяжёлых режимах. При малом количестве полигонов скорость рендеринга для карт AMD упирается в ПСП, а Nvidia и вовсе не могут показать результаты лучше, чем в среднем — упор явный, но непонятный. Зато в тяжёлых режимах обе видеокарты Nvidia показывают результаты заметно лучше моделей новой серии Radeon HD 7700, разница порой более чем полуторакратная.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты во втором тесте вершинного текстурирования «Waves» лишь отдалённо похожи на то, что мы видели на предыдущих двух диаграммах. В этом тесте видеокарты AMD и Nvidia разделились на две группы: все видеокарты Nvidia и новые платы AMD, а вот старые платы AMD выступили гораздо сильнее их.

Новые модели из семейства HD 7700 очень хорошо конкурируют с платами Nvidia, но уступают своим старшим собратьям предыдущей серии. Причём, разница между картами на базе графического процессора Cape Verde явно говорит об очередном упоре производительности в ПСП — ведь результаты карт почти одинаковые. Рассмотрим второй вариант этого же теста:

В этом тесте произошли изменения, аналогичные тем, что мы видели ранее — видеокарты Nvidia снова немного ухудшили свои результаты, и это позволило представленным платам на новом чипе AMD одержать над ними явную победу. Лучшими в лёгком режиме снова стали старые карты семейства Radeon HD 6800, не имеющими такого ограничения ПСП, а вот в тяжёлых побеждают теперь свежие платы семейства Radeon HD 7700.

В общем, платы семейства HD 7700 в тестах вершинных выборок показала себя неплохо, они почти всегда опережали конкурирующие решения от Nvidia, хотя часто уступали своим предшественникам из серии Radeon HD 6800 (впрочем, основанных на более сложном и дорогом GPU).

3DMark Vantage: тесты Feature

Синтетические тесты из пакета 3DMark Vantage покажут нам то, что мы ранее упустили. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10 и интересны тем, что отличаются от наших и до сих пор актуальны. При анализе результатов новых видеокарт линейки Radeon HD 7700 в этом пакете мы сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах семейства RightMark.

Feature Test 1: Texture Fill

Первый тест — тест скорости текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Хотя тест компании Futuremark не показывает теоретически возможный уровень производительности текстурных выборок, но эффективность видеокарт и AMD и Nvidia в нём достаточно высока и сравнительные цифры близки к соответствующим теоретическим параметрам. Лучшая видеокарта из семейства Radeon HD 7700 показывает второй результат, отставая только от Radeon HD 6870, что очень неплохо.

А вот Radeon HD 7750, к сожалению, «придушена» очень сильно и проигрывает вообще всем остальным решениям. Видеокарты Nvidia в этом тесте держатся не так уж плохо, старшая GTX 560 показывает результат на уровне HD 6850, что примерно соответствует теории. А вот лучшей из новых плат обе Geforce проигрывают. Разница между двумя моделями на базе Cape Verde просто огромная, но также соответствующая теории.

Feature Test 2: Color Fill

Это тест скорости заполнения. Используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

А вот ситуация в тесте производительности блоков ROP совсем другая. Как мы определили раньше, цифры этого подтеста из 3DMark Vantage показывают производительность блоков ROP, но с дополнительным влиянием величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»). Что очень хорошо видно по идентичным результатам обеих плат семейства Radeon HD 7700 — то есть, в данном случае тест измеряет скорее пропускную способность, чем производительность ROP. К сожалению, новые модели AMD тут могут поспорить разве что с GTX 550 Ti, а карты предыдущего поколения и GTX 560 — далеко впереди.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нём рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоёмкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжёлого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчёты освещения по Strauss.

Данный тест отличается от остальных тем, что результаты в нём зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от всего понемногу. Для достижения высокой скорости тут важен верный баланс GPU, а также весьма заметно влияет на скорость и эффективность выполнения ветвлений в шейдерах.

И тут новому семейству на базе новейшей архитектуры есть что сказать! Сравнительные результаты видеокарт AMD показывают, что в таких сложных вычислительных задачах новые платы серии Radeon HD 7000 заметно эффективнее карт предыдущего поколения. Даже слабая из пары новинок не так много отстаёт от HD 6850, а уж гигагерцевая HD 7770 так и вообще вровень с более сложной и дорогой HD 6870. Платы Nvidia показывают результат, сравнимый разве что с HD 6850 и HD 7750.

Сравнительные цифры решений на чипах AMD разных поколений явно не соответствуют разнице между ними по чисто теоретическим параметрам и подтверждают улучшенную эффективность исполнения сложных вычислений с ветвлениями для GPU новой архитектуры.

Feature Test 4: GPU Cloth

Тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте также может зависеть от нескольких параметров, но основными факторами влияния являются производительность обработки геометрии, эффективность выполнения геометрических шейдеров и производительность блоков ROP. Поэтому вполне логично, что видеокарты производства Nvidia, имеющие по несколько геометрических блоков, чувствуют себя в этом приложении неплохо, а Geforce GTX 560 так и вовсе значительно опережает всех конкурентов.

Но и Radeon HD 7770 показывает отличный второй по порядку результат, опережая обе старые платы компании. А вот младшая из парочки Radeon HD 7750 смогла противостоять только GTX 550 Ti, которая практически не имеет преимуществ по геометрической производительности. В общем, это один из тех тестов, в которых видно преимущество решений Nvidia, имеющих несколько геометрических блоков, а также новинок от AMD, в которых улучшена геометрическая производительность.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчётами, также тестируется stream out.

Результаты ещё одного теста из пакета 3DMark Vantage были бы похожи на те, что мы видели на предыдущей диаграмме, но производительность ROP в нём стала ещё важнее. Именно поэтому платы нового семейства просто провалились. Впрочем, видеокарты с чипами от компании Nvidia также ослабили показатели, относительно старых плат Radeon HD 6850 и HD 6870.

К сожалению, семейству на Cape Verde тут хвастать нечем, из-за малого филлрейта и ПСП эти платы стали худшими в сравнении и до конкурирующих Geforce им очень далеко. В общем, в синтетических тестах имитации тканей и частиц из тестового пакета 3DMark Vantage, в которых активно используются геометрические шейдеры, результаты показаны неоднозначные и решениям AMD зачастую мешает низкие показатели ПСП и филлрейта (производительности блоков ROP).

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует очень много математических расчётов.

В чисто математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы видим несколько иное распределение результатов, по сравнению с аналогичными тестами из нашего тестового пакета Rightmark. Вот и в этот раз показанная на диаграмме производительность решений соответствует теории лишь примерно, и несколько расходится с тем, что мы видели ранее в математических тестах из пакета RightMark 2.0.

Новая архитектура GCN с этой задачей справляется весьма неплохо, явно лучше Fermi от Nvidia. Хотя эффективность использования имеющихся ALU у этих чипов близка, но решения AMD в целом быстрее, и младшая из плат Geforce показывает скорость на уровне младшей же карты из линейки Radeon HD 7700.

Что касается старшей из представленных недавно новинок, то Radeon HD 7700 обходит видеоплаты Nvidia, но не может конкурировать по пиковой синтетике с предыдущим поколением Radeon HD 6800. Впрочем, видеокарты Radeon всё равно показывают лучшие результаты в случаях, когда выполняется простая и интенсивная математика.

Direct3D 11: Вычислительные шейдеры

Чтобы протестировать новые решения компании AMD и в задачах, использующих такие новые возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы воспользовались примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, Nvidia и AMD.

К сожалению, до недавнего времени мы тестировали не все решения в этих задачах, поэтому придётся сравнивать не с GTX 560 и GTX 550 Ti, а с GTX 560 Ti, что не совсем корректно. Да и место HD 6850/6870 заняли HD 6970 и HD 7970 — впрочем, по ним будет интересно оценить архитектурные изменения последнего поколения и степень урезания возможностей относительно Tahiti.

Сначала рассмотрим тесты, использующие вычислительные (Compute) шейдеры. Их появление — одно из наиболее важных нововведений в последних версиях DX API, они уже используются в современных играх для выполнения различных задач: постобработки, симуляций и т. п. В первом тесте показан пример HDR-рендеринга с tone mapping из DirectX SDK, с постобработкой, использующей пиксельные и вычислительные шейдеры.

Да, это не самый удачный пример для вычислительных шейдеров, но разницу в производительности он показывает. Скорость расчётов в вычислительном и пиксельном шейдерах для видеокарт AMD и Nvidia почти нет, но первые чуть быстрее в вычислительном, а Nvidia в пиксельном.

Похоже, пара семейства Radeon HD 7700 ограничена пропускной способностью памяти, так как результат двух моделей оказался практически идентичен. Топовая модель HD 7970 более чем втрое быстрее их, что также может указывать на упор в ПСП. Анонсированные платы на новом чипе Cape Verde не могут конкурировать с грандами в этом тесте (это и не ожидалось), да и GTX 560 Ti для них является сильным и более дорогим соперником.

Второй тест вычислительных шейдеров также взят из Microsoft DirectX SDK, в нём показана расчётная задача гравитации N тел (N-body) — симуляция динамической системы частиц, на которую воздействуют физические силы, такие как гравитация.

Результаты в этом тесте в целом весьма похожи на цифры из предыдущего теста, кроме того, что между HD 7750 и HD 7770 есть явная разница. То есть, этот тест всё же измеряет скорость математических вычислений. Сравнивать анонсированные карты AMD с Geforce напрямую нельзя, так как GTX 560 Ti не является их конкурентом, но в целом их результат выглядит неплохо. Конечно, топовые карты компании двух поколений ещё быстрее. Нас больше интересует производительность в задачах тесселяции, к которым мы и переходим.

Direct3D 11: Производительность тесселяции

Вычислительные шейдеры очень важны, но ещё одним важным нововведением в Direct3D 11 считается аппаратная тесселяция. Мы очень подробно рассматривали её в своей теоретической статье про Nvidia GF100. Тесселяцию уже довольно давно начали использовать в DX11-играх, таких как STALKER: Зов Припяти, DiRT 2, Aliens vs Predator, Metro 2033, Civilization V, Crysis 2, Battlefield 3 и других. В некоторых из них тесселяция используется для моделей персонажей, в других — для имитации реалистичной водной поверхности или ландшафта.

Существует несколько различных схем разбиения графических примитивов (тесселяции). Например, phong tessellation, PN triangles, Catmull-Clark subdivision. Так, схема разбиения PN Triangles используется в STALKER: Зов Припяти, а в Metro 2033 — Phong tessellation. Эти методы сравнительно быстро и просто внедряются в процесс разработки игр и существующие движки, поэтому и стали популярными.

Первым тестом тесселяции будет пример Detail Tessellation из ATI Radeon SDK. В нём реализована не только тесселяция, но и две разные техники попиксельной обработки: простое наложение карт нормалей и parallax occlusion mapping. Что ж, сравним DX11-решения AMD и Nvidia в различных условиях:

Мы уже видели, что parallax occlusion mapping (средние столбики на диаграмме) на видеокартах обоих производителей выполняется гораздо менее эффективно, чем тесселяция (нижние столбики), а тесселяция не даёт слишком большого падения производительности — сравните верхние и нижние столбцы. То есть качественная имитация геометрии при помощи пиксельных расчётов обеспечивает даже меньшую производительность, чем оттесселированная геометрия с displacement mapping.

Что касается производительности видеокарт относительно друг друга, то тут всё очень интересно. По тесту простого бампмаппинга видно, что новые платы AMD больше остальных упираются во что-то (вероятно, снова ПСП, так как их результаты в подтесте идентичны), и проигрывают всем остальным. Все остальные платы расположились по ранжиру, лидирует топовая видеокарта AMD, и все остальные за ней.

Зато подтест со сложными пиксельными расчётами показывает что разница между HD 7750 и HD 7770 весьма велика, и упор тут в математические вычисления. При этом, новые карты AMD показывают неплохой результат, младшая немного уступает GTX 560 Ti, а старшая заметно впереди. Старшая плата на чипе Cape Verde показала очень хороший результат в тесте parallax mapping по сравнению с HD 6970, который говорит о высокой эффективности исполнения сложных шейдерных программ на чипах архитектуры GCN.

Переходим к самому интересному — тесселяции. В данном тесте разбиение треугольников весьма умеренное, поэтому платы AMD не так сильно проваливаются вниз. Скорости новинок хватает даже для того, чтобы опережать GTX 560 Ti. И снова отметим, что производительность двух моделей почти одинакова. Топовая HD 7970 далеко впереди, да и Radeon HD 6970 очень неплох. Значит, в этом тесте основной упор отнюдь не в производительность геометрических блоков, а коэффициент разбиения треугольников невелик.

Вторым тестом производительности тесселяции будет ещё один пример для 3D-разработчиков из ATI Radeon SDK — PN Triangles. Собственно, оба примера входят также и в состав DX SDK, так что мы уверены, что на их основе создают свой код игровые разработчики. Этот пример мы протестировали с различным коэффициентом разбиения (tessellation factor), чтобы понять, как сильно влияет его изменение на общую производительность.

В этом примере мы видим уже более полное сравнение геометрической мощи различных решений AMD и Nvidia. Сильно выделяется единственный представитель графической архитектуры Fermi от Nvidia, но и чипы архитектуры GCN от AMD весьма хороши. Конечно, это чисто синтетический тест и экстремальные коэффициенты разбиения вряд ли будут использоваться в играх ближайшего времени, но в этом разделе нас интересует архитектурный потенциал.

Если в лёгких условиях новые платы семейства Radeon HD 7700 проигрывают топовой плате предыдущего поколения, то с усложнением геометрии их результаты улучшаются. И в более сложных условиях с очень большим количеством треугольников (третий столбик) HD 6970 уже заметно отстаёт, как отстаёт даже видеокарта Nvidia Geforce на чипе GF114!

Впрочем, бочка мёда испорчена тем, что тест просто не даёт использовать максимальный уровень тесселяции (tessellation factor = 19) на видеокартах Radeon HD 7700. Скорее всего, драйвер AMD намеренно урезает возможности выставления большего уровня тесселяции так, чтобы их видеокарты в синтетических тестах не проваливались, как это обычно бывает при экстремальной тесселяции.

Да, мы понимаем, что это чистая синтетика и в реальных играх такого не будет, но нельзя же так некрасиво поступать! Пусть в синтетике будут показаны правдивые результаты, а уж мы объясним, что таких уровней в играх не будет ещё долго. Получается, что с как минимум с тестовым драйвером новые видеокарты поддерживают не все возможности DirectX 11. Это может быть ещё и багом в коде драйвера, но на это не очень похоже, честно говоря.

Но если эту ложку дёгтя не воспринимать, то отметим, что младшие чипы архитектуры GCN в тесселяции быстрее даже топовых чипов Cayman. Новые GPU не просто сократили отставание от конкурента в задачах обработки геометрии, но и обогнали его (кроме максимальных уровней тесселяции). И можно ожидать, что Cape Verde будет силён в других существующих тестах с применением тесселяции, вроде 3DMark 11 и Heaven.

Давайте рассмотрим ещё один тест — демонстрационную программу Nvidia Realistic Water Terrain, также известную как Island. В этой демке используется тесселяция и карты смещения (displacement mapping) для рендеринга реалистично выглядящей поверхности океана и ландшафта.

Island не является чисто синтетическим тестом для измерения одной только геометрической производительности, он содержит и сложные пиксельные и вычислительные шейдеры в том числе, и такая нагрузка ближе к реальным играм, в которых используются сразу все блоки GPU, а не только геометрические, как в предыдущем бенчмарке.

Мы протестировали программу при четырёх разных коэффициентах тесселяции, в её случае настройка называется Dynamic Tessellation LOD. И если при низких коэффициентах разбиения треугольников видеокарты компании AMD сильны, то при усложнении работы единственная плата от Nvidia начинает выигрывать даже у топов! При увеличении коэффициента разбиения и сложности сцены производительность абсолютно всех Radeon падает очень сильно, так что можно смело констатировать победу Nvidia в самых сложных геометрических тестах.

Если не обращать внимания на Geforce GTX 560 Ti, то очень интересна разница между HD 7700 и HD 6970. Новые чипы GCN даже в простой версии Cape Verde гораздо быстрее справляются с задачей при максимальных уровнях тесселяции — только в самом простом режиме старая видеокарта оказалась быстрее новинок.

Что касается сравнения младших решений с топовым Radeon HD 7970, то отмечаем схожее поведение разных чипов в условиях тяжёлой геометрической нагрузки. Естественно, что в случаях меньшей геометрической нагрузки топовое решение всё же заметно быстрее, но зато в максимально сложном режиме разницы в производительности между Radeon HD 7770 и HD 7970 просто нет! Значит, количество и эффективность геометрических блоков в Tahiti и Cape Verde одинаковое, а разница в скорости обусловлена лишь различной тактовой частотой и влиянием на производительность других параметров, таких как скорость математических вычислений. Очень хороший результат для Cape Verde.

Выводы по синтетическим тестам

По результатам проведённых синтетических тестов новых моделей видеокарт серии Radeon HD 7700, основанных на графическом процессоре Cape Verde из семейства Southern Islands, а также результатам других моделей видеокарт производства обоих производителей дискретных видеочипов, становится понятно, что новые решения должны хорошо вписаться в линейку компании AMD и стать наиболее доступными видеокартами с поддержкой всех современных технологий. Они хороши и как удачное продолжение серии предыдущего поколения и должны продаваться гораздо более массово, чем топовые видеокарты на Tahiti.

Графический процессор Cape Verde также выполнен с применением самого современного техпроцесса 28 нм на основе новой архитектуры GCN, которая довольно сильно отличается от предыдущих решений компании. Хотя количество исполнительных блоков выросло не слишком заметно, новые модели GPU имеют архитектурные улучшения, направленными на увеличение эффективности сложных вычислений на GPU, а также на ускорение обработки геометрических данных. Набор наших синтетических тестов показал, что эффективность вычислений в сложных задачах и скорость тесселяции действительно выросли.

Благодаря архитектурным изменениям, видеокарты новой серии должны улучшить и без того неплохие позиции компании AMD на рынке недорогих видеоплат. Особенно радует то, что были исправлены некоторые из слабых мест предыдущих поколений. К сожалению, у недорогих видеокарт просто не может не быть недостатков. Хотя эффективность новых GPU в сложных вычислительных задачах серьёзно повысилась, сравнительно простые тесты показывают, что предыдущая архитектура AMD имеет свои сильные стороны, а при нынешнем засилии простых мультиплатформенных игр старые модели могут оказаться выгоднее новых.

Во-вторых, хотя возможности и эффективность вычислений новыми чипами AMD улучшились, оба решения на базе чипа Cape Verde явно не могут раскрыть все свои способности из-за слишком узкой 128-битной шины памяти и низкой пропускной способности. Впрочем, этот недостаток есть у абсолютно всех недорогих решений — на них просто не ставят широкие шины и кучу микросхем памяти. Ну и хотелось бы понять, почему в одном из тестов тесселяции драйвер не дал выставить максимальные настройки — ошибка ли это в коде или намеренное ограничение функциональности, призванное оградить видеокарты компании от низких результатов при экстремальных геометрических нагрузках?

И всё же, недостатки таких дешевых GPU вполне понятны (кроме странностей с максимальным уровнем тесселяции) и мы уверены, что результаты Radeon HD 7750 и HD 7770 в синтетических тестах будут подтверждены неплохими показателями и в игровых приложениях. В играх новые платы должны показать конкурентоспособную скорость по сравнению с соперниками от Nvidia в лице Geforce GTX 550 Ti и GTX 560. Чтобы проверить это утверждение, давайте перейдём к следующей части материала — исследованию скорости новых решений AMD в играх.

Часть 3 — производительность в игровых тестах →

Блок питания для тестового стенда предоставлен компанией Tagan

Корпус ThermalTake 8430 для тестового стенда предоставлен компанией 3Logic

Монитор Dell 3007WFP для тестовых стендов предоставлен компанией Nvidia




Дополнительно

ВИКТОРИНА TT

Материнские платы какого форм-фактора можно устанавливать в корпус Thermaltake Versa C22 RGB Snow Edition?

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.