AMD Radeon HD 6850/6870:


описание видеокарт и результаты синтетических тестов



СОДЕРЖАНИЕ

  1. Часть 1 — Теория и архитектура
  2. Часть 2 — Практическое знакомство
  3. Особенности видеокарт
  4. Конфигурация стенда, список тестовых инструментов
  5. Результаты синтетических тестов
  6. Результаты игровых тестов (производительность)


AMD Radeon HD 6850/6870. Часть 1 — Теория и архитектура


Так уж сложились обстоятельства, что 22 октября, в день анонса новых продуктов AMD, мы выпустили обширную, однако лишь теоретическую часть, описывающую Radeon HD 6850/6870, которые ранее имели кодовое обозначение Barts.

Поэтому сегодня мы наверстываем упущенное и предлагаем вниманию наших читателей уже две практические части, где мы детально изучим новинки AMD.

Как обычно, в этой, второй части, мы изучим сами видеокарты, а также познакомимся с результатами синтетических тестов.

AMD Radeon HD 6850 1024MB 256-битной GDDR5, PCI-E
  • GPU: Radeon HD 6850 (Barts)
  • Интерфейс: PCI-Express x16
  • Частоты работы GPU (ROPs/Shaders): 775/775 МГц (номинал — 775/775 МГц)
  • Частоты работы памяти (физическая (эффективная)): 1000 (4000) МГц (номинал — 1000 (4000) МГц)
  • Ширина шины обмена с памятью: 256 бит
  • Число вершинных процессоров:
  • Число пиксельных процессоров:
  • Число универсальных процессоров: 960
  • Число текстурных процессоров: 48 (BLF/TLF)
  • Число ROPs: 32
  • Размеры: 250×100×33 мм (последняя величина — максимальная толщина видеокарты)
  • Цвет текстолита: черный
  • RAMDACs/TMDS: интегрированы в GPU
  • Выходные гнезда: 2×DVI (Dual-Link/HDMI), 2×mini-Display Port, 1×HDMI
  • VIVO: нет
  • TV-out: не выведен
  • Поддержка многопроцессорной работы: CrossFire (Hardware)
AMD Radeon HD 6870 1024MB 256-битной GDDR5, PCI-E
  • GPU: Radeon HD 6870 (Barts)
  • Интерфейс: PCI-Express x16
  • Частоты работы GPU (ROPs/Shaders): 900/900 МГц (номинал — 900/900 МГц)
  • Частоты работы памяти (физическая (эффективная)): 1050 (4200) МГц (номинал — 1050 (4200) МГц)
  • Ширина шины обмена с памятью: 256 бит
  • Число вершинных процессоров:
  • Число пиксельных процессоров:
  • Число универсальных процессоров: 1120
  • Число текстурных процессоров: 56 (BLF/TLF)
  • Число ROPs: 32
  • Размеры: 270×100×33 мм (последняя величина — максимальная толщина видеокарты)
  • Цвет текстолита: черный
  • RAMDACs/TMDS: интегрированы в GPU
  • Выходные гнезда: 2×DVI (Dual-Link/HDMI), 2×mini-Display Port, 1×HDMI
  • VIVO: нет
  • TV-out: не выведен
  • Поддержка многопроцессорной работы: CrossFire (Hardware)




AMD Radeon HD 6850 / 6870 1024MB 256-битной GDDR5, PCI-E
Каждая карта имеет по 1024 МБ памяти GDDR5 SDRAM, размещенной в восьми микросхемах на лицевой сторонe PCB.

Микросхемы памяти Samsung (GDDR5). Микросхемы расчитаны на максимальную частоту работы в 1250 (5000) МГц.





Сравнение с эталонным дизайном, вид спереди
AMD Radeon HD 6850 1024MB 256-битной GDDR5, PCI-E Reference card AMD Radeon HD 5850
AMD Radeon HD 6870 1024MB 256-битной GDDR5, PCI-E Reference card AMD Radeon HD 5870




Сравнение с эталонным дизайном, вид сзади
AMD Radeon HD 6850 1024MB 256-битной GDDR5, PCI-E Reference card AMD Radeon HD 5850
AMD Radeon HD 6870 1024MB 256-битной GDDR5, PCI-E Reference card AMD Radeon HD 5870




Почему мы сравниваем 6850/6870 с картами уровня 5850/5870, а не с 5770? Ведь, как известно, 6850 и 6870 — это продукты не топового класса, а призванные занять места 5770, вытеснив последние на более низкую ступень. Однако 6850 и 6870 имеют 256-битные шины обмена с памятью, поэтому резонно сравнить их с аналогичными по разводке 5850 и 5870.

И при ближайшем рассмотрении оказалось, что действительно в целом дизайны 5850 и 6850, как и 5870 и 6870, в чем-то схожи. Разумеется, ядра разные, потому силовая развязка претерпела некоторые изменения, а также выводы иные (теперь их пять, а не четыре как было ранее).

Подключение к аналоговым мониторам с d-Sub (VGA) производится через специальные адаптеры-переходники DVI-to-d-Sub. Также с серийными картами поставляются переходники DVI-to-HDMI (данные ускорители поддерживают полноценную передачу видео и звука на HDMI-приемник, поскольку обладают собственным звуковым кодеком), поэтому проблем с такими мониторами также не должно быть. К тому же продукты уже оснащены одним разъемом HDMI. Видеокарты также предоставляют и Display Port в количестве двух штук. Следует напомнить, что каждая такая карта позволяет выводить картинку игры сразу на ТРИ монитора (при условии, что задействован хотя бы один Display Port). А вот если не требуется выводить единую картинку на все мониторы, а лишь размещать рабочий стол или делать клоны, то сочетания могут быть следующими: DVI+DVI+HDMI, DVI+HDMI+DP, HDMI+DP+DP.

Максимальные разрешения и частоты:

  • 240 Hz Max Refresh Rate
  • 2048×1536×32bit @ 85Hz Max — по аналоговому интерфейсу
  • 2560×1600 @ 60Hz Max — по цифровому интерфейсу (для DVI-гнезд с Dual-Link/HDMI)

По поводу HDTV. Одно из исследований также проведено, и с ним можно ознакомиться здесь.

Есть смысл сказать, что обе карты требуют дополнительного питания, причем 6870 — двумя 6-пиновыми разъемами, а 6850 — одним разъемом.

О системах охлаждения.

AMD Radeon HD 6850 1024MB 256-битной GDDR5, PCI-E

Прекрасно видно, что СО состоит из двух частей — центрального кулера и радиаторов для охлаждения памяти, которые работают как бы сами по себе, а центральное устройство охлаждает лишь ядро.

Прибор цилиндрического типа, когда на одном конце закреплена цилиндрический вентилятор, прогоняющая воздух через радиатор, установленный над ядром. Несмотря на медную подошву, сам радиатор небольшой. В целом устройство довольно тихое, и явно говорит о том, что нагрев ядра не столь велик.

AMD Radeon HD 6870 1024MB 256-битной GDDR5, PCI-E

Аналогичное по принципу действия устройство, но отличия в том, что центральный кулер уже охлаждает как ядро, так и микросхемы памяти, поэтому радиатор усилен (увеличен в размерах). Да и цилиндрический вентилятор стоит помощнее. Однако все равно в целом устройство малошумное.




Мы провели исследование температурного режима с помощью утилиты EVGA Precision (автор А. Николайчук AKA Unwinder) и получили следующие результаты:

AMD Radeon HD 6850 1024MB 256-битной GDDR5, PCI-E



AMD Radeon HD 6870 1024MB 256-битной GDDR5, PCI-E



Как мы видим, обе СО работают одинаково эффективно, и нагрев не превышает 80—81 градус, что очень неплохо для подобного рода современных акселераторов.

Максимальное энергопотребление карт под нагрузкой: 6850 — 150 Вт, а 6870 — 180 Вт.

Комплектация. Учитывая, что референс-образцы никогда не имеют комплектаций, мы этот вопрос опустим.

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютер на базе Intel Core I7 CPU 975 (Socket 1366)
    • процессор Intel Core I7 CPU 975 (3340 МГц);
    • системная плата Asus P6T Deluxe на чипсете Intel X58;
    • оперативная память 6 ГБ DDR3 SDRAM Corsair 1600MHz;
    • жесткий диск WD Caviar SE WD1600JD 160 ГБ SATA;
    • блок питания Tagan TG900-BZ 900W.
  • операционная система Windows 7 64bit; DirectX 11;
  • монитор Dell 3007WFP (30″);
  • драйверы ATI версии Catalyst 10.10; Nvidia версии 262.99/260.99.

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

  • D3D RightMark Beta 4 (1050) с описанием на сайте http://3d.rightmark.org.
  • D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 — тесты пиксельных шейдеров версий 2.0 и 3.0 ссылка.
  • RightMark3D 2.0 с кратким описанием: Vista без SP1, Vista c SP1.

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

Синтетические тесты проводились на следующих видеокартах:

  • Radeon HD 6870 со стандартными параметрами (далее HD 6870)
  • Radeon HD 6850 со стандартными параметрами (далее HD 6850)
  • Radeon HD 5830 со стандартными параметрами (далее HD 5830)
  • Radeon HD 5770 со стандартными параметрами (далее HD 5770)
  • Geforce GTX 470 со стандартными параметрами (далее GTX 470)
  • Geforce GTX 460 со стандартными параметрами, модель с 1 ГБ памяти (далее GTX 460)

Для сравнения результатов новых моделей видеокарт серии Radeon HD 6800 были выбраны эти решения по следующим причинам: Radeon HD 5830 — наиболее близкое по цене и наименее производительное решение на основе чипа Cypress, HD 5770 — предыдущее решение компании для среднего ценового диапазона (того же, для которого предназначены новые модели), базирующееся на видеочипе Juniper.

А именно эти решения Nvidia взяты потому, что Geforce GTX 470 — одна из самых дешёвых карт на предыдущем топовом GPU, теперь спустившаяся по цене вниз и ставшая конкурентом для HD 6870 (GTX 465 рассматривать просто уже нет смысла, как снятую с производства). Ну а GTX 460 с гигабайтом видеопамяти была взята как прямой конкурент для младшей модели линейки HD — 6850.

Direct3D 9: тесты Pixel Filling

В тесте определяется пиковая производительность выборки текстур (texel rate) в режиме FFP для разного числа текстур, накладываемых на один пиксель:

Повторимся в очередной раз, что в данном тесте фильтрации RGB8-текстур большинство видеокарт показывают цифры, далёкие от теоретически возможных. И далее, в тесте из пакета 3DMark Vantage, есть более жизненные цифры. Результаты нашей текстурной синтетики в случае видеоплат HD 6800 сильно не дотягивают до пиковых значений, по ней получается, что новый чип выбирает лишь до 42 текселей за один такт из 32-битных текстур при билинейной фильтрации в этом тесте, что на треть меньше теоретической цифры в 56 отфильтрованных текселя.

Неудивительно, что в тяжёлых режимах карты семейства HD 6800 показывают столь высокую производительность, что значительно опережают своих соперников производства компании Nvidia. Любопытной получилась разница между семействами HD 6000 и HD 5000 в разных условиях. Если в случаях с большим количеством текстур, где больше всего сказывается количество TMU и их частота, выигрывают варианты на основе новых GPU, то при малом количестве текстур на пиксель впереди уже семейство HD 5000.

Забавно и то, что мы уже отметили подобный подход в обзоре Geforce GTX 580 — видимо, и в AMD несколько изменили баланс в новых GPU и/или драйверах и лёгкие условия принесли в жертву более тяжёлым. Рассмотрим эти же результаты в тесте филлрейта:

Ну а эти цифры показывают скорость заполнения, и в них мы видим всё то же самое, разве что с учетом количества записанных в буфер кадра пикселей. Максимальный результат остаётся за новыми решениями компании AMD, имеющими большее количество TMU и более эффективными в данном синтетическом тесте. В случаях с 0—3 накладываемыми текстурами, рассматриваемые сегодня решения немного уступают предыдущему поколению видеокарт AMD, а в сложных условиях опережают их.

Direct3D 9: тесты Pixel Shaders

Первая группа пиксельных шейдеров, которую мы рассматриваем, очень проста для современных видеочипов, она включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся в старых играх.

Тесты весьма просты для современных GPU и показывают не все возможности современных видеочипов, но они всё же интересны для оценки баланса между текстурными выборками и математическими вычислениями, и особенно при сравнении GPU, отличающихся архитектурно. Но в данном случае особых отличий между HD 5000 и HD 6000 нет, поэтому и результаты показаны схожие, с учётом частот, естественно.

Производительность в этих тестах ограничена по большей части филлрейтом и скоростью текстурных модулей, но с учётом эффективности блоков и кэширования текстурных данных. Новые модели Radeon попарно чуть быстрее предшествующих: HD 6870 быстрее HD 5830, а HD 6850 быстрее HD 5770. Ну и все они опережают две модели Geforce — GTX 470 в этих тестах показывает результат лишь на уровне HD 5770, да и у GTX 460 явно виден недостаток скорости текстурирования.

Посмотрим на результаты более сложных пиксельных программ промежуточных версий:

Как ни странно, получилось примерно то же самое. Тест Cook-Torrance более интенсивен вычислительно, и разница в нём примерно соответствует разнице в количестве ALU и их частоте. И из-за этого данный тест лучше подходит для архитектуры AMD, имеющей большее количество математических блоков, и в нём даже Radeon HD 5770 показывает результат на уровне видеокарты на основе GF100.

В сильно зависящем от скорости текстурирования тесте процедурной визуализации воды «Water» используется зависимая выборка из текстур больших уровней вложенности, и карты в нём располагаются по скорости текстурирования, с поправкой на разную эффективность использования TMU. В этом тесте есть две явные группы: HD 6870 и HD 5830, а также все остальные. Новые модели Radeon снова немного быстрее парных старых — неплохой результат.

Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье «Современная терминология 3D-графики».
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

Существует два варианта этих шейдеров: с ориентацией на математические вычисления и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это универсальные тесты, зависящие и от скорости блоков ALU? и от скорости текстурирования, в них важен общий баланс чипа. Производительность видеокарт в тесте «Frozen Glass» весьма схожа с тем, что мы видели выше в «Cook-Torrance». HD 6870 снова быстрее, чем HD 5830, а HD 6850 быстрее HD 5770. Ну и в целом решения компании AMD оказались быстрее карт Nvidia и в этот раз.

Во втором тесте «Parallax Mapping» решения Nvidia чувствуют себя немногим лучше, и HD 5770 соревнуется уже с GTX 460, а GTX 470 близка к HD 6850. Вероятно, скорость в тесте ограничена во многом математической производительностью. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:

А вот со скоростью текстурирования у последних модификаций чипов графической архитектуры AMD всё очень хорошо, и поэтому они лишь наращивают своё преимущество. И даже GTX 470 из числа топовой серии уступает даже HD 5770 в этих тестах с упором на текстурирование. Ну а новые герои из семейства HD 6800 далеко впереди. HD 6870 и HD 6850 всё так же быстрее своих предшественников, что вполне объяснимо теоретически.

Но это были несколько устаревшие задачи, в основном с упором в текстурирование или филлрейт, а далее мы рассмотрим результаты ещё двух тестов пиксельных шейдеров — но уже версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9 API, которые намного показательнее с точки зрения современных игр на ПК. Тесты отличаются тем, что сильнее нагружают и ALU, и текстурные модули, обе шейдерные программы сложные и длинные, включают большое количество ветвлений:

Как обычно, в наших самых сложных DX9-тестах, видеокарты производства Nvidia выступают уже сильнее решений AMD. И похоже, что с тестами сложных пиксельных шейдеров версии 3.0 у решений AMD всё не так уж безоблачно, как могло показаться ранее. При этом, оба PS 3.0 теста довольно сложные, скорость в них мало зависит от ПСП и текстурирования, зато код отличается большим количеством ветвлений, с которыми очень неплохо справляется новая архитектура Nvidia.

И в этих тестах даже HD 6870 трудно держать удар GTX 460, не говоря про GTX 470, которая является неоспоримым лидером в данной паре тестовых задач. Впрочем, не всё так плохо, и по крайней мере своих предшественников из серии HD 5000 новые решения уверенно обогнали. Просто в этих задачах позиции Nvidia традиционно сильнее.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два знакомых теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами, при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в этом тесте зависит как от количества и эффективности блоков TMU, так и от филлрейта с ПСП, но в меньшей степени. Результаты в «High» получаются примерно в полтора раза ниже, чем в «Low», как и должно быть по теории. В тестах Direct3D 10 процедурной визуализации меха с большим количеством текстурных выборок решения Nvidia обычно сильны, но последняя архитектура AMD к ним подтянулась, да как!

В результате, HD 6870 даже немного опережает GTX 470 в этом тесте, а HD 6850 показывает результат на уровне HD 5830 и лучше, чем GTX 460. Влияние эффективного филлрейта и ПСП хорошо видно по тому, как сильно отстаёт HD 5770 с 128-битной шиной памяти. Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза, возможно в такой ситуации что-то изменится и ПСП с филлрейтом будут влиять меньше:

Включение суперсэмплинга увеличивает теоретическую нагрузку в четыре раза, и в этот раз сравнительные результаты решений Nvidia опускаются ещё ниже. Теперь HD 5770 встала на уровень GTX 460, а HD 6870 в полтора раза быстрее чем GTX 470. Разница между картами линеек HD 6000 и HD 5000 осталась примерно той же.

Второй шейдерный DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше, по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Данный тест интереснее с практической точки зрения, так как разновидности parallax mapping давно применяются в играх, а тяжелые варианты, вроде нашего steep parallax mapping, используются во многих проектах, например, в играх Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип примерно в два раза, такой режим называется «High».

Диаграмма во многом похожа на предыдущие. В обновленном D3D10 варианте теста без суперсэмплинга, HD 6870 становится лидером среди выбранных видеокарт, а HD 6850 с переменным успехом борется с HD 5830. Видеокарты Nvidia немного не дотягивают до решений AMD, а GTX 460 снова показала результат на уровне более дешёвой HD 5770. Посмотрим, что изменит включение суперсэмплинга, он должен вызвать ещё большее падение скорости на картах Nvidia.

При включении суперсэмплинга и самозатенения задача получается ещё более тяжёлой, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая большое падение производительности. Разница между скоростными показателями протестированных видеокарт изменилась, включение суперсэмплинга сказывается как и в предыдущем случае — карты производства AMD явно улучшили свои показатели относительно решения Nvidia.

И теперь HD 5770 уже опережает GTX 460, а HD 6850 обеспечивает производительность рендеринга, схожую со скоростью GTX 470. Сравнительные цифры в парах HD 6870 и HD 5830, а также HD 6850 и HD 5770 снова повторились, разница в пользу свежих моделей примерно та же. По этим тестам можно сделать вывод — обе карты линейки HD 6800 справились с «шейдерными» задачами отлично, что неудивительно, так как новый GPU имеет достаточно большое количество блоков ALU.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Чисто математические тесты привычно соответствуют разнице в частотах и количестве ALU. И это объясняет тот факт, что решения AMD в этих тестах явно оказываются значительно более производительными. Современная архитектура AMD в таких случаях имеет большое преимущество перед конкурирующими видеокартами от Nvidia. Что подтвердилось в очередной раз, даже HD 5770 быстрее обеих карт Nvidia, не говоря уже про новые HD 6870 и HD 6850.

Что касается сравнения нового и старого семейств видеокарт AMD, то HD 6870 является явным лидером теста, обогнав вдвое самую слабую карту сравнения — GTX 460. А HD 6850 показала результат на уровне HD 5830, что немного не соответствует теоретической разнице — в данном случае новый GPU отработал эффективнее старого. А вот все остальные решения расположились примерно соответственно теории, это касается как карт Nvidia, так и AMD.

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нём только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

И в этот раз все GPU остались примерно на тех же позициях, можно лишь отметить тот факт, что HD 5830 в этом тесте всё же опережает HD 6850. И, в отличие от предыдущего теста, это уже полностью соответствует теории, так как HD 5830 и должен быть немного быстрее. В остальном — всё то же самое, так как скорость рендеринга ограничена исключительно производительностью шейдерных блоков, поэтому карты AMD оказываются далеко впереди решений Nvidia — налицо уже привычный разгром.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующих частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS составляет около двух раз. Задача для современных видеокарт не особенно сложная, производительность в целом ограничена не только скоростью обработки геометрии, но и пропускной способностью памяти в определённой мере.

И вот здесь мы впервые видим результат архитектурных изменений в виде подтянутой геометрической производительности видеочипа Barts. Обе видеокарты нового семейства Radeon HD 6800 показали результаты, заметно превышающие скорость решений линейки HD 5000. Причём, они обе обогнали и GTX 460, а вот до победы над GTX 470 новой HD 6870 не хватило совсем чуть-чуть.

В любом случае, выполнение геометрических шейдеров у HD 6800 стало заметно более эффективным, и новый чип быстрее всех предыдущих от компании AMD в этом тесте. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте, цифры для решений и Nvidia и AMD почти не изменились. Новые видеокарты семейства HD 6800 в данном тесте почти не реагируют изменения параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, и показывают аналогичные предыдущей диаграмме результаты. И, что интересно, они ведут себя скорее аналогично видеоплатам Nvidia, а не HD 5830 и HD 5770. Последние-то как раз немного улучшили свои показатели в данном случае. Что же, посмотрим, что изменится в следующем тесте, который предполагает большую нагрузку именно на геометрические шейдеры.

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленном в «Heavy» — ещё и для их отрисовки. Другими словами, в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер. Сначала рассматриваем лёгкий режим:

Относительные результаты в разных режимах снова соответствуют нагрузке: во всех случаях производительность неплохо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть менее чем в два раза медленней.

В этом тесте скорость рендеринга больше всего ограничена именно геометрической производительностью. Новые видеокарты компании AMD показывают значительно более сильные результаты, по сравнению со старыми моделями, что объясняется архитектурными изменениями в GPU. И хотя Geforce GTX 470 остаётся лидером теста, за ней очень плотно идёт HD 6870. А в паре HD 6850 и GTX 460 решение AMD и вовсе выигрывает. Это явственно говорит о наличии серьёзных оптимизаций по обработке геометрических данных в Barts.

Но цифры должны измениться на следующей диаграмме, в тесте с более активным использованием геометрических шейдеров. Также будет интересно сравнить друг с другом результаты, полученные в режимах «Balanced» и «Heavy».

А вот в этом тесте мы всё же видим явную разницу между чипами с традиционным графическим конвейером (все Radeon, в том числе и новые решения на Barts) и чипами с архитектурой Fermi. Да, GF104 по скорости исполнения геометрических шейдеров в этом тесте отстаёт, показывая худший результат, чем обе Barts, но это легко объяснимо урезанными возможностями геометрической обработки в чипе среднего ценового диапазона. Но посмотрите на результат GTX 470, имеющей в основе чип GF100, — он значительно выше всех остальных протестированных сегодня видеокарт.

Возможности топовых чипов Nvidia по обработке геометрии и скорости исполнения геометрических шейдеров очень сильно превышают их же решения среднего ценового диапазона, а также все конкурирующие решения AMD. Но всё же, новый чип Barts, применённый в линейке HD 6800, позволил в этих тестах обогнать GF104 и значительно сократить отставание даже от недавнего топового чипа Nvidia. Отличный результат!

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи по сути, и соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Предыдущие исследования показали, что на результаты этого теста влияет и скорость текстурирования, и пропускная способность памяти. И это отлично видно по результатам Radeon HD 5770, имеющем меньшую ПСП и сильно отставшем от других участников теста. Между остальными решениями разница не такая уж большая, хотя интересно, что GTX 470 оказывается лидером в двух тяжёлых режимах, а HD 6870 — в наиболее простом. Но что важно, так это то, что обе карты семейства HD 6800 опережают HD 5830 предыдущего поколения.

Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Взаимное расположение карт на диаграмме почти не изменилось, но обе карты Nvidia почему-то ещё больше потеряли в производительности в наиболее лёгком режиме. В данном случае GTX 460 и GTX 470 остаются недосягаемы для соперников, но лишь в двух тяжёлых режимах теста. Обе карты линейки HD 6800 всё так же опережают старые. Влияние ПСП заметно и тут — результат HD 5770 довольно низок.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

А вот результаты в тесте «Waves» совсем не похожи на то, что мы видели на предыдущих диаграммах. Подавляющего преимущества у продукции AMD здесь нет, но в этом тесте именно две новые карты стали лидерами, а GTX 470 и HD 5830 немного отстают от них. GTX 460 показывает производительность ещё ниже, а наиболее медленной привычно и заслуженно стала Radeon HD 5770. Видимо, в тесте всё-таки сказывается влияние ПСП. Рассмотрим второй вариант этого же теста:

Изменения почти отсутствуют, хотя карты Nvidia немного сдали позиции и теперь GTX 470 по скорости соответствует HD 5830, кроме самого тяжёлого режима. Снова мы видим, что видеокарты Nvidia стали сильнее в тяжёлом режиме, но много теряют в простых. В любом случае, результаты нового графического процессора Barts, а также видеокарт на его основе, во втором тесте вершинных выборок весьма хороши, и новый GPU даже стал быстрейшим в этом тесте.

3DMark Vantage: Feature тесты

Синтетические тесты из пакета 3DMark Vantage могут показать нам что-то, что мы ранее упустили. Feature-тесты этого тестового пакета обладают поддержкой D3D10 и интересны уже тем, что отличаются от наших. При анализе результатов нового решения Nvidia в этом пакете мы сможем сделать какие-то новые и полезные выводы, ускользнувшие от нас в тестах семейства RightMark. Особенно это касается теста скорости текстурных выборок.

Feature Test 1: Texture Fill

Первый тест — тест скорости текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Как видно, тест Futuremark также не показывает теоретически возможного уровня скорости текстурных выборок, хотя эффективность новых карт AMD в нём несколько выше, чем в нашем. Карты Nvidia также более эффективно используют имеющиеся текстурные блоки, и в этом текстурном тесте получается иное соотношение результатов, по сравнению с нашим. И мы считаем, что эти цифры больше похожи на реальное положение дел.

Две новые видеокарты семейства Radeon HD 6800 показали результаты немногим лучшие, чем их парные соперники: HD 5830 для HD 6870 и HD 5770 для HD 6850. Видно, что в Barts усилилась в основном математическая производительность. Обе видеокарты Nvidia всё так же продолжают показывать не слишком высокие результаты, но они уже подобрались к решениям AMD поближе. GTX 470 оказался примерно на уровне HD 5770, а GTX 460, имеющий больше блоков TMU, почти дотянул до HD 6850.

Feature Test 2: Color Fill

Это тест скорости заполнения. Используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

В этом тесте мы видим две группы видеокарт, расположенных в соответствии с теоретическими цифрами филлрейта, но без учёта влияния ПСП видеопамяти. Цифры Vantage показывают именно производительность блоков ROP и только её, но не величину пропускной способности. Поэтому результаты HD 5830, HD 5770 и GTX 460 весьма близки, как и цифры обеих новых карт и GTX 470.

Впрочем, HD 6870 показывает лучший результат, процентов на 10 опережая соперника от Nvidia, а HD 6850 не только впереди своих прямых конкурентов, но также берёт верх и над GTX 470. Итак, отметим высокую скорость заполнения у новых моделей видеокарт, соответствующую уровню недавнего топа у конкурента.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нём рисуется один четырехугольник (точнее, два треугольника), с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоёмкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжёлого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчёты освещения по Strauss.

Этот тест отличается от других подобных тем, что результаты в нём зависят не исключительно от скорости математических вычислений или эффективности исполнения ветвлений или скорости текстурных выборок, а от всего понемногу. И для достижения высокой скорости важен правильный баланс блоков GPU и ПСП видеопамяти. Заметно влияет на скорость и эффективность выполнения ветвлений в шейдерах.

Сравнительные результаты видеокарт AMD на диаграмме весьма похожи на те, что мы видели в тесте текстурной производительности 3DMark Vantage. А вот для Nvidia это не так — в данном случае GTX 470 получила явное ускорение, видимо, из-за разной эффективности выполнения шейдерных программ с ветвлениями. И вообще — немного удивительно, что именно GTX 460 стал аутсайдером этого теста, проиграв даже HD 5770. А вот новые герои от AMD снова попарно хоть и чуть-чуть, но всё-таки быстрее своих предшественников в лице HD 5830 и HD 5770.

Feature Test 4: GPU Cloth

Тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте зависит сразу от нескольких параметров, основные из которых: производительность обработки геометрии и эффективность выполнения геометрических шейдеров. И поэтому видеокарты производства Nvidia чувствуют себя как рыба в воде, значительно опережая конкурентов от компании AMD. Хорошо видна и разница между решениями Nvidia из разных ценовых диапазонов.

Конкретно у представленных недавно видеокарт новой серии Radeon HD 6800 скорость рендеринга в этом тесте выше, чем у предыдущей линейки, так как в Barts увеличили скорость обработки геометрии и выполнения геометрических шейдеров. И хотя HD 6870 всё же не достаёт до GTX 460, но она значительно обгоняет другие протестированные решения компании, да и HD 6850 идёт где-то недалеко.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующих частицу. Но тест больше всего загружает шейдерные блоки вершинными расчётами, также тестируется stream out.

Результаты очередного теста весьма похожи на те, что мы видели на предыдущей диаграмме, но здесь скорость обработки геометрии даже ещё важнее, чем в прошлом тесте. Именно поэтому старое поколение в виде карт Radeon HD 5830 и HD 5770 отстало как от обеих Geforce, являющихся лидерами сравнения, так и от новой линейки видеокарт, рассмотренной сегодня. А обе модели, основанные на Barts, показали неплохие результаты, уступив GTX 460 не слишком много.

В общем, в синтетических тестах имитации тканей и частиц из тестового пакета 3DMark Vantage, где активно используются геометрические шейдеры, новый чип Barts показал себя просто отлично, так как в нём была ускорена обработка геометрии. И хотя оба решения линейки HD 6800 продолжают отставать от конкурирующих с ними видеокарт соперника, разница между ними заметно сократилась — работа над этим улучшением в Barts проведена неплохо. Но всё же от следующего топового решения компании AMD мы ожидаем ещё больших архитектурных изменений.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто используемый в процедурном текстурировании, он использует очень много математических расчётов.

В чисто математическом тесте из пакета компании Futuremark, показывающим пиковую производительность видеочипов в предельных задачах, мы видим уже знакомую нам картину. Показанная на диаграмме производительность решений примерно соответствует тому, что должно получаться по теории, и тому, что мы видели ранее в наших математических тестах из пакета RightMark 2.0.

Так как новые карты HD 6870 и HD 6850 серьёзно усилили позиции как раз по математике, то неудивительно, что старшая модель является лидером сравнения, а младшая опережает предшествующую плату среднего ценового диапазона — HD 5770. Видеокарты Geforce показывают не очень высокие результаты, проигрывая всем платам AMD, что полностью соответствует теории. Ведь простая, но интенсивная математика выполняется на видеокартах Radeon значительно быстрее.

Выводы по синтетическим тестам

По результатам проведённых синтетических тестов видеокарт из нового семейства Radeon HD 6800, основанных на графическом процессоре Barts, а также результатам других моделей видеокарт производства обоих производителей дискретных видеочипов, мы делаем вывод о том, что это весьма подходящая замена решениям среднего ценового диапазона на чипах прошлого поколения.

Графический процессор Barts хоть и не слишком сильно отличается от предыдущих чипов архитектурно, но зато количество исполнительных блоков и их частота возросли настолько, что производительность вплотную подобралась к топовой серии предшествующего поколения — HD 5800. Также новый GPU отличается некоторыми архитектурными улучшениями, направленными на устранение самого важного из недостатков, по сравнению с продукцией конкурента, — и по синтетическим тестам мы видим, что производительность обработки геометрии выросла.

Благодаря всем изменениям, результаты видеокарт новой серии во многих синтетических тестах являются максимальными для решений из данного ценового сектора. Особенно хорошо это видно в распараллеленных, но не слишком сложных по алгоритму вычислительных тестах из пакетов RightMark и Vantage. Да и во всех остальных приложениях скорость HD 6800 очень неплохая — заметно выше, чем у соответствующих решений из предыдущей линейки.

Можно предположить, что очень неплохие результаты Radeon HD 6870 и HD 6850 в наших синтетических тестах будут подтверждены и аналогичными результатами в следующей части нашего материла, где вы ознакомитесь с игровыми тестами из нашего набора. Соответственно, в игровых тестах HD 6870 должна будет опередить HD 5830, а HD 6850 оказаться быстрее, чем HD 5770.

Но вот что получится в сравнении с видеокартами Geforce, предсказать не так уж просто, так как и у тех, и у других есть свои сильные и слабые стороны. Вероятно, в некоторых играх будут первенствовать выпущенные недавно решения компании AMD, а в других верх возьмут их конкуренты от Nvidia. Тем интереснее будет посмотреть на результаты!



AMD Radeon HD 6850/6870 — Часть 3: Игровые тесты (производительность)



Блок питания для тестового стенда предоставлен компанией TAGAN

Корпус ThermalTake 8430 для тестового стенда предоставлен компанией 3LOGIC

Монитор Dell 3007WFP для тестовых стендов предоставлен компанией Nvidia








Дополнительно

ВИКТОРИНА TT

Материнские платы какого форм-фактора можно устанавливать в корпус Thermaltake Versa C22 RGB Snow Edition?

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.