Бюджетные ускорители — 2011

AMD (reference) Radeon HD 6450 512 МБ 64-битной GDDR5 PCI-E
Sapphire Radeon HD 6570 1024 МБ 128-битной GDDR3 PCI-E
Sapphire Radeon HD 6670 1024 МБ 128-битной GDDR5 PCI-E
Sapphire Radeon HD 6670 Ultimate 1024 МБ 128-битной GDDR5 PCI-E
AFox Geforce GT 520 1024 МБ 64-битной GDDR3 PCI-E
Nvidia Geforce GT 430 1024 МБ 128-битной SDDR3 PCI-E
MSI Geforce GT 440 1024 МБ 128-битной GDDR3 PCI-E
Gainward Geforce GTS 450 1024 МБ 128-битной GDDR3 PCI-E




Содержание

В этой части, как обычно, мы изучим сами видеокарты, а также познакомимся с результатами синтетических тестов. Видеокарту на базе Geforce GT 430 представлять не будем, поскольку в нашем проекте участвует продукт Inno3D, а по нему уже был отдельный материал с детальным описанием видеокарты.

Платы

AMD (reference) Radeon HD 6450 512 МБ 64-битной GDDR5 PCI-E
  • GPU: Radeon HD 6450 (Caicos)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs): 750 МГц (номинал — 750 МГц)
  • Частоты работы памяти (физическая (эффективная)): 900 (3600) МГц (номинал — 900 (3600) МГц)
  • Ширина шины обмена с памятью: 64 бит
  • Число вычислительных блоков в GPU/частота работы блоков: 24/750 МГц (номинал — 24/750 МГц)
  • Число операций (ALU) в блоке: 5
  • Суммарное число операций (ALU): 120
  • Число блоков текстурирования: 8 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 4
  • Размеры: 190×60×16 мм (последняя величина — максимальная толщина видеокарты)
  • Цвет текстолита: черный
  • RAMDACs/TMDS: интегрированы в GPU
  • Выходные гнезда: 1×DVI (Dual-Link/HDMI), 1×DisplayPort, 1×VGA
  • Поддержка многопроцессорной работы: CrossFire (Software)
Sapphire Radeon HD 6570 1024 МБ 128-битной GDDR3 PCI-E
  • GPU: Radeon HD 6570 (Turks)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs): 650 МГц (номинал — 650 МГц)
  • Частоты работы памяти (физическая (эффективная)): 1000 (2000) МГц (номинал — 1000 (2000) МГц)
  • Ширина шины обмена с памятью: 128 бит
  • Число вычислительных блоков в GPU/частота работы блоков: 96/650 МГц (номинал — 96/650 МГц)
  • Число операций (ALU) в блоке: 5
  • Суммарное число операций (ALU): 480
  • Число блоков текстурирования: 24 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 8
  • Размеры: 190×100×33 мм (последняя величина — максимальная толщина видеокарты)
  • Цвет текстолита: синий
  • RAMDACs/TMDS: интегрированы в GPU
  • Выходные гнезда: 1×DVI (Dual-Link/HDMI), 1×HDMI, 1×VGA
  • Поддержка многопроцессорной работы: CrossFire (Software)
Sapphire Radeon HD 6670 1024 МБ 128-битной GDDR5 PCI-E
  • GPU: Radeon HD 6670 (Turks)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs): 800 МГц (номинал — 800 МГц)
  • Частоты работы памяти (физическая (эффективная)): 1000 (4000) МГц (номинал — 1000 (4000) МГц)
  • Ширина шины обмена с памятью: 128 бит
  • Число вычислительных блоков в GPU/частота работы блоков: 96/650 МГц (номинал — 96/650 МГц)
  • Число операций (ALU) в блоке: 5
  • Суммарное число операций (ALU): 480
  • Число блоков текстурирования: 24 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 8
  • Размеры: 190×100×33 мм (последняя величина — максимальная толщина видеокарты)
  • Цвет текстолита: синий
  • RAMDACs/TMDS: интегрированы в GPU
  • Выходные гнезда: 1×DVI (Dual-Link/HDMI), 1×HDMI, 1×DisplayPort
  • Поддержка многопроцессорной работы: CrossFire (Software)
Sapphire Radeon HD 6670 Ultimate 1024 МБ 128-битной GDDR5 PCI-E
  • GPU: Radeon HD 6670 (Turks)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs): 800 МГц (номинал — 800 МГц)
  • Частоты работы памяти (физическая (эффективная)): 1000 (4000) МГц (номинал — 1000 (4000) МГц)
  • Ширина шины обмена с памятью: 128 бит
  • Число вычислительных блоков в GPU/частота работы блоков: 96/650 МГц (номинал — 96/650 МГц)
  • Число операций (ALU) в блоке: 5
  • Суммарное число операций (ALU): 480
  • Число блоков текстурирования: 24 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 8
  • Размеры: 190×120×39 мм (последняя величина — максимальная толщина видеокарты)
  • Цвет текстолита: синий
  • RAMDACs/TMDS: интегрированы в GPU
  • Выходные гнезда: 1×DVI (Dual-Link/HDMI), 1×HDMI, 1×Display Port
  • Поддержка многопроцессорной работы: CrossFire (Software)
AFox Geforce GT 520 1024 МБ 64-битной GDDR3 PCI-E
  • GPU: Geforce GT 520 (GF118)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs): 810 МГц (номинал — 810 МГц)
  • Частота работы памяти (физическая (эффективная)): 533 (1066) МГц (номинал — 900 (1800) МГц)
  • Ширина шины обмена с памятью: 64 бит
  • Число вычислительных блоков в GPU/частота работы блоков: 48/1620 МГц (номинал — 48/1620 МГц)
  • Число операций (ALU) в блоке: 1
  • Суммарное число операций (ALU): 48
  • Число блоков текстурирования: 8 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 4
  • Размеры: 180×55×16 мм (последняя величина — максимальная толщина видеокарты)
  • Цвет текстолита: черный
  • RAMDACs/TMDS: интегрированы в GPU
  • Выходные гнезда: 1×DVI (Dual-Link/HDMI), 1×VGA, 1×HDMI
  • Поддержка многопроцессорной работы: SLI (Software)
MSI Geforce GT 440 1024 МБ 128-битной GDDR3 PCI-E
  • GPU: Geforce GT 440 (GF108)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs): 810 МГц (номинал — 810 МГц)
  • Частота работы памяти (физическая (эффективная)): 900 (1800) МГц (номинал — 900 (1800) МГц)
  • Ширина шины обмена с памятью: 128 бит
  • Число вычислительных блоков в GPU/частота работы блоков: 96/1620 МГц (номинал — 96/1620 МГц)
  • Число операций (ALU) в блоке: 1
  • Суммарное число операций (ALU): 96
  • Число блоков текстурирования: 16 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 4
  • Размеры: 190×70×18 мм (последняя величина — максимальная толщина видеокарты)
  • Цвет текстолита: черный
  • RAMDACs/TMDS: интегрированы в GPU
  • Выходные гнезда: 1×DVI (Dual-Link/HDMI), 1×VGA, 1×HDMI
  • Поддержка многопроцессорной работы: SLI (Software)
Gainward Geforce GTS 450 1024 МБ 128-битной GDDR3 PCI-E
  • GPU: Geforce GTS 450 (GF106)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs): 783 МГц (номинал — 783 МГц)
  • Частоты работы памяти (физическая (эффективная)): 700 (1400) МГц (номинал — 800 (1600) МГц)
  • Ширина шины обмена с памятью: 128 бит
  • Число вычислительных блоков в GPU/частота работы блоков: 192/1566 МГц (номинал — 192/1566 МГц)
  • Число операций (ALU) в блоке: 1
  • Суммарное число операций (ALU): 192
  • Число блоков текстурирования: 32 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 16
  • Размеры: 190×100×33 мм (последняя величина — максимальная толщина видеокарты)
  • Цвет текстолита: красный
  • RAMDACs/TMDS: интегрированы в GPU
  • Выходные гнезда: 1×DVI (Dual-Link/HDMI), 1×HDMI, 1×VGA
  • Поддержка многопроцессорной работы: SLI (Hardware)

AMD (reference) Radeon HD 6450 512 МБ 64-битной GDDR5 PCI-E
Карта имеет 512 МБ памяти GDDR5 SDRAM, размещенной в 4 микросхемах на лицевой сторонe PCB.

Микросхемы памяти Samsung (GDDR5). Микросхемы расчитаны на максимальную частоту работы в 1000 (4000) МГц.
Sapphire Radeon HD 6570 1024 МБ 128-битной GDDR3 PCI-E
Карта имеет 1024 МБ памяти GDDR3 SDRAM, размещенной в 4 микросхемах на лицевой сторонe PCB.

Микросхемы памяти Elpida (GDDR3). Микросхемы рассчитаны на максимальную частоту работы в 1250 (2500) МГц.
Sapphire Radeon HD 6670 1024 МБ 128-битной GDDR5 PCI-E
Карта имеет 1024 МБ памяти GDDR3 SDRAM, размещенной в 4 микросхемах на лицевой сторонe PCB.

Микросхемы памяти Hynix (GDDR5). Микросхемы рассчитаны на максимальную частоту работы в 1250 (5000) МГц.
Sapphire Radeon HD 6670 Ultimate 1024 МБ 128-битной GDDR5 PCI-E
Карта имеет 1024 МБ памяти GDDR3 SDRAM, размещенной в 4 микросхемах на лицевой сторонe PCB.

Микросхемы памяти Hynix (GDDR5). Микросхемы рассчитаны на максимальную частоту работы в 1250 (5000) МГц.
AFox Geforce GT 520 1024 МБ 64-битной GDDR3 PCI-E
Карта имеет 1024 МБ памяти GDDR3 SDRAM, размещенной в 4 микросхемах на лицевой сторонe PCB.

Микросхемы памяти Hynix (GDDR5). Микросхемы рассчитаны на максимальную частоту работы в 1250 (5000) МГц.
MSI Geforce GT 440 1024 МБ 128-битной GDDR3 PCI-E
Карта имеет 1024 МБ памяти GDDR3 SDRAM, размещенной в 8 микросхемах на лицевой сторонe PCB.

Микросхемы памяти Hynix (GDDR3). Микросхемы рассчитаны на максимальную частоту работы в 900 (1800) МГц.
Gainward Geforce GTS 450 1024 МБ 128-битной GDDR3 PCI-E
Карта имеет 1024 МБ памяти GDDR3 SDRAM, размещенной в 8 микросхемах на лицевой сторонe PCB.

Микросхемы памяти Hynix (GDDR3). Микросхемы рассчитаны на максимальную частоту работы в 900 (1800) МГц.

AMD (reference) Radeon HD 6450 512 МБ 64-битной GDDR5 PCI-E
Вид спереди Вид сзади
Sapphire Radeon HD 6570 1024 МБ 128-битной GDDR3 PCI-E
Вид спереди Вид сзади
Sapphire Radeon HD 6670 1024 МБ 128-битной GDDR5 PCI-E
Вид спереди Вид сзади
Sapphire Radeon HD 6670 Ultimate 1024 МБ 128-битной GDDR5 PCI-E
Вид спереди Вид сзади
AFox Geforce GT 520 1024 МБ 64-битной GDDR3 PCI-E
Вид спереди Вид сзади
MSI Geforce GT 440 1024 МБ 128-битной GDDR3 PCI-E
Вид спереди Вид сзади
Gainward Geforce GTS 450 1024 МБ 128-битной GDDR3 PCI-E
Вид спереди Вид сзади

У тех карт, у которых нет VGA-гнезд, подключение к аналоговым мониторам производится через специальные адаптеры-переходники DVI-to-d-Sub. Что касается вывода через HDMI, то многие продукты обладают такой возможностью, а у одной карты есть и порт DisplayPort.

Максимальные разрешения и частоты:

  • 240 Гц — максимальная частота обновления
  • 2048×1536@85 Гц — по аналоговому интерфейсу
  • 2560×1600@60 Гц — по цифровому интерфейсу (для DVI-гнезд с Dual-Link/HDMI)

По поводу HDTV. Одно из исследований также проведено, и с ним можно ознакомиться здесь.

Напомню, что только карта на основе GTS 450 требует дополнительного питания одним 6-контактным разъемом, остальные не требуют.

О системах охлаждения.

AMD (reference) Radeon HD 6450 512 МБ 64-битной GDDR5 PCI-E
Очень простая конструкция, состоящая из закрытого плоского радиатора, на одном конце которого установлен вентилятор.

Ядро не требует сильного охлаждения, поэтому вентилятор не шумит, поскольку его обороты невелики.
Sapphire Radeon HD 6570 1024 МБ 128-битной GDDR3 PCI-E
На ядре установлен большой пластинчатый радиатор, прикрытый сверху кожухом с большим вентилятором, частота вращения которого также невелика, поэтому СО практически бесшумная.
Sapphire Radeon HD 6670 1024 МБ 128-битной GDDR5 PCI-E
Полностью аналогичная СО, которая замечательно справляется и с более высокими (по сравнению с HD 6570) частотами HD 6670, при этом частота вращения вентилятора по-прежнему невелика, делая СО бесшумной.
Sapphire Radeon HD 6670 Ultimate 1024 МБ 128-битной GDDR5 PCI-E
А в данном случае суффикс Ultimate у видеокарты предусматривает наличие нестандартной СО. И действительно, мы видим массивный радиатор, которому по силам справиться с охлаждением такой карты без вентилятора.
AFox Geforce GT 520 1024 МБ 64-битной GDDR3 PCI-E
Такая же простая СО, как и у Radeon HD 6450.
MSI Geforce GT 440 1024 МБ 128-битной GDDR3 PCI-E
Любопытно, что компания MSI даже на такую маленькую плату установила как бы «игрушечную» копию своего знаменитого кулера TwinFrozzr. Даже форма кожуха напоминает о том — настоящем и большом кулере.

Нужно ли здесь два вентилятора, а не один? Сложный вопрос. Однако частота вращения невелика, так что СО практически не шумит. При этом размеры СО заставляют карту занимать 2 слота.
Gainward Geforce GTS 450 1024 МБ 128-битной GDDR3 PCI-E
СО по всем параметрам очень похожа на ту, что мы изучили выше у карт Sapphire — другая лишь форма кожуха. А все остальное то же самое: и низкая частота вращения, и бесшумность.

И точно так же СО занимает 2 слота в системном блоке.

Мы провели исследование температурного режима с помощью утилиты MSI Afterburner (автор А. Николайчук AKA Unwinder) и получили следующие результаты:

AMD (reference) Radeon HD 6450 512 МБ 64-битной GDDR5 PCI-E
Sapphire Radeon HD 6570 1024 МБ 128-битной GDDR3 PCI-E
Sapphire Radeon HD 6670 1024 МБ 128-битной GDDR5 PCI-E
Sapphire Radeon HD 6670 Ultimate 1024 МБ 128-битной GDDR5 PCI-E
AFox Geforce GT 520 1024 МБ 64-битной GDDR3 PCI-E
Nvidia Geforce GT 430 (Inno3D) 1024 МБ 128-битной SDDR3 PCI-E
MSI Geforce GT 440 1024 МБ 128-битной GDDR3 PCI-E
Gainward Geforce GTS 450 1024 МБ 128-битной GDDR3 PCI-E

Никаких сюрпризов тут нет, все СО отработали эффективно. Разве что у Sapphire Radeon HD 6670 Ultimate температура нагрева ядра достигла 80 градусов, что приемлемо для топовых карт, но наверное, не очень хорошо для лоу-энда. Впрочем, не забываем, что СО у этой карты без вентилятора, а потому совершенно бесшумная.

Теперь о комплектации.

Базовый комплект поставки должен включать в себя: руководство пользователя, диск с драйверами и утилитами.

AMD (reference) Radeon HD 6450 512 МБ 64-битной GDDR5 PCI-E
Карта прибыла к нам в ОЕМ-виде, поэтому комплекта нет.
Sapphire Radeon HD 6570 1024 МБ 128-битной GDDR3 PCI-E
Базовый комплект.
Sapphire Radeon HD 6670 1024 МБ 128-битной GDDR5 PCI-E
Базовый комплект плюс адаптер DVI-to-VGA, поскольку у этой карты нет VGA-гнезда.
Sapphire Radeon HD 6670 Ultimate 1024 МБ 128-битной GDDR5 PCI-E
Аналогичный комплект плюс кабель HDMI для подключения к монитору, а также бонус в виде купона на игру Dirt3.
AFox Geforce GT 520 1024 МБ 64-битной GDDR3 PCI-E
Базовый комплект плюс набор выводных планок для крепления карты в низкопрофильных корпусах.
MSI Geforce GT 440 1024 МБ 128-битной GDDR3 PCI-E
Карта прибыла к нам в ОЕМ-виде, поэтому комплекта нет.
Gainward Geforce GTS 450 1024 МБ 128-битной GDDR3 PCI-E
Карта прибыла к нам в ОЕМ-виде, поэтому комплекта нет.

На очереди рассмотрение упаковок.

AMD (reference) Radeon HD 6450 512 МБ 64-битной GDDR5 PCI-E
Карта прибыла к нам в ОЕМ-виде, поэтому упаковки нет.
Sapphire Radeon HD 6570 1024 МБ 128-битной GDDR3 PCI-E
Небольшой бокс из папье-маше, куда вмещается ровно видеокарта и маленький комплект. Все размещено компактно. А бокс помещен в глянцевую суперобложку стандартного для Sapphire дизайна.

Все надписи четкие и детальные.
Sapphire Radeon HD 6670 1024 МБ 128-битной GDDR5 PCI-E
Полностью аналогичная упаковка.
Sapphire Radeon HD 6670 Ultimate 1024 МБ 128-битной GDDR5 PCI-E
А в данном случае ради серии Ultimate упаковка приобрела черты аналогов для видеокарт более дорогого сегмента, когда и суперобложка особого дизайна, и размеры в целом больше, и коробка уже имеет отсеки для размещения комплекта.

Но также все надписи четкие и детальные.
AFox Geforce GT 520 1024 МБ 64-битной GDDR3 PCI-E
Небольшой бокс из твердого картона, выполненный в фирменном стиле компании. Все основные надписи сделаны крупно и хорошо читаются.

Видеокарта внутри находится в мягком пакете, поэтому «мотание» в коробке исключено.
MSI Geforce GT 440 1024 МБ 128-битной GDDR3 PCI-E
Карта прибыла к нам в ОЕМ-виде, поэтому упаковки нет.
Gainward Geforce GTS 450 1024 МБ 128-битной GDDR3 PCI-E
Карта прибыла к нам в ОЕМ-виде, поэтому упаковки нет.

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютер на базе Intel Core i7-975 (Socket 1366)
    • процессор Intel Core i7-975 (3340 МГц);
    • системная плата Asus P6T Deluxe на чипсете Intel X58;
    • оперативная память 6 ГБ DDR3 SDRAM Corsair 1600 МГц;
    • жесткий диск WD Caviar SE WD1600JD 160 ГБ SATA;
    • блок питания Tagan TG900-BZ 900 Вт.
  • операционная система Windows 7 64-битная с SP1; DirectX 11;
  • монитор Dell 3007WFP (30″);
  • драйверы ATI версии Catalyst 11.8; Nvidia версии ForceWare 280.26.

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать:

  • D3D RightMark Beta 4 (1050) с описанием — на сайте 3d.rightmark.org
  • D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 (тесты пиксельных шейдеров версий 2.0 и 3.0) — по ссылке
  • RightMark3D 2.0 с кратким описанием — под Vista без SP1, под Vista c SP1

Для работы RightMark3D 2.0 также требуется установленный пакет MS Visual Studio 2005 runtime и последнее обновление DirectX runtime.

Синтетические тесты выполнялись на следующих видеокартах:

  • Radeon HD 6670 со стандартными параметрами (далее HD 6670)
  • Radeon HD 6570 со стандартными параметрами (далее HD 6570)
  • Radeon HD 6450 со стандартными параметрами (далее HD 6450)
  • Geforce GTS 450 DDR3, модель с памятью DDR3 (далее GTS 450 DDR3)
  • Geforce GT 440 DDR3, модель с памятью DDR3 (далее GT 440 DDR3)
  • Geforce GT 430 со стандартными параметрами (далее GT 430)

Для анализа результатов бюджетных линеек Radeon HD 6600/6500/6400 и разнокалиберных Geforce нам не пришлось долго думать над выбором видеокарт. Мы просто взяли по три решения каждого производителя, наиболее близкие по цене и производительности, хотя и не идентичные по всем этим показателям. Geforce GTS 450 с DDR3-памятью является ближайшим решением к Radeon HD 6670; GT 440 с DDR3 — схожая по стоимости и теоретическим характеристикам с HD 6570 видеокарта Nvidia; ну а GT 430 ближе всего к самой дешёвой плате обзора — Radeon HD 6450.

Direct3D 9: тесты Pixel Filling

В тесте определяется пиковая производительность выборки текстур (texel rate) в режиме FFP для разного числа текстур, накладываемых на один пиксель:

В тесте текстурной производительности все видеокарты традиционно показывают меньшие цифры, чем теоретически возможные значения, и мы проверим их ещё раз в аналогичном тесте из пакета 3DMark Vantage. Результаты нашей же синтетики для новых видеокарт Radeon не дотягивают до пиковых значений по несколько процентов, но гораздо ближе к ним, чем показатели топовых решений.

По сравнению с конкурирующими видеоплатами Nvidia скорость текстурирования новых Radeon оказалась весьма неплохой, если не считать самого слабого HD 6450, который и по теории должен быть слабее всех. Результаты Radeon HD 6670 превышают показатели Geforce GTS 450, а HD 6570 серьёзно опередила GT 440, что даже лучше, чем должно быть по теоретическим показателям производительности блоков TMU. Рассмотрим тест филлрейта:

Второй синтетический тест показывает скорость заполнения, и в нём мы видим всё то же самое, но уже с учётом количества записанных в буфер кадра пикселей. На диаграмме отлично видно явное ограничение скорости рендеринга у всех решений AMD и Nvidia в условиях до трёх текстур включительно.

Максимальный результат и тут остаётся за старшим решением бюджетной линейки Radeon HD 6670, но и HD 6570, основанный на том же GPU, оказывается близко к GTS 450 с DDR3-памятью, которая явно «душит» производительность этой модели от Nvidia. Явным аутсайдером ожидаемо выглядит очень простой чип, ставший основой для Radeon HD 6450, но он и стоит дешевле остальных плат.

Direct3D 9: тесты Pixel Shaders

Первая группа пиксельных шейдеров, которую мы рассматриваем, очень проста для современных видеочипов, она включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся в старых играх.

Тесты пиксельных шейдеров младших версий весьма и весьма просты для современных GPU, даже таких бюджетных. И производительность в данных тестах ограничена по большей части скоростью текстурных модулей, с учётом эффективности этих блоков и кэширования текстур. В предыдущих исследованиях мы отмечали также и некоторое влияние ПСП видеопамяти.

Диаграммой подтверждается слабость HD 6450, зато даже HD 6570 показал результат на уровне GTS 450 DDR3. А лучшим решением сравнения стала старшая бюджетная модель — HD 6670, опередившая всех с запасом. Что лишь подтверждает упор скорости рендеринга в производительность текстурирования и филлрейт.

В общем, если брать сравнение с видеокартами Nvidia, то только HD 6450 выглядит слабо по понятным причинам. В этих, сравнительно лёгких тестах, важнее всего реальная скорость текстурирования, и по этому параметру и HD 6450 и видеокарты Nvidia проигрывают остальным представленным моделям Radeon. Посмотрим на результаты более сложных пиксельных программ промежуточных версий:

В сильно зависящем от скорости текстурирования тесте процедурной визуализации воды «Water» используется зависимая выборка из текстур больших уровней вложенности, и поэтому видеокарты в нём также располагаются по скорости текстурирования, но с влиянием эффективности кэширования данных. В этом тесте выигрывает уже старшее решение Nvidia, имеющее лучшие показатели скорости текстурирования. Хотя Radeon HD 6670 отстаёт не слишком сильно, да и HD 6570 всё так же быстрее GT 440. Лишь HD 6450 традиционно серьёзно уступает и самой медленной из видеокарт Nvidia. В целом, представленные видеокарты AMD выступили неплохо.

А вот результаты второго подтеста уже иные. Тест более интенсивен вычислительно, и в нём сказывается в том числе и влияние математической производительности. Поэтому тест несколько лучше подходит для видеокарт AMD, обладающих большим количеством блоков ALU, в дополнение к неплохой текстурной производительности. И тут HD 6670 уже вырывается вперёд, а HD 6570 совсем недалеко от лучшего из решений конкурента. Естественно и то, что слабый HD 6450 всё так же отстаёт от всех — такая уж сегодня роль у него.

Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье Современная терминология 3D графики.
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

Существует два варианта этих шейдеров: с ориентацией на математические вычисления, и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это — универсальные тесты, зависящие и от скорости блоков ALU и от скорости текстурирования, в них важен общий баланс чипа. Соотношение производительности видеокарт в тесте «Frozen Glass» в целом весьма схоже с тем, что мы видели выше в «Cook-Torrance», но модель Radeon HD 6570 выступила даже ещё лучше, показав результат на уровне лучшей из Nvidia — модели GTS 450 с DDR3-памятью. Так получилось потому, что в этом тесте прослеживается ещё и влияние пропускной способности видеопамяти. Логично, что HD 6450 снова отстала от остальных участников, ну а HD 6670 показала лучший результат. Так что в среднем все решения компании AMD выступили очень хорошо.

Результаты второго теста «Parallax Mapping» мало чем отличаются, разве что решения Nvidia уступили ещё больше, так как им явно не хватает математической производительности для этой задачи. В этот раз оба новых решения на основе чипа Turks оказались значительно лучше GTS 450, а HD 6450 уже не так далёк от более дорогих конкурентов. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:

Относительное положение на диаграмме изменилось мало, разве что GTS 450, «придушенная» DDR3-памятью, стала чуть повыше, обогнав хотя бы HD 6570 в одном из тестов и приблизившись к ней во втором. Видно, что текстурирование у старого чипа Nvidia явно в числе сильных сторон. Но это не сильно помогло во втором тесте. Слабейший Radeon HD 6450 привычно плетётся позади, а лидирует модель HD 6670.

Но всё это были устаревшие задачи, в основном с упором в текстурирование или филлрейт. А сейчас мы рассмотрим результаты ещё двух тестов пиксельных шейдеров — версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9 API, которые намного показательнее с точки зрения современных игр на ПК. Эти тесты отличаются тем, что сильнее нагружают и ALU, и текстурные модули, обе шейдерные программы сложные и длинные, включают большое количество ветвлений.

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье Современная терминология 3D-графики.
  • Fur — процедурный шейдер, визуализирующий мех.

Мы не раз отмечали, что эти два теста пиксельных шейдеров версии 3.0 из всего подраздела наиболее адекватно показывают примерную расстановку графических решений по скорости рендеринга в современных играх. С этими тестами у решений Nvidia дела обычно обстоят гораздо лучше, чем с предыдущими примерами. Оба представленных теста довольно сложны, результаты в нём мало зависят от ПСП и текстурирования, они ограничены производительностью математических блоков, но с учётом большого количества переходов и ветвлений.

И вот тут видно, что в обоих тестах представленная в сравнении модель Radeon HD 6670 показывает результат уже хуже, чем Nvidia GTS 450 DDR3, причём в случае теста Fur отставание большое. Radeon HD 6450 здесь ловить вообще нечего, хотя она и не предназначена для конкуренции с остальными платами. Что касается среднего Radeon HD 6570, то он опережает своего прямого соперника во втором тесте (Steep Parallax Mapping), а в первом тесте (Fur) это решение уступает даже GT 430. Сегодняшний тест лишь подтвердил найденную закономерность — в этом разделе традиционно выигрывают видеоплаты производства компании Nvidia.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два знакомых PS 3.0 теста под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами, при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40-80, включение «шейдерного» суперсэмплинга — до 60-120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Как показали прошлые исследования, производительность в этом тесте зависит не только от количества и эффективности блоков TMU, но и от филлрейта. К сожалению, все решения Nvidia в Direct3D 10 тестах процедурной визуализации меха с большим количеством текстурных выборок на сегодняшний момент явно сдали позиции и показывают слишком низкие результаты. А ведь когда-то решения Nvidia были весьма сильны в этих тестах. Результаты в режиме «High» получаются примерно в полтора раза ниже, чем в «Low», как и должно быть по теории.

Верхняя модель из представленных видеокарт AMD показала быстрейший результат, и лишь немного отстаёт от неё конкурирующая GTS 450. HD 6570 свою борьбу у GT 440 выигрывает с хорошим запасом, и даже HD 6450 уже на одном уровне с GT 430! В целом, видеокарты AMD в этом тесте оказались способны успешно конкурировать со своими противниками. Похоже, что на скорости рендеринга решений Nvidia дополнительно сказывается и низкая пропускная способность.

Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза, возможно в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять иначе:

Включение суперсэмплинга увеличивает теоретическую нагрузку вчетверо, и в таком случае решения Nvidia уступают ещё больше, сдавая свои позиции. Low-end видеокарты AMD выглядят теперь ещё сильнее, Radeon серии HD 6600 уже в обоих подтестах опережает GTS 450. HD 6570 оторвался от GT 440 сильнее, а вот HD 6450 так и не смог достичь скорости слабейшей карты Nvidia. Результаты теста явно указывают на то, что производительность в тесте ограничивается не только производительностью ROP, но и пропускной способностью видеопамяти.

Второй тест, измеряющий производительность выполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок, называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением, число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше, по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Этот тест интереснее с практической точки зрения, так как разновидности parallax mapping давно применяются в играх, а тяжелые варианты, вроде нашего steep parallax mapping используются во многих проектах, например, в играх серий Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить и самозатенение, увеличивающее нагрузку на видеочип примерно в два раза — такой режим называется «High».

Диаграмма в целом очень похожа на предыдущую (без сглаживания методом суперсэмплинга) и результаты близки и по абсолютным цифрам. В обновленном варианте данного теста без включения суперсэмплинга, модель Radeon HD 6670 справляется с задачей явно лучше платы Geforce GTS 450 с DDR3-памятью. HD 6570 не оставляет шансов GT 440, а вот слабейший из рассматриваемых сегодня вариант не смог догнать GT 430. Посмотрим, что изменит включение суперсэмплинга.

При включении SSAA и самозатенения задача стала заметно более тяжёлой, совместное включение сразу этих двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая большое падение производительности до двухзначных цифр FPS. Разница между показателями видеокарт изменилась, включение суперсэмплинга сказывается как и в предыдущем случае — карты производства компании AMD снова улучшили свои показатели относительно решений Nvidia (кроме откровенно слабой Radeon HD 6450).

В этой ситуации даже Radeon HD 6570 уже конкурирует не с GF 440, а с GTS 450! Не говоря уже о HD 6670, которая явно лидирует в данном тесте, легко справляясь со всеми соперниками. Хорошо видно, что при росте нагрузки и усложнении условий, влияние ПСП на результаты теста уже гораздо меньше. И карты ограничиваются уже возможностями математических вычислений, которые у AMD явно лучше. Кроме одного из сегодняшних героев — Radeon HD 6450. Будучи основан на самом простом GPU, он абсолютно справедливо отстаёт от остальных решений, имеющих более сложные графические процессоры.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

В каждом материале мы пишем о том, что видеокарты AMD в синтетических, вычислительно сложных задачах традиционно показывают значительно более высокие результаты, по сравнению с решениями Nvidia. Это не изменится до выхода следующего поколения GPU, как минимум. Современная архитектура AMD имеет огромное преимущество перед конкурирующими видеокартами Nvidia в пиковой производительности, даже несмотря на меньший КПД. Вот и в этот раз разница между видеокартами Nvidia и AMD осталась просто гигантской.

В первом из чисто математических тестов мы видим то, что каждая из видеокарт Radeon быстрее не только конкурирующей по цене Geforce, но и успешно соперничает с моделью на ступеньку выше. То есть, Radeon HD 6670 просто стала недосягаема для GTS 450, зато с последней конкурирует HD 6570, да как! И даже HD 6450 в этот раз оказалась на одном уровне с GT 430, хотя имеет худшие теоретические показатели производительности ALU.

Но всё же, можно отметить, что решения расположились примерно соответственно теоретическим показателям. Хотя конкретно этот тест всё же не полностью зависит от скорости ALU, иногда скорость GPU ограничивается ещё и скоростью видеопамяти. Поэтому рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он ещё тяжелее для ALU, и текстурная выборка в нём только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Но нет, изменений в расстановке видеоплат на диаграмме практически нет. Значит, и в первом и во втором математическом подтесте скорость рендеринга была ограничена почти исключительно производительностью шейдерных блоков. Разница между различными решениями осталась примерно той же и близкой к теоретическим показателям.

Radeon HD 6670 снова стала явным лидером сравнения, средняя модель HD 6570 опередила более дорогую и сложную Geforce GTS 450 DDR3, ну а HD 6450 немного не дотянулась до GT 430. В общем, тесты производительности блоков математических вычислений снова показали ожидаемый нами результат — у решений компании AMD на данный момент есть явное архитектурное преимущество в большем количестве блоков ALU.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующих частицу. Аналогичные алгоритмы должны получить широкое использование в будущих DirectX 10 играх.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений — производительность соответствует количеству точек и с каждым шагом падение FPS составляет около двух раз. Задача для современных видеокарт не очень сложная, и производительность в целом ограничена не только скоростью геометрической обработки, но ещё и пропускной способностью памяти.

Radeon HD 6670 показал результат несколько худший, чем получился у Geforce GTS 450, которая лидирует в сравнении. Ещё немного отстал средний HD 6570, но он уверенно опережает своего прямого конкурента — модель GT 440. Интересно, что даже слабейшая HD 6450 по сравнению с конкурентами не так уж и отстала, показав результат, близкий к уровню более дорогой GT 430, особенно в более сложных условиях. Посмотрим, что изменится при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте, цифры для решений Nvidia вообще не изменились, а вот младшие видеокарты AMD Radeon слегка подтянули свои результаты. Платы с графическими процессорами компании Nvidia в этом тесте вовсе не замечают изменения параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, и показывают аналогичные предыдущей диаграмме результаты, а вот младшие решения AMD на чипах Turks и Caicos слегка ускоряются.

В результате, Radeon HD 6670 во всех условиях максимально близок к Geforce GTS 450 с DDR3-памятью, HD 6570 показывает скорость где-то между GTS 450 и GT 440, а младший HD 6450 почти достал GT 430. Что ж, перейдём к следующему тесту, который предполагает большую нагрузку на геометрические блоки и должен быть несколько интереснее для нас.

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленном в «Heavy» — ещё и для их отрисовки. То есть, в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер. Сначала рассматриваем лёгкий режим:

Относительные результаты в разных режимах снова соответствуют нагрузке: во всех случаях производительность неплохо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть почти в два раза медленней.

В этом тесте при сбалансированной нагрузке скорость рендеринга для всех решений менее явно ограничена геометрической производительностью — возможен больший упор в пропускную способность видеопамяти. Верхняя среди рассматриваемых модель Radeon HD 6670 в этот раз показывает результат чуть хуже, чем в предыдущем тесте — между видеокартами GTS 450 DDR3 и GT 430. Средняя HD 6570 весьма близка к GT 430, а не к прямой сопернице GT 440, а младшая HD 6450 с треском проиграла всем остальным.

Но эти цифры должны измениться на следующей диаграмме, в тесте с более активным использованием геометрических шейдеров. Также интересно будет сравнить друг с другом результаты, полученные в «Balanced» и «Heavy» режимах.

Ситуация меняется кардинально. Если у младших чипов Nvidia практически нет преимуществ по скорости исполнения геометрических шейдеров, так как они имеют лишь один-два растеризатора, то оптимизированная обработка геометрии в новых чипах AMD позволила видеокартам Radeon оказаться в этих условиях гораздо быстрее. Хотя и Geforce GTS 450 DDR3 ускорилась заметно.

В результате, модель Radeon HD 6570 смогла достать прямого конкурента в лице Geforce GT 440. А вот две другие карты своим соперникам проиграли, старшая HD 6670 не так много уступила GTS 450, а вот младшая HD 6450 традиционно показала почти вдвое худший результат. И всё же, в этом ценовом диапазоне особых преимуществ в скорости растеризации и обработки геометрии у младших чипов Nvidia не видно. После соответствующих оптимизаций геометрического конвейера у чипов AMD, начиная с Barts, конкурирующие решения Nvidia и AMD в тестах с обработкой большого количества геометрии стали сравнимыми по скорости.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи по сути и соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Наши предыдущие исследования показали, что на результаты этого теста влияет и скорость текстурирования и пропускная способность памяти. Разница между решениями Nvidia почему-то получилась совсем небольшой, да и в целом результаты ими показаны странные. Они почти не ускоряются в простых режимах по причине некоего ограничения, которое мы отмечаем уже пару лет. При этом у AMD таких проблем нет, и свежая модель Radeon HD 6670 показывает в условиях простой геометрии результат выше, чем Geforce GTS 450, проигрывает при большом количестве полигонов, и держится на одном уровне с конкурентом при средних настройках.

Что касается двух других моделей, то Radeon HD 6450 привычно в отстающих, а вот HD 6570 соперничает с GT 440 с переменным успехом, проигрывая в сложном режиме и опережая карту Nvidia в лёгком. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Взаимное расположение карт на диаграмме изменилось мало, упор видеокарт Nvidia во что-то неведомое остался. В среднем и лёгком режиме разницы в скорости для них теперь вовсе считай, что и нет. Остальное остаётся примерно так же, все новые платы AMD сильнее в лёгком режиме, в среднем результаты конкурентов близки, а вот в режиме сложной геометрии доминируют уже Geforce. Впрочем, Radeon HD 6570 и HD 6670 даже в этом случае неплохо справляются с задачей, чего нельзя сказать об постоянно отстающем HD 6450.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

В этом тесте результаты у всех участников сравнения получились совершенно иными, и не похожими на те, что мы видели на предыдущих диаграммах. В этот раз при разном количестве геометрии в тесте «Waves» мы видим явное преимущество решений AMD, и платы на основе их видеочипов показывают просто отличные результаты.

Старшая модель Radeon HD 6670 в 1.5 раза опережает конкурента Geforce GTS 450 с DDR3-памятью, HD 6570 делает то же самое с GT 440. А вот с HD 6450 снова незадача — он сильно медленнее в этом тесте, а все Geforce близки друг к другу, поэтому решение AMD сильно проигрывает. Рассмотрим второй вариант этого же теста:

С ростом сложности условий теста произошло немного изменений, и ничего нового и интересного мы тут не видим. Кроме того, что решения Nvidia немного сдали. Относительные результаты Radeon HD 6670 во втором тесте вершинных выборок при высокой детализации остались на очень хорошем уровне, и в самых сложных условиях эта плата обходит своего конкурента Geforce GTS 450. HD 6570 в полтора раза быстрее GT 440, ну а HD 6450 в этот раз почти догнала GT 430!

В общем, по этому тесту создаётся такое впечатление, что производительность в нём почти не зависит только от скорости текстурирования, а больше всего на неё влияет производительность блоков установки треугольников вместе с кэшированием геометрических данных, которое было серьёзно улучшено во всех графических процессорах компании AMD, начиная с Barts.

3DMark Vantage: Feature тесты

Синтетические тесты из пакета 3DMark Vantage хоть уже и не новы, но они обладают поддержкой D3D10 и интересны тем, что отличаются от наших. При анализе результатов low-end решений компании AMD в этом пакете мы сможем сделать какие-то полезные выводы, ускользнувшие от нас в тестах семейства RightMark.

Feature Test 1: Texture Fill

Первый тест — тест скорости текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

В тесте текстурной производительности из пакета 3DMark Vantage результаты всегда получаются не такими, как в RightMark. Причём, эти цифры гораздо ближе к теории, да и к тому, что обычно получается в играх. В текстурной синтетике данного пакета видеокарты Nvidia уже несколько эффективнее используют имеющиеся в их составе текстурные блоки, и Radeon HD 6670 тут показывает результат хуже, чем Geforce GTS 450.

Что касается остальных видеокарт AMD из нижнего ценового диапазона, которые мы сегодня рассматриваем, то HD 6570 с запасом опережает GT 440 по текстурированию, а вот младшая HD 6450 уступает наиболее медленной плате Nvidia в нашем сравнении (впрочем, они имеют разные цены). Налицо большая разница по скорости блоков TMU между GPU стоимостью хотя бы $100, и более дешёвыми вариантами.

Feature Test 2: Color Fill

Это — простой тест скорости заполнения. Используется несложный пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Цифры не похожи на наши потому, что у нас используется целочисленный буфер с 8-бит на компоненту, а в тесте Vantage — 16-битный формат с плавающей точкой. Показатели производительности в этом тесте часто соответствуют теоретическим цифрам филлрейта (производительности блоков ROP с учётом частоты работы GPU), но в нашем сегодняшнем сравнении они полностью ограничены пропускной способностью видеопамяти.

Поэтому и результаты такие. Например, GTS 450 явно ограничена именно ПСП, потому что теоретически блоки ROP у неё гораздо быстрее, чем у видеокарт AMD. А вот Radeon HD 6670 и HD 6570 с GDDR5 памятью не ограничены ПСП и более чем вдвое быстрее всех плат Nvidia в этом тесте. Да что там, даже HD 6450 быстрее всех видеокарт Nvidia! Так получилось именно из-за пропускной способности памяти. Так что для рассматриваемых сегодня плат компании AMD всё более чем хорошо.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature тестов, так как подобная техника уже используется в играх. В нём рисуется один четырехугольник (точнее, два треугольника), с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоёмкие операции по трассировке лучей и карта глубины большого разрешения.

Отрисовываемая поверхность затеняется при помощи тяжёлого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчёты освещения по Strauss.

Этот тест отличается от соседних тем, что результаты GPU в нём зависят не исключительно от скорости математических вычислений или эффективности исполнения ветвлений или скорости текстурных выборок, а от всего сразу. А для достижения высокой скорости важен грамотный баланс блоков GPU и ПСП видеопамяти. Заметно влияет на скорость и эффективность выполнения ветвлений в шейдерах.

В этом тесте традиционно несколько лучше выступают все решения компании AMD, и результаты двух плат из сегодняшней троицы не стали исключением. Сильнейшая из видеокарт AMD стала победителем, и даже Radeon HD 6570 идёт наравне с Geforce GTS 450 DDR3. Конечно, самая слабая HD 6450 уступает всем, но отрыв от GT 430 не такой уж и большой, а стоит изделие с чипом калифорнийской компании больше. Очень хороший результат для Turks.

Feature Test 4: GPU Cloth

Тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

На скорость рендеринга в этом тесте также влияет сразу несколько различных параметров, но всё же, больше всего скорость зависит от производительности обработки геометрии и эффективности исполнения геометрических шейдеров. Мы ранее отмечали, что в тестах физических симуляций графические процессоры производства Nvidia явно сильнее, но это касалось лишь решений высокого уровня, имеющих большое количество блоков обработки геометрии. Даже в диапазоне цен $150-200 преимущества у них уже нет, не говоря про менее дорогие чипы, которые мы сегодня рассматриваем.

Так и есть — в этом тесте явно быстрее всех работает Radeon HD 6670, а HD 6570 отстаёт соответственно частотам GPU. Обе они опережают все карты Nvidia, и даже HD 6450 лишь немного не догнала Geforce GTS 450 с DDR3-памятью. То есть, снова мы видим разгромный для Nvidia результат. Похоже, что в этом снова виновата в том числе и излишне урезанная пропускная способность памяти. А платы AMD получают оценку «отлично», постепенно избавляясь от своих слабых сторон.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующих частицу. Но тест больше всего загружает шейдерные блоки вершинными расчётами, также тестируется stream out.

Раньше в этом тесте результаты были схожи с теми, что мы видели на прошлой диаграмме, но в этот раз нехватка ПСП явно сказывается гораздо меньше. Поэтому платы Nvidia сильно подтянулись вверх, и пары HD 6670 c GTS 450 и HD 6570 с GT 440 близки друг к другу по скорости (с небольшим преимуществом решений AMD). Слабейшая HD 6450 снова сильно отстала от всех — уж явно более слаб этот чип, по мощности он близок скорее к интегрированной графике.

В остальном, по двум синтетическим тестам имитации тканей и частиц из рассматриваемого тестового пакета, в которых используются геометрические шейдеры, делаем вывод о том, что представленные в материале решения серии Radeon HD 6000 неплохо справляются с работой, зачастую обгоняя конкурентов из противоположного лагеря практически на его поле (обработка геометрии). Похвальное достижение!

Feature Test 6: Perlin Noise

Последний feature тест пакета Vantage является математически-интенсивным тестом GPU, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто используемый в процедурном текстурировании, он использует очень много математических расчётов.

Данный тест из пакета 3DMark Vantage измеряет пиковую математическую производительность видеочипов в предельных задачах. Показанная в нём скорость решений примерно соответствует тому, что должно получаться по теории и получилось в наших математических тестах из пакета RightMark 2.0. И всё так же видеокарты AMD значительно производительнее соответствующих решений Nvidia в очередном математическом тесте.

Снова интенсивные математические расчёты выполняются на Radeon быстрее, чем на Geforce. И в этом математическом тесте Radeon HD 6670, основанный на чипе Turks, показывает скорость выше, чем свой основной конкурент по цене. С HD 6570 всё ещё лучше — он почти вдвое быстрее конкурирующей с ним Geforce GT 440. А вот HD 6450 слаб по вполне понятным причинам — уровень его явно ниже, чем даже у GT 430.

Выводы по синтетическим тестам

По результатам проведённых синтетических тестов новых бюджетных моделей Radeon и Geforce, основанных на сравнительно новых графических процессорах, можно сделать вывод о том, что рассмотренные модели компаний AMD и Nvidia имеют неплохую производительность, соответствующую своей ценовой категории и превышающую скорость решений предыдущих линеек. Реальные розничные цены на все модели более-менее оправданы и успех их на рынке low-end будет зависеть уже от розницы. И ещё от того, насколько они быстрее новейших интегрированных видеоядер той же AMD. Но этот вопрос мы затронем в отдельном исследовании.

Отметим, что во многих синтетических тестах новые платы Radeon HD 6670 и HD 6570 показали себя с лучшей стороны, на уровне или лучше конкурентов производства Nvidia. Отдельно выделим высокую пропускную способность видеопамяти, по сравнению с соперничающими видеоплатами, а также такие параметры, как математическая и текстурная производительность, которые у данных моделей на очень хорошем уровне. Впрочем, против GTS 450, даже придушенной медленной DDR3-памятью старшему решению конкурента будет бороться непросто. А младший Radeon HD 6450 абсолютно точно не может тягаться с Geforce GT 430, хотя он и стоит дешевле, что необходимо учесть.

Результаты бюджетных Geforce и Radeon в синтетических тестах должны подтвердиться в следующей части нашего материала, посвящённой тестированию в игровых приложениях. Мы уже отмечали, что в играх скорость рендеринга часто зависит от математической производительности и текстурирования и частично от филлрейта, поэтому решения AMD на чипе Turks должны быть весьма сильными. А вот с Radeon HD 6450 всё несколько сложнее, ведь GT 430 ему не совсем прямой конкурент; эта модель Nvidia имеет GPU большей сложности и более высокую цену. Итак, давайте посмотрим, что получится в игровом сравнении бюджетных плат, так как и у AMD, и у Nvidia есть свои сильные и слабые стороны.



Бюджетные ускорители — 2011. Часть 3: игровые тесты (производительность) →



Блок питания для тестового стенда предоставлен компанией Tagan

Корпус ThermalTake 8430 для тестового стенда предоставлен компанией 3Logic

Монитор Dell 3007WFP для тестовых стендов предоставлен компанией Nvidia




Дополнительно

Бюджетные ускорители — 2011: Radeon HD 6450/6570/6670, Geforce GT 520/430/440/450. Часть 2: особенности видеокарт, конфигурация стенда и список тестовых инструментов, производительность в синтетических тестах

Бюджетные ускорители — 2011

AMD (reference) Radeon HD 6450 512 МБ 64-битной GDDR5 PCI-E
Sapphire Radeon HD 6570 1024 МБ 128-битной GDDR3 PCI-E
Sapphire Radeon HD 6670 1024 МБ 128-битной GDDR5 PCI-E
Sapphire Radeon HD 6670 Ultimate 1024 МБ 128-битной GDDR5 PCI-E
AFox Geforce GT 520 1024 МБ 64-битной GDDR3 PCI-E
Nvidia Geforce GT 430 1024 МБ 128-битной SDDR3 PCI-E
MSI Geforce GT 440 1024 МБ 128-битной GDDR3 PCI-E
Gainward Geforce GTS 450 1024 МБ 128-битной GDDR3 PCI-E



Содержание

В этой части, как обычно, мы изучим сами видеокарты, а также познакомимся с результатами синтетических тестов. Видеокарту на базе Geforce GT 430 представлять не будем, поскольку в нашем проекте участвует продукт Inno3D, а по нему уже был отдельный материал с детальным описанием видеокарты.

Платы

AMD (reference) Radeon HD 6450 512 МБ 64-битной GDDR5 PCI-E
  • GPU: Radeon HD 6450 (Caicos)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs): 750 МГц (номинал — 750 МГц)
  • Частоты работы памяти (физическая (эффективная)): 900 (3600) МГц (номинал — 900 (3600) МГц)
  • Ширина шины обмена с памятью: 64 бит
  • Число вычислительных блоков в GPU/частота работы блоков: 24/750 МГц (номинал — 24/750 МГц)
  • Число операций (ALU) в блоке: 5
  • Суммарное число операций (ALU): 120
  • Число блоков текстурирования: 8 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 4
  • Размеры: 190×60×16 мм (последняя величина — максимальная толщина видеокарты)
  • Цвет текстолита: черный
  • RAMDACs/TMDS: интегрированы в GPU
  • Выходные гнезда: 1×DVI (Dual-Link/HDMI), 1×DisplayPort, 1×VGA
  • Поддержка многопроцессорной работы: CrossFire (Software)
Sapphire Radeon HD 6570 1024 МБ 128-битной GDDR3 PCI-E
  • GPU: Radeon HD 6570 (Turks)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs): 650 МГц (номинал — 650 МГц)
  • Частоты работы памяти (физическая (эффективная)): 1000 (2000) МГц (номинал — 1000 (2000) МГц)
  • Ширина шины обмена с памятью: 128 бит
  • Число вычислительных блоков в GPU/частота работы блоков: 96/650 МГц (номинал — 96/650 МГц)
  • Число операций (ALU) в блоке: 5
  • Суммарное число операций (ALU): 480
  • Число блоков текстурирования: 24 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 8
  • Размеры: 190×100×33 мм (последняя величина — максимальная толщина видеокарты)
  • Цвет текстолита: синий
  • RAMDACs/TMDS: интегрированы в GPU
  • Выходные гнезда: 1×DVI (Dual-Link/HDMI), 1×HDMI, 1×VGA
  • Поддержка многопроцессорной работы: CrossFire (Software)
Sapphire Radeon HD 6670 1024 МБ 128-битной GDDR5 PCI-E
  • GPU: Radeon HD 6670 (Turks)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs): 800 МГц (номинал — 800 МГц)
  • Частоты работы памяти (физическая (эффективная)): 1000 (4000) МГц (номинал — 1000 (4000) МГц)
  • Ширина шины обмена с памятью: 128 бит
  • Число вычислительных блоков в GPU/частота работы блоков: 96/650 МГц (номинал — 96/650 МГц)
  • Число операций (ALU) в блоке: 5
  • Суммарное число операций (ALU): 480
  • Число блоков текстурирования: 24 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 8
  • Размеры: 190×100×33 мм (последняя величина — максимальная толщина видеокарты)
  • Цвет текстолита: синий
  • RAMDACs/TMDS: интегрированы в GPU
  • Выходные гнезда: 1×DVI (Dual-Link/HDMI), 1×HDMI, 1×DisplayPort
  • Поддержка многопроцессорной работы: CrossFire (Software)
Sapphire Radeon HD 6670 Ultimate 1024 МБ 128-битной GDDR5 PCI-E
  • GPU: Radeon HD 6670 (Turks)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs): 800 МГц (номинал — 800 МГц)
  • Частоты работы памяти (физическая (эффективная)): 1000 (4000) МГц (номинал — 1000 (4000) МГц)
  • Ширина шины обмена с памятью: 128 бит
  • Число вычислительных блоков в GPU/частота работы блоков: 96/650 МГц (номинал — 96/650 МГц)
  • Число операций (ALU) в блоке: 5
  • Суммарное число операций (ALU): 480
  • Число блоков текстурирования: 24 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 8
  • Размеры: 190×120×39 мм (последняя величина — максимальная толщина видеокарты)
  • Цвет текстолита: синий
  • RAMDACs/TMDS: интегрированы в GPU
  • Выходные гнезда: 1×DVI (Dual-Link/HDMI), 1×HDMI, 1×Display Port
  • Поддержка многопроцессорной работы: CrossFire (Software)
AFox Geforce GT 520 1024 МБ 64-битной GDDR3 PCI-E
  • GPU: Geforce GT 520 (GF118)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs): 810 МГц (номинал — 810 МГц)
  • Частота работы памяти (физическая (эффективная)): 533 (1066) МГц (номинал — 900 (1800) МГц)
  • Ширина шины обмена с памятью: 64 бит
  • Число вычислительных блоков в GPU/частота работы блоков: 48/1620 МГц (номинал — 48/1620 МГц)
  • Число операций (ALU) в блоке: 1
  • Суммарное число операций (ALU): 48
  • Число блоков текстурирования: 8 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 4
  • Размеры: 180×55×16 мм (последняя величина — максимальная толщина видеокарты)
  • Цвет текстолита: черный
  • RAMDACs/TMDS: интегрированы в GPU
  • Выходные гнезда: 1×DVI (Dual-Link/HDMI), 1×VGA, 1×HDMI
  • Поддержка многопроцессорной работы: SLI (Software)
MSI Geforce GT 440 1024 МБ 128-битной GDDR3 PCI-E
  • GPU: Geforce GT 440 (GF108)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs): 810 МГц (номинал — 810 МГц)
  • Частота работы памяти (физическая (эффективная)): 900 (1800) МГц (номинал — 900 (1800) МГц)
  • Ширина шины обмена с памятью: 128 бит
  • Число вычислительных блоков в GPU/частота работы блоков: 96/1620 МГц (номинал — 96/1620 МГц)
  • Число операций (ALU) в блоке: 1
  • Суммарное число операций (ALU): 96
  • Число блоков текстурирования: 16 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 4
  • Размеры: 190×70×18 мм (последняя величина — максимальная толщина видеокарты)
  • Цвет текстолита: черный
  • RAMDACs/TMDS: интегрированы в GPU
  • Выходные гнезда: 1×DVI (Dual-Link/HDMI), 1×VGA, 1×HDMI
  • Поддержка многопроцессорной работы: SLI (Software)
Gainward Geforce GTS 450 1024 МБ 128-битной GDDR3 PCI-E
  • GPU: Geforce GTS 450 (GF106)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs): 783 МГц (номинал — 783 МГц)
  • Частоты работы памяти (физическая (эффективная)): 700 (1400) МГц (номинал — 800 (1600) МГц)
  • Ширина шины обмена с памятью: 128 бит
  • Число вычислительных блоков в GPU/частота работы блоков: 192/1566 МГц (номинал — 192/1566 МГц)
  • Число операций (ALU) в блоке: 1
  • Суммарное число операций (ALU): 192
  • Число блоков текстурирования: 32 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 16
  • Размеры: 190×100×33 мм (последняя величина — максимальная толщина видеокарты)
  • Цвет текстолита: красный
  • RAMDACs/TMDS: интегрированы в GPU
  • Выходные гнезда: 1×DVI (Dual-Link/HDMI), 1×HDMI, 1×VGA
  • Поддержка многопроцессорной работы: SLI (Hardware)

AMD (reference) Radeon HD 6450 512 МБ 64-битной GDDR5 PCI-E
Карта имеет 512 МБ памяти GDDR5 SDRAM, размещенной в 4 микросхемах на лицевой сторонe PCB.

Микросхемы памяти Samsung (GDDR5). Микросхемы расчитаны на максимальную частоту работы в 1000 (4000) МГц.
Sapphire Radeon HD 6570 1024 МБ 128-битной GDDR3 PCI-E
Карта имеет 1024 МБ памяти GDDR3 SDRAM, размещенной в 4 микросхемах на лицевой сторонe PCB.

Микросхемы памяти Elpida (GDDR3). Микросхемы рассчитаны на максимальную частоту работы в 1250 (2500) МГц.
Sapphire Radeon HD 6670 1024 МБ 128-битной GDDR5 PCI-E
Карта имеет 1024 МБ памяти GDDR3 SDRAM, размещенной в 4 микросхемах на лицевой сторонe PCB.

Микросхемы памяти Hynix (GDDR5). Микросхемы рассчитаны на максимальную частоту работы в 1250 (5000) МГц.
Sapphire Radeon HD 6670 Ultimate 1024 МБ 128-битной GDDR5 PCI-E
Карта имеет 1024 МБ памяти GDDR3 SDRAM, размещенной в 4 микросхемах на лицевой сторонe PCB.

Микросхемы памяти Hynix (GDDR5). Микросхемы рассчитаны на максимальную частоту работы в 1250 (5000) МГц.
AFox Geforce GT 520 1024 МБ 64-битной GDDR3 PCI-E
Карта имеет 1024 МБ памяти GDDR3 SDRAM, размещенной в 4 микросхемах на лицевой сторонe PCB.

Микросхемы памяти Hynix (GDDR5). Микросхемы рассчитаны на максимальную частоту работы в 1250 (5000) МГц.
MSI Geforce GT 440 1024 МБ 128-битной GDDR3 PCI-E
Карта имеет 1024 МБ памяти GDDR3 SDRAM, размещенной в 8 микросхемах на лицевой сторонe PCB.

Микросхемы памяти Hynix (GDDR3). Микросхемы рассчитаны на максимальную частоту работы в 900 (1800) МГц.
Gainward Geforce GTS 450 1024 МБ 128-битной GDDR3 PCI-E
Карта имеет 1024 МБ памяти GDDR3 SDRAM, размещенной в 8 микросхемах на лицевой сторонe PCB.

Микросхемы памяти Hynix (GDDR3). Микросхемы рассчитаны на максимальную частоту работы в 900 (1800) МГц.

AMD (reference) Radeon HD 6450 512 МБ 64-битной GDDR5 PCI-E
Вид спереди Вид сзади
Sapphire Radeon HD 6570 1024 МБ 128-битной GDDR3 PCI-E
Вид спереди Вид сзади
Sapphire Radeon HD 6670 1024 МБ 128-битной GDDR5 PCI-E
Вид спереди Вид сзади
Sapphire Radeon HD 6670 Ultimate 1024 МБ 128-битной GDDR5 PCI-E
Вид спереди Вид сзади
AFox Geforce GT 520 1024 МБ 64-битной GDDR3 PCI-E
Вид спереди Вид сзади
MSI Geforce GT 440 1024 МБ 128-битной GDDR3 PCI-E
Вид спереди Вид сзади
Gainward Geforce GTS 450 1024 МБ 128-битной GDDR3 PCI-E
Вид спереди Вид сзади

У тех карт, у которых нет VGA-гнезд, подключение к аналоговым мониторам производится через специальные адаптеры-переходники DVI-to-d-Sub. Что касается вывода через HDMI, то многие продукты обладают такой возможностью, а у одной карты есть и порт DisplayPort.

Максимальные разрешения и частоты:

  • 240 Гц — максимальная частота обновления
  • 2048×1536@85 Гц — по аналоговому интерфейсу
  • 2560×1600@60 Гц — по цифровому интерфейсу (для DVI-гнезд с Dual-Link/HDMI)

По поводу HDTV. Одно из исследований также проведено, и с ним можно ознакомиться здесь.

Напомню, что только карта на основе GTS 450 требует дополнительного питания одним 6-контактным разъемом, остальные не требуют.

О системах охлаждения.

AMD (reference) Radeon HD 6450 512 МБ 64-битной GDDR5 PCI-E
Очень простая конструкция, состоящая из закрытого плоского радиатора, на одном конце которого установлен вентилятор.

Ядро не требует сильного охлаждения, поэтому вентилятор не шумит, поскольку его обороты невелики.
Sapphire Radeon HD 6570 1024 МБ 128-битной GDDR3 PCI-E
На ядре установлен большой пластинчатый радиатор, прикрытый сверху кожухом с большим вентилятором, частота вращения которого также невелика, поэтому СО практически бесшумная.
Sapphire Radeon HD 6670 1024 МБ 128-битной GDDR5 PCI-E
Полностью аналогичная СО, которая замечательно справляется и с более высокими (по сравнению с HD 6570) частотами HD 6670, при этом частота вращения вентилятора по-прежнему невелика, делая СО бесшумной.
Sapphire Radeon HD 6670 Ultimate 1024 МБ 128-битной GDDR5 PCI-E
А в данном случае суффикс Ultimate у видеокарты предусматривает наличие нестандартной СО. И действительно, мы видим массивный радиатор, которому по силам справиться с охлаждением такой карты без вентилятора.
AFox Geforce GT 520 1024 МБ 64-битной GDDR3 PCI-E
Такая же простая СО, как и у Radeon HD 6450.
MSI Geforce GT 440 1024 МБ 128-битной GDDR3 PCI-E
Любопытно, что компания MSI даже на такую маленькую плату установила как бы «игрушечную» копию своего знаменитого кулера TwinFrozzr. Даже форма кожуха напоминает о том — настоящем и большом кулере.

Нужно ли здесь два вентилятора, а не один? Сложный вопрос. Однако частота вращения невелика, так что СО практически не шумит. При этом размеры СО заставляют карту занимать 2 слота.
Gainward Geforce GTS 450 1024 МБ 128-битной GDDR3 PCI-E
СО по всем параметрам очень похожа на ту, что мы изучили выше у карт Sapphire — другая лишь форма кожуха. А все остальное то же самое: и низкая частота вращения, и бесшумность.

И точно так же СО занимает 2 слота в системном блоке.

Мы провели исследование температурного режима с помощью утилиты MSI Afterburner (автор А. Николайчук AKA Unwinder) и получили следующие результаты:

AMD (reference) Radeon HD 6450 512 МБ 64-битной GDDR5 PCI-E
Sapphire Radeon HD 6570 1024 МБ 128-битной GDDR3 PCI-E
Sapphire Radeon HD 6670 1024 МБ 128-битной GDDR5 PCI-E
Sapphire Radeon HD 6670 Ultimate 1024 МБ 128-битной GDDR5 PCI-E
AFox Geforce GT 520 1024 МБ 64-битной GDDR3 PCI-E
Nvidia Geforce GT 430 (Inno3D) 1024 МБ 128-битной SDDR3 PCI-E
MSI Geforce GT 440 1024 МБ 128-битной GDDR3 PCI-E
Gainward Geforce GTS 450 1024 МБ 128-битной GDDR3 PCI-E

Никаких сюрпризов тут нет, все СО отработали эффективно. Разве что у Sapphire Radeon HD 6670 Ultimate температура нагрева ядра достигла 80 градусов, что приемлемо для топовых карт, но наверное, не очень хорошо для лоу-энда. Впрочем, не забываем, что СО у этой карты без вентилятора, а потому совершенно бесшумная.

Теперь о комплектации.

Базовый комплект поставки должен включать в себя: руководство пользователя, диск с драйверами и утилитами.

AMD (reference) Radeon HD 6450 512 МБ 64-битной GDDR5 PCI-E
Карта прибыла к нам в ОЕМ-виде, поэтому комплекта нет.
Sapphire Radeon HD 6570 1024 МБ 128-битной GDDR3 PCI-E
Базовый комплект.
Sapphire Radeon HD 6670 1024 МБ 128-битной GDDR5 PCI-E
Базовый комплект плюс адаптер DVI-to-VGA, поскольку у этой карты нет VGA-гнезда.
Sapphire Radeon HD 6670 Ultimate 1024 МБ 128-битной GDDR5 PCI-E
Аналогичный комплект плюс кабель HDMI для подключения к монитору, а также бонус в виде купона на игру Dirt3.
AFox Geforce GT 520 1024 МБ 64-битной GDDR3 PCI-E
Базовый комплект плюс набор выводных планок для крепления карты в низкопрофильных корпусах.
MSI Geforce GT 440 1024 МБ 128-битной GDDR3 PCI-E
Карта прибыла к нам в ОЕМ-виде, поэтому комплекта нет.
Gainward Geforce GTS 450 1024 МБ 128-битной GDDR3 PCI-E
Карта прибыла к нам в ОЕМ-виде, поэтому комплекта нет.

На очереди рассмотрение упаковок.

AMD (reference) Radeon HD 6450 512 МБ 64-битной GDDR5 PCI-E
Карта прибыла к нам в ОЕМ-виде, поэтому упаковки нет.
Sapphire Radeon HD 6570 1024 МБ 128-битной GDDR3 PCI-E
Небольшой бокс из папье-маше, куда вмещается ровно видеокарта и маленький комплект. Все размещено компактно. А бокс помещен в глянцевую суперобложку стандартного для Sapphire дизайна.

Все надписи четкие и детальные.
Sapphire Radeon HD 6670 1024 МБ 128-битной GDDR5 PCI-E
Полностью аналогичная упаковка.
Sapphire Radeon HD 6670 Ultimate 1024 МБ 128-битной GDDR5 PCI-E
А в данном случае ради серии Ultimate упаковка приобрела черты аналогов для видеокарт более дорогого сегмента, когда и суперобложка особого дизайна, и размеры в целом больше, и коробка уже имеет отсеки для размещения комплекта.

Но также все надписи четкие и детальные.
AFox Geforce GT 520 1024 МБ 64-битной GDDR3 PCI-E
Небольшой бокс из твердого картона, выполненный в фирменном стиле компании. Все основные надписи сделаны крупно и хорошо читаются.

Видеокарта внутри находится в мягком пакете, поэтому «мотание» в коробке исключено.
MSI Geforce GT 440 1024 МБ 128-битной GDDR3 PCI-E
Карта прибыла к нам в ОЕМ-виде, поэтому упаковки нет.
Gainward Geforce GTS 450 1024 МБ 128-битной GDDR3 PCI-E
Карта прибыла к нам в ОЕМ-виде, поэтому упаковки нет.

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютер на базе Intel Core i7-975 (Socket 1366)
    • процессор Intel Core i7-975 (3340 МГц);
    • системная плата Asus P6T Deluxe на чипсете Intel X58;
    • оперативная память 6 ГБ DDR3 SDRAM Corsair 1600 МГц;
    • жесткий диск WD Caviar SE WD1600JD 160 ГБ SATA;
    • блок питания Tagan TG900-BZ 900 Вт.
  • операционная система Windows 7 64-битная с SP1; DirectX 11;
  • монитор Dell 3007WFP (30″);
  • драйверы ATI версии Catalyst 11.8; Nvidia версии ForceWare 280.26.

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать:

  • D3D RightMark Beta 4 (1050) с описанием — на сайте 3d.rightmark.org
  • D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 (тесты пиксельных шейдеров версий 2.0 и 3.0) — по ссылке
  • RightMark3D 2.0 с кратким описанием — под Vista без SP1, под Vista c SP1

Для работы RightMark3D 2.0 также требуется установленный пакет MS Visual Studio 2005 runtime и последнее обновление DirectX runtime.

Синтетические тесты выполнялись на следующих видеокартах:

  • Radeon HD 6670 со стандартными параметрами (далее HD 6670)
  • Radeon HD 6570 со стандартными параметрами (далее HD 6570)
  • Radeon HD 6450 со стандартными параметрами (далее HD 6450)
  • Geforce GTS 450 DDR3, модель с памятью DDR3 (далее GTS 450 DDR3)
  • Geforce GT 440 DDR3, модель с памятью DDR3 (далее GT 440 DDR3)
  • Geforce GT 430 со стандартными параметрами (далее GT 430)

Для анализа результатов бюджетных линеек Radeon HD 6600/6500/6400 и разнокалиберных Geforce нам не пришлось долго думать над выбором видеокарт. Мы просто взяли по три решения каждого производителя, наиболее близкие по цене и производительности, хотя и не идентичные по всем этим показателям. Geforce GTS 450 с DDR3-памятью является ближайшим решением к Radeon HD 6670; GT 440 с DDR3 — схожая по стоимости и теоретическим характеристикам с HD 6570 видеокарта Nvidia; ну а GT 430 ближе всего к самой дешёвой плате обзора — Radeon HD 6450.

Direct3D 9: тесты Pixel Filling

В тесте определяется пиковая производительность выборки текстур (texel rate) в режиме FFP для разного числа текстур, накладываемых на один пиксель:

В тесте текстурной производительности все видеокарты традиционно показывают меньшие цифры, чем теоретически возможные значения, и мы проверим их ещё раз в аналогичном тесте из пакета 3DMark Vantage. Результаты нашей же синтетики для новых видеокарт Radeon не дотягивают до пиковых значений по несколько процентов, но гораздо ближе к ним, чем показатели топовых решений.

По сравнению с конкурирующими видеоплатами Nvidia скорость текстурирования новых Radeon оказалась весьма неплохой, если не считать самого слабого HD 6450, который и по теории должен быть слабее всех. Результаты Radeon HD 6670 превышают показатели Geforce GTS 450, а HD 6570 серьёзно опередила GT 440, что даже лучше, чем должно быть по теоретическим показателям производительности блоков TMU. Рассмотрим тест филлрейта:

Второй синтетический тест показывает скорость заполнения, и в нём мы видим всё то же самое, но уже с учётом количества записанных в буфер кадра пикселей. На диаграмме отлично видно явное ограничение скорости рендеринга у всех решений AMD и Nvidia в условиях до трёх текстур включительно.

Максимальный результат и тут остаётся за старшим решением бюджетной линейки Radeon HD 6670, но и HD 6570, основанный на том же GPU, оказывается близко к GTS 450 с DDR3-памятью, которая явно «душит» производительность этой модели от Nvidia. Явным аутсайдером ожидаемо выглядит очень простой чип, ставший основой для Radeon HD 6450, но он и стоит дешевле остальных плат.

Direct3D 9: тесты Pixel Shaders

Первая группа пиксельных шейдеров, которую мы рассматриваем, очень проста для современных видеочипов, она включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся в старых играх.

Тесты пиксельных шейдеров младших версий весьма и весьма просты для современных GPU, даже таких бюджетных. И производительность в данных тестах ограничена по большей части скоростью текстурных модулей, с учётом эффективности этих блоков и кэширования текстур. В предыдущих исследованиях мы отмечали также и некоторое влияние ПСП видеопамяти.

Диаграммой подтверждается слабость HD 6450, зато даже HD 6570 показал результат на уровне GTS 450 DDR3. А лучшим решением сравнения стала старшая бюджетная модель — HD 6670, опередившая всех с запасом. Что лишь подтверждает упор скорости рендеринга в производительность текстурирования и филлрейт.

В общем, если брать сравнение с видеокартами Nvidia, то только HD 6450 выглядит слабо по понятным причинам. В этих, сравнительно лёгких тестах, важнее всего реальная скорость текстурирования, и по этому параметру и HD 6450 и видеокарты Nvidia проигрывают остальным представленным моделям Radeon. Посмотрим на результаты более сложных пиксельных программ промежуточных версий:

В сильно зависящем от скорости текстурирования тесте процедурной визуализации воды «Water» используется зависимая выборка из текстур больших уровней вложенности, и поэтому видеокарты в нём также располагаются по скорости текстурирования, но с влиянием эффективности кэширования данных. В этом тесте выигрывает уже старшее решение Nvidia, имеющее лучшие показатели скорости текстурирования. Хотя Radeon HD 6670 отстаёт не слишком сильно, да и HD 6570 всё так же быстрее GT 440. Лишь HD 6450 традиционно серьёзно уступает и самой медленной из видеокарт Nvidia. В целом, представленные видеокарты AMD выступили неплохо.

А вот результаты второго подтеста уже иные. Тест более интенсивен вычислительно, и в нём сказывается в том числе и влияние математической производительности. Поэтому тест несколько лучше подходит для видеокарт AMD, обладающих большим количеством блоков ALU, в дополнение к неплохой текстурной производительности. И тут HD 6670 уже вырывается вперёд, а HD 6570 совсем недалеко от лучшего из решений конкурента. Естественно и то, что слабый HD 6450 всё так же отстаёт от всех — такая уж сегодня роль у него.

Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье Современная терминология 3D графики.
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

Существует два варианта этих шейдеров: с ориентацией на математические вычисления, и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это — универсальные тесты, зависящие и от скорости блоков ALU и от скорости текстурирования, в них важен общий баланс чипа. Соотношение производительности видеокарт в тесте «Frozen Glass» в целом весьма схоже с тем, что мы видели выше в «Cook-Torrance», но модель Radeon HD 6570 выступила даже ещё лучше, показав результат на уровне лучшей из Nvidia — модели GTS 450 с DDR3-памятью. Так получилось потому, что в этом тесте прослеживается ещё и влияние пропускной способности видеопамяти. Логично, что HD 6450 снова отстала от остальных участников, ну а HD 6670 показала лучший результат. Так что в среднем все решения компании AMD выступили очень хорошо.

Результаты второго теста «Parallax Mapping» мало чем отличаются, разве что решения Nvidia уступили ещё больше, так как им явно не хватает математической производительности для этой задачи. В этот раз оба новых решения на основе чипа Turks оказались значительно лучше GTS 450, а HD 6450 уже не так далёк от более дорогих конкурентов. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:

Относительное положение на диаграмме изменилось мало, разве что GTS 450, «придушенная» DDR3-памятью, стала чуть повыше, обогнав хотя бы HD 6570 в одном из тестов и приблизившись к ней во втором. Видно, что текстурирование у старого чипа Nvidia явно в числе сильных сторон. Но это не сильно помогло во втором тесте. Слабейший Radeon HD 6450 привычно плетётся позади, а лидирует модель HD 6670.

Но всё это были устаревшие задачи, в основном с упором в текстурирование или филлрейт. А сейчас мы рассмотрим результаты ещё двух тестов пиксельных шейдеров — версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9 API, которые намного показательнее с точки зрения современных игр на ПК. Эти тесты отличаются тем, что сильнее нагружают и ALU, и текстурные модули, обе шейдерные программы сложные и длинные, включают большое количество ветвлений.

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье Современная терминология 3D-графики.
  • Fur — процедурный шейдер, визуализирующий мех.

Мы не раз отмечали, что эти два теста пиксельных шейдеров версии 3.0 из всего подраздела наиболее адекватно показывают примерную расстановку графических решений по скорости рендеринга в современных играх. С этими тестами у решений Nvidia дела обычно обстоят гораздо лучше, чем с предыдущими примерами. Оба представленных теста довольно сложны, результаты в нём мало зависят от ПСП и текстурирования, они ограничены производительностью математических блоков, но с учётом большого количества переходов и ветвлений.

И вот тут видно, что в обоих тестах представленная в сравнении модель Radeon HD 6670 показывает результат уже хуже, чем Nvidia GTS 450 DDR3, причём в случае теста Fur отставание большое. Radeon HD 6450 здесь ловить вообще нечего, хотя она и не предназначена для конкуренции с остальными платами. Что касается среднего Radeon HD 6570, то он опережает своего прямого соперника во втором тесте (Steep Parallax Mapping), а в первом тесте (Fur) это решение уступает даже GT 430. Сегодняшний тест лишь подтвердил найденную закономерность — в этом разделе традиционно выигрывают видеоплаты производства компании Nvidia.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два знакомых PS 3.0 теста под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами, при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40-80, включение «шейдерного» суперсэмплинга — до 60-120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Как показали прошлые исследования, производительность в этом тесте зависит не только от количества и эффективности блоков TMU, но и от филлрейта. К сожалению, все решения Nvidia в Direct3D 10 тестах процедурной визуализации меха с большим количеством текстурных выборок на сегодняшний момент явно сдали позиции и показывают слишком низкие результаты. А ведь когда-то решения Nvidia были весьма сильны в этих тестах. Результаты в режиме «High» получаются примерно в полтора раза ниже, чем в «Low», как и должно быть по теории.

Верхняя модель из представленных видеокарт AMD показала быстрейший результат, и лишь немного отстаёт от неё конкурирующая GTS 450. HD 6570 свою борьбу у GT 440 выигрывает с хорошим запасом, и даже HD 6450 уже на одном уровне с GT 430! В целом, видеокарты AMD в этом тесте оказались способны успешно конкурировать со своими противниками. Похоже, что на скорости рендеринга решений Nvidia дополнительно сказывается и низкая пропускная способность.

Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза, возможно в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять иначе:

Включение суперсэмплинга увеличивает теоретическую нагрузку вчетверо, и в таком случае решения Nvidia уступают ещё больше, сдавая свои позиции. Low-end видеокарты AMD выглядят теперь ещё сильнее, Radeon серии HD 6600 уже в обоих подтестах опережает GTS 450. HD 6570 оторвался от GT 440 сильнее, а вот HD 6450 так и не смог достичь скорости слабейшей карты Nvidia. Результаты теста явно указывают на то, что производительность в тесте ограничивается не только производительностью ROP, но и пропускной способностью видеопамяти.

Второй тест, измеряющий производительность выполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок, называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением, число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше, по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Этот тест интереснее с практической точки зрения, так как разновидности parallax mapping давно применяются в играх, а тяжелые варианты, вроде нашего steep parallax mapping используются во многих проектах, например, в играх серий Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить и самозатенение, увеличивающее нагрузку на видеочип примерно в два раза — такой режим называется «High».

Диаграмма в целом очень похожа на предыдущую (без сглаживания методом суперсэмплинга) и результаты близки и по абсолютным цифрам. В обновленном варианте данного теста без включения суперсэмплинга, модель Radeon HD 6670 справляется с задачей явно лучше платы Geforce GTS 450 с DDR3-памятью. HD 6570 не оставляет шансов GT 440, а вот слабейший из рассматриваемых сегодня вариант не смог догнать GT 430. Посмотрим, что изменит включение суперсэмплинга.

При включении SSAA и самозатенения задача стала заметно более тяжёлой, совместное включение сразу этих двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая большое падение производительности до двухзначных цифр FPS. Разница между показателями видеокарт изменилась, включение суперсэмплинга сказывается как и в предыдущем случае — карты производства компании AMD снова улучшили свои показатели относительно решений Nvidia (кроме откровенно слабой Radeon HD 6450).

В этой ситуации даже Radeon HD 6570 уже конкурирует не с GF 440, а с GTS 450! Не говоря уже о HD 6670, которая явно лидирует в данном тесте, легко справляясь со всеми соперниками. Хорошо видно, что при росте нагрузки и усложнении условий, влияние ПСП на результаты теста уже гораздо меньше. И карты ограничиваются уже возможностями математических вычислений, которые у AMD явно лучше. Кроме одного из сегодняшних героев — Radeon HD 6450. Будучи основан на самом простом GPU, он абсолютно справедливо отстаёт от остальных решений, имеющих более сложные графические процессоры.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

В каждом материале мы пишем о том, что видеокарты AMD в синтетических, вычислительно сложных задачах традиционно показывают значительно более высокие результаты, по сравнению с решениями Nvidia. Это не изменится до выхода следующего поколения GPU, как минимум. Современная архитектура AMD имеет огромное преимущество перед конкурирующими видеокартами Nvidia в пиковой производительности, даже несмотря на меньший КПД. Вот и в этот раз разница между видеокартами Nvidia и AMD осталась просто гигантской.

В первом из чисто математических тестов мы видим то, что каждая из видеокарт Radeon быстрее не только конкурирующей по цене Geforce, но и успешно соперничает с моделью на ступеньку выше. То есть, Radeon HD 6670 просто стала недосягаема для GTS 450, зато с последней конкурирует HD 6570, да как! И даже HD 6450 в этот раз оказалась на одном уровне с GT 430, хотя имеет худшие теоретические показатели производительности ALU.

Но всё же, можно отметить, что решения расположились примерно соответственно теоретическим показателям. Хотя конкретно этот тест всё же не полностью зависит от скорости ALU, иногда скорость GPU ограничивается ещё и скоростью видеопамяти. Поэтому рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он ещё тяжелее для ALU, и текстурная выборка в нём только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Но нет, изменений в расстановке видеоплат на диаграмме практически нет. Значит, и в первом и во втором математическом подтесте скорость рендеринга была ограничена почти исключительно производительностью шейдерных блоков. Разница между различными решениями осталась примерно той же и близкой к теоретическим показателям.

Radeon HD 6670 снова стала явным лидером сравнения, средняя модель HD 6570 опередила более дорогую и сложную Geforce GTS 450 DDR3, ну а HD 6450 немного не дотянулась до GT 430. В общем, тесты производительности блоков математических вычислений снова показали ожидаемый нами результат — у решений компании AMD на данный момент есть явное архитектурное преимущество в большем количестве блоков ALU.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующих частицу. Аналогичные алгоритмы должны получить широкое использование в будущих DirectX 10 играх.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений — производительность соответствует количеству точек и с каждым шагом падение FPS составляет около двух раз. Задача для современных видеокарт не очень сложная, и производительность в целом ограничена не только скоростью геометрической обработки, но ещё и пропускной способностью памяти.

Radeon HD 6670 показал результат несколько худший, чем получился у Geforce GTS 450, которая лидирует в сравнении. Ещё немного отстал средний HD 6570, но он уверенно опережает своего прямого конкурента — модель GT 440. Интересно, что даже слабейшая HD 6450 по сравнению с конкурентами не так уж и отстала, показав результат, близкий к уровню более дорогой GT 430, особенно в более сложных условиях. Посмотрим, что изменится при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте, цифры для решений Nvidia вообще не изменились, а вот младшие видеокарты AMD Radeon слегка подтянули свои результаты. Платы с графическими процессорами компании Nvidia в этом тесте вовсе не замечают изменения параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, и показывают аналогичные предыдущей диаграмме результаты, а вот младшие решения AMD на чипах Turks и Caicos слегка ускоряются.

В результате, Radeon HD 6670 во всех условиях максимально близок к Geforce GTS 450 с DDR3-памятью, HD 6570 показывает скорость где-то между GTS 450 и GT 440, а младший HD 6450 почти достал GT 430. Что ж, перейдём к следующему тесту, который предполагает большую нагрузку на геометрические блоки и должен быть несколько интереснее для нас.

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленном в «Heavy» — ещё и для их отрисовки. То есть, в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер. Сначала рассматриваем лёгкий режим:

Относительные результаты в разных режимах снова соответствуют нагрузке: во всех случаях производительность неплохо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть почти в два раза медленней.

В этом тесте при сбалансированной нагрузке скорость рендеринга для всех решений менее явно ограничена геометрической производительностью — возможен больший упор в пропускную способность видеопамяти. Верхняя среди рассматриваемых модель Radeon HD 6670 в этот раз показывает результат чуть хуже, чем в предыдущем тесте — между видеокартами GTS 450 DDR3 и GT 430. Средняя HD 6570 весьма близка к GT 430, а не к прямой сопернице GT 440, а младшая HD 6450 с треском проиграла всем остальным.

Но эти цифры должны измениться на следующей диаграмме, в тесте с более активным использованием геометрических шейдеров. Также интересно будет сравнить друг с другом результаты, полученные в «Balanced» и «Heavy» режимах.

Ситуация меняется кардинально. Если у младших чипов Nvidia практически нет преимуществ по скорости исполнения геометрических шейдеров, так как они имеют лишь один-два растеризатора, то оптимизированная обработка геометрии в новых чипах AMD позволила видеокартам Radeon оказаться в этих условиях гораздо быстрее. Хотя и Geforce GTS 450 DDR3 ускорилась заметно.

В результате, модель Radeon HD 6570 смогла достать прямого конкурента в лице Geforce GT 440. А вот две другие карты своим соперникам проиграли, старшая HD 6670 не так много уступила GTS 450, а вот младшая HD 6450 традиционно показала почти вдвое худший результат. И всё же, в этом ценовом диапазоне особых преимуществ в скорости растеризации и обработки геометрии у младших чипов Nvidia не видно. После соответствующих оптимизаций геометрического конвейера у чипов AMD, начиная с Barts, конкурирующие решения Nvidia и AMD в тестах с обработкой большого количества геометрии стали сравнимыми по скорости.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи по сути и соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Наши предыдущие исследования показали, что на результаты этого теста влияет и скорость текстурирования и пропускная способность памяти. Разница между решениями Nvidia почему-то получилась совсем небольшой, да и в целом результаты ими показаны странные. Они почти не ускоряются в простых режимах по причине некоего ограничения, которое мы отмечаем уже пару лет. При этом у AMD таких проблем нет, и свежая модель Radeon HD 6670 показывает в условиях простой геометрии результат выше, чем Geforce GTS 450, проигрывает при большом количестве полигонов, и держится на одном уровне с конкурентом при средних настройках.

Что касается двух других моделей, то Radeon HD 6450 привычно в отстающих, а вот HD 6570 соперничает с GT 440 с переменным успехом, проигрывая в сложном режиме и опережая карту Nvidia в лёгком. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Взаимное расположение карт на диаграмме изменилось мало, упор видеокарт Nvidia во что-то неведомое остался. В среднем и лёгком режиме разницы в скорости для них теперь вовсе считай, что и нет. Остальное остаётся примерно так же, все новые платы AMD сильнее в лёгком режиме, в среднем результаты конкурентов близки, а вот в режиме сложной геометрии доминируют уже Geforce. Впрочем, Radeon HD 6570 и HD 6670 даже в этом случае неплохо справляются с задачей, чего нельзя сказать об постоянно отстающем HD 6450.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

В этом тесте результаты у всех участников сравнения получились совершенно иными, и не похожими на те, что мы видели на предыдущих диаграммах. В этот раз при разном количестве геометрии в тесте «Waves» мы видим явное преимущество решений AMD, и платы на основе их видеочипов показывают просто отличные результаты.

Старшая модель Radeon HD 6670 в 1.5 раза опережает конкурента Geforce GTS 450 с DDR3-памятью, HD 6570 делает то же самое с GT 440. А вот с HD 6450 снова незадача — он сильно медленнее в этом тесте, а все Geforce близки друг к другу, поэтому решение AMD сильно проигрывает. Рассмотрим второй вариант этого же теста:

С ростом сложности условий теста произошло немного изменений, и ничего нового и интересного мы тут не видим. Кроме того, что решения Nvidia немного сдали. Относительные результаты Radeon HD 6670 во втором тесте вершинных выборок при высокой детализации остались на очень хорошем уровне, и в самых сложных условиях эта плата обходит своего конкурента Geforce GTS 450. HD 6570 в полтора раза быстрее GT 440, ну а HD 6450 в этот раз почти догнала GT 430!

В общем, по этому тесту создаётся такое впечатление, что производительность в нём почти не зависит только от скорости текстурирования, а больше всего на неё влияет производительность блоков установки треугольников вместе с кэшированием геометрических данных, которое было серьёзно улучшено во всех графических процессорах компании AMD, начиная с Barts.

3DMark Vantage: Feature тесты

Синтетические тесты из пакета 3DMark Vantage хоть уже и не новы, но они обладают поддержкой D3D10 и интересны тем, что отличаются от наших. При анализе результатов low-end решений компании AMD в этом пакете мы сможем сделать какие-то полезные выводы, ускользнувшие от нас в тестах семейства RightMark.

Feature Test 1: Texture Fill

Первый тест — тест скорости текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

В тесте текстурной производительности из пакета 3DMark Vantage результаты всегда получаются не такими, как в RightMark. Причём, эти цифры гораздо ближе к теории, да и к тому, что обычно получается в играх. В текстурной синтетике данного пакета видеокарты Nvidia уже несколько эффективнее используют имеющиеся в их составе текстурные блоки, и Radeon HD 6670 тут показывает результат хуже, чем Geforce GTS 450.

Что касается остальных видеокарт AMD из нижнего ценового диапазона, которые мы сегодня рассматриваем, то HD 6570 с запасом опережает GT 440 по текстурированию, а вот младшая HD 6450 уступает наиболее медленной плате Nvidia в нашем сравнении (впрочем, они имеют разные цены). Налицо большая разница по скорости блоков TMU между GPU стоимостью хотя бы $100, и более дешёвыми вариантами.

Feature Test 2: Color Fill

Это — простой тест скорости заполнения. Используется несложный пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Цифры не похожи на наши потому, что у нас используется целочисленный буфер с 8-бит на компоненту, а в тесте Vantage — 16-битный формат с плавающей точкой. Показатели производительности в этом тесте часто соответствуют теоретическим цифрам филлрейта (производительности блоков ROP с учётом частоты работы GPU), но в нашем сегодняшнем сравнении они полностью ограничены пропускной способностью видеопамяти.

Поэтому и результаты такие. Например, GTS 450 явно ограничена именно ПСП, потому что теоретически блоки ROP у неё гораздо быстрее, чем у видеокарт AMD. А вот Radeon HD 6670 и HD 6570 с GDDR5 памятью не ограничены ПСП и более чем вдвое быстрее всех плат Nvidia в этом тесте. Да что там, даже HD 6450 быстрее всех видеокарт Nvidia! Так получилось именно из-за пропускной способности памяти. Так что для рассматриваемых сегодня плат компании AMD всё более чем хорошо.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature тестов, так как подобная техника уже используется в играх. В нём рисуется один четырехугольник (точнее, два треугольника), с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоёмкие операции по трассировке лучей и карта глубины большого разрешения.

Отрисовываемая поверхность затеняется при помощи тяжёлого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчёты освещения по Strauss.

Этот тест отличается от соседних тем, что результаты GPU в нём зависят не исключительно от скорости математических вычислений или эффективности исполнения ветвлений или скорости текстурных выборок, а от всего сразу. А для достижения высокой скорости важен грамотный баланс блоков GPU и ПСП видеопамяти. Заметно влияет на скорость и эффективность выполнения ветвлений в шейдерах.

В этом тесте традиционно несколько лучше выступают все решения компании AMD, и результаты двух плат из сегодняшней троицы не стали исключением. Сильнейшая из видеокарт AMD стала победителем, и даже Radeon HD 6570 идёт наравне с Geforce GTS 450 DDR3. Конечно, самая слабая HD 6450 уступает всем, но отрыв от GT 430 не такой уж и большой, а стоит изделие с чипом калифорнийской компании больше. Очень хороший результат для Turks.

Feature Test 4: GPU Cloth

Тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

На скорость рендеринга в этом тесте также влияет сразу несколько различных параметров, но всё же, больше всего скорость зависит от производительности обработки геометрии и эффективности исполнения геометрических шейдеров. Мы ранее отмечали, что в тестах физических симуляций графические процессоры производства Nvidia явно сильнее, но это касалось лишь решений высокого уровня, имеющих большое количество блоков обработки геометрии. Даже в диапазоне цен $150-200 преимущества у них уже нет, не говоря про менее дорогие чипы, которые мы сегодня рассматриваем.

Так и есть — в этом тесте явно быстрее всех работает Radeon HD 6670, а HD 6570 отстаёт соответственно частотам GPU. Обе они опережают все карты Nvidia, и даже HD 6450 лишь немного не догнала Geforce GTS 450 с DDR3-памятью. То есть, снова мы видим разгромный для Nvidia результат. Похоже, что в этом снова виновата в том числе и излишне урезанная пропускная способность памяти. А платы AMD получают оценку «отлично», постепенно избавляясь от своих слабых сторон.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующих частицу. Но тест больше всего загружает шейдерные блоки вершинными расчётами, также тестируется stream out.

Раньше в этом тесте результаты были схожи с теми, что мы видели на прошлой диаграмме, но в этот раз нехватка ПСП явно сказывается гораздо меньше. Поэтому платы Nvidia сильно подтянулись вверх, и пары HD 6670 c GTS 450 и HD 6570 с GT 440 близки друг к другу по скорости (с небольшим преимуществом решений AMD). Слабейшая HD 6450 снова сильно отстала от всех — уж явно более слаб этот чип, по мощности он близок скорее к интегрированной графике.

В остальном, по двум синтетическим тестам имитации тканей и частиц из рассматриваемого тестового пакета, в которых используются геометрические шейдеры, делаем вывод о том, что представленные в материале решения серии Radeon HD 6000 неплохо справляются с работой, зачастую обгоняя конкурентов из противоположного лагеря практически на его поле (обработка геометрии). Похвальное достижение!

Feature Test 6: Perlin Noise

Последний feature тест пакета Vantage является математически-интенсивным тестом GPU, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто используемый в процедурном текстурировании, он использует очень много математических расчётов.

Данный тест из пакета 3DMark Vantage измеряет пиковую математическую производительность видеочипов в предельных задачах. Показанная в нём скорость решений примерно соответствует тому, что должно получаться по теории и получилось в наших математических тестах из пакета RightMark 2.0. И всё так же видеокарты AMD значительно производительнее соответствующих решений Nvidia в очередном математическом тесте.

Снова интенсивные математические расчёты выполняются на Radeon быстрее, чем на Geforce. И в этом математическом тесте Radeon HD 6670, основанный на чипе Turks, показывает скорость выше, чем свой основной конкурент по цене. С HD 6570 всё ещё лучше — он почти вдвое быстрее конкурирующей с ним Geforce GT 440. А вот HD 6450 слаб по вполне понятным причинам — уровень его явно ниже, чем даже у GT 430.

Выводы по синтетическим тестам

По результатам проведённых синтетических тестов новых бюджетных моделей Radeon и Geforce, основанных на сравнительно новых графических процессорах, можно сделать вывод о том, что рассмотренные модели компаний AMD и Nvidia имеют неплохую производительность, соответствующую своей ценовой категории и превышающую скорость решений предыдущих линеек. Реальные розничные цены на все модели более-менее оправданы и успех их на рынке low-end будет зависеть уже от розницы. И ещё от того, насколько они быстрее новейших интегрированных видеоядер той же AMD. Но этот вопрос мы затронем в отдельном исследовании.

Отметим, что во многих синтетических тестах новые платы Radeon HD 6670 и HD 6570 показали себя с лучшей стороны, на уровне или лучше конкурентов производства Nvidia. Отдельно выделим высокую пропускную способность видеопамяти, по сравнению с соперничающими видеоплатами, а также такие параметры, как математическая и текстурная производительность, которые у данных моделей на очень хорошем уровне. Впрочем, против GTS 450, даже придушенной медленной DDR3-памятью старшему решению конкурента будет бороться непросто. А младший Radeon HD 6450 абсолютно точно не может тягаться с Geforce GT 430, хотя он и стоит дешевле, что необходимо учесть.

Результаты бюджетных Geforce и Radeon в синтетических тестах должны подтвердиться в следующей части нашего материала, посвящённой тестированию в игровых приложениях. Мы уже отмечали, что в играх скорость рендеринга часто зависит от математической производительности и текстурирования и частично от филлрейта, поэтому решения AMD на чипе Turks должны быть весьма сильными. А вот с Radeon HD 6450 всё несколько сложнее, ведь GT 430 ему не совсем прямой конкурент; эта модель Nvidia имеет GPU большей сложности и более высокую цену. Итак, давайте посмотрим, что получится в игровом сравнении бюджетных плат, так как и у AMD, и у Nvidia есть свои сильные и слабые стороны.



Бюджетные ускорители — 2011. Часть 3: игровые тесты (производительность) →



Блок питания для тестового стенда предоставлен компанией Tagan

Корпус ThermalTake 8430 для тестового стенда предоставлен компанией 3Logic

Монитор Dell 3007WFP для тестовых стендов предоставлен компанией Nvidia