RADEON HD 3870 X2 2x512MB PCI-E

выпуска HIS, MSI, Powerolor (TUL) и GeCube



СОДЕРЖАНИЕ

  1. Часть 1 — Теория и архитектура
  2. Часть 2 — Практическое знакомство
  3. Особенности видеокарт
  4. Конфигурация стенда, список тестовых инструментов
  5. Результаты синтетических тестов
  6. Результаты игровых тестов (производительность)


ATI RADEON 3870 X2: Часть 1: Теоретические сведения


В предверии подготовки выпуска данного материала в нашей лаборатории побывало четыре ускорителя 3870 X2 от вышеназванных компаний — партнеров AMD. Трое из них — это копии эталонной карты, ничем особо от референс не отличающиеся (разве лишь частоты работы у карты от MSI выше), то бишь HIS, MSI и TUL не имеют отношения к производству этих карт, они закупили сразу же готовые продукты у AMD. Затем в MSI отбирали карты, гарантированно поддерживающие разгон по ядру до 860 МГц, м получился продукт с суффиксом ОС.

И лишь GeCube представила на суд публики свой продукт, видеокарту своего дизайна. Причем полностью. От PCB, до кулера. А подробности все будут ниже.

Платы



HIS RADEON HD 3870 X2 2x512MB PCI-E
  • GPU: 2 × RADEON HD 3870 (RV670) = R680
  • Интерфейс: PCI-Express x16
  • Частоты работы GPU (ROPs/Shaders): 825/825 MHz (номинал — 825/825 МГц)
  • Частоты работы памяти (физическая (эффективная)): 900 (1800) MHz (номинал — 900 (1800) МГц)
  • Ширина шины обмена с памятью: 2 × 256bit
  • Число вершинных процессоров: -
  • Число пиксельных процессоров: -
  • Число универсальных процессоров: 2 × 320
  • Число текстурных процессоров: 2 × 16 (BLF/TLF)
  • Число ROPs: 2 × 16
  • Размеры: 270x100x32 мм (последняя величина — максимальная толщина видеокарты).
  • Цвет текстолита: красный
  • RAMDACs/TMDS: интегрированы в GPU.
  • Выходные гнезда: 2xDVI (Dual-Link/HDMI), TV-выход.
  • VIVO: нет
  • TV-out: интегрирован в GPU.
  • Поддержка многопроцессорной работы:внутри 3870 X2 — аппаратный CrossFire, а также возможен внешний CrossFire (Hardware).
Powercolor RADEON HD 3870 X2 2x512MB PCI-E
  • GPU: 2 × RADEON HD 3870 (RV670) = R680
  • Интерфейс: PCI-Express x16
  • Частоты работы GPU (ROPs/Shaders): 825/825 MHz (номинал — 825/825 МГц)
  • Частоты работы памяти (физическая (эффективная)): 900 (1800) MHz (номинал — 900 (1800) МГц)
  • Ширина шины обмена с памятью: 2 × 256bit
  • Число вершинных процессоров: -
  • Число пиксельных процессоров: -
  • Число универсальных процессоров: 2 × 320
  • Число текстурных процессоров: 2 × 16 (BLF/TLF)
  • Число ROPs: 2 × 16
  • Размеры: 270x100x32 мм (последняя величина — максимальная толщина видеокарты).
  • Цвет текстолита: красный
  • RAMDACs/TMDS: интегрированы в GPU.
  • Выходные гнезда: 2xDVI (Dual-Link/HDMI), TV-выход.
  • VIVO: нет
  • TV-out: интегрирован в GPU.
  • Поддержка многопроцессорной работы:внутри 3870 X2 — аппаратный CrossFire, а также возможен внешний CrossFire (Hardware).
MSI R3870X2-T2D1Q-OC (RADEON HD 3870 X2) 2x512MB PCI-E
  • GPU: 2 × RADEON HD 3870 (RV670) = R680
  • Интерфейс: PCI-Express x16
  • Частоты работы GPU (ROPs/Shaders): 857/857 MHz (номинал — 825/825 МГц)
  • Частоты работы памяти (физическая (эффективная)): 900 (1800) MHz (номинал — 900 (1800) МГц)
  • Ширина шины обмена с памятью: 2 × 256bit
  • Число вершинных процессоров: -
  • Число пиксельных процессоров: -
  • Число универсальных процессоров: 2 × 320
  • Число текстурных процессоров: 2 × 16 (BLF/TLF)
  • Число ROPs: 2 × 16
  • Размеры: 270x100x32 мм (последняя величина — максимальная толщина видеокарты).
  • Цвет текстолита: красный
  • RAMDACs/TMDS: интегрированы в GPU.
  • Выходные гнезда: 2xDVI (Dual-Link/HDMI), TV-выход.
  • VIVO: нет
  • TV-out: интегрирован в GPU.
  • Поддержка многопроцессорной работы:внутри 3870 X2 — аппаратный CrossFire, а также возможен внешний CrossFire (Hardware).
GeCube RADEON HD 3870 X2 X-Turbo Dual 2x512MB PCI-E
  • GPU: 2 × RADEON HD 3870 (RV670) = R680
  • Интерфейс: PCI-Express x16
  • Частоты работы GPU (ROPs/Shaders): 837/837 MHz (номинал — 825/825 МГц)
  • Частоты работы памяти (физическая (эффективная)): 972 (1944) MHz (номинал — 900 (1800) МГц)
  • Ширина шины обмена с памятью: 2 × 256bit
  • Число вершинных процессоров: -
  • Число пиксельных процессоров: -
  • Число универсальных процессоров: 2 × 320
  • Число текстурных процессоров: 2 × 16 (BLF/TLF)
  • Число ROPs: 2 × 16
  • Размеры: 250x100x32 мм (последняя величина — максимальная толщина видеокарты).
  • Цвет текстолита: красный
  • RAMDACs/TMDS: интегрированы в GPU.
  • Выходные гнезда: 2xDVI (Dual-Link/HDMI), TV-выход.
  • VIVO: нет
  • TV-out: интегрирован в GPU.
  • Поддержка многопроцессорной работы:внутри 3870 X2 — аппаратный CrossFire, а также возможен внешний CrossFire (Hardware).


HIS RADEON HD 3870 X2 2x512MB PCI-E
Powercolor RADEON HD 3870 X2 2x512MB PCI-E
MSI R3870X2-T2D1Q-OC (RADEON HD 3870 X2) 2x512MB PCI-E
GeCube RADEON HD 3870 X2 X-Turbo Dual 2x512MB PCI-E
Kаждая карта имеет 2x512=1024 МБ памяти GDDR3 SDRAM, размещенной в 16 микросхемах на лицевой и оборотной сторонах PCB.

Микросхемы памяти Samsung (GDDR3). Время выборки у микросхем памяти 1,0 ns, что соответствует частоте работы 1000 (2000) МГц.



Сравнение с эталонным дизайном, вид спереди
HIS RADEON HD 3870 X2 2x512MB PCI-E Reference card ATI RADEON HD 3870
GeCube RADEON HD 3870 X2 X-Turbo Dual 2x512MB PCI-E
MSI R3870X2-T2D1Q-OC (RADEON HD 3870 X2) 2x512MB PCI-E
Powercolor RADEON HD 3870 X2 2x512MB PCI-E


Сравнение с эталонным дизайном, вид сзади
HIS RADEON HD 3870 X2 2x512MB PCI-E Reference card ATI RADEON HD 3870
GeCube RADEON HD 3870 X2 X-Turbo Dual 2x512MB PCI-E
MSI R3870X2-T2D1Q-OC (RADEON HD 3870 X2) 2x512MB PCI-E
Powercolor RADEON HD 3870 X2 2x512MB PCI-E


Понятно, что аналогов таких карт нет, и потому сравнивать их по сути не с чем. Однако все же рискнем сравнить с однопроцессорным ускорителем на базе того же 3870. Видим, что разработчики вынуждены занять оборотную сторону карты микросхемами памяти (перенести половину с лицевой стороны на оборотную). Поэтому для хоть какого-то охлаждения микросхем памяти установили на них металлическую пластину на оборотной стороне. Хотя, например, GeCube обошелся и без оной, имея те же самые микросхемы памяти, да еще и работающие на более высокой частоте.

Вообще GeCube пошел по своему пути, разработав PCB собственной конструкции. У данного решения есть свои плюсы и минусы. Плюс в том, что длина карты меньще, чем референс, и потому появляется больше шансов найти под нее корпус подходящих размеров. Но тут же возникает минус в расположении гнезд для внешнего питания. Если у референс-карт они «смотрят» вниз (когда ускоритель установлен в компьютере), и поэтому к ним легко подключать хвосты питания, то у продукта от GeCube они «смотрят» назад. То есть подключение хвостов питания автоматически чуть-чуть увеличивает необходимую для установки в корпус длину карты.

Заметим еще одну интересную особенность карты от GeCube — наличие четырех выводов DVI, а не двух, как на референс. Более того, наличие нестандартного BIOS у карты заставляет драйвер не включать по умолчанию режим CrossFire (который у referenc не отключить), а давать управление пользователю, который при желании может его отключить, и получить просто две видеокарты с двумя DVI у каждой, как говорится, «в одном флаконе». И поэтому может подключать к 4-м мониторам, используя мультимониторные конфигурации. Эта гибкость работы карты заслуживает похвалы.

Что касается эталонных карт, то бишь от HIS, Powercolor и MSI, то длина PCB точно такая же, как у 8800 GTX (270 мм). Поэтому следует это учитывать при покупке карты.

У карт имеется гнездо TV-выхода, которое уникально по разъему, и для вывода изображения на ТВ как через S-Video, так и по RCA, требуются специальные адаптеры-переходники, поставляемые вместе с картой. Более подробно о ТВ-выходе можно почитать здесь.

Подключение к аналоговым мониторам с d-Sub (VGA) производится через специальные адаптеры-переходники DVI-to-d-Sub. Также поставляются переходники DVI-to-HDMI (мы помним, что данные ускорители поддерживают полноценную передачу видео и звука на HDMI-приемник), поэтому проблем с такими мониторами также не должно быть. Максимальные разрешения и частоты:

  • 240 Hz Max Refresh Rate
  • 2048 × 1536 × 32bit x85Hz Max — по аналоговому интерфейсу
  • 2560 × 1600 @ 60Hz Max — по цифровому интерфейсу (все DVI-гнезда с Dual-Link)

Что касается возможностей видеокарт по проигрыванию MPEG2 (DVD-Video), то еще в 2002 году мы изучали этот вопрос, с тех пор мало что поменялось. В зависимости от фильма загрузка CPU при проигрывании на современных видеокартах не поднимается выше 25%.

По поводу HDTV и прочих новомодных видеоштучек. Одно из исследований также проведено, и с ним можно ознакомиться здесь.

Напомним, что эта карты требуют дополнительное питание, поэтому с каждой картой поставляются переходники с молекс на 6-пиновый разъем, хотя уже все современные БП имеют такие «хвосты». Отмечу особо, что эталонные карты имеют ДВА гнезда для питания, причем, одно из них 8-пиновое. Это не должно смущать пользователя — привычного 6-пинового хвоста питания будет достаточно. Два дополнительных пина отвечают лишь за возможность разгона видеокарты через драйвер.

Теперь о системах охлаждения.

HIS RADEON HD 3870 X2 2x512MB PCI-E
Powercolor RADEON HD 3870 X2 2x512MB PCI-E
MSI R3870X2-T2D1Q-OC (RADEON HD 3870 X2) 2x512MB PCI-E
На примере видеокарты от HIS изучим эталонную систему охлаждения, потому что почти все ускорители этого класса будут оснащены именно таким кулером.

Перед нами уже знакомая всем конструкция цилиндрического типа: длинный радиатор, закрытый пластиковым кожухом, направляюшим поток воздуха. На одном конце — цилиндрический вентилятор, прогоняющая воздух через радиатор, на другом конце — раструб, через который тепло выходит за пределы системного блока.

Мы такие кулеры уже видели и на HD 2900 XT, и на HS 3870. Здесь изюминка в том, что устройство просто очень длинное, и внутри — не один радиатор, а два, по одному на каждое GPU.

Прошу обратить внимание на то, что пластина и радиатор, находящиеся ближе к турбине, алюминиевые, а другие — медные. Дело в том, что логика у производителей была такой: первый по ходу движения потока воздуха радиатор получает более холодный воздух, и там достаточно алюминиевого радиатора. А второй уже охлаждается нагретым после первого потоком. И там уже надо усиливать радиатор, установив медный. Что получилось — покажем ниже.

А в завершение рассмотрения скажу, что такие разные радиаторы установлены ТОЛЬКО в первых партиях таких кулеров. Продукты от MSI, Powercolor имеют уже ОБА медных радиатора, что привело к приросту массы всей карты в целом. Вероятно, что HIS получил карту от AMD одним из первых, и там кулер еше был с разными радиаторами.

Что касается шума, то цилиндрический вентилятор работает на невысоких оборотах, и потому шума практически нет. Только при старте компьютера на несколько секунд включается большая скорость на кулере.

GeCube RADEON HD 3870 X2 X-Turbo Dual 2x512MB PCI-E

Разработчики из GeCube пошли по иному пути. Раз плата собственной разработки, то и кулер будет свой. Или эе где-то его заказали.

Устройство полностью сделано из медных сплавов, поэтому весит весьма прилично. На медной подошве, которая прижимается как к ядрам, так и к микросхемам памяти (вызывает удивление факт, что на обороте карты микросхемы памяти оставлены без охлаждения вообще), установлены два чашеобразных радиатора, где сами чаши образованы из тепловых трубок, на которые часто нанизаны небольшие пластины охлаждения.

Внутри чаш имеются два вентилятора, работающих на невысоких оборотах, и потому кулер полностью бесшумный. Однако надо обращать внимание на хрупкость крепления самих вентиляторов к радиаторам, и лучше при монтаже карты за них не браться руками.

Понятно, что как и в предыдущем случае, эта система охлаждения весьма широкая, поэтому видеокарта в целом занимает два слота у материнской платы.



Мы провели исследование температурного режима с помощью утилиты RivaTuner (автор А.Николайчук AKA Unwinder) и получили следующие результаты:

HIS RADEON HD 3870 X2 2x512MB PCI-E
Powercolor RADEON HD 3870 X2 2x512MB PCI-E



MSI R3870X2-T2D1Q-OC (RADEON HD 3870 X2) 2x512MB PCI-E



GeCube RADEON HD 3870 X2 X-Turbo Dual 2x512MB PCI-E



Результаты показали, что установка радиаторов из алюминия и меди сыграла свою негативную роль в охлаждении, и получилось, что карта от HIS, работая на менее высоких частотах получила нагрев выше, чем у карты от MSI, когда как последняя имеет частоты, прилично выше эталонных, и при этом оснащена эталонным кулером, но полностью медным.

А эффективность охлаждения у GeCube выше всяких похвал! И не забываем, что кулер бесшумный.



А это процессор, который и обеспечивает аппаратную поддержку CrossFire в рамках одной карты. По сути своей это PCI-E-to-PCI-E мост. Согласно спецификациям, он поддерживает только PCI-E 1.1, а не 2.0, которым обладает каждый GPU. Поэтому между GPU обмен идет именно по шине версии 1.1.



Это, собственно, сам RV670 — RADEON HD 3870, каковых у каждой карты по 2 штуки.



А это так выглядит референс-карта Х2 внутри стендового компьютера.

Комплектация.

HIS RADEON HD 3870 X2 2x512MB PCI-E
В коробке можно увидеть руководство пользователя, диск с драйверами, адаптер компонентного вывода, DVI-to-VGA адаптер, DVI-to-HDMI адаптер, переходник для внешнего питания, мост для объединения видеокарт в CrossFire. И что самое любопытное, что HIS продолжает поставлять бонусы с видеокартами, как то универсальную отвертку со съемными насадками. В нее встроен также фонарик, узким пучком света освещающий место привинчивания или отвинчивания, а также уровнем.. Это приятный бонус для каждого, кто самостоятельно собирает системные блоки или меняет в них какие-либо комплектующие. Минусом является отсутствие переходника с 6 на 8 пин, ведь один из разъемов питания на карте 8-пиновый.
GeCube RADEON HD 3870 X2 X-Turbo Dual 2x512MB PCI-E
В комплект поставки входят: руководство пользователя, диск с драйверами, адаптер компонентного вывода, DVI-to-VGA адаптер, DVI-to-HDMI адаптер, переходник для внешнего питания, мост для объединения видеокарт в CrossFire. Скромный комплект. Не чета роскошному виду карты и упаковки.
Powercolor RADEON HD 3870 X2 2x512MB PCI-E
Руководство пользователя, диск с драйверами, адаптер компонентного вывода, DVI-to-VGA адаптер (2 шт.), DVI-to-HDMI адаптер, адаптер компонентного вывода, переходник для внешнего питания, мост для объединения видеокарт в CrossFire.
MSI R3870X2-T2D1Q-OC (RADEON HD 3870 X2) 2x512MB PCI-E
Аналогичный комплект, плюс(что ОЧЕНЬ ВАЖНО!) переходник питания 6-8 пин. Такии образом, ускоритель от MSI можно подключить так, что будут доступны опции разгона в драйверах AMD.


Упаковки.

HIS RADEON HD 3870 X2 2x512MB PCI-E

Вот тут хочется отругать компанию HIS, которая, имея прекрасный опыт выпуска отличных упаковок, в данном случае засунула огромную карту в тоненький бокс, который после закрывания выглядит даже выпуклым. Плюс бесформенное и безвкусное оформление. Такое ощущение, что не самая дорогая карта внутри, а какая-то дешевка, и то от китайского «нонейм».

Очень печально видеть это.

Внутри коробки все разложено в пластиковом отсеке.

GeCube RADEON HD 3870 X2 X-Turbo Dual 2x512MB PCI-E

Дизайнеры же GeCube, наоборот, очень классно постарались, и выдали отличную упаковку даже с окном, через которое видна сама карта, а ее стОит показывать, ибо выглядит шикарно.

Весь комплект разложен по картонным отсекам.

Powercolor RADEON HD 3870 X2 2x512MB PCI-E

Дизайнеры ведут прежнюю политику вертикальных коробок. А по сути это супер, внутри которого белая картонная коробка. А в ней в куче картонных прокладок и перемычек можно найти содержимое. Не совсем понятно, зачем тратить такую уйму картона, когда достаточно сделать форму из пластика, и в нее разложить весь комплект.

Сам дизайн упаковки весьма стильный и привлекательный.

MSI R3870X2-T2D1Q-OC (RADEON HD 3870 X2) 2x512MB PCI-E

А в данном случае мы видим пресловутую огромную коробку-сумку, которой славятся все дорогие карты от MSI. Правда внутри все полупустое, ибо комплект скромен (вспоминаются годы, когда в таких боксах мы находили и 11 дисков с ПО, и бонусы всякие).

Видеокарта в этой таре надежно лежит во внутренней коробочке из полипеноуретана.



Установка и драйверы

Конфигурация тестового стенда:

  • Компьютер на базе Intel Core2 (775 Socket)
    • процессор Intel Core2 Extreme QX9650 (3000 MHz);
    • системная плата Gigabyte GA-X38-DQ6 на чипсете Intel X38;
    • оперативная память 2 GB DDR2 SDRAM Corsair 1142MHz (CAS (tCL)=5; RAS to CAS delay (tRCD)=5; Row Precharge (tRP)=5; tRAS=15);
    • жесткий диск WD Caviar SE WD1600JD 160GB SATA.
    • блок питания Tagan 1100-U95 (1100W).
  • операционная система Windows XP SP2; DirectX 9.0c;
  • операционная система Windows Vista 32bit; DirectX 10.0;
  • монитор Dell 3007WFP (30").
  • драйверы ATI версии CATALYST 7.12/8.1; Nvidia версии 169.21/169,25.

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

  • D3D RightMark Beta 4 (1050) с описанием на сайте 3d.rightmark.org
  • D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 — тесты пиксельных шейдеров версий 2.0 и 3.0 ссылка.
  • RightMark3D 2.0 с кратким описанием: ссылка

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

Синтетические тесты проводились на следующих видеокартах:

  • RADEON HD 3870 X2 со стандартными параметрами (далее HD3870 X2)
  • RADEON HD 3870 со стандартными параметрами (далее HD3870)
  • Nvidia Geforce 8800 GTS 512MB со стандартными параметрами (далее GF8800GTS 512)

Для анализа результатов новой модели двухчиповой видеокарты AMD были выбраны именно эти решения по следующим причинам: RADEON HD 3870 — как полный одночиповый аналог, с отличиями только по рабочим частотам памяти и чипа, ну а с последней моделью Geforce 8800 GTS на основе чипа G92 мы сравниваем по двум причинам. Во-первых, эта видеокарта близка к HD 3870 X2 по цене, а во-вторых, она является одним из наиболее быстрых решений конкурента.

Нужно сказать, что исследование грозит быть весьма скучным. Ведь с архитектурной точки зрения вообще ничего не изменилось, GPU те же, просто их больше, а принцип работы CrossFire давно известен. Кроме того, с учетом включения алгоритма AFR у CrossFire предсказать результаты несложно, в большинстве случаев будет почти удвоение производительности (равно как и количества кадров), что далеко от реальной игровой ситуации, ведь синтетические тесты просты и в них нет, к примеру, тех же зависимостей построения следующего кадра при использовании результатов (render targets) предыдущего. Поэтому мы предполагаем удвоение количества кадров в секунду почти во всех случаях.

Direct3D 9: Тесты Pixel Filling

В тесте определяется пиковая производительность выборки текстур (texel rate) в режиме FFP для разного числа текстур, накладываемых на один пиксель:



У видеокарт AMD значения ближе к теоретическому максимуму, хотя и меньше, чем должны быть. Результаты синтетических тестов привычно уже не дотягивают до теоретических цифр даже в режимах с большим количеством текстур. Хотя у видеокарты Nvidia, отличающейся улучшенными TMU и высокой скоростью текстурирования, дела ещё хуже. Судя по цифрам наших старых тестов, чип выбирает в два раза меньше текселей за один такт, по сравнению со своими теоретическими показателями для 32-битных текстур с билинейной фильтрацией.

В случае с одной текстурой, производительность всех решений ограничена пропускной способностью памяти, а дополнительно — ещё и количеством блоков ROP. В случае с большим количеством текстур на пиксель, ситуация выправляется, Geforce 8800 GTS и HD 3870 X2 идут вместе, хотя двухчиповый монстр от AMD всё равно проигрывает одночиповому от Nvidia. Вот что значит не слишком большое количество блоков TMU, заложенное при проектировании архитектуры AMD R6xx… Двукратной разницы между HD 3870 X2 и HD 3870 нигде нет, несмотря на то, что при увеличении количества текстур она постоянно увеличивается. Смотрим тест филлрейта:



Второй синтетический тест измеряет скорость заполнения, тут мы видим ту же ситуацию с учетом количества записанных в буфер кадра пикселей. В случаях с 0 и 1 накладываемыми текстурами все решения демонстрируют схожие результаты, показывая свою реальную силу лишь в ситуациях с большим количеством текстур на пиксель. В целом, как и предполагалось, видеокарты на основе чипов RV670 проигрывают решениям на базе G92 по скорости текстурных выборок и филлрейту, когда скорость не ограничивается пропускной способностью памяти.

Direct3D 9: Тесты Geometry Processing Speed

Рассмотрим пару предельных геометрических тестов, и первым у нас будет самый простой вершинный шейдер, показывающий максимальную пропускную способность по треугольникам:



Все чипы основаны на унифицированных архитектурах, все их универсальные исполнительные блоки в этом тесте заняты геометрической работой и решения показывают высокие результаты, явно упирающиеся не в пиковую производительность унифицированных блоков, а в производительность других блоков, например, triangle setup.

Эффективность выполнения теста в разных режимах у чипов примерно одинаковая, пиковая производительность в FFP, VS 1.1 и VS 2.0 отличается не сильно, только у G92 режим FFP оказался несколько быстрее. По этим результатам ничего особенного сказать нельзя, кроме того, что по ним видно, что чипы AMD традиционно быстрее обрабатывают геометрию, по сравнению с чипами Nvidia. И явным лидером по геометрической производительности становится двухчиповое решение на основе пары RV670, показывать удвоенную частоту кадров в этом тесте ему ничто не мешает.

Мы убрали два промежуточных теста на скорость обработки геометрии с одним источником освещения, так как они не показывают ничего интересного. И переходим сразу к рассмотрению самой сложной геометрической задачи с тремя источниками света, включающей статические и динамические переходы:



Разница между AMD и Nvidia увеличилась, лидером по геометрической производительности остаётся HD 3870 X2, во всех режимах опережающий своего одночипового собрата в два раза. Видно, что даже в нашей самой сложной геометрической задаче возможности этих чипов не раскрываются, можно давать даже ещё большую нагрузку. А вот результаты единственной протестированной видеокарты Nvidia провалились ниже, и она значительно уступает даже обычному HD 3870. Интересно, что на трех смешанных источниках света наличие оптимизированной эмуляции FFP у G92 стало ещё заметнее.

Краткий итог по проведенным геометрическим тестам: чипы в HD 3870 X2 всё те же, используется режим CrossFire, увеличивающий частоту кадров ровно в два раза, поэтому и результаты получились ожидаемыми — в два раза превышающими показатели одиночного HD 3870. Хотя не забываем, что в реальных приложениях ситуация может быть совершенно другой…

Direct3D 9: Тесты Pixel Shaders

Первая группа пиксельных шейдеров, которую мы рассматриваем, является очень простой для современных видеочипов, она включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0.



Эти тесты слишком просты для современных архитектур и не показывают их истинную силу. Производительность в самых простых из них ограничена текстурными выборками и филлрейтом, что и видно на примере слабых результатов видеокарт AMD по сравнению с Geforce 8800 GTS. Опять сказывается сравнительно малое количеством TMU… Но в более сложных PS 2.0 тестах результаты становятся интереснее, например, в самом сложном Phong с тремя источниками света, Geforce 8800 GTS немного проигрывает даже обычному HD 3870.

Между производительностью HD 3870 X2 и HD 3870 сохраняется примерно двукратная разница, лишь только в тестах освещения получилось чуть меньше. Смотрим результаты более сложных пиксельных программ промежуточных версий:



В тесте процедурной визуализации воды «Water», сильно зависящем от скорости текстурирования, используется зависимая выборка из текстур с большим уровнем вложенности, поэтому оба решения компании AMD отстают от единственного представителя Nvidia. Geforce 8800 GTS значительно опережает даже двухчиповое решение в этом случае. Скорость HD 3870 X2 более чем в два раза выше производительности одиночного HD 3870.

Во втором тесте, интенсивном вычислительно, прежде всего, решения AMD уже впереди, Geforce 8800 GTS немного проигрывает обычному HD 3870, не говоря про двухчиповый X2, традиционно для наших тестов ровно в два раза опережающий HD 3870. В общем, вторая задача явно лучше подходит для архитектуры AMD с большим числом унифицированных вычислительных блоков.

Direct3D 9: Тесты пиксельных шейдеров New Pixel Shaders

Эти тесты пиксельных шейдеров DirectX 9 ещё сложнее, они делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье Современная терминология 3D графики
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами

Существует два варианта этих шейдеров: с ориентацией на математические вычисления, и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:



В тесте «Frozen Glass» явным лидером является решение Nvidia, Geforce 8800 GTS опережает даже новинку, в которой соединена мощь двух RV670, а одиночный HD 3870 отстаёт от него в 2,5 раза. Это говорит об ограничении производительности данного теста скоростью текстурных выборок, прежде всего.

Во втором тесте «Parallax Mapping» лидерство традиционно принадлежало решениям AMD, но выход решений на Nvidia G92 с улучшенными блоками TMU (для параллакс маппинга нужна дополнительная текстурная выборка) изменил ситуацию, и новый Geforce 8800 GTS опередил HD 3870. Зато сдвоенный RV670 в виде HD 3870 X2 показывает в два раза большее количество кадров в секунду в этом тесте, по сравнению с аналогичным одночиповым решением. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:



Ситуация изменилась, теперь производительность ещё больше упирается в скорость текстурных блоков, и поэтому Geforce 8800 GTS отрывается ещё сильнее, проигрывая двухчиповой видеокарте совсем немного во втором тесте. Между HD 3870 X2 и HD 3870 наблюдается всё та же самая двукратная разница…

Как и раньше, на всех видеокартах варианты шейдеров с большим количеством математических вычислений работают быстрее, и для современных архитектур GPU смысла в варианте с упором на текстурирование нет, все новые чипы AMD и Nvidia предпочитают математические вычисления текстурированию.

Рассмотрим результаты ещё двух тестов пиксельных шейдеров — версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9. Тесты отличаются тем, что сильно нагружают и ALU и текстурные модули, обе шейдерные программы сложные, длинные, включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье Современная терминология 3D графики
  • Fur — процедурный шейдер, визуализирующий мех



Нагрузка на видеокарты тут большая даже для самых мощных чипов. И хотя решения AMD обеспечивают эффективное исполнение сложных пиксельных шейдеров версии 3.0 с большим количеством ветвлений, одночиповый HD 3870 отстаёт от новой модели Geforce 8800 GTS 512MB почти в два раза, что можно объяснить ускоренными билинейными текстурными выборками у последнего. Понятно, что в реальных приложениях картина будет иной, там используется трилинейная и/или анизотропная фильтрация текстур, да и упор в филлрейт и ПСП бывает значительно чаще.

RADEON HD 3870 X2 продолжает опережать одночиповый вариант карты AMD в два раза, но это даёт ему лишь очень небольшое преимущество над Geforce 8800 GTS. Что же будет, когда Nvidia выпустит аналогичный вариант на основе пары G92? Гадать не нужно, при условии аналогичных режимов SLI и CrossFire, решение AMD вновь уступит.

Direct3D 10: Тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

В новую версию RightMark3D 2.0 вошли два знакомых PS 3.0 теста под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два полностью новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами, при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель!) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40-80, включение «шейдерного» суперсэмплинга — до 60-120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Все результаты в «High» примерно в полтора раза ниже, чем в «Low». Тесты процедурной визуализации меха с большим количеством текстурных выборок традиционно показывают очень большое преимущество решений Nvidia над AMD. С Geforce 8800 GTS ни одна из карт RADEON тягаться не может, даже два чипа не помогают. Такое отставание трудно объяснить даже теоретически, возможно, виноваты недоработки Direct3D 10 драйвера. Зато с CrossFire в Direct3D 10 всё в порядке, HD 3870 X2 ровно в два раза быстрее одночипового варианта.

Кстати, судя по предыдущим исследованиям, производительность в этом тесте зависит не только от количества и скорости блоков TMU, скорость рендеринга упирается в том числе и в филлрейт и ПСП. Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза, может быть, в такой ситуации что-то изменится:

Включение суперсэмплинга теоретически увеличивает нагрузку ровно в четыре раза, но на видеокартах Nvidia скорость снижается сильнее, чем на AMD, за счет чего отрыв сокращается. Но всё равно, тесты такой сложности под силу разве что Geforce 8800 GTS, остальные протестированные решения показывают слишком низкие результаты. В сравнении HD 3870 X2 и HD 3870 ничего не меняется, анонсированная сегодня видеокарта опережает предыдущее решение в два раза, благодаря режиму AFR у CrossFire.

Второй тест, измеряющий производительность выполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением, число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше, по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Этот тест интереснее с практической точки зрения, разновидности parallax mapping давно применяются в играх, а тяжелые варианты, вроде нашего steep parallax mapping используются в последних релизах, например, в Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип примерно в два раза, такой режим называется «High».

Хотя решения AMD ранее были традиционно сильны в Direct3D 9 тестах parallax mapping, в обновленном DX10 варианте без суперсэмплинга они не могут справиться с задачей на уровне Geforce 8800 GTS, даже HD 3870 X2 на основе двух GPU проигрывает решению Nvidia. К тому же, включение самозатенения вызывает на продукции AMD большее падение производительности (более двух раз), по сравнению с полуторакратной разницей для решений производства Nvidia.

Успокаивает только то, что X2 ровно в два раза быстрее обычного HD 3870, то есть, можно сказать, что CrossFire AFR работает в наших тестах отлично. Посмотрим, что изменит включение суперсэмплинга, ведь в прошлом тесте он вызывал большее падение скорости на картах Nvidia.

Это ещё одна тяжелая задача для видеочипов, совместное включение сразу двух опций: суперсэмплинга и самозатенения, увеличивает нагрузку на карты почти в восемь раз, вызывая большое падение производительности. Разница между производительностью разных видеокарт в целом сохраняется, включение суперсэмплинга сказывается так же, как и в предыдущем случае — карты AMD улучшают свои показатели относительно решения Nvidia. Несмотря на это, даже HD 3870 X2 продолжает отставать от Geforce 8800 GTS 512MB. Что касается сравнения HD 3870 X2 и HD 3870, ничего нового добавить нельзя — видим традиционное двукратное преимущество двухчипового варианта.

Direct3D 10: Тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

В наших Direct3D 9 синтетических тестах мы уже отмечали, что в вычислительно сложных задачах последняя архитектура AMD показывает себя зачастую лучше конкурирующей от Nvidia. Хотя в этом тесте RADEON HD 3870 всё же уступает лучшему решению на базе G92, его двухчиповый вариант ускоряет частоту кадров в два раза и значительно опережает одну из быстрейших карт Nvidia по показателю FPS.

Второй тест шейдерных вычислений носит название Fire, и он ещё более тяжёл для ALU. В нём текстурная выборка только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Если вы помните, во всех предыдущих статьях видеокарты AMD проваливали этот тест, показывая крайне низкие результаты, указывающие на явную ошибку в драйверах. Судя по результатам сегодняшнего исследования, ошибку наконец-то исправили (не прошло и года!) и теперь HD 3870 показывает результат на уровне 512 Мбайт модификации Geforce 8800 GTS. А RADEON HD 3870 X2 ещё ровно в два раза быстрее.

Direct3D 10: Тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующих частицу. Аналогичные алгоритмы должны получить широкое использование в будущих DirectX 10 играх.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен получилось примерно одинаковым, отличаются только абсолютные значения. Показываемая производительность соответствует количеству точек, с каждым шагом падение FPS составляет около двух раз. С Geforce 8800 GTS в этом тесте может конкурировать только двухчиповая видеокарта AMD, более чем в два раза опережающая одиночный вариант на базе RV670, который, в свою очередь, проигрывает решению Nvidia. Впрочем, эта задача для современных видеокарт несложная, как показали предыдущие исследования, ограничения скорости мощностью шейдерных ALU тут нет, задача ограничена скорее больше ПСП, чем мощностью чипов. Возможно, при переносе части вычислений в геометрический шейдер ситуация изменится.

В данном случае, никаких существенных изменений не произошло. Все видеокарты показывают почти те же результаты при изменении параметра GS load, отвечающем за перенос части вычислений в геометрический шейдер. Geforce 8800 GTS всё так же опережает HD 3870, а двухчиповый HD 3870 X2 быстрее одиночной модели более чем в два раза. Вероятно, сказывается разность в тактовых частотах и погрешность измерения. Посмотрим, что будет в следующем тесте…

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленном в «Heavy» — ещё и для их отрисовки. То есть, в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер. Сначала рассматриваем лёгкий режим:

Относительные результаты в разных режимах соответствуют нагрузке: во всех случаях производительность хорошо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть в два раза медленней. Производительность единственной видеокарты Nvidia в этом тесте опять значительно выше, по сравнению с обоими решениями AMD при любой геометрической сложности. Одночиповая видеокарта AMD отстаёт от Geforce 8800 GTS 512MB более чем в два раза, а двухчиповая даже не может приблизиться к ней.

Тест интересен ещё и тем, что стал первым в нашем исследовании, в котором рассматриваемый сегодня RADEON HD 3870 X2 менее чем в два раза опередил своего одночипового брата. Разница между их скоростью составила лишь около 1.5 раз. Вот вам и синтетический тест, в котором наиболее благоприятный для FPS режим CrossFire не даёт двукратного роста производительности. То ли ещё будет в игровых тестах…

Цифры могут измениться в следующем тесте, с более активным использованием геометрических шейдеров, также интересно сравнить друг с другом результаты, полученные в «Balanced» и «Heavy» режимах.

Соотношение скоростей изменилось очень сильно, видно, что чипы AMD выполняют более сложные геометрические шейдеры эффективнее чипа Nvidia. Хотя Geforce 8800 GTS 512MB показывает результат, примерно равный результату RADEON HD 3870, а ведь раньше отставание было значительно больше. Сдвоенный HD 3870 X2 быстрее одиночного хоть и не в два раза, но всё же значительно опережает обоих конкурентов.

Что касается сравнения результатов в разных режимах, нужно отметить, что обновленный вариант Geforce 8800 GTS в «Balanced» показывает лучшие показатели, чем RADEON HD 3870 X2 в «Heavy». И это при том, что получаемая в разных режимах картинка не отличается визуально. То есть, решениям AMD больше подходит второй режим (использование геометрического шейдера при выводе вместо «instancing»), Nvidia — первый, но при сравнении в лучших для обеих компаний режимах, Geforce 8800 GTS всё же немного опережает даже новую двухчиповую видеокарту AMD.

Direct3D 10: Скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи по сути и соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

И снова результаты в разных режимах показывают примерно одинаковую картину производительности видеокарт относительно друг друга. Судя по нашим предыдущим исследованиям, на результаты данного теста сильно влияет пропускная способность памяти, и чем проще режим, тем большее влияние на скорость она оказывает.

В сравнении Geforce 8800 GTS и RADEON HD 3870 побеждает решение Nvidia, но двухчиповый вариант той же карты ускоряется и выходит вперёд. Разница между видеоплатами AMD достигает двух раз, но только в тяжелых режимах. В самом легком режиме не хватает ПСП, да и в среднем разница меньше двух раз. Посмотрим на результаты этого же теста с увеличенным количеством текстурных выборок:

Ситуация изменилась не слишком сильно, всё так же впереди RADEON HD 3870 X2, опережающий HD 3870 до двух раз по мере усложнения задачи. Ну а производительность Nvidia Geforce 8800 GTS находится где-то посередине между ними.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

В «Waves» ситуация несколько отличается от предыдущих результатов. Обе модели семейства HD 3800 смотрятся неплохо, младшая показывает результат на уровне Geforce 8800 GTS, опережая его в лёгком режиме и отставая в тяжёлом, а двухчиповый герой HD 3870 X2 ещё в два раза быстрее и является лидером, благодаря работе двух чипов в CrossFire. Смотрим второй режим:

Почти без изменений, хотя с увеличением сложности теста результат одиночной HD 3870 становится уже явно лучше, чем у Geforce 8800 GTS, она выигрывает уже во всех режимах, а не только в лёгком. Остальные выводы остаются в силе — в легком режиме скорость немного ограничивается ПСП, а в тяжёлых большую роль играют блоки TMU и ROP. Видно, что драйверы AMD оптимизировали, ведь раньше мы отмечали, что решения Nvidia лучше справляются с тестами текстурных выборок из вершинных шейдеров по сравнению с картами AMD, а теперь ситуация намного лучше. Тем более, что двухчиповый X2 в очередной раз оказался более чем в два раза быстрее обычного варианта HD 3870.

Выводы по синтетическим тестам

Ничего особенно нового и интересного в выводах написать не получится. Ведь RADEON HD 3870 X2 основан на двух видеочипах, которые мы давно знаем. По сравнению с R600 они изменились мало, и все сильные и слабые места архитектуры остались прежними. Двухчиповое решение отличается высокой вычислительной производительностью, особенно в современных и будущих приложениях с большим количеством сложных шейдеров всех типов, ну а самым слабым местом нужно признать сравнительно малое количество текстурных блоков, которое не позволяет всем видеокартам на основе R6xx показывать большую производительность в тестах, сильно зависящих от скорости текстурирования.

Что касается увеличения производительности HD 3870 X2 относительно одночипового варианта, основанного на том же GPU, можно сказать одно — все результаты объясняются применяемым режимом CrossFire — Alternate Frame Rendering (AFR), при котором каждый видеочип занимается обработкой своего (четного или нечетного) кадра целиком. И так как зависимостей между кадрами в наших тестах нет, частота кадров увеличивается примерно в два раза, за исключением нескольких тестов, где решению не хватает пропускной способности памяти. Кроме того, очень важно помнить, что в реальных игровых условиях достичь двукратного прироста в скорости непросто даже в режиме AFR, который сам по себе имеет некоторые недостатки в виде больших задержек по сравнению с «честным» удвоением производительности. Иными словами, во многих случаях 60 FPS на системе CrossFire или SLI будут столь же комфортны при игре, как и 30 FPS на одночиповой карте.

В целом же, на основе анализа результатов синтетических тестов, нужно признать, что RADEON HD 3870 X2 получился довольно быстрым решением. В определенных условиях оно может составить конкуренцию даже более дорогим видеокартам и в большом количестве наших тестов опережает одночиповый Geforce 8800 GTS 512MB с примерно равной рекомендуемой ценой. Но не забывайте, что при выборе между одночиповой и двухчиповой видеоплатой, обязательно нужно учитывать все указанные выше недостатки CrossFire/SLI систем. И обязательно учитывать результаты, показанные в реальных игровых приложениях, а не в синтетических или полусинтетических тестах, вроде 3DMark.

Именно поэтому очень важно обратить внимание на следующую часть статьи, в которой вы увидите тесты новой двухчиповой видеокарты производства компании AMD в современных игровых приложениях. Эти результаты должны быть значительно интереснее синтетических из этой части, ведь в играх производительность удвоить не так просто, как в специализированных тестах.



ATI RADEON 3870 X2 — Часть 3: Игровые тесты (производительность)



Блок питания для тестового стенда предоставлен компанией TAGAN
Монитор Dell 3007WFP для тестовых стендов предоставлен компанией Nvidia




Дополнительно

Локомотив с двумя дизелями RADEON HD 3870 X2 2x512MB PCI-E выпуска HIS, MSI, Powerolor (TUL) и GeCube

RADEON HD 3870 X2 2x512MB PCI-E

выпуска HIS, MSI, Powerolor (TUL) и GeCube


СОДЕРЖАНИЕ

  1. Часть 1 — Теория и архитектура
  2. Часть 2 — Практическое знакомство
  3. Особенности видеокарт
  4. Конфигурация стенда, список тестовых инструментов
  5. Результаты синтетических тестов
  6. Результаты игровых тестов (производительность)


ATI RADEON 3870 X2: Часть 1: Теоретические сведения


В предверии подготовки выпуска данного материала в нашей лаборатории побывало четыре ускорителя 3870 X2 от вышеназванных компаний — партнеров AMD. Трое из них — это копии эталонной карты, ничем особо от референс не отличающиеся (разве лишь частоты работы у карты от MSI выше), то бишь HIS, MSI и TUL не имеют отношения к производству этих карт, они закупили сразу же готовые продукты у AMD. Затем в MSI отбирали карты, гарантированно поддерживающие разгон по ядру до 860 МГц, м получился продукт с суффиксом ОС.

И лишь GeCube представила на суд публики свой продукт, видеокарту своего дизайна. Причем полностью. От PCB, до кулера. А подробности все будут ниже.

Платы



HIS RADEON HD 3870 X2 2x512MB PCI-E
  • GPU: 2 × RADEON HD 3870 (RV670) = R680
  • Интерфейс: PCI-Express x16
  • Частоты работы GPU (ROPs/Shaders): 825/825 MHz (номинал — 825/825 МГц)
  • Частоты работы памяти (физическая (эффективная)): 900 (1800) MHz (номинал — 900 (1800) МГц)
  • Ширина шины обмена с памятью: 2 × 256bit
  • Число вершинных процессоров: -
  • Число пиксельных процессоров: -
  • Число универсальных процессоров: 2 × 320
  • Число текстурных процессоров: 2 × 16 (BLF/TLF)
  • Число ROPs: 2 × 16
  • Размеры: 270x100x32 мм (последняя величина — максимальная толщина видеокарты).
  • Цвет текстолита: красный
  • RAMDACs/TMDS: интегрированы в GPU.
  • Выходные гнезда: 2xDVI (Dual-Link/HDMI), TV-выход.
  • VIVO: нет
  • TV-out: интегрирован в GPU.
  • Поддержка многопроцессорной работы:внутри 3870 X2 — аппаратный CrossFire, а также возможен внешний CrossFire (Hardware).
Powercolor RADEON HD 3870 X2 2x512MB PCI-E
  • GPU: 2 × RADEON HD 3870 (RV670) = R680
  • Интерфейс: PCI-Express x16
  • Частоты работы GPU (ROPs/Shaders): 825/825 MHz (номинал — 825/825 МГц)
  • Частоты работы памяти (физическая (эффективная)): 900 (1800) MHz (номинал — 900 (1800) МГц)
  • Ширина шины обмена с памятью: 2 × 256bit
  • Число вершинных процессоров: -
  • Число пиксельных процессоров: -
  • Число универсальных процессоров: 2 × 320
  • Число текстурных процессоров: 2 × 16 (BLF/TLF)
  • Число ROPs: 2 × 16
  • Размеры: 270x100x32 мм (последняя величина — максимальная толщина видеокарты).
  • Цвет текстолита: красный
  • RAMDACs/TMDS: интегрированы в GPU.
  • Выходные гнезда: 2xDVI (Dual-Link/HDMI), TV-выход.
  • VIVO: нет
  • TV-out: интегрирован в GPU.
  • Поддержка многопроцессорной работы:внутри 3870 X2 — аппаратный CrossFire, а также возможен внешний CrossFire (Hardware).
MSI R3870X2-T2D1Q-OC (RADEON HD 3870 X2) 2x512MB PCI-E
  • GPU: 2 × RADEON HD 3870 (RV670) = R680
  • Интерфейс: PCI-Express x16
  • Частоты работы GPU (ROPs/Shaders): 857/857 MHz (номинал — 825/825 МГц)
  • Частоты работы памяти (физическая (эффективная)): 900 (1800) MHz (номинал — 900 (1800) МГц)
  • Ширина шины обмена с памятью: 2 × 256bit
  • Число вершинных процессоров: -
  • Число пиксельных процессоров: -
  • Число универсальных процессоров: 2 × 320
  • Число текстурных процессоров: 2 × 16 (BLF/TLF)
  • Число ROPs: 2 × 16
  • Размеры: 270x100x32 мм (последняя величина — максимальная толщина видеокарты).
  • Цвет текстолита: красный
  • RAMDACs/TMDS: интегрированы в GPU.
  • Выходные гнезда: 2xDVI (Dual-Link/HDMI), TV-выход.
  • VIVO: нет
  • TV-out: интегрирован в GPU.
  • Поддержка многопроцессорной работы:внутри 3870 X2 — аппаратный CrossFire, а также возможен внешний CrossFire (Hardware).
GeCube RADEON HD 3870 X2 X-Turbo Dual 2x512MB PCI-E
  • GPU: 2 × RADEON HD 3870 (RV670) = R680
  • Интерфейс: PCI-Express x16
  • Частоты работы GPU (ROPs/Shaders): 837/837 MHz (номинал — 825/825 МГц)
  • Частоты работы памяти (физическая (эффективная)): 972 (1944) MHz (номинал — 900 (1800) МГц)
  • Ширина шины обмена с памятью: 2 × 256bit
  • Число вершинных процессоров: -
  • Число пиксельных процессоров: -
  • Число универсальных процессоров: 2 × 320
  • Число текстурных процессоров: 2 × 16 (BLF/TLF)
  • Число ROPs: 2 × 16
  • Размеры: 250x100x32 мм (последняя величина — максимальная толщина видеокарты).
  • Цвет текстолита: красный
  • RAMDACs/TMDS: интегрированы в GPU.
  • Выходные гнезда: 2xDVI (Dual-Link/HDMI), TV-выход.
  • VIVO: нет
  • TV-out: интегрирован в GPU.
  • Поддержка многопроцессорной работы:внутри 3870 X2 — аппаратный CrossFire, а также возможен внешний CrossFire (Hardware).


HIS RADEON HD 3870 X2 2x512MB PCI-E
Powercolor RADEON HD 3870 X2 2x512MB PCI-E
MSI R3870X2-T2D1Q-OC (RADEON HD 3870 X2) 2x512MB PCI-E
GeCube RADEON HD 3870 X2 X-Turbo Dual 2x512MB PCI-E
Kаждая карта имеет 2x512=1024 МБ памяти GDDR3 SDRAM, размещенной в 16 микросхемах на лицевой и оборотной сторонах PCB.

Микросхемы памяти Samsung (GDDR3). Время выборки у микросхем памяти 1,0 ns, что соответствует частоте работы 1000 (2000) МГц.



Сравнение с эталонным дизайном, вид спереди
HIS RADEON HD 3870 X2 2x512MB PCI-E Reference card ATI RADEON HD 3870
GeCube RADEON HD 3870 X2 X-Turbo Dual 2x512MB PCI-E
MSI R3870X2-T2D1Q-OC (RADEON HD 3870 X2) 2x512MB PCI-E
Powercolor RADEON HD 3870 X2 2x512MB PCI-E


Сравнение с эталонным дизайном, вид сзади
HIS RADEON HD 3870 X2 2x512MB PCI-E Reference card ATI RADEON HD 3870
GeCube RADEON HD 3870 X2 X-Turbo Dual 2x512MB PCI-E
MSI R3870X2-T2D1Q-OC (RADEON HD 3870 X2) 2x512MB PCI-E
Powercolor RADEON HD 3870 X2 2x512MB PCI-E


Понятно, что аналогов таких карт нет, и потому сравнивать их по сути не с чем. Однако все же рискнем сравнить с однопроцессорным ускорителем на базе того же 3870. Видим, что разработчики вынуждены занять оборотную сторону карты микросхемами памяти (перенести половину с лицевой стороны на оборотную). Поэтому для хоть какого-то охлаждения микросхем памяти установили на них металлическую пластину на оборотной стороне. Хотя, например, GeCube обошелся и без оной, имея те же самые микросхемы памяти, да еще и работающие на более высокой частоте.

Вообще GeCube пошел по своему пути, разработав PCB собственной конструкции. У данного решения есть свои плюсы и минусы. Плюс в том, что длина карты меньще, чем референс, и потому появляется больше шансов найти под нее корпус подходящих размеров. Но тут же возникает минус в расположении гнезд для внешнего питания. Если у референс-карт они «смотрят» вниз (когда ускоритель установлен в компьютере), и поэтому к ним легко подключать хвосты питания, то у продукта от GeCube они «смотрят» назад. То есть подключение хвостов питания автоматически чуть-чуть увеличивает необходимую для установки в корпус длину карты.

Заметим еще одну интересную особенность карты от GeCube — наличие четырех выводов DVI, а не двух, как на референс. Более того, наличие нестандартного BIOS у карты заставляет драйвер не включать по умолчанию режим CrossFire (который у referenc не отключить), а давать управление пользователю, который при желании может его отключить, и получить просто две видеокарты с двумя DVI у каждой, как говорится, «в одном флаконе». И поэтому может подключать к 4-м мониторам, используя мультимониторные конфигурации. Эта гибкость работы карты заслуживает похвалы.

Что касается эталонных карт, то бишь от HIS, Powercolor и MSI, то длина PCB точно такая же, как у 8800 GTX (270 мм). Поэтому следует это учитывать при покупке карты.

У карт имеется гнездо TV-выхода, которое уникально по разъему, и для вывода изображения на ТВ как через S-Video, так и по RCA, требуются специальные адаптеры-переходники, поставляемые вместе с картой. Более подробно о ТВ-выходе можно почитать здесь.

Подключение к аналоговым мониторам с d-Sub (VGA) производится через специальные адаптеры-переходники DVI-to-d-Sub. Также поставляются переходники DVI-to-HDMI (мы помним, что данные ускорители поддерживают полноценную передачу видео и звука на HDMI-приемник), поэтому проблем с такими мониторами также не должно быть. Максимальные разрешения и частоты:

  • 240 Hz Max Refresh Rate
  • 2048 × 1536 × 32bit x85Hz Max — по аналоговому интерфейсу
  • 2560 × 1600 @ 60Hz Max — по цифровому интерфейсу (все DVI-гнезда с Dual-Link)

Что касается возможностей видеокарт по проигрыванию MPEG2 (DVD-Video), то еще в 2002 году мы изучали этот вопрос, с тех пор мало что поменялось. В зависимости от фильма загрузка CPU при проигрывании на современных видеокартах не поднимается выше 25%.

По поводу HDTV и прочих новомодных видеоштучек. Одно из исследований также проведено, и с ним можно ознакомиться здесь.

Напомним, что эта карты требуют дополнительное питание, поэтому с каждой картой поставляются переходники с молекс на 6-пиновый разъем, хотя уже все современные БП имеют такие «хвосты». Отмечу особо, что эталонные карты имеют ДВА гнезда для питания, причем, одно из них 8-пиновое. Это не должно смущать пользователя — привычного 6-пинового хвоста питания будет достаточно. Два дополнительных пина отвечают лишь за возможность разгона видеокарты через драйвер.

Теперь о системах охлаждения.

HIS RADEON HD 3870 X2 2x512MB PCI-E
Powercolor RADEON HD 3870 X2 2x512MB PCI-E
MSI R3870X2-T2D1Q-OC (RADEON HD 3870 X2) 2x512MB PCI-E
На примере видеокарты от HIS изучим эталонную систему охлаждения, потому что почти все ускорители этого класса будут оснащены именно таким кулером.

Перед нами уже знакомая всем конструкция цилиндрического типа: длинный радиатор, закрытый пластиковым кожухом, направляюшим поток воздуха. На одном конце — цилиндрический вентилятор, прогоняющая воздух через радиатор, на другом конце — раструб, через который тепло выходит за пределы системного блока.

Мы такие кулеры уже видели и на HD 2900 XT, и на HS 3870. Здесь изюминка в том, что устройство просто очень длинное, и внутри — не один радиатор, а два, по одному на каждое GPU.

Прошу обратить внимание на то, что пластина и радиатор, находящиеся ближе к турбине, алюминиевые, а другие — медные. Дело в том, что логика у производителей была такой: первый по ходу движения потока воздуха радиатор получает более холодный воздух, и там достаточно алюминиевого радиатора. А второй уже охлаждается нагретым после первого потоком. И там уже надо усиливать радиатор, установив медный. Что получилось — покажем ниже.

А в завершение рассмотрения скажу, что такие разные радиаторы установлены ТОЛЬКО в первых партиях таких кулеров. Продукты от MSI, Powercolor имеют уже ОБА медных радиатора, что привело к приросту массы всей карты в целом. Вероятно, что HIS получил карту от AMD одним из первых, и там кулер еше был с разными радиаторами.

Что касается шума, то цилиндрический вентилятор работает на невысоких оборотах, и потому шума практически нет. Только при старте компьютера на несколько секунд включается большая скорость на кулере.

GeCube RADEON HD 3870 X2 X-Turbo Dual 2x512MB PCI-E

Разработчики из GeCube пошли по иному пути. Раз плата собственной разработки, то и кулер будет свой. Или эе где-то его заказали.

Устройство полностью сделано из медных сплавов, поэтому весит весьма прилично. На медной подошве, которая прижимается как к ядрам, так и к микросхемам памяти (вызывает удивление факт, что на обороте карты микросхемы памяти оставлены без охлаждения вообще), установлены два чашеобразных радиатора, где сами чаши образованы из тепловых трубок, на которые часто нанизаны небольшие пластины охлаждения.

Внутри чаш имеются два вентилятора, работающих на невысоких оборотах, и потому кулер полностью бесшумный. Однако надо обращать внимание на хрупкость крепления самих вентиляторов к радиаторам, и лучше при монтаже карты за них не браться руками.

Понятно, что как и в предыдущем случае, эта система охлаждения весьма широкая, поэтому видеокарта в целом занимает два слота у материнской платы.



Мы провели исследование температурного режима с помощью утилиты RivaTuner (автор А.Николайчук AKA Unwinder) и получили следующие результаты:

HIS RADEON HD 3870 X2 2x512MB PCI-E
Powercolor RADEON HD 3870 X2 2x512MB PCI-E



MSI R3870X2-T2D1Q-OC (RADEON HD 3870 X2) 2x512MB PCI-E



GeCube RADEON HD 3870 X2 X-Turbo Dual 2x512MB PCI-E



Результаты показали, что установка радиаторов из алюминия и меди сыграла свою негативную роль в охлаждении, и получилось, что карта от HIS, работая на менее высоких частотах получила нагрев выше, чем у карты от MSI, когда как последняя имеет частоты, прилично выше эталонных, и при этом оснащена эталонным кулером, но полностью медным.

А эффективность охлаждения у GeCube выше всяких похвал! И не забываем, что кулер бесшумный.



А это процессор, который и обеспечивает аппаратную поддержку CrossFire в рамках одной карты. По сути своей это PCI-E-to-PCI-E мост. Согласно спецификациям, он поддерживает только PCI-E 1.1, а не 2.0, которым обладает каждый GPU. Поэтому между GPU обмен идет именно по шине версии 1.1.



Это, собственно, сам RV670 — RADEON HD 3870, каковых у каждой карты по 2 штуки.



А это так выглядит референс-карта Х2 внутри стендового компьютера.

Комплектация.

HIS RADEON HD 3870 X2 2x512MB PCI-E
В коробке можно увидеть руководство пользователя, диск с драйверами, адаптер компонентного вывода, DVI-to-VGA адаптер, DVI-to-HDMI адаптер, переходник для внешнего питания, мост для объединения видеокарт в CrossFire. И что самое любопытное, что HIS продолжает поставлять бонусы с видеокартами, как то универсальную отвертку со съемными насадками. В нее встроен также фонарик, узким пучком света освещающий место привинчивания или отвинчивания, а также уровнем.. Это приятный бонус для каждого, кто самостоятельно собирает системные блоки или меняет в них какие-либо комплектующие. Минусом является отсутствие переходника с 6 на 8 пин, ведь один из разъемов питания на карте 8-пиновый.
GeCube RADEON HD 3870 X2 X-Turbo Dual 2x512MB PCI-E
В комплект поставки входят: руководство пользователя, диск с драйверами, адаптер компонентного вывода, DVI-to-VGA адаптер, DVI-to-HDMI адаптер, переходник для внешнего питания, мост для объединения видеокарт в CrossFire. Скромный комплект. Не чета роскошному виду карты и упаковки.
Powercolor RADEON HD 3870 X2 2x512MB PCI-E
Руководство пользователя, диск с драйверами, адаптер компонентного вывода, DVI-to-VGA адаптер (2 шт.), DVI-to-HDMI адаптер, адаптер компонентного вывода, переходник для внешнего питания, мост для объединения видеокарт в CrossFire.
MSI R3870X2-T2D1Q-OC (RADEON HD 3870 X2) 2x512MB PCI-E
Аналогичный комплект, плюс(что ОЧЕНЬ ВАЖНО!) переходник питания 6-8 пин. Такии образом, ускоритель от MSI можно подключить так, что будут доступны опции разгона в драйверах AMD.


Упаковки.

HIS RADEON HD 3870 X2 2x512MB PCI-E

Вот тут хочется отругать компанию HIS, которая, имея прекрасный опыт выпуска отличных упаковок, в данном случае засунула огромную карту в тоненький бокс, который после закрывания выглядит даже выпуклым. Плюс бесформенное и безвкусное оформление. Такое ощущение, что не самая дорогая карта внутри, а какая-то дешевка, и то от китайского «нонейм».

Очень печально видеть это.

Внутри коробки все разложено в пластиковом отсеке.

GeCube RADEON HD 3870 X2 X-Turbo Dual 2x512MB PCI-E

Дизайнеры же GeCube, наоборот, очень классно постарались, и выдали отличную упаковку даже с окном, через которое видна сама карта, а ее стОит показывать, ибо выглядит шикарно.

Весь комплект разложен по картонным отсекам.

Powercolor RADEON HD 3870 X2 2x512MB PCI-E

Дизайнеры ведут прежнюю политику вертикальных коробок. А по сути это супер, внутри которого белая картонная коробка. А в ней в куче картонных прокладок и перемычек можно найти содержимое. Не совсем понятно, зачем тратить такую уйму картона, когда достаточно сделать форму из пластика, и в нее разложить весь комплект.

Сам дизайн упаковки весьма стильный и привлекательный.

MSI R3870X2-T2D1Q-OC (RADEON HD 3870 X2) 2x512MB PCI-E

А в данном случае мы видим пресловутую огромную коробку-сумку, которой славятся все дорогие карты от MSI. Правда внутри все полупустое, ибо комплект скромен (вспоминаются годы, когда в таких боксах мы находили и 11 дисков с ПО, и бонусы всякие).

Видеокарта в этой таре надежно лежит во внутренней коробочке из полипеноуретана.



Установка и драйверы

Конфигурация тестового стенда:

  • Компьютер на базе Intel Core2 (775 Socket)
    • процессор Intel Core2 Extreme QX9650 (3000 MHz);
    • системная плата Gigabyte GA-X38-DQ6 на чипсете Intel X38;
    • оперативная память 2 GB DDR2 SDRAM Corsair 1142MHz (CAS (tCL)=5; RAS to CAS delay (tRCD)=5; Row Precharge (tRP)=5; tRAS=15);
    • жесткий диск WD Caviar SE WD1600JD 160GB SATA.
    • блок питания Tagan 1100-U95 (1100W).
  • операционная система Windows XP SP2; DirectX 9.0c;
  • операционная система Windows Vista 32bit; DirectX 10.0;
  • монитор Dell 3007WFP (30").
  • драйверы ATI версии CATALYST 7.12/8.1; Nvidia версии 169.21/169,25.

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

  • D3D RightMark Beta 4 (1050) с описанием на сайте 3d.rightmark.org
  • D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 — тесты пиксельных шейдеров версий 2.0 и 3.0 ссылка.
  • RightMark3D 2.0 с кратким описанием: ссылка

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

Синтетические тесты проводились на следующих видеокартах:

  • RADEON HD 3870 X2 со стандартными параметрами (далее HD3870 X2)
  • RADEON HD 3870 со стандартными параметрами (далее HD3870)
  • Nvidia Geforce 8800 GTS 512MB со стандартными параметрами (далее GF8800GTS 512)

Для анализа результатов новой модели двухчиповой видеокарты AMD были выбраны именно эти решения по следующим причинам: RADEON HD 3870 — как полный одночиповый аналог, с отличиями только по рабочим частотам памяти и чипа, ну а с последней моделью Geforce 8800 GTS на основе чипа G92 мы сравниваем по двум причинам. Во-первых, эта видеокарта близка к HD 3870 X2 по цене, а во-вторых, она является одним из наиболее быстрых решений конкурента.

Нужно сказать, что исследование грозит быть весьма скучным. Ведь с архитектурной точки зрения вообще ничего не изменилось, GPU те же, просто их больше, а принцип работы CrossFire давно известен. Кроме того, с учетом включения алгоритма AFR у CrossFire предсказать результаты несложно, в большинстве случаев будет почти удвоение производительности (равно как и количества кадров), что далеко от реальной игровой ситуации, ведь синтетические тесты просты и в них нет, к примеру, тех же зависимостей построения следующего кадра при использовании результатов (render targets) предыдущего. Поэтому мы предполагаем удвоение количества кадров в секунду почти во всех случаях.

Direct3D 9: Тесты Pixel Filling

В тесте определяется пиковая производительность выборки текстур (texel rate) в режиме FFP для разного числа текстур, накладываемых на один пиксель:



У видеокарт AMD значения ближе к теоретическому максимуму, хотя и меньше, чем должны быть. Результаты синтетических тестов привычно уже не дотягивают до теоретических цифр даже в режимах с большим количеством текстур. Хотя у видеокарты Nvidia, отличающейся улучшенными TMU и высокой скоростью текстурирования, дела ещё хуже. Судя по цифрам наших старых тестов, чип выбирает в два раза меньше текселей за один такт, по сравнению со своими теоретическими показателями для 32-битных текстур с билинейной фильтрацией.

В случае с одной текстурой, производительность всех решений ограничена пропускной способностью памяти, а дополнительно — ещё и количеством блоков ROP. В случае с большим количеством текстур на пиксель, ситуация выправляется, Geforce 8800 GTS и HD 3870 X2 идут вместе, хотя двухчиповый монстр от AMD всё равно проигрывает одночиповому от Nvidia. Вот что значит не слишком большое количество блоков TMU, заложенное при проектировании архитектуры AMD R6xx… Двукратной разницы между HD 3870 X2 и HD 3870 нигде нет, несмотря на то, что при увеличении количества текстур она постоянно увеличивается. Смотрим тест филлрейта:



Второй синтетический тест измеряет скорость заполнения, тут мы видим ту же ситуацию с учетом количества записанных в буфер кадра пикселей. В случаях с 0 и 1 накладываемыми текстурами все решения демонстрируют схожие результаты, показывая свою реальную силу лишь в ситуациях с большим количеством текстур на пиксель. В целом, как и предполагалось, видеокарты на основе чипов RV670 проигрывают решениям на базе G92 по скорости текстурных выборок и филлрейту, когда скорость не ограничивается пропускной способностью памяти.

Direct3D 9: Тесты Geometry Processing Speed

Рассмотрим пару предельных геометрических тестов, и первым у нас будет самый простой вершинный шейдер, показывающий максимальную пропускную способность по треугольникам:



Все чипы основаны на унифицированных архитектурах, все их универсальные исполнительные блоки в этом тесте заняты геометрической работой и решения показывают высокие результаты, явно упирающиеся не в пиковую производительность унифицированных блоков, а в производительность других блоков, например, triangle setup.

Эффективность выполнения теста в разных режимах у чипов примерно одинаковая, пиковая производительность в FFP, VS 1.1 и VS 2.0 отличается не сильно, только у G92 режим FFP оказался несколько быстрее. По этим результатам ничего особенного сказать нельзя, кроме того, что по ним видно, что чипы AMD традиционно быстрее обрабатывают геометрию, по сравнению с чипами Nvidia. И явным лидером по геометрической производительности становится двухчиповое решение на основе пары RV670, показывать удвоенную частоту кадров в этом тесте ему ничто не мешает.

Мы убрали два промежуточных теста на скорость обработки геометрии с одним источником освещения, так как они не показывают ничего интересного. И переходим сразу к рассмотрению самой сложной геометрической задачи с тремя источниками света, включающей статические и динамические переходы:



Разница между AMD и Nvidia увеличилась, лидером по геометрической производительности остаётся HD 3870 X2, во всех режимах опережающий своего одночипового собрата в два раза. Видно, что даже в нашей самой сложной геометрической задаче возможности этих чипов не раскрываются, можно давать даже ещё большую нагрузку. А вот результаты единственной протестированной видеокарты Nvidia провалились ниже, и она значительно уступает даже обычному HD 3870. Интересно, что на трех смешанных источниках света наличие оптимизированной эмуляции FFP у G92 стало ещё заметнее.

Краткий итог по проведенным геометрическим тестам: чипы в HD 3870 X2 всё те же, используется режим CrossFire, увеличивающий частоту кадров ровно в два раза, поэтому и результаты получились ожидаемыми — в два раза превышающими показатели одиночного HD 3870. Хотя не забываем, что в реальных приложениях ситуация может быть совершенно другой…

Direct3D 9: Тесты Pixel Shaders

Первая группа пиксельных шейдеров, которую мы рассматриваем, является очень простой для современных видеочипов, она включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0.



Эти тесты слишком просты для современных архитектур и не показывают их истинную силу. Производительность в самых простых из них ограничена текстурными выборками и филлрейтом, что и видно на примере слабых результатов видеокарт AMD по сравнению с Geforce 8800 GTS. Опять сказывается сравнительно малое количеством TMU… Но в более сложных PS 2.0 тестах результаты становятся интереснее, например, в самом сложном Phong с тремя источниками света, Geforce 8800 GTS немного проигрывает даже обычному HD 3870.

Между производительностью HD 3870 X2 и HD 3870 сохраняется примерно двукратная разница, лишь только в тестах освещения получилось чуть меньше. Смотрим результаты более сложных пиксельных программ промежуточных версий:



В тесте процедурной визуализации воды «Water», сильно зависящем от скорости текстурирования, используется зависимая выборка из текстур с большим уровнем вложенности, поэтому оба решения компании AMD отстают от единственного представителя Nvidia. Geforce 8800 GTS значительно опережает даже двухчиповое решение в этом случае. Скорость HD 3870 X2 более чем в два раза выше производительности одиночного HD 3870.

Во втором тесте, интенсивном вычислительно, прежде всего, решения AMD уже впереди, Geforce 8800 GTS немного проигрывает обычному HD 3870, не говоря про двухчиповый X2, традиционно для наших тестов ровно в два раза опережающий HD 3870. В общем, вторая задача явно лучше подходит для архитектуры AMD с большим числом унифицированных вычислительных блоков.

Direct3D 9: Тесты пиксельных шейдеров New Pixel Shaders

Эти тесты пиксельных шейдеров DirectX 9 ещё сложнее, они делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье Современная терминология 3D графики
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами

Существует два варианта этих шейдеров: с ориентацией на математические вычисления, и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:



В тесте «Frozen Glass» явным лидером является решение Nvidia, Geforce 8800 GTS опережает даже новинку, в которой соединена мощь двух RV670, а одиночный HD 3870 отстаёт от него в 2,5 раза. Это говорит об ограничении производительности данного теста скоростью текстурных выборок, прежде всего.

Во втором тесте «Parallax Mapping» лидерство традиционно принадлежало решениям AMD, но выход решений на Nvidia G92 с улучшенными блоками TMU (для параллакс маппинга нужна дополнительная текстурная выборка) изменил ситуацию, и новый Geforce 8800 GTS опередил HD 3870. Зато сдвоенный RV670 в виде HD 3870 X2 показывает в два раза большее количество кадров в секунду в этом тесте, по сравнению с аналогичным одночиповым решением. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:



Ситуация изменилась, теперь производительность ещё больше упирается в скорость текстурных блоков, и поэтому Geforce 8800 GTS отрывается ещё сильнее, проигрывая двухчиповой видеокарте совсем немного во втором тесте. Между HD 3870 X2 и HD 3870 наблюдается всё та же самая двукратная разница…

Как и раньше, на всех видеокартах варианты шейдеров с большим количеством математических вычислений работают быстрее, и для современных архитектур GPU смысла в варианте с упором на текстурирование нет, все новые чипы AMD и Nvidia предпочитают математические вычисления текстурированию.

Рассмотрим результаты ещё двух тестов пиксельных шейдеров — версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9. Тесты отличаются тем, что сильно нагружают и ALU и текстурные модули, обе шейдерные программы сложные, длинные, включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье Современная терминология 3D графики
  • Fur — процедурный шейдер, визуализирующий мех



Нагрузка на видеокарты тут большая даже для самых мощных чипов. И хотя решения AMD обеспечивают эффективное исполнение сложных пиксельных шейдеров версии 3.0 с большим количеством ветвлений, одночиповый HD 3870 отстаёт от новой модели Geforce 8800 GTS 512MB почти в два раза, что можно объяснить ускоренными билинейными текстурными выборками у последнего. Понятно, что в реальных приложениях картина будет иной, там используется трилинейная и/или анизотропная фильтрация текстур, да и упор в филлрейт и ПСП бывает значительно чаще.

RADEON HD 3870 X2 продолжает опережать одночиповый вариант карты AMD в два раза, но это даёт ему лишь очень небольшое преимущество над Geforce 8800 GTS. Что же будет, когда Nvidia выпустит аналогичный вариант на основе пары G92? Гадать не нужно, при условии аналогичных режимов SLI и CrossFire, решение AMD вновь уступит.

Direct3D 10: Тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

В новую версию RightMark3D 2.0 вошли два знакомых PS 3.0 теста под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два полностью новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами, при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель!) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40-80, включение «шейдерного» суперсэмплинга — до 60-120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Все результаты в «High» примерно в полтора раза ниже, чем в «Low». Тесты процедурной визуализации меха с большим количеством текстурных выборок традиционно показывают очень большое преимущество решений Nvidia над AMD. С Geforce 8800 GTS ни одна из карт RADEON тягаться не может, даже два чипа не помогают. Такое отставание трудно объяснить даже теоретически, возможно, виноваты недоработки Direct3D 10 драйвера. Зато с CrossFire в Direct3D 10 всё в порядке, HD 3870 X2 ровно в два раза быстрее одночипового варианта.

Кстати, судя по предыдущим исследованиям, производительность в этом тесте зависит не только от количества и скорости блоков TMU, скорость рендеринга упирается в том числе и в филлрейт и ПСП. Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза, может быть, в такой ситуации что-то изменится:

Включение суперсэмплинга теоретически увеличивает нагрузку ровно в четыре раза, но на видеокартах Nvidia скорость снижается сильнее, чем на AMD, за счет чего отрыв сокращается. Но всё равно, тесты такой сложности под силу разве что Geforce 8800 GTS, остальные протестированные решения показывают слишком низкие результаты. В сравнении HD 3870 X2 и HD 3870 ничего не меняется, анонсированная сегодня видеокарта опережает предыдущее решение в два раза, благодаря режиму AFR у CrossFire.

Второй тест, измеряющий производительность выполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением, число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше, по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Этот тест интереснее с практической точки зрения, разновидности parallax mapping давно применяются в играх, а тяжелые варианты, вроде нашего steep parallax mapping используются в последних релизах, например, в Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип примерно в два раза, такой режим называется «High».

Хотя решения AMD ранее были традиционно сильны в Direct3D 9 тестах parallax mapping, в обновленном DX10 варианте без суперсэмплинга они не могут справиться с задачей на уровне Geforce 8800 GTS, даже HD 3870 X2 на основе двух GPU проигрывает решению Nvidia. К тому же, включение самозатенения вызывает на продукции AMD большее падение производительности (более двух раз), по сравнению с полуторакратной разницей для решений производства Nvidia.

Успокаивает только то, что X2 ровно в два раза быстрее обычного HD 3870, то есть, можно сказать, что CrossFire AFR работает в наших тестах отлично. Посмотрим, что изменит включение суперсэмплинга, ведь в прошлом тесте он вызывал большее падение скорости на картах Nvidia.

Это ещё одна тяжелая задача для видеочипов, совместное включение сразу двух опций: суперсэмплинга и самозатенения, увеличивает нагрузку на карты почти в восемь раз, вызывая большое падение производительности. Разница между производительностью разных видеокарт в целом сохраняется, включение суперсэмплинга сказывается так же, как и в предыдущем случае — карты AMD улучшают свои показатели относительно решения Nvidia. Несмотря на это, даже HD 3870 X2 продолжает отставать от Geforce 8800 GTS 512MB. Что касается сравнения HD 3870 X2 и HD 3870, ничего нового добавить нельзя — видим традиционное двукратное преимущество двухчипового варианта.

Direct3D 10: Тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

В наших Direct3D 9 синтетических тестах мы уже отмечали, что в вычислительно сложных задачах последняя архитектура AMD показывает себя зачастую лучше конкурирующей от Nvidia. Хотя в этом тесте RADEON HD 3870 всё же уступает лучшему решению на базе G92, его двухчиповый вариант ускоряет частоту кадров в два раза и значительно опережает одну из быстрейших карт Nvidia по показателю FPS.

Второй тест шейдерных вычислений носит название Fire, и он ещё более тяжёл для ALU. В нём текстурная выборка только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Если вы помните, во всех предыдущих статьях видеокарты AMD проваливали этот тест, показывая крайне низкие результаты, указывающие на явную ошибку в драйверах. Судя по результатам сегодняшнего исследования, ошибку наконец-то исправили (не прошло и года!) и теперь HD 3870 показывает результат на уровне 512 Мбайт модификации Geforce 8800 GTS. А RADEON HD 3870 X2 ещё ровно в два раза быстрее.

Direct3D 10: Тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующих частицу. Аналогичные алгоритмы должны получить широкое использование в будущих DirectX 10 играх.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен получилось примерно одинаковым, отличаются только абсолютные значения. Показываемая производительность соответствует количеству точек, с каждым шагом падение FPS составляет около двух раз. С Geforce 8800 GTS в этом тесте может конкурировать только двухчиповая видеокарта AMD, более чем в два раза опережающая одиночный вариант на базе RV670, который, в свою очередь, проигрывает решению Nvidia. Впрочем, эта задача для современных видеокарт несложная, как показали предыдущие исследования, ограничения скорости мощностью шейдерных ALU тут нет, задача ограничена скорее больше ПСП, чем мощностью чипов. Возможно, при переносе части вычислений в геометрический шейдер ситуация изменится.

В данном случае, никаких существенных изменений не произошло. Все видеокарты показывают почти те же результаты при изменении параметра GS load, отвечающем за перенос части вычислений в геометрический шейдер. Geforce 8800 GTS всё так же опережает HD 3870, а двухчиповый HD 3870 X2 быстрее одиночной модели более чем в два раза. Вероятно, сказывается разность в тактовых частотах и погрешность измерения. Посмотрим, что будет в следующем тесте…

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленном в «Heavy» — ещё и для их отрисовки. То есть, в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер. Сначала рассматриваем лёгкий режим:

Относительные результаты в разных режимах соответствуют нагрузке: во всех случаях производительность хорошо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть в два раза медленней. Производительность единственной видеокарты Nvidia в этом тесте опять значительно выше, по сравнению с обоими решениями AMD при любой геометрической сложности. Одночиповая видеокарта AMD отстаёт от Geforce 8800 GTS 512MB более чем в два раза, а двухчиповая даже не может приблизиться к ней.

Тест интересен ещё и тем, что стал первым в нашем исследовании, в котором рассматриваемый сегодня RADEON HD 3870 X2 менее чем в два раза опередил своего одночипового брата. Разница между их скоростью составила лишь около 1.5 раз. Вот вам и синтетический тест, в котором наиболее благоприятный для FPS режим CrossFire не даёт двукратного роста производительности. То ли ещё будет в игровых тестах…

Цифры могут измениться в следующем тесте, с более активным использованием геометрических шейдеров, также интересно сравнить друг с другом результаты, полученные в «Balanced» и «Heavy» режимах.

Соотношение скоростей изменилось очень сильно, видно, что чипы AMD выполняют более сложные геометрические шейдеры эффективнее чипа Nvidia. Хотя Geforce 8800 GTS 512MB показывает результат, примерно равный результату RADEON HD 3870, а ведь раньше отставание было значительно больше. Сдвоенный HD 3870 X2 быстрее одиночного хоть и не в два раза, но всё же значительно опережает обоих конкурентов.

Что касается сравнения результатов в разных режимах, нужно отметить, что обновленный вариант Geforce 8800 GTS в «Balanced» показывает лучшие показатели, чем RADEON HD 3870 X2 в «Heavy». И это при том, что получаемая в разных режимах картинка не отличается визуально. То есть, решениям AMD больше подходит второй режим (использование геометрического шейдера при выводе вместо «instancing»), Nvidia — первый, но при сравнении в лучших для обеих компаний режимах, Geforce 8800 GTS всё же немного опережает даже новую двухчиповую видеокарту AMD.

Direct3D 10: Скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи по сути и соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

И снова результаты в разных режимах показывают примерно одинаковую картину производительности видеокарт относительно друг друга. Судя по нашим предыдущим исследованиям, на результаты данного теста сильно влияет пропускная способность памяти, и чем проще режим, тем большее влияние на скорость она оказывает.

В сравнении Geforce 8800 GTS и RADEON HD 3870 побеждает решение Nvidia, но двухчиповый вариант той же карты ускоряется и выходит вперёд. Разница между видеоплатами AMD достигает двух раз, но только в тяжелых режимах. В самом легком режиме не хватает ПСП, да и в среднем разница меньше двух раз. Посмотрим на результаты этого же теста с увеличенным количеством текстурных выборок:

Ситуация изменилась не слишком сильно, всё так же впереди RADEON HD 3870 X2, опережающий HD 3870 до двух раз по мере усложнения задачи. Ну а производительность Nvidia Geforce 8800 GTS находится где-то посередине между ними.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

В «Waves» ситуация несколько отличается от предыдущих результатов. Обе модели семейства HD 3800 смотрятся неплохо, младшая показывает результат на уровне Geforce 8800 GTS, опережая его в лёгком режиме и отставая в тяжёлом, а двухчиповый герой HD 3870 X2 ещё в два раза быстрее и является лидером, благодаря работе двух чипов в CrossFire. Смотрим второй режим:

Почти без изменений, хотя с увеличением сложности теста результат одиночной HD 3870 становится уже явно лучше, чем у Geforce 8800 GTS, она выигрывает уже во всех режимах, а не только в лёгком. Остальные выводы остаются в силе — в легком режиме скорость немного ограничивается ПСП, а в тяжёлых большую роль играют блоки TMU и ROP. Видно, что драйверы AMD оптимизировали, ведь раньше мы отмечали, что решения Nvidia лучше справляются с тестами текстурных выборок из вершинных шейдеров по сравнению с картами AMD, а теперь ситуация намного лучше. Тем более, что двухчиповый X2 в очередной раз оказался более чем в два раза быстрее обычного варианта HD 3870.

Выводы по синтетическим тестам

Ничего особенно нового и интересного в выводах написать не получится. Ведь RADEON HD 3870 X2 основан на двух видеочипах, которые мы давно знаем. По сравнению с R600 они изменились мало, и все сильные и слабые места архитектуры остались прежними. Двухчиповое решение отличается высокой вычислительной производительностью, особенно в современных и будущих приложениях с большим количеством сложных шейдеров всех типов, ну а самым слабым местом нужно признать сравнительно малое количество текстурных блоков, которое не позволяет всем видеокартам на основе R6xx показывать большую производительность в тестах, сильно зависящих от скорости текстурирования.

Что касается увеличения производительности HD 3870 X2 относительно одночипового варианта, основанного на том же GPU, можно сказать одно — все результаты объясняются применяемым режимом CrossFire — Alternate Frame Rendering (AFR), при котором каждый видеочип занимается обработкой своего (четного или нечетного) кадра целиком. И так как зависимостей между кадрами в наших тестах нет, частота кадров увеличивается примерно в два раза, за исключением нескольких тестов, где решению не хватает пропускной способности памяти. Кроме того, очень важно помнить, что в реальных игровых условиях достичь двукратного прироста в скорости непросто даже в режиме AFR, который сам по себе имеет некоторые недостатки в виде больших задержек по сравнению с «честным» удвоением производительности. Иными словами, во многих случаях 60 FPS на системе CrossFire или SLI будут столь же комфортны при игре, как и 30 FPS на одночиповой карте.

В целом же, на основе анализа результатов синтетических тестов, нужно признать, что RADEON HD 3870 X2 получился довольно быстрым решением. В определенных условиях оно может составить конкуренцию даже более дорогим видеокартам и в большом количестве наших тестов опережает одночиповый Geforce 8800 GTS 512MB с примерно равной рекомендуемой ценой. Но не забывайте, что при выборе между одночиповой и двухчиповой видеоплатой, обязательно нужно учитывать все указанные выше недостатки CrossFire/SLI систем. И обязательно учитывать результаты, показанные в реальных игровых приложениях, а не в синтетических или полусинтетических тестах, вроде 3DMark.

Именно поэтому очень важно обратить внимание на следующую часть статьи, в которой вы увидите тесты новой двухчиповой видеокарты производства компании AMD в современных игровых приложениях. Эти результаты должны быть значительно интереснее синтетических из этой части, ведь в играх производительность удвоить не так просто, как в специализированных тестах.



ATI RADEON 3870 X2 — Часть 3: Игровые тесты (производительность)



Блок питания для тестового стенда предоставлен компанией TAGAN
Монитор Dell 3007WFP для тестовых стендов предоставлен компанией Nvidia