ATI RADEON HD 4870 X2 2x1024MB PCI-E

Самая тяжелая артиллерия от AMD/ATI на рынке графических карт
Финальное тестирование



СОДЕРЖАНИЕ

  1. Часть 1 — Теория и архитектура
  2. Часть 2 — Практическое знакомство
  3. Особенности видеокарт
  4. Конфигурация стенда, список тестовых инструментов
  5. Результаты синтетических тестов
  6. Результаты игровых тестов (производительность)


ATI RADEON HD 4870 Х2: Часть 1: Теоретические сведения


Еще раз напомним, что в отличие от уже вышедших на прилавки магазинов 4870 с 512 МБ памяти на борту, данный продукт несет в себе не 2 по 512 МБ, а 2 по 1024, то есть в сумме 2 ГБ памяти. Но мы специально подчеркиваем, что складывать объем памяти у двухпроцессорных ускорителей нельзя — это будет некорректно. Поскольку каждое ядро использует только свой блок памяти, и общего, так сказать, банка памяти, нет. Поэтому только маркетологи, ради красивых слов, могут складывать и демонстрировать карту с якобы невероятно большим объемом памяти.

Плата



ATI RADEON HD 4870 X2 2x1024MB PCI-E
  • GPU: 2 × RADEON HD 4870 (RV770)
  • Интерфейс: PCI-Express x16
  • Частоты работы GPU (ROPs/Shaders): 750/750 MHz (номинал — 750/750 МГц)
  • Частоты работы памяти (физическая (эффективная)): 900 (3600) MHz (номинал — 900 (3600) МГц)
  • Ширина шины обмена с памятью: 2 × 256bit
  • Число вершинных процессоров: -
  • Число пиксельных процессоров: -
  • Число универсальных процессоров: 2 × 800
  • Число текстурных процессоров: 2 × 40 (BLF/TLF)
  • Число ROPs: 2 × 16
  • Размеры: 270x100x33 мм (последняя величина — максимальная толщина видеокарты).
  • Цвет текстолита: черный
  • RAMDACs/TMDS: интегрированы в GPU.
  • Выходные гнезда: 2xDVI (Dual-Link/HDMI), TV-out.
  • VIVO: нет
  • TV-out: интегрирован в GPU.
  • Поддержка многопроцессорной работы: CrossFire (Hardware).


ATI RADEON HD 4870 X2 2x1024MB PCI-E
Карта имеет 2x1024 МБ памяти GDDR5 SDRAM, размещенной в 16 микросхемах ( по 8 на лицевой и оборотной сторонах PCB)

Микросхемы памяти Hynix (GDDR5). Микросхемы расчитаны на максимальную частоту работы в 1000 (4000) МГц.



Сравнение с эталонным дизайном, вид спереди
ATI RADEON HD 4870 X2 2x1024MB PCI-E Reference ATI RADEON HD 3870 X2 2x512MB PCI-E


Сравнение с эталонным дизайном, вид сзади
ATI RADEON HD 4870 X2 2x1024MB PCI-E Reference ATI RADEON HD 3870 X2 2x512MB PCI-E


Очевидно, что концепция дизайна перекочевала из 3870 Х2, изменения коснулись лишь особенностей памяти DDR5, и более сильных требований к силовой цепи. На плате установлен новый мост PEX от PLX Technologies, обеспечивающий внутренний CrossFire режим между ядрами.





О кулере. Система охлаждения та же, что и у 3870 X2, усилены лишь радиаторы.

Принцип действия тот же: прогон воздуха через радиатор с помощью турбины. Имеется большой плюс: горячий воздух выносится за пределы системного блока, а не остается внутри. Минусы тоже есть. Если на 3870 Х2 кулер справлялся со своей задачей, оставаясь бесшумным, то теперь при нагрузке он может ощутимо шуметь (вернее, не он, а выходящий воздух, то есть слышен шелест). Микросхемы памяти на обороте охлаждаются специальной пластиной-радиатором.





Видеокарты этой серии оснащены собственным звуковым кодеком, поэтому именно этот звуковой поток затем передается на HDMI (с помощью переходника DVI-to-HDMI). Поэтому, если кому-то эта функция важна, следите за тем, чтобы в комплекте поставки видеокарты был этот переходник.

Также отметим, что питание ускорителя осуществляется с помощью одного 6-пинового и второго 8-пинового разъемов. Размешение их такое же, как и у 3870 Х2.

У карты имеется гнездо TV-выхода, которое уникально по разъему, и для вывода изображения на ТВ как через S-Video, так и по RCA, требуются специальные адаптеры-переходники, поставляемые вместе с картой. Более подробно о ТВ-выходе можно почитать здесь.

Подключение к аналоговым мониторам с d-Sub (VGA) производится через специальные адаптеры-переходники DVI-to-d-Sub. Также поставляются переходники DVI-to-HDMI (мы помним, что данные ускорители поддерживают полноценную передачу видео и звука на HDMI-приемник), поэтому проблем с такими мониторами также не должно быть.

Максимальные разрешения и частоты:

  • 240 Hz Max Refresh Rate
  • 2048 × 1536 × 32bit x85Hz Max — по аналоговому интерфейсу
  • 2560 × 1600 @ 60Hz Max — по цифровому интерфейсу (все DVI-гнезда с Dual-Link)

Что касается возможностей видеокарт по проигрыванию MPEG2 (DVD-Video), то еще в 2002 году мы изучали этот вопрос, с тех пор мало что поменялось. В зависимости от фильма загрузка CPU при проигрывании на современных видеокартах не поднимается выше 25%.

По поводу HDTV. Одно из исследований также проведено, и с ним можно ознакомиться здесь.

К сожалению, на настоящий момент утилита RivaTuner (автор А. Николайчук AKA Unwinder) не поддерживает новую серию, и потому мониторинга нет. Однако карта очень сильно греется, и температура ядра может быть 80 и выше градусов (по первым впечатлениям).

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютер на базе Intel Core2 (775 Socket)
    • процессор Intel Core2 Extreme QX9650 (3000 MHz);
    • системная плата Zotac 790i Ultra на чипсете Nvidia nForce 790i Ultra;
    • оперативная память 2 GB DDR3 SDRAM Corsair 2000MHz (CAS (tCL)=5; RAS to CAS delay (tRCD)=5; Row Precharge (tRP)=5; tRAS=15);
    • жесткий диск WD Caviar SE WD1600JD 160GB SATA.
    • блок питания Tagan TG900-BZ 900W.
  • операционная система Windows Vista 32bit SP1; DirectX 10.1;
  • монитор Dell 3007WFP (30").
  • драйверы ATI версии CATALYST 8.7; Nvidia версии 177.79.

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

  • D3D RightMark Beta 4 (1050) с описанием на сайте 3d.rightmark.org
  • D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 — тесты пиксельных шейдеров версий 2.0 и 3.0 ссылка.
  • RightMark3D 2.0 с кратким описанием: Vista без SP1, Vista c SP1

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

Синтетические тесты проводились на следующих видеокартах:

  • RADEON HD 4870 X2 со стандартными параметрами (далее HD4870X2)
  • RADEON HD 4870 со стандартными параметрами (далее HD4870)
  • RADEON HD 3870 X2 со стандартными параметрами (далее HD3870X2)
  • Nvidia Geforce GTX 280 со стандартными параметрами (далее GTX280)
  • Nvidia Geforce GTX 260 со стандартными параметрами (далее GTX260)
  • Nvidia Geforce 9800 GX2 со стандартными параметрами (далее GF9800GX2)

Для сравнения результатов видеокарты RADEON HD 4870 X2 были выбраны эти модели по следующим причинам: с RADEON HD 3870 X2 её будет интересно сравнить, как с аналогичным двухчиповым решением компании AMD на GPU предыдущей архитектуры, чтобы оценить влияние улучшений и разницу в производительности. Цифры HD 4870 полезны, чтобы увидеть прирост от работы двух GPU. И видеокарты Nvidia интересны все по-своему: Geforce 9800 GX2 — единственная двухчиповая видеокарта Nvidia на предыдущей архитектуре G9x, а обе модели серии Geforce GTX 200 выступают как конкуренты RADEON HD 4870 X2, хотя последняя и несколько дороже топового чипа Nvidia.

Direct3D 9: Тесты Pixel Filling

В тесте определяется пиковая производительность выборки текстур (texel rate) в режиме FFP для разного числа текстур, накладываемых на один пиксель:



Ничего особенно интересного, всё соответствует нашим предыдущим исследованиям. Видеокарты привычно не достигают теоретических значений, ближе всего к теории подходит HD 3870 X2, основанный на двух RV670. А для новых видеокарт Nvidia и AMD, в данном тесте теоретический максимум не достигается. Каждый RV770 в нашем тесте выбирает менее 30 текселей за один такт из 32-битных текстур при билинейной фильтрации, не дотягивая до 40 теоретических, а у карт Nvidia эффективность ещё ниже.

Из действительно интересного — более чем двукратная разница между одной HD 4870 и HD 4870 X2, которая явно выше погрешности измерения. Хотя это ни о чём не говорит, данный тест очень хорошо работает на двухчиповых конфигурациях, и на нём вряд ли сказываются какие-то аппаратные изменения в R700.

Что касается сравнения HD 4870 X2 с прямым конкурентом GTX 280, в этом тесте двухчиповая видеокарта AMD значительно опережает конкурента за счёт своей двухчиповой природы. Любопытно и то, что вплоть до пяти текстур на пиксель не виден двукратный или близкий к двукратному прирост скорости от CrossFire. Но с каждой дополнительной текстурой относительный результат двухчипового решения улучшается. И видно, что в случае с 1-2 текстурами скорость сдерживается ПСП. Посмотрим на результаты в тесте филлрейта:



Второй синтетический тест измеряет скорость заполнения, и в нём мы видим ту же ситуацию, но уже с учетом количества записанных в буфер кадра пикселей. В случаях с 0, 1 и 2 накладываемыми текстурами у RADEON HD 4870 X2 получается не очень высокий результат, по сравнению с одиночной HD 4870, что обусловлено влиянием ПСП и метода мультичипового рендеринга. Но, как и на предыдущей диаграмме, в ситуациях с большим количеством текстур на пиксель, новая видеоплата выходит далеко вперёд, опережая в два раза решение на одном RV770 и все конкурирующие.

Direct3D 9: Тесты Pixel Shaders

Первая группа пиксельных шейдеров, которую мы рассматриваем, является очень простой для современных видеочипов, она включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0.



Тесты слишком просты для современных архитектур и интересны разве что при смене архитектур. Даже с учётом того, что в простых тестах производительность ограничена скоростью текстурных выборок, результат двухчиповой карты примерно в два раза выше, чем у одночиповой. Поэтому HD 4870 X2 опережает все карты Nvidia во всех рассмотренных задачах и быстрее всех остальных в два и более раз. Это следствие работы AFR и улучшенной архитектуры RV770.

Да и в более сложных тестах RADEON HD 4870 X2 также показывает отличные по цифрам результаты, значительно опережая и предшественников и конкурентов. Новые одночиповые видеокарты Nvidia по количественным показателям в этих тестах выглядят явно слабее, конкурируя разве что с одночиповой же HD 4870. Посмотрим на результаты тестов более сложных пиксельных программ промежуточных версий:



Всё то же. AFR эффективно удваивает частоту кадров в таких синтетических тестов, и в сильно зависящем от скорости текстурирования тесте процедурной визуализации воды «Water», где используется зависимая выборка из текстур больших уровней вложенности, и карты располагаются по скорости текстурирования, мы получаем, что новая двухчиповая модель в 2.2-2.5 раза выигрывает у обеих карт Nvidia, и ровно вдвое превосходит HD 4870.

Второй тест интенсивнее загружает вычислительные блоки, лучше подходит для архитектур AMD, обладающих большим количеством потоковых процессоров. В нём новое решение AMD снова показывает максимальный результат, значительно выше, чем у Geforce GTX 260/280 и HD 4870. И снова режим AFR обеспечил карте на двух RV770 двойное ускорение над одночиповым вариантом.

Direct3D 9: Тесты пиксельных шейдеров New Pixel Shaders

Эти тесты пиксельных шейдеров DirectX 9 ещё сложнее, они делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье Современная терминология 3D графики
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами

Существуют два варианта этих шейдеров: с ориентацией на математические вычисления, и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:



В этих математических тестах, зависящих прежде всего от частоты шейдерных блоков и скорости текстурирования, важен баланс всего чипа. Производительность видеокарт в тесте «Frozen Glass» ограничена не только математикой, но и скоростью текстурных выборок, поэтому старая двухчиповая RADEON показывает слабый результат. А новые карты очень хороши, одночиповая HD 4870 быстрее и GTX 260 и GTX 280, а двухчиповый герой сегодняшнего обзора ещё вдвое (AFR же) быстрее.

И во втором тесте «Parallax Mapping» новые решения серии HD 4800 остаются впереди. Одночиповый HD 4870 опережает обе модели от Nvidia, а двухчиповый снова показал вдвое большее количество кадров в секунду. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям, там результаты могут получиться даже более интересными:



В целом — почти то же. В обоих тестах RADEON HD 4870 быстрее и Geforce GTX 260 и GTX 280, а HD 4870 X2 всё так же силён. Хотя взаимное положение карт немного изменилось, сказывается больший упор в скорость текстурных блоков, поэтому HD 3870 X2 стала несколько слабее.

Рассмотрим результаты ещё двух тестов пиксельных шейдеров — версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9. Тесты отличаются тем, что сильно нагружают и ALU и текстурные модули, обе шейдерные программы сложные, длинные, включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье Современная терминология 3D графики
  • Fur — процедурный шейдер, визуализирующий мех



В очередной раз удивляемся тому, насколько хорошо новая архитектура компании AMD показывает себя в этих тестах. Особенно это контрастирует с результатами предыдущих решений, которые проигрывают картам Nvidia, даже два чипа HD 3870 X2 не спасают. А HD 4870 с большим запасом опережает всех соперников, но мы сегодня наблюдаем за HD 4870 X2, которая в 2,7-2,8 раза быстрее топовой Geforce GTX 280! Посмотрим, что получится в DX10, где в предыдущих исследованиях у карт AMD дела были явно хуже. Изменилось ли что-нибудь со времени последнего тестирования?

Direct3D 10: Тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

В новую версию RightMark3D 2.0 вошли два знакомых PS 3.0 теста под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два полностью новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами, при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель!) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40-80, включение «шейдерного» суперсэмплинга — до 60-120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в тесте Fur зависит не только от количества и скорости блоков TMU, но и от филлрейта и ПСП. Наконец-то, в драйверах AMD исправили ошибки, связанные с этими нашими тестами! Теперь, в Direct3D 10 тестах процедурной визуализации меха с большим количеством текстурных выборок, от огромного преимущества решений Nvidia над AMD не осталось и следа.

Хотя не сказать, что HD 4870 X2 уж очень силён на фоне обеих карт Nvidia, но по крайней мере он на одном уровне с ними. Две другие карты AMD можно не смотреть, их результаты возрастут при смене драйвера на более новый. Что же, посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза, возможно в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

Включение суперсэмплинга теоретически увеличивает нагрузку в четыре раза, в этот раз подавляющее преимущество карт Nvidia также испарилось. Новая двухчиповая видеокарта AMD хоть немного, но опережает даже Geforce GTX 280. С увеличением сложности шейдера и нагрузки на видеочип, разница между разными видеокартами схожа. Очень хорошо, что AMD наконец-то подтянула результаты в этом тесте.

Второй тест, измеряющий производительность выполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением, число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше, по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Этот тест интереснее с практической точки зрения, ведь разновидности parallax mapping давно применяются в играх, а тяжелые варианты, вроде нашего steep parallax mapping используются в некоторых проектах, например, в Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип примерно в два раза, такой режим называется «High».

И снова повторяется улучшение результатов карты AMD с новыми драйверами! Всё-таки это были недостатки программные, как мы и предполагали. Раньше казалось странным, что решения AMD сильны в Direct3D 9 тестах parallax mapping, в обновленном D3D10 варианте без суперсэмплинга почему-то проигрывали слишком много. Да ещё и включение самозатенения вызывает на продукции AMD слишком большое падение производительности. Теперь всё намного приятнее, рассматриваемый нами сегодня RADEON HD 4870 X2 только в тяжёлом режиме отстаёт от новой топовой видеокарты Nvidia, обгоняя её в лёгком. Посмотрим, что изменит включение суперсэмплинга, в прошлом тесте он вызывал большее падение скорости на картах Nvidia.

При включении суперсэмплинга и самозатенения задача получается более тяжёлой, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая большое падение производительности. И теперь взаимное расположение разных видеокарт уже иное, а включение суперсэмплинга сказывается как и в предыдущем случае — карты производства AMD улучшают свои показатели относительно решений Nvidia. И новая HD 4870 X2 уже просто быстрее всех в обоих режимах. Что уже значительно больше похоже на реальное положение дел, по сравнении с результатами на предыдущих версиях драйверов.

Direct3D 10: Тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

При анализе результатов наших синтетических тестов, мы всегда отмечаем, что в вычислительно сложных задачах современные решения AMD показывают себя лучше конкурирующих от Nvidia. Но чтобы настолько… Понятно, что это двухчиповое решение, и с одночиповым его напрямую сравнивать нужно с определённой скидкой. Но всё же, в тесте Mineral у RADEON HD 4870 X2 получились просто потрясающие цифры. Топовая видеокарта AMD на основе двух чипов RV770 обгоняет карту прошлого поколения на двух RV670 более чем в два раза, что близко к разнице в количестве и частоте потоковых процессоров. Также новая видеокарта в два с половиной раза опережает и своего прямого конкурента Geforce GTX 280, а также и Geforce 9800 GX2.

Второй тест шейдерных вычислений носит название Fire, и он ещё более тяжёл для ALU. В нём текстурная выборка только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

В данном тесте скорость рендеринга также ограничена исключительно производительностью шейдерных блоков, и тест очень хорошо подходит архитектурам AMD, что хорошо заметно после недавнего исправления ошибки в драйверах AMD. И снова налицо подавляющее преимущество решений этой компании. Если RADEON HD 4870 на 70% быстрее, чем Geforce GTX 280, то двухчиповый HD 4870 X2 просто рвёт его, будучи быстрее в три раза! Очень высокий результат, в вычислениях у двухчиповой карты на RV770 явно отличные возможности. Кстати, в обоих вычислительных тестах двухчиповая карта была не вдвое сильнее одночиповой, а несколько меньше.

Direct3D 10: Тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующих частицу. Аналогичные алгоритмы должны получить широкое использование в будущих DirectX 10 играх.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаковое, производительность соответствует количеству точек, с каждым шагом падение FPS составляет около двух раз. Задача для современных видеокарт не очень сложная и ограничение скорости мощностью потоковых процессоров в тесте не явное, задача ограничена также и ПСП и филлрейтом.

В этом тесте снова получилось интересно. Очень плотные результаты сразу у нескольких решений: у двухчиповой HD 3870 X2, новой HD 4870 и GTX 280 от конкурента. Ну а AFR режим даёт HD 4870 X2 возможность быть впереди всех, почти вдвое увеличивая результат в каждом режиме. Посмотрим, что будет при переносе части вычислений в геометрический шейдер, ситуация может стать ещё интереснее:

Нет, разница между рассмотренными вариантами теста невелика, существенных изменений не произошло. Хотя двухчиповый HD 3870 X2 слегка поднялся вверх. Но лидером так и остаётся наш сегодняшний герой — HD 4870 X2. Двухчиповым картам в этом тесте очень просто показать высокие результаты, ведь алгоритм многочипового рендеринга AFR эффективно удваивает FPS. Кстати, видеокарты Nvidia показывают идентичные результаты при изменении параметра GS load, отвечающем за перенос части вычислений в геометрический шейдер, а результаты видеоплаты AMD на базе старых RV670 немного выросли. Посмотрим, что изменится в следующем тесте, который предполагает большую нагрузку именно на геометрические шейдеры…

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленном в «Heavy» — ещё и для их отрисовки. То есть, в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер. Сначала рассматриваем лёгкий режим:

Относительные результаты в разных режимах соответствуют нагрузке: во всех случаях производительность неплохо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть в два раза медленней. В этот раз двухчиповый рендеринг не даёт такой эффективности, какая была отмечена в предыдущем случае. Поэтому RADON HD 4870 X2 хоть и является лидером во всех режимах, но Geforce GTX 280 довольно близок к его результатам, особенно в тяжёлых режимах.

Судя по не очень высоким результатам HD 3870 X2, похоже, что на результаты новых карт повлияли улучшенные возможности текстурирования. Впрочем, цифры должны измениться на следующей диаграмме, в тесте с более активным использованием геометрических шейдеров. Также будет интересно сравнить друг с другом результаты, полученные в «Balanced» и «Heavy» режимах.

Как ни странно, почти ничего не изменилось, все архитектуры, кроме устаревшей G9x, улучшили результаты. Тем более, что и в RV770, и в GT200 были сделаны некоторые оптимизации, направленные на улучшение исполнения геометрических шейдеров. RADEON HD 4870 теперь догнал Geforce GTX 280, а двухчиповый вариант и вовсе обогнал с хорошим запасом. Предыдущее поколение чипов AMD значительно хуже показывает себя в этом тесте, что видно по двухчиповой карте.

Что касается сравнения результатов в разных режимах, тут всё как всегда, видеоплаты AMD при переходе от использования «instancing» к геометрическому шейдеру при выводе, улучшают свои показатели, а старые видеокарты Nvidia теряют в производительности. При этом, получаемая в разных режимах картинка не отличается визуально.

Direct3D 10: Скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи по сути и соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Судя по предыдущим исследованиям, на результаты этого теста влияет не только скорость текстурирования, но и производительность ROP и пропускная способность памяти, и чем проще режим, тем большее влияние на скорость они оказывают. Во всех режимах лидером является рассматриваемая нами двухчиповая модель серии RADEON HD 4800. Но вообще, явно влияет ПСП и ограничивает скорость, особенно в простом режиме. Да и многочиповый рендеринг показывает себя неплохо. Посмотрим на результаты этого же теста с увеличенным количеством текстурных выборок:

Ситуация изменилась не слишком сильно, но текстурирование влияет на скорость уже сильнее, судя по предыдущим исследованиям. Двухчиповый рендеринг всё так же высокоэффективен, поэтому даже с учётом того, что HD 4870 уступает решениям Nvidia, двухчиповая HD 4870 X2 является лидером. В лёгких режимах к ней близки обе Geforce, так как в этом случае скорость ограничена величиной ПСП.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Второй тест раздела под названием «Waves» несколько благосклоннее к продукции AMD, новые модели семейства RADEON HD 4800 смотрятся очень хорошо. Одночиповая карта выступает на уровне двухчипового предшественника, обгоняя видеокарты Nvidia, кроме самого простого режима с влиянием ПСП. А вот двухчиповая является просто ярким лидером этого теста. Похоже, что в таких условиях эффективность TMU у RV770 выше, чем у GT200. Рассмотрим второй вариант этого же теста:

И снова видим почти то же самое. Хотя с увеличением сложности теста результаты видеоплат AMD относительно скорости карт Nvidia ещё несколько улучшились, последние потеряли от изменения условий тестирования больше. Во всех режимах явным лидером является герой обзора — HD 4870 X2, который опережает одночиповый аналог HD 4870 почти в два раза. А последний, к слову, является лучшим среди одночиповых решений.

3DMark Vantage: Feature тесты

В данный обзор мы снова включили синтетические тесты из пакета 3DMark Vantage. Пакет новый, его feature тесты довольно интересны и отличаются от наших. Вероятно, при анализе результатов карт в этом пакете мы сделаем для себя какие-то новые и полезные выводы.

Feature Test 1: Texture Fill

Первый тест — тест скорости текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.



Соотношение результатов в целом схоже с тем, что показывают наши тесты, когда используются условия, в которых карты Nvidia не получают дополнительного преимущества от большого количества TMU. Старая двухчиповая карта AMD идёт наравне с новой одночиповой, а новая модель HD 4870 X2 значительно обгоняет все решения производства Nvidia и AMD. Как и должно быть по теории, так как у RV770 очень эффективные текстурные модули и работа AFR в тестах текстурирования весьма эффективно удваивает FPS.

Feature Test 2: Color Fill

Тест скорости заполнения. Используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR рендеринг, поэтому такой тест очень своевременен.



Показания этого теста соответствуют тому, что мы получаем в своих синтетических тестах, с учетом того, что у нас используется целочисленный буфер с 8-бит на компоненту, а в тесте Vantage — 16-бит с плавающей точкой. Поэтому все цифры в два раза меньше наших.

Цифры скорее показывают не столько производительность ROP, но величину пропускной способности памяти (в случае двухчиповых карт умноженную на два). Цифры соответствуют теоретическим и зависят, прежде всего, от ширины шины памяти и её частоты. В этом тесте новая модель HD 4870, пользуясь улучшенными возможностями блоков ROP и большой ПСП GDDR5 памяти, показывает высокий результат чуть выше уровня двухчиповой HD 3870 X2 и GTX 260 с 448-битной шиной памяти. А двухчиповый герой обзора удваивает эту цифру и в очередной раз является безусловным лидером теста.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature тестов, так как подобная техника уже используется в играх. В нём рисуется один четырехугольник (точнее, два треугольника), с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоёмкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжёлого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчёты освещения по Strauss.



Тест интересен тем, что он не зависит только от шейдерной мощности, эффективности исполнения ветвлений и скорости текстурных выборок, а от всего сразу. То есть, для достижения высокой скорости важен баланс чипа и карты. И больше всего важна эффективность выполнения ветвлений в шейдерах, так называемая гранулярность исполнения.

Старые карты от обоих производителей в этом тесте всегда отстают, поэтому двухчиповый HD 3870 X2 позади HD 4870. CrossFire рендеринг в этом тесте весьма эффективен, результаты RADEON HD 4870 X2 вдвое сильнее, чем у HD 4870, что позволяет новой карте выиграть даже у Geforce GTX 280. Несмотря на то, что в тестах текстурных выборок и математических вычислений решение AMD обычно выигрывало больше, в данном POM тесте разница между топовыми решениями Geforce и RADEON не такая большая — меньше 30%.

Feature Test 4: GPU Cloth

Тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров, и скорость stream out.



А вот в этом тесте у двухчиповых карт ничего хорошего не получается, что у HD 3870 X2 весьма низкий результат (по нашим предыдущим исследованиям — не выше карты с одиночным GPU), что у HD 4870 X2 цифры слабые, даже чуть меньше, чем у HD 4870. В общем, мы снова видим отставание решений AMD в этом тесте, даже двухчиповая карта HD 4870 X2 далека до Geforce GTX 260, не говоря про GTX 280. Похоже, что скорость в GPU Cloth не зависит от шейдерной производительности, а зависит от скорости stream out, да и взаимодействие мультичипов в этом случае неэффективно работает. И никакой sideport не помогает.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот. Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующих частицу. Но тест больше всего загружает шейдерные блоки вершинными расчётами, также тестируется stream out.



Снова мы видим по смыслу почти то же самое, что и в предыдущем случае, только у новых карт на RV770 дела намного лучше. Эти карты AMD подтянулись выше, но всё равно, лидером остаётся Geforce GTX 280, остальные близки к нему, но всё же отстают. Новая двухчиповая карта AMD снова близка к одночиповой, поэтому мы можем предположить плохую совместимость ещё одного алгоритма с мультичиповым рендерингом.

Feature Test 6: Perlin Noise

Этот feature тест можно считать математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто используемый в процедурном текстурировании, он очень сложен математически.



Ну а последний feature тест в Vantage показывает чистую математическую производительность видеочипов. И немудрено, что показанная в нём скорость в целом соответствует тому, что мы видели выше в наших математических тестах из RightMark 2.0, хотя здесь у HD 4870 и GTX 280 результаты почти равные. В целом же видеокарты AMD закономерно выигрывают у конкурентов производства Nvidia, а рассматриваемый RADEON HD 4870 X2 является чистым лидером и опережает одночиповый вариант ровно в два раза.

Выводы по синтетическим тестам

Итак, на основе результатов проведённых синтетических тестов, мы подтверждаем выводы, сделанные в предыдущих статьях. Новый чип компании AMD получился очень удачными, в RV770 было сделано много изменений, и поэтому даже одночиповое решение почти во всех синтетических тестах находится среди лидеров. А двухчиповая карта RADEON HD 4870 X2, благодаря улучшенной архитектуре RV770, в которой исправили главные недостатки, почти во всех тестах обгоняет своего ближайшего конкурента Geforce GTX 280.

Новое решение на основе двух GPU очень мощное, обладает большим количеством исполнительных блоков, поддерживает новую память GDDR5 достаточного объёма (на чип доступно больше, чем у одночиповой). Компания AMD исправила некоторые недостатки в драйверах, и теперь HD 4870 X2 можно смело признать наиболее быстрой видеокартой (не забываем про два чипа и AFR, конечно) в наших синтетических тестах. Единственные вопросы возникли по меньшей эффективности исполнения ветвлений в шейдерных программах, что сказалось на производительности сложных алгоритмов parallax mapping, и по скорости stream out, из-за которой новые решения AMD уступают конкурирующим картам Nvidia в паре тестов. Зато вычислительные возможности у рассматриваемой сегодня карты непревзойденные.

Следующая часть статьи содержит тесты нового двухчипового решения компании AMD на основе двух RV770, а также других видеокарт обоих производителей в нескольких современных игровых приложениях. Их результаты должны подтвердить наши выводы, мы предполагаем, что в большинстве случаев скорость HD 4870 X2 в играх будет выше, чем у всех конкурентов. Кроме случаев с неработоспособностью режима AFR и плохо совместимых с мультичиповым рендерингом алгоритмов.



ATI RADEON HD 4870 Х2 — Часть 3: Игровые тесты (производительность)



Блок питания для тестового стенда предоставлен компанией TAGAN
Монитор Dell 3007WFP для тестовых стендов предоставлен компанией Nvidia




Дополнительно

Самая тяжелая артиллерия от AMD/ATI на рынке графических карт: ATI RADEON HD 4870 X2 (R700) 2x1024 MB PCI-E

ATI RADEON HD 4870 X2 2x1024MB PCI-E

Самая тяжелая артиллерия от AMD/ATI на рынке графических карт
Финальное тестирование


СОДЕРЖАНИЕ

  1. Часть 1 — Теория и архитектура
  2. Часть 2 — Практическое знакомство
  3. Особенности видеокарт
  4. Конфигурация стенда, список тестовых инструментов
  5. Результаты синтетических тестов
  6. Результаты игровых тестов (производительность)


ATI RADEON HD 4870 Х2: Часть 1: Теоретические сведения


Еще раз напомним, что в отличие от уже вышедших на прилавки магазинов 4870 с 512 МБ памяти на борту, данный продукт несет в себе не 2 по 512 МБ, а 2 по 1024, то есть в сумме 2 ГБ памяти. Но мы специально подчеркиваем, что складывать объем памяти у двухпроцессорных ускорителей нельзя — это будет некорректно. Поскольку каждое ядро использует только свой блок памяти, и общего, так сказать, банка памяти, нет. Поэтому только маркетологи, ради красивых слов, могут складывать и демонстрировать карту с якобы невероятно большим объемом памяти.

Плата



ATI RADEON HD 4870 X2 2x1024MB PCI-E
  • GPU: 2 × RADEON HD 4870 (RV770)
  • Интерфейс: PCI-Express x16
  • Частоты работы GPU (ROPs/Shaders): 750/750 MHz (номинал — 750/750 МГц)
  • Частоты работы памяти (физическая (эффективная)): 900 (3600) MHz (номинал — 900 (3600) МГц)
  • Ширина шины обмена с памятью: 2 × 256bit
  • Число вершинных процессоров: -
  • Число пиксельных процессоров: -
  • Число универсальных процессоров: 2 × 800
  • Число текстурных процессоров: 2 × 40 (BLF/TLF)
  • Число ROPs: 2 × 16
  • Размеры: 270x100x33 мм (последняя величина — максимальная толщина видеокарты).
  • Цвет текстолита: черный
  • RAMDACs/TMDS: интегрированы в GPU.
  • Выходные гнезда: 2xDVI (Dual-Link/HDMI), TV-out.
  • VIVO: нет
  • TV-out: интегрирован в GPU.
  • Поддержка многопроцессорной работы: CrossFire (Hardware).


ATI RADEON HD 4870 X2 2x1024MB PCI-E
Карта имеет 2x1024 МБ памяти GDDR5 SDRAM, размещенной в 16 микросхемах ( по 8 на лицевой и оборотной сторонах PCB)

Микросхемы памяти Hynix (GDDR5). Микросхемы расчитаны на максимальную частоту работы в 1000 (4000) МГц.



Сравнение с эталонным дизайном, вид спереди
ATI RADEON HD 4870 X2 2x1024MB PCI-E Reference ATI RADEON HD 3870 X2 2x512MB PCI-E


Сравнение с эталонным дизайном, вид сзади
ATI RADEON HD 4870 X2 2x1024MB PCI-E Reference ATI RADEON HD 3870 X2 2x512MB PCI-E


Очевидно, что концепция дизайна перекочевала из 3870 Х2, изменения коснулись лишь особенностей памяти DDR5, и более сильных требований к силовой цепи. На плате установлен новый мост PEX от PLX Technologies, обеспечивающий внутренний CrossFire режим между ядрами.





О кулере. Система охлаждения та же, что и у 3870 X2, усилены лишь радиаторы.

Принцип действия тот же: прогон воздуха через радиатор с помощью турбины. Имеется большой плюс: горячий воздух выносится за пределы системного блока, а не остается внутри. Минусы тоже есть. Если на 3870 Х2 кулер справлялся со своей задачей, оставаясь бесшумным, то теперь при нагрузке он может ощутимо шуметь (вернее, не он, а выходящий воздух, то есть слышен шелест). Микросхемы памяти на обороте охлаждаются специальной пластиной-радиатором.





Видеокарты этой серии оснащены собственным звуковым кодеком, поэтому именно этот звуковой поток затем передается на HDMI (с помощью переходника DVI-to-HDMI). Поэтому, если кому-то эта функция важна, следите за тем, чтобы в комплекте поставки видеокарты был этот переходник.

Также отметим, что питание ускорителя осуществляется с помощью одного 6-пинового и второго 8-пинового разъемов. Размешение их такое же, как и у 3870 Х2.

У карты имеется гнездо TV-выхода, которое уникально по разъему, и для вывода изображения на ТВ как через S-Video, так и по RCA, требуются специальные адаптеры-переходники, поставляемые вместе с картой. Более подробно о ТВ-выходе можно почитать здесь.

Подключение к аналоговым мониторам с d-Sub (VGA) производится через специальные адаптеры-переходники DVI-to-d-Sub. Также поставляются переходники DVI-to-HDMI (мы помним, что данные ускорители поддерживают полноценную передачу видео и звука на HDMI-приемник), поэтому проблем с такими мониторами также не должно быть.

Максимальные разрешения и частоты:

  • 240 Hz Max Refresh Rate
  • 2048 × 1536 × 32bit x85Hz Max — по аналоговому интерфейсу
  • 2560 × 1600 @ 60Hz Max — по цифровому интерфейсу (все DVI-гнезда с Dual-Link)

Что касается возможностей видеокарт по проигрыванию MPEG2 (DVD-Video), то еще в 2002 году мы изучали этот вопрос, с тех пор мало что поменялось. В зависимости от фильма загрузка CPU при проигрывании на современных видеокартах не поднимается выше 25%.

По поводу HDTV. Одно из исследований также проведено, и с ним можно ознакомиться здесь.

К сожалению, на настоящий момент утилита RivaTuner (автор А. Николайчук AKA Unwinder) не поддерживает новую серию, и потому мониторинга нет. Однако карта очень сильно греется, и температура ядра может быть 80 и выше градусов (по первым впечатлениям).

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютер на базе Intel Core2 (775 Socket)
    • процессор Intel Core2 Extreme QX9650 (3000 MHz);
    • системная плата Zotac 790i Ultra на чипсете Nvidia nForce 790i Ultra;
    • оперативная память 2 GB DDR3 SDRAM Corsair 2000MHz (CAS (tCL)=5; RAS to CAS delay (tRCD)=5; Row Precharge (tRP)=5; tRAS=15);
    • жесткий диск WD Caviar SE WD1600JD 160GB SATA.
    • блок питания Tagan TG900-BZ 900W.
  • операционная система Windows Vista 32bit SP1; DirectX 10.1;
  • монитор Dell 3007WFP (30").
  • драйверы ATI версии CATALYST 8.7; Nvidia версии 177.79.

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

  • D3D RightMark Beta 4 (1050) с описанием на сайте 3d.rightmark.org
  • D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 — тесты пиксельных шейдеров версий 2.0 и 3.0 ссылка.
  • RightMark3D 2.0 с кратким описанием: Vista без SP1, Vista c SP1

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

Синтетические тесты проводились на следующих видеокартах:

  • RADEON HD 4870 X2 со стандартными параметрами (далее HD4870X2)
  • RADEON HD 4870 со стандартными параметрами (далее HD4870)
  • RADEON HD 3870 X2 со стандартными параметрами (далее HD3870X2)
  • Nvidia Geforce GTX 280 со стандартными параметрами (далее GTX280)
  • Nvidia Geforce GTX 260 со стандартными параметрами (далее GTX260)
  • Nvidia Geforce 9800 GX2 со стандартными параметрами (далее GF9800GX2)

Для сравнения результатов видеокарты RADEON HD 4870 X2 были выбраны эти модели по следующим причинам: с RADEON HD 3870 X2 её будет интересно сравнить, как с аналогичным двухчиповым решением компании AMD на GPU предыдущей архитектуры, чтобы оценить влияние улучшений и разницу в производительности. Цифры HD 4870 полезны, чтобы увидеть прирост от работы двух GPU. И видеокарты Nvidia интересны все по-своему: Geforce 9800 GX2 — единственная двухчиповая видеокарта Nvidia на предыдущей архитектуре G9x, а обе модели серии Geforce GTX 200 выступают как конкуренты RADEON HD 4870 X2, хотя последняя и несколько дороже топового чипа Nvidia.

Direct3D 9: Тесты Pixel Filling

В тесте определяется пиковая производительность выборки текстур (texel rate) в режиме FFP для разного числа текстур, накладываемых на один пиксель:



Ничего особенно интересного, всё соответствует нашим предыдущим исследованиям. Видеокарты привычно не достигают теоретических значений, ближе всего к теории подходит HD 3870 X2, основанный на двух RV670. А для новых видеокарт Nvidia и AMD, в данном тесте теоретический максимум не достигается. Каждый RV770 в нашем тесте выбирает менее 30 текселей за один такт из 32-битных текстур при билинейной фильтрации, не дотягивая до 40 теоретических, а у карт Nvidia эффективность ещё ниже.

Из действительно интересного — более чем двукратная разница между одной HD 4870 и HD 4870 X2, которая явно выше погрешности измерения. Хотя это ни о чём не говорит, данный тест очень хорошо работает на двухчиповых конфигурациях, и на нём вряд ли сказываются какие-то аппаратные изменения в R700.

Что касается сравнения HD 4870 X2 с прямым конкурентом GTX 280, в этом тесте двухчиповая видеокарта AMD значительно опережает конкурента за счёт своей двухчиповой природы. Любопытно и то, что вплоть до пяти текстур на пиксель не виден двукратный или близкий к двукратному прирост скорости от CrossFire. Но с каждой дополнительной текстурой относительный результат двухчипового решения улучшается. И видно, что в случае с 1-2 текстурами скорость сдерживается ПСП. Посмотрим на результаты в тесте филлрейта:



Второй синтетический тест измеряет скорость заполнения, и в нём мы видим ту же ситуацию, но уже с учетом количества записанных в буфер кадра пикселей. В случаях с 0, 1 и 2 накладываемыми текстурами у RADEON HD 4870 X2 получается не очень высокий результат, по сравнению с одиночной HD 4870, что обусловлено влиянием ПСП и метода мультичипового рендеринга. Но, как и на предыдущей диаграмме, в ситуациях с большим количеством текстур на пиксель, новая видеоплата выходит далеко вперёд, опережая в два раза решение на одном RV770 и все конкурирующие.

Direct3D 9: Тесты Pixel Shaders

Первая группа пиксельных шейдеров, которую мы рассматриваем, является очень простой для современных видеочипов, она включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0.



Тесты слишком просты для современных архитектур и интересны разве что при смене архитектур. Даже с учётом того, что в простых тестах производительность ограничена скоростью текстурных выборок, результат двухчиповой карты примерно в два раза выше, чем у одночиповой. Поэтому HD 4870 X2 опережает все карты Nvidia во всех рассмотренных задачах и быстрее всех остальных в два и более раз. Это следствие работы AFR и улучшенной архитектуры RV770.

Да и в более сложных тестах RADEON HD 4870 X2 также показывает отличные по цифрам результаты, значительно опережая и предшественников и конкурентов. Новые одночиповые видеокарты Nvidia по количественным показателям в этих тестах выглядят явно слабее, конкурируя разве что с одночиповой же HD 4870. Посмотрим на результаты тестов более сложных пиксельных программ промежуточных версий:



Всё то же. AFR эффективно удваивает частоту кадров в таких синтетических тестов, и в сильно зависящем от скорости текстурирования тесте процедурной визуализации воды «Water», где используется зависимая выборка из текстур больших уровней вложенности, и карты располагаются по скорости текстурирования, мы получаем, что новая двухчиповая модель в 2.2-2.5 раза выигрывает у обеих карт Nvidia, и ровно вдвое превосходит HD 4870.

Второй тест интенсивнее загружает вычислительные блоки, лучше подходит для архитектур AMD, обладающих большим количеством потоковых процессоров. В нём новое решение AMD снова показывает максимальный результат, значительно выше, чем у Geforce GTX 260/280 и HD 4870. И снова режим AFR обеспечил карте на двух RV770 двойное ускорение над одночиповым вариантом.

Direct3D 9: Тесты пиксельных шейдеров New Pixel Shaders

Эти тесты пиксельных шейдеров DirectX 9 ещё сложнее, они делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье Современная терминология 3D графики
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами

Существуют два варианта этих шейдеров: с ориентацией на математические вычисления, и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:



В этих математических тестах, зависящих прежде всего от частоты шейдерных блоков и скорости текстурирования, важен баланс всего чипа. Производительность видеокарт в тесте «Frozen Glass» ограничена не только математикой, но и скоростью текстурных выборок, поэтому старая двухчиповая RADEON показывает слабый результат. А новые карты очень хороши, одночиповая HD 4870 быстрее и GTX 260 и GTX 280, а двухчиповый герой сегодняшнего обзора ещё вдвое (AFR же) быстрее.

И во втором тесте «Parallax Mapping» новые решения серии HD 4800 остаются впереди. Одночиповый HD 4870 опережает обе модели от Nvidia, а двухчиповый снова показал вдвое большее количество кадров в секунду. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям, там результаты могут получиться даже более интересными:



В целом — почти то же. В обоих тестах RADEON HD 4870 быстрее и Geforce GTX 260 и GTX 280, а HD 4870 X2 всё так же силён. Хотя взаимное положение карт немного изменилось, сказывается больший упор в скорость текстурных блоков, поэтому HD 3870 X2 стала несколько слабее.

Рассмотрим результаты ещё двух тестов пиксельных шейдеров — версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9. Тесты отличаются тем, что сильно нагружают и ALU и текстурные модули, обе шейдерные программы сложные, длинные, включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье Современная терминология 3D графики
  • Fur — процедурный шейдер, визуализирующий мех



В очередной раз удивляемся тому, насколько хорошо новая архитектура компании AMD показывает себя в этих тестах. Особенно это контрастирует с результатами предыдущих решений, которые проигрывают картам Nvidia, даже два чипа HD 3870 X2 не спасают. А HD 4870 с большим запасом опережает всех соперников, но мы сегодня наблюдаем за HD 4870 X2, которая в 2,7-2,8 раза быстрее топовой Geforce GTX 280! Посмотрим, что получится в DX10, где в предыдущих исследованиях у карт AMD дела были явно хуже. Изменилось ли что-нибудь со времени последнего тестирования?

Direct3D 10: Тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

В новую версию RightMark3D 2.0 вошли два знакомых PS 3.0 теста под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два полностью новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами, при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель!) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40-80, включение «шейдерного» суперсэмплинга — до 60-120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в тесте Fur зависит не только от количества и скорости блоков TMU, но и от филлрейта и ПСП. Наконец-то, в драйверах AMD исправили ошибки, связанные с этими нашими тестами! Теперь, в Direct3D 10 тестах процедурной визуализации меха с большим количеством текстурных выборок, от огромного преимущества решений Nvidia над AMD не осталось и следа.

Хотя не сказать, что HD 4870 X2 уж очень силён на фоне обеих карт Nvidia, но по крайней мере он на одном уровне с ними. Две другие карты AMD можно не смотреть, их результаты возрастут при смене драйвера на более новый. Что же, посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза, возможно в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

Включение суперсэмплинга теоретически увеличивает нагрузку в четыре раза, в этот раз подавляющее преимущество карт Nvidia также испарилось. Новая двухчиповая видеокарта AMD хоть немного, но опережает даже Geforce GTX 280. С увеличением сложности шейдера и нагрузки на видеочип, разница между разными видеокартами схожа. Очень хорошо, что AMD наконец-то подтянула результаты в этом тесте.

Второй тест, измеряющий производительность выполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением, число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше, по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Этот тест интереснее с практической точки зрения, ведь разновидности parallax mapping давно применяются в играх, а тяжелые варианты, вроде нашего steep parallax mapping используются в некоторых проектах, например, в Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип примерно в два раза, такой режим называется «High».

И снова повторяется улучшение результатов карты AMD с новыми драйверами! Всё-таки это были недостатки программные, как мы и предполагали. Раньше казалось странным, что решения AMD сильны в Direct3D 9 тестах parallax mapping, в обновленном D3D10 варианте без суперсэмплинга почему-то проигрывали слишком много. Да ещё и включение самозатенения вызывает на продукции AMD слишком большое падение производительности. Теперь всё намного приятнее, рассматриваемый нами сегодня RADEON HD 4870 X2 только в тяжёлом режиме отстаёт от новой топовой видеокарты Nvidia, обгоняя её в лёгком. Посмотрим, что изменит включение суперсэмплинга, в прошлом тесте он вызывал большее падение скорости на картах Nvidia.

При включении суперсэмплинга и самозатенения задача получается более тяжёлой, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая большое падение производительности. И теперь взаимное расположение разных видеокарт уже иное, а включение суперсэмплинга сказывается как и в предыдущем случае — карты производства AMD улучшают свои показатели относительно решений Nvidia. И новая HD 4870 X2 уже просто быстрее всех в обоих режимах. Что уже значительно больше похоже на реальное положение дел, по сравнении с результатами на предыдущих версиях драйверов.

Direct3D 10: Тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

При анализе результатов наших синтетических тестов, мы всегда отмечаем, что в вычислительно сложных задачах современные решения AMD показывают себя лучше конкурирующих от Nvidia. Но чтобы настолько… Понятно, что это двухчиповое решение, и с одночиповым его напрямую сравнивать нужно с определённой скидкой. Но всё же, в тесте Mineral у RADEON HD 4870 X2 получились просто потрясающие цифры. Топовая видеокарта AMD на основе двух чипов RV770 обгоняет карту прошлого поколения на двух RV670 более чем в два раза, что близко к разнице в количестве и частоте потоковых процессоров. Также новая видеокарта в два с половиной раза опережает и своего прямого конкурента Geforce GTX 280, а также и Geforce 9800 GX2.

Второй тест шейдерных вычислений носит название Fire, и он ещё более тяжёл для ALU. В нём текстурная выборка только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

В данном тесте скорость рендеринга также ограничена исключительно производительностью шейдерных блоков, и тест очень хорошо подходит архитектурам AMD, что хорошо заметно после недавнего исправления ошибки в драйверах AMD. И снова налицо подавляющее преимущество решений этой компании. Если RADEON HD 4870 на 70% быстрее, чем Geforce GTX 280, то двухчиповый HD 4870 X2 просто рвёт его, будучи быстрее в три раза! Очень высокий результат, в вычислениях у двухчиповой карты на RV770 явно отличные возможности. Кстати, в обоих вычислительных тестах двухчиповая карта была не вдвое сильнее одночиповой, а несколько меньше.

Direct3D 10: Тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующих частицу. Аналогичные алгоритмы должны получить широкое использование в будущих DirectX 10 играх.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаковое, производительность соответствует количеству точек, с каждым шагом падение FPS составляет около двух раз. Задача для современных видеокарт не очень сложная и ограничение скорости мощностью потоковых процессоров в тесте не явное, задача ограничена также и ПСП и филлрейтом.

В этом тесте снова получилось интересно. Очень плотные результаты сразу у нескольких решений: у двухчиповой HD 3870 X2, новой HD 4870 и GTX 280 от конкурента. Ну а AFR режим даёт HD 4870 X2 возможность быть впереди всех, почти вдвое увеличивая результат в каждом режиме. Посмотрим, что будет при переносе части вычислений в геометрический шейдер, ситуация может стать ещё интереснее:

Нет, разница между рассмотренными вариантами теста невелика, существенных изменений не произошло. Хотя двухчиповый HD 3870 X2 слегка поднялся вверх. Но лидером так и остаётся наш сегодняшний герой — HD 4870 X2. Двухчиповым картам в этом тесте очень просто показать высокие результаты, ведь алгоритм многочипового рендеринга AFR эффективно удваивает FPS. Кстати, видеокарты Nvidia показывают идентичные результаты при изменении параметра GS load, отвечающем за перенос части вычислений в геометрический шейдер, а результаты видеоплаты AMD на базе старых RV670 немного выросли. Посмотрим, что изменится в следующем тесте, который предполагает большую нагрузку именно на геометрические шейдеры…

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленном в «Heavy» — ещё и для их отрисовки. То есть, в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер. Сначала рассматриваем лёгкий режим:

Относительные результаты в разных режимах соответствуют нагрузке: во всех случаях производительность неплохо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть в два раза медленней. В этот раз двухчиповый рендеринг не даёт такой эффективности, какая была отмечена в предыдущем случае. Поэтому RADON HD 4870 X2 хоть и является лидером во всех режимах, но Geforce GTX 280 довольно близок к его результатам, особенно в тяжёлых режимах.

Судя по не очень высоким результатам HD 3870 X2, похоже, что на результаты новых карт повлияли улучшенные возможности текстурирования. Впрочем, цифры должны измениться на следующей диаграмме, в тесте с более активным использованием геометрических шейдеров. Также будет интересно сравнить друг с другом результаты, полученные в «Balanced» и «Heavy» режимах.

Как ни странно, почти ничего не изменилось, все архитектуры, кроме устаревшей G9x, улучшили результаты. Тем более, что и в RV770, и в GT200 были сделаны некоторые оптимизации, направленные на улучшение исполнения геометрических шейдеров. RADEON HD 4870 теперь догнал Geforce GTX 280, а двухчиповый вариант и вовсе обогнал с хорошим запасом. Предыдущее поколение чипов AMD значительно хуже показывает себя в этом тесте, что видно по двухчиповой карте.

Что касается сравнения результатов в разных режимах, тут всё как всегда, видеоплаты AMD при переходе от использования «instancing» к геометрическому шейдеру при выводе, улучшают свои показатели, а старые видеокарты Nvidia теряют в производительности. При этом, получаемая в разных режимах картинка не отличается визуально.

Direct3D 10: Скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи по сути и соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Судя по предыдущим исследованиям, на результаты этого теста влияет не только скорость текстурирования, но и производительность ROP и пропускная способность памяти, и чем проще режим, тем большее влияние на скорость они оказывают. Во всех режимах лидером является рассматриваемая нами двухчиповая модель серии RADEON HD 4800. Но вообще, явно влияет ПСП и ограничивает скорость, особенно в простом режиме. Да и многочиповый рендеринг показывает себя неплохо. Посмотрим на результаты этого же теста с увеличенным количеством текстурных выборок:

Ситуация изменилась не слишком сильно, но текстурирование влияет на скорость уже сильнее, судя по предыдущим исследованиям. Двухчиповый рендеринг всё так же высокоэффективен, поэтому даже с учётом того, что HD 4870 уступает решениям Nvidia, двухчиповая HD 4870 X2 является лидером. В лёгких режимах к ней близки обе Geforce, так как в этом случае скорость ограничена величиной ПСП.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Второй тест раздела под названием «Waves» несколько благосклоннее к продукции AMD, новые модели семейства RADEON HD 4800 смотрятся очень хорошо. Одночиповая карта выступает на уровне двухчипового предшественника, обгоняя видеокарты Nvidia, кроме самого простого режима с влиянием ПСП. А вот двухчиповая является просто ярким лидером этого теста. Похоже, что в таких условиях эффективность TMU у RV770 выше, чем у GT200. Рассмотрим второй вариант этого же теста:

И снова видим почти то же самое. Хотя с увеличением сложности теста результаты видеоплат AMD относительно скорости карт Nvidia ещё несколько улучшились, последние потеряли от изменения условий тестирования больше. Во всех режимах явным лидером является герой обзора — HD 4870 X2, который опережает одночиповый аналог HD 4870 почти в два раза. А последний, к слову, является лучшим среди одночиповых решений.

3DMark Vantage: Feature тесты

В данный обзор мы снова включили синтетические тесты из пакета 3DMark Vantage. Пакет новый, его feature тесты довольно интересны и отличаются от наших. Вероятно, при анализе результатов карт в этом пакете мы сделаем для себя какие-то новые и полезные выводы.

Feature Test 1: Texture Fill

Первый тест — тест скорости текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.



Соотношение результатов в целом схоже с тем, что показывают наши тесты, когда используются условия, в которых карты Nvidia не получают дополнительного преимущества от большого количества TMU. Старая двухчиповая карта AMD идёт наравне с новой одночиповой, а новая модель HD 4870 X2 значительно обгоняет все решения производства Nvidia и AMD. Как и должно быть по теории, так как у RV770 очень эффективные текстурные модули и работа AFR в тестах текстурирования весьма эффективно удваивает FPS.

Feature Test 2: Color Fill

Тест скорости заполнения. Используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR рендеринг, поэтому такой тест очень своевременен.



Показания этого теста соответствуют тому, что мы получаем в своих синтетических тестах, с учетом того, что у нас используется целочисленный буфер с 8-бит на компоненту, а в тесте Vantage — 16-бит с плавающей точкой. Поэтому все цифры в два раза меньше наших.

Цифры скорее показывают не столько производительность ROP, но величину пропускной способности памяти (в случае двухчиповых карт умноженную на два). Цифры соответствуют теоретическим и зависят, прежде всего, от ширины шины памяти и её частоты. В этом тесте новая модель HD 4870, пользуясь улучшенными возможностями блоков ROP и большой ПСП GDDR5 памяти, показывает высокий результат чуть выше уровня двухчиповой HD 3870 X2 и GTX 260 с 448-битной шиной памяти. А двухчиповый герой обзора удваивает эту цифру и в очередной раз является безусловным лидером теста.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature тестов, так как подобная техника уже используется в играх. В нём рисуется один четырехугольник (точнее, два треугольника), с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоёмкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжёлого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчёты освещения по Strauss.



Тест интересен тем, что он не зависит только от шейдерной мощности, эффективности исполнения ветвлений и скорости текстурных выборок, а от всего сразу. То есть, для достижения высокой скорости важен баланс чипа и карты. И больше всего важна эффективность выполнения ветвлений в шейдерах, так называемая гранулярность исполнения.

Старые карты от обоих производителей в этом тесте всегда отстают, поэтому двухчиповый HD 3870 X2 позади HD 4870. CrossFire рендеринг в этом тесте весьма эффективен, результаты RADEON HD 4870 X2 вдвое сильнее, чем у HD 4870, что позволяет новой карте выиграть даже у Geforce GTX 280. Несмотря на то, что в тестах текстурных выборок и математических вычислений решение AMD обычно выигрывало больше, в данном POM тесте разница между топовыми решениями Geforce и RADEON не такая большая — меньше 30%.

Feature Test 4: GPU Cloth

Тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров, и скорость stream out.



А вот в этом тесте у двухчиповых карт ничего хорошего не получается, что у HD 3870 X2 весьма низкий результат (по нашим предыдущим исследованиям — не выше карты с одиночным GPU), что у HD 4870 X2 цифры слабые, даже чуть меньше, чем у HD 4870. В общем, мы снова видим отставание решений AMD в этом тесте, даже двухчиповая карта HD 4870 X2 далека до Geforce GTX 260, не говоря про GTX 280. Похоже, что скорость в GPU Cloth не зависит от шейдерной производительности, а зависит от скорости stream out, да и взаимодействие мультичипов в этом случае неэффективно работает. И никакой sideport не помогает.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот. Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующих частицу. Но тест больше всего загружает шейдерные блоки вершинными расчётами, также тестируется stream out.



Снова мы видим по смыслу почти то же самое, что и в предыдущем случае, только у новых карт на RV770 дела намного лучше. Эти карты AMD подтянулись выше, но всё равно, лидером остаётся Geforce GTX 280, остальные близки к нему, но всё же отстают. Новая двухчиповая карта AMD снова близка к одночиповой, поэтому мы можем предположить плохую совместимость ещё одного алгоритма с мультичиповым рендерингом.

Feature Test 6: Perlin Noise

Этот feature тест можно считать математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто используемый в процедурном текстурировании, он очень сложен математически.



Ну а последний feature тест в Vantage показывает чистую математическую производительность видеочипов. И немудрено, что показанная в нём скорость в целом соответствует тому, что мы видели выше в наших математических тестах из RightMark 2.0, хотя здесь у HD 4870 и GTX 280 результаты почти равные. В целом же видеокарты AMD закономерно выигрывают у конкурентов производства Nvidia, а рассматриваемый RADEON HD 4870 X2 является чистым лидером и опережает одночиповый вариант ровно в два раза.

Выводы по синтетическим тестам

Итак, на основе результатов проведённых синтетических тестов, мы подтверждаем выводы, сделанные в предыдущих статьях. Новый чип компании AMD получился очень удачными, в RV770 было сделано много изменений, и поэтому даже одночиповое решение почти во всех синтетических тестах находится среди лидеров. А двухчиповая карта RADEON HD 4870 X2, благодаря улучшенной архитектуре RV770, в которой исправили главные недостатки, почти во всех тестах обгоняет своего ближайшего конкурента Geforce GTX 280.

Новое решение на основе двух GPU очень мощное, обладает большим количеством исполнительных блоков, поддерживает новую память GDDR5 достаточного объёма (на чип доступно больше, чем у одночиповой). Компания AMD исправила некоторые недостатки в драйверах, и теперь HD 4870 X2 можно смело признать наиболее быстрой видеокартой (не забываем про два чипа и AFR, конечно) в наших синтетических тестах. Единственные вопросы возникли по меньшей эффективности исполнения ветвлений в шейдерных программах, что сказалось на производительности сложных алгоритмов parallax mapping, и по скорости stream out, из-за которой новые решения AMD уступают конкурирующим картам Nvidia в паре тестов. Зато вычислительные возможности у рассматриваемой сегодня карты непревзойденные.

Следующая часть статьи содержит тесты нового двухчипового решения компании AMD на основе двух RV770, а также других видеокарт обоих производителей в нескольких современных игровых приложениях. Их результаты должны подтвердить наши выводы, мы предполагаем, что в большинстве случаев скорость HD 4870 X2 в играх будет выше, чем у всех конкурентов. Кроме случаев с неработоспособностью режима AFR и плохо совместимых с мультичиповым рендерингом алгоритмов.



ATI RADEON HD 4870 Х2 — Часть 3: Игровые тесты (производительность)



Блок питания для тестового стенда предоставлен компанией TAGAN
Монитор Dell 3007WFP для тестовых стендов предоставлен компанией Nvidia