ATI RADEON HD 4870 X2 2x1024MB PCI-E

Самая тяжелая артиллерия от AMD/ATI на рынке графических карт
Финальное тестирование



СОДЕРЖАНИЕ

  1. Часть 1 — Теория и архитектура
  2. Часть 2 — Практическое знакомство
  3. Особенности видеокарт
  4. Конфигурация стенда, список тестовых инструментов
  5. Результаты синтетических тестов
  6. Результаты игровых тестов (производительность)


Часть 1: Теория и архитектура



Мы уже не раз говорили о том, что для верхнего ценового диапазона компания AMD будет выпускать мультичиповые решения, работающие по технологии CrossFire. По сути, одночиповый соперник топовым видеокартам Nvidia у AMD есть только для Geforce GTX 260, младшей карты серии. Против этой модели выступает RADEON HD 4870 — наиболее быстродействующее решение семейства HD 4800 на основе одного GPU от компании AMD. Компания сама не раз упоминала о том, что собирается делать одночиповые видеоплаты для mid-end и нижнего high-end, а для верхнего ценового диапазона будет предлагать двухчиповые карты.

Сначала для конкуренции с Geforce GTX 280 предназначались CrossFire конфигурации на основе двух отдельных плат HD 4850 или HD 4870, затем было представлено и одноплатное двухчиповое решение, получившее название RADEON HD 4870 X2. Предварительный обзор его производительности с небольшим набором тестов мы уже публиковали на нашем сайте. Настало время и для полноценной статьи, с теорией, синтетическими тестами и расширенным набором игровых приложений.

RADEON HD 4870 X2 на базе двух RV770, связанных друг с другом при помощи специального моста, использует технологию CrofssFire и режим рендеринга Alternate Frame Rendering (AFR), о котором мы неоднократно писали. Естественно, компания AMD просто умножает все технические характеристики на два, и если цифру в 2,4 терафлопов теоретической производительности с некоторой натяжкой ещё можно принять, то, например, удвоение объёма памяти весьма спорно.

Повторим истину, что несмотря на удобство создания продуктов для разных ценовых диапазонов на основе разного количества одних и тех же чипов, одночиповое решение схожей сложности всегда будет обладать определенными преимуществами: оно будет быстрее во всех приложениях, а не только оптимизированных для мультичиповых конфигураций, не будет содержать избыточных блоков в каждом из чипов, зато будет обладать лучшими характеристиками по энергопотреблению и тепловыделению. Не касаясь основных проблем мультичипового рендеринга в режиме AFR — задержек при отрисовке изображения, свойственных таким конфигурациям. В результате, на мультичиповых системах нередки ситуации с высоким FPS, но лагом управления и отсутствием требуемой плавности.

Теоретическая часть по двухчиповой карте на основе ранее известной архитектуры не может быть объёмной, ведь это просто два чипа RV770, установленные на одну печатную плату вместе с памятью, мостом и другими элементами. Такая двухчиповая система работает по технологии CrossFire, реализованной аппаратно, линии PCI Express и связующий мост выполнены прямо на плате. По сравнению с системой из двух плат HD 4870, есть небольшая разница исключительно из-за некоторых архитектурных изменений, о которых мы поговорим далее, но в основном, разница в производительности связана с различным объёмом видеопамяти.

Если вы ещё не знакомы с архитектурой AMD RV770, то все подробности о ней можно прочитать в базовом обзоре на нашем сайте. Хотя это дальнейшее развитие архитектуры R6xx, в неё было внесено очень много изменений, которые оправдали себя на все 100% — фактически, все недостатки предыдущих чипов были устранены, и получилась очень грозная сила. Теперь её стало в два раза больше.

Перед прочтением данного материала мы рекомендуем внимательно ознакомиться с базовыми теоретическими материалами DX Current, DX Next и Longhorn, описывающими различные аспекты современных аппаратных ускорителей графики и архитектурные особенности предыдущей продукции Nvidia и AMD.

Эти материалы довольно точно спрогнозировали текущую ситуацию с архитектурами видеочипов, оправдались многие предположения о будущих решениях. Подробную информацию об унифицированных архитектурах AMD RV7xx и R6xx на примере предыдущих решений можно найти в следующих статьях:

Итак, рассмотрим подробные характеристики двухчиповых видеоплат серии RADEON HD 4800, основанных на RV770.

Двухчиповые графические ускорители серии RADEON HD 4800

  • кодовое имя карты R700 (два чипа RV770);
  • технология производства 55 нм;
  • два чипа по 956 миллионов транзисторов;
  • унифицированная архитектура с массивом общих процессоров для потоковой обработки вершин и пикселей, а также других видов данных;
  • аппаратная поддержка DirectX 10.1, в том числе и новой шейдерной модели — Shader Model 4.1, генерации геометрии и записи промежуточных данных из шейдеров (stream output);
  • две 256-битные шины памяти, по четыре контроллера шириной по 64 бита с поддержкой типов памяти GDDR3 и GDDR5;
  • частота ядра 750 МГц (для HD 4870 X2);
  • 2 × 10 SIMD ядер, включающих 2 × 800 скалярных ALU для расчётов с плавающей точкой (целочисленные и плавающие форматы, поддержка FP32 и FP64 точности в рамках стандарта IEEE 754);
  • 2 × 10 укрупненных текстурных блоков, с поддержкой FP16 и FP32 форматов;
  • 2 × 40 блоков текстурной адресации;
  • 2 × 160 блоков текстурной выборки;
  • 2 × 40 блоков билинейной фильтрации с возможностью фильтрации FP16 текстур на полной скорости и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов;
  • возможность динамических ветвлений в пиксельных и вершинных шейдерах;
  • 2 × 16 блоков ROP с поддержкой режимов антиалиасинга с возможностью программируемой выборки более чем 16 сэмплов на пиксель, в том числе при FP16 или FP32 формате буфера кадра. Пиковая производительность до 32 отсчетов за такт (в том числе и для режимов MSAA 2x/4x, в том числе для буферов формата FP16), в режиме без цвета (Z only) — 128 отсчетов за такт;
  • запись результатов до 8 буферов кадра одновременно (MRT);
  • интегрированная поддержка двух RAMDAC, двух портов Dual Link DVI, HDMI, HDTV, DisplayPort.

Спецификации карты RADEON HD 4870 X2

  • частота ядер 750 МГц;
  • количество универсальных процессоров 1600 (2 × 800);
  • количество текстурных блоков — 2 × 40, блоков блендинга — 2 × 16;
  • эффективная частота памяти 3600 МГц (4*900 МГц);
  • тип памяти GDDR5;
  • объем памяти 2 × 1024 МБ;
  • пропускная способность памяти 2 × 115 ГБ/с;
  • теоретическая максимальная скорость закраски 2 × 12.0 гигапикселей в секунду;
  • теоретическая скорость выборки текстур 2 × 30.0 гигатекселей в секунду;
  • поддержка CrossFireX разъема;
  • шина PCI Express 2.0 x16;
  • два DVI-I Dual Link разъема, поддерживается вывод в разрешениях до 2560х1600;
  • TV-Out, HDTV-Out, поддержка HDCP, HDMI, DisplayPort;
  • энергопотребление 286 Вт (8-штырьковый и 6-штырьковый разъёмы);
  • двухслотовый дизайн;
  • рекомендуемая цена $549.

Спецификации карты RADEON HD 4850 X2

  • частота ядер 625 МГц;
  • количество универсальных процессоров 1600 (2 × 800);
  • количество текстурных блоков — 2 × 40, блоков блендинга — 2 × 16;
  • эффективная частота памяти 2000 МГц (2*1000 МГц);
  • тип памяти GDDR3;
  • объем памяти 2 × 1024 МБ;
  • пропускная способность памяти 2 × 64 ГБ/с;
  • теоретическая максимальная скорость закраски 2 × 10.0 гигапикселей в секунду;
  • теоретическая скорость выборки текстур 2 × 25.0 гигатекселей в секунду;
  • поддержка CrossFireX разъема;
  • шина PCI Express 2.0 x16;
  • два DVI-I Dual Link разъема, поддерживается вывод в разрешениях до 2560х1600;
  • TV-Out, HDTV-Out, поддержка HDCP, HDMI, DisplayPort;
  • энергопотребление 230 Вт (8-штырьковый и 6-штырьковый разъёмы);
  • двухслотовый дизайн;
  • рекомендуемая цена $399.

Производство не слишком сложных GPU по 55 нм технологическим нормам позволило выпустить двухчиповые решения подобной мощности. Компании AMD даже не пришлось снижать тактовые частоты, как это было в прошлом. Мало того — поставлен даже увеличенный объем памяти на оба варианта. Которые, к слову, несут ожидаемые названия, ведь суффикс X2 со времен HD 3870 X2 означает установку двойного комплекта GPU и видеопамяти. Кроме того, помимо топового RADEON HD 4870 X2 с двумя гигабайтами GDDR5 памяти, в ближайшем будущем планируется выпуск и модели HD 4850 X2 с двумя гигабайтами менее дорогой GDDR3 памяти.

Архитектура

Итак, переходим к самой скучной части. Ничего нового к ранее написанному добавить мы не можем, чип RV770 остался тем же, и его архитектура была подробно описана нами в соответствующем материале. Поговорим о некоторых особенностях мультичиповой связки. Помните, во времена HD 3870 X2 мы упоминали, что она не обладает поддержкой шины PCI Express 2.0, несмотря на то, что это было одним из основных нововведений в RV670? В той видеокарте для обеспечения работы двух чипов и их связи между собой использовался специальный PCI Express мост PLX PEX 8547, поддерживающий 48 линий PCI-E версии 1.1. И тогда ожидалось, что в будущем AMD интегрирует подобную логику PCI Express моста в следующие модели GPU.

Давайте разберёмся, что сделали в HD 4870 X2. Между двумя GPU так же стоит чип-коммутатор, который связывает между собой графические процессоры. Судя по всему, это чип из так называемого второго поколения PCI Express мостов, произведённый всё той же компанией PLX Technology, которая является одним из ведущих производителей решений с интерфейсом PCI Express для подсистем ввода-ввода и внутренних соединений. Так как ничего похожего по маркировке в линейке компании нет (см. фото в следующей части статьи), возможно, что чип изготовлен специально для AMD. Хотя по характеристикам он очень похож на PEX8647, что подтверждается документацией на сайте компании.

Второе поколение мостов PLX было анонсировано в начале 2008, и оно отличается сравнительно низким временем задержки (140 нс), очень низким энергопотреблением (в среднем порядка 3.8 Вт), решения гибко конфигурируются. Применённый мост обеспечивает три PCI-E порта с поддержкой версии 2.0 и по 16 линий на каждый из них. Для связи с каждым RV770 отводится по 16 линий PCI-E и столько же для передачи данных между системной платой и видеокартой. От чипа PEX8547, используемого в HD 3870 X2, новая модель отличается поддержкой PCI Express 2.0, меньшими размерами корпуса и лучшей экономичностью (старое решение потребляло около 5 Вт).

Рассмотрим схему соединений между чипами и системной платой, представленную компанией AMD. На ней сравниваются HD 3870 X2 и HD 4870 X2:



Сразу привлекают внимание теоретические цифры общей пропускной способности, которые отличаются у разных поколений в три раза: 21,8 ГБ/с против 6,8 ГБ/с (естественно, это суммирование по всем направлениям). Давайте разберёмся, откуда взялась такая разница. Во-первых, в этом «виноват» мост, поддерживающий PCI Express 2.0 вместо 1.1. Это добавило бОльшую часть пропускной способности, удвоив её на всех направлениях. Внешний линк с пропускной способностью 0,9 ГБ/с не изменился, а тот самый секретный sideport, который был упомянутым ещё в ранних диаграммах RV770, оказался дополнительным портом (похожим на 16-канальным PCI-E 2.0, судя по пропускной способности), предназначенным исключительно для связи между чипами, минуя мост-коммутатор и системную плату.

Даст ли это какие-то серьёзные преимущества? Вряд ли. Просто потому, что основная часть ограничений связана не с ПС между чипами, а с особенностями применяемых алгоритмов. Да, обмен данными (те же внеэкранные буферы рендеринга) по идее, должен стать быстрее, но это вряд ли является основным ограничением производительности AFR рендеринга. Было бы интересно сравнить производительность одной HD 4870 X2 и двух HD 4870 (обязательно с 1 ГБ видеопамяти и одинаковых частотах) в CrossFire, чтобы оценить вклад этого межчипового канала. Но AMD в своих документах предпочитает сравнивать скорость новой карты с 512 МБ вариантами HD 4870 в CrossFire, получая приросты за счёт нехватки последними видеопамяти в тяжёлых режимах.

Кроме того, что HD 4870 X2 сама по себе работает как двухчиповая система, возможности технологии ATI CrossFireX позволяют объединять две такие платы в одной системной плате. И по заявлениям компании AMD, в высоких разрешениях с антиалиасингом и анизотропной фильтрацией обеспечивается высокая эффективность мультичипового рендеринга, с приростом до 75-80% от каждого чипа.

Как видите, технические характеристики и теоретические возможности у двухчиповой карты прекрасные. Учитывая мощь одночипового варианта, HD 4870 X2 должна выглядеть в синтетических и игровых тестах великолепно. А теперь — небольшая ложечка дёгтя. Помните, мы писали о том, что AMD отмечает проблемы, присущие крупным high-end чипам (и они явно намекали на GT200 от Nvidia)? Среди них были слишком высокие цена и потребление энергии и большая временная задержка с освоением новых техпроцессов, так как менее сложные чипы проще переводить на более «тонкие» технологии. Если с последним замечанием ещё можно согласиться, хотя это и не является фактом, то на первом остановимся подробнее.

Итак, AMD позиционирует RADEON HD 4870 X2 и HD 4850 X2 в виде конкурентов для Geforce GTX 280. Сравним цены и заявленное компаниями энергопотребление. Для решений AMD это 230/286 Ватт и $399/549, а для GTX 280 — 236 Вт и $499. И где заявленные преимущества? Даже не касаясь цен, так как мы не знаем себестоимости производства (но вряд ли двухчиповая плата будет дешевле одночиповой). Где меньшее энергопотребление у HD 4850 X2 по сравнению с GTX 280? И что изменится при переводе GT200 на 55 нм техпроцесс? Вопросы, полагаем, риторические…

На этом мы заканчиваем теоретическую часть, так как про RV770 и CrossFire мы всю теорию давно знаем, и переходим к следующей части статьи, где нас ждёт практическая часть исследования. В ней мы определим производительность нового решения на основе двух чипов RV770 относительно скорости других решений компании AMD и конкурирующих видеокарт Nvidia.



ATI RADEON HD 4870 Х2 — Часть 2: видеоплаты и синтетические тесты





Дополнительно

iXBT BRAND 2016

«iXBT Brand 2016» — Выбор читателей в номинации «Процессоры (CPU)»:
Подробнее с условиями участия в розыгрыше можно ознакомиться здесь. Текущие результаты опроса доступны тут.

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.