Что такое 1/3 и 1/9 от мощного современного графического процессора,

или ATI RADEON HD 2400XT/2600PRO/2600XT (RV610/630)



Часть 1: Теория и архитектура





Хотя архитектура AMD R6xx была анонсирована ещё в мае, на рынок в то время поступило только решение верхнего ценового диапазона на основе чипа R600, а остальные видеокарты и чипы на базе унифицированной архитектуры R6xx были отложены на какое-то время, о них были известны лишь теоретические данные.

Грустно наблюдать, как где-то после 2005 года компания ATI постепенно начала сдавать свои позиции в конкурентной борьбе с Nvidia. После угасания 3dfx в 2000-2001 годах, наступило время доминирования компании Nvidia, которое было сломлено ярким наступлением видеочипов линейки R3xx и соответствующих видеокарт RADEON 9x00 от компании ATI и рядом ошибок самой Nvidia (достаточно вспомнить неудачную линейку Geforce FX). С тех пор и где-то до 2005 года мы с удовольствием наблюдали за интересной борьбой двух сильных конкурентов, от которой пользователям была только выгода — они получали достойные продукты от двух компаний и вовремя. А вот потом у ATI наступило время застоя, с того времени и до сих пор они довольно сильно опаздывают с выходом своих продуктов на рынок. Что было с решениями на основе линейки чипов R5xx, то же получилось и с R6xx. Это всё неизбежно сказывается на продажах, на рыночной доле компании и на её финансовом благополучии.

Но вот, наконец, настал момент выхода на рынок low-end и mid-end решений с поддержкой DirectX 10 от AMD, с момента их первоначального анонса прошло не слишком много времени. Основным отличием чипов RV630 и RV610 от топового R600 является технология производства 65 нм, которая позволяет снизить себестоимость, весьма важную для недорогих продуктов, и которая, вероятно, как раз и повлияла на сроки вывода соответствующих решений на рынок. Теперь дело за поступлением необходимых объемов новых видеокарт в магазины.

Перед прочтением материала мы традиционно рекомендуем внимательно ознакомиться как со всеми предыдущими статьями по решениям на основе унифицированных архитектур, так и с базовыми теоретическими материалами DX Current, DX Next и Longhorn, описывающими различные аспекты современных аппаратных ускорителей графики и архитектурные особенности продукции Nvidia и ATI(AMD). Эти материалы достаточно точно спрогнозировали текущую ситуацию с архитектурами видеочипов, оправдались многие предположения о будущих решениях.

Графические ускорители RADEON HD 2600 PRO и HD 2600 XT

  • Кодовое имя чипа RV630
  • Технология 65 нм
  • 390 миллионов транзисторов
  • Унифицированная архитектура с массивом общих процессоров для потоковой обработки вершин и пикселей, а также других видов данных
  • Аппаратная поддержка DirectX 10, в том числе и новой шейдерной модели — Shader Model 4.0, генерации геометрии и записи промежуточных данных из шейдеров (stream output)
  • 128-бит шина памяти, два контроллера шириной 64 бита
  • Частота ядра 600-800 МГц
  • 120 скалярных ALU с плавающей точкой (целочисленные и плавающие форматы, поддержка FP32 точности в рамках стандарта IEEE 754)
  • 2 текстурных блока, поддержка FP16 и FP32 компонент в текстурах
  • 16 блоков текстурной адресации (см. подробности в базовой статье)
  • 40 блоков текстурной выборки (см. подробности в базовой статье)
  • 8 блоков билинейной фильтрации с возможностью фильтрации FP16 текстур на полной скорости и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
  • Возможность динамических ветвлений в пиксельных и вершинных шейдерах
  • 4 блока ROP с поддержкой режимов антиалиасинга с возможностью программируемой выборки более чем 16 сэмплов на пиксель, в том числе при FP16 или FP32 формате буфера кадра. Пиковая производительность до 4 отсчетов за такт, в режиме без цвета (Z only) — 8 отсчетов за такт
  • Запись результатов до 8 буферов кадра одновременно (MRT)
  • Интегрированная поддержка двух RAMDAC, двух портов Dual Link DVI, HDMI, HDTV

Спецификации карты RADEON HD 2600 XT

  • Частота ядра 800 МГц
  • Количество универсальных процессоров 120
  • Количество текстурных блоков — 8, блоков блендинга — 4
  • Эффективная частота памяти 1400 МГц (2*700 МГц)/2200 МГц (2*1100 МГц)
  • Тип памяти GDDR3/GDDR4
  • Объем памяти 256 мегабайт
  • Пропускная способность памяти 22.4/35.2 гигабайт в сек.
  • Теоретическая максимальная скорость закраски 3.2 гигапикселя в сек.
  • Теоретическая скорость выборки текстур 6.4 гигатекселя в сек.
  • CrossFire разъем
  • Шина PCI-Express 16х
  • Два DVI-I Dual Link разъема, поддерживается вывод в разрешениях до 2560х1600
  • TV-Out, HDTV-Out, поддержка HDCP, HDMI адаптер
  • Энергопотребление около 45 Вт
  • Рекомендуемая цена $129/$149

Спецификации карты RADEON HD 2600 PRO

  • Частота ядра 600 МГц
  • Количество универсальных процессоров 120
  • Количество текстурных блоков — 8, блоков блендинга — 4
  • Эффективная частота памяти 800 МГц (2*400 МГц)
  • Тип памяти DDR2
  • Объем памяти 256 мегабайт
  • Пропускная способность памяти 12.8 гигабайт в сек.
  • Теоретическая максимальная скорость закраски 2.4 гигапикселя в сек.
  • Теоретическая скорость выборки текстур 4.8 гигатекселя в сек.
  • CrossFire разъем
  • Шина PCI-Express 16х
  • Два DVI-I Dual Link разъема, поддерживается вывод в разрешениях до 2560х1600
  • TV-Out, HDTV-Out, поддержка HDCP, HDMI адаптер
  • Энергопотребление менее 45 Вт
  • Рекомендуемая цена $99

Графические ускорители RADEON HD 2400 PRO и HD 2400 XT

  • Кодовое имя чипа RV610
  • Технология 65 нм
  • 180 миллионов транзисторов
  • Унифицированная архитектура с массивом общих процессоров для потоковой обработки вершин и пикселей, а также других видов данных
  • Аппаратная поддержка DirectX 10, в том числе и новой шейдерной модели — Shader Model 4.0, генерации геометрии и записи промежуточных данных из шейдеров (stream output)
  • 64-бит шина памяти, один контроллер шириной 64 бита
  • Частота ядра 525-700 МГц
  • 40 скалярных ALU с плавающей точкой (целочисленные и плавающие форматы, поддержка FP32 точности в рамках стандарта IEEE 754)
  • 1 текстурный блок, поддержка FP16 и FP32 компонент в текстурах
  • 8 блоков текстурной адресации (см. подробности в базовой статье)
  • 20 блоков текстурной выборки (см. подробности в базовой статье)
  • 4 блока билинейной фильтрации с возможностью фильтрации FP16 текстур на полной скорости и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
  • Возможность динамических ветвлений в пиксельных и вершинных шейдерах
  • 4 блока ROP с поддержкой режимов антиалиасинга с возможностью программируемой выборки более чем 16 сэмплов на пиксель, в том числе при FP16 или FP32 формате буфера кадра. Пиковая производительность до 4 отсчетов за такт, в режиме без цвета (Z only) — 8 отсчетов за такт
  • Запись результатов до 8 буферов кадра одновременно (MRT)
  • Интегрированная поддержка двух RAMDAC, двух портов Dual Link DVI, HDMI, HDTV

Спецификации карты RADEON HD 2400 XT

  • Частота ядра 700 МГц
  • Количество универсальных процессоров 40
  • Количество текстурных блоков — 4, блоков блендинга — 4
  • Эффективная частота памяти 1600 МГц (2*800 МГц)
  • Тип памяти DDR2/GDDR3
  • Объем памяти 256 мегабайт
  • Пропускная способность памяти 12.8 гигабайт в сек.
  • Теоретическая максимальная скорость закраски 2.8 гигапикселя в сек.
  • Теоретическая скорость выборки текстур 2.8 гигатекселя в сек.
  • Шина PCI-Express 16х
  • Один DVI-I Dual Link разъем, поддерживается вывод в разрешениях до 2560х1600
  • TV-Out, HDTV-Out, поддержка HDCP, HDMI адаптер
  • Энергопотребление около 25 Вт
  • Рекомендуемая цена $79

Спецификации карты RADEON HD 2400 PRO

  • Частота ядра 525 МГц
  • Количество универсальных процессоров 40
  • Количество текстурных блоков — 4, блоков блендинга — 4
  • Эффективная частота памяти 800 МГц (2*400 МГц)
  • Тип памяти DDR2
  • Объем памяти 128/256 мегабайт
  • Пропускная способность памяти 6.4 гигабайт в сек.
  • Теоретическая максимальная скорость закраски 2.1 гигапикселя в сек.
  • Теоретическая скорость выборки текстур 2.1 гигатекселя в сек.
  • Шина PCI-Express 16х
  • Один DVI-I Dual Link разъем, поддерживается вывод в разрешениях до 2560х1600
  • TV-Out, HDTV-Out, поддержка HDCP, HDMI адаптер
  • Энергопотребление менее 25 Вт
  • Рекомендуемая цена $59

Некоторые из особенностей всех решений линейки: унифицированная суперскалярная архитектура, программируемый аппаратный тесселятор, улучшенная поддержка декодирования видео — Avivo HD, «родная» поддержка CrossFire. Архитектура новых чипов унифицированная, все они обладают полноценной поддержкой DirectX 10 и даже больше — некоторых возможностей, которые появятся в следующих версиях этого API.

Уже после анонса топового решения R600 стала известна одна интересная подробность — оказалось, что не все новые решения компании AMD являются функционально идентичными в плане аппаратной поддержки декодирования видеоданных, как это было заявлено при анонсе изначально. Точно как и у Nvidia, low-end и mid-end чипы линейки AMD обладают большими возможностями по декодированию видео, так как в чипе R600 то ли вообще нет того самого улучшенного блока по обработке видео (UVD), то ли он есть, но работает с ошибками… В любом случае, исследование производительности и качества декодирования видео новыми решениями компании выходит за рамки этого материала, но мы обязательно рассмотрим возможности новых чипов, добавив их результаты в последнее исследование по теме.

Итак, AMD первой выходит на рынок графических решений среднего и нижнего уровней, чипы которых выполнены по 65 нм технологическим нормам. Как мы уже не раз говорили, такие переходы важны, так как более совершенные технологические процессы дают преимущества, позволяя добиться меньшего размера ядра или большего количества транзисторов при той же площади, увеличивая частотный потенциал чипов и процент выхода годных на высоких тактовых частотах, а также снижая себестоимость производства. Ещё одним важнейшим преимуществом является сниженное энергопотребление, новые mid-end и low-end чипы AMD потребляют значительно меньше энергии и выделяют меньше тепла, по сравнению с конкурирующими.

Архитектура

В прошлой статье, посвященной анонсу архитектуры R6xx и выходу RADEON HD 2900 XT, мы подробно рассказали обо всех архитектурных особенностях новой линейки DirectX 10 видеочипов компании AMD, в этом материале будет лишь их краткое описание, за остальными данными обращайтесь по указанной выше ссылке.

Архитектура R6xx сочетает в себе некоторые решения из предыдущих: R5xx и Xenos (видеочипа консоли Microsoft Xbox 360), дополняя их различными нововведениями: более мощным диспетчером потоков, суперскалярной архитектурой шейдерных процессоров с выделенными блоками ветвления и т.п. Новая архитектура хорошо масштабируется в обе стороны, что мы и видим на примере low-end и mid-end решений. Схемы чипов RV630 и RV610 выглядят так:



Хорошо видно, что RV630 отличается от R600 только количеством разнообразных блоков: ALU, ROP, TMU, во всем остальном повторяя старшего брата. У RV610 отличий больше, они не только количественные (блоков ALU и TMU стало еще меньше), но и качественные: нет иерархического Z-буфера, нет второго уровня текстурного кэша, а единственный уровень совмещает кэширование вершинных и пиксельных данных. Основные количественные изменения: число шейдерных процессоров в RV630 снижено до 24 (120 процессоров) а в RV610 до 8 (40 процессоров), число блоков текстурирования до 8 и 4, соответственно, а блоков ROP у младших чипов по четыре. Естественно, всё это сделано в угоду меньшему числу транзисторов и негативно скажется на производительности относительно топового решения линейки.

Обо всех остальных архитектурных подробностях решений R6xx вы можете узнать из базового материала, ссылка на который приведена выше. Естественно, у младших чипов нет поддержки 512-битной шины, но всё остальное, написанное в том материале, относится и к ним полностью. Даже более того, написанное про Avivo HD относится как раз к ним, а не к топовому решению.

Далее у нас будет практическая часть исследования, в которой мы узнаем, как производительность новых недорогих решений на базе видеочипов RV630 и RV610 соотносится со скоростью конкурирующих видеокарт Nvidia, а также проверим, насколько сильно их «урезание» сказалось на скорости относительно топового чипа семейства — R600.



ATI RADEON HD 2400 XT (RV610), 2600 PRO, 2600 XT (RV630) — Часть 2: Особенности видеокарт и синтетические тесты





Дополнительно

iXBT BRAND 2016

«iXBT Brand 2016» — Выбор читателей в номинации «Процессоры (CPU)»:
Подробнее с условиями участия в розыгрыше можно ознакомиться здесь. Текущие результаты опроса доступны тут.

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.