ATI RADEON HD 4670 512MB PCI-E (RV730)

Почти половина от 4870 плюс 128bit шина, что получится? –
Новый супершустряк в 3D-графике, если в кармане мало денег.



СОДЕРЖАНИЕ

  1. Часть 1 — Теория и архитектура
  2. Часть 2 — Практическое знакомство
  3. Особенности видеокарт
  4. Конфигурация стенда, список тестовых инструментов
  5. Результаты синтетических тестов
  6. Результаты игровых тестов (производительность)


Часть 1: Теория и архитектура



Давненько у нас не было базовых обзоров low-end решений с рекомендуемой ценой менее $100… Длительное время low-end видеокарты считаются плохо подходящими для современных игр, так как зачастую они не обеспечивают приемлемой производительности в игровых приложениях даже не на максимальных настройках качества. Но время идёт, и всё меняется. Конкурентная борьба чуть раньше сделала возможным выпуск мощных решений нижнего среднего ценового диапазона (например, Radeon HD 3850 и Geforce 9600 GT), а теперь, похоже, пришло время и для нижнего ценового сектора.

Важно понимать, что не только постепенное увеличение производительности видеокарт всех ценовых диапазонов даёт такой эффект. Это — естественный процесс развития индустрии. Весьма сильное влияние на игровые проекты сейчас оказывают консоли, и большинство выходящих игр являются мультиплатформенными, они проектируются одновременно и для персональных компьютеров, и для двух основных игровых консолей текущего поколения: Microsoft Xbox 360 и Sony PlayStation 3.

Естественно, мощности и ресурсы консолей ограничены единственной конфигурацией, по сравнению с персональными компьютерами, и уже через пару лет после их выпуска, по 3D-производительности они начинают отставать даже от сравнительно недорогих ПК конфигураций. И выходящие для компьютеров видеокарты даже из нижнего ценового диапазона вполне способны обеспечить ту необходимую мощность, которая требуется мультиплатформенными играми. Большая производительность дорогих 3D-видеокарт часто расходуется на сверхвысокие разрешения, большие уровни сглаживания и лучшую текстурную фильтрацию. И редкие эксклюзивные для ПК проекты, вроде Crysis и S.T.A.L.K.E.R.: Clear Sky.

Сегодня мы рассматриваем новые решения для нижнего ценового диапазона от компании AMD, которые вполне могут стать теми low-end видеокартами, способными на вполне приемлемую игровую производительность в большинстве проектов за относительно небольшие деньги. Все представляемые сегодня решения и видеочипы основаны на архитектуре RV7xx, на которой базируются и весьма удачные решения серии RADEON HD 4800, получившие очень хорошие оценки в обзорах и у пользователей. Пока что в практической части нашей статьи будет только самый быстрый вариант на основе чипа RV730, но мы приведём и характеристики менее производительных видеокарт.

Перед прочтением данного материала мы рекомендуем внимательно ознакомиться с базовыми теоретическими материалами DX Current, DX Next и Longhorn, описывающими различные аспекты современных аппаратных ускорителей графики и архитектурные особенности предыдущей продукции Nvidia и AMD.

Эти материалы достаточно точно спрогнозировали текущую ситуацию с архитектурами видеочипов, оправдались многие предположения о будущих решениях. Подробную информацию об унифицированных архитектурах AMD R6xx, RV6xx и RV7xx на примере предыдущих решений, можно найти в следующих статьях:

Итак, давайте рассмотрим подробные характеристики новых видеоплат серий RADEON HD 4600 и 4500, основанных на новых чипах RV730 и RV710.

Графические ускорители серии RADEON HD 4600

  • кодовое имя чипа RV730;
  • технология 55 нм;
  • 514 миллионов транзисторов;
  • унифицированная архитектура с массивом общих процессоров для потоковой обработки вершин и пикселей, а также других видов данных;
  • аппаратная поддержка DirectX 10.1, в том числе и новой шейдерной модели — Shader Model 4.1, генерации геометрии и записи промежуточных данных из шейдеров (stream output);
  • 128-битная шина памяти: два контроллера шириной по 64 бита с поддержкой памяти DDR2/DDR3/GDDR2/GDDR3;
  • частота ядра 600-750 МГц;
  • 8 SIMD ядер, включающих 320 скалярных ALU для расчётов с плавающей точкой (целочисленные и плавающие форматы, поддержка FP32 и FP64 точности в рамках стандарта IEEE 754);
  • 8 укрупненных текстурных блоков, с поддержкой FP16 и FP32 форматов;
  • 32 блока текстурной адресации;
  • 128 блоков текстурной выборки;
  • 32 блока билинейной фильтрации с возможностью фильтрации FP16 текстур на полной скорости и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов;
  • возможность динамических ветвлений в пиксельных и вершинных шейдерах;
  • 8 блоков ROP с поддержкой режимов антиалиасинга с возможностью программируемой выборки более чем 16 сэмплов на пиксель, в том числе при FP16 или FP32 формате буфера кадра. Пиковая производительность до 8 отсчетов за такт (в т.ч. и для режимов MSAA 2x/4x, в том числе для буферов формата FP16), в режиме без цвета (Z only) — 32 отсчета за такт;
  • запись результатов до 8 буферов кадра одновременно (MRT);
  • интегрированная поддержка двух RAMDAC, двух портов Dual Link DVI, HDMI, HDTV, DisplayPort.

Спецификации карты RADEON HD 4670

  • частота ядра 750 МГц;
  • количество универсальных процессоров 320;
  • количество текстурных блоков — 32, блоков блендинга — 8;
  • эффективная частота памяти 2000 МГц (2*1000 МГц)/1800 МГц (2*900 МГц);
  • тип памяти GDDR3/DDR3;
  • объем памяти 512 МБ/1 ГБ;
  • пропускная способность памяти 32,0/28,8 ГБ/с;
  • теоретическая максимальная скорость закраски 6,0 гигапикселей в с;
  • теоретическая скорость выборки текстур 24,0 гигатекселей в с;
  • два CrossFireX разъема;
  • шина PCI Express 2.0 x16;
  • два DVI-I Dual Link разъема, поддерживается вывод в разрешениях до 2560х1600;
  • TV-Out, HDTV-Out, поддержка HDCP, HDMI, DisplayPort;
  • энергопотребление менее 75 Вт (без дополнительных разъёмов);
  • однослотовый дизайн;
  • рекомендуемая цена $79.

Спецификации карты RADEON HD 4650

  • частота ядра 600 МГц;
  • количество универсальных процессоров 320;
  • количество текстурных блоков — 32, блоков блендинга — 8;
  • эффективная частота памяти 1000 МГц (2*500 МГц);
  • тип памяти DDR2;
  • объем памяти 512 МБ;
  • пропускная способность памяти 16.0 ГБ/с;
  • теоретическая максимальная скорость закраски 4,8 гигапикселей в с;
  • теоретическая скорость выборки текстур 19,2 гигатекселей в с;
  • два CrossFireX разъема;
  • шина PCI Express 2.0 x16;
  • два DVI-I Dual Link разъема, поддерживается вывод в разрешениях до 2560х1600;
  • TV-Out, HDTV-Out, поддержка HDCP, HDMI, DisplayPort;
  • энергопотребление менее 60 Вт (без дополнительных разъёмов);
  • однослотовый дизайн;
  • рекомендуемая цена $69.

Графические ускорители серии RADEON HD 4500

  • кодовое имя чипа RV710;
  • технология 55 нм;
  • 242 миллиона транзисторов;
  • унифицированная архитектура с массивом общих процессоров для потоковой обработки вершин и пикселей, а также других видов данных;
  • аппаратная поддержка DirectX 10.1, в том числе и новой шейдерной модели — Shader Model 4.1, генерации геометрии и записи промежуточных данных из шейдеров (stream output);
  • 64-битная шина памяти: один контроллер шириной 64 бита с поддержкой памяти DDR2/DDR3/GDDR2/GDDR3;
  • частота ядра 600 МГц;
  • 2 SIMD ядра, включающих 80 скалярных ALU для расчётов с плавающей точкой (целочисленные и плавающие форматы, поддержка FP32 и FP64 точности в рамках стандарта IEEE 754);
  • 2 укрупненных текстурных блока, с поддержкой FP16 и FP32 форматов;
  • 8 блоков текстурной адресации;
  • 32 блоков текстурной выборки;
  • 8 блока билинейной фильтрации с возможностью фильтрации FP16 текстур на полной скорости и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов;
  • возможность динамических ветвлений в пиксельных и вершинных шейдерах;
  • 4 блока ROP с поддержкой режимов антиалиасинга с возможностью программируемой выборки более чем 16 сэмплов на пиксель, в том числе при FP16 или FP32 формате буфера кадра. Пиковая производительность до 4 отсчетов за такт (в том числе и для режимов MSAA 2x/4x, в том числе для буферов формата FP16), в режиме без цвета (Z only) — 16 отсчетов за такт;
  • запись результатов до 8 буферов кадра одновременно (MRT);
  • интегрированная поддержка двух RAMDAC, двух портов Dual Link DVI, HDMI, HDTV, DisplayPort.

Спецификации карты RADEON HD 4550

  • частота ядра 600 МГц;
  • количество универсальных процессоров 80;
  • количество текстурных блоков — 8, блоков блендинга — 4;
  • эффективная частота памяти 1600 МГц (2*800 МГц);
  • тип памяти DDR3;
  • объем памяти 256/512 МБ;
  • пропускная способность памяти 14,4 ГБ/с;
  • теоретическая максимальная скорость закраски 2,4 гигапикселей в с;
  • теоретическая скорость выборки текстур 4,8 гигатекселей в с;
  • шина PCI Express 2.0 x16;
  • два DVI-I Dual Link разъема, поддерживается вывод в разрешениях до 2560х1600;
  • TV-Out, HDTV-Out, поддержка HDCP, HDMI, DisplayPort;
  • энергопотребление менее 25 Вт (без дополнительных разъёмов);
  • однослотовый дизайн, пассивное охлаждение;
  • рекомендуемая цена $29-35.

Компания AMD продолжает выпуск графических решений по 55 нм технологическим нормам, теперь пришло время и для low-end чипов семейства RV7xx. По сравнению с до сих пор широко используемой Nvidia технологией 65 нм, этот более совершенный технологический процесс даёт следующие преимущества: меньшую площадь ядра, увеличенный частотный потенциал и процент выхода годных чипов на требуемых тактовых частотах. Всё это влечёт за собой и меньшую себестоимость. Как и предыдущие решения на RV770, новые чипы весьма эффективны энергетически и с точки зрения производительности на площадь чипов.

Маркировка решений осталась в стиле предыдущей серии HD 3000, поменялась только первая цифра. Позиционирование HD 4650 совпадает с положением HD 3650 во время их выпуска, а новые решения HD 4670 и HD 4550 будут занимать промежуточные положения в линейке. Так как чипы RV730 и RV710 создавались для замены предыдущих семейств AMD, серия HD 3000 будет постепенно вытесняться ими в продаже.

Варианты HD 4670 и 4650, как обычно у AMD, отличаются тактовыми частотами, и видеочипа и памяти. Но это не единственное отличие между моделями карт — на старшей установлена память типа GDDR3 или новая DDR3 большего объёма, а на младшей — DDR2. Из других отличий старшего варианта — большее энергопотребление и лишь чуть-чуть меньшая рекомендованная цена. Впрочем, посмотрим ещё на реальные розничные цены…

Объём видеопамяти у low-end карт всегда очень сильно зависит от её типа. В случае недорогой DDR2 и DDR3 памяти, обычно её ставят больше. У HD 4600 минимальным объёмом является 512 МБ, что очень хорошо, так как современные игры очень требовательны к объёму видеопамяти и используют обычно 500-600 МБ, а в редких случаях и более. Объём памяти в 512 МБ на данный момент является оптимальным количеством памяти для видеокарт нижнего и среднего уровня. И лишь самая дешёвая модель HD 4550 предлагает, в том числе, и вариант с 256 МБ DDR3 памяти, для карты такого уровня это решение оправдано.

Архитектура чипов RV730 и RV710

По сути, всю теорию о новой архитектуре AMD можно получить из нашей базовой статьи по RV770. GPU для решений нижних ценовых диапазонов, которые мы сегодня рассматриваем, отличаются от RV770 лишь количественно (впрочем, небольшие нюансы есть и здесь). Текущая архитектура хорошо масштабируется в обе стороны, что мы и видим сейчас на примере low-end решений. Схемы чипов RV730 и RV710 выглядят так:





По схеме видно, что RV730 отличается от RV760 количеством разнообразных исполнительных блоков: ALU, ROP, TMU, во всем остальном повторяя старшее решение. У RV710 отличий несколько больше, они не только количественные (блоков ALU, ROP и TMU ещё меньше), но есть и одно качественное — кэш первого уровня совмещает кэширование вершинных и пиксельных данных, в отличие от раздельных у старших решений. Основные количественные изменения: число шейдерных процессоров в RV730 снижено до 64 (320 ALU) а в RV710 до 16 (80 ALU), число блоков текстурирования до 32 и 8, соответственно. Но в этот раз блоков ROP у младших чипов разное количество — 8 и 4 для RV730 и RV710, соответственно. Кстати, из других отличий RV730/RV710 от RV770 — разное количество как SIMD ядер, так и количества потоковых процессоров внутри каждого ядра (восемь ALU вместо шестнадцати).

Естественно, все эти изменения сделаны для снижения количества транзисторов и площади чипов, что понятным образом скажется на производительности относительно быстрейшего GPU линейки. Обо всех остальных архитектурных особенностях RV7xx вы можете узнать из базового материала, ссылка на который приведена выше. Также, у младших чипов вместо 256-битной шины сделана поддержка 128-битной и 64-битной для RV730 и RV710, соответственно, а всё остальное, написанное в основном материале, относится и к ним тоже.

Наиболее важное изменение новых GPU заключается в том, что в отличие от RV770, соотношение между количеством блоков TMU и ALU здесь иное. Хотя каждое SIMD ядро имеет по четыре выделенных текстурных модуля, число ALU внутри SIMD отличается, и соотношение между ALU и TMU теперь стало не 4:1, а 2:1. То есть, число текстурных модулей в RV730, по сравнению с RV770, снизилось незначительно (с 40 до 32), а число ALU сильнее — с 800 до 320. Получается, что в AMD сделали ещё один шаг в обратную от архитектуры R6xx и RV6xx сторону. И хотя каждый из 32 и 8 блоков текстурирования в RV730 и RV710 несколько слабее, чем в RV6xx, их увеличенное количество и эффективность должны дать прирост скорости текстурных выборок.

Поговорим немного о применении нового для видеокарт типа памяти на решениях серий HD 4600 и HD 4500. Для так называемых mainstream-видеокарт компанией AMD впервые использованы микросхемы памяти DDR3 (не путать с GDDR3!). Несмотря на то, что она обеспечивает ту же производительность, что и GDDR3 (на равных частотах, естественно), предполагается, что в ближайшем будущем стоимость DDR3-памяти сравняется со стоимостью микросхем DDR2, которые сейчас крайне дёшевы. Соответственно, за счёт этого у производителей видеокарт будет возможность комплектации видеокарт большими объемами сравнительно быстрой видеопамяти.

DirectX 10.1

Уже в который раз компания AMD упирает на поддержку всеми видеокартами серий HD 4000 (а также и HD 3000) обновленной версии основного графического API от Microsoft — DirectX 10.1. Эта версия расширяет некоторые ограничения предыдущей, и упрощает использование некоторых техник и алгоритмов. Следует упомянуть и улучшенные возможности сглаживания, позволяющие повысить качество изображения в некоторых случаях. Но основным преимуществом этой версии API в ближайшем будущем станет увеличение производительности некоторых алгоритмов за счёт снижения количества необходимых проходов рендеринга. И, скорее всего, первые DirectX 10.1 игры будут отличаться в основном этим, а не какими-то видимыми качественными улучшениями. Подробнее о возможностях этого API вы можете прочитать в базовом обзоре RV670.

Первыми играми с поддержкой DirectX 10.1 предполагаются проекты от Electronic Arts и Phenomic Studio, SEGA и NHN Games. Это онлайновая RTS Battleforge, футуристическая RTS Stormrise, и RPG под названием Cloud 9. Заявлено, что все эти проекты используют возможности DirectX 10.1 для увеличения производительности рендеринга и качества картинки. Сроки выхода данных игр пока не называются — вероятнее всего, проекты выйдут уже в 2009 году.



Технология ATI Avivo

Как и в старший чип серии, в RV730 и RV710 встроен модуль обработки видеоданных Unified Video Decoder второго поколения (UVD 2). Он появился в решениях серии Radeon HD 3000 и позднее был без существенных изменений перенесен в HD 4000. UVD2 аппаратно декодирует видеоданные во всех наиболее распространённых форматах: H.264, VC-1 и MPEG-2. В новых решениях серии HD 4000 видеопроцессор был модифицирован для поддержки одновременного декодирования двух полноформатных (1080p) потоков видео для обеспечения возможностей, которые иногда встречаются на дисках Blu-ray. Также добавились улучшенные возможности по постобработке видео, такие как масштабирование DVD-видео до HD-разрешений, а также динамическая регулировка контрастности.

Улучшенное масштабирование

Технология ATI Avivo в серии Radeon HD 4000 включает в себя высококачественное масштабирование видеоданных из низкого разрешения (например, DVD) в более высокие HD (720p, 1080p). Таким образом, стандартные DVD с разрешением 720x480 или 720x576 при выводе на HD устройства вывода с разрешением 1920x1080 или 1920x1200 с ATI Avivo HD масштабированием обеспечат лучшее качество, чем с обычно применяемым программным масштабированием плееров. Вот пример, который приводит в презентациях компания AMD:



В целом, хорошо видно, что чёткость на левой части картинки выше, чем на правой, как по вертикали, так и по горизонтали. В будущих исследованиях скорости и качества декодирования видео при помощи GPU, мы постараемся рассмотреть этот вопрос более подробно.

Динамическая регулировка контрастности

Контрастность сильно влияет на восприятие визуальных данных. Изображения с низкой контрастностью обычно выглядят тусклыми и менее чёткими, когда мелкие детали в некоторых участках изображения плохо различимы. И хотя большинство плееров позволяют подстраивать контрастность, эти настройки не меняются от сцены к сцене, хотя оптимальные настройки контрастности для разных сцен будут разными.

В ATI Avivo HD есть возможность динамического изменения контрастности видеопотока. При помощи специальных алгоритмов постобработки, контрастность изображения автоматически подстраивается, постоянно адаптируясь к изменению параметров изображения. Это обеспечивает улучшенное восприятие видео человеком, в результате, давая большее количество деталей и чёткость (слева — фрагмент картинки с включенной обработкой):

Управление питанием PowerPlay

Новыми чипами поддерживается второе поколение технологии ATI PowerPlay. Эта технология динамического управления питанием получила дальнейшие усовершенствования, её суть в том, что специальная управляющая схема в чипе отслеживает загрузку работой и определяет оптимальный рабочий режим, управляя рабочей частотой чипа, памяти, напряжением питания и другими параметрами, оптимизируя энергопотребление и тепловыделение.

В режиме низкой нагрузки при выводе 2D-картинки и невысокой загрузке GPU, его напряжение и частоты будут максимально снижены, как и частота вращения вентилятора, в режиме средней 3D-нагрузки все параметры установятся на средние значения, а при максимальной работе видеочипа частоты с напряжением будут выставлены максимальными. Таким образом, за счёт обновленной технологии управления питанием была значительно увеличена энергетическая эффективность чипов серии RV7xx, по сравнению с предыдущим поколением видеокарт.

Итак, мы познакомились с теоретическими особенностями новых low-end чипов на основе архитектуры RV7xx, в следующей части статьи вас ждёт практическая часть исследования, в которой мы узнаем, как производительность новых решений на их основе соотносится со скоростью предыдущих решений компании AMD и конкурирующих видеокарт Nvidia в нашем обычном наборе синтетических тестов.



ATI RADEON HD 4670 — Часть 2: видеоплаты и синтетические тесты





Дополнительно

iXBT BRAND 2016

«iXBT Brand 2016» — Выбор читателей в номинации «Процессоры (CPU)»:
Подробнее с условиями участия в розыгрыше можно ознакомиться здесь. Текущие результаты опроса доступны тут.

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.