ATI RADEON HD 5770 и 5750 1024MB PCI-E

DirectX 11 в средний и нижний ценовые сектора!



СОДЕРЖАНИЕ

  1. Часть 1 — Теория и архитектура
  2. Часть 2 — Практическое знакомство
  3. Особенности видеокарт
  4. Конфигурация стенда, список тестовых инструментов
  5. Результаты синтетических тестов
  6. Результаты игровых тестов (производительность)


Совсем недавно мы изучили новый очень серьезный продукт AMD в области трехмерной графики игрового класса - RADEON HD 5870. Это, если можно так сказать, «игрушка» для взрослых, для весьма обеспеченных пользователй. Но, как известно, кроме настоящих автомобилей, имеются игрушечные (или модельные). Вот сегодня мы изучим такого же плана «игрушечный» ускоритель HD 5770 и его еще более «игрушечного» собрата - 5750. У них и цена меньше, ну и дают они меньшую, чем у 5870 производительность. А вот в плане функциональности - эти «игрушки» полностью оснащены всеми функциями, что имеют 5870-карты, в отличие от игрушечных автомобилей, которые только внешне копируют своих собратьев (в меньшем масштабе).

Короче говоря, 5770 и 5750 - это обрезанные в плане производительности трехмерные ускорители такого же нового поколения, что и 5870. А вот детали покажем ниже.

Часть 1: Теория и архитектура



Совершенно логично, что после выхода новых решений из старшей линейки HD 5800, следующим шагом компании AMD стал выпуск видеокарт среднего ценового диапазона. Анонс моделей HD 5750 и HD 5770 не стал неожиданным ни для кого, тем более что AMD заранее предоставила примерный график выхода будущих решений.

Особого смысла в том, чтобы слишком торопиться с этим обзором, у нас не было, ведь новую архитектуру мы подробно рассмотрели ранее, а в магазинах видеокарты линейки HD 5700 стали появляться не так давно. Напомним, что на данный момент видеоплаты серии HD 5800, предназначенные для верхнего ценового диапазона, стоят немало, что объясняется как отсутствием новых видеокарт от соперника, так и некоторым дефицитом этих решений на рынке.

Дефицит лишь частично объясняется высоким спросом на действительно весьма конкурентоспособные видеокарты RADEON HD 5800, но в нём виноваты и проблемы с производством. Фабрики TSMC просто не в состоянии выпускать сейчас столько годной продукции по 40 нм техпроцессу, сколько требуется рынку. Но постепенно ситуация должна улучшиться, там и Nvidia выпустит свои карты, вот тогда и AMD, вероятно, сможет снизить цены на все свои текущие решения.

Ну а мы сегодня рассмотрим семейство видеокарт HD 5700. Которое и по техническим характеристикам, и по цене (как минимум — пока что) соответствует решениям предыдущей топовой линейки HD 4800. Это немудрено, так как предыдущий топовый чип компании AMD был предназначен для решений среднего ценового сегмента, а нынешний наиболее производительный чип Cypress стал несколько больше по площади и требовательнее к питанию. Ну и понятно, что линейка HD 5700 не должна была более чем вдвое отставать по теоретической производительности от топового GPU.

Выпуск настолько мощных решений, заменяющих предыдущие топовые, стал возможен благодаря длительному и мучительному освоению 40 нм технологического процесса на фабриках TSMC. Мучения эти начались с RV740, который уже перестал выпускаться, и продолжились RV870. Теперь пришло время для RV840. В целом, чип повторяет архитектуру RV870 «Cypress», которую мы подробно рассмотрели в предыдущем материале. Подробную информацию обо всех предыдущих унифицированных архитектурах можно найти в следующих статьях на нашем сайте:

Будем считать, что с предыдущими архитектурами AMD читатели уже знакомы, и рассмотрим подробные характеристики двух недавно анонсированных видеоплат серии RADEON HD 5700, основанных на новом чипе с кодовым названием «Juniper», также известном как RV840.

Графические ускорители серии RADEON HD 5700

  • Кодовое имя чипа RV840 «Juniper»
  • Технология 40 нм
  • 1.04 млрд. транзисторов (примерно вдвое меньше, чем у RV870)
  • Унифицированная архитектура с массивом общих процессоров для потоковой обработки многочисленных видов данных: вершин, пикселей и др.
  • Аппаратная поддержка DirectX 11, в том числе и новой шейдерной модели — Shader Model 5.0
  • 128-битная шина памяти: два контроллера шириной по 64 бита с поддержкой GDDR5 памяти
  • Частота ядра 700-850 МГц
  • 10 SIMD ядер, включающих 800 скалярных ALU для расчётов с плавающей точкой (целочисленные и плавающие форматы, поддержка FP32 точности в рамках стандарта IEEE 754, поддержка FP64 вычислений отсутствует)
  • 10 укрупненных текстурных блоков, с поддержкой FP16 и FP32 форматов
  • 40 блоков текстурной адресации и столько же блоков билинейной фильтрации, с возможностью фильтрации FP16 текстур на полной скорости и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
  • 16 блоков ROP с поддержкой режимов антиалиасинга с возможностью программируемой выборки более чем 16 сэмплов на пиксель, в том числе при FP16 или FP32 формате буфера кадра. Пиковая производительность до 16 отсчетов за такт (в т.ч. для буферов формата FP16), в режиме без цвета (Z only) — 64 отсчета за такт
  • Запись результатов до 8 буферов кадра одновременно (MRT)
  • Интегрированная поддержка RAMDAC, шести портов Single Link или трёх портов Dual Link DVI, а также HDMI и DisplayPort

Спецификации карты RADEON HD 5770

  • Частота ядра 850 МГц
  • Количество универсальных процессоров 800
  • Количество текстурных блоков — 40, блоков блендинга — 16
  • Эффективная частота памяти 4800 МГц (4*1200 МГц)
  • Тип памяти GDDR5
  • Объем памяти 1024 мегабайта
  • Пропускная способность памяти 76.8 гигабайт в сек.
  • Теоретическая максимальная скорость закраски 13.6 гигапикселей в сек.
  • Теоретическая скорость выборки текстур 34.0 гигатекселей в сек.
  • Два CrossFireX разъема
  • Шина PCI Express 2.1
  • Разъёмы: DVI-I Dual Link, HDMI, DisplayPort
  • Энергопотребление от 18 до 108 Вт (один 6-штырьковый разъём питания)
  • Двухслотовый дизайн
  • Рекомендуемая цена $159

Спецификации карты RADEON HD 5750

  • Частота ядра 700 МГц
  • Количество универсальных процессоров 720
  • Количество текстурных блоков — 36, блоков блендинга — 16
  • Эффективная частота памяти 4600 МГц (4*1150 МГц)
  • Тип памяти GDDR5
  • Объем памяти 512/1024 мегабайт
  • Пропускная способность памяти 73.6 гигабайт в сек.
  • Теоретическая максимальная скорость закраски 11.2 гигапикселей в сек.
  • Теоретическая скорость выборки текстур 25.2 гигатекселя в сек.
  • Два CrossFireX разъема
  • Шина PCI Express 2.1
  • Разъёмы: DVI-I Dual Link, HDMI, DisplayPort
  • Энергопотребление от 16 до 86 Вт (один 6-штырьковый разъём питания)
  • Двухслотовый дизайн
  • Рекомендуемая цена $109/$129

Применение наиболее совершенного (хотя и до сих пор сложного с точки зрения выхода годных чипов) на сегодня для GPU техпроцесса 40 нм позволило компании AMD выпустить решения среднего уровня, которые примерно соответствуют по производительности предыдущему топовому HD 4870. Сложность у чипов похожая, зато площадь ядра заметно уменьшилась. Почти все характеристики остались на том же уровне, по сравнению с решениями на RV770 (кроме пропускной способности памяти, разве что). Естественно, что новый чип более эффективен энергетически, и новые карты потребляют относительно немного энергии.

Принцип наименования моделей тот же, что и раньше. По сравнению с предыдущей серией среднего диапазона поменялась первая цифра. RADEON HD 5770 и HD 5750 предназначены для смены HD 4870 и HD 4850. И не совсем удачной HD 4770, которая стала экспериментальной по освоению 40 нм техпроцесса. При этом пока остаются проблемы с производством чипов по новому техпроцессу, некоторые из карт предыдущего поколения остаются в продаже, смещаясь в нижние ценовые диапазоны.

Два варианта серии, что привычно для видеокарт AMD, отличаются тактовыми частотами видеочипа и памяти. В данном случае у младшего продукта отключена ещё и часть исполнительных блоков. Так и разница в производительности будет больше, да и брак нужно куда-то девать. Но и это ещё не всё. Хотя на оба варианта устанавливают память типа GDDR5 (чтобы не было ограничения производительности полосой пропускания), у младшего варианта есть две модификации, отличающиеся объёмом видеопамяти: 512 мегабайт и 1 гигабайт.

Один гигабайт локальной памяти для карт уровня HD 5750 нужен не всегда, да и это не позволяет снизить цену, чтобы она приблизилась к $100. И хотя современные игры требовательны к объёму набортной памяти, и объём памяти в 1024 мегабайт является оптимальным количеством для большинства игр, а 512 мегабайт — не всегда достаточно для некоторых приложений, для HD 5750 это логичное и правильное решение. Тем более что никто не отменяет и более дорогой вариант.

Ещё младшее решение отличается иным дизайном платы, а также референсные кулеры у них совершенно не похожие. Если в случае HD 5770 используется аналогичный с применяемым на HD 5850 и 5870 дизайн системы охлаждения, то на HD 5750 поставили упрощённый кулер. Впрочем, он всё равно двухслотовый, да и энергопотребление карты хоть и ниже, но не так уж значительно.

Архитектура RV840 «Juniper»

Обновленную архитектуру RV8xx под названием TeraScale 2 мы уже рассматривали в предыдущей базовой статье. Отличия младшего чипа Juniper от старшего Cypress, в основном количественные, хотя и не только. Новый чип отличается ровно вдвое урезанными возможностями по всем параметрам: вычислительной производительности, скорости текстурных выборок и блоков ROP. Он примерно соответствует топовому чипу RV770 по этим характеристикам. Видимо, именно такой и была цель инженеров компании.

Как вы помните, хотя кардинальных изменений в RV8xx нет, это развитие идей предыдущих поколений, небольшие модификации затронули практически все блоки чипа: потоковые вычислительные блоки, текстурные модули, блоки ROP, контроллеры устройств вывода. Схема чипа Juniper весьма похожа на ту, что мы видели в обзоре Cypress:

Основная часть видеочипа RV840 состоит из десяти SIMD ядер, столько же, что и у RV770, каждое из которых содержит по 16 блоков суперскалярных потоковых процессоров. Суперскалярная сущность этих процессоров не меняется со времён RV670, и AMD считает, что чип содержит 10*16*5=800 скалярных 32-битных потоковых процессоров.

Все возможности видеочипа остались прежними. Кроме одной, но важной для расчётов на GPU. Как вы помните, в предыдущих чипах для 64-битных расчётов двойной точности используются эти же математические блоки, только темп расчётов снижается. А вот RV840 «Juniper» не поддерживает вычисления с двойной точностью, исходя из выложенных на сайте AMD спецификаций.

Плохо это, или вполне можно обойтись без двойной точности в сравнительно недорогих чипах? С точки зрения вычислений на GPU это не очень хорошо, конечно. Всегда полезно иметь одинаковые возможности на всех чипах для любого ценового диапазона. С другой стороны, если это помогает снизить себестоимость и цену для конечного пользователя, то на данный момент это — вполне логичное решение. Ведь и одинарная то точность в «домашних» GPGPU задачах редко используется, не говоря уже про двойную...

В общем, сравнительно большое количество потоковых процессоров, в сумме с остальными модификациями (увеличенное количество исполняемых за один такт инструкций, исполнение дополнительной инструкции MUL и зависимой инструкции ADD за такт, новая команда Sum of Absolute Differences) обеспечивает RV840 высокую производительность в вычислениях с одиночной точностью, и графического и общего назначения.

Все новые чипы семейства RV8xx, в том числе и RV840 «Juniper», отличаются поддержкой нового алгоритма анизотропной фильтрации, который отличается улучшенным качеством. Текстурные мип-уровни теперь расположены по идеальным окружностям. Исследование качества и производительности анизотропной фильтрации и полноэкранного сглаживания будет готово совсем скоро, а пока что можно сравнить старый алгоритм и новый (внимание на плавность переходов между мип-уровнями и геометрическую правильность окружностей):

Обо всех остальных изменениях в блоках TMU и ROP вы можете прочитать в базовом обзоре Cypress, там всё подробно расписано. Новыми решениями поддерживается и сглаживание методом суперсэмплинга, что позволяет сглаживать не только края полигонов, но и текстуры и результат работы пиксельных шейдеров, что улучшает общее качество рендеринга.

Новый чип среднего ценового диапазона обладает теми же контроллерами GDDR5 памяти, которые были оптимизированы в архитектуре RV8xx. В целом, там всё то же самое, что и в Cypress, за исключением сравнительно низкой пропускной способности видеопамяти, что может стать узким местом линейки HD 5700. Впрочем, решение о 128-битной шине также логично, ведь и площадь чипа уменьшилась, и для AMD важнее обеспечить низкую себестоимость. А ПСП у быстрой GDDR5 памяти при 128-битной шине, в общем-то, вполне достаточная для таких видеокарт. Хотя, в некоторых случаях можно ожидать отставания по скорости от HD 4870/4890, имеющих значительно большую ПСП за счёт 256-битной шины памяти.

И снова DirectX 11

В базовом обзоре RADEON HD 5800 мы подробно рассмотрели все особенности новой версии этого графического API, который работает в операционных системах Windows 7 и Windows Vista (требуется обновление через Windows Update). В той статье этому был посвящен самый большой раздел теоретической части.

В новой версии API было введено довольно много нового, хотя DirectX 11 является, скорее, улучшенной и дополненной DirectX 10. Все нововведения в нём направлены на увеличение гибкости, производительности, удобства разработки, которые должны вылиться в качественные изменения в будущих графических (и не только!) приложениях.

Для увеличения скорости в DX11 поддерживается многопоточный рендеринг, и новые возможности DirectCompute, которые могут ускорить постобработку и многие другие алгоритмы. А улучшить качество изображения в играх помогут: тесселяция, рендеринг прозрачных полигонов без необходимости сортировки, сложная постобработка, новые возможности при фильтрации теней. Также весьма интересно игровое применение физических расчётов и алгоритмов AI на видеочипах через DirectCompute.

Все теоретические особенности нового API были рассмотрены в обзоре Cypress. В этом обзоре приведем лишь пару других картинок из игр. Например, тесселяция применяемая для увеличения детализации персонажей в последней части игры STALKER под названием Call of Pripyat, слева скриншот без тесселяции, справа с её включением:

Да, силуэты стали более гладкими, это бесспорно и хорошо заметно на некоторых частях модели. Но это и не самое удачное применение тесселяции в играх, так как объекты в Call of Pripyat становятся слегка похожими на надувные игрушки, что знакомо по ранним применениям n-патчей, также известных как TRUFORM. Кроме того, сложность моделей персонажей в играх сейчас и так уже достаточно велика, чтобы не было острых углов, и тесселяция тут слабо поможет, если только не предусматривать её использование изначально, и делать модели с её учётом.

Ещё одной отличительной особенностью Direct3D 11 рендерера, который появился в одном из патчей к последней игре серии STALKER, является применение DirectCompute11 для получения более реалистичных теней. При этом тень становится более размытой по краям по мере удаления от отбрасывающего её объекта, то есть, полутень так выглядит правдоподобнее. Смотрим сравнительные картинки из игры STALKER: Call of Pripyat:

Всё внимание на тень от столба в двух местах: в месте его соприкосновения с землёй, и на стене дома. В первом случае тень более чёткая и контрастная для DX11 варианта, а во втором — наоборот, более размытая. То есть, как раз то, что мы и видим в жизни. Впрочем, разница снова не так уж велика, если специально не присматриваться.

А вот что на 100% позитивно, так это то, что патч для игры Call of Pripyat с поддержкой возможностей DirectX 11 уже вышел, и все перечисленные выше улучшения можно увидеть в реальной игре. К сожалению, другие игры этим похвастать не могут, BattleForge от EA Phenomic хоть и получила патч, но никаких видимых изменений там нет, ну а DiRT 2 от Codemasters и Aliens vs Predator от Rebellion ещё не вышли. Поэтому реальной пользы от DirectX 11 пока что немного.

PCI Express 2.1

Хотя системные платы сейчас ограничены поддержкой версии PCI Express 2.0, а выпуск спецификаций версии 3.0 был перенесен PCISIG на позднее время, новое семейство видеокарт AMD отличилось поддержкой стандарта PCI-E версии 2.1. Если судить по их спецификациям, по крайней мере.

Отличий там, как можно предположить из небольшого увеличения версии стандарта, не так уж много. Основной целью будущей версии 3.0 является более высокая производительность, но и 2.1 позволяет ускорить передачу данных в некоторых случаях. И некоторые из планируемых в 3.0 изменений, были реализованы в версии 2.1. Они предназначены для лучшей поддержки устройств, требующих быстрой передачи данных, таких как GPU.

Опишем вкратце основные изменения в PCI Express 2.1, по сравнению с PCI Express 2.0. Internal Error Reporting — теперь информация о внутренних ошибках стала доступной программному коду. Atomic Operations — поддержка атомарных операций, помогающая распределять задачи между ядрами CPU и ускорителями на основе видеочипов. Resizable BAR Capability — возможность определения количества системных ресурсов, выделяемых устройствам. Dynamic Power Allocation — возможность программного управления состояниями питания. ID-based Ordering — снижение простоев, вызванных неоптимальным порядком команд, дающий увеличение производительности. Latency Tolerance Reporting — улучшения в распределении ресурсов. Alternative Routing-ID Interpretation — поддержка большего количества внутренних функций устройств.

Это только часть изменений в новой версии PCI Express. К сожалению, проверить увеличение производительности по сравнению со второй версией PCI-E мы пока не можем — просто нет подходящих системных плат. Как только возможность появится, то обязательно проверим.

Вывод информации, управление питанием и другие особенности

Анонсированные недавно новые решения среднего ценового диапазона от AMD не были обделены и поддержкой интересной технологии одновременного вывода изображения на три устройства под названием Eyefinity. Расширенная поддержка мультимониторных конфигураций в виде подключения трёх, а то и шести мониторов к одной видеокарте, может быть полезна как в играх, так и в рабочих применениях.

Блок вывода изображения в чипах RV8xx был переделан так, что теперь он поддерживает вывод картинки на устройства вывода в количестве до шести штук (при использовании специальных версий видеоплат), в разных комбинациях. Количество поддерживаемых мониторов зависит от конкретной конфигурации платы, оно может достигать шести или трёх. В чипе есть шесть встроенных TMDS трансмиттеров, и на обычных видеокартах четыре из них обеспечивают работу двух разъёмов Dual Link DVI, поэтому к ним можно подключить до трёх мониторов.

Поддержка трёх мониторов, в отличие от двух в предыдущих решениях — это не такое уж важное преимущество. Вряд ли многие игроки решатся на установку трёх мониторов, покупая видеокарту среднего уровня. Да и проще купить один большой монитор, или телевизор. Так что, возможность эта хоть и полезная, но назвать её явным преимуществом нельзя.

Зато можно назвать преимуществом новые возможности вывода звука по HDMI. Как и старшее семейство, линейка ATI RADEON HD 5700 поддерживает версию HDMI 1.3a и передачу форматов высококачественного звука (Dolby TrueHD и DTS-HD Master Audio) с дисков Blu-ray по HDMI подключению. И если в случае дорогих карт серии HD 5800 это не так важно, то на основе сравнительно недорогой HD 5750 уже можно будет сделать HTPC, и там эта возможность будет полезной.

Новыми платами поддерживается технология динамического управления питанием ATI PowerPlay. Сниженное потребление для режима простоя новых карт достигнуто при помощи ещё более низких, чем обычно, частот и напряжений для чипа и памяти, а также специального режима работы GDDR5 памяти. В результате, в простое семейство HD 5700 потребляет лишь 16-18 Вт, и это действительно очень мало. А при максимальной работе GPU частоты с напряжением будут выставлены в наибольшее значение, и потребление уже превысит 80-100 Вт, что тоже неплохо для такой производительности.



Как обычно, в первой части статьи мы познакомились с теоретическими особенностями нового чипа и решений на его основе от компании AMD. Следующая часть статьи посвящена практической части исследования, в которой мы узнаем, как производительность новых решений на основе чипа Juniper соотносится со скоростью предыдущих решений компании AMD, а также конкурирующих видеокарт Nvidia.



ATI RADEON HD 5770 и 5750 - Часть 2: видеоплаты и синтетические тесты










Дополнительно

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.