ATI RADEON HD 4770 (RV740) 512MB PCI-E

потрясающее соотношение цены и скорости!



СОДЕРЖАНИЕ

  1. Часть 1 — Теория и архитектура
  2. Часть 2 — Практическое знакомство
  3. Особенности видеокарт
  4. Конфигурация стенда, список тестовых инструментов
  5. Результаты игровых тестов (производительность)


ATI RADEON HD 4770 512MB: Часть 1: Теоретические сведения


Приступаем к практической части.

Сегодня мы рассмотрим 2 видеокарты на базе нового процессора: эталонный вариант от AMD, и карту от HIS.

Знакомство построим с точки зрения обывателя — когда он покупает видеокарту. Вначале он видит коробки. Разумеется, у эталонной карты нет ни коробки, ни комплекта.



HIS RADEON HD 4770 512MB PCI-E

Компания решила изменить дизайн упаковки, отказавшись глянцевого супера, выполнив весь лизайн на толстом картоне. Внутри расположен пластиковый отсек, в котором и лежит видеокарта. Хорошо закреплена, потому в процессе перевозки сохранность гарантирована.



Затем пользователь открывает коробку и смотрит на то, что там лежит кроме самого предмета приобретения.

Стоит напомнить еще раз, что в качестве комплекта к подобного рода картам должен идти следующий набор:

  • руководство пользователя,
  • диск с драйверами и утилитами,
  • переходник-адаптер DVI-to-VGA,
  • DVI-to-HMDI адаптер,
  • адаптер компонентного вывода (TV-out),
  • разветвитель внешнего питания.



HIS RADEON HD 4770 512MB PCI-E

Комплект неполноценный и не соответствует базовому (нет адаптера компонентного вывода (для TV-out), а также нет разветвителя внешнего питания (хотя это уже не такая проблема, ибо почти все БП имеют собственные кабели для таких целей).



А теперь изучим сами карты.



HIS RADEON HD 4770 512MB PCI-E
  • GPU: RADEON HD 4770 (RV740)
  • Интерфейс: PCI-Express x16
  • Частоты работы GPU (ROPs/Shaders): 750/750 MHz (номинал — 750/750 МГц)
  • Частоты работы памяти (физическая (эффективная)): 800 (3200) MHz (номинал — 800 (3200) МГц)
  • Ширина шины обмена с памятью: 128bit
  • Число вершинных процессоров: -
  • Число пиксельных процессоров: -
  • Число универсальных процессоров: 640
  • Число текстурных процессоров: 32 (BLF/TLF)
  • Число ROPs: 16
  • Размеры: 200x100x32 мм (последняя величина — максимальная толщина видеокарты).
  • Цвет текстолита: красный
  • RAMDACs/TMDS: интегрированы в GPU.
  • Выходные гнезда: 2xDVI (Dual-Link/HDMI), TV-out.
  • VIVO: нет
  • TV-out: интегрирован в GPU.
  • Поддержка многопроцессорной работы: CrossFire (Hardware).
ATI RADEON HD 4770 512MB PCI-E
  • GPU: RADEON HD 4770 (RV740)
  • Интерфейс: PCI-Express x16
  • Частоты работы GPU (ROPs/Shaders): 750/750 MHz (номинал — 750/750 МГц)
  • Частоты работы памяти (физическая (эффективная)): 800 (3200) MHz (номинал — 800 (3200) МГц)
  • Ширина шины обмена с памятью: 128bit
  • Число вершинных процессоров: -
  • Число пиксельных процессоров: -
  • Число универсальных процессоров: 640
  • Число текстурных процессоров: 32 (BLF/TLF)
  • Число ROPs: 16
  • Размеры: 200x100x32 мм (последняя величина — максимальная толщина видеокарты).
  • Цвет текстолита: красный
  • RAMDACs/TMDS: интегрированы в GPU.
  • Выходные гнезда: 2xDVI (Dual-Link/HDMI), TV-out.
  • VIVO: нет
  • TV-out: интегрирован в GPU.
  • Поддержка многопроцессорной работы: CrossFire (Hardware).


HIS RADEON HD 4770 512MB PCI-E
ATI RADEON HD 4770 512MB PCI-E
Каждая карта имеет 512 МБ памяти GDDR5 SDRAM, размещенной в 8 микросхемах на лицевой стороне PCB.

Микросхемы памяти Qimonda (GDDR5). Микросхемы расчитаны на максимальную частоту работы в 1000 (4000) МГц.



Сравнение с эталонным дизайном, вид спереди
HIS RADEON HD 4770 512MB PCI-E Reference ATI RADEON HD 4850
ATI RADEON HD 4770 512MB PCI-E


Сравнение с эталонным дизайном, вид сзади
HIS RADEON HD 4770 512MB PCI-E Reference ATI RADEON HD 4850
ATI RADEON HD 4770 512MB PCI-E


Кристалл изготовлен на 11-й неделе этого года, то есть примерно в середине марта. Размеры очень малы, что явно говорит об измененном техпроцессе даже с учетом урезанности ядра относительно RV770.



Как мы видим, обе карты идентичны и представляют собой референс-дизайн (хотя налицо некоторое упрощение у карты от HIS: это не уловка инженеров этой компании, это просто упрощен сам референс-дизайн, и возможно, что все остальные 4770 будут выходить с таким дизайном, если конечно же, какой-либо из партнеров AMD не придумает свой дизайн). Мне лично очень непонятно, зачем для 128-битной шины с объемом памяти 512 мегабайт устанавливать 8(!) микросхем памяти. Раньше для аналогичных целей хватало 4х, да и это одна из составляющих удешевления производства карт. На ум приходит только одно объяснение, что пока нет в доступности столь емких микросхем памяти GDDR5.

В данном же случае мы видим, что используются те же микросхемы памяти, что и для 4870, в том же количестве, только ядро дешевле и PCB немного дешевле из-за разводки. Понимаем, что из-за необходимости в дополнительном питании (карта потребляет 80 Ватт, то выходит за рамки по спецификациям PCI-E, потому надо ставить дополнительное питание, а следовательно и увеличивать размеры карты), однако если бы производитель не монтировал бы 8 микросхем, а ограничился бы 4-мя, то может быть и нужды в дополнительном питании и не было бы.

Видеокарты этой серии кодеком звукового потока для передачи его через HDMI (с помощью переходника DVI-to-HDMI) на приемник.

Еще раз отмечу, что видеокарты требуют дополнительное питание, поэтому необходимо, чтобы БП имел соответствующий «хвост», или надо использовать дополнительные переходники, поставляемые с картой.

Подключение к аналоговым мониторам с d-Sub (VGA) производится через специальные адаптеры-переходники DVI-to-d-Sub. Также с серийными картами поставляются переходники DVI-to-HDMI (мы помним, что данные ускорители поддерживают полноценную передачу видео и звука на HDMI-приемник), поэтому проблем с такими мониторами также не должно быть.

Максимальные разрешения и частоты:

  • 240 Hz Max Refresh Rate
  • 2048 × 1536 × 32bit x85Hz Max — по аналоговому интерфейсу
  • 2560 × 1600 @ 60Hz Max — по цифровому интерфейсу (для DVI-гнезд с Dual-Link)

По поводу HDTV. Одно из исследований также проведено, и с ним можно ознакомиться здесь.

Теперь о референс кулере.

Это цилиндрического типа кулер, прогоняющий воздух с помощью установленной на одном конце турбины через радиатор внутри длинного пластикового корпуса. Горячий воздух выбрасывается за пределы системного блока, поэтому карта с СО занимает 2 слота. Немного непонятно, зачем карте ценой в 100 долларов США такая мощная система охлаждения. Стоит отметить, что СО почти бесшумная (это и понятно, она явно избыточна для такой карты).







А вот продукт от HIS (впрочем, есть основания полагать, что данный кулер также референс, и что большинство 4770 карт будет укомплектовано именно таким кулером) имеет совсем иную конструкцию СО. Данное устройство охлаждает только ядро, имеет форму округлого цилиндра, покрытого лластинчатыми ребрами. В его центре большой вентилятор, работающий на невысоких оборотах, потому кулер почти бесшумен.







А далее мы провели исследование температурного режима с помощью утилиты RivaTuner (автор А.Николайчук AKA Unwinder) и получили следующие результаты:

ATI RADEON HD 4770 512MB PCI-E



HIS RADEON HD 4770 512MB PCI-E



Очевидно, что температурные реижимы обеих карт находятся в пределах нормы, да и по сути невелики для современных ускорителей.

А теперь мы займемся тестами.

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютер на базе Intel Core2 (775 Socket)
    • процессор Intel Core2 Extreme QX9650 (3000 MHz);
    • системная плата Zotac 790i Ultra а чипсете Nvidia nForce 790i Ultra;
    • оперативная память 2 GB DDR3 SDRAM Corsair 2000MHz;
    • жесткий диск WD Caviar SE WD1600JD 160GB SATA.
    • блок питания Tagan TG900-BZ 900W.
  • операционная система Windows Vista 32bit SP1; DirectX 10.1;
  • монитор Dell 3007WFP (30").
  • драйверы ATI версии CATALYST 9.4; Nvidia версии 185.68.

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

  • D3D RightMark Beta 4 (1050) с описанием на сайте 3d.rightmark.org
  • D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 — тесты пиксельных шейдеров версий 2.0 и 3.0 ссылка.
  • RightMark3D 2.0 с кратким описанием: Vista без SP1, Vista c SP1

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

Синтетические тесты проводились на следующих видеокартах:

  • RADEON HD 4770 со стандартными параметрами (далее HD4770)
  • RADEON HD 4830 со стандартными параметрами (далее HD4830)
  • RADEON HD 4770, работающий на частотах 575/800 МГц (далее HD4770 (575))
  • RADEON HD 4830, работающий на частотах 575/800 МГц (далее HD4830 (575))
  • Nvidia Geforce 9800 GT со стандартными параметрами (далее 9800GT или 8800GT)

Для сравнения результатов новой модели RADEON HD 4770 были выбраны эти модели видеокарт по следующим причинам: RADEON HD 4830 на стандартной частоте является моделью, которую заменяет новое решение компании AMD, а Nvidia Geforce 9800 GT — это основной конкурент от компании Nvidia. На диаграммах приведены и два варианта на нестандартных частотах: HD 4770 и HD 4830. Частоты этих решений приведены к тому, чтобы они по своим характеристикам не отличались друг от друга. В этом случае и пропускная способность памяти равная, и все теоретические показатели, кроме скорости заполнения (в RV740 физически больше блоков ROP). Будет интересно сравнить вклад увеличенного количества этих блоков, и убедиться в отсутствии иных архитектурных изменений в RV740.

Direct3D 9: Тесты Pixel Filling

В тесте определяется пиковая производительность выборки текстур (texel rate) в режиме FFP для разного числа текстур, накладываемых на один пиксель:



Как обычно для этого несколько устаревшего теста, видеокарты не достигают теоретически возможных значений. Результаты данной синтетики не дотягивают до пиковых значений, и все новые видеокарты в нашем тесте не достигают теоретического максимума. Получается, что RV740 выбирает около 25 текселей за один такт из 32-битных текстур при билинейной фильтрации в этом тесте, что ниже теоретической цифры в 32 текселя.

Но этой скорости HD 4770 хватает, чтобы показать примерно равный с Geforce 9800 GT результат. Лишь в некоторых случаях конкурент от Nvidia чуть быстрее, зато при наложении 1 и 2 текстур видеокарта AMD явно мощнее. По сравнению с HD 4830 на одинаковых частотах показан весьма близкий результат, что говорит об идентичности текстурных модулей. А вот на стандартных частотах HD 4770 намного сильнее, чем HD 4830. Посмотрим на результаты в тесте филлрейта:



Второй синтетический тест показывает скорость заполнения, и в нём мы видим ту же самую ситуацию, но уже с учетом количества записанных в буфер кадра пикселей. В случаях с 0, 1 и 2 накладываемыми текстурами у RADEON HD 4770 получается максимальный результат, превосходящий цифры Geforce 9800 GT. Но в таких режимах производительность ограничена ПСП, прежде всего, а вот в ситуациях с большим количеством текстур на пиксель, новая видеоплата компании AMD сравнивается со старым Geforce 9800 GT (она же Geforce 8800 GT), кроме случаев с 3 и 4 текстурами, где немного отстаёт.

Direct3D 9: Тесты Pixel Shaders

Первая группа пиксельных шейдеров, которую мы рассматриваем, является очень простой для современных видеочипов, она включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0.



Тесты слишком просты для современных архитектур, даже при стоимости решений менее $100. Они показывают далеко не всю силу GPU, но интересны для оценки баланса между текстурными выборками и математическими вычислениями, особенно при смене архитектур. В этих простых тестах производительность ограничена в основном скоростью текстурных модулей. Впрочем, у нас смены архитектур не было, и видеокарта HD 4770, которую мы сегодня рассматриваем, показала результат, аналогичный карте на основе предыдущего чипа, с поправкой на разность частот.

RADEON HD 4770 во всех тестах опередил главного конкурента Geforce 9800 GT, хотя значительная разница в производительности наблюдается только в тесте с тремя источниками света. Сравнение HD 4770 и HD 4830 на одинаковых частотах интересно тем, что «старая» карта в ряде случаев почему-то оказалась быстрее. Вероятно, в новых драйверах баланс смещён в сторону более сложных задач, а на простые внимания обращают всё меньше. Или же сказывается разный тип памяти. Впрочем, разница там не такая уж большая. Посмотрим на результаты тестов более сложных пиксельных программ промежуточных версий:



Вот тут чуть интереснее, хотя в первом тесте получилось то же самое, что и в предыдущих. В сильно зависящем от скорости текстурирования тесте процедурной визуализации воды «Water» используется зависимая выборка из текстур больших уровней вложенности, и карты располагаются по скорости текстурирования, исключая небольшое отставание Nvidia, которая должна быть быстрее. RV740 же показывает максимальный результат, на 30% выше, чем у Geforce 9800 GT.

Второй тест более интенсивен вычислительно, и отлично подходит для всех архитектур AMD, обладающих большим количеством вычислительных блоков. В этом тесте новое решение AMD показывает лучший результат, обгоняя и Geforce 9800 GT, и RADEON HD 4830. При работе на той же частоте карты почти равны, но старая модель чуть быстрее, как и в прошлый раз. Впрочем, разница получилась менее 2%, и её можно не принимать во внимание.

Direct3D 9: Тесты пиксельных шейдеров New Pixel Shaders

Эти тесты пиксельных шейдеров DirectX 9 ещё сложнее, они делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье Современная терминология 3D графики
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами

Существует два варианта этих шейдеров: с ориентацией на математические вычисления, и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:



Это универсальные тесты, зависящие и от скорости блоков ALU и от скорости текстурирования, тут важен общий баланс чипа. Производительность видеокарт в тесте «Frozen Glass» ограничена не только математикой, но и скоростью текстурных выборок. Ситуация в нём похожа на то, что мы видели чуть раньше в «Water». На номинальных частотах HD 4770 опережает всех примерно одинаково. А в случае с одинаковыми частотами RV740 и RV770LE видим аналогичный результат.

Во втором тесте «Parallax Mapping» решения AMD стали ещё сильнее. Тут уже скорость ALU играет большую роль, чем в предыдущем тесте. И HD 4770 остаётся быстрее всех на номинальных частотах, обгоняя конкурента от Nvidia в полтора раза. В целом, новый чип явно силён и по текстурной и по математической производительности. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям, чтобы убедиться окончательно:



Картинка абсолютно аналогичная, разве что Geforce 9800 GT немного подтянулся вверх, явно виден больший упор производительности в скорость текстурных блоков. В первом тесте RADEON HD 4770 оторвался от остальных карт ещё чуть дальше. Да и во втором не теряет позиций, показывая лучшие результаты. Сравнительная производительность HD 4770 и HD 4830 на равных частотах говорит о полной идентичности архитектур и об отсутствии упора тестов в филлрейт.

Рассмотрим результаты ещё двух тестов пиксельных шейдеров — версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9. Тесты отличаются тем, что сильно нагружают и ALU и текстурные модули, обе шейдерные программы сложные, длинные, включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье Современная терминология 3D графики
  • Fur — процедурный шейдер, визуализирующий мех



Наверное, читатели помнят времена, когда решения AMD сильно проигрывали картам Nvidia в этом тесте. Но с новой архитектурой R7xx мы увидели просто огромный прирост производительности в PS 3.0 тестах. Что подтверждает и RV740, ведь RADEON HD 4770 заметно быстрее всех представленных решений, особенно это касается видеокарты производства компании Nvidia.

Geforce 9800 GT отстаёт от HD 4770 в 1.8 и 2.3 раза в двух самых сложных DX9 тестах. Новое решение компании AMD показывает ровно тот же результат, что и предыдущее, при условии установки идентичных рабочих частот. Снова мы видим превосходные результаты переработанной архитектуры AMD, которые обусловлены большим исполнительных блоков и значительно улучшенной архитектурой R7xx.

Direct3D 10: Тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

В новую версию RightMark3D 2.0 вошли два знакомых PS 3.0 теста под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два полностью новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами, при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель!) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40-80, включение «шейдерного» суперсэмплинга — до 60-120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в этом тесте зависит по большей части от количества и скорости блоков TMU, и лишь немного от филлрейта и ПСП. Результаты в «High» получились примерно в полтора раза ниже, чем в «Low», как и должно быть. В Direct3D 10 тестах процедурной визуализации меха с большим количеством текстурных выборок решения Nvidia традиционно сильны, но новое решение AMD в этом ценовом диапазоне показывает результат, схожий с конкурирующим решением Geforce 9800 GT. Что точно соответствует DX9 тестам текстурирования.

Герой обзора RADEON HD 4770 не только показывает скорость на уровне Geforce 9800 GT, но и опережает старую модель HD 4830. На одной частоте HD 4770 и HD 4830 показывают идентичные результаты, как и должно быть по теории, что подтверждает одинаковую архитектуру. Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза, возможно в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

Включение суперсэмплинга теоретически увеличивает нагрузку в четыре раза, и в этот раз от преимущества карты Nvidia не осталось и следа. Её обгоняет и HD 4830 (впрочем, совсем немного), и новая HD 4770. С увеличением сложности шейдера и нагрузки на видеочип, разница снижается, но остаётся значительной. На родной частоте HD 4770 намного быстрее HD 4830, а приведение к одинаковым параметрам лишь совсем немного выводит новое решение вперёд (хотя 2-3% разницы можно считать погрешностью измерений).

Второй тест, измеряющий производительность выполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением, число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше, по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Данный тест интереснее с практической точки зрения, ведь разновидности parallax mapping давно применяются в играх, а тяжелые варианты, вроде нашего steep parallax mapping используются в некоторых проектах, например, в Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип примерно в два раза, такой режим называется «High».

Почти повторилась ситуация предыдущего теста, но как будто уже с включенным суперсэмплингом. В обновленном D3D10 варианте теста без суперсэмплинга, RADEON HD 4770 лучше всех соперников справляется со своей задачей, оставляя видеокарты Geforce 9800 GT и HD 4830 позади. Интересно, что результат карты Geforce в этот раз идентичен результатам карт AMD на равных частотах. Кстати, у последних наблюдаются схожие результаты, как и должно быть по теории.

Посмотрим, что изменит включение суперсэмплинга, в прошлом тесте он вызывал значительно большее падение скорости на карте Nvidia.

При включении суперсэмплинга и самозатенения задача получается более тяжёлой, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая большое падение производительности. Разница между показателями видеокарт изменилась, включение суперсэмплинга сказывается как и в предыдущем случае — карты производства AMD улучшают свои показатели относительно решения Nvidia.

Интересующий нас сегодня RADEON HD 4770 уже до двух раз выигрывает у видеокарты Nvidia Geforce 9800 GT, и с запасом обгоняет HD 4830. Сравнение RV740 и RV770LE на равных частотах снова наглядно говорит об идентичности архитектуры чипов RV740 и RV770.

Direct3D 10: Тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

При анализе результатов наших синтетических тестов, мы всегда отмечаем, что в вычислительно сложных задачах современная архитектура AMD показывает себя лучше конкурирующих от Nvidia. Подтверждается это и сейчас, в этом тесте новая плата HD 4770 почти в два раза быстрее аналогичного по цене решения Geforce 9800 GT. Новая карта RADEON показывает отличную производительность на уровне видеоплат конкурента из более высокого ценового диапазона.

Но это было предсказуемо, а интересные результаты получились при сравнении HD 4770 и HD 4830 на равных частотах. Разница в 5% несколько выше погрешности измерения, и она может быть вызвана немного разной оптимизацией драйверов для разных моделей видеокарт. Или же тест немного зависит ещё и от пропускной способности видеопамяти, как мы видим из сравнения HD 4830 на разных частотах. А может быть, оказывают своё влияние и чуть большие задержки GDDR5 памяти…

Второй тест шейдерных вычислений носит название Fire, и он ещё более тяжёл для ALU. В нём текстурная выборка только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

А вот во втором тесте скорость рендеринга ограничена уже больше производительностью шейдерных блоков, и мы видим схожий результат, и RADEON HD 4770 в этом тесте показывает сравнительную скорость ещё лучшую, по сравнению с предыдущим тестом. Значит, в первом тесте его явно немного ограничивали возможности памяти. Хотя разница не такая уж большая. Не то, что при сравнении с Geforce 9800 GT, в этот раз превосходство HD 4770 превысило два раза! Равночастотные же решения на основе RV740 и RV770LE показывают аналогичные результаты, соответствующие теории. Итог по математическим вычислениям остаётся неизменным — явное и неоспоримое лидерство решений компании AMD.

Direct3D 10: Тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующих частицу. Аналогичные алгоритмы должны получить широкое использование в будущих DirectX 10 играх.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаковое, производительность соответствует количеству точек, с каждым шагом падение FPS составляет около двух раз. Задача для современных видеокарт не очень сложная и ограничение скорости мощностью потоковых процессоров в тесте не явное, задача ограничена также и пропускной способностью памяти, что хорошо видно по результатам HD 4830, которая обгоняет HD 4770. Да и последняя при снижении тактовой частоты чипа не получает прироста.

Возможны и драйверные отличия, уж слишком всё странно в этом тесте. HD 4770 показывает результаты, почти равные тому, что мы видим у Geforce 9800 GT, а HD 4830 быстрее обеих. Да и на равных частотах у HD 4830 есть явное преимущество — видимо, GDDR5 память всё-таки не всегда обеспечивает ту же производительность, что и GDDR3 на вдвое более широкой шине… Возможно, при переносе части вычислений в геометрический шейдер ситуация изменится:

При увеличении нагрузки ситуация немного изменилась. Разница между рассмотренными вариантами теста видна в том, что HD 4770 уже почти не отстаёт от HD 4830. Теперь новое решение AMD обгоняет и своего основного соперника от Nvidia. Интересно, что видеокарта Nvidia и HD 4830 показывают тот же результат при изменении параметра GS load, отвечающем за перенос части вычислений в геометрический шейдер, а результаты новой видеоплаты HD 4770 немного возрастают. Посмотрим, что изменится в следующем тесте, который предполагает большую нагрузку именно на геометрические шейдеры.

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленном в «Heavy» — ещё и для их отрисовки. То есть, в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер. Сначала рассматриваем лёгкий режим:

Относительные результаты в разных режимах соответствуют нагрузке: во всех случаях производительность неплохо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть в два раза медленней. В этот раз скорость RADEON HD 4770 уже во всех подтестах ниже, чем у аналогичной по цене карты Geforce 9800 GT. Скорость у HD 4770 и HD 4830 почти одинаковая, что на номинальных частотах, что на равных, хотя небольшая разница в пользу RV770LE есть.

Судя по всем предыдущим тестам, упор тут наблюдается во что-то отличное от ПСП, филлрейта и вычислительной мощности. И даже от частоты не сильно зависит. Есть вероятность, что скорость упирается в возможности видеодрайвера. Впрочем, относительно единственной Geforce у рассматриваемого HD 4770 показатели неплохие. Цифры должны измениться на следующей диаграмме, в тесте с более активным использованием геометрических шейдеров. Также будет интересно сравнить друг с другом результаты, полученные в «Balanced» и «Heavy» режимах.

Ну вот теперь явно видна хотя бы разница между Nvidia и AMD. В RV7xx было улучшено исполнение геометрических шейдеров, и инженеры компании устранили один из недостатков предыдущих архитектур. Теперь в таких условиях новое решение примерно вдвое быстрее чем Geforce 9800 GT. Интересно, что разница между HD 4830 и HD 4770 остаётся в пользу первого решения, причём она явно превышает возможную ошибку при тестировании. Видимо, всё-таки сказывается разница между GDDR3 и GDDR5. Ну или драйверы для разных моделей оптимизированы по-разному, других вариантов нет.

Что касается сравнения результатов в разных режимах, тут всё как обычно: видеоплаты AMD при переходе от использования «instancing» к геометрическому шейдеру при выводе, улучшают свои показатели, а видеокарты Nvidia теряют в производительности. И если сравнивать цифры, полученные в разных режимах, при условии неизменности получаемой картинки, мы увидим, что скорость видеокарты Nvidia и видеокарт AMD в разных режимах примерно одинакова.

Direct3D 10: Скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи по сути и соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Предыдущие исследования показали, что на результаты этого теста влияет и скорость текстурирования и пропускная способность памяти. И чем проще режим, тем большее влияние на скорость оказывает ПСП. Это хорошо видно по сравнению карт AMD на равных частотах, где выигрыш HD 4830 очевиден. Вероятно, именно HD 4770 больше всего ограничивает именно ПСП.

Но всё же, если брать во внимание стандартные частоты, то во всех режимах, кроме наиболее простого, лидером является рассматриваемая сегодня low-end карта AMD. Но конкуренты близки, а в самом лёгком режиме её обгоняет RADEON HD 4830. Посмотрим на результаты этого же теста с увеличенным количеством текстурных выборок:

Ситуация изменилась совсем немного, в основном это видно по ухудшившимся показателям карты Nvidia. HD 4770 в двух режимах показывает лучший результат, а HD 4830 всё так же обгоняет её в самом лёгком режиме. Сравнение на равных частотах обнажает причину этой разницы — RADEON HD 4770 отстаёт тем больше, чем проще задача и чем больше скорость упирается в возможности видеопамяти. Похоже, что действительно не только ПСП важна, но и задержки, которые у GDDR5 больше.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты в тесте «Waves» очень похожи на те, что мы видели в предыдущий раз. Преимущество продукции AMD даже усилилось, теперь Geforce 9800 GT проигрывает до полутора раз. Новая модель семейства RADEON HD 4700 смотрится неплохо, обгоняя соперника, хотя и уступает теперь своему предшественнику во всех режимах. Но чем тяжелее режим, тем меньше это отставание. Рассмотрим второй вариант этого же теста:

Изменений почти нет, хотя с ростом сложности условий результаты видеоплат AMD становятся ещё лучше относительно скорости карты Nvidia. Geforce 9800 GT снова в полтора раза медленнее, чем анонсированный сегодня RADEON HD 4770. Который в очередной раз в VTF тестах уступает уже уходящему решению HD 4830, основанному на урезанном чипе RV770. Видимо, ограничение скоростью памяти в этом тесте оказывает влияние на конечный результат, пусть упор в память и не полный. А вот что мешает карте Nvidia показывать более высокий результат — это остаётся загадкой.

Выводы по синтетическим тестам

На основе результатов синтетических тестов новой бюджетной модели RADEON HD 4770, выполненной на основе чипа RV740, а также результатов других моделей видеокарт от обоих основных производителей видеочипов, мы делаем вывод, что новое решение компании AMD очень мощное и оно явно выгодно выделяется в своём ценовом диапазоне. HD 4770 должна показать весьма сильные результаты и в игровых приложениях, и практически во всех случаях обгонять своего предшественника HD 4830.

Хотя новый чип относится к архитектуре R7xx, и мало чем отличается от решений на основе урезанных RV770, его явным преимуществом, обусловленным новым технологическим процессом, является большая тактовая частота, которая позволяет предполагать результаты в играх почти на уровне RADEON HD 4850. А в случаях, когда скорость ограничена скоростью заполнения, вполне возможно, что и выше. Ведь игры бывают чаще ограничены возможностями блоков ROP, чем наши тесты, и тут RV740 вполне может иметь преимущество.

Очень важно, что переход на 128-битную шину памяти и использование GDDR5 памяти позволил и снизить себестоимость, и не потерять при этом в производительности. Лишь в малой части синтетических тестов мы видели небольшую разницу в пользу старого решения с 256-битной шиной памяти и чипами GDDR3, а в большинстве случаев решение, используемое в HD 4770, полностью себя оправдало.

Что касается борьбы с заклятым соперником Nvidia, можно сказать, что в большинстве синтетических тестов RADEON HD 4770 значительно опережает по скорости единственного конкурента своего ценового диапазона от компании Nvidia — Geforce 9800 GT. Почти во всех тестах карта на основе чипа RV740 показала лучший результат, на уровне решений из более высокого ценового диапазона. В этом «виновата» и успешная архитектура R7xx, и новый 40 нм техпроцесс.

В следующей части статьи вы увидите тесты нового решения компании AMD в современных игровых приложениях. Игровые результаты должны примерно соответствовать нашим выводам при анализе результатов синтетических тестов, но с учётом того, что скорость рендеринга в играх сильнее зависит от филлрейта и скорости памяти, поэтому в отдельных случаях HD 4770 может показать себя там даже ещё сильнее. Можно предположить, что в среднем скорость HD 4770 в играх превысит производительность HD 4830, новое решение почти догонит HD 4850, и уж точно должно быть быстрее, чем Nvidia Geforce 9800 GT.



ATI RADEON HD 4770 512MB — Часть 3: Игровые тесты (производительность)



Блок питания для тестового стенда предоставлен компанией TAGAN
Монитор Dell 3007WFP для тестовых стендов предоставлен компанией Nvidia




Дополнительно

ATI RADEON HD 4770 (RV740) 512MB PCI-E: потрясающее соотношение цены и скорости!

ATI RADEON HD 4770 (RV740) 512MB PCI-E

потрясающее соотношение цены и скорости!


СОДЕРЖАНИЕ

  1. Часть 1 — Теория и архитектура
  2. Часть 2 — Практическое знакомство
  3. Особенности видеокарт
  4. Конфигурация стенда, список тестовых инструментов
  5. Результаты игровых тестов (производительность)


ATI RADEON HD 4770 512MB: Часть 1: Теоретические сведения


Приступаем к практической части.

Сегодня мы рассмотрим 2 видеокарты на базе нового процессора: эталонный вариант от AMD, и карту от HIS.

Знакомство построим с точки зрения обывателя — когда он покупает видеокарту. Вначале он видит коробки. Разумеется, у эталонной карты нет ни коробки, ни комплекта.



HIS RADEON HD 4770 512MB PCI-E

Компания решила изменить дизайн упаковки, отказавшись глянцевого супера, выполнив весь лизайн на толстом картоне. Внутри расположен пластиковый отсек, в котором и лежит видеокарта. Хорошо закреплена, потому в процессе перевозки сохранность гарантирована.



Затем пользователь открывает коробку и смотрит на то, что там лежит кроме самого предмета приобретения.

Стоит напомнить еще раз, что в качестве комплекта к подобного рода картам должен идти следующий набор:

  • руководство пользователя,
  • диск с драйверами и утилитами,
  • переходник-адаптер DVI-to-VGA,
  • DVI-to-HMDI адаптер,
  • адаптер компонентного вывода (TV-out),
  • разветвитель внешнего питания.



HIS RADEON HD 4770 512MB PCI-E

Комплект неполноценный и не соответствует базовому (нет адаптера компонентного вывода (для TV-out), а также нет разветвителя внешнего питания (хотя это уже не такая проблема, ибо почти все БП имеют собственные кабели для таких целей).



А теперь изучим сами карты.



HIS RADEON HD 4770 512MB PCI-E
  • GPU: RADEON HD 4770 (RV740)
  • Интерфейс: PCI-Express x16
  • Частоты работы GPU (ROPs/Shaders): 750/750 MHz (номинал — 750/750 МГц)
  • Частоты работы памяти (физическая (эффективная)): 800 (3200) MHz (номинал — 800 (3200) МГц)
  • Ширина шины обмена с памятью: 128bit
  • Число вершинных процессоров: -
  • Число пиксельных процессоров: -
  • Число универсальных процессоров: 640
  • Число текстурных процессоров: 32 (BLF/TLF)
  • Число ROPs: 16
  • Размеры: 200x100x32 мм (последняя величина — максимальная толщина видеокарты).
  • Цвет текстолита: красный
  • RAMDACs/TMDS: интегрированы в GPU.
  • Выходные гнезда: 2xDVI (Dual-Link/HDMI), TV-out.
  • VIVO: нет
  • TV-out: интегрирован в GPU.
  • Поддержка многопроцессорной работы: CrossFire (Hardware).
ATI RADEON HD 4770 512MB PCI-E
  • GPU: RADEON HD 4770 (RV740)
  • Интерфейс: PCI-Express x16
  • Частоты работы GPU (ROPs/Shaders): 750/750 MHz (номинал — 750/750 МГц)
  • Частоты работы памяти (физическая (эффективная)): 800 (3200) MHz (номинал — 800 (3200) МГц)
  • Ширина шины обмена с памятью: 128bit
  • Число вершинных процессоров: -
  • Число пиксельных процессоров: -
  • Число универсальных процессоров: 640
  • Число текстурных процессоров: 32 (BLF/TLF)
  • Число ROPs: 16
  • Размеры: 200x100x32 мм (последняя величина — максимальная толщина видеокарты).
  • Цвет текстолита: красный
  • RAMDACs/TMDS: интегрированы в GPU.
  • Выходные гнезда: 2xDVI (Dual-Link/HDMI), TV-out.
  • VIVO: нет
  • TV-out: интегрирован в GPU.
  • Поддержка многопроцессорной работы: CrossFire (Hardware).


HIS RADEON HD 4770 512MB PCI-E
ATI RADEON HD 4770 512MB PCI-E
Каждая карта имеет 512 МБ памяти GDDR5 SDRAM, размещенной в 8 микросхемах на лицевой стороне PCB.

Микросхемы памяти Qimonda (GDDR5). Микросхемы расчитаны на максимальную частоту работы в 1000 (4000) МГц.



Сравнение с эталонным дизайном, вид спереди
HIS RADEON HD 4770 512MB PCI-E Reference ATI RADEON HD 4850
ATI RADEON HD 4770 512MB PCI-E


Сравнение с эталонным дизайном, вид сзади
HIS RADEON HD 4770 512MB PCI-E Reference ATI RADEON HD 4850
ATI RADEON HD 4770 512MB PCI-E


Кристалл изготовлен на 11-й неделе этого года, то есть примерно в середине марта. Размеры очень малы, что явно говорит об измененном техпроцессе даже с учетом урезанности ядра относительно RV770.



Как мы видим, обе карты идентичны и представляют собой референс-дизайн (хотя налицо некоторое упрощение у карты от HIS: это не уловка инженеров этой компании, это просто упрощен сам референс-дизайн, и возможно, что все остальные 4770 будут выходить с таким дизайном, если конечно же, какой-либо из партнеров AMD не придумает свой дизайн). Мне лично очень непонятно, зачем для 128-битной шины с объемом памяти 512 мегабайт устанавливать 8(!) микросхем памяти. Раньше для аналогичных целей хватало 4х, да и это одна из составляющих удешевления производства карт. На ум приходит только одно объяснение, что пока нет в доступности столь емких микросхем памяти GDDR5.

В данном же случае мы видим, что используются те же микросхемы памяти, что и для 4870, в том же количестве, только ядро дешевле и PCB немного дешевле из-за разводки. Понимаем, что из-за необходимости в дополнительном питании (карта потребляет 80 Ватт, то выходит за рамки по спецификациям PCI-E, потому надо ставить дополнительное питание, а следовательно и увеличивать размеры карты), однако если бы производитель не монтировал бы 8 микросхем, а ограничился бы 4-мя, то может быть и нужды в дополнительном питании и не было бы.

Видеокарты этой серии кодеком звукового потока для передачи его через HDMI (с помощью переходника DVI-to-HDMI) на приемник.

Еще раз отмечу, что видеокарты требуют дополнительное питание, поэтому необходимо, чтобы БП имел соответствующий «хвост», или надо использовать дополнительные переходники, поставляемые с картой.

Подключение к аналоговым мониторам с d-Sub (VGA) производится через специальные адаптеры-переходники DVI-to-d-Sub. Также с серийными картами поставляются переходники DVI-to-HDMI (мы помним, что данные ускорители поддерживают полноценную передачу видео и звука на HDMI-приемник), поэтому проблем с такими мониторами также не должно быть.

Максимальные разрешения и частоты:

  • 240 Hz Max Refresh Rate
  • 2048 × 1536 × 32bit x85Hz Max — по аналоговому интерфейсу
  • 2560 × 1600 @ 60Hz Max — по цифровому интерфейсу (для DVI-гнезд с Dual-Link)

По поводу HDTV. Одно из исследований также проведено, и с ним можно ознакомиться здесь.

Теперь о референс кулере.

Это цилиндрического типа кулер, прогоняющий воздух с помощью установленной на одном конце турбины через радиатор внутри длинного пластикового корпуса. Горячий воздух выбрасывается за пределы системного блока, поэтому карта с СО занимает 2 слота. Немного непонятно, зачем карте ценой в 100 долларов США такая мощная система охлаждения. Стоит отметить, что СО почти бесшумная (это и понятно, она явно избыточна для такой карты).







А вот продукт от HIS (впрочем, есть основания полагать, что данный кулер также референс, и что большинство 4770 карт будет укомплектовано именно таким кулером) имеет совсем иную конструкцию СО. Данное устройство охлаждает только ядро, имеет форму округлого цилиндра, покрытого лластинчатыми ребрами. В его центре большой вентилятор, работающий на невысоких оборотах, потому кулер почти бесшумен.







А далее мы провели исследование температурного режима с помощью утилиты RivaTuner (автор А.Николайчук AKA Unwinder) и получили следующие результаты:

ATI RADEON HD 4770 512MB PCI-E



HIS RADEON HD 4770 512MB PCI-E



Очевидно, что температурные реижимы обеих карт находятся в пределах нормы, да и по сути невелики для современных ускорителей.

А теперь мы займемся тестами.

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютер на базе Intel Core2 (775 Socket)
    • процессор Intel Core2 Extreme QX9650 (3000 MHz);
    • системная плата Zotac 790i Ultra а чипсете Nvidia nForce 790i Ultra;
    • оперативная память 2 GB DDR3 SDRAM Corsair 2000MHz;
    • жесткий диск WD Caviar SE WD1600JD 160GB SATA.
    • блок питания Tagan TG900-BZ 900W.
  • операционная система Windows Vista 32bit SP1; DirectX 10.1;
  • монитор Dell 3007WFP (30").
  • драйверы ATI версии CATALYST 9.4; Nvidia версии 185.68.

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

  • D3D RightMark Beta 4 (1050) с описанием на сайте 3d.rightmark.org
  • D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 — тесты пиксельных шейдеров версий 2.0 и 3.0 ссылка.
  • RightMark3D 2.0 с кратким описанием: Vista без SP1, Vista c SP1

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

Синтетические тесты проводились на следующих видеокартах:

  • RADEON HD 4770 со стандартными параметрами (далее HD4770)
  • RADEON HD 4830 со стандартными параметрами (далее HD4830)
  • RADEON HD 4770, работающий на частотах 575/800 МГц (далее HD4770 (575))
  • RADEON HD 4830, работающий на частотах 575/800 МГц (далее HD4830 (575))
  • Nvidia Geforce 9800 GT со стандартными параметрами (далее 9800GT или 8800GT)

Для сравнения результатов новой модели RADEON HD 4770 были выбраны эти модели видеокарт по следующим причинам: RADEON HD 4830 на стандартной частоте является моделью, которую заменяет новое решение компании AMD, а Nvidia Geforce 9800 GT — это основной конкурент от компании Nvidia. На диаграммах приведены и два варианта на нестандартных частотах: HD 4770 и HD 4830. Частоты этих решений приведены к тому, чтобы они по своим характеристикам не отличались друг от друга. В этом случае и пропускная способность памяти равная, и все теоретические показатели, кроме скорости заполнения (в RV740 физически больше блоков ROP). Будет интересно сравнить вклад увеличенного количества этих блоков, и убедиться в отсутствии иных архитектурных изменений в RV740.

Direct3D 9: Тесты Pixel Filling

В тесте определяется пиковая производительность выборки текстур (texel rate) в режиме FFP для разного числа текстур, накладываемых на один пиксель:



Как обычно для этого несколько устаревшего теста, видеокарты не достигают теоретически возможных значений. Результаты данной синтетики не дотягивают до пиковых значений, и все новые видеокарты в нашем тесте не достигают теоретического максимума. Получается, что RV740 выбирает около 25 текселей за один такт из 32-битных текстур при билинейной фильтрации в этом тесте, что ниже теоретической цифры в 32 текселя.

Но этой скорости HD 4770 хватает, чтобы показать примерно равный с Geforce 9800 GT результат. Лишь в некоторых случаях конкурент от Nvidia чуть быстрее, зато при наложении 1 и 2 текстур видеокарта AMD явно мощнее. По сравнению с HD 4830 на одинаковых частотах показан весьма близкий результат, что говорит об идентичности текстурных модулей. А вот на стандартных частотах HD 4770 намного сильнее, чем HD 4830. Посмотрим на результаты в тесте филлрейта:



Второй синтетический тест показывает скорость заполнения, и в нём мы видим ту же самую ситуацию, но уже с учетом количества записанных в буфер кадра пикселей. В случаях с 0, 1 и 2 накладываемыми текстурами у RADEON HD 4770 получается максимальный результат, превосходящий цифры Geforce 9800 GT. Но в таких режимах производительность ограничена ПСП, прежде всего, а вот в ситуациях с большим количеством текстур на пиксель, новая видеоплата компании AMD сравнивается со старым Geforce 9800 GT (она же Geforce 8800 GT), кроме случаев с 3 и 4 текстурами, где немного отстаёт.

Direct3D 9: Тесты Pixel Shaders

Первая группа пиксельных шейдеров, которую мы рассматриваем, является очень простой для современных видеочипов, она включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0.



Тесты слишком просты для современных архитектур, даже при стоимости решений менее $100. Они показывают далеко не всю силу GPU, но интересны для оценки баланса между текстурными выборками и математическими вычислениями, особенно при смене архитектур. В этих простых тестах производительность ограничена в основном скоростью текстурных модулей. Впрочем, у нас смены архитектур не было, и видеокарта HD 4770, которую мы сегодня рассматриваем, показала результат, аналогичный карте на основе предыдущего чипа, с поправкой на разность частот.

RADEON HD 4770 во всех тестах опередил главного конкурента Geforce 9800 GT, хотя значительная разница в производительности наблюдается только в тесте с тремя источниками света. Сравнение HD 4770 и HD 4830 на одинаковых частотах интересно тем, что «старая» карта в ряде случаев почему-то оказалась быстрее. Вероятно, в новых драйверах баланс смещён в сторону более сложных задач, а на простые внимания обращают всё меньше. Или же сказывается разный тип памяти. Впрочем, разница там не такая уж большая. Посмотрим на результаты тестов более сложных пиксельных программ промежуточных версий:



Вот тут чуть интереснее, хотя в первом тесте получилось то же самое, что и в предыдущих. В сильно зависящем от скорости текстурирования тесте процедурной визуализации воды «Water» используется зависимая выборка из текстур больших уровней вложенности, и карты располагаются по скорости текстурирования, исключая небольшое отставание Nvidia, которая должна быть быстрее. RV740 же показывает максимальный результат, на 30% выше, чем у Geforce 9800 GT.

Второй тест более интенсивен вычислительно, и отлично подходит для всех архитектур AMD, обладающих большим количеством вычислительных блоков. В этом тесте новое решение AMD показывает лучший результат, обгоняя и Geforce 9800 GT, и RADEON HD 4830. При работе на той же частоте карты почти равны, но старая модель чуть быстрее, как и в прошлый раз. Впрочем, разница получилась менее 2%, и её можно не принимать во внимание.

Direct3D 9: Тесты пиксельных шейдеров New Pixel Shaders

Эти тесты пиксельных шейдеров DirectX 9 ещё сложнее, они делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье Современная терминология 3D графики
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами

Существует два варианта этих шейдеров: с ориентацией на математические вычисления, и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:



Это универсальные тесты, зависящие и от скорости блоков ALU и от скорости текстурирования, тут важен общий баланс чипа. Производительность видеокарт в тесте «Frozen Glass» ограничена не только математикой, но и скоростью текстурных выборок. Ситуация в нём похожа на то, что мы видели чуть раньше в «Water». На номинальных частотах HD 4770 опережает всех примерно одинаково. А в случае с одинаковыми частотами RV740 и RV770LE видим аналогичный результат.

Во втором тесте «Parallax Mapping» решения AMD стали ещё сильнее. Тут уже скорость ALU играет большую роль, чем в предыдущем тесте. И HD 4770 остаётся быстрее всех на номинальных частотах, обгоняя конкурента от Nvidia в полтора раза. В целом, новый чип явно силён и по текстурной и по математической производительности. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям, чтобы убедиться окончательно:



Картинка абсолютно аналогичная, разве что Geforce 9800 GT немного подтянулся вверх, явно виден больший упор производительности в скорость текстурных блоков. В первом тесте RADEON HD 4770 оторвался от остальных карт ещё чуть дальше. Да и во втором не теряет позиций, показывая лучшие результаты. Сравнительная производительность HD 4770 и HD 4830 на равных частотах говорит о полной идентичности архитектур и об отсутствии упора тестов в филлрейт.

Рассмотрим результаты ещё двух тестов пиксельных шейдеров — версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9. Тесты отличаются тем, что сильно нагружают и ALU и текстурные модули, обе шейдерные программы сложные, длинные, включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье Современная терминология 3D графики
  • Fur — процедурный шейдер, визуализирующий мех



Наверное, читатели помнят времена, когда решения AMD сильно проигрывали картам Nvidia в этом тесте. Но с новой архитектурой R7xx мы увидели просто огромный прирост производительности в PS 3.0 тестах. Что подтверждает и RV740, ведь RADEON HD 4770 заметно быстрее всех представленных решений, особенно это касается видеокарты производства компании Nvidia.

Geforce 9800 GT отстаёт от HD 4770 в 1.8 и 2.3 раза в двух самых сложных DX9 тестах. Новое решение компании AMD показывает ровно тот же результат, что и предыдущее, при условии установки идентичных рабочих частот. Снова мы видим превосходные результаты переработанной архитектуры AMD, которые обусловлены большим исполнительных блоков и значительно улучшенной архитектурой R7xx.

Direct3D 10: Тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

В новую версию RightMark3D 2.0 вошли два знакомых PS 3.0 теста под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два полностью новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами, при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель!) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40-80, включение «шейдерного» суперсэмплинга — до 60-120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в этом тесте зависит по большей части от количества и скорости блоков TMU, и лишь немного от филлрейта и ПСП. Результаты в «High» получились примерно в полтора раза ниже, чем в «Low», как и должно быть. В Direct3D 10 тестах процедурной визуализации меха с большим количеством текстурных выборок решения Nvidia традиционно сильны, но новое решение AMD в этом ценовом диапазоне показывает результат, схожий с конкурирующим решением Geforce 9800 GT. Что точно соответствует DX9 тестам текстурирования.

Герой обзора RADEON HD 4770 не только показывает скорость на уровне Geforce 9800 GT, но и опережает старую модель HD 4830. На одной частоте HD 4770 и HD 4830 показывают идентичные результаты, как и должно быть по теории, что подтверждает одинаковую архитектуру. Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза, возможно в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

Включение суперсэмплинга теоретически увеличивает нагрузку в четыре раза, и в этот раз от преимущества карты Nvidia не осталось и следа. Её обгоняет и HD 4830 (впрочем, совсем немного), и новая HD 4770. С увеличением сложности шейдера и нагрузки на видеочип, разница снижается, но остаётся значительной. На родной частоте HD 4770 намного быстрее HD 4830, а приведение к одинаковым параметрам лишь совсем немного выводит новое решение вперёд (хотя 2-3% разницы можно считать погрешностью измерений).

Второй тест, измеряющий производительность выполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением, число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше, по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Данный тест интереснее с практической точки зрения, ведь разновидности parallax mapping давно применяются в играх, а тяжелые варианты, вроде нашего steep parallax mapping используются в некоторых проектах, например, в Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип примерно в два раза, такой режим называется «High».

Почти повторилась ситуация предыдущего теста, но как будто уже с включенным суперсэмплингом. В обновленном D3D10 варианте теста без суперсэмплинга, RADEON HD 4770 лучше всех соперников справляется со своей задачей, оставляя видеокарты Geforce 9800 GT и HD 4830 позади. Интересно, что результат карты Geforce в этот раз идентичен результатам карт AMD на равных частотах. Кстати, у последних наблюдаются схожие результаты, как и должно быть по теории.

Посмотрим, что изменит включение суперсэмплинга, в прошлом тесте он вызывал значительно большее падение скорости на карте Nvidia.

При включении суперсэмплинга и самозатенения задача получается более тяжёлой, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая большое падение производительности. Разница между показателями видеокарт изменилась, включение суперсэмплинга сказывается как и в предыдущем случае — карты производства AMD улучшают свои показатели относительно решения Nvidia.

Интересующий нас сегодня RADEON HD 4770 уже до двух раз выигрывает у видеокарты Nvidia Geforce 9800 GT, и с запасом обгоняет HD 4830. Сравнение RV740 и RV770LE на равных частотах снова наглядно говорит об идентичности архитектуры чипов RV740 и RV770.

Direct3D 10: Тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

При анализе результатов наших синтетических тестов, мы всегда отмечаем, что в вычислительно сложных задачах современная архитектура AMD показывает себя лучше конкурирующих от Nvidia. Подтверждается это и сейчас, в этом тесте новая плата HD 4770 почти в два раза быстрее аналогичного по цене решения Geforce 9800 GT. Новая карта RADEON показывает отличную производительность на уровне видеоплат конкурента из более высокого ценового диапазона.

Но это было предсказуемо, а интересные результаты получились при сравнении HD 4770 и HD 4830 на равных частотах. Разница в 5% несколько выше погрешности измерения, и она может быть вызвана немного разной оптимизацией драйверов для разных моделей видеокарт. Или же тест немного зависит ещё и от пропускной способности видеопамяти, как мы видим из сравнения HD 4830 на разных частотах. А может быть, оказывают своё влияние и чуть большие задержки GDDR5 памяти…

Второй тест шейдерных вычислений носит название Fire, и он ещё более тяжёл для ALU. В нём текстурная выборка только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

А вот во втором тесте скорость рендеринга ограничена уже больше производительностью шейдерных блоков, и мы видим схожий результат, и RADEON HD 4770 в этом тесте показывает сравнительную скорость ещё лучшую, по сравнению с предыдущим тестом. Значит, в первом тесте его явно немного ограничивали возможности памяти. Хотя разница не такая уж большая. Не то, что при сравнении с Geforce 9800 GT, в этот раз превосходство HD 4770 превысило два раза! Равночастотные же решения на основе RV740 и RV770LE показывают аналогичные результаты, соответствующие теории. Итог по математическим вычислениям остаётся неизменным — явное и неоспоримое лидерство решений компании AMD.

Direct3D 10: Тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующих частицу. Аналогичные алгоритмы должны получить широкое использование в будущих DirectX 10 играх.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаковое, производительность соответствует количеству точек, с каждым шагом падение FPS составляет около двух раз. Задача для современных видеокарт не очень сложная и ограничение скорости мощностью потоковых процессоров в тесте не явное, задача ограничена также и пропускной способностью памяти, что хорошо видно по результатам HD 4830, которая обгоняет HD 4770. Да и последняя при снижении тактовой частоты чипа не получает прироста.

Возможны и драйверные отличия, уж слишком всё странно в этом тесте. HD 4770 показывает результаты, почти равные тому, что мы видим у Geforce 9800 GT, а HD 4830 быстрее обеих. Да и на равных частотах у HD 4830 есть явное преимущество — видимо, GDDR5 память всё-таки не всегда обеспечивает ту же производительность, что и GDDR3 на вдвое более широкой шине… Возможно, при переносе части вычислений в геометрический шейдер ситуация изменится:

При увеличении нагрузки ситуация немного изменилась. Разница между рассмотренными вариантами теста видна в том, что HD 4770 уже почти не отстаёт от HD 4830. Теперь новое решение AMD обгоняет и своего основного соперника от Nvidia. Интересно, что видеокарта Nvidia и HD 4830 показывают тот же результат при изменении параметра GS load, отвечающем за перенос части вычислений в геометрический шейдер, а результаты новой видеоплаты HD 4770 немного возрастают. Посмотрим, что изменится в следующем тесте, который предполагает большую нагрузку именно на геометрические шейдеры.

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленном в «Heavy» — ещё и для их отрисовки. То есть, в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер. Сначала рассматриваем лёгкий режим:

Относительные результаты в разных режимах соответствуют нагрузке: во всех случаях производительность неплохо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть в два раза медленней. В этот раз скорость RADEON HD 4770 уже во всех подтестах ниже, чем у аналогичной по цене карты Geforce 9800 GT. Скорость у HD 4770 и HD 4830 почти одинаковая, что на номинальных частотах, что на равных, хотя небольшая разница в пользу RV770LE есть.

Судя по всем предыдущим тестам, упор тут наблюдается во что-то отличное от ПСП, филлрейта и вычислительной мощности. И даже от частоты не сильно зависит. Есть вероятность, что скорость упирается в возможности видеодрайвера. Впрочем, относительно единственной Geforce у рассматриваемого HD 4770 показатели неплохие. Цифры должны измениться на следующей диаграмме, в тесте с более активным использованием геометрических шейдеров. Также будет интересно сравнить друг с другом результаты, полученные в «Balanced» и «Heavy» режимах.

Ну вот теперь явно видна хотя бы разница между Nvidia и AMD. В RV7xx было улучшено исполнение геометрических шейдеров, и инженеры компании устранили один из недостатков предыдущих архитектур. Теперь в таких условиях новое решение примерно вдвое быстрее чем Geforce 9800 GT. Интересно, что разница между HD 4830 и HD 4770 остаётся в пользу первого решения, причём она явно превышает возможную ошибку при тестировании. Видимо, всё-таки сказывается разница между GDDR3 и GDDR5. Ну или драйверы для разных моделей оптимизированы по-разному, других вариантов нет.

Что касается сравнения результатов в разных режимах, тут всё как обычно: видеоплаты AMD при переходе от использования «instancing» к геометрическому шейдеру при выводе, улучшают свои показатели, а видеокарты Nvidia теряют в производительности. И если сравнивать цифры, полученные в разных режимах, при условии неизменности получаемой картинки, мы увидим, что скорость видеокарты Nvidia и видеокарт AMD в разных режимах примерно одинакова.

Direct3D 10: Скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи по сути и соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Предыдущие исследования показали, что на результаты этого теста влияет и скорость текстурирования и пропускная способность памяти. И чем проще режим, тем большее влияние на скорость оказывает ПСП. Это хорошо видно по сравнению карт AMD на равных частотах, где выигрыш HD 4830 очевиден. Вероятно, именно HD 4770 больше всего ограничивает именно ПСП.

Но всё же, если брать во внимание стандартные частоты, то во всех режимах, кроме наиболее простого, лидером является рассматриваемая сегодня low-end карта AMD. Но конкуренты близки, а в самом лёгком режиме её обгоняет RADEON HD 4830. Посмотрим на результаты этого же теста с увеличенным количеством текстурных выборок:

Ситуация изменилась совсем немного, в основном это видно по ухудшившимся показателям карты Nvidia. HD 4770 в двух режимах показывает лучший результат, а HD 4830 всё так же обгоняет её в самом лёгком режиме. Сравнение на равных частотах обнажает причину этой разницы — RADEON HD 4770 отстаёт тем больше, чем проще задача и чем больше скорость упирается в возможности видеопамяти. Похоже, что действительно не только ПСП важна, но и задержки, которые у GDDR5 больше.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты в тесте «Waves» очень похожи на те, что мы видели в предыдущий раз. Преимущество продукции AMD даже усилилось, теперь Geforce 9800 GT проигрывает до полутора раз. Новая модель семейства RADEON HD 4700 смотрится неплохо, обгоняя соперника, хотя и уступает теперь своему предшественнику во всех режимах. Но чем тяжелее режим, тем меньше это отставание. Рассмотрим второй вариант этого же теста:

Изменений почти нет, хотя с ростом сложности условий результаты видеоплат AMD становятся ещё лучше относительно скорости карты Nvidia. Geforce 9800 GT снова в полтора раза медленнее, чем анонсированный сегодня RADEON HD 4770. Который в очередной раз в VTF тестах уступает уже уходящему решению HD 4830, основанному на урезанном чипе RV770. Видимо, ограничение скоростью памяти в этом тесте оказывает влияние на конечный результат, пусть упор в память и не полный. А вот что мешает карте Nvidia показывать более высокий результат — это остаётся загадкой.

Выводы по синтетическим тестам

На основе результатов синтетических тестов новой бюджетной модели RADEON HD 4770, выполненной на основе чипа RV740, а также результатов других моделей видеокарт от обоих основных производителей видеочипов, мы делаем вывод, что новое решение компании AMD очень мощное и оно явно выгодно выделяется в своём ценовом диапазоне. HD 4770 должна показать весьма сильные результаты и в игровых приложениях, и практически во всех случаях обгонять своего предшественника HD 4830.

Хотя новый чип относится к архитектуре R7xx, и мало чем отличается от решений на основе урезанных RV770, его явным преимуществом, обусловленным новым технологическим процессом, является большая тактовая частота, которая позволяет предполагать результаты в играх почти на уровне RADEON HD 4850. А в случаях, когда скорость ограничена скоростью заполнения, вполне возможно, что и выше. Ведь игры бывают чаще ограничены возможностями блоков ROP, чем наши тесты, и тут RV740 вполне может иметь преимущество.

Очень важно, что переход на 128-битную шину памяти и использование GDDR5 памяти позволил и снизить себестоимость, и не потерять при этом в производительности. Лишь в малой части синтетических тестов мы видели небольшую разницу в пользу старого решения с 256-битной шиной памяти и чипами GDDR3, а в большинстве случаев решение, используемое в HD 4770, полностью себя оправдало.

Что касается борьбы с заклятым соперником Nvidia, можно сказать, что в большинстве синтетических тестов RADEON HD 4770 значительно опережает по скорости единственного конкурента своего ценового диапазона от компании Nvidia — Geforce 9800 GT. Почти во всех тестах карта на основе чипа RV740 показала лучший результат, на уровне решений из более высокого ценового диапазона. В этом «виновата» и успешная архитектура R7xx, и новый 40 нм техпроцесс.

В следующей части статьи вы увидите тесты нового решения компании AMD в современных игровых приложениях. Игровые результаты должны примерно соответствовать нашим выводам при анализе результатов синтетических тестов, но с учётом того, что скорость рендеринга в играх сильнее зависит от филлрейта и скорости памяти, поэтому в отдельных случаях HD 4770 может показать себя там даже ещё сильнее. Можно предположить, что в среднем скорость HD 4770 в играх превысит производительность HD 4830, новое решение почти догонит HD 4850, и уж точно должно быть быстрее, чем Nvidia Geforce 9800 GT.



ATI RADEON HD 4770 512MB — Часть 3: Игровые тесты (производительность)



Блок питания для тестового стенда предоставлен компанией TAGAN
Монитор Dell 3007WFP для тестовых стендов предоставлен компанией Nvidia