Контрнаступление ATI Technologies:

семейство RADEON X1800 (R520), X1600 (RV530) и X1300 (RV515)



Часть 2: Особенности видеокарт, синтетические тесты

СОДЕРЖАНИЕ

  1. Часть 1 — Теория и архитектура
  2. Часть 2 — Практическое знакомство
  3. Особенности видеокарт
  4. Конфигурации стендов, список тестовых инструментов
  5. Результаты синтетических тестов

Установка и драйверы

Конфигурации тестовых стендов:

  • Компьютер на базе Athlon 64 (939Socket)
    • процессор AMD Athlon 4000+ (2400MHz) (L2=1024K);
    • системная плата ASUS A8N SLI Deluxe на чипсете NVIDIA nForce4 SLI;
    • оперативная память 1 GB DDR SDRAM 400MHz (CAS (tCL)=2.5; RAS to CAS delay (tRCD)=3; Row Precharge (tRP)=3; tRAS=6);
    • жесткий диск WD Caviar SE WD1600JD 160GB SATA.
  • RADEON X850 XT PE (PowerColor RX850XT PE, PCI-E, 256MB GDDR3, 540/1180 MHz);
  • GeForce 7800 GTX (ASUS EN7800GTX TOP, PCI-E, 256MB GDDR3, 486/1350 MHz);
  • GeForce 7800 GTX (Leadtek WinFast PX7800GTX, PCI-E, 256MB GDDR3, 430/1200 MHz);
  • GeForce 7800 GTX (Gainward PowerPack Ultra/3500 GS, PCI-E, 256MB GDDR3, 459/1300 MHz);
  • GeForce 7800 GT (Gainward PowerPack Ultra/3400 GS, PCI-E, 256MB GDDR3, 450/1100 MHz);
  • GeForce 7800 GT (Palit, PCI-E, 256MB GDDR3, 400/1000 MHz);
  • операционная система Windows XP SP2; DirectX 9.0c;
  • мониторы ViewSonic P810 (21") и Mitsubishi Diamond Pro 2070sb (21").
  • драйверы ATI версии 6.571beta (CATALYST 5.10beta); NVIDIA версии 81.84.

VSync отключен.










По сути контрольная панель драйверов особых изменений не претерпела, добавилось лишь меню по AVIVO (о нем в пятой части материала), в 3D-настройках появились новые опции для Adaptive AA и HQ Aniso. Надо отметить, что улучшена работа карт с TV-out, есть режим вывода на ТВ (или второй приемник) полноэкранного изображения фильма или иного видеоролика (вне зависимости от выставленного на нем разрешения).

Напомню, что для совместной работы X1800-карт с TV и монитором последний надо подключать к нижнему гнезду на видеокарте.

Синтетические тесты

Использованная нами версия пакета синтетических тестов D3D RightMark Beta 4 (1050) и ее описание доступна на сайте 3d.rightmark.org.

Параметры D3D вы можете посмотреть и сравнить здесь:

D3D RightMark: X1800 XT, G70
DX Caps: X1800 XT, G70

Тесты проводились:

  • На GeForce 7800 GTX, 6600, 6600 GT со стандартными параметрами;
  • На оригинальном RADEON X850 XT
  • На новых картах RADEON X1300, X1600 XT, X1800 XL, X1800 XT.

Тест Pixel Filling

Пиковая производительность выборки текстур (texelrate), режим FFP, для разного числа текстур накладываемых на один пиксель:



В случае старших карт (первый график) ATI одерживает четкую победу. Дает себя знать более эффективная работа с памятью в том числе благодаря ее скорости и сжатию данных до кэширования, даже большее число конвейеров не спасает 7800 GTX (хотя и проигрыш его не столь силен чтобы говорить о каком либо поражении NVIDIA). Зато в случае среднего сегмента, картина не столь удачная для ATI — сказывается перекос в числе текстурных модулей RV530 — их всего 4 и это явно недостаточно в данном случае. Этот факт уравнивает RV515 и RV530 в этом тесте и назвать это нормальным мы никак не можем — цена этих решений отличается почти вдвое. Возникает подозрение, что 4 текстурных блока у RV530 — вынужденная мера, а изначально их планировалось все-таки большее число. В реальных приложения этот неприятный эффект будет сглажен, но, и дальше вы это увидите, не настолько, чтобы о нем забыть или даже считать его оправданным.

А сейчас — скорость закраски буфера кадра (fillrate, pixelrate), режим FFP, для разного числа текстур накладываемых на один пиксель:

В старшем сегменте в случае с 1 текстурой (и с фиксированным цветом) заметно лидирует ATI. Далее лидерство сохраняется, но оно уже не столь велико. Однако, учитывая лишь 16 конвейеров R520 можно говорить о более успешной, в этом плане, архитектуре и прогнозировать ещё большую величину отрыва с выходом R580. В среднем классе опять сказывается печальный эффект 4-х текстурных модулей — только в случае 1-2 текстур ATI обыгрывает противопоставленные карты NVIDIA, а вот по мере роста числа текстур RV530 заметно сдает свои позиции. Шутка-ли — двукратная разница в числе текстурных блоков.

Посмотрим, как скорость закраски зависит от наличия шейдеров (2.0):

та же картина для среднего класса:

Итак, можно констатировать что ничего не изменилось — как FFP так и шейдеры работают совершенно одинаково с точки зрения железа (FFP эмулируется шейдером) и показывают одинаковые результаты. Все та же хорошо заметная проблема с небольшим числом текстурных блоков RV530 и все тоже примущество R520 в грубой закраске, несмотря на меньшее число пиксельных конвейеров.

Тест Geometry Processing Speed

Самый простой шейдер — предельная пропускная способность по треугольникам:



Итак, G70 по прежнему несомненный лидер, a X1800 не далеко ушла в плане пиковой скорости геометрии от X850 XT. В среднем классе ATI задает жару — NVIDIA заметно проигрывает. Значит у ATI более эффективный и широкий блок установки и отбрасывания треугольников.

Более сложный шейдер — один смешанный источник света:

Усложняем задачу и для среднего класса:

Как мы видим, везде FFP чуть быстрее — сказывается наличие специальных аппаратных блоков для его эмуляции (было время когда ATI манкировали этой возможностью, но теперь это не так). А теперь самая сложная задача, три источника света, причем, для сравнения в вариантах без переходов, со статическим и динамическим управлением исполнением:



Вот здесь ATI впереди во всех случаях. С ростом сложности задачи преимущество 7800 в обработке простых треугольников пропало, а частота ядра X1800 XT дает развернуться его геометрическим возможностям. Интересно, что если шейдеры с динамическими переходами на новых продуктах ATI заработали, то такие же шейдеры с указанием модели 3.0 почему то исполняются неверно — судя по всему мы наткнулись на ошибку в драйверах или странности при его взаимодействии с нашим тестом. Но, как бы там нибыло — переходы что в 2.X динамическом профиле, что в 3.0 у нас одинаковые и мы можем оценить эффективность реализации динамчиеских переходов у ATI. Она ниже чем статическая версия, как и у NVIDIA, и накладные расходы чуть выше, но больше в абсолюте, из-за более мощного геометрического блока вообще. Напомним, что, к сожалению, новые продукты ATI не поддерживают доступ к текстурам из вершинных шейдеров.

Итак, если не считать отсутствие доступа к текстурами и странности с компиляцией и исполнением шейдеров 3.0, вершинные блоки продуктов ATI заслуживают похвалу — всё на уровне!

Тест Pixel Shaders

Первая группа шейдеров — достаточно простых для исполнения в реальном времени, 1.1, 1.4 и 2.0:



В старшей группе царит примерный паритет 7800 и X1800 XT — с одной стороны эффективные конвейеры и частота, с другой — 24 пиксельных конвейера. Победила дружба, точнее противостояние. А вот в средней группе мы опять замечаем досадное поведение RV530 — нехорошо. 4 текстурных модуля снова «портят нам малину» и даже 12 пиксельных конвейеров не спасают X1600. Он ЗАМЕТНО проигрывает 6600 GT. Плохо!

Интересно, что NVIDIA в силу наличия карусели квадов и весьма бережного отношения ко временным регистрам до сих пор получает преимущество от использования 16 битных регистров, во время обработки промежуточных данных в шейдере! А вот архитектура ATI свободна от этой зависимости — она построена по иному принцыпу и не зависит так сильно от числа и размера временных переменных при компиляции шейдера. Это похвально! И должно заметно сказаться на эффективности сложных шейдеров с вычислениями. Итак, посмотрим, изменится ли что-либо для более сложных шейдеров:



В старшем классе в режиме 16 бит выигрывает 7800. Но, это 16 бит со всеми потенциальными артефактами. В режиме FP32 мы наблюдаем паритет. Интересно что в среднем классе ATI безоговорочно выигрывает. Даже, несмотря на 4 текстурных блока. Ну правильно — много вычислений, меньше доступов к текстурам. Но в реальных играх такие сложные шейдеры редки и не стоит об этом забывать. Эх, если бы текстурников было 12 — как бы развернулся этот чип и во всех остальных тестах. 6600 GT был бы просто сметен X1600 XT, но этого не случилось. Досадный промах или досадные обстоятельства…

Тест HSR

Пиковая эффективность (без текстур и с текстурами) в зависимости от сложности геометрии:







Эффективность HSR топового решения ATI традиционно выше, как и ранее. Хотя, из-за более низкой латентности работы с текстурами NVIDIA заметно лучше выглядит в случае тестирования HSR совместно с текстурированием. А вот в среднем классе все не так просто — с текстурами ATI выглядит даже чуть хуже 6600/GT, особенно RV515 — там HyperZ очевидно слабее, чем в старших чипах ATI.

Тест Point Sprites







Все как и раньше — NVIDIA лучше справляется с маленькими спрайтами, а ATI с большими. В случае освещения ATI получает еще немного преимущества — вершинные блоки там сильнее.

Выводы по синтетическим тестам

  1. Самая досадная проблема — 4 текстурных блока RV530. Не надо быть провидцем чтобы предсказать, что она аукнется и в реальных игровых тестах. Если бы их было 8 или 12 — 6600 GT заметно проиграл бы X1600 XT, но при текущей ситуации можно говорить о паритете с переменным успехом. В чем же всё-таки дело — в ТАКОЙ просчет архитекторов слабо верится, неужели проблемы с реализацией и производством?
  2. В верхнем классе R520 опережает или равен 7800 в зависимости от теста и параметров. Что очень неплохо, учитывая его 16 конвейеров. Это говорит о крайне эффективной архитектуре пиксельной части, которая только выиграет в случае последующего масштабирования (R580). Пока что нет явного превосходства над 7800, но есть факт доминирования во многих предельных синтетических тестах. Это не победа, это разумеется и не поражение, это хорший задел.
  3. Эффективность вычислительной части пиксельных процессоров ATI на высоте. Хороший задел для будущего и будущих архитектур с поддержкой WGF 2.0 — которые будет не сложно развить из текущей архитектуры, в силу ее особенностей.
  4. Вершинная производительность ATI на высоте (хотя и есть небольшие выше упомянутые «но»).


Контрнаступление ATI Technologies: семейство RADEON X1800 (R520), X1600 (RV530) и X1300 (RV515) — Часть 2 (начало): Описание карт

Впереди еще будут части по тестам в играх и по изучению AVIVO. Оставайтесь с нами!

Контрнаступление ATI Technologies: семейство RADEON X1800 (R520), X1600 (RV530) и X1300 (RV515) — Часть 3: Игровые тесты (производительность)






Дополнительно

Контрнаступление ATI Technologies: семейство RADEON X1800 (R520), X1600 (RV530) и X1300 (RV515)

Контрнаступление ATI Technologies:

семейство RADEON X1800 (R520), X1600 (RV530) и X1300 (RV515)


Часть 2: Особенности видеокарт, синтетические тесты

СОДЕРЖАНИЕ

  1. Часть 1 — Теория и архитектура
  2. Часть 2 — Практическое знакомство
  3. Особенности видеокарт
  4. Конфигурации стендов, список тестовых инструментов
  5. Результаты синтетических тестов

Установка и драйверы

Конфигурации тестовых стендов:

  • Компьютер на базе Athlon 64 (939Socket)
    • процессор AMD Athlon 4000+ (2400MHz) (L2=1024K);
    • системная плата ASUS A8N SLI Deluxe на чипсете NVIDIA nForce4 SLI;
    • оперативная память 1 GB DDR SDRAM 400MHz (CAS (tCL)=2.5; RAS to CAS delay (tRCD)=3; Row Precharge (tRP)=3; tRAS=6);
    • жесткий диск WD Caviar SE WD1600JD 160GB SATA.
  • RADEON X850 XT PE (PowerColor RX850XT PE, PCI-E, 256MB GDDR3, 540/1180 MHz);
  • GeForce 7800 GTX (ASUS EN7800GTX TOP, PCI-E, 256MB GDDR3, 486/1350 MHz);
  • GeForce 7800 GTX (Leadtek WinFast PX7800GTX, PCI-E, 256MB GDDR3, 430/1200 MHz);
  • GeForce 7800 GTX (Gainward PowerPack Ultra/3500 GS, PCI-E, 256MB GDDR3, 459/1300 MHz);
  • GeForce 7800 GT (Gainward PowerPack Ultra/3400 GS, PCI-E, 256MB GDDR3, 450/1100 MHz);
  • GeForce 7800 GT (Palit, PCI-E, 256MB GDDR3, 400/1000 MHz);
  • операционная система Windows XP SP2; DirectX 9.0c;
  • мониторы ViewSonic P810 (21") и Mitsubishi Diamond Pro 2070sb (21").
  • драйверы ATI версии 6.571beta (CATALYST 5.10beta); NVIDIA версии 81.84.

VSync отключен.










По сути контрольная панель драйверов особых изменений не претерпела, добавилось лишь меню по AVIVO (о нем в пятой части материала), в 3D-настройках появились новые опции для Adaptive AA и HQ Aniso. Надо отметить, что улучшена работа карт с TV-out, есть режим вывода на ТВ (или второй приемник) полноэкранного изображения фильма или иного видеоролика (вне зависимости от выставленного на нем разрешения).

Напомню, что для совместной работы X1800-карт с TV и монитором последний надо подключать к нижнему гнезду на видеокарте.

Синтетические тесты

Использованная нами версия пакета синтетических тестов D3D RightMark Beta 4 (1050) и ее описание доступна на сайте 3d.rightmark.org.

Параметры D3D вы можете посмотреть и сравнить здесь:

D3D RightMark: X1800 XT, G70
DX Caps: X1800 XT, G70

Тесты проводились:

  • На GeForce 7800 GTX, 6600, 6600 GT со стандартными параметрами;
  • На оригинальном RADEON X850 XT
  • На новых картах RADEON X1300, X1600 XT, X1800 XL, X1800 XT.

Тест Pixel Filling

Пиковая производительность выборки текстур (texelrate), режим FFP, для разного числа текстур накладываемых на один пиксель:



В случае старших карт (первый график) ATI одерживает четкую победу. Дает себя знать более эффективная работа с памятью в том числе благодаря ее скорости и сжатию данных до кэширования, даже большее число конвейеров не спасает 7800 GTX (хотя и проигрыш его не столь силен чтобы говорить о каком либо поражении NVIDIA). Зато в случае среднего сегмента, картина не столь удачная для ATI — сказывается перекос в числе текстурных модулей RV530 — их всего 4 и это явно недостаточно в данном случае. Этот факт уравнивает RV515 и RV530 в этом тесте и назвать это нормальным мы никак не можем — цена этих решений отличается почти вдвое. Возникает подозрение, что 4 текстурных блока у RV530 — вынужденная мера, а изначально их планировалось все-таки большее число. В реальных приложения этот неприятный эффект будет сглажен, но, и дальше вы это увидите, не настолько, чтобы о нем забыть или даже считать его оправданным.

А сейчас — скорость закраски буфера кадра (fillrate, pixelrate), режим FFP, для разного числа текстур накладываемых на один пиксель:

В старшем сегменте в случае с 1 текстурой (и с фиксированным цветом) заметно лидирует ATI. Далее лидерство сохраняется, но оно уже не столь велико. Однако, учитывая лишь 16 конвейеров R520 можно говорить о более успешной, в этом плане, архитектуре и прогнозировать ещё большую величину отрыва с выходом R580. В среднем классе опять сказывается печальный эффект 4-х текстурных модулей — только в случае 1-2 текстур ATI обыгрывает противопоставленные карты NVIDIA, а вот по мере роста числа текстур RV530 заметно сдает свои позиции. Шутка-ли — двукратная разница в числе текстурных блоков.

Посмотрим, как скорость закраски зависит от наличия шейдеров (2.0):

та же картина для среднего класса:

Итак, можно констатировать что ничего не изменилось — как FFP так и шейдеры работают совершенно одинаково с точки зрения железа (FFP эмулируется шейдером) и показывают одинаковые результаты. Все та же хорошо заметная проблема с небольшим числом текстурных блоков RV530 и все тоже примущество R520 в грубой закраске, несмотря на меньшее число пиксельных конвейеров.

Тест Geometry Processing Speed

Самый простой шейдер — предельная пропускная способность по треугольникам:



Итак, G70 по прежнему несомненный лидер, a X1800 не далеко ушла в плане пиковой скорости геометрии от X850 XT. В среднем классе ATI задает жару — NVIDIA заметно проигрывает. Значит у ATI более эффективный и широкий блок установки и отбрасывания треугольников.

Более сложный шейдер — один смешанный источник света:

Усложняем задачу и для среднего класса:

Как мы видим, везде FFP чуть быстрее — сказывается наличие специальных аппаратных блоков для его эмуляции (было время когда ATI манкировали этой возможностью, но теперь это не так). А теперь самая сложная задача, три источника света, причем, для сравнения в вариантах без переходов, со статическим и динамическим управлением исполнением:



Вот здесь ATI впереди во всех случаях. С ростом сложности задачи преимущество 7800 в обработке простых треугольников пропало, а частота ядра X1800 XT дает развернуться его геометрическим возможностям. Интересно, что если шейдеры с динамическими переходами на новых продуктах ATI заработали, то такие же шейдеры с указанием модели 3.0 почему то исполняются неверно — судя по всему мы наткнулись на ошибку в драйверах или странности при его взаимодействии с нашим тестом. Но, как бы там нибыло — переходы что в 2.X динамическом профиле, что в 3.0 у нас одинаковые и мы можем оценить эффективность реализации динамчиеских переходов у ATI. Она ниже чем статическая версия, как и у NVIDIA, и накладные расходы чуть выше, но больше в абсолюте, из-за более мощного геометрического блока вообще. Напомним, что, к сожалению, новые продукты ATI не поддерживают доступ к текстурам из вершинных шейдеров.

Итак, если не считать отсутствие доступа к текстурами и странности с компиляцией и исполнением шейдеров 3.0, вершинные блоки продуктов ATI заслуживают похвалу — всё на уровне!

Тест Pixel Shaders

Первая группа шейдеров — достаточно простых для исполнения в реальном времени, 1.1, 1.4 и 2.0:



В старшей группе царит примерный паритет 7800 и X1800 XT — с одной стороны эффективные конвейеры и частота, с другой — 24 пиксельных конвейера. Победила дружба, точнее противостояние. А вот в средней группе мы опять замечаем досадное поведение RV530 — нехорошо. 4 текстурных модуля снова «портят нам малину» и даже 12 пиксельных конвейеров не спасают X1600. Он ЗАМЕТНО проигрывает 6600 GT. Плохо!

Интересно, что NVIDIA в силу наличия карусели квадов и весьма бережного отношения ко временным регистрам до сих пор получает преимущество от использования 16 битных регистров, во время обработки промежуточных данных в шейдере! А вот архитектура ATI свободна от этой зависимости — она построена по иному принцыпу и не зависит так сильно от числа и размера временных переменных при компиляции шейдера. Это похвально! И должно заметно сказаться на эффективности сложных шейдеров с вычислениями. Итак, посмотрим, изменится ли что-либо для более сложных шейдеров:



В старшем классе в режиме 16 бит выигрывает 7800. Но, это 16 бит со всеми потенциальными артефактами. В режиме FP32 мы наблюдаем паритет. Интересно что в среднем классе ATI безоговорочно выигрывает. Даже, несмотря на 4 текстурных блока. Ну правильно — много вычислений, меньше доступов к текстурам. Но в реальных играх такие сложные шейдеры редки и не стоит об этом забывать. Эх, если бы текстурников было 12 — как бы развернулся этот чип и во всех остальных тестах. 6600 GT был бы просто сметен X1600 XT, но этого не случилось. Досадный промах или досадные обстоятельства…

Тест HSR

Пиковая эффективность (без текстур и с текстурами) в зависимости от сложности геометрии:







Эффективность HSR топового решения ATI традиционно выше, как и ранее. Хотя, из-за более низкой латентности работы с текстурами NVIDIA заметно лучше выглядит в случае тестирования HSR совместно с текстурированием. А вот в среднем классе все не так просто — с текстурами ATI выглядит даже чуть хуже 6600/GT, особенно RV515 — там HyperZ очевидно слабее, чем в старших чипах ATI.

Тест Point Sprites







Все как и раньше — NVIDIA лучше справляется с маленькими спрайтами, а ATI с большими. В случае освещения ATI получает еще немного преимущества — вершинные блоки там сильнее.

Выводы по синтетическим тестам

  1. Самая досадная проблема — 4 текстурных блока RV530. Не надо быть провидцем чтобы предсказать, что она аукнется и в реальных игровых тестах. Если бы их было 8 или 12 — 6600 GT заметно проиграл бы X1600 XT, но при текущей ситуации можно говорить о паритете с переменным успехом. В чем же всё-таки дело — в ТАКОЙ просчет архитекторов слабо верится, неужели проблемы с реализацией и производством?
  2. В верхнем классе R520 опережает или равен 7800 в зависимости от теста и параметров. Что очень неплохо, учитывая его 16 конвейеров. Это говорит о крайне эффективной архитектуре пиксельной части, которая только выиграет в случае последующего масштабирования (R580). Пока что нет явного превосходства над 7800, но есть факт доминирования во многих предельных синтетических тестах. Это не победа, это разумеется и не поражение, это хорший задел.
  3. Эффективность вычислительной части пиксельных процессоров ATI на высоте. Хороший задел для будущего и будущих архитектур с поддержкой WGF 2.0 — которые будет не сложно развить из текущей архитектуры, в силу ее особенностей.
  4. Вершинная производительность ATI на высоте (хотя и есть небольшие выше упомянутые «но»).


Контрнаступление ATI Technologies: семейство RADEON X1800 (R520), X1600 (RV530) и X1300 (RV515) — Часть 2 (начало): Описание карт

Впереди еще будут части по тестам в играх и по изучению AVIVO. Оставайтесь с нами!

Контрнаступление ATI Technologies: семейство RADEON X1800 (R520), X1600 (RV530) и X1300 (RV515) — Часть 3: Игровые тесты (производительность)