|
По сути контрольная панель драйверов особых изменений не претерпела, добавилось лишь меню по AVIVO (о нем в пятой части материала),
в 3D-настройках появились новые опции для Adaptive AA и HQ Aniso. Надо отметить, что улучшена работа карт с TV-out, есть режим вывода на
ТВ (или второй приемник) полноэкранного изображения фильма или иного видеоролика (вне зависимости от выставленного на нем разрешения).
Напомню, что для совместной работы X1800-карт с TV и монитором последний надо подключать к нижнему гнезду на видеокарте.
Синтетические тесты
Использованная нами версия пакета синтетических тестов D3D RightMark Beta 4 (1050) и ее описание доступна
на сайте http://3d.rightmark.org
Параметры D3D вы можете посмотреть и сравнить здесь:
D3D RightMark: X1800 XT, G70
DX Caps: X1800 XT, G70
Тесты проводились:
- На GeForce 7800 GTX, 6600, 6600 GT со стандартными параметрами;
- На оригинальном RADEON X850 XT
- На новых картах RADEON X1300, X1600 XT, X1800 XL, X1800 XT.
Тест Pixel Filling
Пиковая производительность выборки текстур (texelrate), режим FFP, для разного числа текстур накладываемых на один пиксель:
В случае старших карт (первый график) ATI одерживает четкую победу. Дает себя знать более эффективная работа с памятью в том числе благодаря ее скорости и сжатию данных до кэширования, даже большее число конвейеров не спасает 7800 GTX (хотя и проигрыш его не столь силен чтобы говорить о каком либо поражении NVIDIA). Зато в случае среднего сегмента, картина не столь удачная для ATI сказывается перекос в числе текстурных модулей RV530 их всего 4 и это явно недостаточно в данном случае. Этот факт уравнивает RV515 и RV530 в этом тесте и назвать это нормальным мы никак не можем цена этих решений отличается почти вдвое. Возникает подозрение,
что 4 текстурных блока у RV530 вынужденная мера, а изначально их планировалось все-таки большее число. В реальных
приложения этот неприятный эффект будет сглажен, но, и дальше вы это увидите, не настолько, чтобы о нем забыть или
даже считать его оправданным.
А сейчас — скорость закраски буфера кадра (fillrate, pixelrate), режим FFP, для разного числа текстур
накладываемых на один пиксель:
В старшем сегменте в случае с 1 текстурой (и с фиксированным цветом) заметно лидирует ATI. Далее лидерство сохраняется,
но оно уже не столь велико. Однако, учитывая лишь 16 конвейеров R520 можно говорить о более успешной, в этом плане,
архитектуре и прогнозировать ещё большую величину отрыва с выходом R580. В среднем классе опять сказывается печальный
эффект 4-х текстурных модулей только в случае 1-2 текстур ATI обыгрывает противопоставленные карты NVIDIA, а
вот по мере роста числа текстур RV530 заметно сдает свои позиции. Шутка-ли двукратная разница в числе
текстурных блоков.
Посмотрим, как скорость закраски зависит от наличия шейдеров (2.0):
та же картина для среднего класса:
Итак, можно констатировать что ничего не изменилось как FFP так и шейдеры работают совершенно одинаково с
точки зрения железа (FFP эмулируется шейдером) и показывают одинаковые результаты. Все та же хорошо заметная
проблема с небольшим числом текстурных блоков RV530 и все тоже примущество R520 в грубой закраске, несмотря на
меньшее число пиксельных конвейеров.
Тест Geometry Processing Speed
Самый простой шейдер — предельная пропускная способность по треугольникам:
Итак, G70 по прежнему несомненный лидер, a X1800 не далеко ушла в плане пиковой скорости геометрии от X850 XT. В
среднем классе ATI задает жару NVIDIA заметно проигрывает. Значит у ATI более эффективный и широкий блок
установки и отбрасывания треугольников.
Более сложный шейдер — один смешанный источник света:
Усложняем задачу и для среднего класса:
Как мы видим, везде FFP чуть быстрее сказывается наличие специальных аппаратных блоков для его эмуляции
(было время когда ATI манкировали этой возможностью, но теперь это не так). А теперь самая сложная задача, три
источника света, причем, для сравнения в вариантах без переходов, со статическим и динамическим управлением
исполнением:
Вот здесь ATI впереди во всех случаях. С ростом сложности задачи преимущество 7800 в обработке простых
треугольников пропало, а частота ядра X1800 XT дает развернуться его геометрическим возможностям. Интересно, что если
шейдеры с динамическими переходами на новых продуктах ATI заработали, то такие же шейдеры с указанием модели 3.0
почему то исполняются неверно судя по всему мы наткнулись на ошибку в драйверах или странности при его
взаимодействии с нашим тестом. Но, как бы там нибыло переходы что в 2.X динамическом профиле, что в 3.0 у нас
одинаковые и мы можем оценить эффективность реализации динамчиеских переходов у ATI. Она ниже чем статическая версия,
как и у NVIDIA, и накладные расходы чуть выше, но больше в абсолюте, из-за более мощного геометрического блока вообще.
Напомним, что, к сожалению, новые продукты ATI не поддерживают доступ к текстурам из вершинных шейдеров.
Итак, если не считать отсутствие доступа к текстурами и странности с компиляцией и исполнением шейдеров 3.0,
вершинные блоки продуктов ATI заслуживают похвалу всё на уровне!
Тест Pixel Shaders
Первая группа шейдеров — достаточно простых для исполнения в реальном времени, 1.1, 1.4 и 2.0:
В старшей группе царит примерный паритет 7800 и X1800 XT с одной стороны эффективные конвейеры и частота, с
другой 24 пиксельных конвейера. Победила дружба, точнее противостояние. А вот в средней группе мы опять
замечаем досадное поведение RV530 нехорошо. 4 текстурных модуля снова «портят нам малину» и даже 12
пиксельных конвейеров не спасают X1600. Он ЗАМЕТНО проигрывает 6600 GT. Плохо!
Интересно, что NVIDIA в силу наличия карусели квадов и весьма бережного отношения ко временным регистрам до
сих пор получает преимущество от использования 16 битных регистров, во время обработки промежуточных данных в шейдере!
А вот архитектура ATI свободна от этой зависимости она построена по иному принцыпу и не зависит так сильно от
числа и размера временных переменных при компиляции шейдера. Это похвально! И должно заметно сказаться на
эффективности сложных шейдеров с вычислениями. Итак, посмотрим, изменится ли что-либо для более сложных шейдеров:
В старшем классе в режиме 16 бит выигрывает 7800. Но, это 16 бит со всеми потенциальными артефактами. В режиме
FP32 мы наблюдаем паритет. Интересно что в среднем классе ATI безоговорочно выигрывает. Даже, несмотря на 4 текстурных
блока. Ну правильно много вычислений, меньше доступов к текстурам. Но в реальных играх такие сложные шейдеры
редки и не стоит об этом забывать. Эх, если бы текстурников было 12 как бы развернулся этот чип и во всех
остальных тестах. 6600 GT был бы просто сметен X1600 XT, но этого не случилось. Досадный промах или досадные
обстоятельства...
Тест HSR
Пиковая эффективность (без текстур и с текстурами) в зависимости от сложности геометрии:
Эффективность HSR топового решения ATI традиционно выше, как и ранее. Хотя, из-за более низкой латентности работы с
текстурами NVIDIA заметно лучше выглядит в случае тестирования HSR совместно с текстурированием. А вот в среднем
классе все не так просто с текстурами ATI выглядит даже чуть хуже 6600/GT, особенно RV515 там HyperZ
очевидно слабее, чем в старших чипах ATI.
Тест Point Sprites
Все как и раньше NVIDIA лучше справляется с маленькими спрайтами, а ATI с большими. В случае освещения
ATI получает еще немного преимущества вершинные блоки там сильнее.
Выводы по синтетическим тестам
- Самая досадная проблема 4 текстурных блока RV530. Не надо быть провидцем чтобы предсказать, что она
аукнется и в реальных игровых тестах. Если бы их было 8 или 12 6600 GT заметно проиграл бы X1600 XT, но при
текущей ситуации можно говорить о паритете с переменным успехом. В чем же всё-таки дело в ТАКОЙ просчет
архитекторов слабо верится, неужели проблемы с реализацией и производством?
- В верхнем классе R520 опережает или равен 7800 в зависимости от теста и параметров. Что очень неплохо, учитывая
его 16 конвейеров. Это говорит о крайне эффективной архитектуре пиксельной части, которая только выиграет в случае
последующего масштабирования (R580). Пока что нет явного превосходства над 7800, но есть факт доминирования во многих
предельных синтетических тестах. Это не победа, это разумеется и не поражение, это хорший задел.
- Эффективность вычислительной части пиксельных процессоров ATI на высоте. Хороший задел для будущего и будущих
архитектур с поддержкой WGF 2.0 которые будет не сложно развить из текущей архитектуры, в силу ее особенностей.
- Вершинная производительность ATI на высоте (хотя и есть небольшие выше упомянутые «но»).
Впереди еще будут части по тестам в играх и по изучению AVIVO. Оставайтесь с нами!
Процессор для тестирования предоставлен компанией 
|