но и оптимизация драйверов с F-buffer-ом…"
СОДЕРЖАНИЕ
- Общие сведения
- Особенности видеокарты ATI RADEON 9800 PRO 128MB
- Конфигурации тестовых стендов и особенности настроек драйверов
- Результаты тестов: коротко о 2D
- Синтетические тесты RightMark3D: идеология и описание тестов
- Результаты тестов: RightMark3D: Pixel Filling
- Результаты тестов: RightMark3D: Geometry Processing Speed
- Результаты тестов: RightMark3D: Hidden Surface Removal
- Результаты тестов: RightMark3D: Pixel Shading
- Результаты тестов: RightMark3D: Point Sprites
- Результаты тестов: Синтетические тесты 3DMark2001 SE
- Выводы из результатов синтетических тестов
- Результаты тестов: Игровые тесты 3DMark2001 SE: Game1
- Результаты тестов: Игровые тесты 3DMark2001 SE: Game2
- Результаты тестов: Игровые тесты 3DMark2001 SE: Game3
- Результаты тестов: Игровые тесты 3DMark2001 SE: Game4
- Результаты тестов: Игровые тесты 3DMark03: Game1
- Результаты тестов: Игровые тесты 3DMark03: Game2
- Результаты тестов: Игровые тесты 3DMark03: Game3
- Результаты тестов: Игровые тесты 3DMark03: Game4
- Результаты тестов: Quake3 ARENA
- Результаты тестов: Serious Sam: The Second Encounter
- Результаты тестов: Return to Castle Wolfenstein
- Результаты тестов: Code Creatures DEMO
- Результаты тестов: Unreal Tournament 2003 DEMO
- Результаты тестов: AquaMark
- Результаты тестов: RightMark 3D
- Результаты тестов: DOOM III Alpha version
- Качество 3D
- Выводы
Не успели отзвучать фанфары по поводу выхода "в свет" последних продуктов от NVIDIA GeForce FX 5600 (NV31) и GeForce FX 5200 (NV34), а также результатов тестирования High-End-долгостроя GeForce FX 5800 (NV30), как канадская компания ATI Technologies снова пошла в атаку и анонсировала также целую линейку нового поколения видеоакселераторов.
Впрочем, как покажут наши исследования ниже, да и судя по тем сведениям, что нам доступны, линейка представляет собой лишь несколько видоизмененные и улучшенные продукты. Давайте посмотрим на новое семейство:
- RADEON 9800 PRO 380 МГц чип, 128 Мбайт 340 МГц (DDR 680) 256 бит локальной памяти;
- RADEON 9800 325? МГц чип, 128 Мбайт 310? МГц (DDR 620?) 256 бит локальной памяти;
- RADEON 9600 PRO 400? МГц чип, 128 Мбайт 300? МГц (DDR 600) 128 бит локальной памяти;
- RADEON 9600 350? МГц чип, 64/128 Мбайт 275? МГц (DDR 550) 128 бит локальной памяти;
- RADEON 9200 PRO 275 МГц чип, 64/128 Мбайт 275 МГц (DDR 550) 128 бит локальной памяти;
- RADEON 9200 250 МГц чип, 64/128 Мбайт 200 МГц (DDR 400) 128 бит локальной памяти.
По сути два последних продукта это тот же RADEON 9000/PRO, но с AGP 8x, поэтому ничего нового. Однако, маркетологи снова выдали перл: присвоили более высокий номер 9200 чипу (карте), который слабее нынешнего RADEON 9100 (бывшего RADEON 8500LE). Что будут представлять собой в реальности 9600 и 9600 PRO, пока никто не знает, но уже некоторые данные имеются, прежде всего о том, что эти процессоры будут фактически половиной от 9800/Pro (4 пиксельных и 2 вершинных конвейера). В Сети имеются утечки информации о том, что производительность новых 9600/PRO ниже, чем у нынешних 9500/PRO. Разумеется, верить слухам неблагодарное дело, по мере появления карт и драйверов мы обязательно их будем исследовать, но все же симптомы пока тревожные, ведь не так давно мы провели тестирование последних продуктов от NVIDIA для mainstream и low-секторов рынка (NV31/34), где эти ускорители в тяжелых режимах работы (АА и анизотропия) весьма успешно соперничали с линейкой RADEON 9500/PRO. Чтож схватка предстоит жаркая!
Впрочем, не будем забегать вперед, время покажет. Сегодня все же мы рассматриваем High-End продукт. Кстати, если вернуться в русло вышеприведенных рассуждений, то зададим вопрос: RADEON 9800 PRO это нечто новое с точки зрения технологий и 3D-функций или же просто разогнанный вариант RADEON 9700 PRO?
Полагаем, что читатели получат исчерпывающий ответ из нашего настоящего материала. Кстати, напомним список обзоров, посвященных RADEON 9700/9700 PRO, откуда можно почерпнуть все подробности, связанные с предыдущим High-End продуктом от ATI:
- Аналитический материал по особенностям архитектуры RADEON 9700 и Microsoft DirectX 9.0
- Базовый обзор ATI RADEON 9700 Pro 128MB
- Обзор Gigabyte MAYA II R9700Pro 128MB производительность на новом стенде на базе Pentium 4 2.53 GHz, а также соперничество с новым драйвером 40.41 от NVIDIA
- Обзор Hercules 3D Prophet 9700 Pro 128MB производительность нового драйвера CATALYST 2.3 в 3DMark2001 SE, бенчмарки Unreal Tournament 2003 DEMO final release
- Обзор PowerColor Evil Commando2 RADEON 9700 Pro 128MB продолжение исследования производительности нового драйвера CATALYST 2.3 на базе игровых тестов, вопросы качества 3D-графики
- Обзор Gigabyte MAYA II RADEON 9500 PRO Pro 128MB более детальное исследование анизотропной фильтрации у RADEON 9700
- Обзор HIS Excalibur RADEON 9700 PRO Тестирование в DirectX 9.0 RC0
- Сводное тестирование ATI RADEON 9500 64MB, 9500 128MB, 9500 PRO, 9700 и 9700 PRO в DirectX 9.0: Часть 1 Игровые тесты и 3DMark2001, а также Soft9700!
- Сводное тестирование ATI RADEON 9500 64MB, 9500 128MB, 9500 PRO, 9700 и 9700 PRO в DirectX 9.0: Часть 2 Тестирование в DirectX 9.0 синтетические тесты из RightMark 3D
- Обзор Sapphire Atlantis RADEON 9700 и RADEON 9700 PRO Ultimate Edition, вариант в стихотворной форме
Приведем характеристики, с которыми RADEON 9800 PRO был анонсирован:
- Технология производства: 0.15 микрон;
- Число транзисторов: 115 миллионов;
- Тактовая частота ядра: 380 МГц;
- Шина памяти: 256 бит DDR (позже, возможно DDR II);
- Максимальный объем локальной памяти: 256 Мб;
- Тактовая частота памяти: 340 DDR (680) МГц, пропускная способность около 24 Гб/сек;
- Интерфейсная шина: AGP 8x, пропускная способность 2 Гб/сек;
- Полная поддержка основных возможностей DX9:
- Плавающие 64 и 128 бит форматы данных для текстур (включая объемные и кубические текстуры) и кадрового буфера (векторы из 4 компонент F16 или F32);
- Пиксельные конвейеры с плавающей арифметикой (формат вычислений F24[4] или F24[3+1]);
- Пиксельные шейдеры версии 2.0;
- Четыре независимых вершинных конвейера;
- Вершинные шейдеры версии 2.0;
- Аппаратная тесселяция N-Patches с картами смещения (Displacement Mapping) и, по желанию, адаптивным уровнем детализации;
- Новая технология F-буфера позволяет исполнять пиксельные шейдеры практически неограниченной длины.
- Восемь независимых пиксельных конвейеров
- Восемь текстурных блоков (по одному на пиксельный конвейер), способных производить трилинейную фильтрацию без потери скорости, а также комбинировать анизотропную фильтрацию с трилинейной.
- Четырехканальный (4 канала по 64 бита) контроллер памяти, связанный с ядром ускорителя и AGP коммутатором "каждый-с-каждым";
- Технология экономии пропускной полосы памяти HyperZ III+ (Быстрая очистка и сжатие буфера глубины на основе блоков 8х8, иерархический Z-буфер для быстрого определения видимости);
- Дополнительные оптимизации для скоростной работы двустороннего буфера шаблонов.
- Ранний Z-тест (пиксельный шейдер выполняется только для видимых пикселей);
- Аппаратное ускорение распаковки и сжатия MPEG 1/2, возможность произвольно обрабатывать видеопоток с помощью пиксельных шейдеров (технология VIDEOSHADER);
- Два независимых CRTC;
- Два встроенных 10 бит 400 МГц RAMDAC с аппаратной гаммакоррекцией;
- Встроенный TV-Out;
- Встроенный DVI (TMDS трансмиттер) интерфейс, разрешение до 2043*1536.
- Встроенный цифровой интерфейс общего назначения для подключения внешнего RAMDAC или DVI трансмиттера, а также для сопряжения с TV тюнером.
- FC корпусовка (FlipChip с перевернутым открытым кристаллом).
Итак, характеристики, очень близки к предыдущему флагману R300. Основным аппаратные отличия кроются в двух областях оптимизации производительности работы с двусторонним буфером шаблонов которая может дать прирост в играх на движке DOOM III и им подобных, интенсивно использующих динамические тени на основе буфера шаблонов, и наличие специальной логики в пиксельных процессорах.
Эта дополнительная возможность позволяет сохранять в локальной памяти ускорителя не только финальные значения цвета, рассчитанные пиксельным шейдером, но и промежуточные значения параметров, возникающих, по ходу расчета. Такой подход называется F-буфером и требует наличия относительно несложной аппаратной поддержки в чипе (запись и восстановление потока параметров) а также специального компилятора. Все вместе это позволяет аппаратно исполнять практически неограниченные по длине шейдеры, разбивая их на куски, каждый из которых отрабатывает отдельно, над целой зоной экрана, для каждого пиксела из этой зоны записывая промежуточные параметры, передаваемые следующему куску шейдера в буфер параметров (F-буфер). Следующий кусок шейдера считывает параметры в той же последовательности, в которой они были записаны, продолжает вычисления, и снова записывает уже новые параметры. Этот подход в большинстве случаев будет более выгодным с точки зрения производительности, чем многопроходное построение изображения. Однако пока, поддержка этой технологии планируется только в OpenGL драйвере.
Разумеется, эта технология нацелена в первую очередь на реалистическую графику и DCC в играх пока еще далеко до полного освоения возможностей даже стандартных ограниченных 64 вычислительными командами пиксельных шейдеров 2.0.
Карта снабжена интерфейсом AGP х2/x4/x8, 128 МБ локальной памяти DDR SDRAM (восемь микросхем, размещенных на лицевой и оборотной сторонах PCB).
![]() | ![]() |
На карте установлены микросхемы памяти Samsung марки K4D26323RA-GC2A, форм-фактора BGA. Максимальная частота работы 350 (700) МГц, поэтому можно сделать вывод, что время выборки 2.8 нс. По умолчанию память работает на частоте 340 (680) МГц, чип 380 МГц. | ![]() |
Как мы видим, используется та же самая память, которую мы могли видеть на RADEON 9700 PRO.
ATI RADEON 9800 PRO 128MB | |
---|---|
![]() | ![]() |
![]() | |
ATI RADEON 9700 PRO 128MB | |
![]() | ![]() |
Как мы видим, повышение частот работы карты привело к существенной переработке PCB, отличия от RADEON 9700 PRO видны невооруженным глазом.
Да и для охлаждения чипа используется кулер несколько иной формы:
Еще когда мы рассматривали RADEON 9700 PRO, то заметили, что у многих карт высота кристалла ниже защитной рамки, которая расположена по периметру подошвы чипа. И в одном из материалов проделали эксперимент по снятию этой рамки, чтобы радиатор лучше прижимался к кристаллу:
Так вот, у RADEON 9800 PRO такой проблемы нет:

Благодаря тому самому выступу на радиаторе он прижимается к кристаллу без всяких помех, что прекрасно видно на просвет. Правда, надо отметить очень грубую обработку подошвы радиатора, что недопустимо для чипов с открытым кристаллом.
Раз мы сняли кулер, то можно оценить и размер кристалла. Он примерно такого же размера, как и R300, но зато имеет несколько иную подложку, придающую ему зеркальность. Упаковка кристалла такая же FCPGA.
Обратим внимание на то, что у карты изменен разъем для внешнего питания. Вероятно достаточно много было критики насчет установки относительно хрупкого разъема типа того, что у Floppy-drive (несколько раз вставить-снять кабель питания, и разъем может просто отвалиться). Поэтому на RADEON 9800 PRO мы видим уже более массивное гнездо для питающего кабеля типа того, что применяется на накопителях (HDD, CDD-ROM).
Что касается TV-out, то отличий в этом плане от RADEON 9700 PRO нет. Более подробно о работе этой функции можно прочитать в материале Андрея Карпенко.
Разгон
Мы хотим сразу выразить благодарность автору RivaTuner-а Алексею Николайчуку за оперативный выпуск новой версии этой утилиты, которая уже поддерживает и RADEON 9800 PRO:


Поэтому разгон очень даже возможен, и RADEON 9800 PRO продемонстрировал прекрасный потенциал 430/385 (770) МГц!
Установка и драйверы
Рассмотрим конфигурацию тестового стенда, на котором проводились испытания карт:
- Компьютер на базе Pentium 4:
- процессор Intel Pentium 4 3066 (HT=ON);
- системная плата ASUS P4G8X (iE7205);
- оперативная память 1024 MB DDR SDRAM;
- жесткий диск Seagate Barracuda IV 40GB;
- операционная система Windows XP SP1.
- Компьютер на базе Athlon XP:
- процессор AMD Athlon XP 2600+ (2133 MHz);
- системная плата EPoX (NVIDIA nForce2);
- оперативная память 1024 MB DDR SDRAM PC3200;
- жесткий диск Seagate Barracuda IV 40GB;
- операционная система Windows XP SP1.
На стендах использовались мониторы ViewSonic P810 (21") и ViewSonic P817 (21").
При тестировании применялись драйверы от ATI CATALYST 3.2 (версия 6.307), VSync отключен, компрессия текстур отключена в приложениях. Установлен DirectX 9.0.
Для сравнительного анализа приведены результаты уже знакомых читателям видеокарт:
- Reference card NVIDIA GeForce FX 5800 Ultra (500/500 (1000) МГц, 128 МБ, driver 42.82 для игровых тестов и 42.68 для 3DMark03);
- Hercules 3D Prophet 9700 PRO (RADEON 9700 PRO, 325/310 (620) МГц, 128 МБ).
Новая версия драйверов 6.307 в плане настроек ничем не отличается от ранее выпускаемых для RADEON 9700. Разве лишь версия SmoothVision и анизотропии проставлена 2.1, а не 2, как ранее. Поэтому мы не будем приводить скриншоты и подробно описывать настройки, читатель сможет это узнать из материала по RADEON 9700 PRO.
Мы акцентируем ваше внимание на возможности форсирования RADEON 9800 в драйверах для RADEON 9700 с помощью Soft9800. Это патч к RivaTuner, он доступен на сайте "Мир NVIDIA", который позволяет драйверам "видеть" не RADEON 9700 PRO, а RADEON 9800 PRO, и, если есть какие-то скрытые возможности или оптимизации, присущие только последнему, они могут стать доступными и RADEON 9700 PRO.
В нашем дальнейшем материале мы провели тщательное расследование того, что же дает "настоящий" RADEON 9800 PRO, а что можно получить от таким образом переделанного в 9800 RADEON 9700 PRO. Результаты весьма интересны. Забегая вперед, можем сказать, что версия, гуляющая в Сети, о том, что
RADEON 9800 PRO = RADEON 9700 PRO + повышенные частоты + оптимизация в драйверах
полностью НЕ подтвердилась, в игровых тестах ситуация неоднозначная. Но это все впереди.
Также хотим сказать, что проведено сравнение работы RADEON 9800 PRO на пониженных до уровня RADEON 9700 PRO частотах.
Отметим, что в дальнейшем термином Soft 9800 PRO мы будем называть RADEON 9700 PRO, запущенный на пропатченных драйверах, которые его определили как RADEON 9800 PRO. Разумеется, если частоты работы не оговорены отдельно, они стандартные для RADEON 9700 PRO 325/620 MHz
2D-графика
2D-графику знал еще император Нерон, который любил не только петь, но и рисовать. Еще в те, очень далекие времена, все окружение императора, а также его мать, знали, что качество 2D очень субъективно, что зависит от качества красок (теперь от качества монитора), от кистей (теперь от видеокарты), да и от взгляда самого художника. Нерон приходил в бешенство от подобной философии, считая, что 2D это некий абсолютный идеал, которому надо поклоняться (что сейчас делают матроксоведы), и даже убил свою мать из-за этого… И по сей день дух Нерона не может успокоиться, являясь обладателям мыльных картинок очередным ужасом, после чего те несутся в форумы с криками о помощи (но не могут рассказать, что же ужасного они видели, Нерон неуловим, его лишь ощущают)… Только там, где есть надежные и экранированные кабели, где есть высококачественные мониторы, там дух Нерона не найдет себе пристанища, и муки чудовищных картинок не доставляют пользователям потерь нервных ресурсов…
Поэтому тестирование 2D у нас происходит на мониторе ViewSonic P817-E совместно с BNC-кабелем Bargo, дух Нерона нам незнаком, да и даже он мог быть довольным: качество-то 2D у RADEON 9800 PRO превосходное! В 1600х1200 при 85Гц, а также 1280х1024 при 120Гц просто все отлично.
Разумеется, невзирая не гнев Нерона, напомню, что качество зависит от конкретного экземпляра.
Синтетические тесты RightMark 3D (DirectX 9)
В этой статье мы представим вам подробные описания и первые результаты тестирования, полученные с помощью разрабатываемого нами набора конфигурируемых синтетических тестов для API DX9.
Набор синтетических тестов из разрабатываемого нами тестового пакета RightMark 3D включает в себя (на данный момент) следующие тесты:
- Тест на закраску и фильтрацию текстур (Pixel Filling Test);
- Тест на производительность обработки геометрии (Geometry Processing Speed Test);
- Тест на производительность работы с отсечением невидимых точек и примитивов (Hidden Surface Removal Test);
- Тест на производительность сложных пиксельных шейдеров (Pixel Shader Test);
- Тест на производительность отрисовки, освещения и анимации спрайтов (Point Sprites Test).
Полагаем, что нет смысл повторять здесь освещение идеологических вопросов тестирования, поэтому еще раз просим желающих узнать по-подробнее об идеологии синтетических тестов прочитать внимательно материал по NV30. Там же можно найти и их описание.
Внутри каждого архива вы найдете описание параметров каждого теста и пример .bat файла, используемого нами для тестирования ускорителей. Мы будем благодарны любым откликам, как в плане пожеланий и идей, так и информации об ошибках или странном поведении тестов.
Пишите по адресу: unclesam@ixbt.com.