![]()
Заострим наше внимание на некоторых пунктах:
Несмотря на то, что компания ATI позиционирует RADEON 9000 исключительно как революционное изменение относительно RADEON 7500, мы-то с вами видим, что по сути это урезанный RADEON 8500 с добавлением ряда функций. Разумеется, это только с точки зрения оценки возможностей, а не технологий производства, так как по размерам крышки (да и предположительно по разводке) RV250 соответствует все же RADEON 7500. По сути получается, что у RADEON 8500 урезали текстурные блоки, вместо двух контроллеров памяти по 64-бит использовали старый 128-битный, добавили второй RAMDAC, поддержку TV-out, и получился RADEON 9000. Есть еще сомнения насчет полноты поддержки HyperZ II, но тут пока сложно что-либо сказать. В принципе, это оптимальный способ сделать из High-End бюджетную карту. Во всяком случае, все интересные функции у RV250 оставлены (полная поддержка DX 8.1.) Ну что ж, перейдем к рассмотрению непосредственно самой карты. ПлатаЗамечу, что в качестве RV250 мы рассматриваем опытный образец в исполнении Gigabyte.
Карта снабжена
К сожалению, на момент написания этого материала в нашей лаборатории не было
референс-карты, поэтому для того, чтобы понять, что карта от Gigabyte
полностью повторяет эталонный дизайн, приведу фотографию карты из материалов
ATI:
Мы видим, что дизайн у RADEON 9000 относительно прост, примерно такой же в плане сложности разводки, как и у RADEON 7500, хотя и кардинально отличается от последнего. Заметим, что у карты имеется все три уже ставшие привычными гнезда: DVI, VGA и TV-out. Сразу скажу, что из-за ограниченности по времени протестировать TV-out мы не успели. Сделаем это чуть позже.
Я уже ранее говорил, что размеры GPU меньше, чем у RADEON 8500. Если снять кулер, то мы можем лицезреть
этот процессор:
Несмотря на то, что частоты у него вполне обычные для RADEON 7500, сложность самого чипа все же создает
проблемы с терморежимом его работы, поэтому крышка у него металлическая.
А вот кулер установлен вполне обычной формы.
РазгонПоследняя версия (3.20) PowerStrip уже умеет работать с RV250, поэтому разгон возможен. А потенциал карты таков, что она смогла без проблем работать на частотах 300/310 (620) МГц без дополнительного охлаждения. Установка и драйверыРассмотрим конфигурацию тестового стенда, на котором проводились испытания карт:
На стенде использовались мониторы При тестировании применялись драйверы от ATI Catalyst версии 6.118. VSync отключен. Для сравнительного анализа приведены результаты уже знакомых читателям видеокарт:
Настройки драйверов
Как уже известно, настройки драйвера Catalyst существенно отличаются от ранее привычных читателям панелей:
При тестировании наша цель - показ работы карты при максимально возможном качестве (без активизации дополнительных функций, таких, как анизотропия), поэтому все настройки выставляются соответствующим образом. Замечу, что в Direct3D условие максимальной детализации текстур идет по умолчанию. Результаты тестов
2D-графикаЯ сразу скажу, что мы тестировали опытный образец, поэтому оценка качества 2D будет очень и очень условной. В целом замечу, что нарекания в высоких разрешениях были, в частности, в 1280х1024 при 100Гц замыливание уже очевидно. Однако добавлю, что оценка 2D-качества есть вещь субъективная. Подобные платы будут выпускать много фирм, поэтому качество будет зависеть от конкретного экземпляра, а также от связки карта-монитор, которые могут по-прежнему играть огромную роль, прежде всего, качество монитора и кабеля. 3D-графика, MS DirectX 8.1 SDK - предельные тестыДля тестирования различных предельных характеристик чипов мы использовали модифицированные (для большего удобства и контроля) примеры из последней версии DirectX SDK (8.1, релиз). Без лишних преамбул перейдем к уже хорошо знакомым нашим постоянным читателям тестам: Optimized Mesh Этот тест призван выяснить практический предел пропускной способности
ускорителя по треугольникам. Для этого используется несколько одновременно
выводимых в небольшом окне моделей, каждая из которых состоит из 50
тысяч треугольников. Текстурирование отсутствует. Размеры моделей минимальны
- каждый треугольник не превышает одного пиксела. Хочется сразу отметить,
что результат этого теста, разумеется, останется недостижим для реальных
приложений, где размеры треугольников значительны, присутствуют текстуры
и освещение. Приведем результаты этого теста для трех методов отрисовки
- оптимизированной для оптимальной скорости вывода (в том числе, с учетом
размера внутреннего кэша вершин на чипе) модели - Optimized, неоптимизированной
исходной модели - Unoptimized и той же неоптимизированной модели, выводимой
в виде одного Triangle Strip - Strip:
В случае полностью оптимизированной модели, когда влияние подсистемы памяти минимально, мы видим, что у RADEON 9000 более слабый Hardware T&L блок, и это сказывается на результатах данного теста не лучшим образом. Когда используется 1 Strip, то в этом типе представления моделей (который достаточно популярен в играх) RADEON 9000 практически идет вровень с 8500, отсюда вывод, что геометрические кэши очереди RV250 сделаны столь же добротно, а вот кеш с произвольным доступом слабее (меньше), чем у RADEON 8500. Что ж, не забываем, что это бюджетная версия чипа, и, в первую очередь, имеет смысл экономить транзисторы кэша, которых в любом чипе очень много. Производительность блока вершинного шейдера
Этот тест позволяет определить предельную производительность блока вершинных шейдеров. Выполняется
достаточно сложный шейдер, вычисляющий как видовые преобразования, так и геометрические функции. Тест
проводится в минимальном разрешении, дабы минимизировать влияние закраски:
Как мы видим, при работе по вершинным шейдерам (в отличие от предыдущего теста) производительность эквивалентна RADEON 8500. Это уже радует. Кроме того, давайте обратим внимание на высокий результат в режиме программной эмуляции. Он говорит только об одном - механизм передачи геометрических данных от процессора к ускорителю (традиционно более слабое место у ATI по сравнению с NVIDIA) был существенно улучшен. Видимо, наконец-то должным образом поддержана технология FastWrites или близкая ей по смыслу. Вершинный матричный блендинг
Эта возможность T&L используется для правдоподобной анимации и скиннинга моделей. Мы протестировали
блендинг с использованием двух матриц как в жестком "аппаратном" варианте, так и с
использованием вершинного шейдера, выполняющего ту же функцию. Кроме того, мы, как обычно, "подстраховались"
результатами, полученными в режиме программной эмуляции T&L:
На сей раз сохраняется печальная тенденция, связанная со всеми вопросами работы HW T&L. Вновь результат заметно ниже предшественников. EMBM рельеф В этом тесте мы измеряем производительность, а точнее, ее падение, возникающее
при использовании наложения карт отражения (Environment) и рельефа на
основе карт отражения (EMBM - Environment Bump). Для тестирования использовалось
разрешение 1280*1024 - т.к. именно в нем различия между картами и разными
режимами текстурирования выражены наиболее резко:
Мы видим, что объект исследования EMBM исполняет даже чуть лучше, чем это делает RADEON 8500, с остальным ситуация практически равновесная. Производительность пиксельных шейдеров
Мы вновь использовали модифицированный пример MFCPixelShader, измерив
производительность карт в высоком разрешении при выполнении 5 различных
по сложности шейдеров, для билинейно фильтрованных текстур:
Налицо заметное преимущество пиксельных конвейеров нового чипа при исполнении пиксельных шейдеров, причем оно несколько выше разницы частот - пиксельный конвейер явно был оптимизирован. При этом, преимущество растет с ростом сложности шейдера - видимо, число исполняющих блоков для стадий было все же увеличено. Итак, подведем первый промежуточный итог. Несмотря на урезанное вдвое число текстурных блоков и почти вдвое менее производительный на задачах старого фиксированного T&L геометрический блок, бюджетный чип показывает прекрасные результаты именно в новых, использующих шейдеры, приложениях. Вкупе с невысокой ценой это может стать существенным преимуществом для выбирающего покупателя, видимо, ATI достаточно верно подошла к вопросу "на чем следует экономить, а на чем не следует", отдав предпочтение современным и будущим приложениям. 3D-графика, 3DMark2001 SE - синтетические тестыПодчеркну, что все замеры по всем 3D-тестам проводились в 32-битной глубине цвета. Скорость закраски
Как видим, при использовании одной текстуры (Single Texturing) сказываются одноканальный контроллер памяти и меньшие кэши. А вот при мультитекстурировании очевидно наличие только одного текстурного блока на конвейер. Падение производительности относительно RADEON 8500 не вдвое, а почти вдвое вызвано сохраненным умением накапливать по 6 текстур за проход. Однако теперь уже жертвовать придется 5-ю тактами, а не двумя, как в RADEON 8500. Сцена с большим количеством полигонов
На этом тесте особое внимание следует уделить минимальному разрешению - именно там зависимость от
закраски практически нивелируется:
И снова перед нами явно более слабый блок HW T&L у RADEON 9000. Мы видим, что он ослаблен почти в 2 раза по сравнению с RADEON 8500. Впрочем, мы уже выше пришли к выводу, что это вполне логично из-за компромисса между поддержкой старого блока T&L и нового - на шейдерах. Но даже в этом случае производительность подблока освещенности выше, чем у RADEON 7500. Рельефное текстурирование
Посмотрим на результаты синтетической EMBM сцены:
Преимущество у RADEON 9000 вызвано не только более высокой тактовой частотой, но и оптимизацией работы
с EMBM у нового процессора.
А теперь DP3 рельеф:
Ну а тут все как и ожидалось - при схожей конфигурации конвейерной структуры результаты почти идентичны. Вершинные шейдеры
Мы видим, что вершинные шейдеры исполняются медленнее, чем у RADEON 8500, но не настолько, чтобы говорить о двукратном падении. По всей видимости, конструкторы сознательно сэкономили на эмуляции T&L, которая и на RADEON 8500 выполнялась с привлечением некоторых специфических средств, а теперь просто переложена на плечи обычного вершинного шейдера. Как мы увидим дальше, производительность исполнения типичных шейдеров приложений (извне) пострадала не так сильно. Пиксельный шейдер
А тут RADEON 9000 обогнал соперника в лице RADEON 8500, правда, в
пределах разницы в частотах ядер. А вообще, тут все неплохо: уменьшенное
число текстурников компенсируется в сложной задаче пиксельных шейдеров
увеличенной частотой чипа. К тому же, тут RV250 напрочь убивает GeForce4
MX, ведь последняя не умеет вообще работать с пиксельными шейдерами.
Картина очень похожая, а отставание RADEON 9000 уже связано с более сложной сценой и мультитекстурированием, расплата за которое у него более высокая. Спрайты
Этот тест зависит в первую очередь от геометрической производительности, а во вторую - от умения закрашивать спрайты оптимизированным методом. Второе - в наличии, а вот первое хромает и здорово - отставание почти двукратное (как мы уже выяснили из теста на геометрию). В итоге полуторакратное падение по сравнению с RADEON 8500. Однако посмотрите на результаты RADEON 7500, эмулирующего спрайты двумя треугольниками, и вы согласитесь, что прогресс не так уж и плох. Итак, подведем еще один промежуточный итог. Который, впрочем, почти не отличается от вывода, который мы сделали, рассмотрев предельные тесты из SDK. Мы видим более слабый классический блок HW T&L, но зато сильно продвинутый новый блок шейдеров, прежде всего, пиксельных. По мере выхода игр, все более активно использующих эти техники, преимущество у RADEON 9000 будет расти. Правда, чип имеет не 8, а всего лишь 4 текстурных блока, что сказывается на общей производительности, но, согласитесь, что для карты ценой около $100, это простительно. 3D-графика, 3DMark2001 - игровые тесты
3DMark2001, 3DMARKS
Как и следовало ожидать, на основании общих "марков" можно отметить, что RADEON 9000 находится где-то посредине между RADEON 8500 и 7500, явно выписывая пенсионное удостоверение последнему.
3DMark2001, Game1 Low details
Характеристики теста:
Картина очень схожа с предыдущей. Вообще, Game1 и общие "марки" почти всегда идут в одинаковых пропорциях. Что мы видим при активизации анизотропии? Скорость чуть ниже, чем у RADEON 8500, хотя в целом падение меньше. Замечу, что качество этой фильтрации мы в данном материале не рассматриваем. Ждите Часть 2. :-)
3DMark2001, Game2 Low details
Характеристики теста:
Ну, этот тест всегда бы образчиком полного следования за тем, что акселераторы могут :-). Вот кто сильнее по частотам, конвейерам и т.д. - тот и выигрывает. Интересно отметить, что даже 300/620 МГц у RADEON 9000 не смогли дать карте шанс опередить RADEON 8500.
3DMark2001, Game3 Low details
Характеристики теста:
В этом тесте RADEON 9000 уже ближе подобрался к своему старшему брату. Обратите внимание на то, насколько меньше по сравнению с соперниками у него падение при активизации анизотропии. И это несмотря на то, что у карты всего 4 текстурника. Впрочем, технология RIP-mapping-а позволяет этим манипулировать, а также разработчики вполне могли найти способы оптимизации исполнения фильтрации. Мы еще вернемся к этому вопросу во 2-й части, когда рассмотрим качество.
3DMark2001, Game4
Характеристики теста:
А вот тут мы и видим, что благодаря более высокой скорости работы пиксельных шейдеров RADEON 9000 почти догнал своего старшего брата, несмотря на то, что тест очень сложен, а с текстурниками у нашего подопытного, как известно, туго. В целом, по игровым тестам 3DMark2001 можно сказать, что результаты ожидаемые. С учетом "урезанности" RV250 эта карта себя показала на должном уровне, хорошо оправдывая свою цену. 3D-графика, игровые тестыПриступаем к оценке производительности видеокарты в 3D-играх. В качестве инструментария мы использовали:
Quake3 Arena, Quaver
Этот тест, уже не обладая достаточной сложностью в плане геометрии, дал возможность исследуемой ныне карте догнать RADEON 8500, а при разгоне даже перегнать его. А вот наличие всего 4-х текстурников, а также неумение этой игры работать более, чем с двумя текстурами, привели к тому, что падение скорости при анизотропии у RADEON 9000 весьма велико. Serious Sam: The Second Encounter, Grand Cathedral
Поскольку конфигурация настроек этой игры очень сложна, и ее трудно описать словами, я приведу скриншоты
установок:
Итак, что же мы получили:
А эта игра умеет накладывать 4 текстуры, поэтому возможности RADEON 9000 использованы более прибыльно, но все равно наличие всего одного блока текстурирования у конвейера отрицательно сказалось на падении производительности при анизотропии. Return to Castle Wolfenstein (Multiplayer), Checkpoint
Интересно отметить, что если в плане общей производительности RADEON 9000 ничего нового мы не видим - он почти догнал своего старшего брата - то при активизации анизотропии наблюдается тенденция к резкому увеличению падения скорости по мере роста разрешения. Впрочем, это может объясняться влиянием CPU, от которого данная игра довольно сильно зависит, на младших разрешениях. Comanche4 DEMO
Это очень сложный тест, поэтому всякие "урезанности" у карт выплывают легко. Однако мы видим, что и тут RADEON 9000 показал себя достойно. Правда не совсем понятно - почему такое сильно падение производительности у обоих RADEON 8500/9000 при активизации анизотропии. Качество 3D-графикиСкажу коротко. В целом, нареканий нет, все то же самое, что и у RADEON 8500. Подробности насчет качества анизотропии мы рассмотрим в следующем материале по RV250. В этот раз просто не уложились по времени. Выводы
Думаю, что если RADEON 9000 выйдет на рынок широким потоком (а не как было с RADEON 8500, когда полгода ощущался жуткий дефицит), то у него есть отменный шанс отправить RADEON 7500 на пенсию, а GeForce4 MX вынужден будет потесниться, либо резко упасть в цене. А RADEON 8500 уже может не спешить дешеветь, благо "внизу" есть продукт, обладающий всеми современными техниками. А отсюда следует вывод, что компания ATI находится на пути к выстраиванию стройной и логичной цепочки своих продуктов, которые будут обладать практически всеми современными технологиями. Благодарим компанию:
"Gigabyte Technology" за предоставленную в оперативном порядке видеокарту ![]()
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||