Подводя итог, хочется отметить двойственность оценки нового продукта. По сравнению
с ранее имевшимися на рынке продуктами от Matrox, это супер-революция! Даже нет смысла приводить
старые спецификации G400/450/550, чтобы оценить. И так все очевидно. Но по сравнению с ныне имеющимися
продуктами последнего поколения от ATI (RADEON 8500) и NVIDIA (GeForce4 Ti) Parhelia выглядит уже
довольно скромно. Да, разумеется, наличие 16-ти текстурников ставит этот чип как бы на ступень выше,
но, как покажут наши исследования, на данном этапе формула 4 конвейера Х 4 текстурника невостребована,
практически ни одно (за редким исключением) приложение не умеет работать с таким режимом мультитекстурирования.
Да, такие "богатства" текстурных блоков дают шанс на получение быстрых билинейной и анизотропной
фильтраций. Но теоретический. Судите сами: каждый текстурник умеет производить выборку 4-х сэмплов для
формирования билинейки. Это уже стандарт. Четыре текстурника - 16, 4 конвейера - 64. Именно отсюда
маркетологи Matrox и взяли пресловутые 64 отсчета текстур, выбираемых за такт. Да, при этом мы получаем
либо четыре билинейно фильтрованных, либо две трилинейно или анизотропно (8 отсчетов)
либо одну анизотропно (16 отсчетов) текстуры за такт. Соответственно, для
старых (а таковых 99,9%) «двутекстурных» приложений анизотропная фильтрация на
базе 8 отсчетов должна проходить без потери скорости. Но на практике это не так, и ниже вы в этом убедитесь.
По сути получается, что ныне Parhelia обладает только одной функцией из набора DirectX 9.0 -
технологией Displacement Mapping, которая позволяет существенно увеличить степень реалистичности и
детальности рельефных поверхностей. В отличие от привычных уже разновидностей рельефа,
наносимого на поверхности треугольников при закраске и не влияющего на видимость тех
или иных точек (картой рельефа моделируется только освещенность точки, а не ее реальное
положение в пространстве) карты смещения позволяют создавать геометрически корректные рельефы,
пересечение которых в пространстве не будет выглядеть идеальной прямой. Я приведу яркий пример:
В данной demo-программе не только работают все 16 текстурников, но и виден эффект от карт смещения.
С картами будет поставляться и другая, более шикарная демо-программа, эмулирующая кусочек живой
природы рифа. Разумеется, и тут можно заметить использование карт смещения.
Надо сказать все же, что появление Vertex Shaders 2.0 мы ожидаем с выходом DirectX 9.0. Возможно, что
четыре блока этих шейдеров заработают в полную силу опять же только при условии наличия DX 9.0.
Ну что ж, перейдем к рассмотрению непосредственно самой карты.
Плата
Подчеркну, что мы рассматриваем не опытный образец, а серийную карту на базе Matrox Parhelia-512.
Карта снабжена AGP x2/x4 интерфейсом, 128 МБ локальной DDR SDRAM памяти
(восемь микросхем, размещенных на лицевой стороне PCB).
| На карте установлены микросхемы памяти Infineon, BGA форм-фактора. Время выборки 3.3 нс,
что соответствует примерно 300 (600) МГц. Но память работает на частоте 275 (550) МГц |
 |
Микросхемы памяти в новой BGA-упаковке появились на видеокартах cовсем недавно, но уже стали весьма
популярными среди производителей этой продукции (некоторые компании (ASUSTeK, S/U/M/A/) даже
выпускают платы на дизайнах собственной разработки с использованием таких микросхем памяти).
Этот форм-фактор
обеспечивает более эффективное охлаждение чипов и память не перегревается, работая на
своей штатной частоте (правда, на Parhelia 128MB память работает на частоте, чуть ниже номинальной
частоты для 3.3ns). Напомним частоты серийно выпускаемых карт (ядро/память):
- Matrox Parhelia 128MB (Retail) - 220/275 (550) MHz;
- Matrox Parhelia 128MB (OEM) - 200/250 (500) MHz.
По всей видимости компания ATI Technologies, которая очень любит "баловаться" частотами,
внесла в парламент Канады проект закона о разной частоте видеокарт в зависимости от того,
в коробках те продаются или в пакетиках. И, наверное, этот закон был принят. Ибо, как мы видим, фирма
Matrox точно следует примеру ATI и разделяет разночастотные карты на базе одного GPU в зависимости от
типа поставки. При этом наименования самого чипсета никак не различаются. Впрочем, учитывая, что все карты
Matrox выпускает самостоятельно, обманов быть или не должно, или их число будет невелико. Хотя дельцов
из мира торговцев, которые захотят "погреть" руки на этой разнице, наверно, найдется не так уж и
мало (судя по опыту продаж карт на базе RADEON всех мастей). Но вернемся к рассмотрению карты:
| Matrox Parhelia 128MB |
 |
 |
Без кулера |
 |
Перед нами очень необычного дизайна карта. Разумеется, наличие 256-битной высокоскоростной шины не
может не сказаться на усложнении PCB. Прежде всего мы заметим наличие экрана, предохраняющего от наводок:
Также можно заметить огромное количество элементов на карте, отвечающих за стабильность работы. Мы видим,
что разработчики из Matrox много потрудились над этой картой, сделав все, чтобы устранить возможные наводки от сложной по дизайну разводки, которые могли бы ухудшить качество картинки (мы все помним, что первый опыт высокоскоростной карты
на базе GeForce2 Ultra был печальным: на экране монитора подчас можно было видеть рябь - так влияла
несовершенность дизайна PCB).
Заметим, что у карты имеется два выхода DVI, поэтому для подключения обычных CRT-мониторов обязательно потребуется
переходник, но об этом ниже. Обратим также внимание на качество выходных фильтров, которому
инженеры из Matrox уделяют самое пристальное внимание (вероятно, из-за боязни упрощения дизайна своих
карт Matrox и не передает производство плат сторонним фирмам). В целом, PCB получилась очень дорогая,
что не может не сказаться на себестоимости.
Микросхемы памяти расположены почти по кругу около чипа, что выглядит необычно, но вполне логично (для
уменьшения расстояния между ними и чипом). Кстати, обратите внимание на размеры самого GPU:
Это просто гигант по сравнению с другими! Да и вид у него непривычный: металлическая крышка полностью
покрывает ядро (вначале, когда на GPU был еще установлен кулер, я подумал, что под ним - керамический
процессор, настолько чип сбоку был похож на прежние Pentium-подобные процессоры). И это сделано неспроста,
ибо Parhelia-512 очень сильно греется даже на 220 МГц. Полагаю, что разогнать его будет практически
невозможно (но об этом ниже).
Однако кулер установлен вполне обычной формы (по-видимому, инженеры долго боролись с перегревом чипа,
понижая его частоту, пока не нашли компромисс между приличной еще скоростью и отсутствием особо
дорогой системы охлаждения).
Возвращаясь к двум DVI-коннекторам у карты, скажем, что по сути это универсальные гнезда, а не просто
DVI, поскольку каждое может играть не одну роль. Посмотрим, что входит в комплект поставки с картой:
- Для того, чтобы подключить один CRT-монитор, нужен всего лишь переходник DVI-to-d-Sub (белый). Он подключается
к нижнему гнезду DVI на карте (см. фотографии выше).
- Если же нужно подключить два или три монитора, то к верхнему гнезду DVI подключаем переходник
DVI-to-2-d-sub и уже к его "хвостам" можем подключить один или два монитора.
- Если нужен TV-out, то к верхнему гнезду DVI
подключается тот же переходник DVI-to-2-d-sub и уже к его "хвостам" подключаем другой
переходник DVI-to-TV-out, имеющий два "хвоста": S-Video и RCA. При этом можно
задействовать технологию DualHead и, в частности, DVDMax.
- При этом к оставшемуся свободным "хвосту" у DVI-to-2-d-sub можно подключить второй
монитор и организовать Surround Video (на трех приемниках) с помощью двух мониторов и телевизора,
хотя таким извращением вряд ли кто будет заниматься :-)
Попробуем подключить три монитора:
После активизации соответствующего режима в драйверах (о настройках расскажем ниже) мы получаем расширение
рабочего стола на три монитора:
Поверьте, это выглядит очень необычно и непривычно :-) Особенно при инсталляции чего-либо :-)
К сожалению, как включить подобный режим Surround Games в игре Quake3 мы узнали слишком поздно (карту уже отдали),
а насчет UT2003 так и не выяснили, поэтому мы ограничились просмотром одной
стратегической игры, где на каждом мониторе показываются виды с разных камер наблюдения:
Ну и, конечно, та самая демо от Matrox, показывающая жизнь кораллового рифа:
Это выглядит впечатляюще! Более того, пришедший в это время к нам в гости знакомый просто восхитился:
"Аквариум на трех мониторах!!!" :-) Да и мы долго не могли оторваться от этой завораживающей
картинки. Право, не зря мы целый час высвобождали место и перетаскивали три тяжеленных 21-дюймовых
монитора!
TV-out работает просто блестяще! Мало того, что в настройках драйверов есть все для
оптимизации картинки на ТВ, у Parhelia есть и фирменный метод DVDMax, позволяющий выводить фильмы на ТВ
в полноэкранном режиме, освобождая при этом рабочий стол на мониторе. Да, надо
сказать прямо: до уровня качества и возможностей TV-out от Matrox еще всем расти и расти!
Прежде всего это касается NVIDIA с ее откровенно говоря наспех сделанным nView, который до сих пор подчас
глючит в драйверах.
Ну и? в заключение рассмотрения особенностей самой карты, посмотрим на коробку, в которой такие платы
будут продаваться:
Разгон
Когда мы только начали исследовать работу карты на штатных частотах, то пришли к выводу, что
при таком нагреве наверняка разгон будет почти невозможен. А он оказался не почти, а вообще невозможен
на данном этапе из-за того, что последняя версия (3.20) PowerStrip пока не умеет работать с
Parhelia.
Установка и драйверы
Рассмотрим конфигурацию тестовых стендов, на которых проводились испытания
карт:
- Компьютер на базе Pentium 4 (Socket 478):
- процессор Intel Pentium 4 2200 (L2=512K);
- системная плата ASUS P4T-E (i850);
- оперативная память 512 MB RDRAM PC800;
- жесткий диск Quantum FB AS 20GB;
- операционная система Windows XP.
- Компьютер на базе Athlon XP:
- процессор AMD Athlon XP 2000+;
- системная плата Soltek 75DRV5 (VIA KT333);
- оперативная память 512 MB DDR SDRAM PC2700;
- жесткий диск Fujitsu 20GB;
- операционная система Windows XP.
На стендах использовались мониторы ViewSonic P810 (21") и ViewSonic P817 (21").
При тестировании применялись драйверы от Matrox версии 2.26. VSync отключен.
Для сравнительного анализа приведены результаты уже знакомых читателям видеокарт:
- ASUS V8460Ultra (GeForce4 Ti 4600, 300/325 (650) МГц, 128 МБ);
- S/U/M/A/ Platinum GeForce4 Ti 4200 (250/222 (444) МГц, 128 МБ);
- Gigabyte MAYA AP128DG-H RADEON 8500 Deluxe (275/275 (550) МГц, 128 МБ, driver 6.071).
Настройки драйверов
Желающие познакомиться со сводной картинкой настроек драйверов могут
скачать вот этот анимированный GIF-файл (850К).
А мы рассмотрим все настройки подробно по отдельности. Надо отметить два момента:
- Для полноценной работы драйверов потребуется установить окружение Microsoft .NET Framework,
которое поставляется на диске с драйверами; без него настройки PowerDesk будут недоступными.
- На настоящее время поддерживается только операционная система Windows XP, поддержка Win9x/ME
под вопросом, и очень вероятно, что ее не будет вообще, поэтому будущим покупателям Parhelia надо это
иметь в виду.
Перед нами главное меню настроек, как мы видим, уже тут имеется богатый набор регулировок.
На этой панели пользователь может выбрать режим работы карты с мониторами.
Это переходное меню к настройкам цветности, геометрии и т.д. для монитора(ов) или телевизора. При этом
в левой части можно будет выбрать монитор или телевизор.
Собственно, вот и настройки геометрии для монитора. Надо сказать, что для ТВ их намного больше, можно изменять
размеры не по 4-м направлениям, а по целым 8-ми (включая диагонали).
Переходим к настройкам 2D. Можем включать фирменную технологию сглаживания шрифтов, выбирать режим работы
карты (обычный 32-битный как 24+8 или Gigacolor как 30+2). Я на этом остановлюсь немного дальше.
Что может реально дать пользователю сейчас переход с привычной схемы 8+8+8 (24бит) на 10+10+10 (30бит)
(речь о 2D)? - Разумеется, пока ничего. Но это неплохой задел на будущее. Сейчас любая "старая"
24-битная картинка будет смотреться одинаково, однако есть ряд редакторов, имеющих свою внутреннюю
более высокую точность работы с цветом. И вот тут, при создании объемных иллюстраций, где много
сверхтонких передач цвета, Gigacolor от Matrox весьма поможет. Да, конечно, есть ограничение в виде
обязательного наличия такой же Parhelia при просмотре созданных 30-битных картинок. Но возможно, что
будущие продукты от ATI или NVIDIA смогут использовать также режимы с повышенной битностью на каждый
канал.
Однако есть и обратная сторона медали. Это касается 3D.
Наличие дополнительных 8 бит для альфа-канала до какого-то времени, когда царствовали 16-битные
текстуры, практически никогда не было
востребованным. Поэтому жертвование битностью альфа-канала вполне оправдано ради повышения точности
отображения основной графики (текстур). Но это было. Теперь уже многие разработчики игр переориентировались
на 32-битный формат и те самые 8 бит для альфа-канала могут быть востребованными. Да и будут ли
разработчики использовать эти возможности 10+10+10 ради
повышения качества графики (ведь надо специально изготавливать 30-битные текстуры, либо в расчетах
эффектов применять не 24, а 30-битную точность)? Сомневаюсь. Это не стандарт. А уже хорошо известно,
что стандартом становится то, на что рассчитана основная масса акселераторов. А их, умеющих работать
только со "старым" 32-битным цветом, подавляющее большинство. Судя по предварительным прогнозам,
ATI и NVIDIA не станут озабочиваться поддержкой такого 32-битного цвета в 3D, введя сразу 64-бит или
даже 128. Поэтому можно сказать, что Matrox опоздал с этой новацией. В 3D-графике этим вряд ли кто
воспользуется.
Как посмотреть на этот самый 30-битный цвет? Да никак! Если у вас нет Parhelia, то вы ничего не увидите.
Это примерно то же самое, как показать работу стерео-эффекта. Пока сам не купишь очки и не установишь
необходимое оборудование на своем компьютере, не узнаешь.
Matrox использует способы демонстрации бандинга (полосатости) для различий между 24- и 30-битными
картинками. Ну, мягко говоря, это нечестный способ.
Пойдем дальше.
Перед нами настройки по 3D. Сразу видно, что небогато. Но, тем не менее, основные функции присутствуют.
Прежде всего, мы можем выбрать режим работы 32-битного цвета (о чем выше говорилось).
Затем активизировать фирменный Fragment AA 16x (или суперсэмплинг 4х).
Ну и выбрать режим работы фильтраций, а также отрегулировать VSync.
Далее идут настройки уже, касающиеся MPEG2-проигрывания и оверлеев в целом.
На этих панелях есть возможности по управлению DVDMax, технологии, использующей Dualhead для
просмотра кино на ТВ или втором мониторе.
А здесь мы можем настроить работу режима Overlay.
Остальные настройки отвечают за комфорт и дополнительные функции при работе с desktop:
Кроме всего прочего, не забыта и фирменная технология Multidesktop. Мы по-прежнему можем организовывать
виртуальные рабочие столы и настраивать их:
На этом рассмотрение особенностей драйверов от Matrox мы заканчиваем.
Результаты тестов
2D-графика
Традиционно начнем с 2D. Ну, как говорится, Matrox есть Matrox. Тут все на высшем уровне, 1600х1200х100Гц
на обеих "головах" выглядят безупречно. Никаких замечаний!
Я даже не стану повторять традиционную фразу о том, что оценка 2D-качества есть
вещь субъективная. Подобные платы выпускает только компания Matrox, поэтому, полагаю, что в данном
случае качество уже не зависит от конкретного экземпляра, но связка карта-монитор могут по-прежнему
играть огромную роль, прежде всего качество монитора и кабеля.
Полагаю, что скорость работы Parhelia в 2D также не нуждается в измерениях, как и у всех карт
последнего поколения, она высока.
3D-графика, MS DirectX 8.1 SDK - предельные тесты
Для тестирования различных предельных характеристик чипов мы использовали модифицированные (для
большего удобства и контроля) примеры из последней версии DirectX SDK (8.1, релиз). Без лишних
преамбул перейдем к уже хорошо знакомым нашим постоянным читателям тестам:
Optimized Mesh
Этот тест призван выяснить практический предел пропускной способности ускорителя по
треугольникам. Для этого используется несколько одновременно выводимых в небольшом окне моделей,
каждая из которых состоит из 50 тысяч треугольников. Текстурирование отсутствует. Размеры моделей
минимальны - каждый треугольник не превышает одного пиксела. Хочется сразу отметить, что результат
этого теста, разумеется, останется недостижим для реальных приложений, где размеры треугольников
значительны, присутствуют текстуры и освещение. Приведем результаты этого теста для трех методов
отрисовки - оптимизированной для оптимальной скорости вывода (в том числе, с учетом размера внутреннего
кэша вершин на чипе) модели - Optimized, неоптимизированной исходной модели - Unoptimized и той-же
неоптимизированной модели, выводимой в виде одного Triangle Strip - Strip:
В случае полностью оптимизированной модели, когда влияние подсистемы памяти минимально, мы измеряем
практически чистую производительность трансформации и установки треугольников. Налицо безоговорочное
лидерство Ti 4600. 65 миллионов треугольников в секунду - цифра нешуточная, практически
вдвое превосходит результаты RADEON 8500 и Parhelia. Мы понимаем, что именно так и должен был отразиться на
производительности Ti 4600 второй блок T&L относительно RADEON 8500, но почему Parhelia с ее
4-мя блоками вершинных шейдеров так отстала? Налицо работа только одного конвейера.
Кроме того, отметим существенное преимущество всех GPU в случае принудительной активации программного
расчета геометрии. В случае Strip модели это преимущество нивелируется из-за существенного (вдвое)
снижения объема передаваемых данных.
Производительность блока вершинного шейдера
Этот тест позволяет определить предельную производительность блока вершинных шейдеров. Выполняется
достаточно сложный шейдер, вычисляющий как видовые преобразования, так и геометрические функции. Тест
проводится в минимальном разрешении, дабы минимизировать влияние закраски:
И вновь налицо существенное преимущество реально "двойного" T&L Ti 4600. И снова
сильный проигрыш Matrox Parhelia.
Интересно, что со времени прошлого большого обзора NV25 скорость выполнения RADEON 8500 вершинных шейдеров
почти не выросла, но увеличение процессорной мощности тестового стенда позволило программной
эмуляции опередить по скорости аппаратную обработку. Что наблюдается также и у Matrox. Вероятно, что и карта от
ATI и от Matrox уперлись в частоты работы своих GPU, и 2.2ГГц процессор Pentium 4 справляется с этой задачей
даже быстрее.
Вершинный матричный блендинг
Эта возможность T&L используется для правдоподобной анимации и скиннинга моделей. Мы протестировали
блендинг с использованием двух матриц как в жестком "аппаратном" варианте, так и с
использованием вершинного шейдера, выполняющего ту же функцию. Кроме того, мы, как обычно, "подстраховались"
результатами, полученными в режиме программной эмуляции T&L:
На сей раз, программная эмуляция везде проигрывает аппаратному исполнению, упираясь, судя по всему,
(обратите внимание на похожести результатов с шейдером и без) в скорость передачи геометрии по
AGP. В случае аппаратного исполнения, мы снова видим всплеск у Ti 4600 из-за его 2-х конвейеров
вершинных шейдеров, и незначительный рост у RADEON 8500 и Parhelia.
Интересно, что жесткий аппаратный блендинг
на RADEON 8500 равен, а на Parhelia чуть медленнее шейдерного, но отличия крайне малы.
EMBM рельеф
В этом тесте мы измеряем производительность, а точнее ее падение, возникающее при использовании наложения
карт отражения (Environment) и рельефа на основе карт отражения (EMBM - Environment Bump). Для
тестирования использовалось разрешение 1280*1024 - т.к. именно в нем различия между картами и разными
режимами текстурирования выражены наиболее резко:
Ti 4600 вновь занимает четкую лидирующую позицию, заметно опережая остальные карты по
эффективной скорости закраски во всех трех режимах. Сильнее всего EMBM бьет по R200, однако сама
по себе разница в падении не столь существенна, сколь низка эффективность любой (даже без EMBM)
закраски на R200. Чип от Matrox красит хотя и медленнее, но при полной нагрузке гораздо эффективнее,
чем R200.
Производительность пиксельных шейдеров
Мы вновь использовали модифицированный пример MFCPixelShader, измерив
производительность карт в высоком разрешении при выполнении 5 различных
по сложности шейдеров, для билинейно фильтрованных текстур:
Ti 4600 на коне, и характер зависимости от сложности шейдера и числа текстур
представляет собой почти стабильную горизонталь с некоторым падением вначале.
То же самое можем сказать и про Parhelia. Как мы видим, наличие одного числа пиксельных конвейеров
у Ti 4600 и у Parhelia с разницей лишь в частотах и обусловили почти постоянную дельту между
этими двумя картами.
А вот R200 демонстрирует печальную
слабость, существенно сдавая на сложных заданиях. Повторное использование
текстурных блоков стоит ему гораздо дороже, нежели творениям Matrox и NVIDIA.
Итак, подведем первый промежуточный итог. По сумме тестов DX 8.1 SDK карта Matrox Parhelia 128MB
выходит почти пораженцем. Этого от нее не ожидалось - ведь декларации гласили о наличии 4-х
вершинных конвейеров, а в действительности задействован только один. Это может быть следствием как
несовершенства драйверов, так и наличия ошибки в чипе. А вот работа с пиксельными шейдерами у Parhelia
на высоте. Хотя и отстает по скорости от Ti 4600.
Мы еще вернемся к этим тестам несколько позже (примерно в августе), когда будет возможность протестировать наличие
VS 2.0 на DirectX 9.0.
3D-графика, 3DMark2001 SE - синтетические тесты
Подчеркну, что все замеры по всем 3D-тестам проводились в 32-битной глубине цвета.
Скорость закраски
Напомним, что теоретические пределы для данного теста
составляют 880 миллионов пикселей в секунду для Parhelia, 1100 для RADEON 8500 и 1200 для Ti 4600
соответственно. Как мы видим, по фактической скорости закраски Parhelia наиболее близко подошла
к пиковым значениям.
Также напомним, что пиковые значения для этого теста составляют 3520 (1760) миллионов
текселей в секунду для Parhelia (в скобках указано значение при работе схемы 4 конвейера по
2 текстурника на каждом), 2200 - для RADEON 8500 и 2400 для Ti 4600.
И уже тут хорошо видно, что прямо около своей пиковой скорости оказался уже Ti 4600, чуть далее -
RADEON 8500. А вот с Parhelia все более сложно. Очевидно, что была задействована схема не 4 х 2,
а 4 х 4, однако при этом реальная скорость закраски оказалась сильно ниже пикового значения.
И это еще одно доказательство того, что чип работает не в полную свою силу. Почему? Лучше спросить
у инженеров из Matrox (или программистов).
Сцена с большим количеством полигонов
На этом тесте особое внимание следует уделить минимальному разрешению - именно там зависимость от
закраски практически нивелируется:
При наличии одного источника света Ti 4600 показывает себя абсолютным лидером. Его результат не только
значительно (более, чем в 2 раза) превосходит Parhelia, но и (что более важно) вплотную
приблизился к значению практического предела пропускной способности по треугольникам, полученному ранее
с помощью Optimized Mesh из DX8.1 SDK. Еще одно свидетельство мощи двойного T&L Ti 4600.
Впрочем, не будем умалять достоинств RADEON 8500, также приблизившегося к предельной
цифре, полученной в тесте из SDK. А вот с Parhelia снова неясно. Налицо отставание скорости работы
с одним источником света от продемонстрированного ею же предела ПС по полигонам. Опять драйверы?
А вот в случае 8 источников света Parhelia несколько реабилитирует себя: с ростом числа источников его
производительность падает более медленно, чем RADEON 8500, да и в целом продукт от Matrox тут сильно
выигрывает у R200. Но лидер - по-прежнему Ti 4600.
Рельефное текстурирование
Посмотрим на результаты синтетической EMBM сцены:
Несмотря на то, что в предельных тестах Parhelia продемонстрировала бОльшую скорость работы с
рельефным текстурированием, чем у RADEON 8500, в данном случае видно небольшое отставание от последнего.
А теперь DP3 рельеф:
Картина схожая.
Вершинные шейдеры
Данный тест лишь подтвердил работоспособность только одного конвейера T&L у Parhelia,
поскольку мы наблюдаем отставание этой карты от RADEON 8500 в точном соответствии с частотами.
Кстати, обратим внимание на то, что с ростом разрешения и RADEON 8500, и Parhelia стремительно сдают
свои позиции, упираясь в недостаточную эффективность
закраски, в то время как скорость Ti 4600 падает медленнее.
Пиксельный шейдер
Руководствуясь высказанными выше соображениями о том, что слишком малые разрешения "упираются" в
геометрию, а слишком большие - в пропускную полосу памяти, обратим основное внимание на 1024х768
и 1280х1024:
Чудеса, да? Совсем недавно при тестировании пиксельных шейдеров в SDK Parhelia демонстрировала явный
перевес над RADEON 8500. А тут мы видим просто провальные результаты. Учитывая приспосабливаемость
теста 3DMark2001 SE к разным картам, могу предположить, что вскоре выйдет патч к нему, после которого
скорость работы Parhelia резко возрастет.
Для чистоты эксперимента посмотрим и на тест Advanced Pixel Shader.
Картина очень похожая. Заметим, что в данном случае карты от Matrox и NVIDIA исполняют задачу за 2 прохода,
используя шейдеры версии 1.1, когда RADEON 8500 требуется только 1 проход с использованием шейдеров 1.4,
но это его не спасает.
Спрайты
В этой области у Parhelia совсем все плохо.
Итак, подведем первый промежуточный итог. По сумме синтетических тестов карта Matrox Parhelia 128MB
проигрывает своим конкурентам (не считая работы с большим числом источников света).
Впрочем, частично это и ожидалось - ведь частота работы карты сильно ниже, чем у соперников, несмотря
на наличие вдвое большего числа текстурников. Да и 4 вершинных конвейера не видать. Так что, ждем
улучшений работы с выходом новых версий драйверов (если это виноваты драйверы) или смены заявленных характеристик
от Matrox (если виноват сам чип и это уже не исправить программным путем).
Однако не будем забывать, что только результаты
реальных приложений позволят нам судить об общей производительности, да и сбалансированности Parhelia.
Оставайтесь с нами.
3D-графика, 3DMark2001 - игровые тесты
3DMark2001, 3DMARKS
На основании общих "марков" можно отметить, что Parhelia отстала от всех соперников. Проиграла даже Ti 4200. А теперь посмотрим более подробно.
3DMark2001, Game1 Low details
Характеристики теста:
- Rendered triangles per frame (min/avg/max): 19773/33753/143422
- Rendered textures per frame with 16 bit textures (min/avg/max): 7.5/8.8/16.5 MB
- Rendered textures per frame with 32 bit textures (min/avg/max): 15.1/17.7/30.3 MB
- Rendered textures per frame with texture compression (min/avg/max): 10.7/12.2/21.0 MB
Отставание у Parhelia в разрешении 1600х1200х32 таково: от Ti 4600 - 46.7%, от Ti 4200 - 30%,
от RADEON 8500 - 32.8%.
А вот активизации АА мы видим явное преимущество FAA 16x от Matrox над 4х от NVIDIA. Качество
рассмотрим ниже.
И мы видим, что, несмотря на предполагаемую бесплатность анизотропии при 8-семпловой выборке,
падение производительности все же имеется, хотя оно и меньше, чем у GeForce4 Ti. В наличии
опять неработоспособность части текстурников.
3DMark2001, Game2 Low details
Характеристики теста:
- Rendered triangles per frame (min/avg/max): 46159/51440/147828
- Rendered textures per frame with 16 bit textures (min/avg/max): 8.0/8.8/10.1 MB
- Rendered textures per frame with 32 bit textures (min/avg/max): 15.6/17.2/19.8 MB
- Rendered textures per frame with texture compression (min/avg/max): 9.3/10.9/13.5 MB
Отставание у Parhelia в разрешении 1600х1200х32 таково: от Ti 4600 - 43%, от Ti 4200 - 24.8%,
от RADEON 8500 - 25.4%.
При включении АА снова явное преимущество FAA 16x от Matrox над 4х от NVIDIA, не говоря уже об
4х от ATI.
В данном тесте падение производительности при активизации анизотропии у Parhelia сильно
меньше, чем у GeForce4 Ti.
3DMark2001, Game3 Low details
Характеристики теста:
- Rendered triangles per frame (min/avg/max): 16681/21746/39890
- Rendered textures per frame with 16 bit textures (min/avg/max): 2.8/4.1/4.7 MB
- Rendered textures per frame with 32 bit textures (min/avg/max): 5.7/8.2/9.4 MB
- Rendered textures per frame with texture compression (min/avg/max): 5.0/7.2/8.4 MB
Отставание у Parhelia в разрешении 1600х1200х32 таково: от Ti 4600 - 41%, от Ti 4200 - 21.6%,
от RADEON 8500 - 26.6%.
Мы видим феноменальный перевес в производительности при включении FAA 16x у Parhelia, но все ли так
хорошо? Немного терпения, и ниже мы рассмотрим вопросы качества.
Падение производительности при активизации анизотропии у Parhelia примерно равно тому, каким
обладают ее соперники.
Характеристики теста:
- Rendered triangles per frame (min/avg/max): 55601/81714/180938
- Rendered textures per frame with 16 bit textures (min/avg/max): 14.9/17.4/20.7 MB
- Rendered textures per frame with 32 bit textures (min/avg/max): 28.4/33.5/40.0 MB
- Rendered textures per frame with texture compression (min/avg/max): 28.4/33.5/40.0 MB
Отставание у Parhelia в разрешении 1600х1200х32 таково: от Ti 4600 - 47.6%, от Ti 4200 - 27.6%,
от RADEON 8500 - 44%.
А в данном тесте Parhelia не помогло и включение FAA 16x, скорость очень низкая. Впрочем, сам
этот тест весьма сложен, хотя компания ATI в свое время смогла как-то найти способ оптимизации
работы своих карт в Game4, с тех пор этот тест - "королевский" для RADEON 8500.
Интересно отметить, что падение производительности при активизации анизотропии у Parhelia в данном
случае весьма велико! Явно влияние простаивания половины текстурников у детища от Matrox.
Подводя итоги работы Parhelia в 3DMark2001, можно с очень большим сожалением отметить, что карта очень сильно проиграла
соперникам, имеющим гораздо меньшую стоимость и потенциальную мощность. Ну что
можно сказать? Хотели как лучше, а получилось... Даже еще хуже, чем всегда. Да, разумеется, схема
4 х 4 не работает. Имеем 4 х 2 при 220 МГц частоты чипа. И даже супербольшая пропускная способность
шины обмена с памятью не поможет поднять потенциал самого GPU. Ну и плюс отсутствие обещанных 4-х
конвейеров T&L.
3D-графика, игровые тесты
Приступаем к оценке производительности видеокарты в 3D-играх. В качестве инструментария мы использовали:
- Return to Castle Wolfenstein (MultiPlayer) (id Software/Activision) - OpenGL, мультитекстурирование, Checkpoint-demo,
настройки тестирования - все на максимально возможном уровне, S3TC OFF,
конфигурации можно скачать тут
- Serious Sam: The Second Encounter v.1.05 (Croteam/GodGames) - OpenGL, мультитекстурирование, Grand Cathedral demo, настройки
тестирования: quality, S3TC OFF
- Quake3 Arena v.1.17 (id Software/Activision) - OpenGL, мультитекстурирование,
Quaver, настройки
тестирования все на максимальном уровне:
уровень детализации High, уровень детализации текстур №4, S3TC OFF, плавность кривых
поверхностей резко увеличена при помощи переменных r_subdivisions "1" и
r_lodCurveError "30000" (подчеркну, что по умолчанию r_lodCurveError "250" !),
конфигурации можно скачать тут
- Comanche4 Benchmark Demo (NovaLogic) - Direct3D, Shaders,
Hardware T&L, Dot3, cube texturing, максимально возможное качество
- Unreal Tournament 2003 Demo v.927 (Digital Extreme/Epic Games) - Direct3D, Vertex Shaders,
Hardware T&L, Dot3, cube texturing, качество по умолчанию
- Code Creatures (CodeCult) игровой тест (на базе демо-версии),
демонстрирующий работу платы в DirectX 8.1, Shaders, HW T&L.
Quake3 Arena, Quaver
Что мы видим? Да ничего хорошего для Parhelia. Такое же отставание от всех соперников. 220 МГц
и 4 х 2 вместо 4 х 4 дают о себе знать. И даже FAA не спасает ситуацию.
Serious Sam: The Second Encounter, Grand Cathedral
Поскольку конфигурация настроек этой игры очень сложна, и ее трудно описать словами, я приведу скриншоты
установок:
Итак, что же мы получили:
Обратите внимание на то, что, несмотря на отставание в этом тесте, Parhelia при росте разрешения
смогла удержать позиции по производительности почти на том же уровне. Вот уже начинает сказываться
то, что в данной игре возможно задействовать все 4 текстурника на каждом конвейере. Конечно, низкая
частота работы GPU и экономия разработчиков Matrox на кэшировании, не позволяют этой карте даже
при таком полноценном использовании всего конвейерного потенциала догнать соперников. Однако при
включении FAA ситуация резко меняется в пользу Parhelia.
Return to Castle Wolfenstein (Multiplayer), Checkpoint
Результаты для Parhelia просто катастрофичны! И даже FAA не помогает карте догнать лидера. Впрочем,
Ti 4200 при AA4x в 1280х1024 все же проиграл, но это даже не серьезно.
Должен заметить, что результаты работы RADEON 8500 при AA 4x Quality практически даже не конкурентоспособны,
поэтому мы с ними не сравниваем, падение скорости у детища ATI настолько велико, что этот режим
малопригоден для применения на практике.
Code Creatures
Этот тест создан на базе движка от CodeCult, на котором в производстве находится несколько игр.
Движок примечателен тем, что использует практически все современные возможности видеокарт последнего
поколения. Плюс демо-программа на базе этого движка содержит очень тяжелые для акселераторов сцены
как по объему текстур, геометрии, так и по числу используемых эффектов.
Ввиду вышеуказанной сложности теста, мы сняли показания только в разрешении 1024х768, поскольку даже
в этом режиме самые мощные карты резко "просаживаются".
Прошу обратить внимание на то, что детище от Matrox показало себя в данном случае не на самом
последнем месте. Все же работа пиксельных шейдеров (а в этом тесте именно они формируют водную
поверхность, а также небо) у Parhelia идет на довольно высокой скорости,
а провалы при тестировании 3DMark2001 опять можно объяснить "незнанием" этой программой
такого GPU. Плюс выручает гигантская пропускная способность памяти. Все упирается в относительно низкую
частоту работы самого графического процессора.
Comanche4 DEMO
Этот тест также является довольно сложным для акселератором, да и зависимость от центрального процессора
у него весьма сильная. Но, к сожалению, в нем не используются возможности Parhelia, половина текстурных
блоков по-прежнему простаивает, а с вершинными шейдерами, которые задействованы в игре, у канадского
творения явные проблемы (пока?).
Unreal Tournament 2003 DEMO b.927
Учитывая особенность работы этого теста с RADEON 8500 (см. 3DGiТоги),
мы провели этот тест на стенде на базе VIA KT333 (Athlon XP). Известно, что это приложение активно
использует вершинные шейдеры. А что мы имеем у Parhelia? Снова проигрыш везде. Увы.
Качество 3D-графики
АНИЗОТРОПНАЯ ФИЛЬТРАЦИЯ
Подробности о работе этой функции, и для чего она нужна, вы можете почитать в нашем разделе
3DGiТогов, посвященном данной теме.
Мы знаем, что реализация этой функции у разных фирм-производителей видеопроцессоров отличается. Да и скоростные
характеристики анизотропий, скажем, от ATI и от NVIDIA, сильно отличаются.
Схоже только результирующее качество.
И вот, галерею скриншотов из вышеуказанного раздела 3DGiТогов мы пополнили образцами качества
анизотропии у Matrox Parhelia.
- 3DMark2001 (Game1, Game2):
- Serious Sam: The Second Encounter:
- Return to Castle Wolfenstein:
Я полагаю, что читатели сами убедятся в том, что качество исполнения анизотропной фильтрации -
на уровне GeForce4 Ti в той же степени Level2.
АНТИ-АЛИАСИНГ (АА)
Эта функция борьбы с "лестницами по краям объектов", называемыми артефактами алиасинга, также
имеет давнюю и сложную историю. Дело в том, что у АА аппетиты еще выше, чем
у анизотропии (если имеем дело с существенными уровнями АА, дающими заметное визуальное улучшение
картинки).
Рекомендую еще раз почитать наш аналитический материал по Matrox Parhelia,
где доступно описан новый метод АА, предлагаемый Matrox. По своей сути это суперсэмплинг, до 16 отсчетов на одну точку экрана. Но,
выполняется он ТОЛЬКО (!) для точек принадлежащих краям полигонов (всего 3..5% типичной сцены):
Основное преимущество очевидно: в отличие от мултисэмплинга избыточные данные не хранятся в памяти
и не пересылаются по шине! Суммарный размер буфера кадра возрастает незначительно, не более
чем вдвое, даже при максимальной 16x установке.
Для определения граничных пикселей используется специальный быстрый проход рендеринга, когда
ускоритель в отдельном буфере помечает только граничные пиксели полигонов, не вычисляя значения
текстур и не закрашивая промежуточных точек.
Кроме того, т.к. обрабатываются только края полигонов, не возникает свойственной FSAA и
некоторым гибридным MSAA техникам потери четкости текстур.
Однако столь интеллектуальный метод AA способен в некоторых случаях вызывать артефакты. Кроме
того, он не может корректно обрабатывать сглаживание границ, перемешаных с полупрозрачными
полигонами (например облака, туман, стекла, огонь в играх). Пользователь может переключиться на
хорошо знакомый классический 4х (2х2) MSAA, также поддерживаемый чипом.
Давайте посмотрим на качество.
|