Matrox Parhelia 128MB


" Удивительное природное явление наблюдали 7 января жители поселка Краснообск: в середине дня в небе неожиданно появилась яркая сочная радуга. Столь необычное явление многие жители связали с праздником Рождества Христова и восприняли как особое Божье благоволение. Между прочим, метеорологи уверяют, что появление на небосклоне радуги в зимнее время вряд ли возможно. В ясную или малооблачную морозную погоду, заметил начальник Западно-Сибирского гидрометеоцентра Ренат Ягудин, можно наблюдать такие атмосферные явления, как ложное солнце или гало (светящиеся круги). Скорее всего, их и видели краснообцы и ошибочно приняли за радугу."

(10.01.02, "Вечерний Новосибирск")


Внимание! Прежде, чем приступить к прочтению данного материала, рекомендуем ознакомится с вышедшим в середине мая аналитическим материалом Ложное солнце / Parhelia-512.

СОДЕРЖАНИЕ

  1. Общие сведения о Parhelia-512
  2. Краткая теория
  3. Особенности видеокарты Matrox Parhelia 128MB
  4. Описание работы вывода изображения на три монитора, а также особенности TV-out и DVDMax
  5. Конфигурации тестовых стендов и особенности настроек драйверов
  6. Результаты тестов: коротко о 2D и предельные тесты из DirectX 8.1 SDK
  7. Результаты тестов: Синтетические тесты 3DMark2001 SE
  8. Результаты тестов: Игровые тесты 3DMark2001 SE
  9. Результаты тестов: Quake3 ARENA
  10. Результаты тестов: Serious Sam: The Second Encounter
  11. Результаты тестов: Return to Castle Wolfenstein
  12. Результаты тестов: Code Creatures DEMO
  13. Результаты тестов: Comanche4 DEMO
  14. Результаты тестов: Unreal Tournament 2003 DEMO
  15. Качество 3D: Анизотропная фильтрация
  16. Качество 3D: Анти-алиасинг
  17. Качество 3D в целом
  18. Выводы

Как мы уже говорили, канадская компания Matrox Graphics (в дальнейшем просто Matrox), подразделение корпорации Matrox Electronic Systems Ltd, совершенно неожиданно для многих (ну, не считая, конечно, поклонников Matrox, которые ждали анонсов от любимой компании ежесуточно :-) ) выпустила в свет довольно уникальный продукт. Чем же он уникален? Более подробно об этом можно почитать в вышеупомянутом материале-превью, а сейчас мы только коротко скажем, что самая главная особенность данного продукта состоит в том, что это плод деятельности компании за несколько лет(!). Ведь после 1999 года от канадской фирмы по сути не было новинок (G450, как и G550 — достаточно вялые попытки представить на рынке видоизмененный G400, поскольку ни существенных улучшений в возможностях, ни роста скорости в 3D не было). Витали только слухи о якобы появившемся на горизонте G800, а потом и G1000. Собственно, даже после известий о том, что Matrox представит новый продукт, многие называли его G1000.

И вот, Parhelia-512 перед нами. Еще раз замечу, что теоретические аспекты и особенности данного продукта стоит обязательно изучить в обзоре этого чипа.

Линейка продуктов

Да, не удивляйтесь этому слову — "линейка". Во-первых, компания обещала на базе Parhelia-512 выпустить несколько карт, имеющих разные объемы памяти, и (возможно) частоты. Во-вторых, уже ныне вышедшая карта Matrox Parhelia 128MB имеет две ревизии:

  • Parhelia 128MB (Retail) — 220 МГц ядро, 128 МБ 275(550) МГц 256 бит DDR памяти.
  • Parhelia 128MB (OEM) — 200 МГц ядро, 128 МБ 250(500) МГц 256 бит DDR памяти.
Давайте взглянем на отличия характеристик реального продукта от того, что было анонсировано ранее (в скобках указаны соответствия или несоответствия заявленным параметрам):
  1. 80 миллионов транзисторов (Судя по нагреву чипа — имеется :-))
  2. Технологическая норма 0.15 мкм (То же самое)
  3. Графическое ядро с частотой 250 МГц (ориентировочно) и частота памяти до DDR 325 (650) МГц (220/550 или 200/500 МГц)
  4. Полноценная 256 бит (!) DDR шина памяти (Есть!)
  5. Пропускная способность локальной памяти порядка 20 ГБ/сек ( ПИКОВАЯ пропускная способность памяти 16/17.6 ГБ/сек для 500/550 МГц частоты соответственно)
  6. Объем локальной памяти 64/128/256 МБ (Пока 128 МБ)
  7. AGP 2x/4x/8x, включая режимы SBA и FastWrites (Есть, но только 2x/4x!)
  8. 4 пиксельных конвейера (Есть!)
  9. 4 текстурных блока на каждом конвейере (!) (Есть!)
  10. Скорость закраски — около 1 Гигапикселя и около 4 Гигатекселей (Несколько ниже, 880 мегапикселей и 3520 мегатекселей!)
  11. Вершинные шейдеры версии 2.0 (Vertex Shader 2.0), четыре параллельных исполняющих блока (В текущих драйверах имеется поддержка вершинных шейдеров только версии 1.1 (а не 2.0 из-за отсутствия DirectX 9.0), да и скорость работы вершинных шейдеров заставляет усомниться в том, что задействованы 4 конвейера)
  12. Пиксельные шейдеры версии 1.3 (Pixel Shader 1.3), 4 текстурных + 5 комбинационных стадий на каждом пиксельном конвейере, с возможностью объединения конвейеров попарно (получаем 2 конвейера по 10 комбинационных стадий) (Есть!)
  13. EMBM и DOT3 наложение рельефа (Есть!)
  14. Фиксированный T&L DX8 (включая расширенные возможности матричного блендинга и скининга). Фактически представляет собой специальный вершинный шейдер (Есть!)
  15. Построение, хранение в локальной памяти и вывод на монитор изображения с точностью 10 бит на компоненту цвета (!). Технология 10-bit GigaColor (Есть!)
  16. Два встроенных в чип, 400 МГц, 10 бит на канал RAMDAC, использующих технологию UltraSharp (Есть!)
  17. Полноценная 10 бит —> 10 бит таблица для произвольной гамма-коррекции выводимого изображения (Есть!)
  18. DVD и HDTV видео декодер с точностью (на выходе) 10 бит (Есть!)
  19. Поддерживается вывод изображения в разрешениях вплоть до 2048x1536x32bpp@85 Гц (Есть!)
  20. Встроенный в чип интерфейс TV-Out с 10 битной точностью формирования сигнала (Есть!)
  21. Два цифровых TMDS интерфейса для цифровых выходов или внешних RAMDAC. Поддерживается разрешение вплоть до 1920x1200x32bpp (Не проверялось)
  22. Два полностью независимых CRTC (Есть!)
  23. Возможность вывода одного изображения, растянутого на два или даже три (!) приемника. Например, на 2 встроенных и один внешний RAMDAC или на оба встроенных RAMDAC и TV-Out. Суммарное разрешение в тройном режиме до 3840x1024x32bpp. Технологии TripleHead Desktop, Surround Gaming и DualHead-HighFidelity (HF) (Есть!)
  24. Адаптивная разновидность суперсэмплинга (не мултисэмплинг!) — 16x Fragment SSAA с числом сэмплов до 16 включительно. Активируется только на краевых точках полигонов. (Есть!)
  25. Аппаратная поддержка N-патчей с адаптивной тесселяцией (!) и картами смещения (Displacement mapping) (Есть!)
  26. Glyph Antialiasing — технология аппаратного краевого сглаживания и гамма-коррекции шрифтов (!) (Есть!)

Теория

С учетом вышеприведенных замечаний, тех читателей, кто до сих пор не прочитал превью Parhelia-512, еще раз просим это сделать, ибо в здесь мы будем заниматься анализом реальных возможностей карты, а в этом разделе ограничимся лишь сравнительной таблицей.

ЧипParhelia-5123Dlabs P10GeForce4 TiRADEON 8500
Шина памяти, бит256 DDR256 DDR128 DDR128 DDR
Частота памяти, МГц275 (250)250(?)325275
Частота ядра, МГц220(200)250300275
Полоса пропускания16/17 Гб/сек~20 Гб/сек10.4 Гб/сек9.6 Гб/сек
Макс. доступный объем локальной памяти256 Мб256 Мб128 Мб128 Мб
Вершинные шейдеры, версия1.1 (4 блока?)2.0 (4 блока)1.1 (2 блока)1.1
Пиксельные шейдеры, версия1.31.3 (2.0?)1.31.4
Текстур за проход, до48 (до 16 выборок)46
Текстурных блоков4222
Пиксельных конвейеров4444
Анизотропия2 (8, 16?)?8, 16, 32RIP-маппинг
Встроенные RAMDAC2 (10 бит!)2 (10 бит?)22
Встроенный TV-Out1 (10 бит!)нетнетнет
Число CRTC2 (+ режим растяжения на 3 экрана)222
FSAA16x FAA (фрагментный)8x MSAA4x MSAA6x pattern MSAA
N-PatchesDX9 (адаптивные)НетНетDX8
Карты смещенияДаНетНетНет

Приведем, для полноты картины, полный список OpenGL расширений, поддерживаемых с текущими драйверами:

Matrox, ICD for Parhelia version 1.2 NVIDIA, GeForce4 Ti 4400/AGP/SSE2, version 1.3.1 ATI, Radeon 8500 DDR x86/SSE2, version 1.3.2475
GL_ARB_multitexture GL_ARB_imaging GL_ARB_multitexture
GL_ARB_point_parameters GL_ARB_multisample GL_ARB_texture_border_clamp
GL_ARB_texture_compression GL_ARB_multitexture GL_ARB_texture_compression
GL_ARB_texture_cube_map GL_ARB_texture_border_clamp GL_ARB_texture_cube_map
GL_ARB_texture_env_add GL_ARB_texture_compression GL_ARB_texture_env_add
GL_ARB_texture_env_combine GL_ARB_texture_cube_map GL_ARB_texture_env_combine
GL_ARB_texture_env_dot3 GL_ARB_texture_env_add GL_ARB_texture_env_crossbar
GL_ARB_transpose_matrix GL_ARB_texture_env_combine GL_ARB_texture_env_dot3
GL_S3_s3tc GL_ARB_texture_env_dot3 GL_ARB_transpose_matrix
GL_ATI_element_array GL_ARB_transpose_matrix GL_ARB_vertex_blend
GL_ATI_vertex_array_object GL_S3_s3tc GL_ARB_window_pos
GL_EXT_bgra GL_EXT_abgr GL_S3_s3tc
GL_EXT_blend_color GL_EXT_bgra GL_ATI_element_array
GL_EXT_blend_func_separate GL_EXT_blend_color GL_ATI_envmap_bumpmap
GL_EXT_blend_logic_op GL_EXT_blend_minmax GL_ATI_fragment_shader
GL_EXT_blend_minmax GL_EXT_blend_subtract GL_ATI_map_object_buffer
GL_EXT_blend_subtract GL_EXT_compiled_vertex_array GL_ATI_pn_triangles
GL_EXT_secondary_color GL_EXT_separate_specular_color GL_ATI_texture_mirror_once
GL_EXT_compiled_vertex_array GL_EXT_fog_coord GL_ATI_vertex_array_object
GL_EXT_draw_range_elements GL_EXT_multi_draw_arrays GL_ATI_vertex_streams
GL_EXT_element_array GL_EXT_packed_pixels GL_ATIX_texture_env_combine3
GL_EXT_fog_coord GL_EXT_paletted_texture GL_ATIX_texture_env_route
GL_EXT_multi_draw_arrays GL_EXT_point_parameters GL_ATIX_vertex_shader_output_point_size
GL_EXT_packed_pixels GL_EXT_rescale_normal GL_EXT_abgr
GL_EXT_point_parameters GL_EXT_clip_volume_hint GL_EXT_bgra
GL_EXT_rescale_normal GL_EXT_draw_range_elements GL_EXT_blend_color
GL_EXT_secondary_color GL_EXT_shared_texture_palette GL_EXT_blend_func_separate
GL_EXT_separate_specular_color GL_EXT_stencil_wrap GL_EXT_blend_minmax
GL_EXT_stencil_wrap GL_EXT_texture3D GL_EXT_blend_subtract
GL_EXT_subtexture GL_EXT_texture_compression_s3tc GL_EXT_clip_volume_hint
GL_EXT_texture3D GL_EXT_texture_edge_clamp GL_EXT_compiled_vertex_array
GL_EXT_texture_compression_s3tc GL_EXT_texture_env_add GL_EXT_draw_range_elements
GL_EXT_texture_cube_map GL_EXT_texture_env_combine GL_EXT_fog_coord
GL_EXT_texture_edge_clamp GL_EXT_texture_env_dot3 GL_EXT_packed_pixels
GL_EXT_texture_env_add GL_EXT_texture_cube_map GL_EXT_point_parameters
GL_EXT_texture_filter_anisotropic GL_EXT_texture_filter_anisotropic GL_ARB_point_parameters
GL_EXT_texture_lod_bias GL_EXT_texture_lod GL_EXT_rescale_normal
GL_EXT_vertex_array GL_EXT_texture_lod_bias GL_EXT_secondary_color
GL_EXT_vertex_array_object GL_EXT_texture_object GL_EXT_separate_specular_color
GL_EXT_vertex_shader GL_EXT_vertex_array GL_EXT_stencil_wrap
GL_EXT_texture_env_combine GL_EXT_vertex_weighting GL_EXT_texgen_reflection
GL_EXT_texture_env_dot3 GL_HP_occlusion_test GL_EXT_texture_env_add
GL_KTX_buffer_region GL_IBM_texture_mirrored_repeat GL_EXT_texture3D
GL_MTX_fragment_shader GL_KTX_buffer_region GL_EXT_texture_compression_s3tc
GL_NV_texgen_reflection GL_NV_blend_square GL_EXT_texture_cube_map
GL_SGIS_multitexture GL_NV_copy_depth_to_color GL_EXT_texture_edge_clamp
GL_SGIS_texture_lod GL_NV_evaluators GL_EXT_texture_env_combine
WGL_EXT_swap_control GL_NV_fence GL_EXT_texture_env_dot3
- GL_NV_fog_distance GL_EXT_texture_lod_bias
- GL_NV_light_max_exponent GL_EXT_texture_filter_anisotropic
- GL_NV_multisample_filter_hint GL_EXT_texture_object
- GL_NV_occlusion_query GL_EXT_vertex_array
- GL_NV_packed_depth_stencil GL_EXT_vertex_shader
- GL_NV_point_sprite GL_KTX_buffer_region
- GL_NV_register_combiners GL_NV_texgen_reflection
- GL_NV_register_combiners2 GL_NV_blend_square
- GL_NV_texgen_reflection GL_SGI_texture_edge_clamp
- GL_NV_texture_compression_vtc GL_SGIS_texture_border_clamp
- GL_NV_texture_env_combine4 GL_SGIS_texture_lod
- GL_NV_texture_rectangle GL_SGIS_generate_mipmap
- GL_NV_texture_shader GL_SGIS_multitexture
- GL_NV_texture_shader2 GL_WIN_swap_hint
- GL_NV_texture_shader3 WGL_EXT_extensions_string
- GL_NV_vertex_array_range WGL_EXT_swap_control
- GL_NV_vertex_array_range2 -
- GL_NV_vertex_program -
- GL_NV_vertex_program1_1 -
- GL_SGIS_generate_mipmap -
- GL_SGIS_multitexture -
- GL_SGIS_texture_lod -
- GL_SGIX_depth_texture -
- GL_SGIX_shadow -
- GL_WIN_swap_hint -
- WGL_EXT_swap_control -


Подводя итог, хочется отметить двойственность оценки нового продукта. По сравнению с ранее имевшимися на рынке продуктами от Matrox, это супер-революция! Даже нет смысла приводить старые спецификации G400/450/550, чтобы оценить. И так все очевидно. Но по сравнению с ныне имеющимися продуктами последнего поколения от ATI (RADEON 8500) и NVIDIA (GeForce4 Ti) Parhelia выглядит уже довольно скромно. Да, разумеется, наличие 16-ти текстурников ставит этот чип как бы на ступень выше, но, как покажут наши исследования, на данном этапе формула 4 конвейера × 4 текстурника невостребована, практически ни одно (за редким исключением) приложение не умеет работать с таким режимом мультитекстурирования. Да, такие "богатства" текстурных блоков дают шанс на получение быстрых билинейной и анизотропной фильтраций. Но теоретический. Судите сами: каждый текстурник умеет производить выборку 4-х сэмплов для формирования билинейки. Это уже стандарт. Четыре текстурника — 16, 4 конвейера — 64. Именно отсюда маркетологи Matrox и взяли пресловутые 64 отсчета текстур, выбираемых за такт. Да, при этом мы получаем либо четыре билинейно фильтрованных, либо две трилинейно или анизотропно (8 отсчетов) либо одну анизотропно (16 отсчетов) текстуры за такт. Соответственно, для старых (а таковых 99,9%) «двутекстурных» приложений анизотропная фильтрация на базе 8 отсчетов должна проходить без потери скорости. Но на практике это не так, и ниже вы в этом убедитесь.

По сути получается, что ныне Parhelia обладает только одной функцией из набора DirectX 9.0 - технологией Displacement Mapping, которая позволяет существенно увеличить степень реалистичности и детальности рельефных поверхностей. В отличие от привычных уже разновидностей рельефа, наносимого на поверхности треугольников при закраске и не влияющего на видимость тех или иных точек (картой рельефа моделируется только освещенность точки, а не ее реальное положение в пространстве) карты смещения позволяют создавать геометрически корректные рельефы, пересечение которых в пространстве не будет выглядеть идеальной прямой. Я приведу яркий пример:


В данной demo-программе не только работают все 16 текстурников, но и виден эффект от карт смещения. С картами будет поставляться и другая, более шикарная демо-программа, эмулирующая кусочек живой природы рифа. Разумеется, и тут можно заметить использование карт смещения.


Надо сказать все же, что появление Vertex Shaders 2.0 мы ожидаем с выходом DirectX 9.0. Возможно, что четыре блока этих шейдеров заработают в полную силу опять же только при условии наличия DX 9.0.

Ну что ж, перейдем к рассмотрению непосредственно самой карты.

Плата

Подчеркну, что мы рассматриваем не опытный образец, а серийную карту на базе Matrox Parhelia-512.

Карта снабжена AGP x2/x4 интерфейсом, 128 МБ локальной DDR SDRAM памяти (восемь микросхем, размещенных на лицевой стороне PCB).



На карте установлены микросхемы памяти Infineon, BGA форм-фактора. Время выборки — 3.3 нс, что соответствует примерно 300 (600) МГц. Но память работает на частоте 275 (550) МГц

Микросхемы памяти в новой BGA-упаковке появились на видеокартах cовсем недавно, но уже стали весьма популярными среди производителей этой продукции (некоторые компании (ASUSTeK, S/U/M/A/) даже выпускают платы на дизайнах собственной разработки с использованием таких микросхем памяти). Этот форм-фактор обеспечивает более эффективное охлаждение чипов и память не перегревается, работая на своей штатной частоте (правда, на Parhelia 128MB память работает на частоте, чуть ниже номинальной частоты для 3.3ns). Напомним частоты серийно выпускаемых карт (ядро/память):

  • Matrox Parhelia 128MB (Retail) — 220/275 (550) MHz;
  • Matrox Parhelia 128MB (OEM) — 200/250 (500) MHz.

По всей видимости компания ATI Technologies, которая очень любит "баловаться" частотами, внесла в парламент Канады проект закона о разной частоте видеокарт в зависимости от того, в коробках те продаются или в пакетиках. И, наверное, этот закон был принят. Ибо, как мы видим, фирма Matrox точно следует примеру ATI и разделяет разночастотные карты на базе одного GPU в зависимости от типа поставки. При этом наименования самого чипсета никак не различаются. Впрочем, учитывая, что все карты Matrox выпускает самостоятельно, обманов быть или не должно, или их число будет невелико. Хотя дельцов из мира торговцев, которые захотят "погреть" руки на этой разнице, наверно, найдется не так уж и мало (судя по опыту продаж карт на базе RADEON всех мастей). Но вернемся к рассмотрению карты:

Matrox Parhelia 128MB
Без кулера

Перед нами очень необычного дизайна карта. Разумеется, наличие 256-битной высокоскоростной шины не может не сказаться на усложнении PCB. Прежде всего мы заметим наличие экрана, предохраняющего от наводок:


Также можно заметить огромное количество элементов на карте, отвечающих за стабильность работы. Мы видим, что разработчики из Matrox много потрудились над этой картой, сделав все, чтобы устранить возможные наводки от сложной по дизайну разводки, которые могли бы ухудшить качество картинки (мы все помним, что первый опыт высокоскоростной карты на базе GeForce2 Ultra был печальным: на экране монитора подчас можно было видеть рябь — так влияла несовершенность дизайна PCB).


Заметим, что у карты имеется два выхода DVI, поэтому для подключения обычных CRT-мониторов обязательно потребуется переходник, но об этом ниже. Обратим также внимание на качество выходных фильтров, которому инженеры из Matrox уделяют самое пристальное внимание (вероятно, из-за боязни упрощения дизайна своих карт Matrox и не передает производство плат сторонним фирмам). В целом, PCB получилась очень дорогая, что не может не сказаться на себестоимости.

Микросхемы памяти расположены почти по кругу около чипа, что выглядит необычно, но вполне логично (для уменьшения расстояния между ними и чипом). Кстати, обратите внимание на размеры самого GPU:


Это просто гигант по сравнению с другими! Да и вид у него непривычный: металлическая крышка полностью покрывает ядро (вначале, когда на GPU был еще установлен кулер, я подумал, что под ним — керамический процессор, настолько чип сбоку был похож на прежние Pentium-подобные процессоры). И это сделано неспроста, ибо Parhelia-512 очень сильно греется даже на 220 МГц. Полагаю, что разогнать его будет практически невозможно (но об этом ниже).

Однако кулер установлен вполне обычной формы (по-видимому, инженеры долго боролись с перегревом чипа, понижая его частоту, пока не нашли компромисс между приличной еще скоростью и отсутствием особо дорогой системы охлаждения).

Возвращаясь к двум DVI-коннекторам у карты, скажем, что по сути это универсальные гнезда, а не просто DVI, поскольку каждое может играть не одну роль. Посмотрим, что входит в комплект поставки с картой:

  • Для того, чтобы подключить один CRT-монитор, нужен всего лишь переходник DVI-to-d-Sub (белый). Он подключается к нижнему гнезду DVI на карте (см. фотографии выше).
  • Если же нужно подключить два или три монитора, то к верхнему гнезду DVI подключаем переходник DVI-to-2-d-sub и уже к его "хвостам" можем подключить один или два монитора.
  • Если нужен TV-out, то к верхнему гнезду DVI подключается тот же переходник DVI-to-2-d-sub и уже к его "хвостам" подключаем другой переходник DVI-to-TV-out, имеющий два "хвоста": S-Video и RCA. При этом можно задействовать технологию DualHead и, в частности, DVDMax.
  • При этом к оставшемуся свободным "хвосту" у DVI-to-2-d-sub можно подключить второй монитор и организовать Surround Video (на трех приемниках) с помощью двух мониторов и телевизора, хотя таким извращением вряд ли кто будет заниматься :-)

Попробуем подключить три монитора:

После активизации соответствующего режима в драйверах (о настройках расскажем ниже) мы получаем расширение рабочего стола на три монитора:

Поверьте, это выглядит очень необычно и непривычно :-) Особенно при инсталляции чего-либо :-)

К сожалению, как включить подобный режим Surround Games в игре Quake3 мы узнали слишком поздно (карту уже отдали), а насчет UT2003 так и не выяснили, поэтому мы ограничились просмотром одной стратегической игры, где на каждом мониторе показываются виды с разных камер наблюдения:

Ну и, конечно, та самая демо от Matrox, показывающая жизнь кораллового рифа:

Это выглядит впечатляюще! Более того, пришедший в это время к нам в гости знакомый просто восхитился: "Аквариум на трех мониторах!!!" :-) Да и мы долго не могли оторваться от этой завораживающей картинки. Право, не зря мы целый час высвобождали место и перетаскивали три тяжеленных 21-дюймовых монитора!



TV-out работает просто блестяще! Мало того, что в настройках драйверов есть все для оптимизации картинки на ТВ, у Parhelia есть и фирменный метод DVDMax, позволяющий выводить фильмы на ТВ в полноэкранном режиме, освобождая при этом рабочий стол на мониторе. Да, надо сказать прямо: до уровня качества и возможностей TV-out от Matrox еще всем расти и расти! Прежде всего это касается NVIDIA с ее откровенно говоря наспех сделанным nView, который до сих пор подчас глючит в драйверах.

Ну и? в заключение рассмотрения особенностей самой карты, посмотрим на коробку, в которой такие платы будут продаваться:

Разгон

Когда мы только начали исследовать работу карты на штатных частотах, то пришли к выводу, что при таком нагреве наверняка разгон будет почти невозможен. А он оказался не почти, а вообще невозможен на данном этапе из-за того, что последняя версия (3.20) PowerStrip пока не умеет работать с Parhelia.

Установка и драйверы

Рассмотрим конфигурацию тестовых стендов, на которых проводились испытания карт:

  • Компьютер на базе Pentium 4 (Socket 478):
    • процессор Intel Pentium 4 2200 (L2=512K);
    • системная плата ASUS P4T-E (i850);
    • оперативная память 512 MB RDRAM PC800;
    • жесткий диск Quantum FB AS 20GB;
    • операционная система Windows XP.
  • Компьютер на базе Athlon XP:
    • процессор AMD Athlon XP 2000+;
    • системная плата Soltek 75DRV5 (VIA KT333);
    • оперативная память 512 MB DDR SDRAM PC2700;
    • жесткий диск Fujitsu 20GB;
    • операционная система Windows XP.

На стендах использовались мониторы ViewSonic P810 (21") и ViewSonic P817 (21").

При тестировании применялись драйверы от Matrox версии 2.26. VSync отключен.

Для сравнительного анализа приведены результаты уже знакомых читателям видеокарт:

  • ASUS V8460Ultra (GeForce4 Ti 4600, 300/325 (650) МГц, 128 МБ);
  • S/U/M/A/ Platinum GeForce4 Ti 4200 (250/222 (444) МГц, 128 МБ);
  • Gigabyte MAYA AP128DG-H RADEON 8500 Deluxe (275/275 (550) МГц, 128 МБ, driver 6.071).

Настройки драйверов

Желающие познакомиться со сводной картинкой настроек драйверов могут скачать вот этот анимированный GIF-файл (850К). А мы рассмотрим все настройки подробно по отдельности. Надо отметить два момента:

  1. Для полноценной работы драйверов потребуется установить окружение Microsoft .NET Framework, которое поставляется на диске с драйверами; без него настройки PowerDesk будут недоступными.
  2. На настоящее время поддерживается только операционная система Windows XP, поддержка Win9x/ME под вопросом, и очень вероятно, что ее не будет вообще, поэтому будущим покупателям Parhelia надо это иметь в виду.


Перед нами главное меню настроек, как мы видим, уже тут имеется богатый набор регулировок.

На этой панели пользователь может выбрать режим работы карты с мониторами.

Это переходное меню к настройкам цветности, геометрии и т.д. для монитора(ов) или телевизора. При этом в левой части можно будет выбрать монитор или телевизор.

Собственно, вот и настройки геометрии для монитора. Надо сказать, что для ТВ их намного больше, можно изменять размеры не по 4-м направлениям, а по целым 8-ми (включая диагонали).

Переходим к настройкам 2D. Можем включать фирменную технологию сглаживания шрифтов, выбирать режим работы карты (обычный 32-битный как 24+8 или Gigacolor как 30+2). Я на этом остановлюсь немного дальше. Что может реально дать пользователю сейчас переход с привычной схемы 8+8+8 (24бит) на 10+10+10 (30бит) (речь о 2D)? — Разумеется, пока ничего. Но это неплохой задел на будущее. Сейчас любая "старая" 24-битная картинка будет смотреться одинаково, однако есть ряд редакторов, имеющих свою внутреннюю более высокую точность работы с цветом. И вот тут, при создании объемных иллюстраций, где много сверхтонких передач цвета, Gigacolor от Matrox весьма поможет. Да, конечно, есть ограничение в виде обязательного наличия такой же Parhelia при просмотре созданных 30-битных картинок. Но возможно, что будущие продукты от ATI или NVIDIA смогут использовать также режимы с повышенной битностью на каждый канал.

Однако есть и обратная сторона медали. Это касается 3D.

Наличие дополнительных 8 бит для альфа-канала до какого-то времени, когда царствовали 16-битные текстуры, практически никогда не было востребованным. Поэтому жертвование битностью альфа-канала вполне оправдано ради повышения точности отображения основной графики (текстур). Но это было. Теперь уже многие разработчики игр переориентировались на 32-битный формат и те самые 8 бит для альфа-канала могут быть востребованными. Да и будут ли разработчики использовать эти возможности 10+10+10 ради повышения качества графики (ведь надо специально изготавливать 30-битные текстуры, либо в расчетах эффектов применять не 24, а 30-битную точность)? Сомневаюсь. Это не стандарт. А уже хорошо известно, что стандартом становится то, на что рассчитана основная масса акселераторов. А их, умеющих работать только со "старым" 32-битным цветом, подавляющее большинство. Судя по предварительным прогнозам, ATI и NVIDIA не станут озабочиваться поддержкой такого 32-битного цвета в 3D, введя сразу 64-бит или даже 128. Поэтому можно сказать, что Matrox опоздал с этой новацией. В 3D-графике этим вряд ли кто воспользуется.

Как посмотреть на этот самый 30-битный цвет? Да никак! Если у вас нет Parhelia, то вы ничего не увидите. Это примерно то же самое, как показать работу стерео-эффекта. Пока сам не купишь очки и не установишь необходимое оборудование на своем компьютере, не узнаешь.

Matrox использует способы демонстрации бандинга (полосатости) для различий между 24- и 30-битными картинками. Ну, мягко говоря, это нечестный способ.

Пойдем дальше.

Перед нами настройки по 3D. Сразу видно, что небогато. Но, тем не менее, основные функции присутствуют.

Прежде всего, мы можем выбрать режим работы 32-битного цвета (о чем выше говорилось).

Затем активизировать фирменный Fragment AA 16x (или суперсэмплинг 4х).

Ну и выбрать режим работы фильтраций, а также отрегулировать VSync.

Далее идут настройки уже, касающиеся MPEG2-проигрывания и оверлеев в целом.

На этих панелях есть возможности по управлению DVDMax, технологии, использующей Dualhead для просмотра кино на ТВ или втором мониторе.

А здесь мы можем настроить работу режима Overlay.

Остальные настройки отвечают за комфорт и дополнительные функции при работе с desktop:

Кроме всего прочего, не забыта и фирменная технология Multidesktop. Мы по-прежнему можем организовывать виртуальные рабочие столы и настраивать их:

На этом рассмотрение особенностей драйверов от Matrox мы заканчиваем.

Результаты тестов

2D-графика

Традиционно начнем с 2D. Ну, как говорится, Matrox есть Matrox. Тут все на высшем уровне, 1600х1200х100Гц на обеих "головах" выглядят безупречно. Никаких замечаний!

Я даже не стану повторять традиционную фразу о том, что оценка 2D-качества есть вещь субъективная. Подобные платы выпускает только компания Matrox, поэтому, полагаю, что в данном случае качество уже не зависит от конкретного экземпляра, но связка карта-монитор могут по-прежнему играть огромную роль, прежде всего качество монитора и кабеля.

Полагаю, что скорость работы Parhelia в 2D также не нуждается в измерениях, как и у всех карт последнего поколения, она высока.

3D-графика, MS DirectX 8.1 SDK — предельные тесты

Для тестирования различных предельных характеристик чипов мы использовали модифицированные (для большего удобства и контроля) примеры из последней версии DirectX SDK (8.1, релиз). Без лишних преамбул перейдем к уже хорошо знакомым нашим постоянным читателям тестам:

Optimized Mesh

Этот тест призван выяснить практический предел пропускной способности ускорителя по треугольникам. Для этого используется несколько одновременно выводимых в небольшом окне моделей, каждая из которых состоит из 50 тысяч треугольников. Текстурирование отсутствует. Размеры моделей минимальны — каждый треугольник не превышает одного пиксела. Хочется сразу отметить, что результат этого теста, разумеется, останется недостижим для реальных приложений, где размеры треугольников значительны, присутствуют текстуры и освещение. Приведем результаты этого теста для трех методов отрисовки — оптимизированной для оптимальной скорости вывода (в том числе, с учетом размера внутреннего кэша вершин на чипе) модели — Optimized, неоптимизированной исходной модели — Unoptimized и той-же неоптимизированной модели, выводимой в виде одного Triangle Strip — Strip:

В случае полностью оптимизированной модели, когда влияние подсистемы памяти минимально, мы измеряем практически чистую производительность трансформации и установки треугольников. Налицо безоговорочное лидерство Ti 4600. 65 миллионов треугольников в секунду — цифра нешуточная, практически вдвое превосходит результаты RADEON 8500 и Parhelia. Мы понимаем, что именно так и должен был отразиться на производительности Ti 4600 второй блок T&L относительно RADEON 8500, но почему Parhelia с ее 4-мя блоками вершинных шейдеров так отстала? Налицо работа только одного конвейера.

Кроме того, отметим существенное преимущество всех GPU в случае принудительной активации программного расчета геометрии. В случае Strip модели это преимущество нивелируется из-за существенного (вдвое) снижения объема передаваемых данных.

Производительность блока вершинного шейдера

Этот тест позволяет определить предельную производительность блока вершинных шейдеров. Выполняется достаточно сложный шейдер, вычисляющий как видовые преобразования, так и геометрические функции. Тест проводится в минимальном разрешении, дабы минимизировать влияние закраски:

И вновь налицо существенное преимущество реально "двойного" T&L Ti 4600. И снова сильный проигрыш Matrox Parhelia.

Интересно, что со времени прошлого большого обзора NV25 скорость выполнения RADEON 8500 вершинных шейдеров почти не выросла, но увеличение процессорной мощности тестового стенда позволило программной эмуляции опередить по скорости аппаратную обработку. Что наблюдается также и у Matrox. Вероятно, что и карта от ATI и от Matrox уперлись в частоты работы своих GPU, и 2.2ГГц процессор Pentium 4 справляется с этой задачей даже быстрее.

Вершинный матричный блендинг

Эта возможность T&L используется для правдоподобной анимации и скиннинга моделей. Мы протестировали блендинг с использованием двух матриц как в жестком "аппаратном" варианте, так и с использованием вершинного шейдера, выполняющего ту же функцию. Кроме того, мы, как обычно, "подстраховались" результатами, полученными в режиме программной эмуляции T&L:

На сей раз, программная эмуляция везде проигрывает аппаратному исполнению, упираясь, судя по всему, (обратите внимание на похожести результатов с шейдером и без) в скорость передачи геометрии по AGP. В случае аппаратного исполнения, мы снова видим всплеск у Ti 4600 из-за его 2-х конвейеров вершинных шейдеров, и незначительный рост у RADEON 8500 и Parhelia. Интересно, что жесткий аппаратный блендинг на RADEON 8500 равен, а на Parhelia чуть медленнее шейдерного, но отличия крайне малы.

EMBM рельеф

В этом тесте мы измеряем производительность, а точнее ее падение, возникающее при использовании наложения карт отражения (Environment) и рельефа на основе карт отражения (EMBM — Environment Bump). Для тестирования использовалось разрешение 1280*1024 — т.к. именно в нем различия между картами и разными режимами текстурирования выражены наиболее резко:

Ti 4600 вновь занимает четкую лидирующую позицию, заметно опережая остальные карты по эффективной скорости закраски во всех трех режимах. Сильнее всего EMBM бьет по R200, однако сама по себе разница в падении не столь существенна, сколь низка эффективность любой (даже без EMBM) закраски на R200. Чип от Matrox красит хотя и медленнее, но при полной нагрузке гораздо эффективнее, чем R200.

Производительность пиксельных шейдеров

Мы вновь использовали модифицированный пример MFCPixelShader, измерив производительность карт в высоком разрешении при выполнении 5 различных по сложности шейдеров, для билинейно фильтрованных текстур:

Ti 4600 на коне, и характер зависимости от сложности шейдера и числа текстур представляет собой почти стабильную горизонталь с некоторым падением вначале. То же самое можем сказать и про Parhelia. Как мы видим, наличие одного числа пиксельных конвейеров у Ti 4600 и у Parhelia с разницей лишь в частотах и обусловили почти постоянную дельту между этими двумя картами. А вот R200 демонстрирует печальную слабость, существенно сдавая на сложных заданиях. Повторное использование текстурных блоков стоит ему гораздо дороже, нежели творениям Matrox и NVIDIA.

Итак, подведем первый промежуточный итог. По сумме тестов DX 8.1 SDK карта Matrox Parhelia 128MB выходит почти пораженцем. Этого от нее не ожидалось — ведь декларации гласили о наличии 4-х вершинных конвейеров, а в действительности задействован только один. Это может быть следствием как несовершенства драйверов, так и наличия ошибки в чипе. А вот работа с пиксельными шейдерами у Parhelia на высоте. Хотя и отстает по скорости от Ti 4600.

Мы еще вернемся к этим тестам несколько позже (примерно в августе), когда будет возможность протестировать наличие VS 2.0 на DirectX 9.0.

3D-графика, 3DMark2001 SE — синтетические тесты

Подчеркну, что все замеры по всем 3D-тестам проводились в 32-битной глубине цвета.

Скорость закраски



Напомним, что теоретические пределы для данного теста составляют 880 миллионов пикселей в секунду для Parhelia, 1100 для RADEON 8500 и 1200 для Ti 4600 соответственно. Как мы видим, по фактической скорости закраски Parhelia наиболее близко подошла к пиковым значениям.

Также напомним, что пиковые значения для этого теста составляют 3520 (1760) миллионов текселей в секунду для Parhelia (в скобках указано значение при работе схемы 4 конвейера по 2 текстурника на каждом), 2200 — для RADEON 8500 и 2400 для Ti 4600. И уже тут хорошо видно, что прямо около своей пиковой скорости оказался уже Ti 4600, чуть далее — RADEON 8500. А вот с Parhelia все более сложно. Очевидно, что была задействована схема не 4 × 2, а 4 × 4, однако при этом реальная скорость закраски оказалась сильно ниже пикового значения. И это еще одно доказательство того, что чип работает не в полную свою силу. Почему? Лучше спросить у инженеров из Matrox (или программистов).

Сцена с большим количеством полигонов

На этом тесте особое внимание следует уделить минимальному разрешению — именно там зависимость от закраски практически нивелируется:

При наличии одного источника света Ti 4600 показывает себя абсолютным лидером. Его результат не только значительно (более, чем в 2 раза) превосходит Parhelia, но и (что более важно) вплотную приблизился к значению практического предела пропускной способности по треугольникам, полученному ранее с помощью Optimized Mesh из DX8.1 SDK. Еще одно свидетельство мощи двойного T&L Ti 4600. Впрочем, не будем умалять достоинств RADEON 8500, также приблизившегося к предельной цифре, полученной в тесте из SDK. А вот с Parhelia снова неясно. Налицо отставание скорости работы с одним источником света от продемонстрированного ею же предела ПС по полигонам. Опять драйверы?

А вот в случае 8 источников света Parhelia несколько реабилитирует себя: с ростом числа источников его производительность падает более медленно, чем RADEON 8500, да и в целом продукт от Matrox тут сильно выигрывает у R200. Но лидер — по-прежнему Ti 4600.

Рельефное текстурирование

Посмотрим на результаты синтетической EMBM сцены:

Несмотря на то, что в предельных тестах Parhelia продемонстрировала бОльшую скорость работы с рельефным текстурированием, чем у RADEON 8500, в данном случае видно небольшое отставание от последнего. А теперь DP3 рельеф:

Картина схожая.

Вершинные шейдеры



Данный тест лишь подтвердил работоспособность только одного конвейера T&L у Parhelia, поскольку мы наблюдаем отставание этой карты от RADEON 8500 в точном соответствии с частотами. Кстати, обратим внимание на то, что с ростом разрешения и RADEON 8500, и Parhelia стремительно сдают свои позиции, упираясь в недостаточную эффективность закраски, в то время как скорость Ti 4600 падает медленнее.

Пиксельный шейдер

Руководствуясь высказанными выше соображениями о том, что слишком малые разрешения "упираются" в геометрию, а слишком большие — в пропускную полосу памяти, обратим основное внимание на 1024х768 и 1280х1024:

Чудеса, да? Совсем недавно при тестировании пиксельных шейдеров в SDK Parhelia демонстрировала явный перевес над RADEON 8500. А тут мы видим просто провальные результаты. Учитывая приспосабливаемость теста 3DMark2001 SE к разным картам, могу предположить, что вскоре выйдет патч к нему, после которого скорость работы Parhelia резко возрастет. Для чистоты эксперимента посмотрим и на тест Advanced Pixel Shader.

Картина очень похожая. Заметим, что в данном случае карты от Matrox и NVIDIA исполняют задачу за 2 прохода, используя шейдеры версии 1.1, когда RADEON 8500 требуется только 1 проход с использованием шейдеров 1.4, но это его не спасает.

Спрайты



В этой области у Parhelia совсем все плохо.

Итак, подведем первый промежуточный итог. По сумме синтетических тестов карта Matrox Parhelia 128MB проигрывает своим конкурентам (не считая работы с большим числом источников света). Впрочем, частично это и ожидалось — ведь частота работы карты сильно ниже, чем у соперников, несмотря на наличие вдвое большего числа текстурников. Да и 4 вершинных конвейера не видать. Так что, ждем улучшений работы с выходом новых версий драйверов (если это виноваты драйверы) или смены заявленных характеристик от Matrox (если виноват сам чип и это уже не исправить программным путем). Однако не будем забывать, что только результаты реальных приложений позволят нам судить об общей производительности, да и сбалансированности Parhelia. Оставайтесь с нами.

3D-графика, 3DMark2001 — игровые тесты



3DMark2001, 3DMARKS

На основании общих "марков" можно отметить, что Parhelia отстала от всех соперников. Проиграла даже Ti 4200. А теперь посмотрим более подробно.



3DMark2001, Game1 Low details

Характеристики теста:

  • Rendered triangles per frame (min/avg/max): 19773/33753/143422
  • Rendered textures per frame with 16 bit textures (min/avg/max): 7.5/8.8/16.5 MB
  • Rendered textures per frame with 32 bit textures (min/avg/max): 15.1/17.7/30.3 MB
  • Rendered textures per frame with texture compression (min/avg/max): 10.7/12.2/21.0 MB

Отставание у Parhelia в разрешении 1600х1200х32 таково: от Ti 4600 — 46.7%, от Ti 4200 — 30%, от RADEON 8500 — 32.8%.

А вот активизации АА мы видим явное преимущество FAA 16x от Matrox над 4х от NVIDIA. Качество рассмотрим ниже.

И мы видим, что, несмотря на предполагаемую бесплатность анизотропии при 8-семпловой выборке, падение производительности все же имеется, хотя оно и меньше, чем у GeForce4 Ti. В наличии опять неработоспособность части текстурников.



3DMark2001, Game2 Low details

Характеристики теста:

  • Rendered triangles per frame (min/avg/max): 46159/51440/147828
  • Rendered textures per frame with 16 bit textures (min/avg/max): 8.0/8.8/10.1 MB
  • Rendered textures per frame with 32 bit textures (min/avg/max): 15.6/17.2/19.8 MB
  • Rendered textures per frame with texture compression (min/avg/max): 9.3/10.9/13.5 MB

Отставание у Parhelia в разрешении 1600х1200х32 таково: от Ti 4600 — 43%, от Ti 4200 — 24.8%, от RADEON 8500 — 25.4%.

При включении АА снова явное преимущество FAA 16x от Matrox над 4х от NVIDIA, не говоря уже об 4х от ATI.

В данном тесте падение производительности при активизации анизотропии у Parhelia сильно меньше, чем у GeForce4 Ti.



3DMark2001, Game3 Low details

Характеристики теста:

  • Rendered triangles per frame (min/avg/max): 16681/21746/39890
  • Rendered textures per frame with 16 bit textures (min/avg/max): 2.8/4.1/4.7 MB
  • Rendered textures per frame with 32 bit textures (min/avg/max): 5.7/8.2/9.4 MB
  • Rendered textures per frame with texture compression (min/avg/max): 5.0/7.2/8.4 MB

Отставание у Parhelia в разрешении 1600х1200х32 таково: от Ti 4600 — 41%, от Ti 4200 — 21.6%, от RADEON 8500 — 26.6%.

Мы видим феноменальный перевес в производительности при включении FAA 16x у Parhelia, но все ли так хорошо? Немного терпения, и ниже мы рассмотрим вопросы качества.

Падение производительности при активизации анизотропии у Parhelia примерно равно тому, каким обладают ее соперники.



3DMark2001, Game4

Характеристики теста:

  • Rendered triangles per frame (min/avg/max): 55601/81714/180938
  • Rendered textures per frame with 16 bit textures (min/avg/max): 14.9/17.4/20.7 MB
  • Rendered textures per frame with 32 bit textures (min/avg/max): 28.4/33.5/40.0 MB
  • Rendered textures per frame with texture compression (min/avg/max): 28.4/33.5/40.0 MB

Отставание у Parhelia в разрешении 1600х1200х32 таково: от Ti 4600 — 47.6%, от Ti 4200 — 27.6%, от RADEON 8500 — 44%.

А в данном тесте Parhelia не помогло и включение FAA 16x, скорость очень низкая. Впрочем, сам этот тест весьма сложен, хотя компания ATI в свое время смогла как-то найти способ оптимизации работы своих карт в Game4, с тех пор этот тест — "королевский" для RADEON 8500.

Интересно отметить, что падение производительности при активизации анизотропии у Parhelia в данном случае весьма велико! Явно влияние простаивания половины текстурников у детища от Matrox.

Подводя итоги работы Parhelia в 3DMark2001, можно с очень большим сожалением отметить, что карта очень сильно проиграла соперникам, имеющим гораздо меньшую стоимость и потенциальную мощность. Ну что можно сказать? Хотели как лучше, а получилось… Даже еще хуже, чем всегда. Да, разумеется, схема 4 × 4 не работает. Имеем 4 × 2 при 220 МГц частоты чипа. И даже супербольшая пропускная способность шины обмена с памятью не поможет поднять потенциал самого GPU. Ну и плюс отсутствие обещанных 4-х конвейеров T&L.

3D-графика, игровые тесты

Приступаем к оценке производительности видеокарты в 3D-играх. В качестве инструментария мы использовали:

  • Return to Castle Wolfenstein (MultiPlayer) (id Software/Activision) — OpenGL, мультитекстурирование, Checkpoint-demo, настройки тестирования — все на максимально возможном уровне, S3TC OFF, конфигурации можно скачать тут

  • Serious Sam: The Second Encounter v.1.05 (Croteam/GodGames) — OpenGL, мультитекстурирование, Grand Cathedral demo, настройки тестирования: quality, S3TC OFF

  • Quake3 Arena v.1.17 (id Software/Activision) — OpenGL, мультитекстурирование, Quaver, настройки тестирования все на максимальном уровне: уровень детализации — High, уровень детализации текстур — №4, S3TC OFF, плавность кривых поверхностей резко увеличена при помощи переменных r_subdivisions "1" и r_lodCurveError "30000" (подчеркну, что по умолчанию r_lodCurveError "250" !), конфигурации можно скачать тут

  • Comanche4 Benchmark Demo (NovaLogic) — Direct3D, Shaders, Hardware T&L, Dot3, cube texturing, максимально возможное качество

  • Unreal Tournament 2003 Demo v.927 (Digital Extreme/Epic Games) — Direct3D, Vertex Shaders, Hardware T&L, Dot3, cube texturing, качество по умолчанию

  • Code Creatures (CodeCult) — игровой тест (на базе демо-версии), демонстрирующий работу платы в DirectX 8.1, Shaders, HW T&L.

Quake3 Arena, Quaver



Что мы видим? Да ничего хорошего для Parhelia. Такое же отставание от всех соперников. 220 МГц и 4 × 2 вместо 4 × 4 дают о себе знать. И даже FAA не спасает ситуацию.

Serious Sam: The Second Encounter, Grand Cathedral

Поскольку конфигурация настроек этой игры очень сложна, и ее трудно описать словами, я приведу скриншоты установок:

Итак, что же мы получили:

Обратите внимание на то, что, несмотря на отставание в этом тесте, Parhelia при росте разрешения смогла удержать позиции по производительности почти на том же уровне. Вот уже начинает сказываться то, что в данной игре возможно задействовать все 4 текстурника на каждом конвейере. Конечно, низкая частота работы GPU и экономия разработчиков Matrox на кэшировании, не позволяют этой карте даже при таком полноценном использовании всего конвейерного потенциала догнать соперников. Однако при включении FAA ситуация резко меняется в пользу Parhelia.

Return to Castle Wolfenstein (Multiplayer), Checkpoint



Результаты для Parhelia просто катастрофичны! И даже FAA не помогает карте догнать лидера. Впрочем, Ti 4200 при AA4x в 1280х1024 все же проиграл, но это даже не серьезно.

Должен заметить, что результаты работы RADEON 8500 при AA 4x Quality практически даже не конкурентоспособны, поэтому мы с ними не сравниваем, падение скорости у детища ATI настолько велико, что этот режим малопригоден для применения на практике.

Code Creatures

Этот тест создан на базе движка от CodeCult, на котором в производстве находится несколько игр.


Движок примечателен тем, что использует практически все современные возможности видеокарт последнего поколения. Плюс демо-программа на базе этого движка содержит очень тяжелые для акселераторов сцены как по объему текстур, геометрии, так и по числу используемых эффектов.

Ввиду вышеуказанной сложности теста, мы сняли показания только в разрешении 1024х768, поскольку даже в этом режиме самые мощные карты резко "просаживаются".

Прошу обратить внимание на то, что детище от Matrox показало себя в данном случае не на самом последнем месте. Все же работа пиксельных шейдеров (а в этом тесте именно они формируют водную поверхность, а также небо) у Parhelia идет на довольно высокой скорости, а провалы при тестировании 3DMark2001 опять можно объяснить "незнанием" этой программой такого GPU. Плюс выручает гигантская пропускная способность памяти. Все упирается в относительно низкую частоту работы самого графического процессора.

Comanche4 DEMO



Этот тест также является довольно сложным для акселератором, да и зависимость от центрального процессора у него весьма сильная. Но, к сожалению, в нем не используются возможности Parhelia, половина текстурных блоков по-прежнему простаивает, а с вершинными шейдерами, которые задействованы в игре, у канадского творения явные проблемы (пока?).

Unreal Tournament 2003 DEMO b.927



Учитывая особенность работы этого теста с RADEON 8500 (см. 3DGiТоги), мы провели этот тест на стенде на базе VIA KT333 (Athlon XP). Известно, что это приложение активно использует вершинные шейдеры. А что мы имеем у Parhelia? Снова проигрыш везде. Увы.

Качество 3D-графики

АНИЗОТРОПНАЯ ФИЛЬТРАЦИЯ

Подробности о работе этой функции, и для чего она нужна, вы можете почитать в нашем разделе 3DGiТогов, посвященном данной теме.

Мы знаем, что реализация этой функции у разных фирм-производителей видеопроцессоров отличается. Да и скоростные характеристики анизотропий, скажем, от ATI и от NVIDIA, сильно отличаются. Схоже только результирующее качество.

И вот, галерею скриншотов из вышеуказанного раздела 3DGiТогов мы пополнили образцами качества анизотропии у Matrox Parhelia.

  1. 3DMark2001 (Game1, Game2):
  2. Serious Sam: The Second Encounter:
  3. Return to Castle Wolfenstein:

Я полагаю, что читатели сами убедятся в том, что качество исполнения анизотропной фильтрации — на уровне GeForce4 Ti в той же степени Level2.

АНТИ-АЛИАСИНГ (АА)

Эта функция борьбы с "лестницами по краям объектов", называемыми артефактами алиасинга, также имеет давнюю и сложную историю. Дело в том, что у АА аппетиты еще выше, чем у анизотропии (если имеем дело с существенными уровнями АА, дающими заметное визуальное улучшение картинки).

Рекомендую еще раз почитать наш аналитический материал по Matrox Parhelia, где доступно описан новый метод АА, предлагаемый Matrox. По своей сути это суперсэмплинг, до 16 отсчетов на одну точку экрана. Но, выполняется он ТОЛЬКО (!) для точек принадлежащих краям полигонов (всего 3..5% типичной сцены):

Основное преимущество очевидно: в отличие от мултисэмплинга избыточные данные не хранятся в памяти и не пересылаются по шине! Суммарный размер буфера кадра возрастает незначительно, не более чем вдвое, даже при максимальной 16x установке. Для определения граничных пикселей используется специальный быстрый проход рендеринга, когда ускоритель в отдельном буфере помечает только граничные пиксели полигонов, не вычисляя значения текстур и не закрашивая промежуточных точек. Кроме того, т.к. обрабатываются только края полигонов, не возникает свойственной FSAA и некоторым гибридным MSAA техникам потери четкости текстур.

Однако столь интеллектуальный метод AA способен в некоторых случаях вызывать артефакты. Кроме того, он не может корректно обрабатывать сглаживание границ, перемешаных с полупрозрачными полигонами (например облака, туман, стекла, огонь в играх). Пользователь может переключиться на хорошо знакомый классический 4х (2х2) MSAA, также поддерживаемый чипом.

Давайте посмотрим на качество.

GeForce4 Ti Parhelia
3DMark2001, Game 1
No AA
AA 4x
AA 4x FAA 16x
3DMark2001, Game 4
No AA
AA 4x
AA 4x FAA 16x


Заметим, что различий между FAA 16X и AA4x вообще почти нет. Учитывая, что этот режим у Parhelia является очень даже интересным в силу относительно малого падения производительности, можем только похвалить разработчиков из Matrox за это. Но есть и большая ложка дегтя.

Parhelia
3DMark2001, Game 3
No AA
AA 4x FAA 16x


Заметили, что слева внизу границы рукояти пистолета при FAA 16x не были обработаны? К сожалению, подобные факты имеют место не только в данном тесте. Выше мы уже говорили о ряде моментов, при которых фирменный метод от Matrox не работает. Вот оно и подтверждение тому. Да, что-то напоминает анизотропию от ATI (где-то фильтруем, где-то нет). Но придется воспринимать и данный факт как особенность метода FAA в реализации Matrox.

Качество 3D в целом

Несмотря на некоторую грустность данного материала, я хочу с радостью сообщить, что программисты Matrox все же постарались на славу. Да, мы не знаем, кто виноват в том, что вместо 4-х вершинных конвейеров работает только один (или работают все 4, но очень и очень слабо), а также почему вместо обещанных шейдеров 2.0 мы имеем лишь 1.1. Возможно, это недоработка с драйверами. Но факт в том, что на первом релизе драйверов мы не усмотрели НИ ОДНОГО АРТЕФАКТА в 3D-ИГРАХ! Даже такие проблемные, как Warcraft III и Morrowind, работали отменно:


Мы прогнали 14 игр, и никаких нареканий не усмотрели.

И последнее. Как было сказано выше, в настройках драйверов у Parhelia есть возможность форсирования трилинейной фильтрации. Должен сказать, что это работает во всех играх. И даже если приложение само может управлять фильтрациями, то в наличии будет все равно трилинейка, причем "честная":

Выводы

  1. Очень сложная оценка, поскольку практически все в Matrox Parhelia неоднозначно.
  2. Несмотря на самый "многотранзисторный" на сегодня чип, Parhelia выглядит весьма скромно в плане производительности в 3D. Да, виной тому низкая частота работы графического процессора. 220 МГц на сегодня — это очень мало. Но 0.15 мкм техпроцесс и отсутствие опыта в создании столь сложного чипа (вспомним, что в 2001 году по 0.15 мкм NVIDIA смогла выпустить лишь 200 МГц GeForce3, и год ушел на отработку технологии, позволившей поднять частоты на 1/3) сделали свое черное дело, и Parhelia продемонстрировала результаты подчас даже ниже, чем у GeForce4 Ti 4200. Eще сыграло свою черную роль отсутствие малейшей оптимизации работы с памятью (несмотря на огромную ПСП), а также возможная экономия на кэшах. Также можем предположить не совсем эффективную работу контроллера памяти с новой шиной.
  3. Очень спасает ситуацию фирменный режим АА — FAA 16x, который в большинстве случаев выносит Parhelia в лидеры по сравнению с производительностью MSAA 4x у GeForce4 Ti 4600. Но и тут не без горчинки: на некоторых сценах данный метод пропускает часть подлежащих сглаживанию границ.
  4. К сожалению, анизотропия представлена только режимом Level2 (надеемся на драйверы и исправление этого недостатка).
  5. Еше большее сожаление вызывает низкая производительность вершинных шейдеров при заявленных четырех конвейерах. Есть очень большое подозрение, что работает всего один из них. Кто виноват? Возможно, отсутствие DirectX 9.0, и, как следствие, версии 2.0, что могло повлечь за собой блокирование 3-х из 4-х конвейеров. При следующем тестировании мы проверим эту гипотезу.
  6. Работу новинки — карт смещения — мы рассмотрим, когда она станет более востребованной разработчиками (и после выхода DirectX 9.0).
  7. Теперь о плюсах. Прежде всего, это высокая скорость пиксельных шейдеров, в чем мы могли убедиться на примере некоторых тестов (конфуз со скоростью в 3DMark2001, возможно, разрешится с выходом очередного патча для этого многоликого теста).
  8. Отсутствие артефактов в 3D вроде бы не является плюсом (по логике вещей так и должно быть), но это лишь теоретически. Мы прекрасно знаем, что всякий выход нового графического чипа сопровождается проблемами с качеством в 3D (это касается прежде всего SIS, ATI), которые почти всегда имеют место и даже после выхода продуктов в продажу. А данный случай явился прекрасным и приятным исключением из утвердившегося несколько лет назад правила.
  9. Ну и, конечно же, возможности в 2D и технологии вывода изображения на три приемника. Это действительно где-то сенсация, пусть и для очень узкого круга пользователей (мало кто может позволить себе заиметь три LCD-монитора для получения такого эффекта). Параллельно с этим отметим, что все наработки Matrox в плане TV-out вместились в новом продукте, и для вывода картинки на ТВ Parhelia просто незаменима (разумеется, для тех, кто способен выложить $400 за подобную карту).
  10. Надо особо отметить и превосходное качество обработки DVD Video, и работу DVDMax.
  11. Наличие у Parhelia поддержки GigaColor (32bit, но по новой схеме 10+10+10+2) пока мало кому понадобится, а в 3D вообще вряд ли будет нужно вообще.

Подводя общий итог, отметим, что новая карта от Matrox будет прекрасным решением по апгрейду для профессиональных дизайнеров, которым хочется еще и поиграть иногда, а также для эстетов, считающих, что лучше чем у Matrox качество 2D не может быть нигде и никогда. Правда и тем, и другим придется выложить очень большую сумму за такой апгрейд (порядка $400, цены примерные на середину июля). К сожалению, Matrox пока не предложила более дешевого варианта на базе Parhelia-512, поэтому мы никак не можем рекомендовать такую дорогую карту массовому пользователю. Хотя, время идет быстро, кто знает, может цены быстро и упадут. Во всяком случае, если бы Matrox Parhelia 128MB имела цену в $300, то, полагаю, что она составила бы серьезную конкуренцию GeForce4 Ti 4600, несмотря на отставание по скорости в 3D (ведь кто еще сможет предложить лучшее компромиссное решение между авторитетным и непреклонным качеством и возможностями в 2D и современные скорости и возможности в 3D).

И еще раз отметим, что нынешняя низкая производительность карты может еще сильно возрасти после выхода DirectX 9.0, поэтому мы не закрываем тему, а лишь ее несколько откладываем.




Дополнительно

iXBT BRAND 2016

«iXBT Brand 2016» — Выбор читателей в номинации «Процессоры (CPU)»:
Подробнее с условиями участия в розыгрыше можно ознакомиться здесь. Текущие результаты опроса доступны тут.

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.