MSI FX5900-VTD128 на базе NVIDIA GeForce FX 5900

и "Продолжаем вертеть 3DMark-ом 2003…"



СОДЕРЖАНИЕ

  1. Особенности видеокарты
  2. Конфигурации стендов, список тестовых инструментов, качество в 2D
  3. Результаты тестов: исследование производительности в 3DMark03 на драйверах 44.65
  4. Результаты тестов: исследование изменений в качестве графики в 3DMark03, Game4
  5. Результаты тестов: исследование изменений в качестве графики в 3DMark03, Game1
  6. Результаты тестов: исследование изменений в качестве графики в 3DMark03, Vertex Shader
  7. Результаты тестов: исследование изменений в качестве графики в 3DMark03, Pixel Shader
  8. Выводы


3DMark03 v.3.30, Pixel Shader 2.0



RADEON 9800 PRO GeForce FX 5900
Driver 6.343, 1600x1200 Driver 6.360, 1600x1200 Driver 44.03, 1600x1200 Driver 44.65, 1600x1200


RADEON 9800 PRO, 6,343 vs 6.360 GeForce FX 5900, 44.03 vs 44.65
Сравнение полноразмерных BMP через PhotoShop, 1600x1200


Сравнение с Reference picture
RADEON 9800 PRO GeForce FX 5900
Driver 6.343 Driver 6.360 Driver 44.03 Driver 44.65
1024x768 1024x768 1024x768 1024x768
Reference picture, 1024x768
Driver 6.343 vs reference Driver 6.360 vs reference Driver 44.03 vs reference Driver 44.65 vs reference


Очевидно, что картинки у GF на 44.03 и 44.65 разные. Это и показывает сравнение через BMP. Обратим внимание, что разницы между версиями драйверов у ATI нет, это видно. Почему? Ведь в CATALYST 3.5 ATI убрала "заточки". Как мне объяснили специалисты ATI, они были связаны с математическими особенностями способов вычислений, а не с подменами шейдеров так, что менялась конечная картинка. И потому визуальных отличий нет.

C помощью AntiDetect уберем в драйвере определение приложения и смотрим на картинку, которую GeForce FX 5900 выдает при "девственно чистом" драйвере.

GeForce FX 5900: Сравнение с картинками, полученными на драйвере с Antidetect! 1024x768
AntiDetect Reference Driver 44.03 Driver 44.65


Реалии иные, каждый акселератор имеет свои особенности. И видим, что опять 44.03 плюс патч 3.30 показывают отличия от картинки, полученной с помощью Anti-Detect.

Подведем итоги по 3DMark03. Тестирование показало, что компания NVIDIA предпочитает прятать промашки по скорости работы шейдеров за различные ухищрения, поднимающие скорость ее карт именно в "шейдерных" тестах. Самым популярным из таковых сегодня является 3DMark03.

Да, безусловно, ходы, позволяющие реализовать ту или иную математическую функцию меньшими затратами, должны приветствоваться. И если программисты FutureMark где-то "чешут левое ухо правой рукой", а NVIDIA предоставляет своим картам осуществлять этот процесс нормальным и оптимальным путем, это хорошо и должно приветствоваться. Однако, тут вступает в силу и другое правило: программа должна работать так, как ее задумывали авторы (только показали бы хотя бы — что должны получить). И подмена узловых команд в угоду той или иной видеокарте — это нечестно. Тогда мы уже меряем не карты, а хитрости и ловкости программистов.

Но в то же время надо и осознавать то, что в конечном итоге пользователь использует карту на драйверах производителя, и никто не станет ставить некие эталонные и лишенные "заточек" драйверы. Надо понимать, что нравится нам или не нравится, а конечная производительность, получаемая пользователем ускорителя, складывается из возможностей акселератора, отлаженности драйвера и тех самых "оптимизаций".

В ближайшее время мы выпустим еще один материал, посвященный "заточкам", где рассмотрим более подробно работу подобного драйвера, лишенного определений тех приложений, которые запускает пользователь. Об этом уже начал говорить в своей статье Алексей Николайчук, коснувшись проблемы с 3DMark2001. Мы затронем игровые тесты. А также продолжим исследовать 3DMark03. Но это позже.

Всех ярых противников оптимизаций и ратующих за массовые тестирования ТОЛЬКО на пропатченных AntiDetect-ом драйверах, я все же прошу вдуматься в проблему глубже и понять, что это бессмысленно.

  1. Драйвер действительно может осуществлять управление ускорителем по более совершенной схеме, нежели может предложить приложение. Вот пример, приведенный автором RightMark 3D Филиппом Герасимовым:

    Реализация функций Sin/Cos авторами 3DMark2001:

    ; c12 vecsin ( 1.0f, -1.0f / 6.0f, 1.0f / 120.0f, -1.0f / 5040.0f )
    ; c13 veccos ( 1.0f, -1.0f / 2.0f, 1.0f / 24.0f, -1.0f / 720.0f )
    ; c14 pis( PI, 1.0f / (2.0f * PI), 2.0f * PI, 0 )

    ; now r1.x = fAngle
    ; wrap theta to -pi..pi
    mul r1.x, r1.x, c14.y ; divide by 2*PI
    expp r2.y, r1.x ; get fractional part only
    mad r1.x, r2.y, c14.z, -c14.x ; multiply with 2*PI

    ; compute first 4 values in sin and cos series
    mov r2.x, c12.x ; theta^0 ;r2.x = 1
    mul r2.y, r1.x, r1.x ; theta^2
    mul r1.y, r1.x, r2.y ; theta^3
    mul r2.z, r2.y, r2.y ; theta^4
    mul r1.z, r1.x, r2.z ; theta^5
    mul r2.w, r2.y, r2.z ; theta^6
    mul r1.w, r1.x, r2.w ; theta^7

    ; sin
    mul r1, r1, c12
    dp4 r1.x, r1, c12.x

    ; cos
    mul r2, r2, c13
    dp4 r2.x, r2, c12.x

    Итого 14 инструкций



    А вот те же функции в реализации NVIDIA:

    ; scalar r0.x = cos(r1.x), r0.y = sin(r1.x)
    DEF c0, PI, 1.f/2.f, 2.f*PI, 1.f/(2.f*PI)
    DEF c1, 1.0f, -1.f/2.f, 1.f/24.f, -1.f/720.f
    DEF c2, 1.0f, -1.f/6.f, 1.f/120.f, -1.f/5040.f
    MAD r0.x, r1.x, c0.w, c0.y ; bring argument into –pi, .., +pi range
    EXPP r0.y, r0.x
    MAD r0.x, r0.y, c0.z, -c0.x
    DST r2.xy, r0.x, r0.x ; generate 1, (r0.x)^2, .. (r0.x)^6
    MUL r2.z, r2.y, r2.y
    MUL r2.w, r2.y, r2.z
    MUL r0, r2, r0.x ; generate r0.x, (r0.x)^3, .., (r0.x)^7
    DP4 r0.y, r0, c2 ; compute sin(r0.x)
    DP4 r0.x, r2, c1 ; compute cos(r0.x)

    Итого 9 инструкций

    Очевидно, что второй путь совершеннее.

  2. Будут выходить все новые и новые версии драйверов, где все эти заточки будут прятаться глубже и дальше. Сможет ли соревноваться один (пусть даже и гениальный) програмист с целой армией программистов NVIDIA или ATI? Пока будет хватать желания и энтузиазма, может быть и сможет. А если не хватит?

Я считаю, что надо призывать и NVIDIA, и ATI отказаться от политики грязных игр, от политики выкручивания рук тестерам своими "заточками" (а другими словами это и не назвать), больше усилий вкладывать в совершенствование самого "железа", а не в зализывание драйверами своих ошибок. Ведь тестеры попали в заложники политики обманов и лжекорон в 3D-графике и вынуждены рассматривать соотношение скоростей работы ускорителей КАК ЕСТЬ. Увы! Иного пока не дано. Просто читателям надо всегда иметь в виду, что если видеокарта "А" производительнее видеокарты "Б" на 20%, то какая-то часть этих процентов может принадлежать не заслугам самой карты, а программистов-драйверописателей.

Поэтому мы не можем молчать, видя, что ведущие производители графических процессоров ради прибыли идут на подлоги, не мытьем, так катаньем повышают рейтинги и скорости. Мы не можем согласиться с тем, что NVIDIA и ATI сделали из тестеров посмешище, а все обзоры (с участием 3DMark) превратили в водевиль. Мы настоятельно просим, чтобы политика заточек в драйверах под бенчмарки была ПРЕКРАЩЕНА, мы призываем, чтобы обе компании честно раскрывали полноценные спецификации своих продуктов, а не выдавали только то, что выгодно маркетинговым отделам.

Мы также хотим, что FutureMark меньше зависел от того, кто из магнатов входит в бета-тестирование и делал свои 3DMark-и более защищенными от вмешательств извне. И так очевидно, что репутация 3DMark03 капитально пострадала.

Выводы

Что касается предмета, собственно, нашего материала. Видеокарта от MSI представляет собой прекрасный продукт с точки зрения качества изготовления, комплекта поставки. И вообще, очевидно, что специалисты этой компании подходят к выпуску видеокарт, особенно High-End класса, с душой. Применены интересные решения по охлаждению, а также в дизайне самой карты.

Плюс не надо забывать, что FX 5900 — это один из самых производительных ускорителей на сегодня. Он смело соперничает с RADEON 9800 PRO, обладая либо равной, либо более низкой ценой. А что касается продукта от MSI, то ни один RADEON 9800 PRO не сможет соперничать с этой картой по комплекту поставки (мы знаем, что почти все видеокарты на базе флагмана от ATI отличаются схожей и довольной бедной комплектацией).

В итоге MSI FX5900-VTD128 может дать пользователю:

  1. Отличную скорость в 3D (особенно при АА и/ или анизотропии);
  2. Технологичное решение с поддержкой DX9 (игры эти хоть в будущем, но не за горами);
  3. поддержку VIVO;
  4. несомненно истинное удовольствие от покупки очень качественного изделия, снабженного такой Retail-поставкой (уж если отдавать $400-420, то не за пакетик с картой или коробку с картой и диском, а за внешне совершенный продукт).

В конце отмечу еще раз маленькую ложку дегтя — это потенциальные проблемы с установкой карты в ряд системных плат, где северный мост расположен близко к AGP-слоту. Маленький вентилятор с обратной стороны видеоплаты может не поместиться между AGP и кулером на северном мосту. Хотя эту деталь можно всегда снять с видеокарты без ущерба для последней.

[ Предыдущая часть (5) ]




Хочу выразить благодарность Алексею Барковому и Филиппу Герасимову за неоценимую помощь в получении reference-скриншотов




Дополнительно

Обзор MSI FX5900-VTD128 на базе NVIDIA GeForce FX 5900

MSI FX5900-VTD128 на базе NVIDIA GeForce FX 5900

и "Продолжаем вертеть 3DMark-ом 2003…"


СОДЕРЖАНИЕ

  1. Особенности видеокарты
  2. Конфигурации стендов, список тестовых инструментов, качество в 2D
  3. Результаты тестов: исследование производительности в 3DMark03 на драйверах 44.65
  4. Результаты тестов: исследование изменений в качестве графики в 3DMark03, Game4
  5. Результаты тестов: исследование изменений в качестве графики в 3DMark03, Game1
  6. Результаты тестов: исследование изменений в качестве графики в 3DMark03, Vertex Shader
  7. Результаты тестов: исследование изменений в качестве графики в 3DMark03, Pixel Shader
  8. Выводы


3DMark03 v.3.30, Pixel Shader 2.0



RADEON 9800 PRO GeForce FX 5900
Driver 6.343, 1600x1200 Driver 6.360, 1600x1200 Driver 44.03, 1600x1200 Driver 44.65, 1600x1200


RADEON 9800 PRO, 6,343 vs 6.360 GeForce FX 5900, 44.03 vs 44.65
Сравнение полноразмерных BMP через PhotoShop, 1600x1200


Сравнение с Reference picture
RADEON 9800 PRO GeForce FX 5900
Driver 6.343 Driver 6.360 Driver 44.03 Driver 44.65
1024x768 1024x768 1024x768 1024x768
Reference picture, 1024x768
Driver 6.343 vs reference Driver 6.360 vs reference Driver 44.03 vs reference Driver 44.65 vs reference


Очевидно, что картинки у GF на 44.03 и 44.65 разные. Это и показывает сравнение через BMP. Обратим внимание, что разницы между версиями драйверов у ATI нет, это видно. Почему? Ведь в CATALYST 3.5 ATI убрала "заточки". Как мне объяснили специалисты ATI, они были связаны с математическими особенностями способов вычислений, а не с подменами шейдеров так, что менялась конечная картинка. И потому визуальных отличий нет.

C помощью AntiDetect уберем в драйвере определение приложения и смотрим на картинку, которую GeForce FX 5900 выдает при "девственно чистом" драйвере.

GeForce FX 5900: Сравнение с картинками, полученными на драйвере с Antidetect! 1024x768
AntiDetect Reference Driver 44.03 Driver 44.65


Реалии иные, каждый акселератор имеет свои особенности. И видим, что опять 44.03 плюс патч 3.30 показывают отличия от картинки, полученной с помощью Anti-Detect.

Подведем итоги по 3DMark03. Тестирование показало, что компания NVIDIA предпочитает прятать промашки по скорости работы шейдеров за различные ухищрения, поднимающие скорость ее карт именно в "шейдерных" тестах. Самым популярным из таковых сегодня является 3DMark03.

Да, безусловно, ходы, позволяющие реализовать ту или иную математическую функцию меньшими затратами, должны приветствоваться. И если программисты FutureMark где-то "чешут левое ухо правой рукой", а NVIDIA предоставляет своим картам осуществлять этот процесс нормальным и оптимальным путем, это хорошо и должно приветствоваться. Однако, тут вступает в силу и другое правило: программа должна работать так, как ее задумывали авторы (только показали бы хотя бы — что должны получить). И подмена узловых команд в угоду той или иной видеокарте — это нечестно. Тогда мы уже меряем не карты, а хитрости и ловкости программистов.

Но в то же время надо и осознавать то, что в конечном итоге пользователь использует карту на драйверах производителя, и никто не станет ставить некие эталонные и лишенные "заточек" драйверы. Надо понимать, что нравится нам или не нравится, а конечная производительность, получаемая пользователем ускорителя, складывается из возможностей акселератора, отлаженности драйвера и тех самых "оптимизаций".

В ближайшее время мы выпустим еще один материал, посвященный "заточкам", где рассмотрим более подробно работу подобного драйвера, лишенного определений тех приложений, которые запускает пользователь. Об этом уже начал говорить в своей статье Алексей Николайчук, коснувшись проблемы с 3DMark2001. Мы затронем игровые тесты. А также продолжим исследовать 3DMark03. Но это позже.

Всех ярых противников оптимизаций и ратующих за массовые тестирования ТОЛЬКО на пропатченных AntiDetect-ом драйверах, я все же прошу вдуматься в проблему глубже и понять, что это бессмысленно.

  1. Драйвер действительно может осуществлять управление ускорителем по более совершенной схеме, нежели может предложить приложение. Вот пример, приведенный автором RightMark 3D Филиппом Герасимовым:

    Реализация функций Sin/Cos авторами 3DMark2001:

    ; c12 vecsin ( 1.0f, -1.0f / 6.0f, 1.0f / 120.0f, -1.0f / 5040.0f )
    ; c13 veccos ( 1.0f, -1.0f / 2.0f, 1.0f / 24.0f, -1.0f / 720.0f )
    ; c14 pis( PI, 1.0f / (2.0f * PI), 2.0f * PI, 0 )

    ; now r1.x = fAngle
    ; wrap theta to -pi..pi
    mul r1.x, r1.x, c14.y ; divide by 2*PI
    expp r2.y, r1.x ; get fractional part only
    mad r1.x, r2.y, c14.z, -c14.x ; multiply with 2*PI

    ; compute first 4 values in sin and cos series
    mov r2.x, c12.x ; theta^0 ;r2.x = 1
    mul r2.y, r1.x, r1.x ; theta^2
    mul r1.y, r1.x, r2.y ; theta^3
    mul r2.z, r2.y, r2.y ; theta^4
    mul r1.z, r1.x, r2.z ; theta^5
    mul r2.w, r2.y, r2.z ; theta^6
    mul r1.w, r1.x, r2.w ; theta^7

    ; sin
    mul r1, r1, c12
    dp4 r1.x, r1, c12.x

    ; cos
    mul r2, r2, c13
    dp4 r2.x, r2, c12.x

    Итого 14 инструкций



    А вот те же функции в реализации NVIDIA:

    ; scalar r0.x = cos(r1.x), r0.y = sin(r1.x)
    DEF c0, PI, 1.f/2.f, 2.f*PI, 1.f/(2.f*PI)
    DEF c1, 1.0f, -1.f/2.f, 1.f/24.f, -1.f/720.f
    DEF c2, 1.0f, -1.f/6.f, 1.f/120.f, -1.f/5040.f
    MAD r0.x, r1.x, c0.w, c0.y ; bring argument into –pi, .., +pi range
    EXPP r0.y, r0.x
    MAD r0.x, r0.y, c0.z, -c0.x
    DST r2.xy, r0.x, r0.x ; generate 1, (r0.x)^2, .. (r0.x)^6
    MUL r2.z, r2.y, r2.y
    MUL r2.w, r2.y, r2.z
    MUL r0, r2, r0.x ; generate r0.x, (r0.x)^3, .., (r0.x)^7
    DP4 r0.y, r0, c2 ; compute sin(r0.x)
    DP4 r0.x, r2, c1 ; compute cos(r0.x)

    Итого 9 инструкций

    Очевидно, что второй путь совершеннее.

  2. Будут выходить все новые и новые версии драйверов, где все эти заточки будут прятаться глубже и дальше. Сможет ли соревноваться один (пусть даже и гениальный) програмист с целой армией программистов NVIDIA или ATI? Пока будет хватать желания и энтузиазма, может быть и сможет. А если не хватит?

Я считаю, что надо призывать и NVIDIA, и ATI отказаться от политики грязных игр, от политики выкручивания рук тестерам своими "заточками" (а другими словами это и не назвать), больше усилий вкладывать в совершенствование самого "железа", а не в зализывание драйверами своих ошибок. Ведь тестеры попали в заложники политики обманов и лжекорон в 3D-графике и вынуждены рассматривать соотношение скоростей работы ускорителей КАК ЕСТЬ. Увы! Иного пока не дано. Просто читателям надо всегда иметь в виду, что если видеокарта "А" производительнее видеокарты "Б" на 20%, то какая-то часть этих процентов может принадлежать не заслугам самой карты, а программистов-драйверописателей.

Поэтому мы не можем молчать, видя, что ведущие производители графических процессоров ради прибыли идут на подлоги, не мытьем, так катаньем повышают рейтинги и скорости. Мы не можем согласиться с тем, что NVIDIA и ATI сделали из тестеров посмешище, а все обзоры (с участием 3DMark) превратили в водевиль. Мы настоятельно просим, чтобы политика заточек в драйверах под бенчмарки была ПРЕКРАЩЕНА, мы призываем, чтобы обе компании честно раскрывали полноценные спецификации своих продуктов, а не выдавали только то, что выгодно маркетинговым отделам.

Мы также хотим, что FutureMark меньше зависел от того, кто из магнатов входит в бета-тестирование и делал свои 3DMark-и более защищенными от вмешательств извне. И так очевидно, что репутация 3DMark03 капитально пострадала.

Выводы

Что касается предмета, собственно, нашего материала. Видеокарта от MSI представляет собой прекрасный продукт с точки зрения качества изготовления, комплекта поставки. И вообще, очевидно, что специалисты этой компании подходят к выпуску видеокарт, особенно High-End класса, с душой. Применены интересные решения по охлаждению, а также в дизайне самой карты.

Плюс не надо забывать, что FX 5900 — это один из самых производительных ускорителей на сегодня. Он смело соперничает с RADEON 9800 PRO, обладая либо равной, либо более низкой ценой. А что касается продукта от MSI, то ни один RADEON 9800 PRO не сможет соперничать с этой картой по комплекту поставки (мы знаем, что почти все видеокарты на базе флагмана от ATI отличаются схожей и довольной бедной комплектацией).

В итоге MSI FX5900-VTD128 может дать пользователю:

  1. Отличную скорость в 3D (особенно при АА и/ или анизотропии);
  2. Технологичное решение с поддержкой DX9 (игры эти хоть в будущем, но не за горами);
  3. поддержку VIVO;
  4. несомненно истинное удовольствие от покупки очень качественного изделия, снабженного такой Retail-поставкой (уж если отдавать $400-420, то не за пакетик с картой или коробку с картой и диском, а за внешне совершенный продукт).

В конце отмечу еще раз маленькую ложку дегтя — это потенциальные проблемы с установкой карты в ряд системных плат, где северный мост расположен близко к AGP-слоту. Маленький вентилятор с обратной стороны видеоплаты может не поместиться между AGP и кулером на северном мосту. Хотя эту деталь можно всегда снять с видеокарты без ущерба для последней.

[ Предыдущая часть (5) ]




Хочу выразить благодарность Алексею Барковому и Филиппу Герасимову за неоценимую помощь в получении reference-скриншотов