MSI FX5900-VTD128 на базе NVIDIA GeForce FX 5900

и "Продолжаем вертеть 3DMark-ом 2003…"



СОДЕРЖАНИЕ

  1. Особенности видеокарты
  2. Конфигурации стендов, список тестовых инструментов, качество в 2D
  3. Результаты тестов: исследование производительности в 3DMark03 на драйверах 44.65
  4. Результаты тестов: исследование изменений в качестве графики в 3DMark03, Game4
  5. Результаты тестов: исследование изменений в качестве графики в 3DMark03, Game1
  6. Результаты тестов: исследование изменений в качестве графики в 3DMark03, Vertex Shader
  7. Результаты тестов: исследование изменений в качестве графики в 3DMark03, Pixel Shader
  8. Выводы


Вот и подошла пора рассмотрения новых видеокарт на продукте High-End от NVIDIA - GeForce FX 5900. Правда, в первую очередь на прилавках магазинов появились не самые мощные ускорители на базе FX 5900 Ultra, а чуть более медленные.

Напомним, что новое семейство под кодовым названием NV35 включает в себя три карты: 5900 Ultra, 5900 и 5900 Value. Что собой будет представлять последний продукт — мы пока не знаем. А 5900 от 5900 Ultra отличается объемом памяти и частотами: 128 мегабайт против 256 у "ультры" и 400/425 (850) МГц против 450/425 (850) МГц также у "ультры".

В остальном все три карты линейки полностью идентичны, а 5900 Ultra мы уже ранее рассмотрели самым подробнейшим образом; и читатель может ознакомиться с этим и другими материалами по семейству NV3x ниже.

Теоретико-аналитические материалы и обзоры видеокарт, в которых рассматриваются функциональные особенности GPU NVIDIA GeForce FX

Конечно, мы, как тестовая лаборатория, можем ограничиться исследованием карты и вынести свой вердикт, просто исходя из возможностей продукта, однако прекрасно знаем, что ныне оба ведущих чипмейкера ATI и NVIDIA потеряли совесть, и стоимость High-End-продуктов довели уже до уровня $450-550, хотя не так давно это было как минимум на 100 дешевле. Да, мы понимаем, что дорогая память, что дорогие PCB, дорого стоит разработать чип, прошедший сквозь огонь, воду и медные трубы улучшений, кастраций, оптимизаций и прочего. Но все же… Неужели уникальные новые акселераторы столь хороши, что за кусок текстолита, политого потом и слезами трудящихся США, Канады и Китая надо отдавать такие финансы?

Это вопрос очень сложный и болезненный, да и ответ на него неоднозначный. Частично мы попытаемся дать ответ в этом материале.

Но главной темой статьи станет расследование плодов "сотрудничества" NVIDIA и FutureMark в свете уже известных событий с подписанием "мирного" соглашения, согласно которому все действия программистов NVIDIA по увеличению скорости работы GeForce FX в 3DMark03 признаны оптимизациями, а не "заточками" (cheats). Мы рассмотрим работу FX 5900 на последней бета-версии драйверов 44.65, заодно и сравнив ее скорость со скоростью FX 5900 Ultra и RADEON 9800 PRO.

Внимание! Буквально следом за обзором этой карты выходит материал по аналогичному продукту, но от ASUSTeK, где будут рассмотрены сравнения производительностей FX 5900, 5900 Ultra, RADEON 9800 PRO в игровых тестах.

Итак, начнем с самой карты, которая явно говорит о себе, что она принадлежит к High-End ряду:

Это, так сказать, для "затравки", забегая вперед (но к красоте сверкающего радиатора невозможно остаться равнодушным, даже пришлось встать на рассвете и побаловать полусолнышко на карте первыми лучами настоящего солнца :-) ).

Компания MSI (Micro-Star International) очень хорошо известна российскому потребителю. На рынке представлена огромная гамма продуктов этой тайваньской фирмы: от системных плат до оптических накопителей. Это давний и верный союзник NVIDIA, поэтому практически нет процессора от калифорнийской фирмы, на базе которого MSI не выпустила бы видеокарту.

Вот и на фронте High-End компания идет впереди многих других партнеров NVIDIA, уже начав массовые поставки FX 5900. Эти карты можно найти и в Москве, причем по цене, подчас равной стоимости предыдущего решения FX 5800 (не-Ultra).

Ну что ж, рассмотрим видеокарту поближе.

Плата


MSI FX5900-VTD128


Карта имеет интерфейс AGP x8/x4/x2, 128 МБ памяти DDR SDRAM , размещенной в 8-ми микросхемах на лицевой стороне PCB.

MSI FX5900-VTD128

Микросхемы памяти производства Hynix. Время выборки у микросхем памяти 2,2 ns, что соответствует частоте работы примерно 454 (908) МГц, память же работает на частоте 425 (850) МГц. Частота работы GPU — 400 MHz. Интерфейс обмена с памятью — 256 бит.



Сравнение с эталонным дизайном, вид спереди
MSI FX5900-VTD128 Reference card NVIDIA GeForce FX 5900 Ultra


Сравнение с эталонным дизайном, вид сзади
MSI FX5900-VTD128 Reference card NVIDIA GeForce FX 5900 Ultra


Мы видим несколько особенностей:

  1. Дизайн карты от MSI немного отличается от эталонного у 5900 Ultra, вся правая часть, отвечающая за питание карты, переработана. Есть сведения, что вышел новый эталонный дизайн от NVIDIA с укороченной PCB и заменой элементов. Вероятно, на нем и базируется карта от MSI. В целом длина карты стала равна длине GF4 Ti 4600 (NV25):



  2. Уменьшение объема памяти с 256 до 128 мегабайт получилось путем недокомплектации микросхемами памяти (на оборотной стороне можно увидеть пустые места под BGA-микросхемы. Однако 256-битная шина не обрезалась, ведь на карте установлено 8 32-битных микросхем памяти (то есть всего 256бит). Просто уже невозможен так называемый двубанковый режим работы памяти.



  3. В целом PCB очень сложна, это прекрасно видно из фотографий.

Рассмотрим систему охлаждения.

MSI FX5900-VTD128

Система охлаждения состоит из двух кулеров: большого и малого. Большой кулер призван охлаждать GPU и микросхемы памяти (на лицевой стороне), а малый — охлаждать обратную сторону PCB в месте крепежа процессора.

Ну насчет большого кулера — все ясно из дифирамбов в начале статьи :-), а также очевидно, что эта медная штуковина очень тщательно подогнана под конфигурацию карты. Крепится аж на 6-ти клипсах!

А вот малый кулер — скорее дань моде, красоте, чем насущной необходимости. Ну что может охлаждать кулер, прижимающийся к задней стороне через упругий термоэлемент, когда между ним и самим текстолитом еще есть куча элементов логики? Да ничего практически. Однако, если посмотреть на самую последнюю фотографию в этой таблице, это "украшение" может доставить хлопоты с установкой видеокарты в системные платы, где северный мост установлен под углом 45 градусов и весьма близко к AGP-слоту. В частности, почти все материнки на i875P имеют такую конфигурацию. И приходится отгибать ребра радиатора охлаждения северного моста, чтобы малый кулер видеокарты смог "пролезть". А если на северном мосту установлен кулер с вентилятором, да еще со всякими декоративными решетками? Думаю, что вам ясно.

Разумеется, никто не мешает снять этот малый кулер, так что этот вопрос не имеет критического значения для совместимости карты.



Под большим радиатором, разумеется, можно найти и сам графический процессор:

Как мы видим, маркировка уже серийная, чип был произведен на 19-й неделе 2003 года (это примерно начало мая). Упаковка FlipChip, сверху кристалл закрыт защитной крышкой. Мы не так давно снимали крышку у NV30 (FX 5800), поэтому можем показать, как оно выглядит внутри:

Карта оснащена кодеком Philips 7114, отвечающим за VIVO:

Рассмотрим комплект поставки:

MSI FX5900-VTD128

Комплект поставки просто шикарный! В коробке можно найти 11 (!) дисков с разным ПО (на снимке справа они все представлены), где есть и игры, и просто интересный софт. Не считая, конечно, обязательных дисков с драйверами, утилитами и ПО для реализации Video-In. Ну и, конечно же, переходник S-Video-to-RCA, переходник DVI-to-d-Sub, разветвитель VIVO, руководство пользователя, фирменный БЛОКНОТ и фирменная наклейка на системный блок.



Видеокарта поставляется в retail-упаковке.

MSI FX5900-VTD128

Упаковка, как уже заведено у MSI для продуктов High-End, великолепна! Мало того, что это огромный бокс с яркой обложкой, где есть вся необходимая информация, он имеет ручку для переноски. Лицевая сторона бокса может откидываться, после чего через прозрачное окно можно видеть саму карту.



Мы уже ранее в обзоре карты на базе GeForce FX 5600 рассматривали комплект ПО, поставляемый MSI, поэтому сегодня подробно останавливаться на нем не будем.

Установка и драйверы

Конфигурации тестовых стендов:

  • Компьютер на базе Pentium 4 3200 MHz:
    • процессор Intel Pentium 4 3200 МГц;
    • системная плата DFI LANParty Pro875 (i875P);
    • оперативная память 1024 MB DDR SDRAM;
    • жесткий диск Seagate Barracuda IV 40GB;
    • операционная система Windows XP SP1; DirectX 9.0a;
    • мониторы ViewSonic P810 (21") и ViewSonic P817 (21").
    • драйверы NVIDIA версии 44.65/44.03.

VSync отключен, технология S3TC ОТКЛЮЧЕНА в приложениях.

Для сравнительного анализа приведены результаты видеокарт:

  • Reference card NVIDIA GeForce FX 5900 Ultra (450/425 (850) МГц, 256 МБ);
  • Sapphire Atlantis RADEON 9800 PRO (380/350 (700) МГц, 256 МБ, driver 6.343/6.360);
  • Hercules 3D Prophet 9800 PRO (RADEON 9800 PRO, 380/340 (680) МГц, 128 МБ, driver 6.343/6.360).

Результаты тестов

Перед тем, как кратко дать оценку качеству в 2D, я еще раз дам пояснение, что на настоящий момент НЕТ полноценной методики объективной оценки этого параметра по следующим причинам:

  1. Практически у всех современных 3D-акселераторов качество 2D может сильно зависеть от конкретного экземпляра, а отследить все карты невозможно физически;
  2. Качество 2D зависит не только от видеокарты, но и от монитора, соединительного кабеля;
  3. В последнее время огромное влияние на этот параметр стали оказывать связки: монитор-карта, то есть, встречаются мониторы, "не дружащие" с теми или иными видеокартами.

Что касается протестированного экземпляра, то совместно с ViewSonic P817 и кабелем BNC Bargo плата продемонстрировала отменное качество в следующих разрешениях и частотах:

MSI FX5900-VTD128 1600x1200x85Hz, 1280x1024x120Hz, 1024x768x160Hz (с качеством все в порядке!)


Результаты тестов: производительность в 3DMark03

Условные обозначения: ANISO 8xP — Anisotropic 8x Performance (ранее этот режим назывался Balanced), ANISO 8xQ — Anisotropic 8x Quality, ANISO 16xQ — Anisotropic 16x Quality.

Буквально на днях вышел материал Алексея Николайчука, посвященный "заточкам" в 3DMark. В нем подробно было рассмотрено то, что делают программисты NVIDIA и ATI с 3DMark2001, в частности, подменяют шейдеры и др. В той статье вся проблема расписана очень подробно. Если кратко, то ныне все тестеры по сути меряют не производительность видеокарт в 3DMark, а степень ловкости и ума программистов ATI и NVIDIA, а заодно и FutureMark. Последняя фирма вообще оказалась в роли (извиняюсь за грубое слово) проститутки. Ну раз так легко подменить шейдеры, а авторы хранят молчание, то о чем можно подумать? Речь о 3DMark2001. Странно, что почему-то только в отношении 3DMark03 они вдруг начали возмущаться, что, мол, кругом, "заточки". Одновременно выяснилось, что NVIDIA вышла из бета-тестеров, не желая платить приличную сумму в год. Программистов NVIDIA разоблачили всем миром, FutureMark выпустила патч к пакету, где, якобы, все ухищрения NVIDIA дезавуированы. Заодно немного и ATI досталось. Напоминает историю из "Тома Сойера" Марка Твена, когда тетушка во всех грехах подозревала только Тома, а его брата лишь слегка изредка ругала. При этом NVIDIA лишь становилась ожесточеннее и непримиримее к 3DMark03.

И вдруг… "Тетушка" и пакостник "Том" договорились, помирились, и более того, "Том" дал взятку "Тетушке" (стал бета-тестером будущего 3DMark), после чего последняя простила все грехи и назвала хулиганства "Тома" шалостями и шутками (ну вот такой ребенок игривый и бодрый). Разумеется, не надо быть пророком, чтобы догадаться, что "Том" будет продолжать свои "шалости".

Итак, NVIDIA и FutureMark подписали мировую, посчитав, что все ранее найденные "заточки" — оптимизации. Вышла следующая (пусть и неофициальная) версия драйверов 44.65. Очень интересно посмотреть — сумели ли программисты NVIDIA обойти все преграды, выставленные в последнем патче 3.30. Давайте вначале посмотрим на скорость.

3DMark03, Game1





Ага… По статье, где мы рассматривали ситуацию с патчем 3.30, было видно, что после "дезавуирования" шалостей программистов NVIDIA скорость упала на 20-24%. Что мы видим на драйверах 44.65? Рост! Примерно на такой же процент. Берем на заметку.

3DMark03, Game2





Также есть небольшой рост по скорости на 44.65 относительно 44.03.

3DMark03, Game3





Аналогично.

3DMark03, Game4





Ого! Скорость на 44.65 выросла капитально. Причем прирост более весомый, чем ранее падение после перехода с версии пакета 3.20 на 3.30. Мы помним прекрасно о том, что в этом тесте было снижение качества при формировании водной поверхности (точность вычислений занижена). Также берем на заметку.

3DMark03, 3D MARKS





Итого, общая производительность на патче 3.30 совместно с драйверами 44.65, выросла.

3DMark03, Vertex Shader 1.1





Как мы видим, и этот тест оптимизации не обошли стороной.

3DMark03, Pixel Shader 2.0





Гм… Когда-то мы уже видели сие. Причем в той же пропорции. Переход от 42.* версии к 43.51 ознаменовывался в том числе и резким скачком скорости в тесте пиксельных шейдеров. Поскольку никакие другие тесты с нагрузкой на ПШ подобной картины не повторяли, то "заточка" была налицо. Думаю, что сейчас мы видим то же самое.

Что касается сравнений скоростей с соперниками, то здесь у FX 5900/5900Ultra все в порядке. Ну только лишь отставание в тестах шейдеров, но ведь на всякий медленно работаюший шейдер найдется смекалка программиста! Не зря же их столько у NVIDIA! ;-)

Мы видим, что драйверы 44.65 сделали чудо, и FX 5900 (не Ultra!) превосходно смотрится по сравнению с конкурентом в виде RADEON 9800 PRO 128MB, который, к тому же, еще и дороже. НО! Не ценой ли опять ухудшения качества? К тому же, как уже было сказано в статье А.Николайчука, любая "заточка" под бенчмарк приводит к тому, что он работает не так, как задумывался авторами. А значит, мы меряем не истинную скорость карты, а степень хитроумности программистов — драйверописателей.

А где истина? Там, где патч 3.30 плюс драйвер 44.03? Или и там "месть" со стороны FutureMark? Или все же пусть будут оптимизации, чтобы только бы качество не падало? Где правда? Ответ на этот вопрос очень сложен. Мы лишь частично ответим на него в этом материале, а более полно — в следующем, где будем рассматривать работу драйвера, лишенного любых "заточек".

А сейчас посмотрим на качество.

ВНИМАНИЕ! По МНОГОЧИСЛЕННЫМ просьбам аудитории форума iXBT полноразмерные скриншоты представлены в формате BMP! КАЖДЫЙ СКРИНШОТ ИМЕЕТ РАЗМЕР 5.5 МБайт и запакован в RAR-архив, размеры которых колеблются от 1.7 до 3.2 МБайт!

Результаты тестов: качество в 3DMark03 v.3.30, Game4



Пример 1
RADEON 9800 PRO GeForce FX 5900
Driver 6.343, 1600x1200 Driver 6.360, 1600x1200 Driver 44.03, 1600x1200 Driver 44.65, 1600x1200
RADEON 9800 PRO, 6,343 vs 6.360 GeForce FX 5900, 44.03 vs 44.65
Animated GIFs
Сравнение полноразмерных BMP через PhotoShop, 1600x1200


Пример 2
RADEON 9800 PRO GeForce FX 5900
Driver 6.343, 1600x1200 Driver 6.360, 1600x1200 Driver 44.03, 1600x1200 Driver 44.65, 1600x1200


RADEON 9800 PRO, 6,343 vs 6.360 GeForce FX 5900, 44.03 vs 44.65
Animated GIFs
Сравнение полноразмерных BMP через PhotoShop, 1600x1200


Сравнение с Reference picture
RADEON 9800 PRO GeForce FX 5900
Driver 6.343 Driver 6.360 Driver 44.03 Driver 44.65
1024x768 1024x768 1024x768 1024x768
Reference picture, 1024x768
Driver 6.343 vs reference Driver 6.360 vs reference Driver 44.03 vs reference Driver 44.65 vs reference

Мы ранее уже узнали, что в Game4 версии 3.20 3DMark03 при отрисовке водной поверхности FX5xxx-семейство использовало пониженную точность вычислений, вследствие чего картинка несколько искажалась (мы уже показывали это в ранее упомянутой статье). Патч 3.30, как мы видим, восстановил качество. И вроде бы на драйверах 44.65 мы не видим падения качества, точность не понижалась. Однако, очевидно, что шейдеры снова подменялись. Это заметно как на анимированных GIF, так и через сравнение BMP. Хоть где-то, а подмена есть. НО! В какую сторону? Вопрос сложный. Мы привели сравнение с reference-картинками, понимая, что у каждого акселератора есть свои подходы к формированию сцен, но все же интересно посмотреть, а каковы отличия. Видим, что картинка, полученная на 44.03, отстоит дальше от эталона, чем та, что могли получить на 44.65. Получается все наоборот? Версия 44.65 приблизила FX5900 к эталону? Да, сравнение показывает, что так и есть. Но показывает ли это сравнение наличие заточек и справедливо ли заявление FutureMark о том, что патч 3.30 и драйвер 44.03 вывели ситуацию в правильное русло? — Никто не знает пока.

К сожалению, 1500-й кадр через reference растеризатор нам получить не удалось (слишком долго шел расчет, да и заканчивался ошибками).

Давайте с помощью AntiDetect уберем в драйвере определение приложения и посмотрим на картинку, которую GeForce FX 5900 выдает при "девственно чистом" драйвере.

GeForce FX 5900: Сравнение с картинками, полученными на драйвере с Antidetect! 1024x768
AntiDetect Reference Driver 44.03 Driver 44.65

Да, отличия от reference есть, и они весьма сильные, поэтому за эталон держать картинку, полученную через программный растеризатор, нельзя. Но! Почему же на версии 44.03 и патче 3.30 картина также отличается от той, что мы имеем с AntiDetect? Не убраны все "заточки"? Или искусственно под детект драйвера вставлены новые со стороны FutureMark для занижения скорости? Факт в том, что авторы пакета откровенно лгут, говоря о восстановлении справедливости в патче 3.30.

Результаты тестов: качество в 3DMark03 v.3.30, Game1



Пример 1
RADEON 9800 PRO GeForce FX 5900
Driver 6.343/6.360, 1600x1200 Driver 44.03, 1600x1200 Driver 44.65, 1600x1200


RADEON 9800 PRO, 6,343 vs 6.360 GeForce FX 5900, 44.03 vs 44.65
Animated GIFs
-
Сравнение полноразмерных BMP через PhotoShop, 1600x1200


Сравнение с Reference picture
RADEON 9800 PRO GeForce FX 5900
Driver 6.343 Driver 6.360 Driver 44.03 Driver 44.65
1024x768 1024x768 1024x768 1024x768
Reference picture, 1024x768
Driver 6.343 vs reference Driver 6.360 vs reference Driver 44.03 vs reference Driver 44.65 vs reference


Пример 2
RADEON 9800 PRO GeForce FX 5900
Driver 6.343/6.360, 1600x1200 Driver 44.03, 1600x1200 Driver 44.65, 1600x1200


RADEON 9800 PRO, 6,343 vs 6.360 GeForce FX 5900, 44.03 vs 44.65
Animated GIFs
-
Сравнение полноразмерных BMP через PhotoShop, 1600x1200


Сравнение с Reference picture
RADEON 9800 PRO GeForce FX 5900
Driver 6.343 Driver 6.360 Driver 44.03 Driver 44.65
1024x768 1024x768 1024x768 1024x768
Reference picture, 1024x768
Driver 6.343 vs reference Driver 6.360 vs reference Driver 44.03 vs reference Driver 44.65 vs reference


Итак, мы снова видим, что в драйверах NVIDIA содержатся хитрости. На сей раз это связано уже не с шейдерами, а с включением принудительной компрессии полупрозрачных текстур, с помощью которых образуются клубы дыма. Вот и объяснение тех приростов скоростей, что мы видели выше. У обеих компаний картинки отличаются от reference и друг от друга, что логично. Снова правды не найти?

Вот в чем вопрос! Тут некоторые посетители форумов рьяно ратуют за использование "девственных" драйверов везде и вся. Найдете ли вы правду? Вряд ли. Но будете утешать себя, что "провели NVIDIA и ATI", но совсем забыли, что не провели не менее хитроумных программистов FM.

Давайте снова с помощью AntiDetect уберем в драйвере определение приложения и еще раз посмотрим на картинку, которую GeForce FX 5900 выдает при "девственно чистом" драйвере.

GeForce FX 5900: Сравнение с картинками, полученными на драйвере с Antidetect! 1024x768
AntiDetect Reference Driver 44.03 Driver 44.65


И снова мы видим отличия от reference, и опять задаем вопрос: почему же на версии 44.03 и патче 3.30 картина также отличается от той, что мы имеем с AntiDetect? Где обещанное восстановление истинного выполнения теста, как нам вещали авторы 3DMark03?

3DMark03 v.3.30, Vertex Shader 1.1



RADEON 9800 PRO GeForce FX 5900
Driver 6.343, 1600x1200 Driver 6.360, 1600x1200 Driver 44.03, 1600x1200 Driver 44.65, 1600x1200


RADEON 9800 PRO, 6,343 vs 6.360 GeForce FX 5900, 44.03 vs 44.65
Сравнение полноразмерных BMP через PhotoShop, 1600x1200


Сравнение с Reference picture
RADEON 9800 PRO GeForce FX 5900
Driver 6.343 Driver 6.360 Driver 44.03 Driver 44.65
1024x768 1024x768 1024x768 1024x768
Reference picture, 1024x768
Driver 6.343 vs reference Driver 6.360 vs reference Driver 44.03 vs reference Driver 44.65 vs reference


Вспомним о приростах по скорости у FX 5900 на версии 44.65, и мы прекрасно видим, что подмена шейдеров очевидна.

C помощью AntiDetect уберем в драйвере определение приложения и смотрим на картинку, которую GeForce FX 5900 выдает при "девственно чистом" драйвере.

GeForce FX 5900: Сравнение с картинками, полученными на драйвере с Antidetect! 1024x768
AntiDetect Reference Driver 44.03 Driver 44.65


Вопрос тот же: почему же на версии 44.03 и патче 3.30 картина также отличается от той, что мы имеет с AntiDetect?

3DMark03 v.3.30, Pixel Shader 2.0



RADEON 9800 PRO GeForce FX 5900
Driver 6.343, 1600x1200 Driver 6.360, 1600x1200 Driver 44.03, 1600x1200 Driver 44.65, 1600x1200


RADEON 9800 PRO, 6,343 vs 6.360 GeForce FX 5900, 44.03 vs 44.65
Сравнение полноразмерных BMP через PhotoShop, 1600x1200


Сравнение с Reference picture
RADEON 9800 PRO GeForce FX 5900
Driver 6.343 Driver 6.360 Driver 44.03 Driver 44.65
1024x768 1024x768 1024x768 1024x768
Reference picture, 1024x768
Driver 6.343 vs reference Driver 6.360 vs reference Driver 44.03 vs reference Driver 44.65 vs reference


Очевидно, что картинки у GF на 44.03 и 44.65 разные. Это и показывает сравнение через BMP. Обратим внимание, что разницы между версиями драйверов у ATI нет, это видно. Почему? Ведь в CATALYST 3.5 ATI убрала "заточки". Как мне объяснили специалисты ATI, они были связаны с математическими особенностями способов вычислений, а не с подменами шейдеров так, что менялась конечная картинка. И потому визуальных отличий нет.

C помощью AntiDetect уберем в драйвере определение приложения и смотрим на картинку, которую GeForce FX 5900 выдает при "девственно чистом" драйвере.

GeForce FX 5900: Сравнение с картинками, полученными на драйвере с Antidetect! 1024x768
AntiDetect Reference Driver 44.03 Driver 44.65


Реалии иные, каждый акселератор имеет свои особенности. И видим, что опять 44.03 плюс патч 3.30 показывают отличия от картинки, полученной с помощью Anti-Detect.

Подведем итоги по 3DMark03. Тестирование показало, что компания NVIDIA предпочитает прятать промашки по скорости работы шейдеров за различные ухищрения, поднимающие скорость ее карт именно в "шейдерных" тестах. Самым популярным из таковых сегодня является 3DMark03.

Да, безусловно, ходы, позволяющие реализовать ту или иную математическую функцию меньшими затратами, должны приветствоваться. И если программисты FutureMark где-то "чешут левое ухо правой рукой", а NVIDIA предоставляет своим картам осуществлять этот процесс нормальным и оптимальным путем, это хорошо и должно приветствоваться. Однако, тут вступает в силу и другое правило: программа должна работать так, как ее задумывали авторы (только показали бы хотя бы — что должны получить). И подмена узловых команд в угоду той или иной видеокарте — это нечестно. Тогда мы уже меряем не карты, а хитрости и ловкости программистов.

Но в то же время надо и осознавать то, что в конечном итоге пользователь использует карту на драйверах производителя, и никто не станет ставить некие эталонные и лишенные "заточек" драйверы. Надо понимать, что нравится нам или не нравится, а конечная производительность, получаемая пользователем ускорителя, складывается из возможностей акселератора, отлаженности драйвера и тех самых "оптимизаций".

В ближайшее время мы выпустим еще один материал, посвященный "заточкам", где рассмотрим более подробно работу подобного драйвера, лишенного определений тех приложений, которые запускает пользователь. Об этом уже начал говорить в своей статье Алексей Николайчук, коснувшись проблемы с 3DMark2001. Мы затронем игровые тесты. А также продолжим исследовать 3DMark03. Но это позже.

Всех ярых противников оптимизаций и ратующих за массовые тестирования ТОЛЬКО на пропатченных AntiDetect-ом драйверах, я все же прошу вдуматься в проблему глубже и понять, что это бессмысленно.

  1. Драйвер действительно может осуществлять управление ускорителем по более совершенной схеме, нежели может предложить приложение. Вот пример, приведенный автором RightMark 3D Филиппом Герасимовым:

    Реализация функций Sin/Cos авторами 3DMark2001:

    ; c12 vecsin ( 1.0f, -1.0f / 6.0f, 1.0f / 120.0f, -1.0f / 5040.0f )
    ; c13 veccos ( 1.0f, -1.0f / 2.0f, 1.0f / 24.0f, -1.0f / 720.0f )
    ; c14 pis( PI, 1.0f / (2.0f * PI), 2.0f * PI, 0 )

    ; now r1.x = fAngle
    ; wrap theta to -pi..pi
    mul r1.x, r1.x, c14.y ; divide by 2*PI
    expp r2.y, r1.x ; get fractional part only
    mad r1.x, r2.y, c14.z, -c14.x ; multiply with 2*PI

    ; compute first 4 values in sin and cos series
    mov r2.x, c12.x ; theta^0 ;r2.x = 1
    mul r2.y, r1.x, r1.x ; theta^2
    mul r1.y, r1.x, r2.y ; theta^3
    mul r2.z, r2.y, r2.y ; theta^4
    mul r1.z, r1.x, r2.z ; theta^5
    mul r2.w, r2.y, r2.z ; theta^6
    mul r1.w, r1.x, r2.w ; theta^7

    ; sin
    mul r1, r1, c12
    dp4 r1.x, r1, c12.x

    ; cos
    mul r2, r2, c13
    dp4 r2.x, r2, c12.x

    Итого 14 инструкций



    А вот те же функции в реализации NVIDIA:

    ; scalar r0.x = cos(r1.x), r0.y = sin(r1.x)
    DEF c0, PI, 1.f/2.f, 2.f*PI, 1.f/(2.f*PI)
    DEF c1, 1.0f, -1.f/2.f, 1.f/24.f, -1.f/720.f
    DEF c2, 1.0f, -1.f/6.f, 1.f/120.f, -1.f/5040.f
    MAD r0.x, r1.x, c0.w, c0.y ; bring argument into –pi, .., +pi range
    EXPP r0.y, r0.x
    MAD r0.x, r0.y, c0.z, -c0.x
    DST r2.xy, r0.x, r0.x ; generate 1, (r0.x)^2, .. (r0.x)^6
    MUL r2.z, r2.y, r2.y
    MUL r2.w, r2.y, r2.z
    MUL r0, r2, r0.x ; generate r0.x, (r0.x)^3, .., (r0.x)^7
    DP4 r0.y, r0, c2 ; compute sin(r0.x)
    DP4 r0.x, r2, c1 ; compute cos(r0.x)

    Итого 9 инструкций

    Очевидно, что второй путь совершеннее.

  2. Будут выходить все новые и новые версии драйверов, где все эти заточки будут прятаться глубже и дальше. Сможет ли соревноваться один (пусть даже и гениальный) програмист с целой армией программистов NVIDIA или ATI? Пока будет хватать желания и энтузиазма, может быть и сможет. А если не хватит?

Я считаю, что надо призывать и NVIDIA, и ATI отказаться от политики грязных игр, от политики выкручивания рук тестерам своими "заточками" (а другими словами это и не назвать), больше усилий вкладывать в совершенствование самого "железа", а не в зализывание драйверами своих ошибок. Ведь тестеры попали в заложники политики обманов и лжекорон в 3D-графике и вынуждены рассматривать соотношение скоростей работы ускорителей КАК ЕСТЬ. Увы! Иного пока не дано. Просто читателям надо всегда иметь в виду, что если видеокарта "А" производительнее видеокарты "Б" на 20%, то какая-то часть этих процентов может принадлежать не заслугам самой карты, а программистов-драйверописателей.

Поэтому мы не можем молчать, видя, что ведущие производители графических процессоров ради прибыли идут на подлоги, не мытьем, так катаньем повышают рейтинги и скорости. Мы не можем согласиться с тем, что NVIDIA и ATI сделали из тестеров посмешище, а все обзоры (с участием 3DMark) превратили в водевиль. Мы настоятельно просим, чтобы политика заточек в драйверах под бенчмарки была ПРЕКРАЩЕНА, мы призываем, чтобы обе компании честно раскрывали полноценные спецификации своих продуктов, а не выдавали только то, что выгодно маркетинговым отделам.

Мы также хотим, что FutureMark меньше зависел от того, кто из магнатов входит в бета-тестирование и делал свои 3DMark-и более защищенными от вмешательств извне. И так очевидно, что репутация 3DMark03 капитально пострадала.

Выводы

Что касается предмета, собственно, нашего материала. Видеокарта от MSI представляет собой прекрасный продукт с точки зрения качества изготовления, комплекта поставки. И вообще, очевидно, что специалисты этой компании подходят к выпуску видеокарт, особенно класса High-End, с душой. Применены интересные решения по охлаждению, а также в дизайне самой карты.

Плюс не надо забывать, что FX 5900 — это один из самых производительных ускорителей на сегодня. Он смело соперничает с RADEON 9800 PRO, обладая либо равной, либо более низкой ценой. А что касается продукта от MSI, то ни один RADEON 9800 PRO не сможет соперничать с этой картой по комплекту поставки (мы знаем, что почти все видеокарты на базе флагмана от ATI отличаются схожей и довольной бедной комплектацией).

В итоге MSI FX5900-VTD128 может дать пользователю:

  1. Отличную скорость в 3D (особенно при АА и/ или анизотропии);
  2. Технологичное решение с поддержкой DX9 (игры эти хоть в будущем, но не за горами);
  3. поддержку VIVO;
  4. несомненно истинное удовольствие от покупки очень качественного изделия, снабженного такой Retail-поставкой (уж если отдавать $400-420, то не за пакетик с картой или коробку с картой и диском, а за внешне совершенный продукт).

В конце отмечу еще раз маленькую ложку дегтя — это потенциальные проблемы с установкой карты в ряд системных плат, где северный мост расположен близко к AGP-слоту. Маленький вентилятор с обратной стороны видеоплаты может не поместиться между AGP и кулером на северном мосту. Хотя эту деталь можно всегда снять с видеокарты без ущерба для последней.





Хочу выразить благодарность Алексею Барковому и Филиппу Герасимову за неоценимую помощь в получении reference-скриншотов




Дополнительно

Обзор MSI FX5900-VTD128 на базе NVIDIA GeForce FX 5900

MSI FX5900-VTD128 на базе NVIDIA GeForce FX 5900

и "Продолжаем вертеть 3DMark-ом 2003…"


СОДЕРЖАНИЕ

  1. Особенности видеокарты
  2. Конфигурации стендов, список тестовых инструментов, качество в 2D
  3. Результаты тестов: исследование производительности в 3DMark03 на драйверах 44.65
  4. Результаты тестов: исследование изменений в качестве графики в 3DMark03, Game4
  5. Результаты тестов: исследование изменений в качестве графики в 3DMark03, Game1
  6. Результаты тестов: исследование изменений в качестве графики в 3DMark03, Vertex Shader
  7. Результаты тестов: исследование изменений в качестве графики в 3DMark03, Pixel Shader
  8. Выводы


Вот и подошла пора рассмотрения новых видеокарт на продукте High-End от NVIDIA - GeForce FX 5900. Правда, в первую очередь на прилавках магазинов появились не самые мощные ускорители на базе FX 5900 Ultra, а чуть более медленные.

Напомним, что новое семейство под кодовым названием NV35 включает в себя три карты: 5900 Ultra, 5900 и 5900 Value. Что собой будет представлять последний продукт — мы пока не знаем. А 5900 от 5900 Ultra отличается объемом памяти и частотами: 128 мегабайт против 256 у "ультры" и 400/425 (850) МГц против 450/425 (850) МГц также у "ультры".

В остальном все три карты линейки полностью идентичны, а 5900 Ultra мы уже ранее рассмотрели самым подробнейшим образом; и читатель может ознакомиться с этим и другими материалами по семейству NV3x ниже.

Теоретико-аналитические материалы и обзоры видеокарт, в которых рассматриваются функциональные особенности GPU NVIDIA GeForce FX

Конечно, мы, как тестовая лаборатория, можем ограничиться исследованием карты и вынести свой вердикт, просто исходя из возможностей продукта, однако прекрасно знаем, что ныне оба ведущих чипмейкера ATI и NVIDIA потеряли совесть, и стоимость High-End-продуктов довели уже до уровня $450-550, хотя не так давно это было как минимум на 100 дешевле. Да, мы понимаем, что дорогая память, что дорогие PCB, дорого стоит разработать чип, прошедший сквозь огонь, воду и медные трубы улучшений, кастраций, оптимизаций и прочего. Но все же… Неужели уникальные новые акселераторы столь хороши, что за кусок текстолита, политого потом и слезами трудящихся США, Канады и Китая надо отдавать такие финансы?

Это вопрос очень сложный и болезненный, да и ответ на него неоднозначный. Частично мы попытаемся дать ответ в этом материале.

Но главной темой статьи станет расследование плодов "сотрудничества" NVIDIA и FutureMark в свете уже известных событий с подписанием "мирного" соглашения, согласно которому все действия программистов NVIDIA по увеличению скорости работы GeForce FX в 3DMark03 признаны оптимизациями, а не "заточками" (cheats). Мы рассмотрим работу FX 5900 на последней бета-версии драйверов 44.65, заодно и сравнив ее скорость со скоростью FX 5900 Ultra и RADEON 9800 PRO.

Внимание! Буквально следом за обзором этой карты выходит материал по аналогичному продукту, но от ASUSTeK, где будут рассмотрены сравнения производительностей FX 5900, 5900 Ultra, RADEON 9800 PRO в игровых тестах.

Итак, начнем с самой карты, которая явно говорит о себе, что она принадлежит к High-End ряду:

Это, так сказать, для "затравки", забегая вперед (но к красоте сверкающего радиатора невозможно остаться равнодушным, даже пришлось встать на рассвете и побаловать полусолнышко на карте первыми лучами настоящего солнца :-) ).

Компания MSI (Micro-Star International) очень хорошо известна российскому потребителю. На рынке представлена огромная гамма продуктов этой тайваньской фирмы: от системных плат до оптических накопителей. Это давний и верный союзник NVIDIA, поэтому практически нет процессора от калифорнийской фирмы, на базе которого MSI не выпустила бы видеокарту.

Вот и на фронте High-End компания идет впереди многих других партнеров NVIDIA, уже начав массовые поставки FX 5900. Эти карты можно найти и в Москве, причем по цене, подчас равной стоимости предыдущего решения FX 5800 (не-Ultra).

Ну что ж, рассмотрим видеокарту поближе.

Плата


MSI FX5900-VTD128


Карта имеет интерфейс AGP x8/x4/x2, 128 МБ памяти DDR SDRAM , размещенной в 8-ми микросхемах на лицевой стороне PCB.

MSI FX5900-VTD128

Микросхемы памяти производства Hynix. Время выборки у микросхем памяти 2,2 ns, что соответствует частоте работы примерно 454 (908) МГц, память же работает на частоте 425 (850) МГц. Частота работы GPU — 400 MHz. Интерфейс обмена с памятью — 256 бит.



Сравнение с эталонным дизайном, вид спереди
MSI FX5900-VTD128 Reference card NVIDIA GeForce FX 5900 Ultra


Сравнение с эталонным дизайном, вид сзади
MSI FX5900-VTD128 Reference card NVIDIA GeForce FX 5900 Ultra


Мы видим несколько особенностей:

  1. Дизайн карты от MSI немного отличается от эталонного у 5900 Ultra, вся правая часть, отвечающая за питание карты, переработана. Есть сведения, что вышел новый эталонный дизайн от NVIDIA с укороченной PCB и заменой элементов. Вероятно, на нем и базируется карта от MSI. В целом длина карты стала равна длине GF4 Ti 4600 (NV25):



  2. Уменьшение объема памяти с 256 до 128 мегабайт получилось путем недокомплектации микросхемами памяти (на оборотной стороне можно увидеть пустые места под BGA-микросхемы. Однако 256-битная шина не обрезалась, ведь на карте установлено 8 32-битных микросхем памяти (то есть всего 256бит). Просто уже невозможен так называемый двубанковый режим работы памяти.



  3. В целом PCB очень сложна, это прекрасно видно из фотографий.

Рассмотрим систему охлаждения.

MSI FX5900-VTD128

Система охлаждения состоит из двух кулеров: большого и малого. Большой кулер призван охлаждать GPU и микросхемы памяти (на лицевой стороне), а малый — охлаждать обратную сторону PCB в месте крепежа процессора.

Ну насчет большого кулера — все ясно из дифирамбов в начале статьи :-), а также очевидно, что эта медная штуковина очень тщательно подогнана под конфигурацию карты. Крепится аж на 6-ти клипсах!

А вот малый кулер — скорее дань моде, красоте, чем насущной необходимости. Ну что может охлаждать кулер, прижимающийся к задней стороне через упругий термоэлемент, когда между ним и самим текстолитом еще есть куча элементов логики? Да ничего практически. Однако, если посмотреть на самую последнюю фотографию в этой таблице, это "украшение" может доставить хлопоты с установкой видеокарты в системные платы, где северный мост установлен под углом 45 градусов и весьма близко к AGP-слоту. В частности, почти все материнки на i875P имеют такую конфигурацию. И приходится отгибать ребра радиатора охлаждения северного моста, чтобы малый кулер видеокарты смог "пролезть". А если на северном мосту установлен кулер с вентилятором, да еще со всякими декоративными решетками? Думаю, что вам ясно.

Разумеется, никто не мешает снять этот малый кулер, так что этот вопрос не имеет критического значения для совместимости карты.



Под большим радиатором, разумеется, можно найти и сам графический процессор:

Как мы видим, маркировка уже серийная, чип был произведен на 19-й неделе 2003 года (это примерно начало мая). Упаковка FlipChip, сверху кристалл закрыт защитной крышкой. Мы не так давно снимали крышку у NV30 (FX 5800), поэтому можем показать, как оно выглядит внутри:

Карта оснащена кодеком Philips 7114, отвечающим за VIVO:

Рассмотрим комплект поставки:

MSI FX5900-VTD128

Комплект поставки просто шикарный! В коробке можно найти 11 (!) дисков с разным ПО (на снимке справа они все представлены), где есть и игры, и просто интересный софт. Не считая, конечно, обязательных дисков с драйверами, утилитами и ПО для реализации Video-In. Ну и, конечно же, переходник S-Video-to-RCA, переходник DVI-to-d-Sub, разветвитель VIVO, руководство пользователя, фирменный БЛОКНОТ и фирменная наклейка на системный блок.



Видеокарта поставляется в retail-упаковке.

MSI FX5900-VTD128

Упаковка, как уже заведено у MSI для продуктов High-End, великолепна! Мало того, что это огромный бокс с яркой обложкой, где есть вся необходимая информация, он имеет ручку для переноски. Лицевая сторона бокса может откидываться, после чего через прозрачное окно можно видеть саму карту.



Мы уже ранее в обзоре карты на базе GeForce FX 5600 рассматривали комплект ПО, поставляемый MSI, поэтому сегодня подробно останавливаться на нем не будем.

Установка и драйверы

Конфигурации тестовых стендов:

  • Компьютер на базе Pentium 4 3200 MHz:
    • процессор Intel Pentium 4 3200 МГц;
    • системная плата DFI LANParty Pro875 (i875P);
    • оперативная память 1024 MB DDR SDRAM;
    • жесткий диск Seagate Barracuda IV 40GB;
    • операционная система Windows XP SP1; DirectX 9.0a;
    • мониторы ViewSonic P810 (21") и ViewSonic P817 (21").
    • драйверы NVIDIA версии 44.65/44.03.

VSync отключен, технология S3TC ОТКЛЮЧЕНА в приложениях.

Для сравнительного анализа приведены результаты видеокарт:

  • Reference card NVIDIA GeForce FX 5900 Ultra (450/425 (850) МГц, 256 МБ);
  • Sapphire Atlantis RADEON 9800 PRO (380/350 (700) МГц, 256 МБ, driver 6.343/6.360);
  • Hercules 3D Prophet 9800 PRO (RADEON 9800 PRO, 380/340 (680) МГц, 128 МБ, driver 6.343/6.360).

Результаты тестов

Перед тем, как кратко дать оценку качеству в 2D, я еще раз дам пояснение, что на настоящий момент НЕТ полноценной методики объективной оценки этого параметра по следующим причинам:

  1. Практически у всех современных 3D-акселераторов качество 2D может сильно зависеть от конкретного экземпляра, а отследить все карты невозможно физически;
  2. Качество 2D зависит не только от видеокарты, но и от монитора, соединительного кабеля;
  3. В последнее время огромное влияние на этот параметр стали оказывать связки: монитор-карта, то есть, встречаются мониторы, "не дружащие" с теми или иными видеокартами.

Что касается протестированного экземпляра, то совместно с ViewSonic P817 и кабелем BNC Bargo плата продемонстрировала отменное качество в следующих разрешениях и частотах:

MSI FX5900-VTD128 1600x1200x85Hz, 1280x1024x120Hz, 1024x768x160Hz (с качеством все в порядке!)


Результаты тестов: производительность в 3DMark03

Условные обозначения: ANISO 8xP — Anisotropic 8x Performance (ранее этот режим назывался Balanced), ANISO 8xQ — Anisotropic 8x Quality, ANISO 16xQ — Anisotropic 16x Quality.

Буквально на днях вышел материал Алексея Николайчука, посвященный "заточкам" в 3DMark. В нем подробно было рассмотрено то, что делают программисты NVIDIA и ATI с 3DMark2001, в частности, подменяют шейдеры и др. В той статье вся проблема расписана очень подробно. Если кратко, то ныне все тестеры по сути меряют не производительность видеокарт в 3DMark, а степень ловкости и ума программистов ATI и NVIDIA, а заодно и FutureMark. Последняя фирма вообще оказалась в роли (извиняюсь за грубое слово) проститутки. Ну раз так легко подменить шейдеры, а авторы хранят молчание, то о чем можно подумать? Речь о 3DMark2001. Странно, что почему-то только в отношении 3DMark03 они вдруг начали возмущаться, что, мол, кругом, "заточки". Одновременно выяснилось, что NVIDIA вышла из бета-тестеров, не желая платить приличную сумму в год. Программистов NVIDIA разоблачили всем миром, FutureMark выпустила патч к пакету, где, якобы, все ухищрения NVIDIA дезавуированы. Заодно немного и ATI досталось. Напоминает историю из "Тома Сойера" Марка Твена, когда тетушка во всех грехах подозревала только Тома, а его брата лишь слегка изредка ругала. При этом NVIDIA лишь становилась ожесточеннее и непримиримее к 3DMark03.

И вдруг… "Тетушка" и пакостник "Том" договорились, помирились, и более того, "Том" дал взятку "Тетушке" (стал бета-тестером будущего 3DMark), после чего последняя простила все грехи и назвала хулиганства "Тома" шалостями и шутками (ну вот такой ребенок игривый и бодрый). Разумеется, не надо быть пророком, чтобы догадаться, что "Том" будет продолжать свои "шалости".

Итак, NVIDIA и FutureMark подписали мировую, посчитав, что все ранее найденные "заточки" — оптимизации. Вышла следующая (пусть и неофициальная) версия драйверов 44.65. Очень интересно посмотреть — сумели ли программисты NVIDIA обойти все преграды, выставленные в последнем патче 3.30. Давайте вначале посмотрим на скорость.

3DMark03, Game1





Ага… По статье, где мы рассматривали ситуацию с патчем 3.30, было видно, что после "дезавуирования" шалостей программистов NVIDIA скорость упала на 20-24%. Что мы видим на драйверах 44.65? Рост! Примерно на такой же процент. Берем на заметку.

3DMark03, Game2





Также есть небольшой рост по скорости на 44.65 относительно 44.03.

3DMark03, Game3





Аналогично.

3DMark03, Game4





Ого! Скорость на 44.65 выросла капитально. Причем прирост более весомый, чем ранее падение после перехода с версии пакета 3.20 на 3.30. Мы помним прекрасно о том, что в этом тесте было снижение качества при формировании водной поверхности (точность вычислений занижена). Также берем на заметку.

3DMark03, 3D MARKS





Итого, общая производительность на патче 3.30 совместно с драйверами 44.65, выросла.

3DMark03, Vertex Shader 1.1





Как мы видим, и этот тест оптимизации не обошли стороной.

3DMark03, Pixel Shader 2.0





Гм… Когда-то мы уже видели сие. Причем в той же пропорции. Переход от 42.* версии к 43.51 ознаменовывался в том числе и резким скачком скорости в тесте пиксельных шейдеров. Поскольку никакие другие тесты с нагрузкой на ПШ подобной картины не повторяли, то "заточка" была налицо. Думаю, что сейчас мы видим то же самое.

Что касается сравнений скоростей с соперниками, то здесь у FX 5900/5900Ultra все в порядке. Ну только лишь отставание в тестах шейдеров, но ведь на всякий медленно работаюший шейдер найдется смекалка программиста! Не зря же их столько у NVIDIA! ;-)

Мы видим, что драйверы 44.65 сделали чудо, и FX 5900 (не Ultra!) превосходно смотрится по сравнению с конкурентом в виде RADEON 9800 PRO 128MB, который, к тому же, еще и дороже. НО! Не ценой ли опять ухудшения качества? К тому же, как уже было сказано в статье А.Николайчука, любая "заточка" под бенчмарк приводит к тому, что он работает не так, как задумывался авторами. А значит, мы меряем не истинную скорость карты, а степень хитроумности программистов — драйверописателей.

А где истина? Там, где патч 3.30 плюс драйвер 44.03? Или и там "месть" со стороны FutureMark? Или все же пусть будут оптимизации, чтобы только бы качество не падало? Где правда? Ответ на этот вопрос очень сложен. Мы лишь частично ответим на него в этом материале, а более полно — в следующем, где будем рассматривать работу драйвера, лишенного любых "заточек".

А сейчас посмотрим на качество.

ВНИМАНИЕ! По МНОГОЧИСЛЕННЫМ просьбам аудитории форума iXBT полноразмерные скриншоты представлены в формате BMP! КАЖДЫЙ СКРИНШОТ ИМЕЕТ РАЗМЕР 5.5 МБайт и запакован в RAR-архив, размеры которых колеблются от 1.7 до 3.2 МБайт!

Результаты тестов: качество в 3DMark03 v.3.30, Game4



Пример 1
RADEON 9800 PRO GeForce FX 5900
Driver 6.343, 1600x1200 Driver 6.360, 1600x1200 Driver 44.03, 1600x1200 Driver 44.65, 1600x1200
RADEON 9800 PRO, 6,343 vs 6.360 GeForce FX 5900, 44.03 vs 44.65
Animated GIFs
Сравнение полноразмерных BMP через PhotoShop, 1600x1200


Пример 2
RADEON 9800 PRO GeForce FX 5900
Driver 6.343, 1600x1200 Driver 6.360, 1600x1200 Driver 44.03, 1600x1200 Driver 44.65, 1600x1200


RADEON 9800 PRO, 6,343 vs 6.360 GeForce FX 5900, 44.03 vs 44.65
Animated GIFs
Сравнение полноразмерных BMP через PhotoShop, 1600x1200


Сравнение с Reference picture
RADEON 9800 PRO GeForce FX 5900
Driver 6.343 Driver 6.360 Driver 44.03 Driver 44.65
1024x768 1024x768 1024x768 1024x768
Reference picture, 1024x768
Driver 6.343 vs reference Driver 6.360 vs reference Driver 44.03 vs reference Driver 44.65 vs reference

Мы ранее уже узнали, что в Game4 версии 3.20 3DMark03 при отрисовке водной поверхности FX5xxx-семейство использовало пониженную точность вычислений, вследствие чего картинка несколько искажалась (мы уже показывали это в ранее упомянутой статье). Патч 3.30, как мы видим, восстановил качество. И вроде бы на драйверах 44.65 мы не видим падения качества, точность не понижалась. Однако, очевидно, что шейдеры снова подменялись. Это заметно как на анимированных GIF, так и через сравнение BMP. Хоть где-то, а подмена есть. НО! В какую сторону? Вопрос сложный. Мы привели сравнение с reference-картинками, понимая, что у каждого акселератора есть свои подходы к формированию сцен, но все же интересно посмотреть, а каковы отличия. Видим, что картинка, полученная на 44.03, отстоит дальше от эталона, чем та, что могли получить на 44.65. Получается все наоборот? Версия 44.65 приблизила FX5900 к эталону? Да, сравнение показывает, что так и есть. Но показывает ли это сравнение наличие заточек и справедливо ли заявление FutureMark о том, что патч 3.30 и драйвер 44.03 вывели ситуацию в правильное русло? — Никто не знает пока.

К сожалению, 1500-й кадр через reference растеризатор нам получить не удалось (слишком долго шел расчет, да и заканчивался ошибками).

Давайте с помощью AntiDetect уберем в драйвере определение приложения и посмотрим на картинку, которую GeForce FX 5900 выдает при "девственно чистом" драйвере.

GeForce FX 5900: Сравнение с картинками, полученными на драйвере с Antidetect! 1024x768
AntiDetect Reference Driver 44.03 Driver 44.65

Да, отличия от reference есть, и они весьма сильные, поэтому за эталон держать картинку, полученную через программный растеризатор, нельзя. Но! Почему же на версии 44.03 и патче 3.30 картина также отличается от той, что мы имеем с AntiDetect? Не убраны все "заточки"? Или искусственно под детект драйвера вставлены новые со стороны FutureMark для занижения скорости? Факт в том, что авторы пакета откровенно лгут, говоря о восстановлении справедливости в патче 3.30.

Результаты тестов: качество в 3DMark03 v.3.30, Game1



Пример 1
RADEON 9800 PRO GeForce FX 5900
Driver 6.343/6.360, 1600x1200 Driver 44.03, 1600x1200 Driver 44.65, 1600x1200


RADEON 9800 PRO, 6,343 vs 6.360 GeForce FX 5900, 44.03 vs 44.65
Animated GIFs
-
Сравнение полноразмерных BMP через PhotoShop, 1600x1200


Сравнение с Reference picture
RADEON 9800 PRO GeForce FX 5900
Driver 6.343 Driver 6.360 Driver 44.03 Driver 44.65
1024x768 1024x768 1024x768 1024x768
Reference picture, 1024x768
Driver 6.343 vs reference Driver 6.360 vs reference Driver 44.03 vs reference Driver 44.65 vs reference


Пример 2
RADEON 9800 PRO GeForce FX 5900
Driver 6.343/6.360, 1600x1200 Driver 44.03, 1600x1200 Driver 44.65, 1600x1200


RADEON 9800 PRO, 6,343 vs 6.360 GeForce FX 5900, 44.03 vs 44.65
Animated GIFs
-
Сравнение полноразмерных BMP через PhotoShop, 1600x1200


Сравнение с Reference picture
RADEON 9800 PRO GeForce FX 5900
Driver 6.343 Driver 6.360 Driver 44.03 Driver 44.65
1024x768 1024x768 1024x768 1024x768
Reference picture, 1024x768
Driver 6.343 vs reference Driver 6.360 vs reference Driver 44.03 vs reference Driver 44.65 vs reference


Итак, мы снова видим, что в драйверах NVIDIA содержатся хитрости. На сей раз это связано уже не с шейдерами, а с включением принудительной компрессии полупрозрачных текстур, с помощью которых образуются клубы дыма. Вот и объяснение тех приростов скоростей, что мы видели выше. У обеих компаний картинки отличаются от reference и друг от друга, что логично. Снова правды не найти?

Вот в чем вопрос! Тут некоторые посетители форумов рьяно ратуют за использование "девственных" драйверов везде и вся. Найдете ли вы правду? Вряд ли. Но будете утешать себя, что "провели NVIDIA и ATI", но совсем забыли, что не провели не менее хитроумных программистов FM.

Давайте снова с помощью AntiDetect уберем в драйвере определение приложения и еще раз посмотрим на картинку, которую GeForce FX 5900 выдает при "девственно чистом" драйвере.

GeForce FX 5900: Сравнение с картинками, полученными на драйвере с Antidetect! 1024x768
AntiDetect Reference Driver 44.03 Driver 44.65


И снова мы видим отличия от reference, и опять задаем вопрос: почему же на версии 44.03 и патче 3.30 картина также отличается от той, что мы имеем с AntiDetect? Где обещанное восстановление истинного выполнения теста, как нам вещали авторы 3DMark03?

3DMark03 v.3.30, Vertex Shader 1.1



RADEON 9800 PRO GeForce FX 5900
Driver 6.343, 1600x1200 Driver 6.360, 1600x1200 Driver 44.03, 1600x1200 Driver 44.65, 1600x1200


RADEON 9800 PRO, 6,343 vs 6.360 GeForce FX 5900, 44.03 vs 44.65
Сравнение полноразмерных BMP через PhotoShop, 1600x1200


Сравнение с Reference picture
RADEON 9800 PRO GeForce FX 5900
Driver 6.343 Driver 6.360 Driver 44.03 Driver 44.65
1024x768 1024x768 1024x768 1024x768
Reference picture, 1024x768
Driver 6.343 vs reference Driver 6.360 vs reference Driver 44.03 vs reference Driver 44.65 vs reference


Вспомним о приростах по скорости у FX 5900 на версии 44.65, и мы прекрасно видим, что подмена шейдеров очевидна.

C помощью AntiDetect уберем в драйвере определение приложения и смотрим на картинку, которую GeForce FX 5900 выдает при "девственно чистом" драйвере.

GeForce FX 5900: Сравнение с картинками, полученными на драйвере с Antidetect! 1024x768
AntiDetect Reference Driver 44.03 Driver 44.65


Вопрос тот же: почему же на версии 44.03 и патче 3.30 картина также отличается от той, что мы имеет с AntiDetect?

3DMark03 v.3.30, Pixel Shader 2.0



RADEON 9800 PRO GeForce FX 5900
Driver 6.343, 1600x1200 Driver 6.360, 1600x1200 Driver 44.03, 1600x1200 Driver 44.65, 1600x1200


RADEON 9800 PRO, 6,343 vs 6.360 GeForce FX 5900, 44.03 vs 44.65
Сравнение полноразмерных BMP через PhotoShop, 1600x1200


Сравнение с Reference picture
RADEON 9800 PRO GeForce FX 5900
Driver 6.343 Driver 6.360 Driver 44.03 Driver 44.65
1024x768 1024x768 1024x768 1024x768
Reference picture, 1024x768
Driver 6.343 vs reference Driver 6.360 vs reference Driver 44.03 vs reference Driver 44.65 vs reference


Очевидно, что картинки у GF на 44.03 и 44.65 разные. Это и показывает сравнение через BMP. Обратим внимание, что разницы между версиями драйверов у ATI нет, это видно. Почему? Ведь в CATALYST 3.5 ATI убрала "заточки". Как мне объяснили специалисты ATI, они были связаны с математическими особенностями способов вычислений, а не с подменами шейдеров так, что менялась конечная картинка. И потому визуальных отличий нет.

C помощью AntiDetect уберем в драйвере определение приложения и смотрим на картинку, которую GeForce FX 5900 выдает при "девственно чистом" драйвере.

GeForce FX 5900: Сравнение с картинками, полученными на драйвере с Antidetect! 1024x768
AntiDetect Reference Driver 44.03 Driver 44.65


Реалии иные, каждый акселератор имеет свои особенности. И видим, что опять 44.03 плюс патч 3.30 показывают отличия от картинки, полученной с помощью Anti-Detect.

Подведем итоги по 3DMark03. Тестирование показало, что компания NVIDIA предпочитает прятать промашки по скорости работы шейдеров за различные ухищрения, поднимающие скорость ее карт именно в "шейдерных" тестах. Самым популярным из таковых сегодня является 3DMark03.

Да, безусловно, ходы, позволяющие реализовать ту или иную математическую функцию меньшими затратами, должны приветствоваться. И если программисты FutureMark где-то "чешут левое ухо правой рукой", а NVIDIA предоставляет своим картам осуществлять этот процесс нормальным и оптимальным путем, это хорошо и должно приветствоваться. Однако, тут вступает в силу и другое правило: программа должна работать так, как ее задумывали авторы (только показали бы хотя бы — что должны получить). И подмена узловых команд в угоду той или иной видеокарте — это нечестно. Тогда мы уже меряем не карты, а хитрости и ловкости программистов.

Но в то же время надо и осознавать то, что в конечном итоге пользователь использует карту на драйверах производителя, и никто не станет ставить некие эталонные и лишенные "заточек" драйверы. Надо понимать, что нравится нам или не нравится, а конечная производительность, получаемая пользователем ускорителя, складывается из возможностей акселератора, отлаженности драйвера и тех самых "оптимизаций".

В ближайшее время мы выпустим еще один материал, посвященный "заточкам", где рассмотрим более подробно работу подобного драйвера, лишенного определений тех приложений, которые запускает пользователь. Об этом уже начал говорить в своей статье Алексей Николайчук, коснувшись проблемы с 3DMark2001. Мы затронем игровые тесты. А также продолжим исследовать 3DMark03. Но это позже.

Всех ярых противников оптимизаций и ратующих за массовые тестирования ТОЛЬКО на пропатченных AntiDetect-ом драйверах, я все же прошу вдуматься в проблему глубже и понять, что это бессмысленно.

  1. Драйвер действительно может осуществлять управление ускорителем по более совершенной схеме, нежели может предложить приложение. Вот пример, приведенный автором RightMark 3D Филиппом Герасимовым:

    Реализация функций Sin/Cos авторами 3DMark2001:

    ; c12 vecsin ( 1.0f, -1.0f / 6.0f, 1.0f / 120.0f, -1.0f / 5040.0f )
    ; c13 veccos ( 1.0f, -1.0f / 2.0f, 1.0f / 24.0f, -1.0f / 720.0f )
    ; c14 pis( PI, 1.0f / (2.0f * PI), 2.0f * PI, 0 )

    ; now r1.x = fAngle
    ; wrap theta to -pi..pi
    mul r1.x, r1.x, c14.y ; divide by 2*PI
    expp r2.y, r1.x ; get fractional part only
    mad r1.x, r2.y, c14.z, -c14.x ; multiply with 2*PI

    ; compute first 4 values in sin and cos series
    mov r2.x, c12.x ; theta^0 ;r2.x = 1
    mul r2.y, r1.x, r1.x ; theta^2
    mul r1.y, r1.x, r2.y ; theta^3
    mul r2.z, r2.y, r2.y ; theta^4
    mul r1.z, r1.x, r2.z ; theta^5
    mul r2.w, r2.y, r2.z ; theta^6
    mul r1.w, r1.x, r2.w ; theta^7

    ; sin
    mul r1, r1, c12
    dp4 r1.x, r1, c12.x

    ; cos
    mul r2, r2, c13
    dp4 r2.x, r2, c12.x

    Итого 14 инструкций



    А вот те же функции в реализации NVIDIA:

    ; scalar r0.x = cos(r1.x), r0.y = sin(r1.x)
    DEF c0, PI, 1.f/2.f, 2.f*PI, 1.f/(2.f*PI)
    DEF c1, 1.0f, -1.f/2.f, 1.f/24.f, -1.f/720.f
    DEF c2, 1.0f, -1.f/6.f, 1.f/120.f, -1.f/5040.f
    MAD r0.x, r1.x, c0.w, c0.y ; bring argument into –pi, .., +pi range
    EXPP r0.y, r0.x
    MAD r0.x, r0.y, c0.z, -c0.x
    DST r2.xy, r0.x, r0.x ; generate 1, (r0.x)^2, .. (r0.x)^6
    MUL r2.z, r2.y, r2.y
    MUL r2.w, r2.y, r2.z
    MUL r0, r2, r0.x ; generate r0.x, (r0.x)^3, .., (r0.x)^7
    DP4 r0.y, r0, c2 ; compute sin(r0.x)
    DP4 r0.x, r2, c1 ; compute cos(r0.x)

    Итого 9 инструкций

    Очевидно, что второй путь совершеннее.

  2. Будут выходить все новые и новые версии драйверов, где все эти заточки будут прятаться глубже и дальше. Сможет ли соревноваться один (пусть даже и гениальный) програмист с целой армией программистов NVIDIA или ATI? Пока будет хватать желания и энтузиазма, может быть и сможет. А если не хватит?

Я считаю, что надо призывать и NVIDIA, и ATI отказаться от политики грязных игр, от политики выкручивания рук тестерам своими "заточками" (а другими словами это и не назвать), больше усилий вкладывать в совершенствование самого "железа", а не в зализывание драйверами своих ошибок. Ведь тестеры попали в заложники политики обманов и лжекорон в 3D-графике и вынуждены рассматривать соотношение скоростей работы ускорителей КАК ЕСТЬ. Увы! Иного пока не дано. Просто читателям надо всегда иметь в виду, что если видеокарта "А" производительнее видеокарты "Б" на 20%, то какая-то часть этих процентов может принадлежать не заслугам самой карты, а программистов-драйверописателей.

Поэтому мы не можем молчать, видя, что ведущие производители графических процессоров ради прибыли идут на подлоги, не мытьем, так катаньем повышают рейтинги и скорости. Мы не можем согласиться с тем, что NVIDIA и ATI сделали из тестеров посмешище, а все обзоры (с участием 3DMark) превратили в водевиль. Мы настоятельно просим, чтобы политика заточек в драйверах под бенчмарки была ПРЕКРАЩЕНА, мы призываем, чтобы обе компании честно раскрывали полноценные спецификации своих продуктов, а не выдавали только то, что выгодно маркетинговым отделам.

Мы также хотим, что FutureMark меньше зависел от того, кто из магнатов входит в бета-тестирование и делал свои 3DMark-и более защищенными от вмешательств извне. И так очевидно, что репутация 3DMark03 капитально пострадала.

Выводы

Что касается предмета, собственно, нашего материала. Видеокарта от MSI представляет собой прекрасный продукт с точки зрения качества изготовления, комплекта поставки. И вообще, очевидно, что специалисты этой компании подходят к выпуску видеокарт, особенно класса High-End, с душой. Применены интересные решения по охлаждению, а также в дизайне самой карты.

Плюс не надо забывать, что FX 5900 — это один из самых производительных ускорителей на сегодня. Он смело соперничает с RADEON 9800 PRO, обладая либо равной, либо более низкой ценой. А что касается продукта от MSI, то ни один RADEON 9800 PRO не сможет соперничать с этой картой по комплекту поставки (мы знаем, что почти все видеокарты на базе флагмана от ATI отличаются схожей и довольной бедной комплектацией).

В итоге MSI FX5900-VTD128 может дать пользователю:

  1. Отличную скорость в 3D (особенно при АА и/ или анизотропии);
  2. Технологичное решение с поддержкой DX9 (игры эти хоть в будущем, но не за горами);
  3. поддержку VIVO;
  4. несомненно истинное удовольствие от покупки очень качественного изделия, снабженного такой Retail-поставкой (уж если отдавать $400-420, то не за пакетик с картой или коробку с картой и диском, а за внешне совершенный продукт).

В конце отмечу еще раз маленькую ложку дегтя — это потенциальные проблемы с установкой карты в ряд системных плат, где северный мост расположен близко к AGP-слоту. Маленький вентилятор с обратной стороны видеоплаты может не поместиться между AGP и кулером на северном мосту. Хотя эту деталь можно всегда снять с видеокарты без ущерба для последней.





Хочу выразить благодарность Алексею Барковому и Филиппу Герасимову за неоценимую помощь в получении reference-скриншотов