![]()
Оба продукта представляют собой reference cards, то есть предсерийные образцы. Мы еще будем рассматривать и серийные изделия, но это позже. Напомню, то обе карты имеют по 256 мегабайт памяти GDDR3 со временем выборки 1.6ns, при этом у NV40 частота по памяти - 550 (1100) МГц, а у R420 - 575 (1150) МГц. Частоты работы чипов: NV40 - 400 и 450 МГц, R420 - 525 МГц. Оба GPU содержат по 16 пиксельных и 6 вершинных конвейеров. NV40 поддерживает еще версию шейдеров 3.0, а R420 - собственную технология сжатия карт нормалей - 3Dc. Вот кратко и все.
Для визуальной и очень примерной оценки возможностей по разгону неплохо бы привести снова снимок, где представлены оба чипа: NV40 и R420:
Мы заметим, что размер кристалла у NV40 самый большой (что и не удивительно при его 222 млн. транзисторов), однако, как показал опыт, все же отдельные экземпляры могут разгоняться с 400 до 450 МГц. Например, наша карта при использовании термопасты с содержанием серебра, смогла заработать на таких частотах при наличии всего небольшого дополнительного вентилятора, обеспечивающего поток холодного воздуха на турбину родного кулера от видеокарты. Конечно, это ни о чем не говорит насчет процента GPU, способных гарантированно работать на 450 МГц, но все же показательно. Хотя, пока по Сети ходят слухи, что процент выхода мал, и на 450 МГц работать будут считанные отобранные чипы. Как будет на самом деле - покажет время.
Насчет разгонов X800 XT пока ничего не могу сказать, во время тестирования у карты был BIOS, запрещающий разгон по чипу. Этот вопрос мы будем
еще исследовать дальше. Хотя, надо сказать, что последняя бета-версия RivaTuner (автор Алексей Николайчук AKA Unwinder) уже поддерживает X800 в
полном объеме, показывая не только число пиксельных конвейеров, но и осуществляя мониторинг по температуре:
Сейчас автор совместно с нами работает над патчем к драйверам, позволяющим менять число конвейеров, включая ранее заблокированные (как было у RADEON 9500/9700; 9800SE/9800). Пока есть проблемы (сотрудник ATI не обманул меня, говоря о том, что так просто поменять число конвейеров программным путем уже не удастся), стоят защиты. Но работа ведется и время покажет! :-)
Установка и драйверыКонфигурации тестовых стендов:
Синтетические тесты D3D RightMarkИспользованная нами версия пакета синтетических тестов D3D RightMark Beta 4 (1050) и ее описание доступна на сайте http://3d.rightmark.org Еще раз отмечу, что все тесты в RightMark снимались на компьютере на базе Pentium4. Все тесты включают в себя результаты из обзоров NV40 на частоте 400МГц и обзора R420, поэтому мы прокомментируем только отличия и характер поведения NV40 с ядром 450МГц. Итак: Тест Pixel FillingПиковая производительность выборки текстур (texelrate), режим FFP, для разного числа текстур накладываемых на один пиксель:
В случае одной и двух текстур NV40-450 вполне предсказуемо упирается в пропускную способность памяти, а точнее скорость работы с буфером кадра. По мере роста числа текстур преимущество более высокой частоты ядра начинает проявляться, но никаких кардинальных изменений в расклад сил не вносит - R420 лидер. А сейчас - скорость закраски буфера кадра (fillrate, pixelrate), режим FFP, для разного числа текстур накладываемых на один пиксель: Та же самая ситуация. Посмотрим, как скорость закраски зависит от версии шейдеров:
Ничего нового. Итак, 450 МГц не внесли существенных изменений в расклад сил в этом тесте. Вполне логично - до 525 МГц им все еще далеко. А теперь посмотрим, как текстурные модули справляются с кэшированием и билинейной фильтрацией реальных текстур различных размеров:
Различия есть, но их сложно назвать существенными. Полоса пропускания памяти и алгоритм фильтрации определяют в этом тесте больше, чем 50 МГц прирост ядра. А теперь посмотрим на зависимость производительности текстурных модулей от формата текстур:
Больше размер:
Вновь ничего нового или удивительного. Итак, можно констатировать отсутствие существенных отличий. Тест Geometry Processing SpeedСамый простой шейдер – предельная пропускная способность по треугольникам:
Заметный прирост, причем теперь NV40-450 становится лидером. Интересно, что скачек на вершинных шейдерах превышает разницу частоты - сказались новые драйверы - на лицо лучшая оптимизация коротких вершинных шейдеров. Посмотрим, сохранится ли этот скачкообразный прирост на более сложных задачах. Более сложный шейдер – один простой точечный источник света:
Сюрпризы исчезли. Оптимизация коснулась только пиковой пропускной способности, на более-менее стандартной задаче она себя уже так не проявит. Как бы там ни было результат вершинных шейдеров не зависит так сильно от пропускной полосы памяти, и потому увеличился пропорционально частоте ядра. Усложняем задачу далее:
Здесь NV40 FFP лидер, несмотря на частотное преимущество ATI. Но общая картина по-прежнему скалывается скорее в пользу ATI - выше частота ядра - больше скорость вершинных шейдеров. А теперь самая сложная задача, три источника света, причем, для сравнения в вариантах без переходов, со статическим и динамическим управлением исполнением:
FFP силен, а статические переходы заметно ударяют по чипам NVIDIA. Парадокс в том, что динамические переходы на чипах от NVIDIA выгоднее статических. Общая картина вновь в пользу R420, везде, где дело не касается FFP… Вывод - вновь никаких сюрпризов. Вершинные шейдеры масштабируются строго пропорционально частоте ядра - сказывается отсутствие сильной зависимости от пропускной полосы памяти.
Тест Pixel ShadersПервая группа шейдеров – достаточно простых для исполнения в реальном времени, 1.1, 1.4 и 2.0:
Мы видим, что NV40 на частоте 450 МГц работает быстрее. Но, недостаточно быстрее - лидер по пиксельным шейдерам игровой сложности прежний - R420. Посмотрим, сможет ли спасти положение NV40 использование 16 битной точности плавающих чисел:
Преимущество 16 битной точности для NV40 есть, в некоторых шейдерах больше, в некоторых меньше. Порою оно позволяет догнать R420 (не забываем про возможные артефакты пониженной точности - см. игровую секцию обзора) но не отыграть у него пальму первенства. Частота и еще раз частота. А теперь посмотрим на действительно сложный, «кинематографичный» шейдер 2.a в силу небольшого числа зависимых выборок уложившийся в ограничения пиксельных конвейеров R420:
Пропорционально быстрее. Теперь NV40-450 выигрывает у R420, но только в случае использования 16 битной точности. Итого, по пиксельным шейдерам: 450 МГц позволяют, порой, выровнять производительность с R420. Но не демонстрируют того, что можно было бы назвать четким лидерством.
Тест HSRПиковая эффективность (без текстур и с текстурами) в зависимости от сложности геометрии:
Картина практически идентична, небольшие отличия в эффективности 450 МГц варината NV40 вызваны иным соотношением частот ядра и памяти.
Тест Point Sprites.Интересно, что в новых драйверах NVIDIA кардинально исправлено досадное падение производительности, которое мы наблюдали на малых размерах спрайтов!
ВЫВОДЫ
То есть, даже 450 МГц не дает твердой победы NV40 в области синтетических тестов. Результаты тестов: сравнение производительности (иногда и качества)Подчеркну, что все показания в игровых тестах снимались на компьютере на базе Athlon64. В качестве инструментария мы использовали:
Также, если кто хочет получить демки-бенчмарки, которыми мы пользуемся, то напишите на мой e-mail. Учитывая мощь современных акселераторов, я решил исключить из рассмотрения отдельные режимы с АА или с АФ, поэтому будут представлены диаграммы только в «чистом» режиме и с полной нагрузкой АА+АФ.
Quake3 Arena
![]() ![]()
Самые легкий режим без АА и анизотропии: R420 проиграл сопернику (мы и раньше уже с этим сталкивались) Cамый тяжелый режим с АА и анизотропией: аналогично Итак, в целом:
Serious Sam: The Second Encounter
![]() ![]()
Самые легкий режим без АА и анизотропии: победа NV40 и с весьма большим счетом. Cамый тяжелый режим с АА и анизотропией: аналогчно. Итак, в целом:
Return to Castle Wolfenstein (Multiplayer)
![]() ![]()
Самые легкий режим без АА и анизотропии: небольшая победа снова у NV40 (OpenGL!) Cамый тяжелый режим с АА и анизотропией: аналогично, и даже выигрыш приличный. Итак, в целом:
Code Creatures
![]() ![]()
Самые легкий режим без АА и анизотропии: примерный паритет между соперниками (если учитывать 400 МГц у NV40), а легкая победа у 450 МГц карты. Cамый тяжелый режим с АА и анизотропией: А здесь полная победа у X800 XT! И даже 450 Мгц у NV40 не спасают от проигрыша. Итак, в целом:
Unreal Tournament 2003
![]() ![]()
Самые легкий режим без АА и анизотропии: выигрыш у X800 XT! И снова 450 МГц у NV40 не помогли карте. Все же, недостаточная ПСП для такой карты играет все более драматическую роль. Cамый тяжелый режим с АА и анизотропией: победа у X800 XT просто блестящая. Увы, для NV40 тут никаких дивидендов нет. 450 МГц по чипу лишь чуть уменьшили разрыв. Итак, в целом:
Unreal II: The Awakening
![]() ![]()
Самый легкий режим без АА и анизотропии: небольшая победа у NV40. Cамый тяжелый режим с АА и анизотропией: А здесь все наоборот: NV40 проиграла с легким счетом. Итак, в целом:
RightMark 3D
![]() ![]()
Самый легкий режим без АА и анизотропии: твердая победа у NV40. Cамый тяжелый режим с АА и анизотропией: сложный вопрос: где-то победа у X800 XT, а где-то нет. В целом, если учитывать 450 МГц у NV40, паритет. Итак, в целом:
TR:AoD, Paris5_4 DEMO
![]() ![]()
Во всех режимах сильная поражение NV40, которому и 450 МГц не помогли Итак, в целом:
FarCry, demo01
![]() ![]()
Самые легкий режим без АА и анизотропии: при 400 МГц у NV40 очевидно, что R420 выигрывает и сильно. 450 МГц помогли GeForce 6800 Ultra приблизиться к сопернику, но в целом, все равно отставание налицо. Cамый тяжелый режим с АА и анизотропией: победа у X800 XT, хотя 450 МГц у NV40 позволили почти догнать соперника! Итак, в целом:
Обратим внимание на последнюю фразу. Прирост засчет чего? Давайте посмотрим на качество.
Вы видим, что оно у семейства NVIDIA вызывает явные нарекания. Такое ощущение, что точность выполнения шейдеров именно у NV4x/3x понижена до 16 бит. А у ATI R4xx/3xx все бегает при 24битной точности. Драйвер 61.11 виноват ли? Я не зря выше объединил NV3x/4x. Да, такая картина наблюдается и на NV3x! Более того, и на 56.56, и на 60.72 версиях. Виноват тут патч 1.1 к игре, который ввел такое безобразие. Почему? Кто изначально виноват в этом? Я не стану утверждать, хотя принадлежность игры к программе «The way It's Meant To Be Played» может о чем-то говорить. Мне бы очень не хотелось думать, что NVIDIA вынудила разработчиков понизить точность вычислений шейдеров для NV3x, чтобы поднять скорость засчет этого (ведь когда вышел патч 1.1, NVIDIA рукоплескала тому, как выросла скорость у NV35/38, и ни слова не было сказано про то, что качество упало). В общем, я выводы оставлю читателям и сотрудникам компаний. Факт есть факт: качество у NV3x/NV4x в этой игре ниже, чем у R3xx/4xx, и при этом наблюдается даже проигрыш детища NVIDIA сопернику. Пока NVIDIA заявляет, что в этой ситуации виноваты разработчики, что это их ошибка. Ждем патча 1.2, где вроде обещано это пофиксить. Посмотрим, что будет там со скоростью.
Теперь что касается 61.11, касательно этой игры. Вот здесь надо отдать должное программистам NVIDIA. Они
смогли уже без ущербов качества поднять скорость засчет внутренних оптимизаций (так называемых заточек не
обнаружено, это действительно полезные и нужные оптимизации).
Call of Duty, ixbt04
![]() ![]()
Самые легкий режим без АА и анизотропии: обратим внимание на то, как выросла скорость на 61.11. И поэтому NV40 везде выиграла! Cамый тяжелый режим с АА и анизотропией: аналогично! Итак, в целом:
Конечно, могут сказать, что какая-то нестабильная ситуация, сейчас мы видим приросты, а не сменятся ли они
потом падениями (как иногда уже бывало)? Не лучше ли сразу выпустить карту и драйверы уже отлаженные, где
все выставлено на максимум? Я выскажу свое мнение: если вышла карта уровня в 600 долларов США, то можно все же
было ДО ЕЕ анонса и отладить ПО, и вывести производительность на максимум. Особенно это касается такой
опытной и сильной своими программистами компании как NVIDIA.
HALO: Combat Evolved
![]()
Самые легкий режим без АА и анизотропии: примерный паритет, хотя 450 МГц помогли NV40 подняться до легкой победы. Итак, в целом:
Half-Life2 (beta): ixbt07 demo
![]() ![]()
Режим с анизотропией: выигрыш у NV40 с 450 МГц. Cамый тяжелый режим с АА и анизотропией: картина обратная. Итак, в целом:
Splinter Cell
![]()
Самые легкий режим без АА и анизотропии: примерный паритет Итак, в целом:
Colin McRae Rally04
![]() ![]()
Самые легкий режим без АА и анизотропии: крупное поражение NV40. Cамый тяжелый режим с АА и анизотропией: аналогично! Итак, в целом:
Это первый пример одной из новых игр, и наблюдаем поражение флагмана NVIDIA. На скриншотах ниже можно
видеть, как отличий по качеству практически нет.
Max Payne-2
![]() ![]()
Самые легкий режим без АА и анизотропии: полный паритет, просто потому что, все уперлось в возможности центрального процессора и системы. Cамый тяжелый режим с АА и анизотропией: только в 1600х1200 выявилась разница, где X800 XT оказался лидером. Итак, в целом:
Эта игра, хоть и не совсем уже свежая, но все же относится к разряду новых. По качеству оба продукта продемонстрировали
одинаковые картинки, да и в целом, как оказалось, карты равны. Игра не загружает по сложности графики акселераторы
на столько, чтобы они стали ограничителем производительности.
Painkiller
![]() ![]()
Самые легкий режим без АА и анизотропии: победа у X800 XT! Cамый тяжелый режим с АА и анизотропией: успех R420 даже стал подавляющим! Итак, в целом:
А данный титул вышел не так давно, и потому весьма интересен. Пока я использовал игру без патча 1.15, где
встроен бенчмарк (эти тесты будут позже). Как можно убедиться, по качеству отличий нет.
Need For Speed: Underground
![]() ![]()
Самые легкий режим без АА и анизотропии: победа у NV40! Cамый тяжелый режим с АА и анизотропией: аналогично. Итак, в целом:
Эта игра вышла хоть и не сейчас, а некоторое время назад, она очень популярная и поныне. Заметим, что тайтл очень любит процессор, и потому в какой-то
мере упирается в него. Но все же победа NV40 примечательна. Что касается качества, то у обоих конкурентов оно одинаковое.
Пираты Карибского моря
В данной игре я не стал искать пути измерения скорости, но сравнить качество весьма интересно, особенно если учесть, сколько было нареканий на
работу разных карт в данном приложении. Как мы видим, наши соперники продемонстрировали идентичное качество без каких-либо артефактов.
Vietcong
Результаты сравнения качества в данной игре аналогичны предыдущим: различий в этом плане между R420 и NV40 нет.
3DMark03 - Game1
![]() ![]()
Самые легкий режим без АА и анизотропии: победа у NV40, Cамый тяжелый режим с АА и анизотропией: а вот здесь NV40 проиграл на 400 МГц, и вышел в паритет при 450 Мгц. Итак, в целом:
3DMark03 - Game2
![]() ![]()
Самые легкий режим без АА и анизотропии: примерный паритет с соперником у NV40 при 400 МГц и выигрыш при 450 МГц. Cамый тяжелый режим с АА и анизотропией: а здесь победа в обоих случаях. Итак, в целом:
В данном тесте прирост по частоте весьма неплохо помог NV40 (тест на шейдерах DX8.1, очень сильная нагрузка
на ядро, поэтому такая и отзывчивость на рост частоты).
3DMark03 - Game3
![]() ![]()
По сути картина аналогичная предыдущему тесту. Итак, в целом:
Поскольку тест по своей нагрузке такими же шейдерами 1.1-1.4 близок к предыдущего, то и выводы остаются такими же.
3DMark03 - Game4
![]() ![]()
Самые легкий режим без АА и анизотропии: А здесь X800 XT имеет подавляющее преимущество! Cамый тяжелый режим с АА и анизотропией: аналогично, и даже просто колоссальный перевес над NV40! Итак, в целом:
А вот в тесте, где превалирующими являются шейдеры 2.0, тут X800 XT взял верх. Причем просто с колоссальным
отрывом! И никакой рост частоты ядра до 450 МГц у NV40 не помог последнего, хотя влияние подъема частоты ядра
существенное, то есть снова ПСП особой роли тут не играет.
3DMark03 - MARKS
![]() ![]()
Самые легкий режим без АА и анизотропии: победа у X800 XT при состязании с 400 МГц NV40, и поражение перед 450 МГц картой. Cамый тяжелый режим с АА и анизотропией: аналогично. Итак, в целом:
Если считать 3DMark03 тестом DX9, то преимущество надо отдавать Game4 все же, и тогда победа у X800 XT налицо.
Но если брать формулу, что предложена авторами пакета, то 3DMark03 в большей части DX8 тест. И тогда победа
у NV40 450 MHz. Короче говоря, просто нет победителей и побежденных. Мы не в детском саду, чтобы «попугаи» считать.
Этот пример наглядно демонстрирует абсурдность почитания этих «марков» как истину в последней
инстанции. Ибо эти оценки не дают анализа истинного соотношения сил.
AquaMark3
![]() ![]()
Самые легкий режим без АА и анизотропии: полная победа у NV40. Cамый тяжелый режим с АА и анизотропией: а вот тут фортуна убежала от детища NVIDIA, и улыбнулась ребенку ATI. Итак, в целом:
И снова синтетический тест, и снова неопределенность! Если, конечно, сложить все минусы и плюсы, то получим
паритет с огромным натягом. А можно ли таким путем снова вычислять «среднюю температуру по больнице»?
Думаю, что это неверно.
Driver NVIDIA 61.11Что можем сказать по поводу этой версии?
ВыводыЧто мы можем сказать в первую очередь по данному огромному тестированию?
И в конце хочу еще сказать, что мы все прекрасно знаем любовь NVIDIA к прятанью козырей в виде более оптимизированных драйверов в рукав, до поры до времени. И кто знает, что покажет NV40 через какое-то время. Вполне допускаю, что это может быть и без вредных заточек. Что касается так называемых оптимизаций под бенчмарки, мы уже писали и не раз об этом, однако если уж сам авторы этих программ признают, что NVIDIA (или ATI) могут по своему усмотрению что-то там оптимизировать даже с подменой шейдеров (лишь бы качество не падало), то мы-то, грешные тестеры, чего можем поделать? Кричать постоянно, что это плохо, когда тест работает не так, как задумывался авторами? - Кричали. И что? - Никакого эффекта. Все молчат, а мы как «Трус» из «Кавказской пленницы» вопим: «Да здравствует наш суд...» :-). Большинство СМИ обсуждали качество, заточки и все эти проблемы? - Нет. :-( За положительные оптимизации без снижения качества надо хвалить. И если в 61.11 оно так и есть, программистам NVIDIA громкие аплодисменты! И большое «фи» авторам патча 1.1 к FarCry (или тем, кто вынудил разработчиков это сделать). Хочется похвалить разработчиков из ATI - они не уронили марку с выпуском X800 XT! Конечно, время покажет, кто кого (как выше уже говорилось), но задел на успех очевиден. Правы ли они, что проигнорировали 3.0 версию шейдеров в данном продукте или нет, - увидим. Пока мы забыли про шейдеры 3.0 и 3Dc. В Сети идут неимоверные споры - кто кого? Что будет больше востребованнее? Пока еще нет версии DX 9.0c и нет драйверов NVIDIA с поддержкой 3.0. И потому оценить возможности NV40 в этом плане мы не можем. Если работоспособность 3.0 сразу же будет на высоте, и мы увидим приличную скорость (не хуже 2.0), и эти техники дадут разработчикам дополнительную гибкость, а также 3.0 пойдет в более массовые карты среднего и младшего уровня (сколько но), то технология приживется. И тогда ATI ничего не останется делать, как в следующих продуктах вводить 3.0 и у себя. Если же 3.0 пойдут со скрипом, будут реализованы не оптимально и будут вкусны только лишь энтузиастам из среды разработчиков, то есть большой шанс, что они умерут без развития. Ведь через два года придут Longhorn и шейдеры 4.0. Что касается технологии 3Dc, то здесь будет все зависет от того, как толково и грамотно будет популяризировать это сама компания ATI. Ведь не секрет, что до многих, особенно мелких разработчиков все возможности и главный козырь - легкость внедрения в игры этой технологии, могут и не добраться. Отрадно, что эта вещь также войдет в DX, будучи уже лицензированной MS, поэтому путь 3Dc может стать проще, чем в свое время у TruForm. За сим мы не прощаемся с вами, будем следить за серийными картами и их ценами и продолжать наши исследования. А там уже и делать более окончательные выводы о том - кто же царь горы 3D на сегодня? В следующем материале мы подробно рассмотрим качественную составляющую, а именно, качество реализации фильтраций, прежде всего, трилинейной. Ибо на сей счет много споров и мнений. Более полные сравнительные характеристики видеокарт этого и других классов вы можете увидеть также в наших 3DGiТогах.
Андрей Воробьев (anvakams@ixbt.com)
Александр Медведев (unclesam@ixbt.com) Опубликовано 18 мая 2004 года |
Обсудить в конференции (комментариев: 64) |
| Комментарии? Поправки? Дополнения? anvakams@ixbt.com
| ![]()
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||