Бородинская битва между ATI RADEON X800 XT и NVIDIA GeForce 6800 Ultra

Картина Вторая: 450 МГц NV40 и новые тесты обеих карт



СОДЕРЖАНИЕ

  1. Введение
  2. Особенности видеокарт
  3. Конфигурации стендов, список тестовых инструментов
  4. Синтетические тесты в D3D RightMark
  5. Результаты тестов: Quake3 ARENA
  6. Результаты тестов: Serious Sam: The Second Encounter
  7. Результаты тестов: Return to Castle Wolfenstein
  8. Результаты тестов: Code Creatures DEMO
  9. Результаты тестов: Unreal Tournament 2003
  10. Результаты тестов: Unreal II: The Awakening
  11. Результаты тестов: RightMark 3D
  12. Результаты тестов: TRAOD
  13. Результаты тестов: FarCry (скорость и качество)
  14. Результаты тестов: Call Of Duty
  15. Результаты тестов: HALO: Combat Evolved
  16. Результаты тестов: Half-Life2(beta)
  17. Результаты тестов: Splinter Cell
  18. Результаты тестов: Colin Mcrae Rally04 (скорость и качество)
  19. Результаты тестов: Max Payne-2 (скорость и качество)
  20. Результаты тестов: Painkiller (скорость и качество)
  21. Результаты тестов: Need For Speed: Underground (скорость и качество)
  22. Результаты тестов: Пираты Карибского моря (качество)
  23. Результаты тестов: Vietcong (качество)
  24. Результаты тестов: 3DMark03-Game1
  25. Результаты тестов: 3DMark03-Game2
  26. Результаты тестов: 3DMark03-Game3
  27. Результаты тестов: 3DMark03-Game4
  28. Результаты тестов: 3DMark03-MARKS
  29. Результаты тестов: AquaMark3
  30. Driver NVIDIA version 61.11
  31. Выводы


Совсем немного времени прошло с тех пор, как прогремели анонсы новых High-End продуктов от NVIDIA (13 апреля) и ATI (4 мая). Обе новинки мы уже достаточно подробно рассмотрели в наших материалах:

Теоретико-аналитические материалы и обзоры видеокарт, в которых рассматриваются функциональные особенности GPU ATI RADEON X800 (R420) и NVIDIA GeForce 6800 (NV40)

В последнем обзоре по R420 я написал, что впереди нас ждет изучение работы новых супер-мощных ускорителей на современных играх, которых среди ранее проведенных тестов было не так много.

На примерах старых тестов мы убедились в том, что все новые акселераторы очень сильно зависят от центрального процессора и производительности системы в целом, полностью упираясь в них даже при максимальных нагрузках АА и анизотропией. Вывод ясен: если даже найдутся такие, кто захочет отдать немалые деньги за суперускоритель для того, чтобы продолжать использовать его в старых и любимых играх, то ему надо обновить всю систему, иначе толку от такой покупки будет немного.

Вкратце: какие основные вещи мы узнали, исследовав новинки?

Прежде всего, это удвоение числа конвейеров у RADEON X800 XT, по сравнению с 9800XT, плюс увеличение частоты работы. Все это дало прирост производительности в 2 раза, при максимальной нагрузке акселератора (разумеется, в современных играх). Заметим, что не на 15-20-25%, как было ранее, а в 2 раза! А подчас и даже больше.

Прирост возможностей и производительности у GeForce 6800 Ultra относительно предшественника GeForce FX 5950 Ultra, вообще потрясает воображение! Поскольку число пиксельных конвейеров выросло в 4(!) раза, а текстурников и вершинных конвейеров — в 2 раза! Плюс прибавить к этому отличную работу инженеров NVIDIA над ускорением работы шейдерных блоков, и новый продукт обгоняет своего предшественника подчас просто с феноменальным отрывом! Несмотря на то, что частота получилась ниже (400 против 475 МГц).

И если раньше мы могли говорить о том, что NV38 дотягивает до R360 только в старых играх (подчас OpenGL, где конек у драйверов от NVIDIA), да и то с помощью подпорок из оптимизаций и т.п., то теперь оба новых продукта выступают с равными весовыми категориями и полноценно конкурируют друг с другом.

Означает ли это, что война «оптимизаций» и подгонки под скорость за счет снижения качества подошла к концу? — Хочется надееться, но есть и сомнения в обратном.

Разумеется, полезные (благие) оптимизации в драйверах, например, правящие ошибки разработчиков, будут и дальше иметь место, и это только надо поощрять.

Сегодня мы рассмотрим три аспекта:

  1. Работу GeForce 6800 Ultra на 450 МГц (и сравнение с 400 МГц вариантом, а также с RADEON X800 XT).
  2. Сравнение версии драйверов NVIDIA 61.11 с ранее использованной 60.72.
  3. Исследование работы GeForce 6800 и RADEON X800 на некоторых современных играх, ранее не принимавших участия в наших тестах.

Что касается первого пункта, то здесь пока нет определенной ясности в том, какие карты пойдут в серию: 400 или 450 МГц. Есть мнение, что более ускоренное решение все же пойдет в очень ограниченном количестве, и на его базе 2-3 вендора выпустят особые карты, типа Golden Sample от Gainward. А все остальные 6800 Ultra будут на 400 МГц (уже появившиеся в США заказы на поставки таких изделий от eVGA явно говорят о том, что в продажу пойдут 400 МГц-карты).

А по второму пункту надо проверить: будет ли прирост по скорости у NV40, и за счет чего. Ну и заодно протестировать надежность и стабильность этой версии.

Итак, кратко напомню, что за карты рассматриваем.

Платы



ATI RADEON X800 XT NVIDIA GeForce 6800 Ultra


Оба продукта представляют собой reference cards, то есть предсерийные образцы. Мы еще будем рассматривать и серийные изделия, но это позже.

Напомню, то обе карты имеют по 256 мегабайт памяти GDDR3 со временем выборки 1.6 ns, при этом у NV40 частота по памяти — 550 (1100) МГц, а у R420 — 575 (1150) МГц. Частоты работы чипов: NV40 — 400 и 450 МГц, R420 — 525 МГц. Оба GPU содержат по 16 пиксельных и 6 вершинных конвейеров. NV40 поддерживает еще версию шейдеров 3.0, а R420 — собственную технология сжатия карт нормалей — 3Dc. Вот кратко и все.

Для визуальной и очень примерной оценки возможностей по разгону неплохо бы привести снова снимок, где представлены оба чипа: NV40 и R420:

Мы заметим, что размер кристалла у NV40 самый большой (что и не удивительно при его 222 млн. транзисторов), однако, как показал опыт, все же отдельные экземпляры могут разгоняться с 400 до 450 МГц. Например, наша карта при использовании термопасты с содержанием серебра, смогла заработать на таких частотах при наличии всего небольшого дополнительного вентилятора, обеспечивающего поток холодного воздуха на турбину родного кулера от видеокарты. Конечно, это ни о чем не говорит насчет процента GPU, способных гарантированно работать на 450 МГц, но все же показательно. Хотя, пока по Сети ходят слухи, что процент выхода мал, и на 450 МГц работать будут считанные отобранные чипы. Как будет на самом деле — покажет время.

Насчет разгонов X800 XT пока ничего не могу сказать, во время тестирования у карты был BIOS, запрещающий разгон по чипу. Этот вопрос мы будем еще исследовать дальше. Хотя, надо сказать, что последняя бета-версия RivaTuner (автор Алексей Николайчук AKA Unwinder) уже поддерживает X800 в полном объеме, показывая не только число пиксельных конвейеров, но и осуществляя мониторинг по температуре:

Сейчас автор совместно с нами работает над патчем к драйверам, позволяющим менять число конвейеров, включая ранее заблокированные (как было у RADEON 9500/9700; 9800SE/9800). Пока есть проблемы (сотрудник ATI не обманул меня, говоря о том, что так просто поменять число конвейеров программным путем уже не удастся), стоят защиты. Но работа ведется и время покажет! :-)

Установка и драйверы

Конфигурации тестовых стендов:

  • Компьютер на базе Pentium 4 3200 MHz: — использовался для тестирования в синтетике
    • процессор Intel Pentium 4 3200 МГц;
    • системная плата ASUS P4C800 Delux на чипсете i875P;
    • оперативная память 1024 MB DDR SDRAM;
    • жесткий диск Seagate Barracuda IV 40GB;
  • Компьютер на базе Athlon 64 3200+: — использовался для тестирования в играх
    • процессор AMD Athlon 64 3200+ (L2=1024K);
    • системная плата ASUS K8V SE Deluxe на чипсете VIA K8T800;
    • оперативная память 1 GB DDR SDRAM PC3200;
    • жесткий диск Seagate Barracuda 7200.7 80GB SATA.
  • операционная система Windows XP SP1; DirectX 9.0b;
  • мониторы ViewSonic P810 (21") и Mitsubishi Diamond Pro 2070sb (21").
  • драйверы ATI версии 6.444 (CATALYST 4.5); NVIDIA версии 60.72 и 61.11.

VSync отключен

Синтетические тесты D3D RightMark

Использованная нами версия пакета синтетических тестов D3D RightMark Beta 4 (1050) и ее описание доступны на сайте 3d.rightmark.org

Еще раз отмечу, что все тесты в RightMark снимались на компьютере на базе Pentium4.

Все тесты включают в себя результаты из обзоров NV40 на частоте 400МГц и обзора R420, поэтому мы прокомментируем только отличия и характер поведения NV40 с ядром 450МГц. Итак:

Тест Pixel Filling

Пиковая производительность выборки текстур (texelrate), режим FFP, для разного числа текстур накладываемых на один пиксель:

В случае одной и двух текстур NV40-450 вполне предсказуемо упирается в пропускную способность памяти, а точнее скорость работы с буфером кадра. По мере роста числа текстур преимущество более высокой частоты ядра начинает проявляться, но никаких кардинальных изменений в расклад сил не вносит — R420 лидер.

А сейчас — скорость закраски буфера кадра (fillrate, pixelrate), режим FFP, для разного числа текстур накладываемых на один пиксель:

Та же самая ситуация.

Посмотрим, как скорость закраски зависит от версии шейдеров:

Ничего нового.

Итак, 450 МГц не внесли существенных изменений в расклад сил в этом тесте. Вполне логично — до 525 МГц им все еще далеко.

А теперь посмотрим, как текстурные модули справляются с кэшированием и билинейной фильтрацией реальных текстур различных размеров:

Различия есть, но их сложно назвать существенными. Полоса пропускания памяти и алгоритм фильтрации определяют в этом тесте больше, чем 50 МГц прирост ядра.

А теперь посмотрим на зависимость производительности текстурных модулей от формата текстур:

Больше размер:

Вновь ничего нового или удивительного.

Итак, можно констатировать отсутствие существенных отличий.

Тест Geometry Processing Speed

Самый простой шейдер – предельная пропускная способность по треугольникам:

Заметный прирост, причем теперь NV40-450 становится лидером. Интересно, что скачок на вершинных шейдерах превышает разницу частоты — сказались новые драйверы — на лицо лучшая оптимизация коротких вершинных шейдеров. Посмотрим, сохранится ли этот скачкообразный прирост на более сложных задачах.

Более сложный шейдер – один простой точечный источник света:

Сюрпризы исчезли. Оптимизация коснулась только пиковой пропускной способности, на более-менее стандартной задаче она себя уже так не проявит. Как бы там ни было, результат вершинных шейдеров не зависит так сильно от пропускной полосы памяти, и потому увеличился пропорционально частоте ядра.

Усложняем задачу далее:

Здесь NV40 FFP лидер, несмотря на частотное преимущество ATI. Но общая картина по-прежнему скалывается скорее в пользу ATI — выше частота ядра — больше скорость вершинных шейдеров.

А теперь самая сложная задача, три источника света, причем, для сравнения в вариантах без переходов, со статическим и динамическим управлением исполнением:

FFP силен, а статические переходы заметно ударяют по чипам NVIDIA. Парадокс в том, что динамические переходы на чипах от NVIDIA выгоднее статических. Общая картина вновь в пользу R420, везде, где дело не касается FFP…

Вывод — вновь никаких сюрпризов. Вершинные шейдеры масштабируются строго пропорционально частоте ядра — сказывается отсутствие сильной зависимости от пропускной полосы памяти.

Тест Pixel Shaders

Первая группа шейдеров – достаточно простых для исполнения в реальном времени, 1.1, 1.4 и 2.0:

Мы видим, что NV40 на частоте 450 МГц работает быстрее. Но, недостаточно быстрее — лидер по пиксельным шейдерам игровой сложности прежний — R420.

Посмотрим, сможет ли спасти положение NV40 использование 16 битной точности плавающих чисел:

Преимущество 16 битной точности для NV40 есть, в некоторых шейдерах больше, в некоторых меньше. Порою, оно позволяет догнать R420 (не забываем про возможные артефакты пониженной точности — см. игровую секцию обзора) но не отыграть у него пальму первенства. Частота и еще раз частота.

А теперь посмотрим на действительно сложный, «кинематографичный» шейдер 2.a в силу небольшого числа зависимых выборок уложившийся в ограничения пиксельных конвейеров R420:

Пропорционально быстрее. Теперь NV40-450 выигрывает у R420, но только в случае использования 16 битной точности.

Итого, по пиксельным шейдерам: 450 МГц позволяют, порой, выровнять производительность с R420. Но не демонстрируют того, что можно было бы назвать четким лидерством.

Тест HSR

Пиковая эффективность (без текстур и с текстурами) в зависимости от сложности геометрии:

Картина практически идентична, небольшие отличия в эффективности 450 МГц варианта NV40 вызваны иным соотношением частот ядра и памяти.

Тест Point Sprites.


Интересно, что в новых драйверах NVIDIA кардинально исправлено досадное падение производительности, которое мы наблюдали на малых размерах спрайтов!

ВЫВОДЫ

  1. Увеличение частоты не меняет картину кардинально.
  2. В некоторых областях оно позволяет NV40 сравниться с R420, но, в общем и целом, последний остается лидером.
  3. В новых драйверах успешно исправлено несколько досадных моментов, которые, видимо, не были связаны с железом.

То есть, даже 450 МГц не дает твердой победы NV40 в области синтетических тестов.

[ Следующая часть (2) ]





Дополнительно

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.