NVIDIA GeForce FX 5800 Ultra 128MB


"Если долго мучиться, что-нибудь получится"
(А.Пугачева)


Как обычно, предваряя большой базовый материал анализа работы нового акселератора, мы настоятельно рекомендуем прочитать аналитическую статью, посвященную архитектуре и спецификациям NVIDIA GeForce FX (NV30)

СОДЕРЖАНИЕ

  1. Общие сведения
  2. Особенности видеокарты NVIDIA GeForce FX 5800 Ultra 128MB
  3. Конфигурации тестовых стендов и особенности настроек драйверов
  4. Результаты тестов: коротко о 2D
  5. Синтетические тесты RightMark3D: идеология и описание тестов
  6. Результаты тестов: RightMark3D: Pixel Filling
  7. Результаты тестов: RightMark3D: Geometry Processing Speed
  8. Результаты тестов: RightMark3D: Hidden Surface Removal
  9. Результаты тестов: RightMark3D: Pixel Shading
  10. Результаты тестов: RightMark3D: Point Sprites
  11. Результаты тестов: Синтетические тесты 3DMark2001 SE
  12. Дополнительная теоретическая информация и выводы из результатов синтетических тестов
  13. Информация по анизотропной фильтрации и по анти-алиасингу
  14. Архитектурные особенности и перспективы
  15. Результаты тестов: Игровые тесты 3DMark2001 SE: Game1
  16. Результаты тестов: Игровые тесты 3DMark2001 SE: Game2
  17. Результаты тестов: Игровые тесты 3DMark2001 SE: Game3
  18. Результаты тестов: Игровые тесты 3DMark2001 SE: Game4
  19. Результаты тестов: Игровые тесты 3DMark03: Game1
  20. Результаты тестов: Игровые тесты 3DMark03: Game2
  21. Результаты тестов: Игровые тесты 3DMark03: Game3
  22. Результаты тестов: Игровые тесты 3DMark03: Game4
  23. Результаты тестов: Quake3 ARENA
  24. Результаты тестов: Serious Sam: The Second Encounter
  25. Результаты тестов: Return to Castle Wolfenstein
  26. Результаты тестов: Code Creatures DEMO
  27. Результаты тестов: Unreal Tournament 2003 DEMO
  28. Результаты тестов: AquaMark
  29. Результаты тестов: RightMark 3D
  30. Результаты тестов: DOOM III Alpha version
  31. Качество 3D: Анизотропная фильтрация
  32. Качество 3D: Анти-алиасинг
  33. Качество 3D в целом
  34. Выводы

Архитектурные особенности и перспективы

Итак, подведем краткий итог по детальному исследованию различных блоков NV30 с помощью синтетических тестов, а также немного заглянем в будущее.

Слабые стороны Сильные стороны
Узкая шина памяти (сказывается на FSAA) Высокая скорость вершинных вычислений, там где это не касается циклов и условий
Низкая скорость пиксельных вычислений, а также схема 4x2 в большинстве игр Высокая скорость выборки и фильтрации текстур
Расплата за гибкость — снижение скорости вершинных вычислений на циклах и переходах Значительно ускоренная анизотропная фильтрация

В первую очередь NVIDIA следует устранить самое узкое место — пропускную полосу 128 битной шины. Очень вероятно, что следующий топовый продукт — NV35 будет снабжен 256 битной DDR2 шиной, и один этот факт способен поднять его производительность в реальных приложениях в режимах с FSAA в полтора раза (!). А вот низкая скорость пиксельных вычислений видимо будет устранена только в NV40 — чрезвычайных перемен в архитектуре пиксельных конвейеров у NV31/34 или 35 не предвидится. Скорее всего, будут задействованы те же блоки. Хотя есть данные, что и в NV35 будут существенные улучшения в этой области (поживем — увидим). Также последняя информация о том, что в большинстве задач ныне чип работает как 4х2, а не 8х1, влияет на скорость пиксельных операций.

Можно похвалить NVIDIA за две вещи — чрезвычайно эффективные текстурные блоки, особенно хорошо справляющиеся с задачей интенсивной выборки множества текстур, и существенно возросшую эффективность анизотропной фильтрации. Еще один приятный пункт — наконец то в наличии реально действующий HSR.

Ну, и наконец, следует посетовать на то, что ничего в этом мире не дается бесплатно. Дополнительная функциональная гибкость заложенная в вершинные (дианмические переходы и циклы) и пиксельные (длинные шейдеры и большое число констант, а также предикаты) процессоры, заставила расплатиться производительностью. И если в случае вершинных это не так заметно, то в случае пиксельных — может послужить слабым местом архитектуры в будущих приложениях. С другой стороны, только такая гибкость пиксельных процессоров может открыть этому чипу дорогу в Голливуд (реалистические эффекты и рендеринг "почти в реальном времени"). Что ж, будем надеяться, что выход новых драйверов способен улучшить ситуацию с пиксельными шейдерами. Также, как и с вершинными 2.0. Это будет важно не только для NV30, но и для всех чипов архитектуры NV3х, мейнстрим представители которых (NV31/34) получат широкое распространение и обречены на долгую жизнь.

3D-графика, 3DMark2001 — игровые тесты



3DMark2001, 3DMARKS

Как и следовало ожидать, мы видим у GF FX подчас прогрыш в тяжелых режимах АА, но в целом перевес на стороне детища NVIDIA, особенно в самом тяжелом режиме: АА плюс анизотропия. Да, более быстрая анизотропка очень помогает.

Если кто хочет проценты перевести в "разы", то надо к процентам прибавить 100 и все разделить на 100.



3DMark2001, Game1 Low details

Мы видим очень хороший результат при работе с анизотропией, небольшой перевес без нагрузок и прекрасную победу над R9700Pro в самом тяжелом режиме АА с анизотропкой. Разумеется, АА 6xS показал хилость ПСП у NV30, вследствие чего провал.



3DMark2001, Game2 Low details

Несмотря на успех при работе с анизотропной фильтрацией, в целом перевес очень мал, а в высоких разрешениях и вовсе поражение в тяжелых режимах (очевидно, что вниз тянет проигрыш с АА).



3DMark2001, Game3 Low details

Картина аналогичная.



3DMark2001, Game4

А вот здесь для NV30 все весьма радужно (кроме плачевной ситуации с тем же AA 6xS — разумеется, виновато смешение более быстрого MSAA и крайне тормозного SSAA).

Подводя итоги тестированию в 3DMark2001SE, можно сказать, что в целом NV30 показал неплохие результаты. Разумеется, мы все ожидали большего, учитывая разницу в тактовых частотах, однако то бремя "бутылочного горла", которое снова одела на свой продукт NVIDIA, сказывается и весьма фатально. Где же обещанное сжатие буфера кадра при АА, и супер-скорости? Пока, увы, оно видно разве лишь в режиме 4х. Впрочем, на сегодня и такого режима вполне достаточно. А на качество мы посмотрим ниже.





Дополнительно

Обзор NVIDIA GeForce FX 5800 Ultra 128MB

NVIDIA GeForce FX 5800 Ultra 128MB

"Если долго мучиться, что-нибудь получится"
(А.Пугачева)


Как обычно, предваряя большой базовый материал анализа работы нового акселератора, мы настоятельно рекомендуем прочитать аналитическую статью, посвященную архитектуре и спецификациям NVIDIA GeForce FX (NV30)

СОДЕРЖАНИЕ

  1. Общие сведения
  2. Особенности видеокарты NVIDIA GeForce FX 5800 Ultra 128MB
  3. Конфигурации тестовых стендов и особенности настроек драйверов
  4. Результаты тестов: коротко о 2D
  5. Синтетические тесты RightMark3D: идеология и описание тестов
  6. Результаты тестов: RightMark3D: Pixel Filling
  7. Результаты тестов: RightMark3D: Geometry Processing Speed
  8. Результаты тестов: RightMark3D: Hidden Surface Removal
  9. Результаты тестов: RightMark3D: Pixel Shading
  10. Результаты тестов: RightMark3D: Point Sprites
  11. Результаты тестов: Синтетические тесты 3DMark2001 SE
  12. Дополнительная теоретическая информация и выводы из результатов синтетических тестов
  13. Информация по анизотропной фильтрации и по анти-алиасингу
  14. Архитектурные особенности и перспективы
  15. Результаты тестов: Игровые тесты 3DMark2001 SE: Game1
  16. Результаты тестов: Игровые тесты 3DMark2001 SE: Game2
  17. Результаты тестов: Игровые тесты 3DMark2001 SE: Game3
  18. Результаты тестов: Игровые тесты 3DMark2001 SE: Game4
  19. Результаты тестов: Игровые тесты 3DMark03: Game1
  20. Результаты тестов: Игровые тесты 3DMark03: Game2
  21. Результаты тестов: Игровые тесты 3DMark03: Game3
  22. Результаты тестов: Игровые тесты 3DMark03: Game4
  23. Результаты тестов: Quake3 ARENA
  24. Результаты тестов: Serious Sam: The Second Encounter
  25. Результаты тестов: Return to Castle Wolfenstein
  26. Результаты тестов: Code Creatures DEMO
  27. Результаты тестов: Unreal Tournament 2003 DEMO
  28. Результаты тестов: AquaMark
  29. Результаты тестов: RightMark 3D
  30. Результаты тестов: DOOM III Alpha version
  31. Качество 3D: Анизотропная фильтрация
  32. Качество 3D: Анти-алиасинг
  33. Качество 3D в целом
  34. Выводы

Архитектурные особенности и перспективы

Итак, подведем краткий итог по детальному исследованию различных блоков NV30 с помощью синтетических тестов, а также немного заглянем в будущее.

Слабые стороны Сильные стороны
Узкая шина памяти (сказывается на FSAA) Высокая скорость вершинных вычислений, там где это не касается циклов и условий
Низкая скорость пиксельных вычислений, а также схема 4x2 в большинстве игр Высокая скорость выборки и фильтрации текстур
Расплата за гибкость — снижение скорости вершинных вычислений на циклах и переходах Значительно ускоренная анизотропная фильтрация

В первую очередь NVIDIA следует устранить самое узкое место — пропускную полосу 128 битной шины. Очень вероятно, что следующий топовый продукт — NV35 будет снабжен 256 битной DDR2 шиной, и один этот факт способен поднять его производительность в реальных приложениях в режимах с FSAA в полтора раза (!). А вот низкая скорость пиксельных вычислений видимо будет устранена только в NV40 — чрезвычайных перемен в архитектуре пиксельных конвейеров у NV31/34 или 35 не предвидится. Скорее всего, будут задействованы те же блоки. Хотя есть данные, что и в NV35 будут существенные улучшения в этой области (поживем — увидим). Также последняя информация о том, что в большинстве задач ныне чип работает как 4х2, а не 8х1, влияет на скорость пиксельных операций.

Можно похвалить NVIDIA за две вещи — чрезвычайно эффективные текстурные блоки, особенно хорошо справляющиеся с задачей интенсивной выборки множества текстур, и существенно возросшую эффективность анизотропной фильтрации. Еще один приятный пункт — наконец то в наличии реально действующий HSR.

Ну, и наконец, следует посетовать на то, что ничего в этом мире не дается бесплатно. Дополнительная функциональная гибкость заложенная в вершинные (дианмические переходы и циклы) и пиксельные (длинные шейдеры и большое число констант, а также предикаты) процессоры, заставила расплатиться производительностью. И если в случае вершинных это не так заметно, то в случае пиксельных — может послужить слабым местом архитектуры в будущих приложениях. С другой стороны, только такая гибкость пиксельных процессоров может открыть этому чипу дорогу в Голливуд (реалистические эффекты и рендеринг "почти в реальном времени"). Что ж, будем надеяться, что выход новых драйверов способен улучшить ситуацию с пиксельными шейдерами. Также, как и с вершинными 2.0. Это будет важно не только для NV30, но и для всех чипов архитектуры NV3х, мейнстрим представители которых (NV31/34) получат широкое распространение и обречены на долгую жизнь.

3D-графика, 3DMark2001 — игровые тесты



3DMark2001, 3DMARKS

Как и следовало ожидать, мы видим у GF FX подчас прогрыш в тяжелых режимах АА, но в целом перевес на стороне детища NVIDIA, особенно в самом тяжелом режиме: АА плюс анизотропия. Да, более быстрая анизотропка очень помогает.

Если кто хочет проценты перевести в "разы", то надо к процентам прибавить 100 и все разделить на 100.



3DMark2001, Game1 Low details

Мы видим очень хороший результат при работе с анизотропией, небольшой перевес без нагрузок и прекрасную победу над R9700Pro в самом тяжелом режиме АА с анизотропкой. Разумеется, АА 6xS показал хилость ПСП у NV30, вследствие чего провал.



3DMark2001, Game2 Low details

Несмотря на успех при работе с анизотропной фильтрацией, в целом перевес очень мал, а в высоких разрешениях и вовсе поражение в тяжелых режимах (очевидно, что вниз тянет проигрыш с АА).



3DMark2001, Game3 Low details

Картина аналогичная.



3DMark2001, Game4

А вот здесь для NV30 все весьма радужно (кроме плачевной ситуации с тем же AA 6xS — разумеется, виновато смешение более быстрого MSAA и крайне тормозного SSAA).

Подводя итоги тестированию в 3DMark2001SE, можно сказать, что в целом NV30 показал неплохие результаты. Разумеется, мы все ожидали большего, учитывая разницу в тактовых частотах, однако то бремя "бутылочного горла", которое снова одела на свой продукт NVIDIA, сказывается и весьма фатально. Где же обещанное сжатие буфера кадра при АА, и супер-скорости? Пока, увы, оно видно разве лишь в режиме 4х. Впрочем, на сегодня и такого режима вполне достаточно. А на качество мы посмотрим ниже.