NVIDIA GeForce FX 5950 Ultra, GeForce FX 5700 Ultra, GeForce FX 5700, GeForce FX 5600XT 128bit



СОДЕРЖАНИЕ

  1. Особенности видеокарт
  2. Конфигурации стендов, список тестовых инструментов, качество в 2D
  3. Результаты тестов: Quake3 ARENA (скорость и качество)
  4. Результаты тестов: Serious Sam: The Second Encounter (скорость и качество)
  5. Результаты тестов: Return to Castle Wolfenstein (скорость и качество)
  6. Результаты тестов: Code Creatures DEMO (скорость и качество)
  7. Результаты тестов: Unreal Tournament 2003 (скорость и качество)
  8. Результаты тестов: Unreal II: The Awakening (скорость и качество)
  9. Результаты тестов: RightMark 3D (скорость и качество)
  10. Результаты тестов: TRAOD: Бенчмарк в paris5_4
  11. Результаты тестов: TRAOD: Бенчмарк в paris1c
  12. Результаты тестов: TRAOD: Бенчмарк в paris2g
  13. Результаты тестов: HALO: Combat Evolved (скорость и качество)
  14. Результаты тестов: Half-Life2(beta): бенчмарк ixbt07 (скорость и качество)
  15. Результаты тестов: Half-Life2(beta): бенчмарк coast (скорость и качество)
  16. Выводы


Не так много прошло времени с момента выхода ATI RADEON 9800 XT и 9600 XT, как соперница канадской компании, американка NVIDIA, объявляет о выпуске целой линейки новых продуктов. Читатель наверняка тяжело вздохнет: «Снова разогнали по частотам старое и продают как новое.» И будет почти прав, но все же не на 100%. Почему? — Просто в Middle-сектор NVIDIA выпускает не разогнанный NV31, а переделанный продукт, имеющий кодовое название NV36.

Давайте для начала посмотрим на список того, что нас ждет:

  • NVIDIA GeForce FX 5950 Ultra — бывший NV38, разгон предыдущего решения GeForce FX 5900 Ultra до частот 475/475 (950) МГц (рекомендованная цена — по одним данным $399, по другим — 499), конкурент ATI RADEON 9800 XT;
  • NVIDIA GeForce FX 5700 Ultra — бывший NV36, это «половинка» от NV38, 4 конвейера рендеринга, 4 текстурных блока, 3 вершинных конвейера, частоты 475/450 (900) МГц (рекомендованная цена — $199) конкурент ATI RADEON 9600 XT;
  • NVIDIA GeForce FX 5700 — тот же NV36, но с более низкими частотами 425/275 (550) МГц (рекомендованная цена — $149), конкурент ATI RADEON 9600 или 9600 PRO;
  • NVIDIA GeForce FX 5600XT 128bit — это старый NV31 (FX 5600), выпущенный на более простых PCB с пониженными частотами 230/200 (400) МГц (рекомендованная цена — $99), конкурент ATI RADEON 9600 SE.

Итак, три видеокарты — это новинки, 5600XT — просто замедленный FX5600, призванный потеснить FX5200 по ценам ниже, а также конкурировать с такими решениями от ATI, как RADEON 9600 SE. Впрочем, жесткого позиционирования относительно конкурентов нет, все будет решать цена на тот или иной товар. Ибо уже сейчас трудно четко противопоставлять карты, поскольку, например, рекомендованная цена на FX 5700 находится между ценами на RADEON 9600 и RADEON 9600 PRO. Как и стоимость RADEON 9600 SE вполне может упасть ниже $80, приблизив цену на RADEON 9600 к $100.

Поэтому в нашем материале мы взяли сопоставления, исходя из примерного фактического позиционирования видеокарт на российском рынке. Наиболее полные сравнения вы, как всегда, можете найти в наших будущих 3DGiТогах.

Замечу, что в нашей лаборатории побывали всего ДВЕ видеокарты: 5950 Ultra и 5700 Ultra. Скоростные показатели FX 5700 получены путем снижения частот, как результаты по FX 5600XT 128bit (аналогичное снижение частот у FX 5600). Поэтому должен предупредить, что эти цифры лишь примерный ориентир, хотя, как правило, у NVIDIA-продуктов почти нет расхождений по скоростям, если же одинаковые по архитектуре карты, имеющие разные штатные частоты, протестировать на одной частоте.

Вернемся к NV38. Полагаю, что нет смысла через полгода после выхода NV35 рассказывать заново об архитектуре этого процессора. Желающие могут обо всем узнать в нашем материале. Я напомню лишь кратко основные параметры:

Технические характеристики

  1. Технологическая норма 0.13 микрон, медные соединения
  2. 135 миллионов транзисторов
  3. 3 геометрических процессора (превышают спецификации DX9 VS 2.0)
  4. 4 усовершенствованных конвейеризированных пиксельных процессора. Здесь же вместо также ожидаемого увеличения числа пиксельных процессоров до 8 NVIDIA оставила все те же 4 процессора. Каждый из пиксельных процессоров снабжен: двумя блоками, фильтрующими текстуры, двумя смешанными целочисленными и работающими с плавающей точкой операциями ALU и одним ALU, выполняющим операции только. с плавающей точкой. То есть, всего три операции с плавающей точкой. Такая конфигурация позволяет выполнять до 12 пиксельных операций за такт.
  5. системный интерфейс AGP 3.0 (8х)
  6. 256-битный интерфейс локальной памяти DDR1(!)
  7. Intellisample HCT (High Compression Technology) является развитием Intellisample представленной в NV30 — техники экономии пропускной полосы локальной памяти.
  8. Тайловые оптимизации: кэширования, сжатия и раннего отсечения невидимых поверхностей (Early HSR, Early z Cull)
  9. Технология UltraShadow — увеличивает скорость прорисовки стенсильных теней (называемых так из-за широкого использования стенсил (stencil) буфера при их генерации) за счет ограничения обрабатываемых объектов по глубине сцены.
  10. Поддержка точных целочисленных форматов (10/16 бит на компоненту) и точных плавающих форматов (16 и 32 бита на компоненту) для буфера кадра и текстур (пока только в OpenGL).
  11. Сквозная точность всех операций — 32-бит плавающей арифметики (поддержка т.н. 128-битной глубины цвета)
  12. Новый алгоритм оптимизированной анизотропной фильтрации, будучи активирован пользователем, снижает падение производительности (читай величины fps) без особенного падения качества
  13. Качество анизотропии вплоть до 8х от обычной билинейной фильтрации, т.е. до 32 дискретных отсчетов на одну выборку из текстуры
  14. Гибридные режимы АА — 8х и 6xS
  15. Сжатие буфера кадра позволяет существенно снизить падение производительности при активации FSАА
  16. Два встроенных RAMDAC 400 МГц
  17. Встроенный интерфейс для TV-Out
  18. Встроенные в чип три TMDS-канала для внешних интерфейсных DVI-чипов

Вообще, NV38 — это тот же NV35, просто прошедший более тщательный отбор. Разумеется, за полгода выпуска NV35 инженеры NVIDIA и TSMC сумели отладить производство, и стало возможным при равном с 5900Ultra проценте выхода годных чипов, отбирать уже работающие не на 450, а на 475 МГц. Карту снабдили более быстрой памятью, и продукт готов. Очень вероятно, что выпуск GeForce FX 5900 Ultra вообще будет прекращен, заменой ему станет 5950 Ultra.

А вот NV36 — это где-то новый чип. Посмотрим на сравнение:


  NV36 NV31 NV34
Технология, нм. 130 130 150
Транзисторов, млн. 85 75 47
Пиксельных конвейеров 2/4(1) 2/4(1) 2
Вершинных конвейеров 3 2 1
Текстурных блоков 4 4 4
Частота ядра, Мегагерц 475 (Ultra) 400 (Ultra) 250
Шина памяти, бит 128 (DDR II) 128 (DDR) (2) 128 (DDR)
Частота шины памяти (эфф.) Mегагерц 900 (Ultra) 800 (Ultra) 400
Пиксельные шейдеры 2.0+ 2.0+ 2.0+ (3)
Вершинные шейдеры 2.0+ 2.0+ 2.0+
ПСП, гигабайт в сек. 14.4 12,8 6,4
HSR Да Да Да
Ранний Z тест Да Да Да
Сжатие Z Да Да Да
Сжатие цвета в MSAA режимах До 1:4 До 1:4 Нет
Аппаратный геометрический блок Есть Есть (4) Есть (4)
RAMDAC, Мегагерц 2х400 2х400 2х350
TV-out Встроен Внешний Внешний
DVI Встроен Встроен Встроен
Корпус FCPGA BGA (5) BGA (5)
Внешнее питание Обязательно Желательно (Ultra) Опционально

Примечания:

  1. NV31 может работать по схеме 4х1 (конвейеров × текстурных модулей) или 2х2.
  2. Есть поддержка DDR2
  3. Есть некоторые отличия в возможностях пиксельных шейдеров NV34, относительно NV31, но они как минимум соответствуют 2.0.
  4. Аппаратный геометрический процессор NV31 и NV34 имеет одинаковую (!) вычислительную производительность, меньшую более чем вдвое по сравнению с NV30, а вот у NV36 она выросла засчет трех конвейеров.
  5. Совместим с NV25

Как мы видим, NV36 значительно усилен относительно NV31. Что дает это на деле, мы проверим на тестах. Особо отмечу, что карта на базе GeForce FX 5700 Ultra снабжена DDR-2 (!) памятью! И это при рекомендованной цене в $199! Или же цены на DDR2 так сильно упали, или же NVIDIA нашла какие-то иные источники для снижения себестоимости. Впрочем, это уже речь пошла о конструкциях карт, а об этом ниже.

Вместе с представлением новых семейств видеокарт NVIDIA объявила также новый набор драйверов, в котором наряду с усовершенствованиями общего плана внедрена unified compiler technology — технология оптимизирующего компилятора шейдеров DirectX9. Что же это означает? Исторически, начиная с DirectX8 шейдеры драйверу видеокарты передаются в виде байт-кода, в который компилировались ассемблерные программы. Драйверу оставалось преобразовать полученный байт-код в такой набор инструкций, который напрямую может исполняться видеочипом. При этом свойства пиксельных шейдеров 1.x почти один в один совпадали с возможностями архитектур видеочипов от NVIDIA (ps.1.1 — ps.1.3) и ATI (ps.1.4). С выходом DirectX9 и объявлением пиксельных шейдеров версии 2.0 и выше ситуация изменилась — набор инструкций стал более обобщенным и менее привязанным к архитектуре видеочипов. И именно NVIDIA, как создавшая более функциональный блок исполнения пиксельных шейдеров по сравнению с базовой версией 2.0, сильно пострадала от несовпадения возможностей чипа и набора инструкций. Также из-за усложнения и увеличения длины шейдерных программ, все большее количество разработчиков отказывается от использования ассемблерных программ в пользу компилятора шейдеров с С-подобного языка высокого уровня (HLSL) от Microsoft, который после компиляции выдавал код, далеко не идеальный для видеочипов NVIDIA. Разработчикам стало еще сложнее оптимизировать шейдеры под чипы семейства GeForceFX.

В результате NVIDIA вместо простого интерпретирования шейдерного байт-кода создала еще один компилятор на уровне драйвера, который разбирает байт-код и выполняет множество различных оптимизаций в зависимости от видеочипа, который будет выполнять шейдерную программу.

Рассмотрим некоторые области, в которых выполняются оптимизации:

  1. Перестановка инструкций местами. Например, чипы NVIDIA в 2 раза быстрее выполняют последовательность инструкций tex-tex-alu-alu, по сравнению с tex-alu- tex-alu (tex – текстурная выборка, alu – арифметическая операция).

  2. Уменьшение количества используемых временных регистров. Возможно в двух случаях. Например, в оригинальной программе какой-либо временный регистр используется первую половину шейдерной программы, а во второй половине про него «забывают», в этом случае компилятор NVIDIA будет пытаться задействовать этот регистр и дальше вместо использования дополнительных регистров. Еще одна возможность уменьшения количества используемых временных регистров предоставляется большей гибкостью набора инструкций в NV3x по сравнению со стандартными ps_2_0, в то время как стандартный шейдер вынужден использовать целый четырех-компонентный регистр для хранения одного или двух чисел (из четырех возможных), то для чипов серии NV3x временные регистры всегда будут использованы полноценно (все четыре компоненты регистров будут использоваться).

Что же означает для нас введение в драйвер оптимизируещего компилятора шейдеров? Разработчики смогут писать шейдеры, опираясь на индустриальные стандарты, такие как PS_2_0, а не прилагая титанических усилий (которые могут и не оправдаться) на оптимизацию под конкретное семейство видеочипов, при этом компилятор в драйвере сможет оптимально использовать функциональность чипов семейства GeForceFX. Встроенный в драйвера компилятор также гарантирует, что существующие шейдерные программы будут оптимально выполняться на будущих поколениях видеочипов, правила оптимизации под которые могут кардинально поменяться.

Более детально работа оптимизируещего копилятора будет рассмотрена в наших следующих материалах.

А теперь перейдем к видеокартам.

Платы



NVIDIA GeForce FX 5950 Ultra
NVIDIA GeForce FX 5700 Ultra


Карты имеют интерфейс AGP x8/x4/x2, FX5700 Ultra — 128 МБ памяти DDR-2 SDRAM размещенной в 8-ми микросхемах на лицевой и оборотной сторонах PCB; FX5950 Ultra — 256 МБ памяти DDR SDRAM размещенной в 16-ти микросхемах на лицевой и оборотной сторонах PCB.
NVIDIA GeForce FX 5950 Ultra
Микросхемы памяти производства Hynix. Время выборки у микросхем памяти 2 ns, что соответствует частоте работы 500 (1000) МГц, память же работает на частоте 475 (950) МГц. Частота работы GPU — 475 MHz. Шина обмена с памятью — 256 bit.
NVIDIA GeForce FX 5700 Ultra
Микросхемы памяти Samsung (GDDR2). Время выборки у микросхем памяти 2.2 ns, что соответствует частоте работы 450 (900) МГц, на которой память и работает. Частота работы GPU — 475 MHz. Шина обмена с памятью — 128 bit.


Сравнение с эталонным дизайном, вид спереди
NVIDIA GeForce FX 5950 Ultra Reference card NVIDIA GeForce FX 5900 Ultra
NVIDIA GeForce FX 5700 Ultra Reference card NVIDIA GeForce FX 5600 Ultra


Сравнение с эталонным дизайном, вид сзади
NVIDIA GeForce FX 5950 Ultra Reference card NVIDIA GeForce FX 5900 Ultra
NVIDIA GeForce FX 5700 Ultra Reference card NVIDIA GeForce FX 5600 Ultra


В конце сравнений приведу фотографию эталонной карты на базе GeForce FX 5700:

Очевидно, что эта карта выполнена на дизайне, близком к FX 5600, а, судя по спецификациям, снабжаться будет 3.6ns памятью в упаковке TSOP.

Вернемся к FX5950 Ultra. Мы видим, что дизайн лишь слегка изменен (относительно FX 5900 Ultra) в части, где размещен блок питания. Видеокарта получилась снова весьма громоздкой, благодаря системе охлаждения.

Интересно сравнить габариты двух флагманов сегодняшней 3D-графики (сверху RADEON 9800 XT, снизу — GeForce FX 5950 Ultra):

Кому-то может показаться, что идет возврат к системе охлаждения FlowFX, сильно испортившей в свое время имидж у NV30. Снова первый слот PCI занят…

Однако, все же, это другой кулер. Давайте посмотрим на него ближе:

Итак, можно сразу заметить, что захват воздуха идет изнутри системного блока, с тыльной стороны радиатора, то есть поток воздуха не меняет своего направления, что было во FlowFX. Это и является главной причиной того, что кулер относительно тихий, несмотря на мощную турбину. Разумеется, все же некоторый шум есть, ведь обороты вентилятора немалые, плюс поток воздуха все же идет через раструб.

Кому интересно посмотреть на систему охлаждения, так сказать, изнутри, мы приведет все шаги по ее сборке:













В заключении рассмотрения особенностей карты на базе NV38, продемонстрируем сам процессор:

Обратим внимание на то, что чип был сделан на 27-й неделе 2003 года, то есть в середине лета. Плюс видно, что надпись «5950» просто добавлена сверху. Это все лишний раз доказывает, что перед нами тот же GeForce FX 5900 Ultra, но гарантированно работающий на частоте 475 МГц.

Карта оборудована кодером Philips 7108, отвечающим за VIVO:

Это уже все стандартно, и качество мультимедийных функций такого рода мы рассматривали ранее (милости просим в раздел Видеосистема).

Теперь рассмотрим NV36, ибо по своей конструкции эта карта более интересна. Ранее мы уже увидели, что PCB у GeForce FX 5700 Ultra особенная и только какими-то чертами схожа с GeForce FX 5600 Ultra. Повторю, что на карте установлена GDDR2 память, а не привычная DDR. Такие микросхемы, только более быстрые, мы уже видели ранее на GeForce FX 5800/5800 Ultra.

Опытные читатели хорошо помнят, насколько была сложна та PCB, что NVIDIA вынуждена заказывать эти карты у сторонних производителей, и партнеры уже получали по сути готовые карты. Здесь ситуация может быть и несколько проще, но сложность PCB весьма велика, ведь GDDR2 требует тщательного оберегания от наводок:

Прекрасно видно, что та часть карты, где расположена память, имеет сплошной экран по обеим сторонам PCB. И снова интересный вопрос: мы помним жутко высокую себестоимость карт на базе NV30, когда тут все похоже: и GDDR2, и 128бит шина, и экранирование PCB. Да и частоты работы близки к NV30. Однако рекомендованная цена — $199. Не верится, что за полгода цены на все компоненты упали в 2 раза… Или тогда все же карты были не столь дороги (а пытались завуалировать это, снимая сверхприбыль), или ныне NVIDIA такие цены ставит себе в убыток.

Опять же, малопонятно — зачем для частот 450 (900) МГц использовать более дорогую и требующую также более дорогой обвязки память GDDR2? Когда есть 2.2ns память и DDR (на том же GeForce FX 5900 именно она и используется). GDDR2 стала дешевле, чем DDR? — Не верится. Оставим этот вопрос открытым, ибо на него пока нет ответа.

Рассматривая карту дальше, заметим, что система охлаждения весьма компактная, и потому карта занимает всего один слот:

А само охлаждение карты осуществляется с помощью двух кулеров: переднего и заднего.



Очень понравилось надежное и тщательно продуманное крепление системы охлаждения. Также могу отметить, что кулер весьма тихий и не раздражает своим присутствием.

Раз снимали кулер, то грех не посмотреть на чип.



Мы впервые видим процессор в упаковке FCPGA со снятой крышкой в исполнении NVIDIA. Напомню, что я проводил опыты на GeForce FX 5600 Ultra по снятию крышки с чипа, вследствие чего он смог легко работать на 500 МГц (штатная частота 400 МГц). Вероятно, инженеры NVIDIA пришли к аналогичному выводу, что охлаждение кристалла напрямую кулером способствует увеличению эффективности убирания последствий нагрева.

И еще один штрих к портрету: NV36 произведен уже на мощностях IBM, и, по словам представителей NVIDIA, уже первая же ревизия кристалла оказалась полноценно рабочей. Короче, пока NVIDIA очень довольна сотрудничеством с IBM.

Что касается разгона, то кратко скажу, что NV38 смогла заработать на частотах 520/1050 МГц, а вот разгон NV36 потрясает воображение: 600/1100 МГц! То есть, и чип имеет очень большой потенциал (вероятно для работы на частоте 475 МГц процент отбора годных очень велик), и PCB грамотно сделана, ибо жутко греющаяся GDDR2 память смогла без проблем пойти на частоте, на 100 МГц превышающей ее номинал. Разумеется, все разгоны производились при наличии дополнительного вентилятора, обдувающего карты. Я уже много раз писал в обзорах об этом.

[ Следующая часть (2) ]





Дополнительно

iXBT BRAND 2016

«iXBT Brand 2016» — Выбор читателей в номинации «Процессоры (CPU)»:
Подробнее с условиями участия в розыгрыше можно ознакомиться здесь. Текущие результаты опроса доступны тут.

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.