NVIDIA GeForce FX 5900 Ultra 256MB

"Король умер — да здравствует король!"

СОДЕРЖАНИЕ

Общие сведения

Не хочется банальных фраз вроде "Пришла весна, началось обострение…", гм, что-то не то. "Пришла весна, и начался вылет на свет Божий новых ускорителей." Право же, и так понятно, что каждая новинка будет сопровождаться тоннами красивых слов, высокими материями из 3D-функциональности, и скриншотами из прекрасно выглядящих игр из… будущего.

А нам, по совести, очень жалко тех, кто уже потратил кровные свои деньги на супер-ускоритель GeForce FX 5800 Ultra, а ведь это подчас выше $500 (когда я посмотрел на цены на такие продукты от Gainward в ряде фирм в Москве, то мне стало нехорошо). Да-да, снова NVIDIA их обманула. Или не обманула? Разговоры о скором выходе NV35 давно ведутся, но ведь это разговоры. Официально компания не обещала и не расписывалась в том, что не стоит покупать NV30, когда вскоре будут улучшенные версии.

И вот, как только в продаже начали появляться обещанные еще перед Новым Годом, видеокарты на базе GeForce FX 5800/Ultra, бац, и анонс. Да еще выступление президента NVIDIA, где он, неделю назад, обещал выход NV35 и назвал NV30 ошибкой и неудачным продуктом. А как быть тем, кто уже купил этот "неудачный" продукт? Бесплатно на NV35 его никто не обменяет. Поэтому мы можем лишь посочувствовать тем, кто уже купился на красивые слова и манящие жесты "эльфийки".

Хотя, по сути, NV35 — это не одна карта, а опять линейка. Ходят разговоры, что будет три карты, однако пока есть достоверные сведения только о двух:

GeForce FX 5900 Ultra — 450 МГц чип, 256 Мбайт 425 МГц (DDR 850) 256 бит шина локальной памяти ($499);
GeForce FX 5900 — 450 МГц чип, 128 Мбайт 425 МГц (DDR 850) 256 бит шина локальной памяти ($399);
GeForce FX 5??? — 425? МГц чип, 128? Мбайт 400? МГц (DDR 800?) 256 бит шина локальной памяти ($299);

Вообще-то, спецификации GF FX 5900 также еще могут меняться. Пока мы имеем на сегодня самый быстрый ускоритель от NVIDIA — GeForce FX 5900 Ultra, ранее имевший кодовое название NV35.

Столь малое изменение в номере от названия карты наводит на мысли, что изменений у 5900 по сравнению с 5800 не так уже и много. Однако, судя по частотам, разгона не было, более того, частоты даже снижены относительно NV30. Только добавлена 256-битная шина? В общем, будем разбираться.

Одно понятно: NV35 — это не выпуск просто новой линейки, которая (как ранее было) смещает с трона предыдушие продукты, переводя их на ступень ниже, а ЗАМЕЩЕНИЕ предыдущего продукта NV30! И в этом коренное отличие от ранее вышедших тандемов: NV10-NV15 (GeForce256-GeForce2), NV20-NV25 (GeForce3-GeForce4Ti). Да, разумеется, целью NVIDIA и тогда была замена продуктов GeForce256 и GeForce3, однако она шла постепенно и в штатном режиме продаж. А тут все иначе: мы еще не сталкивались с таким, что предыдущий продукт появляется в продаже, и буквально через месяц анонсируется новый. Разумеется, фирмы-производители обо всем знали заранее, и потому на выпуск NV30 клюнули немногие, а кто и решился, тот выпустил мизерное количество таких карт. Это объясняется еще и высочайшей себестоимостью GF FX 5800/Ultra. Но мы про все это уже писали, вот список наших статей, посвященных новому семейству GeForce FX:

Аналитический материал по особенностям архитектуры NVIDIA NV30 (GeForce FX)
Базовый обзор NVIDIA GeForce FX 5800 Ultra (NV30) — одностраничный
Базовый обзор NVIDIA GeForce FX 5800 Ultra (NV30) — многостраничный
Базовый обзор NVIDIA GeForce FX 5600 Ultra (NV31) и GeForce FX 5200 Ultra (NV34) — одностраничный
Базовый обзор NVIDIA GeForce FX 5600 Ultra (NV31) и GeForce FX 5200 Ultra (NV34) — многостраничный
Обзор ASUS V9900 Ultra на базе NVIDIA GeForce FX 5800 Ultra — продолжение рассмотрения качества АА и анизотропии
Обзор Gainward FX Powerpack Ultra/1000 Golden Sample и Gainward FX Powerpack Pro/660 TV/DVI на базе NVIDIA GeForce FX 5800 Ultra и 5200 — масштабирование (зависимость производительности от частоты работы CPU) GeForce FX 5800 Ultra, а также изучение производительности GeForce FX 5200
Обзор Leadtek WinFast A300 Ultra MyVIVO на базе NVIDIA GeForce FX 5800 Ultra — продолжение изучения зависимости производительности GeForce FX 5800 Ultra от частоты работы CPU в тяжелых режимах при АА и анизотропии
Обзор MSI FX5800 Ultra-TD8X на базе NVIDIA GeForce FX 5800 Ultra
Обзор видеокарт на базе NVIDIA GeForce FX 5200 производства Albatron, Chaintech, Gainward, InnoVision, Leadtek, Palit и Prolink

Технические характеристики

Технологическая норма 0.13 микрон, медные соединения
135 миллионов транзисторов
3 геометрических процессора (превышают спецификации DX9 VS 2.0)
4 усовершенствованных конвейеризированных пиксельных процессора. Функциональность пиксельных процессоров значительно превышает спецификации DirectX9 PS 2.0, в два раза превосходят по мощности шейдеры в NV30 и операции, использующие плавающую точку, выполняются с истинной 128 битной точностью.
системный интерфейс AGP 3.0 (8х)
256-битный интерфейс локальной памяти DDR1 (!)
Intellisample HCT (High Compression Technology) является развитием Intellisample представленной в NV30 — техники экономии пропускной полосы локальной памяти.
Тайловые оптимизации: кэширования, сжатия и раннего отсечения невидимых поверхностей (Early HSR, Early z Cull)
Технология UltraShadow — увеличивает скорость прорисовки стенсильных теней (называемых так из-за широкого использования стенсил (stencil) буфера при их генерации) за счет ограничения обрабатываемых объектов по глубине сцены.
Поддержка точных целочисленных форматов (10/16 бит на компоненту) и точных плавающих форматов (16 и 32 бита на компоненту) для буфера кадра и текстур.
Сквозная точность всех операций — 32-бит плавающей арифметики (поддержка т.н. 128-битной глубины цвета)
Новый алгоритм оптимизированной анизотропной фильтрации, будучи активирован пользователем, снижает падение производительности (читай величины fps) без особенного падения качества
Качество анизотропии вплоть до 8х от обычной билинейной фильтрации, т.е. до 32 дискретных отсчетов на одну выборку из текстуры
Гибридные режимы АА — 8х и 6xS
Сжатие буфера кадра позволяет существенно снизить падение производительности при активации FSАА
Два встроенных RAMDAC 400 МГц
Встроенный интерфейс для внешнего TV-Out чипа
Встроенные в чип три TMDS-канала для внешних интерфейсных DVI-чипов

Рассмотрим этот список более детально.

Чип из 135 миллионов транзисторов: Как мы видим, количество транзисторов в чипе увеличилось ненамного — это косвенно говорит о том, что изменения в чипе, базирующемся на архитектуре NV30, скорее косметические.
256-битный интерфейс локальной памяти: Пожалуй, самое ожидаемое нововведение в NV35. С момента выпуска NV30 энтузиасты трехмерной графики на ПК, предсказывая характеристики NV35, даже не представляли себе этот чип без 256-битного интерфейса обмена с локальной памятью.
4 усовершенствованных конвейеризированных пиксельных процессора: Здесь же вместо также ожидаемого увеличения числа пиксельных процессоров до 8 NVIDIA оставила все те же 4 процессора. Каждый из пиксельных процессоров снабжен: двумя блоками, фильтрующими текстуры, двумя смешанными целочисленными и работающими с плавающей точкой операциями ALU и одним ALU, выполняющим операции только. с плавающей точкой. То есть, всего три операции с плавающей точкой. Такая конфигурация позволяет выполнять до 12 пиксельных операций за такт. Однако, пока в силу некоторых обстоятельств, эта мощь работает только в OpenGL, в D3D все по-прежнему — только одна операция с плавающей точкой, однако обещают и это выправить. Разумеется, декларируется, что по мощности пиксельных процессоров при выполнении пиксельных шейдеров DirectX9 PS 2.0 со 128 битной точностью вычислений новый чип превосходит NV30 в два раза.
Технология Intellisample HCT: техника экономии пропускной полосы локальной памяти: сжатие без потерь буфера кадра, включая как информацию о цвете, так и из буфера глубины (Z буфера). Возможный коэффициент сжатия — до 4:1. По сравнению с NV30 технология Intellisample была усовершенствованна — как и ранее в чипе на основании нескольких факторов определяется, будет ли эффект от сжатия передаваемых блоков данных, но теперь, в результате оптимизации, вероятность сжатия данных увеличена. Также под общим названием Intellisample HCT включены следующие техники, увеличивающие эффективность работы с локальной памятью: контроллер локальной памяти с коммутатором, текстурные кэши, раннее отсечение невидимых пикселей (z-culling), быстрая очистка буфера глубины (fast z-clear). Все эти оптимизации позволяют существенно снизить падение производительности при активации FSАА.
Технология UltraShadow: Данная технология позволяет увеличить скорость визуализации теней при использовании техники стенсил-буфера (stencil buffer shadows), как раз той техники, которая используется в Doom III. Как часть технологии UltraShadow декларируется возможность чипов NV30/NV35 удваивать fillrate, выдавая до 8 пикселей за такт, если закрашивается только буфер глубины и/или стенсил буфер, по сравнению с 4 пикселями при обычном рендеринге. Вторая, наиболее интересная часть заключается в возможности задавать диапазон глубины в кадре, в котором объект может отбрасывать тень. Для демонстрации взглянем на рисунок:

Если при прорисовке теней значение глубины пикселя, хранящееся в буфере глубины, не попадает в заданный диапазон, то стенсил-буфер для пикселя не обновляется. Таким образом, становится возможной экономия достаточно большого процента от скорости закраски (fillrate). По всей видимости, для реализации этой функции в чипе усовершенствован блок, отвечающий за раннее отбрасывание невидимых поверхностей (early z-cull), который теперь сверяет значение, хранящееся в буфере глубины, не только с текущим значением, интерполированным исходя из координат треугольника, но и с двумя дополнительными значениями. В итоге выигрыш по сравнению с другими чипами с одинаковым количеством конвейеров будет двукратный в худшем случае (8 значений буфера глубины по сравнению с 4 значениями цвета) и четырехкратный (с учетом, что early z-cull может отбрасывать до 16 пикселей за такт), даже без учета уменьшения объема данных, записываемых обратно в локальную память.
Ниже можно видеть, насколько большую площадь занимают визуализированные буферы теней.

Выше мы перечислили плюсы технологии, но у нее есть и свои ограничения.

технология UltraShadow будет доступна только в OpenGL при помощи расширения "NV_depth_bounds_test"
NVIDIA ожидает получения патента на технологию UltraShadow
Технология не включается парой строчек кода (как в свое время говорили про N-Patch aka Truform) — программисты должны анализировать отображаемую сцену и эффективно задавать диапазон, в котором возможна прорисовка теней.
Пока технология анонсирована только для NV35, расширение в текущих драйверах доступно также только на NV35. Неизвестно, будет ли в дальнейшем это расширение доступно для остальных карт на базе NV3x, хотя есть положительный сигнал, т.к. расширение "NV_depth_bounds_test" доступно в режиме эмуляции NV30 в "Buzz/emulated" в OpenGL драйвере, выпущенном еще в августе 2002 года.

Плата

Карта снабжена интерфейсом AGP х2/x4/x8, 256 МБ локальной памяти DDR SDRAM (16(!) микросхем, размещенных на лицевой и оборотной сторонах PCB).

На карте установлены микросхемы DDR памяти Hynix марки HY5DU283222-AF22, форм-фактора BGA. Максимальная частота работы — 450 (900) МГц, время выборки — 2.2 нс. По умолчанию память работает на частоте 425 (850) МГц, чип — 450 МГц.

Мы видим, что для набора объема памяти в 256 мегабайт используется в 2 раза большее, чем мы привыкли видеть, количество микросхем. Заметим, что суммарно они составляют 512бит, то есть при наличии аппаратной 512-битной шины обмена с памятью у чипа и PCB, карта смогла бы иметь столь огромную ПСП. Но, как выше было сказано, шина — 256 битная, поэтому мы снова сталкиваемся с таким явлением, как двухстрочная организация подсистемы памяти. Память при этом работает по двубанковой схеме, что дает некоторый прирост в скорости обмена с нею. Поэтому можно почти смело говорить о том, что если 128-мегабайтные карты GeForce FX 5900 будут иметь немного меньшую производительность, нежели 256-мегабайтные, как это было в случае RADEON 8500 64 и 128 мегабайт.

NVIDIA GeForce FX 5900 Ultra 256MB

NVIDIA GeForce FX 5800 Ultra 128MB

Как мы видим, карта очень большая по длине, и примерно равна PCB карты Voodoo5 5500. Расположение микросхем напоминает Matrox Parhelia:

PCB достаточно сложна по разводке, однако слоев используется меньше — всего 8 плюс экранирование (в отличие от 12-слойной PCB у NV30):

Что касается системы охлаждения, то она состоит из двух кулеров: для процессора и для памяти, что является очень верным решением (мы уже неоднократно отмечали, что единый кулер для GPU и памяти может сыграть злую роль для менее нагревающихся элементов, неся к ним тепло от более сильногреющихся компонентов). Центральный кулер представляет собой копию того, что мы могли видеть ранее на Quadro FX или GeForce FX 5800 (не-Ultra), только с обрезанной крышкой на радиаторе, что способствует уменьшению шума. Вентилятор работает в режиме, как у GeForce FX 5800-не-Ultra: постоянно крутится на малых оборотах, при надобности включаясь на полные обороты (при повышении температуры выше определенных критических значений). Система охлаждения памяти состоит из двух массивных алюминиевых радиаторов, покрашенных в черный цвет. Тепло передается через специальные термоэлементы, приклеенные к радиаторам, они же гарантируют плотный прижим к поверхности микросхем памяти. Сам крепеж системы охлаждения тщательно продуман, нет больше никаких пластмассовых клипс (фитюлек), все на болтах с пружинами.

Отметим, что нагрев в целом НАМНОГО меньше, чем у NV30. Если до карты GeForce FX 5800 Ultra после часа работы в 3D просто невозможно дотронуться (даже до самой PCB!), то здесь нагрев радиаторов всего лишь чуть выше болевого порога человека (или на его уровне).

Завершая рассмотрение карты, заметим, что весь "хвост" у нее отдан системе питания, где имеется и разъем для подключения внешнего питания от БП.

Что касается TV-out, то на карте установлен кодек Philips 7108, который потенциально поддерживает VIVO.

Более подробно о работе ТВ-выхода с помощью такого кодека можно прочитать в материале Алексея Самсонова и Дмитрия Дорофеева.

Разгон

К сожалению, разгон заблокирован драйверами: частоты видны, их можно "менять", но после тестирования новых установок частоты сбрасываются на начальные. Уже после окончания тестирования было выяснено, что через Auto Detect есть возможность разгона, поэтому в следующем материале мы это проверим.