Обзор видеоакселератора NVIDIA GeForce2 GTS

Вот и настала пора выхода в свет новых видеочипсетов, о которых так много говорилось. Если в отношении 3dfx Voodoo5 многое было известно еще осенью 1999 года, то о NVIDIA NV15 ходило много разных слухов. Начиная с того, что это будет просто улучшенный GeForce256 с увеличенными частотами, и кончая тем, что NV15 будет иметь абсолютно новую архитектуру. И вот, 26 апреля 2000 года NVIDIA наконец объявила свой следующий акселератор GeForce2 GTS.

Мы еще в начале этого года высказывали предположения о сохранении марки GeForce в названии нового продукта. Действительно, это имя появилось не так давно, но уже набрало достаточную популярность, и поэтому было бы глупо его бросать. На ум приходит аналогия годичной давности, когда появился чипсет NVIDIA Riva TNT2, также, как и GeForce2 GTS, имеющий число 2 в названии и ставший, по сути, просто разогнанным вариантом NVIDIA Riva TNT (пусть и с небольшими улучшениями). Но ныне ситуация совсем другая: NVIDIA GeForce2 GTS - это принципиально новый чипсет, пусть и имеющий много общего с предыдущим. Не зря его название имеет суффикс GTS, расшифровывающийся как GigaTexel Shading. В нем отражен и огромный потенциал чипа по скорости заполнения сцены, и новая технология NVIDIA Shading Rasterizer. Поговорим об этом подробнее.

Спецификация

Ниже я представлю спецификацию нового чипсета NVIDIA GeForce2 GTS:

  • 256-разрядное графическое ядро
  • Технологический процесс: 0.18 мкм
  • Частота графического ядра: 200 МГц
  • Число конвейеров рендеринга: четыре с двумя блоками текстурирования на каждом
  • Частота работы шины памяти: до 200 Мгц
  • Поддерживаемые типы памяти: DDR SGRAM и стандартная SDR SDRAM/SGRAM
  • Поддерживаемый объем локальной видеопамяти: от 8 до 128 Мб
  • Ширина полосы пропускания памяти: 5.3 Гб в сек. (пиковая при частоте 166 МГц работы памяти типа DDR)
  • Pixel Fillrate: 800 млн. пикселей в секунду
  • Texel Fillrate:
    • 1 texel per 1 Pixel 800 млн. текселей в секунду
    • 2 texel per 1 Pixel 1600 млн. текселей в секунду
  • RAMDAC: 350 МГц
  • Максимальное разрешение: 2048x1536@75Hz
  • Интегрированный в чип TMDS трансмиттер позволяет подключать цифровые мониторы и поддерживает разрешение вплоть до 1600x1200
  • Интерфейс внешней шины: полная поддержка AGP x2/x4 (включая SBA, DME и Fast Writes) и PCI 2.2 (включая Bus mastering).

3D-графика:

  • Геометрический движок GeForce 2 GTS — аппаратная реализация преобразования координат, установка освещения, clipping (отсечение полигонов, не входящих в конечный кадр)
  • Производительность HW T&L: 25 млн. текстурированных полигонов в секунду (пиковая)
  • Аппаратная установка 8 источников света для всей сцены
  • Полная поддержка OpenGL и DX7 — Tranform & Lighting, Cube environment mapping (кубического текстурирования картами окружения), projective textures (проекция текстур) и компрессия текстур
  • Движок NSR обеспечивает аппаратную поддержку Pixel Shaders через D3D8
  • Поддержка аппаратного сглаживания всей сцены (Full-scene hardware anti-aliasing, HW FSAA)
  • Поддержка реализации таких эффектов, как Motion Blur, Depth of Field через D3D8
  • Полная поддержка методов компрессии DXTC и S3TC через DX и OpenGL соответственно
  • Аппаратная поддержка интерполяции вершин полигонов (vertex blending) с применением двух skinning-матриц
  • Рендеринг при 16- и 32-битной глубине представления цвета
  • Аппаратная поддержки рельефного текстурирования следующих типов: Embosing и Dot Product3
  • Поддерживаются текстуры вплоть до 2048x2048 @ 32 bit
  • Программируемые режимы смешивания нескольких текстур
  • Буфер шаблонов (стенсель): 8 бит
  • Z-буфер: 16/24/32 бит
  • Полноценная поддержка в драйверах аппаратного ускорения OpenGL 1.2 под ОС Linux

Видео:

  • Поддерживается аппаратное декодирование всех форматов HDTV
  • Поддерживаются все разрешения ATSC, включая 1080i
  • Поддерживается 8-bit режим альфа-смешивания видео и графики
  • Поддерживается VIP 2.0 порт уровня I (8 бит, 75 МГц), что позволяет подключать внешние MPEG2 декодеры/кодеры.
  • Для вывода видеосигнала на ТВ требуется установка TV-кодера, а в сам чип GeForce 2 GTS встроен цифровой интерфейс для подключения этих ТВ кодеров

Подробно особенности нового чипсета рассматривались недавно в нашей аналитической статье, я же лишь кратко пройдусь по основным параметрам.

Самое главное отличие нового GPU от конкурентов — это наличие четырех конвейеров рендеринга, каждый из которых содержит по два текстурных процессора, что позволяет новому чипсету получить колоссальное преимущество в играх, поддерживающих мультитекстурирование. Какое-то время назад я говорил о том, что чипсеты фирмы 3dfx (Voodoo2, Voodoo3) обладают бесплатным мультитекстурированием, когда к работе подключается второй модуль TMU. Таким образом, при той же скорости обработки пикселей скорость наложения текстур увеличивается вдвое, либо возникает возможность за один такт и наложить текстуру и осуществить, например, трилинейную фильтрацию. Этой возможности не было у чипсетов от NVIDIA, поскольку они все имели по одному TMU на каждом конвейере. При включении режима мультитекстурирования конвейеры спаривались, и при этом скорость обработки пикселей, естественно, падала в два раза. У чипсета NVIDIA GeForce2 GTS же получается так, что этот режим дает то самое бесплатное мультитекстурирование, в то время как в играх без его поддержки чипсет будет выглядеть похожим по структуре на NVIDIA GeForce256, который также обрабатывает 4 пикселя за такт, накладывая на каждый пиксель по одной текстуре. Однако не надо думать, что при этом GeForce2 GTS станет по производительности равным GeForce256. Посмотрите на скорости заполнения сцены! Если у NVIDIA GeForce256 — это 480 миллионов пикселей в секунду, то у NVIDIA GeForce2 GTS — уже 800 миллионов. Поэтому последний будет намного быстрее в играх любого типа, хотя, подчеркну, что в играх с мультитекстурированием преимущество NVIDIA GeForce2 GTS будет более существенным. Впрочем, не надо забывать, что игр, не поддерживающих мультитекстурирование, уже практически не осталось.

Еще одним важным свойством, появившимся еще у NVIDIA GeForce256, стала поддержка настоящей трилинейной фильтрации. Качество анизотропной фильтрации у NVIDIA GeForce2 GTS также значительно улучшено благодаря использованию не восьми, как у GeForce256, а шестнадцати текстурных сэмплов.

NVIDIA Shading Rasterizer

Изюминкой нового чипсета стало наличие в нем нового блока — NVIDIA Shading Rasterizer (NSR). Как я уже выше сказал, чипсет NVIDIA GeForce2 GTS оптимизирован для выполнения мультитекстурирования, иными словами для того, чтобы за такт накладывать больше одной текстуры на пиксель, выполняя различные операции смешения (blending) над текстурами. Так вот, порядок и способ смешения ранее был задан жестко, и разработчик игры не мог вмешиваться в этот процесс. Теперь же через специальный Pixel Shader API, который будет идти в составе DirectX 8.0, появляется возможность задать формулу, по которой будут реализовываться мультитекстурные эффекты.

 

На этих примерах можно видеть различные подобные эффекты и операции, связанные с цветом, полученным после операции расчета освещенности (D), накладыванием базовой текстуры (T) и получением отражения (R).

Замечу, что все вычисления производятся для каждого пикселя, входящего в полигон (треугольник), в результате мы имеем более точный результат, а значит и отсутствие артефактов, и блестящую качественную графику.

Pixel Shader и NSR серьезно меняют концепцию мультитекстурирования, поэтому разработчикам игр, желающим использовать новую технологию, придется разрабатывать новый модуль для реализации мультитекстурирования. И это, естественно, отразится на скорости появления игр, использующих все эти новшества. Справедливости ради замечу, что эта технология даст возможность легко реализовать, например, Environmental Mapped Bump Mapping (EMBM). И конечно, нельзя не обратить внимание на то качество, которое мы можем получить при использовании NSR:

Рельефное текстурирование

Поддержка этого вида текстурирования по технологии Dot Product или Emboss является важным преимуществом NVIDIA GeForce2 GTS:


Bump Mapping

No Bump Mapping

Слева — скриншот, где присутствует рельефное текстурирование, а справа — отсутствует. Скриншоты выполнены на демо-версии игры Isle of Morg от Experience, которая поддерживает все новейшие функции последних чипсетов от NVIDIA.

Кубическое текстурирование

Как видно из характеристик чипсета, NVIDIA GeForce2 GTS поддерживает кубическое наложение текстур при использовании карт среды окружения:

Этот способ дает нам возможность реализации реалистичного отражения окружающих наблюдателя объектов.

Как мы видим, возможности современных видеоакселераторов крайне широки. Если к этому еще приплюсовать вычислительные мощности аппаратного модуля T&L, позволяющего значительно разгрузить CPU от задач расчета отображаемой картинки, то становится малопонятно, почему мы до сих пор играем в блеклые некрасивые игры с глупыми монстрами. Мне приходится еще и еще раз сожалеть, что разработчики игр до сих пор не выпускают игр, где можно видеть такую прекрасную графику, какую нам демонстрируют разработчики чипов в своих технологических демо. Конечно, куда проще идти по проторенной дорожке, используя примитивные модели и 8-битные текстуры размером 256х256… Получается, что пока многие возможности современных видеокарт так и остаются невостребованными по вине разработчиков, которые попросту игнорируют многие новые функции.

Ну что же, на этом я закончу повествование об особенностях чипсета NVIDIA GeForce2 GTS и перейду непосредственно к видеокарте, которая представляет этот чип.

Плата

Эта плата представляет собой опытный образец от NVIDIA, иными словами reference card. На основе дизайна этой карты производители будут выпускать свои платы, которые не должны от нее сильно отличаться. Карта базируется на AGP2x/4x интерфейсе, имеет 32 мегабайта DDR SGRAM памяти, размещенной в 8-ми микросхемах по обеим сторонам PCB. Микросхемы произведены фирмой Infineon и имеют время доступа 6 ns.

Как мы видим, на карте установлена точно такая же память, как и на платах на NVIDIA GeForce256 с DDR памятью. Однако, в данном случае она работает на своей штатной частоте 166 МГц (333 МГц в пересчете на SDR-память). Я могу сразу предположить, что прироста частоты памяти на 16 МГц по сравнению с платами на NVIDIA GeForce256 с DDR-памятью (150 МГц) для такого мощного чипсета явно недостаточно. И с некоторой тревогой жду повторения ситуации с NVIDIA GeForce256 картами с SDR-памятью, для которых пропускная способность памяти является узким местом.

Рассматривая плату, сразу можно заметить, что она имеет TV-out, но вся разводка, в том числе и микросхема BT869, отвечающая за эту функцию, размещены на дочерней плате.

Мы уже видели подобную реализацию TV-out на картах от ATI (RAGE FURY). Такое дизайнерское решение имеет целью получить на PCB универсальный коннектор для использования совместно с картой различных дочерних плат с TV-out, TV-in или TV-in/out на борту. Таким образом, не переделывая эталонный дизайн, производители видеокарт могут выпускать его различные модификации, в том числе и целый мультимедийный комбайн. Также это может дать улучшение качества выводимого на монитор изображения, поскольку замечено, что наличие разводки TV-out на самой карте часто несколько портит четкость картинки.

Чипсет закрыт приклееным на него активным кулером привычной уже конструкции с утопленным в радиатор вентилятором. Чип греется не столь сильно, как NVIDIA GeForce256, поэтому думается, что его разгон будет вполне возможен.

Установка и драйвера

Вместе с видеокартой поставлялись референс-драйверы от NVIDIA версии 5.16, которые по настройкам мало чем отличаются от предыдущих версий, которые мы рассматривали ранее. Я остановлюсь только на двух основных отличиях новой версии драйверов в части поддержки NVIDIA GeForce2 GTS.

На этой закладке в разделе Direct3D мы можем видеть настройки анти-алиасинга (Anti-Aliasing (АА) — эффект сглаживания неровных краев объектов). Как известно, при работе в низких разрешениях в 3D главным недостатком является наличие неровных краев (так называемых лестниц) у объектов, что портит восприятие трехмерной сцены. В эпоху появления чипсетов NVIDIA Riva TNT была введена поддержка анти-алиасинга через суперсэмплинг (оверсэмплинг) — осуществление рендеринга не в заданном разрешении, а вдвое большем, с последующим уменьшением полученной картинки до заданных размеров, что приводило к пропаданию "лестниц" на краях объектов. Однако, естественно, скорость работы карты в таком режиме будет сильно падать (представьте себе, что для показа трехмерной сцены в 800х600 видеокарта должна обработать сцену в разрешении 1600х1200). Именно из-за низкой эффективности этого метода анти-алиасинга, возможность его включения была изъята из драйверов предыдущих версий.

В характеристиках NVIDIA GeForce2 GTS сказано, что этот чипсет поддерживает анти-алиасинг, причем полносценный (Full Scene AA — FSAA). Как можно видеть на скриншоте с драйверов, введено семь градаций FSAA, то есть несколько его видов, от самого простого (ползунок слева) до самого сложного (ползунок справа). К сожалению, в данной версии драйверов работает только один вид FSAA — когда при суперсэмплинге идет выборка субпикселей по маске 2х2 (то есть при этом результурующие цвета границ объектов получаются при выборке 2-субпикселей по горизонтали и 2-х по вертикали). NVIDIA обещает в следующей версии драйверов ввести разные виды FSAA. Так же отмечу, что принудительное включение FSAA распространяется далеко не на все игры. На данный момент FSAA поддерживается только играми, знающими этот эффект, например, Expendable.

Здесь мы можем включить режим FSAA в OpenGL, и тоже пока только в одном виде — при маске 2х2. NVIDIA также обещает ввести гибкую установку видов FSAA и в OpenGL.

Отмечу, что технология S3TC в драйверах поддерживается изначально, и ее отключить, например, в Quake3 можно только через переменную r_ext_compress_textures. Что же касается Direct3D, то тут технология компрессии текстур DXTC используется при наличии поддержки со стороны приложения.

Хочу остановиться еще на одном актуальном моменте: работе AGP-текстурирования в OpenGL у видеокарт на базе чипсетов от NVIDIA. Эта тема обсуждается уже много времени, и все были вынуждены констатировать, что драйверы от NVIDIA не поддерживают DiME режим в OpenGL, то есть обработку текстур непосредственно в оперативной памяти компьютера, а не просто использование ОЗУ как буфера для хранения текстур. В результате, даже мощнейшие карты вроде Creative 3D Blaster GeForce256 Annihilator Pro на "тяжелых" тестах типа Quake3 Quaver (на уровне q3dm9 с максимальным качеством текстур) очень сильно проседали:

Обратите внимание на резкое падение скорости в 32-битном цвете. В этом тесте преобладают большие текстуры размером более 512х512, объем которых в сумме превышает доступный объем локальной видеопамяти, поэтому требования к AGP-текстурированию в данном случае более чем актуальны. И мы видим, что мощнейший акселератор просто резко сдал по скорости, натолкнувшись на отсутствие режима DiME в драйвере версии 3.68.

Затем посмотрите, что же случилось при смене драйвера на версию 5.16. По-моему, комментарии излишни. Я могу только с удовлетворением отметить, что наконец-то поддержка AGP заработала в полную силу. К сожалению, я не могу точно гарантировать работу DiME на чипсетах NVIDIA Riva TNT/TNT2, так как я не испытывал на них работу этого режима.

Производительность

Предваряя рассказ о самом трепетном для тестера разделе — о результатах тестирования, я познакомлю с конфигурацией лабораторных стендов:

Стенд на базе процессора Intel Pentium III:

  • процессор Intel Pentium III 733;
  • системная плата Chaintech 6ATA4 (VIA Apollo Pro 133A);
  • оперативная память 256 MB PC133;
  • жесткий диск IBM DPTA 20 GB;

Стенд на базе процессора AMD Athlon:

  • процессор AMD Athlon 700;
  • системная плата ASUS K7M (AMD750);
  • оперативная память 256 MB PC100;
  • жесткий диск Quantum FB CR 6.4 GB.

На обоих стендах установлена операционная система Windows 98 SE, использовались мониторы ViewSonic P810 (21'') и NOKIA 447Xav (17'').

Напомню, что тестирование проводилось на драйверах версии 5.16 при отключенном Vsync (синхронизация частот дискретизации видеокарты и обновления монитора). Для сравнительного анализа были сняты показания с видеокарты на базе NVIDIA GeForce256 с DDR-памятью — Creative 3D Blaster GeForce256 Annihilator Pro.

Начну с 2D-графики. Оценку скоростных параметров мы осуществляли при помощи WinBench99, набором тестов Graphics Marks. При измерении скорости работы карт в 2D в разрешении 1600х1200 в 32-битном цвете были получены следующие результаты:

 Business Graphics WinmarkHighEnd Graphics Winmark
NVIDIA GeForce256 DDR326907
NVIDIA GeForce2 GTS329909

Как мы видим, скорости у обеих карт примерно одинаковые. В принципе, этот результат был вполне ожидаем, так как увеличивать скорость работы игровой карты в 2D больше нет никакого смысла, на глаз все последние видеокарты работают одинаково быстро. Это может устроить любого пользователя.

А вот что касается качества 2D-графики, то тут есть что сказать. Я понимаю, что могу вызвать бурю негодования поклонников фирмы Matrox, но я скажу, что по качеству двумерной картинки NVIDIA GeForce2 GTS догнала Matrox G400 и в высоких разрешениях (1600х1200). Я хоть и был удовлетворен качеством 2D и на картах NVIDIA GeForce256, но такого качества я еще у карт на чипах от NVIDIA не видел! Хотя, конечно, надо учитывать и то, что мы тестировали только опытный экземпляр карты на чипсете NVIDIA GeForce2 GTS, вполне возможно, что карты от иных производителей будут иметь разные уровни качества картинки в 2D.

Почему же достигнуто такое качество в 2D? Вроде бы RAMDAC имеет частоту 350 МГц, как и у NVIDIA GeForce256, а разница все же есть. В нашей первой статье о NVIDIA NV15 мы писали о том, что в данном чипсете NVIDIA использует совершенно новый RAMDAC, который, хоть и находится в одном корпусе с чипсетом, не интегрирован в ядро GPU. Вероятно это одна из причин увеличения качества. Однако мне кажется, что есть и иная причина, состоящая в вынесении разводки TV-out с основной PCB на дочернюю плату.

Приступаем к рассмотрению 3D-графики с точки зрения производительности видеокарты. Нам предстоит не только увидеть ту скорость, что дает NVIDIA GeForce2 GTS, но и посмотреть на ее работу с включенным FSAA, а также на поддержку S3TC.

В качестве инструментария мы использовали следующие программы:

  • id Software Quake3 v.1.16n — игровой тест, демонстрирующий работу платы в OpenGL с использованием:
    • стандартного демо-бенчмарка demo002 (на этом бенчмарке также получены результаты работы карты при включенном FSAA)
    • бенчмарка quaver, демонстрирующего работу платы в тяжелых условиях при множестве больших текстур (сразу отмечу, что все тесты на этом демо проводились при максимальной детализации текстур)
    • бенчмарка annihilator, демонстрирующего работу платы на специальном уровне dmmq3dm6, выпущенного фирмой S3/Diamond для демонстрации S3TC-технологии
  • Rage Expendable (timedemo) — игровой тест, демонстрирующий работу платы в Direct3D в режиме мультитекстурирования, а также при включенном FSAA
  • Epic Unreal Tournament (testd3d) — игровой тест, демонстрирующий работу в Direct3D при высоких нагрузках на акселератор и CPU.
  • NVIDIA Grove (бывший TreeMark) — синтетический тест, демонстрирующий производительность Hardware TCL (T&L) в OpenGL при различном количестве источников света и сценах разной сложности

Quake3 Arena

Тестирование проводилось на двух режимах: Fast (демонстрирует работу карты в 16-битном цвете) и High Quality (демонстрирует работу карты в 32-битном цвете). Результаты на платформе Pentium III (присутствуют также данные по тестированию с включенной поддержкой S3TC и с включенным FSAA):


Как мы можем видеть, в 16-битном цвете NVIDIA GeForce2 GTS резко ушла вперед, намного обогнав соперника в высоких разрешениях. Включение S3TC (переменной r_ext_compress_textures необходимо присвоить значение 1) мало что дает по скорости. А вот режим с FSAA делает в 16-битном цвете разрешения выше 800х600 просто неиграбельными. Играть с FSAA в 32-битном цвете просто невозможно. Падение в скорости колоссально. Правда, я лично не вижу особого смысла в FSAA в этом случае, так как игра даже в 1280х1024 дает неплохие результаты по скорости, а в разрешениях выше 1024х768 присутствие эффекта FSAA совершенно не заметно. В 32-битном цвете хочу отметить не столь значительный прирост по скорости по сравнению с платой на NVIDIA GeForce256 с DDR-памятью. Вам ничего эта картина не напоминает? Мне же эта ситуация живо напомнила историю с NVIDIA GeForce256 с SDR-памятью, когда память становится узким местом у акселератора. К прискорбию, история повторяется…

Результаты на платформе Athlon:


Мы можем видеть похожую картину: более значительное опережение соперника в 16-битном цвете и менее значительное — в 32-битном.

Целью следующего теста является нагрузка акселераторов сверхбольшими текстурами при выключенной поддержке S3TC, чтобы оценить их работу при интенсивном AGP-текстурировании. Во всех тестах использовалось демо quaver и ползунок уровня детализации текстур был установлен в максимальное положение:


Я могу с удовлетворением отметить, что даже в столь тяжелых условиях карта на NVIDIA GeForce2 GTS может обеспечить хорошую играбельность в 1024х768х32, а в 16-битном цвете — так вообще во всех разрешениях!


А на этой платформе показатели получились даже еще лучше. Не зря было много отзывов о том, что в своих последних драйверах NVIDIA значительно улучшила работу видеокарт на ситемных платах с чипсетом AMD750 в части AGP-текстурирования. И вот результат налицо.

Некоторое время назад появились дополнительные уровни к Quake3, использующие технологию сжатия текстур S3TC и содержащие великолепно нарисованные огромные текстуры, что давало в свое время возможность владельцам карт на чипсете S3 Savage2000 наслаждаться прекрасной графикой. Ныне же, благодаря соглашению о кросслицензировании между NVIDIA и S3, поддержка технологии S3TC в OpenGL появилась и у карт на чипсетах NVIDIA.

Поэтому при помощи демо-бенчмарка Annihilator (уровень dmmq3dm6) мы можем оценить скорость работы NVIDIA GeForce2 GTS при полноценном использовании S3TC.


Я могу констатировать, что картина похожа на предыдущий случай: в 32-битном цвете карта дает прекрасную скорость в разрешении 1024х768 и даже неплохую в 1280х1024, а 16-битном цвете — на всех разрешениях производительность прекрасная.


Соотношение результатов почти аналогичное, но абсолютные цифры повыше, что дает отличную играбельность и в 1280х1024х32.

Таким образом, проанализировав работу NVIDIA GeForce2 GTS в Quake3, я могу сказать, что работу FSAA не иначе как провалом назвать нельзя. Я, конечно, понимаю, что это самый тяжелый для карты режим, однако играть с FSAA можно только на самых низких разрешениях. Впрочем, этот недостаток с лихвой компенсируется отличной скоростью работы платы в высоких разрешениях. Не столь значительный прирост по производительности относительно NVIDIA GeForce256 DDR в 32-битном цвете явно указывает на нехватку пропускной способности применяемой с GeForce2 GTS DDR-памяти.

Expendable

На примере данной игры мы посмотрим на скорость карты в Direct3D, в том числе и при включенном FSAA, а также оценим масштабируемость NVIDIA GeForce2 GTS, то есть зависимость быстродействия этой карты от частоты центрального процессора.


Как мы видим, играбельность находится на очень высоком уровне, производительность NVIDIA GeForce2 GTS практически везде упирается в мощность центрального процессора (кроме лишь 1600х1200, где мы видим еще и сильный отрыв от NVIDIA GeForce256 DDR).

В обоих случаях мы можем наблюдать почти двукратное падение в скорости при включении FSAA. Хочу заметить, что в разрешениях выше 800х600 FSAA просто не работает (блокируется драйверами). И еще раз напомню, что на данный момент в драйверах версии 5.16 FSAA работает только по самой сложной схеме и может быть востребован только в играх, понимающих эту функцию, поэтому на данном этапе в большинстве Direct3D игр увидеть FSAA невозможно.


А вот в 32-битном цвете картина несколько иная. Если на разрешениях до 1024х768 включительно мы снова наблюдаем упор скорости в производительность центрального процессора, то в дальнейшем отрыв от NVIDIA GeForce256 DDR уже не столь велик, как в 16-битном цвете. Хотя, безусловно, играть можно вплоть до 1600х1200х32.

Посмотрим на масштабируемость.


Как можно видеть, скорость, показываемая NVIDIA GeForce2 GTS достаточно сильно зависит от частоты центрального процессора, выдавая, тем не менее, на 550-мегагерцовом Pentium III неплохие результаты.

По итогам тестирования в Expendable хочу отметить, что даже 733-мегагерцового процессора уже подчас недостаточно для достижения максимальных для данной карты результатов в 16-битном цвете (кроме разве что разрешения 1600х1200). Несильный прирост по скорости в 32-битном цвете снова указывает на ограничение, накладываемое пропускной способностью памяти. Работу FSAA я подробно пока не анализирую до выхода полноценной поддержки этого эффекта в драйверах, когда можно будет найти оптимальное соотношение между качеством FSAA и падением производительности при его включении.

Unreal Tournament

Я признаюсь, что мне поначалу не очень хотелось включать этот тест в анализ производительности NVIDIA GeForce2 GTS по двум причинам: слишком большой зависимости скорости в этой игре от центрального процессора и изначальную оптимизацию движка под Glide, что ставит карты, работающие в Direct3D-режиме в заведомо невыгодное положение. Однако, впоследствии я пришел к выводу, что в преддверии появления на массовом рынке новых карт от 3dfx, да и в силу популярности игры Unreal Tournament следует все же провести исследование работы NVIDIA GeForce2 GTS в этой игре.


Как можно видеть, существенное отличие от NVIDIA GeForce256 DDR в большую сторону есть только на сверхвысоких разрешениях. В 32-битном цвете играбельность в разрешениях до 1024х768 включительно находится на высоком уровне, а в 16-битном цвете и в 1600х1200 можно спокойно играть. Замечу, что эта игра построена так, что 32-битный цвет в ней не столь заметен, нежели, например, в Quake3, поэтому без особых потерь в качестве можно играть и в 16-битном цвете.

Grove

Данный тест демонстрирует производительность блока Hardware TCL (T&L). То есть в этой программе все операции по расчету освещенности, трансформации координат и отсечению невидимых участков (clipping) возложены на геометрический сопроцессор. NVIDIA выпустила новую версию своего теста TreeMark, который теперь называется Grove. В новой версии, в частности, можно задать не одно дерево, а несколько (до 10) и посмотреть работу акселератора в очень тяжелых для него условиях.

Тестирование проводилось при установках по умолчанию (количество деревьев 1, уровень сложности depth 5, число источников освещения lights 4):

Как можно видеть, GPU в GeForce2 GTS значительно сильнее предыдущего, GeForce256 DDR.

Ниже мы покажем зависимость производительности GPU от сложности сцены (количества полигонов):

По этому графику видно, что характер кривой практически не изменился, однако результаты NVIDIA GeForce2 GTS лучше.

А здесь представлена диаграмма зависимости производительности GPU от числа источников освещения:

Тут у NVIDIA GeForce2 GTS и NVIDIA GeForce256 мы можем наблюдать похожие кривые, однако опять результаты нового чипсета значительно лучше. Можно отметить, что у нового чипсета установка большого числа источников света при Hardware T&L уже не будет вызывать настолько сильного падения в скорости, что будет страдать играбельность.

Таким образом, мы можем констатировать, что, объявляя новый геометрический сопроцессор у NVIDIA GeForce2 GTS более мощным, нежели у предшественника, NVIDIA не нас обманула. Действительно, мощность его выросла, хотя на очень сложных сценах (выше 120000 полигонов) производительность пока невысока и мало отличается от демонстрируемой NVIDIA GeForce256.

Подводя черту под анализом производительности NVIDIA GeForce2 GTS, я хочу сделать следующие выводы:

  1. В целом, прирост по скорости по сравнению с NVIDIA GeForce256 DDR имеется, в 16-битном цвете разрешения 1600х1200 становятся играбельными практически во всех играх;
  2. Нехватка пропускной способности 166 МГц DDR памяти сказывается на приросте по скорости в 32-битном цвете. Это приводит к тому, что уровень хорошей играбельности по сравнению с GeForce256 мало где сдвинулся выше разрешения 1024х768х32, а на этом разрешении можно играть и на NVIDIA GeForce256 DDR. Для получения более убедительных доказательств нехватки пропускной способности памяти я приведу таблицу с результатами NVIDIA GeForce2 GTS (в разрешении 1280х1024 в 32-битном цвете на игре Quake3, demo002), показываемыми этой картой при разгоне, где видно, как влияет на производительность разгон чипсета и разгон памяти:

    Частота чипа, МГц200210220230235
    Прирост производительности0%2%3%5%6%


    Частота памяти, МГц333340350360370380400
    Прирост производительности0%5%7%8%10%12%18%

    Как можно видеть, разгон памяти до 400 МГц дает очень большой прирост — почти 20%. Что и требовалось доказать. Установи NVIDIA на свою плату 200-мегагерцовые модули DDR-памяти, картина была бы совершенно иной! А пока я должен с огорчением констатировать, что NVIDIA со своим 200-мегагерцовым чипсетом оказалась "впереди паровоза", то есть производительность видеокарты ограничивается скоростью памяти.
  3. Эффект полносценного анти-алиасинга (FSAA) на данный момент представляет собой довольно жалкое зрелище по скорости. Падение производительности при включении FSAA очень велико даже на низких разрешениях. Играть с FSAA можно только разве что в 640х480. Однако я должен отметить, что пока не введена градация глубины этого эффекта, а в данной версии драйверов используется максимально возможный FSAA. Кроме того, в Direct3D FSAA работает далеко не во всех играх.

Качество 3D-графики

Прежде всего мы покажем, что же нам может дать эффект FSAA в точки зрения визуального улучшения графики. Сначала посмотрим на скриншоты без FSAA:

 

А теперь посмотрим на те же участки, но при включенном FSAA:

 

Как можно видеть, эффект сглаживания налицо, хотя и не столь на блестящем уровне (посмотрите на картинку справа). Все равно некоторые неровности еще остались.

Безусловно, если FSAA будет и дальше будет вызывать столь значительное падение скорости и небезупречное качество, то он просто не нужен в данном акселераторе. Справедливости ради я еще раз отмечу, что все же производительность GeForce2 GTS такова, что можно свободно играть в высоких разрешениях, где присутствие FSAA практически уже не требуется.

Что же касается качества 3D-графики в целом, то оно просто великолепно! Работает полноценная трилинейная фильтрация, анизотропная фильтрация, поддерживается S3TC в полном объеме, что дает нам видеть отличные сцены с детализированными объектами:

В предверии выхода GeForce2 GTS NVIDIA выпустила специальный уровень для Quake3 — NVIDIA Bunker, в котором используются огромные текстуры и разнообразные эффекты, сильно нагружающие акселератор. Этот уровень при максимальной детализации графики и текстур свободно может потянуть только мощнейший акселератор класса NVIDIA GeForce2 GTS:

Дополнительные функции

Конечно же, при все большем распространении на рынке DVD, многих интересует работа новых карт с точки зрения поддержки DVD-видео.

Я уже отмечал, что чипсеты NVIDIA GeForce256 полноценно поддерживают Motion Compensation при декодировании MPEG2-потока. Самый распространенный программный плеер, полноценно поддерживающий этот чипсет — это InterVideo WinDVD 2000. Я рекомендую скачать утилиту по комплексной настройке DVD-плееров DVD Genie, в которой есть и поддержка NVIDIA GeForce256. Новый же чипсет NVIDIA GeForce2 GTS пока неизвестен этим программам, однако, я думаю, что в ближайшее время появится и специальная поддержка этого чипсета. Тем не менее, при оптимизации всех функций под NVIDIA GeForce256, изображение на NVIDIA GeForce2 GTS было просто отличным:

И при этом загрузка процессора составляла всего 18-22% ! Прекрасный результат!

Выводы

NVIDIA выпустила мощнейший на сегодняшний день акселератор, обладающий целой гаммой достоинств и особенностей. Однако, не могу обойти вниманием большой недостаток новейшего акселератора — медленная 166 МГц DDR-память, являющаяся существенным тормозом для GeForce2 GTS. Правда, возможно вскоре мы все же увидим новые карты на NVIDIA GeForce2 GTS с более быстрой памятью, но сейчас на этот счет ничего не известно. А пока могу констатировать, что карта на этом чипсете не столь сильно ушла вперед в производительности в 32-битном цвете по сравнению с NVIDIA GeForce256 DDR. Тем не менее, прирост есть, и ощутимый. Играбельность безусловно выросла: подчас возможна комфортная игра и в разрешении 1280х1024х32.

А вот с Full Scene Anti-Aliasing фирма-производитель явно подкачала. Пока мы не будем рассматривать подробно те негативные моменты в реализации FSAA, уповая на обещание NVIDIA в следующей версии драйверов привести в порядок дела с реализацией этой функции. Когда мы будем рассматривать серийные карты, выпущенные на базе NVIDIA GeForce2 GTS, мы вернемся к этой проблеме. Тем не менее, я отмечу, что пока можно считать, что FSAA просто нет, ибо с таким падением по скорости он никому не нужен (кроме разве лишь разрешений 640х480).

Как важное достоинство чипсета, я отмечу поддержку технологии S3TC. И еще раз хочу отметить великолепное качество в 2D-графике, что дает нам новый продукт.

К сожалению, согласно поступающей информации, видеокарты на этом чипсете будут иметь завышенную цену. Поэтому на данный момент я мог бы рекомендовать приобретать эти видеокарты только тем, кто хотел остановить свой выбор на NVIDIA GeForce256 DDR — картах. Желающим проапгрейдиться с более слабых чипсетов я рекомендую пока подождать некоторого спада цен, а также выхода в широкую продажу карт от 3dfx — Voodoo5 5000 и Voodoo5 5500, которые пока для нас являются "темными лошадками".

Плюсы:

  • Высочайшая производительность;
  • Отличное качество 2D-графики в высоких разрешениях;
  • Хорошая разгоняемость чипсета, благодаря 0.18 мкм технологии;
  • Поддержка технологий S3TC, EMBM;
  • Отличная отлаженность драйверов в части поддержки всех основных функций (кроме FSAA).

Минусы:

  • Не столь выдающийся прирост по скорости по сравнению с предшественником из-за уже ставшей низкой пропускной способности 166 МГц DDR-памяти;
  • Сильное падение скорости при включении FSAA;
  • Сильно завышенная первоначальная цена на видеокарты на этом чипсете;
  • Практическое отсутствие реальных игр, поддерживающих большинство представленных технологий и достоинств чипсета NVIDIA GeForce2 GTS.




3 мая 2000 Г.

Обзор видеоакселератора NVIDIA GeForce2 GTS

Обзор видеоакселератора NVIDIA GeForce2 GTS

Вот и настала пора выхода в свет новых видеочипсетов, о которых так много говорилось. Если в отношении 3dfx Voodoo5 многое было известно еще осенью 1999 года, то о NVIDIA NV15 ходило много разных слухов. Начиная с того, что это будет просто улучшенный GeForce256 с увеличенными частотами, и кончая тем, что NV15 будет иметь абсолютно новую архитектуру. И вот, 26 апреля 2000 года NVIDIA наконец объявила свой следующий акселератор GeForce2 GTS.

Мы еще в начале этого года высказывали предположения о сохранении марки GeForce в названии нового продукта. Действительно, это имя появилось не так давно, но уже набрало достаточную популярность, и поэтому было бы глупо его бросать. На ум приходит аналогия годичной давности, когда появился чипсет NVIDIA Riva TNT2, также, как и GeForce2 GTS, имеющий число 2 в названии и ставший, по сути, просто разогнанным вариантом NVIDIA Riva TNT (пусть и с небольшими улучшениями). Но ныне ситуация совсем другая: NVIDIA GeForce2 GTS - это принципиально новый чипсет, пусть и имеющий много общего с предыдущим. Не зря его название имеет суффикс GTS, расшифровывающийся как GigaTexel Shading. В нем отражен и огромный потенциал чипа по скорости заполнения сцены, и новая технология NVIDIA Shading Rasterizer. Поговорим об этом подробнее.

Спецификация

Ниже я представлю спецификацию нового чипсета NVIDIA GeForce2 GTS:

  • 256-разрядное графическое ядро
  • Технологический процесс: 0.18 мкм
  • Частота графического ядра: 200 МГц
  • Число конвейеров рендеринга: четыре с двумя блоками текстурирования на каждом
  • Частота работы шины памяти: до 200 Мгц
  • Поддерживаемые типы памяти: DDR SGRAM и стандартная SDR SDRAM/SGRAM
  • Поддерживаемый объем локальной видеопамяти: от 8 до 128 Мб
  • Ширина полосы пропускания памяти: 5.3 Гб в сек. (пиковая при частоте 166 МГц работы памяти типа DDR)
  • Pixel Fillrate: 800 млн. пикселей в секунду
  • Texel Fillrate:
    • 1 texel per 1 Pixel 800 млн. текселей в секунду
    • 2 texel per 1 Pixel 1600 млн. текселей в секунду
  • RAMDAC: 350 МГц
  • Максимальное разрешение: 2048x1536@75Hz
  • Интегрированный в чип TMDS трансмиттер позволяет подключать цифровые мониторы и поддерживает разрешение вплоть до 1600x1200
  • Интерфейс внешней шины: полная поддержка AGP x2/x4 (включая SBA, DME и Fast Writes) и PCI 2.2 (включая Bus mastering).

3D-графика:

  • Геометрический движок GeForce 2 GTS — аппаратная реализация преобразования координат, установка освещения, clipping (отсечение полигонов, не входящих в конечный кадр)
  • Производительность HW T&L: 25 млн. текстурированных полигонов в секунду (пиковая)
  • Аппаратная установка 8 источников света для всей сцены
  • Полная поддержка OpenGL и DX7 — Tranform & Lighting, Cube environment mapping (кубического текстурирования картами окружения), projective textures (проекция текстур) и компрессия текстур
  • Движок NSR обеспечивает аппаратную поддержку Pixel Shaders через D3D8
  • Поддержка аппаратного сглаживания всей сцены (Full-scene hardware anti-aliasing, HW FSAA)
  • Поддержка реализации таких эффектов, как Motion Blur, Depth of Field через D3D8
  • Полная поддержка методов компрессии DXTC и S3TC через DX и OpenGL соответственно
  • Аппаратная поддержка интерполяции вершин полигонов (vertex blending) с применением двух skinning-матриц
  • Рендеринг при 16- и 32-битной глубине представления цвета
  • Аппаратная поддержки рельефного текстурирования следующих типов: Embosing и Dot Product3
  • Поддерживаются текстуры вплоть до 2048x2048 @ 32 bit
  • Программируемые режимы смешивания нескольких текстур
  • Буфер шаблонов (стенсель): 8 бит
  • Z-буфер: 16/24/32 бит
  • Полноценная поддержка в драйверах аппаратного ускорения OpenGL 1.2 под ОС Linux

Видео:

  • Поддерживается аппаратное декодирование всех форматов HDTV
  • Поддерживаются все разрешения ATSC, включая 1080i
  • Поддерживается 8-bit режим альфа-смешивания видео и графики
  • Поддерживается VIP 2.0 порт уровня I (8 бит, 75 МГц), что позволяет подключать внешние MPEG2 декодеры/кодеры.
  • Для вывода видеосигнала на ТВ требуется установка TV-кодера, а в сам чип GeForce 2 GTS встроен цифровой интерфейс для подключения этих ТВ кодеров

Подробно особенности нового чипсета рассматривались недавно в нашей аналитической статье, я же лишь кратко пройдусь по основным параметрам.

Самое главное отличие нового GPU от конкурентов — это наличие четырех конвейеров рендеринга, каждый из которых содержит по два текстурных процессора, что позволяет новому чипсету получить колоссальное преимущество в играх, поддерживающих мультитекстурирование. Какое-то время назад я говорил о том, что чипсеты фирмы 3dfx (Voodoo2, Voodoo3) обладают бесплатным мультитекстурированием, когда к работе подключается второй модуль TMU. Таким образом, при той же скорости обработки пикселей скорость наложения текстур увеличивается вдвое, либо возникает возможность за один такт и наложить текстуру и осуществить, например, трилинейную фильтрацию. Этой возможности не было у чипсетов от NVIDIA, поскольку они все имели по одному TMU на каждом конвейере. При включении режима мультитекстурирования конвейеры спаривались, и при этом скорость обработки пикселей, естественно, падала в два раза. У чипсета NVIDIA GeForce2 GTS же получается так, что этот режим дает то самое бесплатное мультитекстурирование, в то время как в играх без его поддержки чипсет будет выглядеть похожим по структуре на NVIDIA GeForce256, который также обрабатывает 4 пикселя за такт, накладывая на каждый пиксель по одной текстуре. Однако не надо думать, что при этом GeForce2 GTS станет по производительности равным GeForce256. Посмотрите на скорости заполнения сцены! Если у NVIDIA GeForce256 — это 480 миллионов пикселей в секунду, то у NVIDIA GeForce2 GTS — уже 800 миллионов. Поэтому последний будет намного быстрее в играх любого типа, хотя, подчеркну, что в играх с мультитекстурированием преимущество NVIDIA GeForce2 GTS будет более существенным. Впрочем, не надо забывать, что игр, не поддерживающих мультитекстурирование, уже практически не осталось.

Еще одним важным свойством, появившимся еще у NVIDIA GeForce256, стала поддержка настоящей трилинейной фильтрации. Качество анизотропной фильтрации у NVIDIA GeForce2 GTS также значительно улучшено благодаря использованию не восьми, как у GeForce256, а шестнадцати текстурных сэмплов.

NVIDIA Shading Rasterizer

Изюминкой нового чипсета стало наличие в нем нового блока — NVIDIA Shading Rasterizer (NSR). Как я уже выше сказал, чипсет NVIDIA GeForce2 GTS оптимизирован для выполнения мультитекстурирования, иными словами для того, чтобы за такт накладывать больше одной текстуры на пиксель, выполняя различные операции смешения (blending) над текстурами. Так вот, порядок и способ смешения ранее был задан жестко, и разработчик игры не мог вмешиваться в этот процесс. Теперь же через специальный Pixel Shader API, который будет идти в составе DirectX 8.0, появляется возможность задать формулу, по которой будут реализовываться мультитекстурные эффекты.

 

На этих примерах можно видеть различные подобные эффекты и операции, связанные с цветом, полученным после операции расчета освещенности (D), накладыванием базовой текстуры (T) и получением отражения (R).

Замечу, что все вычисления производятся для каждого пикселя, входящего в полигон (треугольник), в результате мы имеем более точный результат, а значит и отсутствие артефактов, и блестящую качественную графику.

Pixel Shader и NSR серьезно меняют концепцию мультитекстурирования, поэтому разработчикам игр, желающим использовать новую технологию, придется разрабатывать новый модуль для реализации мультитекстурирования. И это, естественно, отразится на скорости появления игр, использующих все эти новшества. Справедливости ради замечу, что эта технология даст возможность легко реализовать, например, Environmental Mapped Bump Mapping (EMBM). И конечно, нельзя не обратить внимание на то качество, которое мы можем получить при использовании NSR:

Рельефное текстурирование

Поддержка этого вида текстурирования по технологии Dot Product или Emboss является важным преимуществом NVIDIA GeForce2 GTS:


Bump Mapping

No Bump Mapping

Слева — скриншот, где присутствует рельефное текстурирование, а справа — отсутствует. Скриншоты выполнены на демо-версии игры Isle of Morg от Experience, которая поддерживает все новейшие функции последних чипсетов от NVIDIA.

Кубическое текстурирование

Как видно из характеристик чипсета, NVIDIA GeForce2 GTS поддерживает кубическое наложение текстур при использовании карт среды окружения:

Этот способ дает нам возможность реализации реалистичного отражения окружающих наблюдателя объектов.

Как мы видим, возможности современных видеоакселераторов крайне широки. Если к этому еще приплюсовать вычислительные мощности аппаратного модуля T&L, позволяющего значительно разгрузить CPU от задач расчета отображаемой картинки, то становится малопонятно, почему мы до сих пор играем в блеклые некрасивые игры с глупыми монстрами. Мне приходится еще и еще раз сожалеть, что разработчики игр до сих пор не выпускают игр, где можно видеть такую прекрасную графику, какую нам демонстрируют разработчики чипов в своих технологических демо. Конечно, куда проще идти по проторенной дорожке, используя примитивные модели и 8-битные текстуры размером 256х256… Получается, что пока многие возможности современных видеокарт так и остаются невостребованными по вине разработчиков, которые попросту игнорируют многие новые функции.

Ну что же, на этом я закончу повествование об особенностях чипсета NVIDIA GeForce2 GTS и перейду непосредственно к видеокарте, которая представляет этот чип.

Плата

Эта плата представляет собой опытный образец от NVIDIA, иными словами reference card. На основе дизайна этой карты производители будут выпускать свои платы, которые не должны от нее сильно отличаться. Карта базируется на AGP2x/4x интерфейсе, имеет 32 мегабайта DDR SGRAM памяти, размещенной в 8-ми микросхемах по обеим сторонам PCB. Микросхемы произведены фирмой Infineon и имеют время доступа 6 ns.

Как мы видим, на карте установлена точно такая же память, как и на платах на NVIDIA GeForce256 с DDR памятью. Однако, в данном случае она работает на своей штатной частоте 166 МГц (333 МГц в пересчете на SDR-память). Я могу сразу предположить, что прироста частоты памяти на 16 МГц по сравнению с платами на NVIDIA GeForce256 с DDR-памятью (150 МГц) для такого мощного чипсета явно недостаточно. И с некоторой тревогой жду повторения ситуации с NVIDIA GeForce256 картами с SDR-памятью, для которых пропускная способность памяти является узким местом.

Рассматривая плату, сразу можно заметить, что она имеет TV-out, но вся разводка, в том числе и микросхема BT869, отвечающая за эту функцию, размещены на дочерней плате.

Мы уже видели подобную реализацию TV-out на картах от ATI (RAGE FURY). Такое дизайнерское решение имеет целью получить на PCB универсальный коннектор для использования совместно с картой различных дочерних плат с TV-out, TV-in или TV-in/out на борту. Таким образом, не переделывая эталонный дизайн, производители видеокарт могут выпускать его различные модификации, в том числе и целый мультимедийный комбайн. Также это может дать улучшение качества выводимого на монитор изображения, поскольку замечено, что наличие разводки TV-out на самой карте часто несколько портит четкость картинки.

Чипсет закрыт приклееным на него активным кулером привычной уже конструкции с утопленным в радиатор вентилятором. Чип греется не столь сильно, как NVIDIA GeForce256, поэтому думается, что его разгон будет вполне возможен.

Установка и драйвера

Вместе с видеокартой поставлялись референс-драйверы от NVIDIA версии 5.16, которые по настройкам мало чем отличаются от предыдущих версий, которые мы рассматривали ранее. Я остановлюсь только на двух основных отличиях новой версии драйверов в части поддержки NVIDIA GeForce2 GTS.

На этой закладке в разделе Direct3D мы можем видеть настройки анти-алиасинга (Anti-Aliasing (АА) — эффект сглаживания неровных краев объектов). Как известно, при работе в низких разрешениях в 3D главным недостатком является наличие неровных краев (так называемых лестниц) у объектов, что портит восприятие трехмерной сцены. В эпоху появления чипсетов NVIDIA Riva TNT была введена поддержка анти-алиасинга через суперсэмплинг (оверсэмплинг) — осуществление рендеринга не в заданном разрешении, а вдвое большем, с последующим уменьшением полученной картинки до заданных размеров, что приводило к пропаданию "лестниц" на краях объектов. Однако, естественно, скорость работы карты в таком режиме будет сильно падать (представьте себе, что для показа трехмерной сцены в 800х600 видеокарта должна обработать сцену в разрешении 1600х1200). Именно из-за низкой эффективности этого метода анти-алиасинга, возможность его включения была изъята из драйверов предыдущих версий.

В характеристиках NVIDIA GeForce2 GTS сказано, что этот чипсет поддерживает анти-алиасинг, причем полносценный (Full Scene AA — FSAA). Как можно видеть на скриншоте с драйверов, введено семь градаций FSAA, то есть несколько его видов, от самого простого (ползунок слева) до самого сложного (ползунок справа). К сожалению, в данной версии драйверов работает только один вид FSAA — когда при суперсэмплинге идет выборка субпикселей по маске 2х2 (то есть при этом результурующие цвета границ объектов получаются при выборке 2-субпикселей по горизонтали и 2-х по вертикали). NVIDIA обещает в следующей версии драйверов ввести разные виды FSAA. Так же отмечу, что принудительное включение FSAA распространяется далеко не на все игры. На данный момент FSAA поддерживается только играми, знающими этот эффект, например, Expendable.

Здесь мы можем включить режим FSAA в OpenGL, и тоже пока только в одном виде — при маске 2х2. NVIDIA также обещает ввести гибкую установку видов FSAA и в OpenGL.

Отмечу, что технология S3TC в драйверах поддерживается изначально, и ее отключить, например, в Quake3 можно только через переменную r_ext_compress_textures. Что же касается Direct3D, то тут технология компрессии текстур DXTC используется при наличии поддержки со стороны приложения.

Хочу остановиться еще на одном актуальном моменте: работе AGP-текстурирования в OpenGL у видеокарт на базе чипсетов от NVIDIA. Эта тема обсуждается уже много времени, и все были вынуждены констатировать, что драйверы от NVIDIA не поддерживают DiME режим в OpenGL, то есть обработку текстур непосредственно в оперативной памяти компьютера, а не просто использование ОЗУ как буфера для хранения текстур. В результате, даже мощнейшие карты вроде Creative 3D Blaster GeForce256 Annihilator Pro на "тяжелых" тестах типа Quake3 Quaver (на уровне q3dm9 с максимальным качеством текстур) очень сильно проседали:

Обратите внимание на резкое падение скорости в 32-битном цвете. В этом тесте преобладают большие текстуры размером более 512х512, объем которых в сумме превышает доступный объем локальной видеопамяти, поэтому требования к AGP-текстурированию в данном случае более чем актуальны. И мы видим, что мощнейший акселератор просто резко сдал по скорости, натолкнувшись на отсутствие режима DiME в драйвере версии 3.68.

Затем посмотрите, что же случилось при смене драйвера на версию 5.16. По-моему, комментарии излишни. Я могу только с удовлетворением отметить, что наконец-то поддержка AGP заработала в полную силу. К сожалению, я не могу точно гарантировать работу DiME на чипсетах NVIDIA Riva TNT/TNT2, так как я не испытывал на них работу этого режима.

Производительность

Предваряя рассказ о самом трепетном для тестера разделе — о результатах тестирования, я познакомлю с конфигурацией лабораторных стендов:

Стенд на базе процессора Intel Pentium III:

  • процессор Intel Pentium III 733;
  • системная плата Chaintech 6ATA4 (VIA Apollo Pro 133A);
  • оперативная память 256 MB PC133;
  • жесткий диск IBM DPTA 20 GB;

Стенд на базе процессора AMD Athlon:

  • процессор AMD Athlon 700;
  • системная плата ASUS K7M (AMD750);
  • оперативная память 256 MB PC100;
  • жесткий диск Quantum FB CR 6.4 GB.

На обоих стендах установлена операционная система Windows 98 SE, использовались мониторы ViewSonic P810 (21'') и NOKIA 447Xav (17'').

Напомню, что тестирование проводилось на драйверах версии 5.16 при отключенном Vsync (синхронизация частот дискретизации видеокарты и обновления монитора). Для сравнительного анализа были сняты показания с видеокарты на базе NVIDIA GeForce256 с DDR-памятью — Creative 3D Blaster GeForce256 Annihilator Pro.

Начну с 2D-графики. Оценку скоростных параметров мы осуществляли при помощи WinBench99, набором тестов Graphics Marks. При измерении скорости работы карт в 2D в разрешении 1600х1200 в 32-битном цвете были получены следующие результаты:

  Business Graphics Winmark HighEnd Graphics Winmark
NVIDIA GeForce256 DDR 326 907
NVIDIA GeForce2 GTS 329 909

Как мы видим, скорости у обеих карт примерно одинаковые. В принципе, этот результат был вполне ожидаем, так как увеличивать скорость работы игровой карты в 2D больше нет никакого смысла, на глаз все последние видеокарты работают одинаково быстро. Это может устроить любого пользователя.

А вот что касается качества 2D-графики, то тут есть что сказать. Я понимаю, что могу вызвать бурю негодования поклонников фирмы Matrox, но я скажу, что по качеству двумерной картинки NVIDIA GeForce2 GTS догнала Matrox G400 и в высоких разрешениях (1600х1200). Я хоть и был удовлетворен качеством 2D и на картах NVIDIA GeForce256, но такого качества я еще у карт на чипах от NVIDIA не видел! Хотя, конечно, надо учитывать и то, что мы тестировали только опытный экземпляр карты на чипсете NVIDIA GeForce2 GTS, вполне возможно, что карты от иных производителей будут иметь разные уровни качества картинки в 2D.

Почему же достигнуто такое качество в 2D? Вроде бы RAMDAC имеет частоту 350 МГц, как и у NVIDIA GeForce256, а разница все же есть. В нашей первой статье о NVIDIA NV15 мы писали о том, что в данном чипсете NVIDIA использует совершенно новый RAMDAC, который, хоть и находится в одном корпусе с чипсетом, не интегрирован в ядро GPU. Вероятно это одна из причин увеличения качества. Однако мне кажется, что есть и иная причина, состоящая в вынесении разводки TV-out с основной PCB на дочернюю плату.

Приступаем к рассмотрению 3D-графики с точки зрения производительности видеокарты. Нам предстоит не только увидеть ту скорость, что дает NVIDIA GeForce2 GTS, но и посмотреть на ее работу с включенным FSAA, а также на поддержку S3TC.

В качестве инструментария мы использовали следующие программы:

  • id Software Quake3 v.1.16n — игровой тест, демонстрирующий работу платы в OpenGL с использованием:
    • стандартного демо-бенчмарка demo002 (на этом бенчмарке также получены результаты работы карты при включенном FSAA)
    • бенчмарка quaver, демонстрирующего работу платы в тяжелых условиях при множестве больших текстур (сразу отмечу, что все тесты на этом демо проводились при максимальной детализации текстур)
    • бенчмарка annihilator, демонстрирующего работу платы на специальном уровне dmmq3dm6, выпущенного фирмой S3/Diamond для демонстрации S3TC-технологии
  • Rage Expendable (timedemo) — игровой тест, демонстрирующий работу платы в Direct3D в режиме мультитекстурирования, а также при включенном FSAA
  • Epic Unreal Tournament (testd3d) — игровой тест, демонстрирующий работу в Direct3D при высоких нагрузках на акселератор и CPU.
  • NVIDIA Grove (бывший TreeMark) — синтетический тест, демонстрирующий производительность Hardware TCL (T&L) в OpenGL при различном количестве источников света и сценах разной сложности

Quake3 Arena

Тестирование проводилось на двух режимах: Fast (демонстрирует работу карты в 16-битном цвете) и High Quality (демонстрирует работу карты в 32-битном цвете). Результаты на платформе Pentium III (присутствуют также данные по тестированию с включенной поддержкой S3TC и с включенным FSAA):


Как мы можем видеть, в 16-битном цвете NVIDIA GeForce2 GTS резко ушла вперед, намного обогнав соперника в высоких разрешениях. Включение S3TC (переменной r_ext_compress_textures необходимо присвоить значение 1) мало что дает по скорости. А вот режим с FSAA делает в 16-битном цвете разрешения выше 800х600 просто неиграбельными. Играть с FSAA в 32-битном цвете просто невозможно. Падение в скорости колоссально. Правда, я лично не вижу особого смысла в FSAA в этом случае, так как игра даже в 1280х1024 дает неплохие результаты по скорости, а в разрешениях выше 1024х768 присутствие эффекта FSAA совершенно не заметно. В 32-битном цвете хочу отметить не столь значительный прирост по скорости по сравнению с платой на NVIDIA GeForce256 с DDR-памятью. Вам ничего эта картина не напоминает? Мне же эта ситуация живо напомнила историю с NVIDIA GeForce256 с SDR-памятью, когда память становится узким местом у акселератора. К прискорбию, история повторяется…

Результаты на платформе Athlon:


Мы можем видеть похожую картину: более значительное опережение соперника в 16-битном цвете и менее значительное — в 32-битном.

Целью следующего теста является нагрузка акселераторов сверхбольшими текстурами при выключенной поддержке S3TC, чтобы оценить их работу при интенсивном AGP-текстурировании. Во всех тестах использовалось демо quaver и ползунок уровня детализации текстур был установлен в максимальное положение:


Я могу с удовлетворением отметить, что даже в столь тяжелых условиях карта на NVIDIA GeForce2 GTS может обеспечить хорошую играбельность в 1024х768х32, а в 16-битном цвете — так вообще во всех разрешениях!


А на этой платформе показатели получились даже еще лучше. Не зря было много отзывов о том, что в своих последних драйверах NVIDIA значительно улучшила работу видеокарт на ситемных платах с чипсетом AMD750 в части AGP-текстурирования. И вот результат налицо.

Некоторое время назад появились дополнительные уровни к Quake3, использующие технологию сжатия текстур S3TC и содержащие великолепно нарисованные огромные текстуры, что давало в свое время возможность владельцам карт на чипсете S3 Savage2000 наслаждаться прекрасной графикой. Ныне же, благодаря соглашению о кросслицензировании между NVIDIA и S3, поддержка технологии S3TC в OpenGL появилась и у карт на чипсетах NVIDIA.

Поэтому при помощи демо-бенчмарка Annihilator (уровень dmmq3dm6) мы можем оценить скорость работы NVIDIA GeForce2 GTS при полноценном использовании S3TC.


Я могу констатировать, что картина похожа на предыдущий случай: в 32-битном цвете карта дает прекрасную скорость в разрешении 1024х768 и даже неплохую в 1280х1024, а 16-битном цвете — на всех разрешениях производительность прекрасная.


Соотношение результатов почти аналогичное, но абсолютные цифры повыше, что дает отличную играбельность и в 1280х1024х32.

Таким образом, проанализировав работу NVIDIA GeForce2 GTS в Quake3, я могу сказать, что работу FSAA не иначе как провалом назвать нельзя. Я, конечно, понимаю, что это самый тяжелый для карты режим, однако играть с FSAA можно только на самых низких разрешениях. Впрочем, этот недостаток с лихвой компенсируется отличной скоростью работы платы в высоких разрешениях. Не столь значительный прирост по производительности относительно NVIDIA GeForce256 DDR в 32-битном цвете явно указывает на нехватку пропускной способности применяемой с GeForce2 GTS DDR-памяти.

Expendable

На примере данной игры мы посмотрим на скорость карты в Direct3D, в том числе и при включенном FSAA, а также оценим масштабируемость NVIDIA GeForce2 GTS, то есть зависимость быстродействия этой карты от частоты центрального процессора.


Как мы видим, играбельность находится на очень высоком уровне, производительность NVIDIA GeForce2 GTS практически везде упирается в мощность центрального процессора (кроме лишь 1600х1200, где мы видим еще и сильный отрыв от NVIDIA GeForce256 DDR).

В обоих случаях мы можем наблюдать почти двукратное падение в скорости при включении FSAA. Хочу заметить, что в разрешениях выше 800х600 FSAA просто не работает (блокируется драйверами). И еще раз напомню, что на данный момент в драйверах версии 5.16 FSAA работает только по самой сложной схеме и может быть востребован только в играх, понимающих эту функцию, поэтому на данном этапе в большинстве Direct3D игр увидеть FSAA невозможно.


А вот в 32-битном цвете картина несколько иная. Если на разрешениях до 1024х768 включительно мы снова наблюдаем упор скорости в производительность центрального процессора, то в дальнейшем отрыв от NVIDIA GeForce256 DDR уже не столь велик, как в 16-битном цвете. Хотя, безусловно, играть можно вплоть до 1600х1200х32.

Посмотрим на масштабируемость.


Как можно видеть, скорость, показываемая NVIDIA GeForce2 GTS достаточно сильно зависит от частоты центрального процессора, выдавая, тем не менее, на 550-мегагерцовом Pentium III неплохие результаты.

По итогам тестирования в Expendable хочу отметить, что даже 733-мегагерцового процессора уже подчас недостаточно для достижения максимальных для данной карты результатов в 16-битном цвете (кроме разве что разрешения 1600х1200). Несильный прирост по скорости в 32-битном цвете снова указывает на ограничение, накладываемое пропускной способностью памяти. Работу FSAA я подробно пока не анализирую до выхода полноценной поддержки этого эффекта в драйверах, когда можно будет найти оптимальное соотношение между качеством FSAA и падением производительности при его включении.

Unreal Tournament

Я признаюсь, что мне поначалу не очень хотелось включать этот тест в анализ производительности NVIDIA GeForce2 GTS по двум причинам: слишком большой зависимости скорости в этой игре от центрального процессора и изначальную оптимизацию движка под Glide, что ставит карты, работающие в Direct3D-режиме в заведомо невыгодное положение. Однако, впоследствии я пришел к выводу, что в преддверии появления на массовом рынке новых карт от 3dfx, да и в силу популярности игры Unreal Tournament следует все же провести исследование работы NVIDIA GeForce2 GTS в этой игре.


Как можно видеть, существенное отличие от NVIDIA GeForce256 DDR в большую сторону есть только на сверхвысоких разрешениях. В 32-битном цвете играбельность в разрешениях до 1024х768 включительно находится на высоком уровне, а в 16-битном цвете и в 1600х1200 можно спокойно играть. Замечу, что эта игра построена так, что 32-битный цвет в ней не столь заметен, нежели, например, в Quake3, поэтому без особых потерь в качестве можно играть и в 16-битном цвете.

Grove

Данный тест демонстрирует производительность блока Hardware TCL (T&L). То есть в этой программе все операции по расчету освещенности, трансформации координат и отсечению невидимых участков (clipping) возложены на геометрический сопроцессор. NVIDIA выпустила новую версию своего теста TreeMark, который теперь называется Grove. В новой версии, в частности, можно задать не одно дерево, а несколько (до 10) и посмотреть работу акселератора в очень тяжелых для него условиях.

Тестирование проводилось при установках по умолчанию (количество деревьев 1, уровень сложности depth 5, число источников освещения lights 4):

Как можно видеть, GPU в GeForce2 GTS значительно сильнее предыдущего, GeForce256 DDR.

Ниже мы покажем зависимость производительности GPU от сложности сцены (количества полигонов):

По этому графику видно, что характер кривой практически не изменился, однако результаты NVIDIA GeForce2 GTS лучше.

А здесь представлена диаграмма зависимости производительности GPU от числа источников освещения:

Тут у NVIDIA GeForce2 GTS и NVIDIA GeForce256 мы можем наблюдать похожие кривые, однако опять результаты нового чипсета значительно лучше. Можно отметить, что у нового чипсета установка большого числа источников света при Hardware T&L уже не будет вызывать настолько сильного падения в скорости, что будет страдать играбельность.

Таким образом, мы можем констатировать, что, объявляя новый геометрический сопроцессор у NVIDIA GeForce2 GTS более мощным, нежели у предшественника, NVIDIA не нас обманула. Действительно, мощность его выросла, хотя на очень сложных сценах (выше 120000 полигонов) производительность пока невысока и мало отличается от демонстрируемой NVIDIA GeForce256.

Подводя черту под анализом производительности NVIDIA GeForce2 GTS, я хочу сделать следующие выводы:

  1. В целом, прирост по скорости по сравнению с NVIDIA GeForce256 DDR имеется, в 16-битном цвете разрешения 1600х1200 становятся играбельными практически во всех играх;
  2. Нехватка пропускной способности 166 МГц DDR памяти сказывается на приросте по скорости в 32-битном цвете. Это приводит к тому, что уровень хорошей играбельности по сравнению с GeForce256 мало где сдвинулся выше разрешения 1024х768х32, а на этом разрешении можно играть и на NVIDIA GeForce256 DDR. Для получения более убедительных доказательств нехватки пропускной способности памяти я приведу таблицу с результатами NVIDIA GeForce2 GTS (в разрешении 1280х1024 в 32-битном цвете на игре Quake3, demo002), показываемыми этой картой при разгоне, где видно, как влияет на производительность разгон чипсета и разгон памяти:

    Частота чипа, МГц 200 210 220 230 235
    Прирост производительности 0% 2% 3% 5% 6%


    Частота памяти, МГц 333 340 350 360 370 380 400
    Прирост производительности 0% 5% 7% 8% 10% 12% 18%

    Как можно видеть, разгон памяти до 400 МГц дает очень большой прирост — почти 20%. Что и требовалось доказать. Установи NVIDIA на свою плату 200-мегагерцовые модули DDR-памяти, картина была бы совершенно иной! А пока я должен с огорчением констатировать, что NVIDIA со своим 200-мегагерцовым чипсетом оказалась "впереди паровоза", то есть производительность видеокарты ограничивается скоростью памяти.
  3. Эффект полносценного анти-алиасинга (FSAA) на данный момент представляет собой довольно жалкое зрелище по скорости. Падение производительности при включении FSAA очень велико даже на низких разрешениях. Играть с FSAA можно только разве что в 640х480. Однако я должен отметить, что пока не введена градация глубины этого эффекта, а в данной версии драйверов используется максимально возможный FSAA. Кроме того, в Direct3D FSAA работает далеко не во всех играх.

Качество 3D-графики

Прежде всего мы покажем, что же нам может дать эффект FSAA в точки зрения визуального улучшения графики. Сначала посмотрим на скриншоты без FSAA:

 

А теперь посмотрим на те же участки, но при включенном FSAA:

 

Как можно видеть, эффект сглаживания налицо, хотя и не столь на блестящем уровне (посмотрите на картинку справа). Все равно некоторые неровности еще остались.

Безусловно, если FSAA будет и дальше будет вызывать столь значительное падение скорости и небезупречное качество, то он просто не нужен в данном акселераторе. Справедливости ради я еще раз отмечу, что все же производительность GeForce2 GTS такова, что можно свободно играть в высоких разрешениях, где присутствие FSAA практически уже не требуется.

Что же касается качества 3D-графики в целом, то оно просто великолепно! Работает полноценная трилинейная фильтрация, анизотропная фильтрация, поддерживается S3TC в полном объеме, что дает нам видеть отличные сцены с детализированными объектами:

В предверии выхода GeForce2 GTS NVIDIA выпустила специальный уровень для Quake3 — NVIDIA Bunker, в котором используются огромные текстуры и разнообразные эффекты, сильно нагружающие акселератор. Этот уровень при максимальной детализации графики и текстур свободно может потянуть только мощнейший акселератор класса NVIDIA GeForce2 GTS:

Дополнительные функции

Конечно же, при все большем распространении на рынке DVD, многих интересует работа новых карт с точки зрения поддержки DVD-видео.

Я уже отмечал, что чипсеты NVIDIA GeForce256 полноценно поддерживают Motion Compensation при декодировании MPEG2-потока. Самый распространенный программный плеер, полноценно поддерживающий этот чипсет — это InterVideo WinDVD 2000. Я рекомендую скачать утилиту по комплексной настройке DVD-плееров DVD Genie, в которой есть и поддержка NVIDIA GeForce256. Новый же чипсет NVIDIA GeForce2 GTS пока неизвестен этим программам, однако, я думаю, что в ближайшее время появится и специальная поддержка этого чипсета. Тем не менее, при оптимизации всех функций под NVIDIA GeForce256, изображение на NVIDIA GeForce2 GTS было просто отличным:

И при этом загрузка процессора составляла всего 18-22% ! Прекрасный результат!

Выводы

NVIDIA выпустила мощнейший на сегодняшний день акселератор, обладающий целой гаммой достоинств и особенностей. Однако, не могу обойти вниманием большой недостаток новейшего акселератора — медленная 166 МГц DDR-память, являющаяся существенным тормозом для GeForce2 GTS. Правда, возможно вскоре мы все же увидим новые карты на NVIDIA GeForce2 GTS с более быстрой памятью, но сейчас на этот счет ничего не известно. А пока могу констатировать, что карта на этом чипсете не столь сильно ушла вперед в производительности в 32-битном цвете по сравнению с NVIDIA GeForce256 DDR. Тем не менее, прирост есть, и ощутимый. Играбельность безусловно выросла: подчас возможна комфортная игра и в разрешении 1280х1024х32.

А вот с Full Scene Anti-Aliasing фирма-производитель явно подкачала. Пока мы не будем рассматривать подробно те негативные моменты в реализации FSAA, уповая на обещание NVIDIA в следующей версии драйверов привести в порядок дела с реализацией этой функции. Когда мы будем рассматривать серийные карты, выпущенные на базе NVIDIA GeForce2 GTS, мы вернемся к этой проблеме. Тем не менее, я отмечу, что пока можно считать, что FSAA просто нет, ибо с таким падением по скорости он никому не нужен (кроме разве лишь разрешений 640х480).

Как важное достоинство чипсета, я отмечу поддержку технологии S3TC. И еще раз хочу отметить великолепное качество в 2D-графике, что дает нам новый продукт.

К сожалению, согласно поступающей информации, видеокарты на этом чипсете будут иметь завышенную цену. Поэтому на данный момент я мог бы рекомендовать приобретать эти видеокарты только тем, кто хотел остановить свой выбор на NVIDIA GeForce256 DDR — картах. Желающим проапгрейдиться с более слабых чипсетов я рекомендую пока подождать некоторого спада цен, а также выхода в широкую продажу карт от 3dfx — Voodoo5 5000 и Voodoo5 5500, которые пока для нас являются "темными лошадками".

Плюсы:

  • Высочайшая производительность;
  • Отличное качество 2D-графики в высоких разрешениях;
  • Хорошая разгоняемость чипсета, благодаря 0.18 мкм технологии;
  • Поддержка технологий S3TC, EMBM;
  • Отличная отлаженность драйверов в части поддержки всех основных функций (кроме FSAA).

Минусы:

  • Не столь выдающийся прирост по скорости по сравнению с предшественником из-за уже ставшей низкой пропускной способности 166 МГц DDR-памяти;
  • Сильное падение скорости при включении FSAA;
  • Сильно завышенная первоначальная цена на видеокарты на этом чипсете;
  • Практическое отсутствие реальных игр, поддерживающих большинство представленных технологий и достоинств чипсета NVIDIA GeForce2 GTS.