Обзор NVIDIA GeForce 6200 TurboCache 16/32MB (128MB) (NV44)




СОДЕРЖАНИЕ

  1. Особенности видеокарты
  2. Конфигурации стендов, список тестовых инструментов, качество в 2D
  3. Результаты тестов: Unreal Tournament 2004
  4. Результаты тестов: TRAOD
  5. Результаты тестов: FarCry Research
  6. Результаты тестов: FarCry Regulator
  7. Результаты тестов: FarCry Pier
  8. Результаты тестов: Half-Life2, ixbt01
  9. Результаты тестов: Half-Life2, ixbt02
  10. Результаты тестов: Half-Life2, ixbt03
  11. Результаты тестов: DOOM III
  12. Результаты тестов: 3DMark05 Game1
  13. Результаты тестов: 3DMark05 Game2
  14. Результаты тестов: 3DMark05 Game3
  15. Результаты тестов: 3DMark05 MARKS
  16. Выводы


Официальные спецификации GeForce 6200 TC

  • Кодовое имя чипа NV44
  • Технология 110 нм (TSMC)
  • 77 миллионов транзисторов
  • FС корпус (перевернутый чип, без металлической крышки)
  • 64 бит двуканальный интерфейс памяти
  • До 64 мегабайт DDR/GDDR-2/GDDR-3 памяти
  • Встроенный в чип PCI Express16х шинный интерфейс
  • Возможность трансляции интерфейса в APG 8х с помощью двустороннего PCI Express<->AGP моста HIS
  • Расширенные возможности использования системной памяти адресуемой через PCI Express для хранения буферов кадра, текстур и другой информации традиционно располагаемой в локальной памяти.
  • 4 Пиксельных процессора, по одному текстурному блоку на каждом с произвольной фильтрацией целочисленных и плавающих текстур (анизотропия степени до 16х включительно).
  • 3 Вершинных процессора, по одному текстурному блоку на каждом, без фильтрации выбираемых значений (дискретная выборка)
  • Вычисление, блендинг и запись до 2 полных (цвет, глубина, буфер шаблонов) пикселей за такт
  • Вычисление и запись до 4 значений глубины и буфера шаблонов за такт (если не производятся операции с цветом)
  • Поддержка «двустороннего» буфера шаблонов
  • Поддержка специальных оптимизаций прорисовки геометрии для ускорения алгоритмов теней на основе буфера шаблонов (т.н. технология Ultra Shadow II) в частности широко используемых в движке Doom III
  • Все необходимое для поддержки пиксельных и вершинных шейдеров версии 3.0, включая динамические ветвления в пиксельных и вершинных процессорах, выбор значений текстур из вершинных процессоров и т.д.
  • Фильтрация текстур в плавающем формате
  • Поддерживается буфер кадра в плавающем формате (включая операции блендинга)
  • MRT
  • 2 RAMDAC 400 МГц
  • 2 DVI интерфейса (требуются интерфейсные чипы)
  • TV-Out и TV-In интерфейс (требуются интерфейсные чипы)
  • Программируемый потоковый видеопроцессор (для задач компрессии, декомпрессии и постобработки видео)
  • 2D ускоритель с поддержкой всех функций GDI+
  • Встроенный мониторинг температуры и энергопотребления

Спецификации референсной карты GeForce 6200 TC-16

  • Частота ядра 350 МГц
  • Эффективная частота памяти 700 МГц (2*350 МГц)
  • Шина памяти 32 бит
  • Тип памяти GDDR
  • Объем памяти 16 мегабайт
  • Пропускная способность памяти 2,8 гигабайта в сек.
  • Теоретическая скорость закраски 700 мегапикселей в сек.
  • Теоретическая скорость выборки текстур 1.4 гигатекселя в сек.
  • Один VGA (D-Sub) и один DVI-I разъем
  • TV-Out
  • На PCI-Express карте разъем для дополнительного питания не нужен

Спецификации референсной карты GeForce 6200 TC-32

  • Частота ядра 350 МГц
  • Эффективная частота памяти 700 МГц (2*350 МГц)
  • Шина памяти 64 бит
  • Тип памяти GDDR
  • Объем памяти 32 мегабайт
  • Пропускная способность памяти 5,6 гигабайт в сек.
  • Теоретическая скорость закраски 700 мегапикселей в сек.
  • Теоретическая скорость выборки текстур 1.4 гигатекселя в сек.
  • Один VGA (D-Sub) и один DVI-I разъем
  • TV-Out
  • На PCI-Express карте разъем для дополнительного питания не нужен

Общая схема чипа

Какие-либо глобальные архитектурные отличия от NV40 и NV43 отсутствуют, есть некоторые новшества в пиксельном конвейере нацеленные на эффективную работу с системной памятью в качестве буфера кадра, но об этом будет рассказано далее.

В общем и целом NV44 является масштабированным (путем уменьшения числа вершинных и пиксельных процессоров и каналов контроллера памяти) решением, основанным на архитектуре NV40. Отличия количественные (на схеме выделены жирным), а не качественные — с точки зрения архитектуры чип практически не изменился.

Итак, в наличии 3 вершинных процессора, как у NV43, и один (было два) независимый пиксельный процессор, работающий с одним квадом (фрагментом 2х2 пикселя). PCI Express стал нативным, как и в случае NV43 и (т.е. реализован на чипе), а AGP 8х платы с этим чипом, видимо, пока, не планируются. По крайней мере, — в варианте TC (TurboCache), т.к. сама идея эффективного использования системной памяти для рендеринга требует адекватной пропускной способности графической шины в обе стороны. Если и появятся карты с буфером 64Мб и дополнительным двусторонний мостом PIC-E <-> AGP (показан пунктиром), стоимость их будет неоправданно высока для low-end сегмента, и они не смогут конкурировать с исконно AGP 8х решениями.

Кроме того, отметим очень важный ограничивающий момент — двухканальный контроллер и 64 (!) битную шину памяти — этот факт мы подробно обсудим и исследуем далее. Судя по корпусу чипа и числу выводов, 64 бит это аппаратный предел для NV44 и 128 битных карт не будет.

Архитектура вершинных и пиксельных процессоров, а также видеопроцессора осталась прежней — эти элементы были детально описаны нами в обзоре GeForce 6800 Ultra. Поэтому поговорим о потенциальных количественных и качественных изменениях по отношению к NV43:

Соображения о том, что и как было урезано

Очевидно, что даже с учетом использования системной памяти через PCI Express, все модели 6200 TC будут в первую очередь страдать из-за недостатка полосы пропускания памяти, как системной, так и локальной. Пиковая скорость закраски 6200 TC составляет 700 мегапикселей, в то время как пропускная способность локальной памяти более чем вдвое ниже, и это, без учета потенциально уменьшенных кэшей и двуканального контроллера памяти.

Можно предсказать, что все решится исходя из двух параметров. Скорости системной памяти и ее адресации через PCI Express (зависит от чипсета и других параметров системы) и сложности выполняемых шейдеров (сложные шейдеры с большим числом команд не будут так привередливы к памяти и, возможно, сумеют полностью раскрыть вычислительный и закрасочный потенциал пиксельных процессоров).

Слабым местом семейства 6200 TC как и в случае 6600 будут большие разрешения и режимы с полноэкранным сглаживанием, особенно на простых приложениях, а сильным — программы с длинными и сложными шейдерами и анизотропная фильтрация без одновременного MSAA. Причем, здесь эта тенденция будет выражена особенно болезненно, на порядок заметнее, чем в случае 6600 — т.е. можно говорить о сильной зависимости этих ускорителей от приложения. Судя по всему сравнительные результаты с конкурирующим семейством (например, X300 * от ATI) будут отличаться в разы, в зависимости от теста, разрешения и настроек. Т.е. на каких то приложениях 6200 TC будет выглядеть равноправно, или лучше, а на каких то — заметно проигрывать.

Далее, мы проверим это предположение тестами.

Сложно судить насколько оправданным был ход с 64 и даже 32-х битной шиной памяти — с одной стороны это удешевляет корпус чипа и уменьшает число бракованных чипов, с другой стороны, разница в цене печатной платы для 64 и 32 бит еще ниже, чем для 256 и 128! И, эта разница с избытком компенсируется разницей в цене обычной недорогой 200 МГц DDR и все еще пока дорогой 350МГц GDDR памяти. Снова, как и в случае 6600, с точки зрения производителей карт решение с 128 битной шиной и более дешевой DDR памятью (как в случае X300) было бы более удобным, как минимум, если бы у них была возможность выбора. А с точки зрения NVIDIA, производящей чипы и зачастую продающей с ними в комплекте память, более выгодно 64 или даже 32 бит решение в комплекте с GDDR.

Вершинные и пиксельные процессоры в NV44, судя по всему, остались неизменными, если не считать декларируемых доработок для эффективной адресации системной памяти из блоков текстурирования и блендинга. Однако это то, что озвучивается — реально есть причины считать, что все эти возможности, не такие принципиальные, и реализуемые скорее на уровне менеджера общего Кэша и кроссбара, изначально были заложены в семейство NV4X. Просто не было смысла использовать их (на уровне драйверов) у более старших карт с более скоростной, емкой и широкой локальной памятью. Также нет смысла в такой технологии у карт с AGP интерфейсом, который несомненно станет узким местом (скажется низкая скорость записи в системную память сравнимая с PCI).

Вот так поясняет различия NVIDIA в своих материалах:

… обычная схема и NV44 с TurboCache:

Очевидна разница, связанная с подачей данных для текстур и дополнительным путем для записи данных кадра (блендинга) в системную память. Однако исходная схема чипа с кроссбаром, трактующим графическую шину практически как пятый канал контроллера памяти, может быть изначально способна на такое (начиная с NV40 и даже ранее). И сложно сказать, действительно ли в NV44 есть архитектурные изменения в плане работы с записью и чтением данных или эти возможности просто задействуются на уровне драйвера.

С другой стороны, не будем отрицать, что оптимальным было бы некое страничное MMU и динамическая подкачка данных из системной памяти в локальную, которая трактовалась бы как Кэш третьего уровня. Если реализована такая схема — все становится на свои места. И эффективность будет заметно выше дискретного размещения объектов там или там, и наличие небольших аппаратных переделок оправдано. Тем более, что, обкатав этот страничный блок подкачки, можно будет задействовать его в будущих архитектурах, которые, судя по всему, будут в обязательном порядке снабжены такими блоками (к этому приводят требования DX Next).

Если в первом случае все зависит от драйвера, он принимает решение, где и какие располагать текстуры, геометрические данные и буфера кадров, то в случае страничной подкачки все может решаться только аппаратурой. Или можно помечать некоторые объекты как « некэшируемые» , например, геометрические данные, или некоторые буфера кадра, в случае которых копирование в локальную память карты не дало бы особого выигрыша, а наоборот снизило бы финальную эффективность. Вообще, задача такого распределения видится очень непростой и по-хорошему требует постоянного, в каждом кадре, анализа значений внутренних счетчиков производительности чипа, причем относительно к разным отдельным объектам в его памяти, т.к. предсказать влияние паттернов доступа в разных случаях тяжело. В пиковом случае системная память может считываться, особенно в случае TC-16, даже быстрее чем локальная, но задержки системной памяти и ее реальная скорость (DDR200-300*64 бит — нужды CPU и арбитраж конкурентного доступа) все равно приведет к более низкой эффективности, чем 32 битный 350 МГц вариант локальной.

Только практика покажет, насколько решение NVIDIA было оправданным как в случае 32 битной TC-16, так и в случае 64 битной TC-32. Однако одно можно сказать точно — реально, все решит цена и приложения, на которые ориентируется покупатель. Если карта будет стоить 40$ — это один случай, если 70$ — другой, т.к. конкурирующие 128 бит решения будут задавливать TurboCache 128 битной памятью, которая, как ни крути, эффективнее. Приложения тоже дадут о себе знать — интенсивные шейдеры или UltraShadow как в Doom 3 — и 6200 TC на коне, простые шейдеры, и полноэкранное сглаживание — и она провалилась.

Далее мы проверим все эти предположения и поговорим о цене.

Платы

Обе карты совершенно аналогичны по разводке, отличаются лишь тем, что у 16-мегабайтной нет одной из двух микросхем памяти.

NVIDIA GeForce 6200 TurboCache 16/32 MB (128MB) (NV44)


NVIDIA GeForce 6200 TurboCache 16/32 MB (128MB) (NV44)
Карты имеют интерфейс PCI-Express x16, 16 или 32 МБ памяти DDR SDRAM, размещенной в одной или двух микросхемах на лицевой и оборотной сторонах PCB.

Микросхемы памяти Samsung. Время выборки у микросхем памяти 2.8 ns, что соответствует частоте работы 350 (700) МГц, на которой память и работает. Частота работы GPU — 350 MHz. Шина обмена с памятью — 32 bit у 16-ти мегабайтной карты и 64 bit у 32-х мегабайтной. 4 пиксельных конвейеров и 3 вершинных.



Сравнение с эталонным дизайном, вид спереди
NVIDIA GeForce 6200 TurboCache 16/32 MB (128MB) (NV44) Reference card NVIDIA GeForce 6200 128MB


Сравнение с эталонным дизайном, вид сзади
NVIDIA GeForce 6200 TurboCache 16/32 MB (128MB) (NV44) Reference card NVIDIA GeForce 6200 128MB


Мы видим, что разводка претерпела сильные изменения. Вызвало большое недоумение — почему у столь примитивной карты с двумя микросхемами памяти столь сложная PCB. Ведь мы еще помним старые платы с таким же объемом памяти, которые были на порядок проще. Да, разумеется, частоты высокие. Но зачем, спрашивается, урезать столь сильно шину и поднимать частоту? Мне лично этот подход кажется неразумным и даже глупым. Только неграмотный может устанавливать ОДНУ(!), но дорогую BGA 2.8ns микросхему, делая ужасной шину (32 бит), нежели поставить 4 или 8 микросхем старого плана (TSOP, 5 ns, например), которые обойдутся ДЕШЕВЛЕ, но шину не портить. В общем, у меня осталось много вопросов при изучении дизайна карты.

Система охлаждения примитивная: радиатор, поэтому ее не рассматриваем.

Посмотрим на графический процессор.



Можно заметить, что размеры чипа намного меньше его предшественников (например, GeForce 6200/6600 — NV43). Я имею в виду подложку, а не сам кристалл, который впрочем, также уменьшился (это понятно, поскольку конвейеров в 2 раза меньше). Это говорит о том, что NV44 аппаратно поддерживает шину обмена с памятью НЕ БОЛЕЕ 64 бит. И опять же мой вопрос: зачем тогда такую сложную PCB воротить с 64битной шиной?

Установка и драйверы

Конфигурации тестовых стендов:

  • Компьютер на базе Athlon64
    • процессор AMD Athlon64 2400 MHz (218MHz × 11; L2=512K) (~3800+);
    • системная плата ASUS A8N SLI Deluxe на чипсете NVIDIA nForce4 SLI; Включен режим работы с ОДНОЙ видеокартой!
    • оперативная память 1 GB DDR SDRAM 400MHz;
    • жесткий диск WD Caviar SE WD1600JD 160GB SATA.
  • операционная система Windows XP SP2; DirectX 9.0c;
  • мониторы ViewSonic P810 (21") и Mitsubishi Diamond Pro 2070sb (21").
  • драйверы ATI версии 6.497 (CATALYST 4.12); NVIDIA версии 71.20.

VSync отключен.

По умолчанию в драйверах обеих компаний включены оптимизации трилинейной фильтрации.

Надо отметить, что автор программы RivaTuner Алексей Николайчук оперативно смог вставить в свою утилиту поддержку nv44. При этом выяснилось, что у чипа есть два бита в регистрах, отвечающих за каждый квад. То есть, по логике вещей, у чипа должно быть 8 конвейеров, но 2 ROP. Конечно, это не поддается логике и здравому смыслу (к тому же тесты FillRate показали, что все же конвейеров 4). И потому единственным разумным выводом стало, что работа у NV44 все же не с квадами, а с парами пикселов. Этот вопрос мы будем прояснять дальше.











Заметим, что о том, сколько реально памяти на видеокарте, вы не узнаете, кроме как из RT :), поскольку драйвера пишут суммарный объем: локальная память+кусок основного ОЗУ.

Результаты тестов

Перед тем, как кратко дать оценку качеству в 2D, я еще раз поясню, что на настоящий момент НЕТ полноценной методики объективной оценки этого параметра по следующим причинам:

  1. Практически у всех современных 3D-акселераторов качество 2D может сильно зависеть от конкретного экземпляра, а отследить все карты невозможно физически;
  2. Качество 2D зависит не только от видеокарты, но и от монитора, соединительного кабеля;
  3. В последнее время огромное влияние на этот параметр стали оказывать связки: монитор-карта. То есть, встречаются мониторы, « не дружащие» с теми или иными видеокартами.

Что касается протестированных экземпляров, то совместно с Mitsubishi Diamond Pro 2070sb платы продемонстрировали одинаково отменное качество в следующих разрешениях и частотах:

NVIDIA GeForce 6200 TurboCache 16/32 MB (128MB) (NV44) 1600x1200x75Hz, 1280x1024x85Hz, 1024x768x100Hz


Результаты тестов: сравнение производительности

В качестве инструментария мы использовали:

  • Unreal Tournament 2004 v.3225 (Digital Extreme/Epic Games) — Direct3D, Vertex Shaders, Hardware T&L, Dot3, cube texturing, качество max; demo (MOON

  • Tomb Raider: Angel of Darkness v.49 (Core Design/Eldos Software) — DirectX 9.0, Paris5_4 demo. Тестирование проводилось при максимально установленном качестве, выключены были лишь Depth of Fields PS20.

  • Half-Life2 (Valve/Sierra) — DirectX 9.0, demo (ixbt01, ixbt02, ixbt03 Тестирование проводилось при максимальном качестве, опция -dxlevel 90, в файле dxsupport.cfg убраны предустановки для видов карт.

  • FarCry 1.3 (Crytek/UbiSoft), DirectX 9.0, мультитекстурирование, 3 demo из уровней Research, Pier, Regulator (запуск игры с опцией -DEVMODE), настройки тестирования все Very High.

  • DOOM III (id Software/Activision) — OpenGL, мультитекстурирование, настройки тестирования — High Quality (ANIS8x). Имеется пример автоматизации запуска с увеличением скорости и уменьшением числа рывков (прекешинг). (НЕ ПУГАТЬСЯ черного экрана после первого меню, так и должно быть! Он будет секунд 5-10, а потом должна пойти демка)

  • 3DMark05 (FutureMark) — DirectX 9.0, мультитекстурирование, настройки тестирования — trilinear,

Unreal Tournament 2004



Результаты тестов: Unreal Tournament 2004

  • GeForce 6200TC 16MB (79USD) — против RADEON X300SE (70USD) — поражение
  • GeForce 6200TC 32MB (99USD) — против RADEON X300 (90USD) — аналогично.

Пока все печально для новинок, которые, к тому же, и дороже (по предварительным ценам).

TR:AoD, Paris5_4 DEMO



Результаты тестов: TRAOD

Аналогично предыдущему тесту, провал. Конечно, относительно PCX5750, которая дороже, новинки смотрятся очень хорошо, но последний уже уходит с рынка, выталкиваемый GF6200/6600.



FarCry, Research



Результаты тестов: FarCry Research

По-прежнему, пока результаты явно отрицательные. Разве что 32меговая карта относительно X300SE выиграла в 1024х768. Но пока по ценам соперничество явно не складывается. Вот если на 30-40 долларов скинуть цифры по стоимости у новых продуктов NVIDIA, тогда уже лучше будет смотреться.

FarCry, Regulator



Результаты тестов: FarCry Regulator

  • GeForce 6200TC 16MB (79USD) — против RADEON X300SE (70USD) — вот первый тест, где показатели у новинок лучше, и даже победа!
  • GeForce 6200TC 32MB (99USD) — против RADEON X300 (90USD) — ещё больший успех!



FarCry, Pier



Результаты тестов: FarCry Pier

  • GeForce 6200TC 16MB (79USD) — против RADEON X300SE (70USD) — снова поражение
  • GeForce 6200TC 32MB (99USD) — против RADEON X300 (90USD) — а здесь не очень однозначно. С натяжкой можно назвать паритетом с X300.



Half-Life2: ixbt01 demo



Результаты тестов: Half-Life2, ixbt01

  • GeForce 6200TC 16MB (79USD) — против RADEON X300SE (70USD) — поражение
  • GeForce 6200TC 32MB (99USD) — против RADEON X300 (90USD) — победа, но над X300SE, а своему сопернику карта проиграла.



Half-Life2: ixbt02 demo



Результаты тестов: Half-Life2, ixbt02

  • GeForce 6200TC 16MB (79USD) — против RADEON X300SE (70USD) — по-прежнему поражение
  • GeForce 6200TC 32MB (99USD) — против RADEON X300 (90USD) — аналогично предыдущему тесту



Half-Life2: ixbt03 demo



Результаты тестов: Half-Life2, ixbt03

Все то же самое.



DOOM III



Результаты тестов: DOOM III

  • GeForce 6200TC 16MB (79USD) — против RADEON X300SE (70USD) — можно осторожно обозначить победу.
  • GeForce 6200TC 32MB (99USD) — против RADEON X300 (90USD) — значительный успех.

Хоть в этой игре новинки как-то себя показали с хорошей стороны.

3DMark05: Game1



Результаты тестов: 3DMark05 Game1



3DMark05: Game2



Результаты тестов: 3DMark05 Game2



3DMark05: Game3



Результаты тестов: 3DMark05 Game3



3DMark05: MARKS



Результаты тестов: 3DMark05 MARKS

У 32-мегабайтной карты явный выигрыш, хотя у более дешевой с 16-ю мегабайтами все же небольшое поражение.

Выводы

Основное слабое место — полоса пропускания памяти, двуканальный 64 бит контроллер, запись результатов в буфер кадра. TurboCache помогает, но не является панацеей, хорошее 128 бит решение может стоить сравнимо и при этом однозначно выигрывать по скорости.

Похвален факт полного соответствия NV40 по набору поддерживаемых возможностей и архитектуре вершинных и пиксельных процессоров — нет необходимости учитывать особенности NV44 в программах.

Меньшая сложность и потребление сыграли свою положительную роль. Тактовая частота высока, и судя по технологии, может быть поднята в будущем гораздо выше — все упирается только в память.

Хочется верить, что такая узкая системная шина и простой корпус в скором времени сыграют роль и в снижении стоимости.

При таких предполагаемых ценах (79 и 99 долларов США) они в явном проигрыше. Тесты ясно дали понять, что только если карты будут дешевле, чем соперники (причем значительно, цена не должна быть выше 50-70 долларов), тогда на них будет спрос.

Разумеется, в данном случае скорость работы карт очень сильно зависит от драйверов, ведь сам по себе TurboCache обеспечивается ими. И потому скорости еще могут вырасти.

Да и, как мы видим, ТурбоКеш не особо помог этим картам. Цель благая — удешевить карты, т.к. память в размере 128 и 256мегабайт в дешевом сегменте уже составляет приличную долю себестоимости. Но что вышло? Вместо удешевления — удорожание? Надеемся, что цены встанут на свои места.

Если окончательные розничный цены будут не 79,99 и 129 долларов за такие продукты, а 49, 69 и 89, то это даст шанс таким картам быть востребованными, и они смогут быть привлекательными.

Поэтому окончательных выводов мы не делаем, их сделать пока невозможно, ибо они полностью зависят от цен на новинки.

Более полные сравнительные характеристики видеокарт этого и других классов вы можете увидеть также в наших 3DGiТогах.

Теоретико-аналитические материалы и обзоры видеокарт, в которых рассматриваются функциональные особенности GPU ATI RADEON X800 (R420)/X850 (R480)/6200tc (nv44)/X700 (RV410) и NVIDIA GeForce 6800 (NV40/45)/6600 (NV43)





Дополнительно

iXBT BRAND 2016

"iXBT Brand 2016" - Выбор читателей в номинации "Процессоры (CPU)":
Подробнее с условиями участия в розыгрыше можно ознакомиться здесь. Текущие результаты опроса доступны тут.

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.