128 калифорнийских стрелков в новых мундирах в виде Nvidia Geforce 9800 GTX

BFG Geforce 9800 GTX 512MB PCI-E, MSI Geforce 9800 GTX 512MB PCI-E (N9800GTX-T2D512), Zotac Geforce 9800 GTX 512MB PCI-E




СОДЕРЖАНИЕ

  1. Часть 1 — Теория и архитектура
  2. Часть 2 — Практическое знакомство
  3. Особенности видеокарт
  4. Конфигурация стенда, список тестовых инструментов
  5. Результаты синтетических тестов
  6. Результаты игровых тестов (производительность)


Почему получается, что ввод в строй нового чипа, графического ядра G92 (после G80) не привел к смене маркетингового наименования семейства акселераторов с 8ххх серии на 9ххх ? И почему осенью 2007 года в свет вышли не 9800GT/GTS, а 8800GT/GTS, что теперь приведет к путанице, когда как нынешний 9800GTX от 8800GTS 512 не особо чем и отличается, кроме небольшой разницы в частотах?

Вероятно потому, что умы в Nvidia точно также постоянно заняты завтраками обедами и ужинами, как и их же девочки на коллаже. А подумать и сделать ранее правильное решение среди более 1500 голов в компании — не дано. Как осенью пользователи путались в этих 8800 GTS, не особо понимая, почему карта с 512 мегабайтами существеннее быстрее карты с 640 мегабайтами. И почему Nvidia, радикально сменив шину, объем памяти и ядро, не подумала поменять радикально и название. Когда как потом спохватилась, и середняк с 64-ми процессорами получил уже название 9600 GT.

А вот теперь снова надо объяснять пользователю, что 9800 GTX — это не невесть что радикально отличающееся, а все тот же 8800 GTS 512, но разогнанный. И ядро, пусть и более новой ревизии, осталось тем же — G92.

Часть 1: Теория и архитектура



После того, как Nvidia выпустила две модели видеокарты на основе чипа G92: Geforce 8800 GT и Geforce 8800 GTS 512MB, стало понятно, что дни Geforce 8800 GTX (да и Ultra варианта, замененного теперь двухчиповой моделью Geforce 9800 GX2) на рынке сочтены. Обновленная Geforce 8800 GTS зачастую превосходила GTX вариант, проигрывая ему лишь в редких случаях, когда становилась заметной нехватка пропускной способности памяти и/или её объёма. Именно по этим параметрам старая GTX превосходила 512-мегабайтную GTS.

В процессе перевода линейки на единое маркетинговое название Geforce 9xxx, Nvidia выпустила ещё одну видеокарту на основе чипа G92 — Geforce 9800 GTX, которая стала наиболее мощной одночиповой платой, призванной заменить уже не выпускающийся Geforce 8800 GTX. Ну и Geforce 8800 GTS 512MB в недалёком будущем, по всей видимости. Хотя на данный момент Geforce 9800 GTX расположилась в линейке между Geforce 9800 GX2 и Geforce 8800 GTS 512 MB. Nvidia отдельно замечает, что новый Geforce 9800 GTX быстрее Geforce 8800 GTX в большинстве (это ключевое слово) приложений и настроек. Они не зря оговариваются, в некоторых случаях может сказываться меньший объем локальной видеопамяти и меньшая ПСП.

В очередной раз с прискорбием сообщаем, что теоретическая часть по новому продукту будет короткой и не особенно интересной, ведь архитектурно уже давно ничего не меняется, нам показывают почти тот же G80, который мы уже давным-давно знаем. Изменений в G92 немного, и все они давно описаны в наших материалах. Мало того, даже по характеристикам Geforce 9800 GTX — это почти тот же Geforce 8800 GTS 512MB, только с чуть более высокими рабочими частотами.

Иными словами, самое большое отличие — в ПСП, ну и чуть-чуть в филлрейте и шейдерной производительности. Всё! И нам тем более непонятно, зачем было делать Geforce 8800 GTS 512MB таким мощным, чтобы он почти догнал GTX, а теперь выпускать новый GTX, который мало чем отличается от того GTS, попутно зачем-то изменяя PCB при таких минорных изменениях тактовых частот. Вероятно, Nvidia просто хочет ещё раз перетрясти всю линейку, и в будущем все оставшиеся Geforce 8800 варианты будут заменены некими моделями Geforce 9800 (вроде 8800 GT — 9800 GT).

Перед прочтением данного материала мы рекомендуем внимательно ознакомиться с базовыми теоретическими материалами DX Current, DX Next и Longhorn, описывающими различные аспекты современных аппаратных ускорителей графики и архитектурные особенности продукции Nvidia и AMD.

Эти материалы достаточно точно спрогнозировали текущую ситуацию с архитектурами видеочипов, оправдались многие предположения о будущих решениях. А подробную информацию об унифицированной архитектуре Nvidia G8x/G9x на примере предыдущих чипов можно найти в следующих статьях:

Как мы уже упоминали в предыдущих материалах, чипы серии G9x основаны на уже известной архитектуре Geforce 8 (G8x) и включают в себя все её преимущества: унифицированную шейдерную архитектуру, полную поддержку DirectX 10 API, качественные методы анизотропной фильтрации и алгоритм антиалиасинга CSAA с количеством сэмплов до шестнадцати включительно. Отличительными особенностями новых чипов являются некоторые из блоков, измененных в лучшую сторону (TMU, ROP, PureVideo HD), а также технология производства 65 нм, позволившая снизить себестоимость продукции и увеличить рабочие тактовые частоты:

Графический ускоритель Geforce 9800 GTX

  • Кодовое имя чипа G92
  • Технология 65 нм
  • 754 миллиона транзисторов
  • Унифицированная архитектура с массивом общих процессоров для потоковой обработки вершин и пикселей, а также других видов данных
  • Аппаратная поддержка DirectX 10, в том числе шейдерной модели — Shader Model 4.0, генерации геометрии и записи промежуточных данных из шейдеров (stream output)
  • 256-битная шина памяти, четыре независимых контроллера шириной по 64 бита
  • Частота ядра 675 МГц
  • ALU работают на более чем удвоенной частоте 1.688 ГГц
  • 128 скалярных ALU с плавающей точкой (целочисленные и плавающие форматы, поддержка FP 32-бит точности в рамках стандарта IEEE 754, MAD+MUL без потери тактов)
  • 64 блока текстурной адресации с поддержкой FP16 и FP32 компонент в текстурах
  • 64 блока билинейной фильтрации (как и в G84 и G86, нет бесплатной трилинейной фильтрации и более эффективной анизотропной фильтрации)
  • Возможность динамических ветвлений в пиксельных и вершинных шейдерах
  • 4 широких блока ROP (16 пикселей) с поддержкой режимов антиалиасинга до 16 сэмплов на пиксель, в том числе при FP16 или FP32 формате буфера кадра. Каждый блок состоит из массива гибко конфигурируемых ALU и отвечает за генерацию и сравнение Z, MSAA, блендинг. Пиковая производительность всей подсистемы до 64 MSAA отсчетов (+ 64 Z) за такт, в режиме без цвета (Z only) — 128 отсчетов за такт
  • Запись результатов до 8 буферов кадра одновременно (MRT)
  • Все интерфейсы (два RAMDAC, два Dual DVI, HDMI, HDTV) интегрированы на чип

Спецификации референсной видеокарты Geforce 9800 GTX

  • Частота ядра 675 МГц
  • Частота универсальных процессоров 1688 МГц
  • Количество универсальных процессоров 128
  • Количество текстурных блоков — 64, блоков блендинга — 16
  • Эффективная частота памяти 2.2 ГГц (2*1100 МГц)
  • Тип памяти GDDR3
  • Объем памяти 512 мегабайт
  • Пропускная способность памяти 70.4 гигабайта в сек.
  • Теоретическая максимальная скорость закраски 10.8 гигапикселей в сек.
  • Теоретическая скорость выборки текстур до 43.2 гигатекселя в сек.
  • Два DVI-I Dual Link разъема, поддерживается вывод в разрешениях до 2560х1600
  • Двойной SLI разъем
  • Шина PCI Express 2.0
  • TV-Out, HDTV-Out
  • Энергопотребление до 156 Вт
  • Двухслотовое исполнение
  • Рекомендуемая цена $299-$349

В общем, снова ничего интересного. Как видно по характеристикам, «новая» видеокарта на основе чипа G92 отличается от Geforce 8800 GTS 512MB частотами GPU и шейдерных блоков. Пропускная способность памяти у нового решения хоть и стала больше, но всё так же отстаёт от ПСП старой Geforce 8800 GTX, да и объём видеопамяти остался меньше, чем у неё же. Именно этим может объясняться и отставание от Geforce 8800 GTX в некоторых условиях в ряде современных игр.

Повторимся, что 512 мегабайт видеопамяти, согласно нашим недавним исследованиям, на сегодняшний день достаточно для подавляющего большинства современных игр. Но, судя по ещё более новым играм, таким, как Crysis, топовым видеокартам в высоких разрешениях, для которых они и предназначены, такого объёма может не хватать, и в таких условиях Geforce 9800 GTX будет отставать от той же Geforce 8800 GTX, имеющей 768 мегабайт памяти и большую её пропускную способность.

И если то, что на двухчиповой видеоплате не установили дважды по 1024 мегабайта ещё можно понять, уж слишком высокой была бы себестоимость, то вот почему на новой быстрейшей одночиповой карте не стали делать объём в 1 гигабайт — не очень понятно. С другой стороны, посмотрите на рекомендуемую цену — она явно не топовая. Вполне вероятно, что это подготовка для настоящей топовой видеокарты с новой архитектурой, которая и займет верхнее положение в линейке несколько позднее. Ну а пока что есть Geforce 9800 GX2 с теми же 512 мегабайтами на чип.

Чтобы обеспечить Geforce 9800 GTX электропитанием, на неё установлены два PCI-E разъема, оба 6-штырьковые. Видеокарта не будет работать при подключении лишь одного из них. Требования к блоку питания дополняются ещё и минимально допустимой мощностью. Для одиночной Geforce 9800 GTX компания Nvidia рекомендует использование как минимум 450 Вт блока питания, обеспечивающего не менее 24 А по 12 В каналам. Для SLI конфигурации из двух видеокарт рекомендуется уже 750-ваттный блок, а для 3-way SLI — 1000 Вт.

Архитектура

И снова повтор старого, ведь чип G92 остался тем же. Архитектура G9x была анонсирована осенью прошлого года, а если учитывать, что это лишь слегка модифицированная архитектура G8x — то вообще в 2006 году. Основным отличием чипа G92 от предыдущего топового G80 стала технология производства 65 нм, позволившая снизить себестоимость сложных чипов и понизить энергопотребление и тепловыделение, заодно увеличив тактовые частоты. Количество блоков ALU и TMU у них равное, а ещё одно значительное отличие более нового чипа заключается в том, что у него вместо 384-битной шины реализована 256-битная, об этом мы уже говорили.

В общем, как было написано в материалах про Geforce 8800 GT и 8800 GTS 512MB, G92 является предыдущим флагманом G80, переведенным на новый техпроцесс, но с некоторыми изменениями: уменьшенным количеством блоков ROP и улучшениями в TMU, а также новым алгоритмом сжатия, реализованным в блоках ROP, который работает на 15% эффективнее. Обо всём этом написано в наших предыдущих материалах. Приведём основную диаграмму чипа G92:



Ещё раз остановимся на том, что 64 текстурных блока у Geforce 9800 GTX в реальных применениях в большинстве случаев не будут сильнее 32 блоков в Geforce 8800 GTX и Ultra, так как в таких условиях используется трилинейная и/или анизотропная фильтрация, а в этом случае производительность TMU, без учёта частот, будет равной. Но там, где применяются неотфильтрованные выборки, производительность решений на G92 будет выше.

3-Way SLI

В отличие от двухчипового Geforce 9800 GX2, пара которых может работать в режиме Quad SLI, в данном случае возможно создание системы на основе трёх видеокарт Geforce 9800 GTX, так называемый 3-Way SLI. Такой поддержкой обладают системные платы на основе чипсетов Nvidia nForce 680i, 780i и 780a. Для этого на каждой видеокарте установлено по два SLI разъёма, при помощи которых карты соединяются между собой специальной тройной планкой:



Первые же реализации 3-Way SLI использовали Alternate Frame Rendering (AFR) режим SLI, который приоритетнее SFR во всех современных играх, использующих сложные шейдеры, многопроходный рендеринг и сложную постобработку. В этом случае параллельно обрабатывается сразу три кадра, и достигнутая частота кадров растёт почти линейно, вместе с геометрической, текстурной и шейдерной производительностью, да и с совместимостью проблем меньше.

По данным Nvidia, конфигурация 3-Way SLI из трёх Geforce 9800 GTX обеспечивает прирост частоты кадров в секунду около 130-150%, по сравнению с одиночной видеокартой. Естественно, речь о высоких разрешениях, максимальных игровых настройках с включенными сглаживанием и анизотропной фильтрацией, в иных условиях разница будет меньшей. Но для тяжелых приложений типа Crysis, и это будет очень хорошо.

Естественно, недостатки AFR никуда не делись. Мы уже упоминали о задержках, вносимых (точнее, не уменьшаемых при видимом росте FPS) режимом AFR. Но если на двухчиповой системе они практически незаметны, то на 3-Way SLI они уже могут ощущаться, так как частота кадров хоть и растёт, но задержки не снижаются. Картинка вроде бы становится плавней, чем на одночиповой системе, но играть почти так же некомфортно, как и в случае, когда одиночная видеокарта не обеспечивает хотя бы 30 средних кадров в секунду в тех же условиях.

HybridPower

Видеокарта Geforce 9800 GTX также поддерживает одну из двух основных возможностей технологии Hybrid SLI — HybridPower. Это технология, которая автоматически переключает используемое видеоядро между внешней видеокартой и интегрированным в чипсет ядром Geforce, в зависимости от степени нагрузки. Технология работает только на системных платах с поддержкой технологии HybridPower. Вот два основных режима её работы:



На схеме изображены два варианта работы SLI системы в HybridPower. Первый режим используется для повседневного применения, а также просмотра видео с аппаратным ускорением. В этом случае используются мощности интегрированного в чипсет видеоядра, а установленная видеокарта может быть выключена полностью. А второй режим предназначен для запуска 3D приложений, интенсивно использующих возможности установленной видеокарты, в таком случае она работает в полную силу.

При работе HybridPower изображение от внешней видеокарты пересылается на встроенную и выводится по видеовыходу, расположенному на задней части системной платы. Это позволяет использовать и встроенное видео и дискретное, выводя изображение на один и тот же физический разъем. В повседневном использовании HybridPower отключает внешнее видео, сохраняя электроэнергию и уменьшая шум, производимый устройствами охлаждения видеокарт. А в случае, когда требуется 3D мощь установленной внешней видеокарты, на неё подаётся питание и она начинают свою привычную горячую и шумную работу.

PureVideo HD

Как и все остальные видеокарты на чипах G9x, Geforce 9800 GTX пользуется всеми программными улучшениями PureVideo HD, появившимися в новых версиях драйверов, начиная с ForceWare 174, приуроченными к выходу Geforce 9600 GT. Из важных нововведений PureVideo HD можно отметить двухпоточное декодирование, динамическое изменение контрастности и цветовой насыщенности.

Ещё одним полезным нововведением последней версии PureVideo HD стала возможность одновременной работы оболочки Aero в операционной системе Windows Vista во время проигрывания аппаратно ускоренного видео в оконном режиме, что ранее не было возможно. Обо всем этом подробнее написано в обзоре Geforce 9600 GT.

Поддержка внешних интерфейсов

На референсных видеокартах Geforce 9800 GTX установлены два Dual Link DVI выхода с поддержкой HDCP, а также один HDTV выход. HDMI и DisplayPort выводы можно реализовать при помощи переходников с DVI на HDMI или DisplayPort, соответственно.

Итак, мы рассмотрели теоретические особенности обновленного решения Geforce 9800 GTX. Далее следует практическая часть исследования с синтетическими тестами, в которой мы определим слабые и сильные стороны видеоплаты, и узнаем, как соотносится производительность рассматриваемой видеокарты Nvidia с другими моделями, а также единственным конкурентом от компании AMD.



Nvidia Geforce 9800 GTX (G92) — Часть 2: видеоплаты и синтетические тесты





Дополнительно

iXBT BRAND 2016

«iXBT Brand 2016» — Выбор читателей в номинации «Процессоры (CPU)»:
Подробнее с условиями участия в розыгрыше можно ознакомиться здесь. Текущие результаты опроса доступны тут.

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.