Nvidia Geforce 8800 GTS 512MB (G92)

Снова 128 более сильных калифорнийских стрелков, но с урезанными копьями (512MB и 256bit)

Часть 1: Теория и архитектура



В прошлом материале, посвященном выходу нового решения среднего уровня Nvidia Geforce 8800 GT, основанного на чипе G92, мы упоминали о том, что в этом решении применен чип, в котором разблокированы не все исполнительные блоки ALU и TMU, часть из них дожидается своего часа, чтобы быть включенной в видеокарте другого ценового уровня. И вот этот момент настал, Nvidia анонсировала обновленный вариант Geforce 8800 GTS, оставивший такое же название, что и младшее решение на основе G80. Отличить его проще всего по объему установленной видеопамяти, он равен 512 мегабайтам, в отличие от предыдущих 320 Мбайт и 640 Мбайт вариантов. Так эту модель и назвали — Geforce 8800 GTS 512MB.

Новый вариант Geforce 8800 GTS основан на чипе G92, уже применённом ранее в Geforce 8800 GT, видеокарте так называемого верхнего среднего ценового уровня, поэтому основные возможности и характеристики мы уже знаем. В отличие от двух моделей Geforce 8800 GT с рекомендуемой ценой от $200 до $250 (что с реальными ценами на данный момент плохо соотносится, кстати), новое решение имеет рекомендованную производителем цену в $349-399. Особенностями применяемого видеочипа является поддержка лишь 256-битной шины памяти, но большее количество разблокированных универсальных исполнительных блоков. Давайте познакомимся с новым нижним high-end решением от компании Nvidia поближе…

Перед прочтением данного материала мы рекомендуем внимательно ознакомиться с базовыми теоретическими материалами DX Current, DX Next и Longhorn, описывающими различные аспекты современных аппаратных ускорителей графики и архитектурные особенности продукции Nvidia и AMD.

Эти материалы достаточно точно спрогнозировали текущую ситуацию с архитектурами видеочипов, оправдались многие предположения о будущих решениях. Подробную информацию об унифицированной архитектуре Nvidia G8x/G9x на примере предыдущих чипов можно найти в следующих статьях:

Как мы упоминали в предыдущем материале, чип G92 включает в себя все преимущества G8x: унифицированную шейдерную архитектуру, полную поддержку DirectX 10, качественные методы анизотропной фильтрации и алгоритм антиалиасинга CSAA с количеством сэмплов до шестнадцати включительно. Некоторые блоки чипа немного отличаются от тех, что были в G80, но основным изменением по сравнению с G80 стала технология производства 65 нм, которая позволила снизить себестоимость продукции. Рассмотрим характеристики GPU и новых видеорешений на его основе:

Графический ускоритель Geforce 8800 GTS 512MB

  • Кодовое имя чипа G92
  • Технология 65 нм
  • 754 миллиона транзисторов (больше, чем у G80)
  • Унифицированная архитектура с массивом общих процессоров для потоковой обработки вершин и пикселей, а также других видов данных
  • Аппаратная поддержка DirectX 10, в том числе шейдерной модели — Shader Model 4.0, генерации геометрии и записи промежуточных данных из шейдеров (stream output)
  • 256-бит шина памяти, четыре независимых контроллера шириной по 64 бита
  • Частота ядра 650 МГц (Geforce 8800 GTS 512MB)
  • ALU работают на более чем удвоенной частоте (1.625 ГГц для Geforce 8800 GTS 512MB)
  • 128 скалярных ALU с плавающей точкой (целочисленные и плавающие форматы, поддержка FP 32-бит точности в рамках стандарта IEEE 754, MAD+MUL без потери тактов)
  • 64 блока текстурной адресации с поддержкой FP16 и FP32 компонент в текстурах
  • 64 блока билинейной фильтрации (как и в G84 и G86, нет бесплатной трилинейной фильтрации и более эффективной анизотропной фильтрации)
  • Возможность динамических ветвлений в пиксельных и вершинных шейдерах
  • 4 широких блока ROP (16 пикселей) с поддержкой режимов антиалиасинга до 16 сэмплов на пиксель, в том числе при FP16 или FP32 формате буфера кадра. Каждый блок состоит из массива гибко конфигурируемых ALU и отвечает за генерацию и сравнение Z, MSAA, блендинг. Пиковая производительность всей подсистемы до 64 MSAA отсчетов (+ 64 Z) за такт, в режиме без цвета (Z only) — 128 отсчета за такт
  • Запись результатов до 8 буферов кадра одновременно (MRT)
  • Все интерфейсы (два RAMDAC, два Dual DVI, HDMI, HDTV) интегрированы на чип (в отличие от вынесенных на внешний дополнительный чип NVIO у Geforce 8800)

Спецификации референсной карты Geforce 8800 GTS 512MB

  • Частота ядра 650 МГц
  • Частота универсальных процессоров 1625 МГц
  • Количество универсальных процессоров 128
  • Количество текстурных блоков — 64, блоков блендинга — 16
  • Эффективная частота памяти 1.94 ГГц (2*970 МГц)
  • Тип памяти GDDR3
  • Объем памяти 512 мегабайт
  • Пропускная способность памяти 64.0 гигабайта в сек.
  • Теоретическая максимальная скорость закраски 10.4 гигапикселя в сек.
  • Теоретическая скорость выборки текстур до 41.6 гигатекселя в сек.
  • Два DVI-I Dual Link разъема, поддерживается вывод в разрешениях до 2560х1600
  • SLI разъем
  • Шина PCI Express 2.0
  • TV-Out, HDTV-Out, поддержка HDCP
  • Рекомендуемая цена $349-399

Как видно по характеристикам, новая версия Geforce 8800 GTS 512MB довольно сильно отличается от старых. Возросло количество исполнительных блоков: ALU и TMU, значительно выросла и частота GPU, включая частоту шейдерных блоков. Несмотря на урезанную шину памяти (256-бит против 320-бит у старых вариантов), пропускная способность памяти осталась прежней, так как её рабочую частоту подняли на соответствующее значение. В результате, новый GTS обладает значительно усиленной мощью по выполнению шейдеров, а также возросшей скоростью текстурных выборок. В то же время, филлрейт и ПСП остались такими же.

Из-за изменившейся разрядности шины памяти, объём последней теперь не может быть равен 320 Мбайт или 640 Мбайт, только 256 Мбайт, 512 Мбайт или 1 Гбайт. Первое значение слишком мало, его будет явно недостаточно для карты такого класса, а последнее — слишком велико, незначительный прирост производительности вряд ли будет оправдывать возросшую цену таких вариантов (которые вполне могут появиться в дальнейшем). Поэтому в Nvidia был выбран средний вариант с комплектацией карт объёмом в 512 Мбайт. Что, как показало наше недавнее исследование, является золотой серединой для всех современных игр, которые весьма требовательны к объёму видеопамяти и используют до 500-600 мегабайт. Не устаём повторять, что это не значит, что все ресурсы игр должны обязательно находиться только в локальной памяти видеокарты, менеджмент ресурсов может отдаваться в управление API, особенно в Direct3D 10 с виртуализацией видеопамяти.

Архитектура

Как было написано в предыдущем материале по Geforce 8800 GT, можно сказать, что G92 является предыдущим флагманом G80, переведенным на новый техпроцесс, но с некоторыми изменениями. Новый чип имеет 8 больших шейдерных блоков и 64 текстурных блока, а также четыре широких ROP. Несмотря на все изменения к лучшему, число транзисторов в чипе кажется слишком большим, вероятно, увеличенная сложность чипа объясняется включением в его состав ранее отдельного чипа NVIO, а также видеопроцессора нового поколения. Кроме того, на количество транзисторов повлияли усложненные блоки TMU, и есть вероятность увеличения кэшей для обеспечения большей эффективности 256-битной шины памяти.

Архитектурных изменений в чипе G92 совсем немного, обо всех мы рассказывали в предыдущем материале, и не будем делать это ещё раз. Всё сказанное в обзорах предыдущих решений остаётся в силе, приведём лишь основную диаграмму чипа G92, теперь уже со всеми 128 универсальными процессорами:



Из всех изменений в чипе, по сравнению с G80 — только уменьшенное количество блоков ROP и некоторые изменения в TMU, о которых написано в нашем предыдущем материале. Ещё раз остановимся на том, что 64 текстурных блока у Geforce 8800 GTS 512MB в реальных применениях в большинстве случаев НЕ будут сильнее 32 блоков в Geforce 8800 GTX. При включенной трилинейной и/или анизотропной фильтрации их производительность будет примерно одинакова, так как они имеют одинаковое количество блоков фильтрации текстурных данных. Конечно же, там, где применяются неотфильтрованные выборки, производительность решений на G92 будет выше.

PureVideo HD

Одним из ожидаемых изменений в G92 стал встроенный видеопроцессор второго поколения, известный по G84 и G86, получивший расширенную поддержку PureVideo HD. Этот вариант видеопроцессора почти полностью разгружает CPU при декодировании всех типов видеоданных, в том числе «тяжелых» форматов H.264 и VC-1. В G92 используется новая модель программируемого PureVideo HD видеопроцессора, включающая так называемый BSP движок. Новый процессор поддерживает декодирование H.264, VC-1 и MPEG-2 форматов с разрешением до 1920x1080 и битрейтом до 30-40 Мбит/с, выполняя работу по декодированию CABAC и CAVLC данных аппаратно, что позволяет воспроизводить все существующие HD-DVD и Blu-ray диски даже на средних по мощности одноядерных ПК. Декодирование VC-1 не такое эффективное, как H.264, но оно всё же поддерживается новым процессором. Подробнее о видеопроцессоре второго поколения можно прочитать в наших обзорах G84/G86 и G92, ссылки на которые приведены в начале статьи.

PCI Express 2.0

Из настоящих нововведений в G92 можно выделить поддержку шины PCI Express 2.0. Вторая версия PCI Express увеличивает стандартную пропускную способность в два раза, с 2.5 Гбит/с до 5 Гбит/с, в результате, по разъему x16 можно передавать данные на скорости до 8 ГБ/с в каждом направлении, в отличие от 4 ГБ/с для версии 1.x. При этом очень важно, что PCI Express 2.0 совместим с PCI Express 1.1, и старые видеокарты будут работать в новых системных платах, и новые видеокарты с поддержкой второй версии останутся работоспособными в платах без его поддержки. При условии достаточности внешнего питания и без увеличения пропускной способности интерфейса, естественно.

Реальное влияние большей пропускной способности шины PCI Express на производительность в своих материалах оценил основной конкурент компании Nvidia. По их данным, видеокарта среднего уровня с 256 мегабайтами локальной памяти ускоряется при переходе от PCI Express 1.0 к 2.0 в таких современных играх, как Company of Heroes, Call of Juarez, Lost Planet и World In Conflict примерно на 10%, показатели изменяются от 5% до 25% для разных игр и условий тестирования. Естественно, речь в высоких разрешениях, когда буфер кадра и сопутствующие буферы занимают большую часть локальной видеопамяти, а некоторые ресурсы хранятся в системной.

Для обеспечения обратной совместимости с существующими PCI Express 1.0 и 1.1 решениями, спецификация 2.0 поддерживает как 2.5 Гбит/с, так и 5 Гбит/с скорости передачи. Обратная совместимость PCI Express 2.0 позволяет использовать прошлые решения с 2.5 Гбит/с в 5.0 Гбит/с слотах, которые будут работать на меньшей скорости, а устройство, разработанное по спецификациям версии 2.0, может поддерживать и 2.5 Гбит/с и 5 Гбит/с скорости. В теории с совместимостью всё хорошо, а вот на практике с некоторыми сочетаниями системных плат и карт расширения возможно возникновение проблем.

Поддержка внешних интерфейсов

Тут всё как и у Geforce 8800 GT, никаких отличий нет. Имеющийся на платах Geforce 8800 дополнительный чип NVIO, поддерживающий вынесенные за пределы основного внешние интерфейсы (два 400 МГц RAMDAC, два Dual Link DVI (или LVDS), HDTV-Out), в данном случае был включен в состав самого чипа, поддержка всех указанных интерфейсов встроена в сам G92.

На видеокартах Geforce 8800 GTS 512MB обычно устанавливают два Dual Link DVI выхода с поддержкой HDCP. Что касается HDMI, поддержка этого разъема реализована, она может быть выполнена производителями на картах специального дизайна. Хотя наличие разъема HDMI на видеокарте совершенно необязательно, его с успехом заменит переходник с DVI на HDMI, который прилагается в комплекте большинства современных видеокарт.

Далее следует практическая часть исследования, посвященная тому, насколько хорошо себя показывает новое решение Nvidia в синтетических тестах.

Nvidia Geforce 8800 GTS 512MB (G92) — Часть 2: видеоплаты и синтетические тесты





11 декабря 2007 Г.

128, , : Nvidia Geforce 8800 GTS 512MB?

Nvidia Geforce 8800 GTS 512MB (G92)

128 , (512MB 256bit)

1:



, Nvidia Geforce 8800 GT, G92, , , ALU TMU, , . , Nvidia Geforce 8800 GTS, , G80. , 512 , 320 640 . — Geforce 8800 GTS 512MB.

Geforce 8800 GTS G92, Geforce 8800 GT, , . Geforce 8800 GT $200 $250 ( , ), $349-399. 256- , . high-end Nvidia …

DX Current, DX Next Longhorn, Nvidia AMD.

, . Nvidia G8x/G9x :

, G92 G8x: , DirectX 10, CSAA . , G80, G80 65 , . GPU :

Geforce 8800 GTS 512MB

  • G92
  • 65
  • 754 (, G80)
  • ,
  • DirectX 10, — Shader Model 4.0, (stream output)
  • 256- , 64
  • 650 (Geforce 8800 GTS 512MB)
  • ALU (1.625 Geforce 8800 GTS 512MB)
  • 128 ALU ( , FP 32- IEEE 754, MAD+MUL )
  • 64 FP16 FP32
  • 64 ( G84 G86, )
  • 4 ROP (16 ) 16 , FP16 FP32 . ALU Z, MSAA, . 64 MSAA (+ 64 Z) , (Z only) — 128
  • 8 (MRT)
  • ( RAMDAC, Dual DVI, HDMI, HDTV) ( NVIO Geforce 8800)

Geforce 8800 GTS 512MB

  • 650
  • 1625
  • 128
  • — 64, — 16
  • 1.94 (2*970 )
  • GDDR3
  • 512
  • 64.0 .
  • 10.4 .
  • 41.6 .
  • DVI-I Dual Link , 25601600
  • SLI
  • PCI Express 2.0
  • TV-Out, HDTV-Out, HDCP
  • $349-399

, Geforce 8800 GTS 512MB . : ALU TMU, GPU, . (256- 320- ), , . , GTS , . , .

- , 320 640 , 256 , 512 1 . , , — , ( ). Nvidia 512 . , , , 500-600 . , , , API, Direct3D 10 .

Geforce 8800 GT, , G92 G80, , . 8 64 , ROP. , , , NVIO, . , TMU, 256- .

G92 , , . , G92, 128 :



, G80 — ROP TMU, . , 64 Geforce 8800 GTS 512MB 32 Geforce 8800 GTX. / , . , , , G92 .

PureVideo HD

G92 , G84 G86, PureVideo HD. CPU , «» H.264 VC-1. G92 PureVideo HD , BSP . H.264, VC-1 MPEG-2 1920x1080 30-40 /, CABAC CAVLC , HD-DVD Blu-ray . VC-1 , H.264, . G84/G86 G92, .

PCI Express 2.0

G92 PCI Express 2.0. PCI Express , 2.5 / 5 /, , x16 8 / , 4 / 1.x. , PCI Express 2.0 PCI Express 1.1, , . , .

PCI Express Nvidia. , 256 PCI Express 1.0 2.0 , CompanyofHeroes, CallofJuarez, LostPlanet WorldInConflict 10%, 5% 25% . , , , .

PCI Express 1.0 1.1 , 2.0 2.5 /, 5 / . PCI Express 2.0 2.5 / 5.0 / , , , 2.0, 2.5 / 5 / . , .

Geforce 8800 GT, . Geforce 8800 NVIO, ( 400 RAMDAC, Dual Link DVI ( LVDS), HDTV-Out), , G92.

Geforce 8800 GTS 512MB Dual Link DVI HDCP. HDMI, , . HDMI , DVI HDMI, .

, , Nvidia .



Nvidia Geforce 8800 GTS 512MB (G92) — 2: