Nvidia Geforce GTX 295 2x240sp 2x896MB 2x448bit PCI-E

В сумме 480 калифорнийских стрелков — получится непобедимое войско



СОДЕРЖАНИЕ

  1. Часть 1 — Теория и архитектура
  2. Часть 2 — Практическое знакомство
  3. Особенности видеокарт
  4. Конфигурация стенда, список тестовых инструментов
  5. Результаты синтетических тестов
  6. Результаты игровых тестов (производительность)


Часть 1: Теория и архитектура



Помнится, еще в 2000 году мы мечтали о двухпроцессорных ускорителях, и даже мысленно представляли себе такое (на основе двух Geforce2 GTS, что на коллаже выше), поскольку в начале того года все с нетерпением ждали двухпроцессорного монстра от 3dfx, но при этом продвинутые пользователи понимали, что два Geforce2 будут явно быстрее. :-))

Но оставим лирику и ностальгию и вернемся в наши дни. Спустя почти полгода после выхода RADEON HD 4870 X2, компания Nvidia всё-таки решила выпустить двухчиповую видеокарту на основе GPU своей современной архитектуры GT2xx. С одной стороны, решение понятное — ведь если рассматривать не только одночиповые видеокарты, то лучшие представители компании отставали от конкурирующих с ними двухчиповых решений AMD, что не может себе позволить лидер рынка.

Ведь посмотрите, что происходило на рынке с августа прошлого года? AMD, следуя своей концепции выпуска одночиповых mid-end решений и двухчиповых high-end видеокарт, и пользуясь преимуществом меньших по сложности и размеру чипов, выполненных по более совершенному техпроцессу, вскоре после одночиповых вариантов представила и свою двухчиповую модель HD 4870 X2. И начиная с августа 2008 года, именно эта модель и являлась наиболее производительной (хотя к вопросу особенностей многочипового рендеринга в своих материалах мы ещё вернёмся) видеокартой, доступной на рынке.

Компании Nvidia тогда ничего не оставалось делать, кроме как противопоставлять одной HD 4870 X2 системы на основе двух Geforce GTX 280 или GTX 260, а против пары HD 4870 X2 — 3-Way SLI на основе трёх GTX 280. То есть, при отсутствии возможности выпуска более мощного одночипового решения, такой вариант как GTX 295, напрашивался сам собой.

C другой стороны — выпуск такой видеокарты именно сейчас кажется нам несколько несвоевременным. Ведь AMD уже несколько месяцев побыла лидером со своим RADEON HD 4870 X2, и эта информация успешно осела в головах у интересующихся 3D индустрией пользователей. А по слухам, уже через несколько месяцев, во втором квартале наступившего года, ожидается выход новых моделей видеокарт от Nvidia на основе GPU обновленной архитектуры, которые вряд ли будут быстрее GTX 295 в бенчмарках.

То есть, получается, что для HD 4870 X2 конкуренция слишком сильно опоздала, а своим будущим решениям эта двухчиповая карта, как когда-то сделала и Geforce 9800 GX2, может и помешать. Да и на финансовое положение компании эта модель положительно повлиять вряд ли сможет и вряд ли успеет — себестоимость решения явно высока, а цену задирать сильно нельзя (и не задрали, см. ниже). Да и сезон рождественских продаж уже прошёл. Другое дело, если бы GTX 295 успели выпустить в ноябре, например… Тогда в этой модели было бы явно больше смысла. К тому же — скоро уже и весна придёт, вместе с новыми одночиповыми моделями.

Впрочем, будущее нам неизвестно, не будем забегать вперёд. Своё видение ситуации мы изложили, а уж как получится — посмотрим. Мы же считаем, что GTX 295 является скорее имиджевым решением, призванным показать, что Nvidia сильна, а не реально изменить ситуацию на рынке, увеличивая продажи и прибыль. Что ж, в этом тоже есть определённый смысл. Лишь бы пользователи снова не стали недоумевать, почему следующие одночиповые карты покажут худшие результаты в бенчмарках, по сравнению с двухчиповой GTX 295, как это случилось ранее с GTX 280 и 9800 GX2.

Ведь в отличие от компании AMD, которая для верхнего ценового диапазона уже выпускает исключительно мультичиповые решения, Nvidia вроде бы не собирается отказываться от одночипового будущего своих топовых видеокарт. Впрочем, повторимся ещё раз, что рассматриваемое сегодня решение призвано отобрать корону лидерства в бенчмарках у AMD RADEON HD 4870 X2, и это — его основная цель.

Естественно, на основе 65 нм чипов такое решение создать было просто невозможно — ведь даже одна Geforce GTX 280 на одном чипе GT200 (а это 1.4 миллиарда транзисторов и размер ядра около 576 кв.мм) потребляет более 200 Вт! А так как переход GT200 на 55 нм технологические нормы занял у Nvidia слишком долго времени, выход и двухчипового решения также затянулся.

Итак, Geforce GTX 295 основана на двух чипах GT200b, произведённых по 55 нм техпроцессу, никаких отличий от 65 нм предшественника, кроме меньшей площади чипа и сниженного энергопотребления, у них нет. Зато этот переход на 55 нм позволил карте на основе двух крупных и мощных GPU потреблять менее 300 Вт, сохранив уровень тепловыделения, с которым справляется обновленная двухслотовая система охлаждения.

Теоретическая часть про Geforce GTX 295 будет короткой, ведь это два обычных чипа GT200b, пусть и выполненных по новым 55 нм производственным нормам, установленных на две соединенные печатные платы. Двухчиповая система работает по технологии SLI, линии PCI Express и соответствующий мост выполнены на плате. И существенной разницей, по сравнению с системами на основе двух Geforce GTX 280 или 260 будут лишь иные рабочие частоты чипа и памяти, объем памяти и ширина шины, а также конфигурация блоков GPU. Это всё количественные, но не качественные отличия.

Если вы ещё не знакомы с архитектурой Geforce GTX 200 (GT200), то все подробности о ней можно прочитать в базовом обзоре на нашем сайте. Это дальнейшее развитие архитектуры G8x/G9x, но в неё были внесены некоторые изменения. Также, перед прочтением данного материала мы рекомендуем внимательно ознакомиться с базовыми теоретическими материалами DX Current, DX Next и Longhorn, описывающими различные аспекты современных аппаратных ускорителей графики и архитектурные особенности предыдущей продукции Nvidia и AMD.

Эти материалы довольно точно спрогнозировали текущую ситуацию с архитектурами видеочипов, оправдались многие предположения о будущих решениях. Подробную информацию об унифицированных архитектурах Nvidia G8x/G9x/GT2xx на примере предыдущих решений можно найти в следующих статьях:

Итак, будем считать, что с архитектурой все читатели уже знакомы, и рассмотрим подробные характеристики двухчиповой видеоплаты серии Geforce GTX 200, основанной на чипах GT200b, выполненных с применением 55 нм техпроцесса.

Графический ускоритель Geforce GTX 295

  • Кодовое имя чипов GT200b
  • Технология производства 55 нм
  • Два чипа по 1.4 миллиарда транзисторов
  • Унифицированная архитектура с массивом общих процессоров для потоковой обработки вершин и пикселей, а также других видов данных
  • Аппаратная поддержка DirectX 10, в том числе шейдерной модели — Shader Model 4.0, генерации геометрии и записи промежуточных данных из шейдеров (stream output)
  • Две 448-битные шины памяти, по семь (из восьми) независимых контроллеров шириной по 64 бита каждый
  • Частота ядер 576 МГц
  • Более чем удвоенная частота ALU 1242 МГц
  • 2 × 240 скалярных ALU с плавающей точкой (целочисленные и плавающие форматы, поддержка FP32 и FP64 точности в рамках стандарта IEEE 754(R), выполнение двух операций MAD+MUL за такт
  • 2 × 80 блоков текстурной адресации и фильтрации с поддержкой FP16 и FP32 компонент в текстурах
  • Возможность динамических ветвлений в пиксельных и вершинных шейдерах
  • 2 × 7 широких блоков ROP (2 × 28 пикселей) с поддержкой режимов антиалиасинга до 16 выборок на пиксель, в том числе при FP16 или FP32 формате буфера кадра. Каждый блок состоит из массива гибко конфигурируемых ALU и отвечает за генерацию и сравнение Z, MSAA, блендинг. Пиковая производительность подсистемы до 224 MSAA отсчетов (+ 224 Z) за такт, в режиме без цвета (Z only) — 448 отсчетов за такт
  • Запись результатов до 8 буферов кадра одновременно (MRT);
  • Интерфейсы (два RAMDAC, два Dual Link DVI, HDMI, DisplayPort, HDTV) интегрированы на отдельный чип.

Спецификации референсной видеокарты Geforce GTX 295

  • Частота ядер 576 МГц
  • Частота универсальных процессоров 1242 МГц
  • Количество универсальных процессоров 480 (2 × 240)
  • Количество текстурных блоков — 160 (2 × 80), блоков блендинга — 56 (2 × 28)
  • Эффективная частота памяти 2000 (2*1000) МГц
  • Тип памяти GDDR3
  • Объем памяти 1792 (896 × 2) мегабайт
  • Пропускная способность памяти 2 × 112 ГБ/с
  • Теоретическая максимальная скорость закраски 2 × 16.1 гигапикселей в сек.
  • Теоретическая скорость выборки текстур 2 × 46.1 гигатекселей в сек.
  • Два DVI-I Dual Link разъема, поддерживается вывод в разрешениях до 2560х1600
  • Одинарный SLI разъем
  • Шина PCI Express 2.0
  • TV-Out, HDTV-Out, поддержка HDCP, HDMI, DisplayPort
  • Энергопотребление до 289 Вт (8-штырьковый и 6-штырьковый разъёмы)
  • Двухслотовое исполнение
  • Рекомендуемая цена $499

Итак, производство GT200b по 55 нм технологическим нормам позволило теперь и компании Nvidia выпустить очень мощное двухчиповое решение. Которое в 2D и 3D режимах работы энергетически эффективнее, по сравнению со своим главным конкурентом в виде RADEON HD 4870 X2. Новая видеокарта Nvidia обеспечивает более высокую производительность при сравнимом энергопотреблении. Это тем более неожиданно, ведь видеочипы GT200b, даже будучи сделаны при помощи того же 55 нм техпроцесса, что и RV770, имеют значительно бОльшую площадь и сложность (кол-во транзисторов). То ли частоты у финальных ревизий GT200b были снижены по сравнению с проектируемыми, то ли чипы специально создавались для лучшей энергоэффективности.

Как видите, в Nvidia решили выпустить двухчиповую карту под тем же суффиксом-префиксом GTX, изменив только номер модели. Решать, конечно же, им, однако более логичным нам видится выпуск такой модели под каким-то другим названием, вроде GX2 290, или G2X 290. Да пусть даже SLI 290, и то людям было бы понятнее. А выбранное компанией название не говорит о том, что карта двухчиповая, и не делает на этом отличии акцента. Что, как нам кажется, не очень хорошо с точки зрения покупателя, так как запутывает его.

Необходимо добавить пару слов и про вынужденно применённый объём видеопамяти. Решение ограничиться 448-битной шиной и объёмом памяти по 896 МБ на каждый видеочип, по всей видимости, было вызвано необходимостью сделать разводку PCB попроще. В следствиях — не совсем обычный объём памяти, и что ещё более важно — он меньше, чем у конкурирующей RADEON HD 4870 X2. И хотя разница между 896 и 1024 совсем невелика, и на практике не слишком сильно скажется на производительности, с точки зрения маркетинга это тоже не очень хорошо — пусть и номинально, но по одной из цифр (по очень любимой в маркетинге!) решение оказывается «хуже» конкурирующего.

Архитектура и особенности решения

Ничего интересного рассказать тут просто невозможно, чипы GT200b — это те же известные нам GT200, просто меньшей площади и более эффективные с точки зрения потребления энергии. Архитектура GT200 была анонсирована ещё прошедшим летом, а если учесть, что это улучшенная архитектура G8x/G9x, то и того раньше — в 2006 году. Основным отличием чипа G92 от G80 была технология производства 65 нм, нововведения GT200 в основном количественные, а GT200b — это тот же GT200. Обо всём этом подробно написано в наших предыдущих материалах.

Ранее в Сети появилась информация о том, что двухчиповая карта на GT200b будет состоять из двух GT200 с количеством исполнительных блоков, аналогичным паре Geforce GTX 260. Но Nvidia решила устанавливать на GTX 295 полноценные чипы GT200 с 240 ALU каждый, а также 80 текстурными блоками. Однако, конфигурацию памяти оставили от GTX 260, то есть 448-битная шина и 896 МБ GDDR3 памяти на чип. Точно как и GTX 260, каждый из двух чипов в GTX 295 использует лишь семь широких блоков ROP из восьми имеющихся в чипе, что даёт 56 блоков ROP в сумме.

Тактовые частоты чипа полностью соответствуют частотам одиночных Geforce GTX 260. Частота GPU, блоков TMU и ROP, равна 576 МГц, а потоковые вычислительные процессоры работают на частоте в 1242 МГц. GDDR3 память тактуется на частоте 1000(2000) МГц.

Аналогично предыдущему двухчиповому решению Nvidia — Geforce 9800 GX2, новая модель Geforce GTX 295 использует двухплатную конструкцию, которая была выбрана из-за своих лучших характеристик, по сравнению с другими решениями. Такой дизайн предполагает монтаж двух GPU, каждый из которых имеет свою PCB. Это даёт следующие преимущества: каждый чип выделяет тепло, нагревая только одну из PCB; кулер охлаждает оба чипа одновременно, в отличие от Geforce 7950 GX2, использующего два устройства охлаждения. Кулер со времен 9800 GX2 изменился в лучшую сторону, приобретя новые характеристики для того, чтобы рассеивать почти в полтора раза большее количество тепла, по сравнению с предыдущей двухчиповой моделью.

Максимальное потребление энергии Geforce GTX 295 составляет 289 Вт, что вполне сравнимо с показателем конкурирующей RADEON HD 4870 X2, равным 286 Вт. Карта требует подключения двух разъемов питания: 6-штырькового и 8-штырькового, а рекомендуемым минимумом мощности системного блока питания для одиночной Geforce GTX 295 является значение 680 Вт.

Поговорим об особенностях мультичиповой связки, хотя их и немного. Между двумя GPU, как и в случае всех предыдущих решений на основе пары видеочипов, установлен чип-коммутатор, который связывает между собой графические процессоры. В данном случае применён чип nForce 200 (BR-04), поддерживающий нужное количество линий на три порта PCI-E с поддержкой версии 2.0. Для связи с каждым чипом отводится по 16 линий PCI-E 2.0, и столько же — для передачи данных между системной платой и видеокартой.

Такой PCI-E мост устанавливался на предыдущее двухчиповое решение компании, и nForce 200 также известен тем, что предлагался в качестве альтернативного решения для поддержки технологии SLI системными платами на основе чипсета Intel X58.

Кроме того, что Geforce GTX 295 сама по себе работает как двухчиповая система, возможности технологии SLI позволяют объединять две такие платы в одной системе. Такая конфигурация называется Quad SLI. Современная реализация Quad SLI для всех четырёх чипов использует чистый AFR режим, когда параллельно обрабатываются четыре кадра. В таком случае частота кадров растёт довольно сильно, до 80-90% на каждое удвоение числа чипов.

О недостатках мультичипового рендеринга готовится отдельный материал, в котором мы постараемся подробно описать все особенности, связанные с работой режима AFR. Это касается как задержек ввода, не особенно сильно уменьшаемых при значительном росте среднего FPS, так и низком минимальном FPS и неравномерности частоты кадров. Все эти мелочи может и не слишком заметны на двухчиповой системе, но на четырехчиповой уже могут вызывать бОльшие неудобства — средняя частота кадров возрастает, а играть настолько уж комфортнее не становится.

Поддержка внешних интерфейсов у Geforce GTX 295 мало отличается от того, что мы видели у предыдущих решений на тех же GPU. Разве что имеющийся на платах Nvidia дополнительный чип ввода-вывода NVIO2, поддерживающий вынесенные за пределы основного внешние интерфейсы, в этот раз присутствует в количестве двух штук.

На видеокарте Geforce GTX 295 установлено два Dual Link DVI выхода с поддержкой HDCP, а также один HDMI выход. DVI выходы выводят изображение от первого GPU, а за единственный HDMI отвечает второй. С последними версиями драйверов при работе в режиме SLI поддерживается вывод на два DVI, а для использования всех трёх выходов одновременно нужно этот режим отключить. Для вывода звука по HDMI, что традиционно для решений Nvidia, на плате размещён SPDIF вход, к которому требуется присоединить источник аудиосигнала.

Естественно, Geforce GTX 295 поддерживает и технологию Nvidia PhysX, активное использование которой уже начинает появляться в таких играх, как недавно вышедшая «Анабиоз: Сон разума» (Cryostasis) и грядущая Mirror's Edge. Причём, Geforce GTX 295 может работать в режиме SLI, одновременно обрабатывая физические эффекты и построение кадра, и в режиме, когда один чип занимается 3D рендерингом, а второй — исключительно расчётами PhysX.



В конце теоретической части позвольте напомнить читателям о вопросе, которым мы задавались в базовой статье про RADEON HD 4870 X2. Тогда мы писали о том, что AMD отмечает проблемы, присущие крупным high-end чипам (при этом они явно намекали на GT200 от Nvidia), и среди этих проблем было и слишком высокое потребление энергии такими GPU. Что тогда мы удивлялись отсутствию этого преимущества у двухчиповых решений AMD (например, HD 4850 X2) по сравнению с одночиповым GTX 280 от Nvidia, что сейчас продолжаем недоумевать — куда делось мнимое преимущество по энергопотреблению? Особенно в случае HD 4870 X2, после того, как вышло двухчиповое решение на основе GT200b, выполненных при помощи 55 нм техпроцесса. Чипы Nvidia в полтора раза сложнее, а потребляют не больше RV770…

На этом теоретическая часть закончена, всю теорию про архитектуру GT200 и основы работы SLI мы давно знаем. А сейчас переходим к следующей части статьи, где нас ждёт практическая часть исследования нового решения на основе двух чипов GT200b в синтетических тестах, и сравнение его производительности со скоростью других решений компании Nvidia, а также конкурирующей видеокарты AMD.

Nvidia Geforce GTX 295 — Часть 2: видеоплаты и синтетические тесты





9 января 2009 Г.