NVIDIA GeForce GTS 450:


распространение новой архитектуры GF1xx на нижний ценовой диапазон



СОДЕРЖАНИЕ

  1. Часть 1 — Теория и архитектура
  2. Часть 2 — Практическое знакомство
  3. Особенности видеокарт
  4. Конфигурация стенда, список тестовых инструментов
  5. Результаты синтетических тестов
  6. Результаты игровых тестов (производительность)


Мы уже не раз говорили, что после выхода флагмана новой архитектуры трехмерной графики через какое-то время выходят в свет продолжатели нового веяния, только менее мощные. Не так давно пользователи дождались выхода продуктов среднего ценового уровня на основе той же архитектуры - GeForce GTX 460 768 и 1024MB. Теперь же предстоит опуститься еще ниже по лестнице цен и попасть в ценовую нишу 130-150 долларов США.

Вообще это выглядит как урезанное в каких-то блоках ядро, выполненное в виде соверщенно нового кристалла. Так было всегда с тех пор, как чипмейкеры ATI (AMD) и NVIDIA стали выпускать не одиночные продукты новой архитектуры, а целую линейку.

То есть в нашем случае, мы имеем дело с совершенно новым чипом GF106. О его особенностях в плане архитектуры расскажет Алексей Берилло.

Часть 1: Теория и архитектура



Компания NVIDIA продолжает выводить на рынок модели семейства GeForce 400, предназначенные для различных ценовых диапазонов. Все DX11 решения серии GeForce 400, основанные на архитектуре Fermi, имеют одинаковую организацию графического конвейера, с несколькими движками растеризации и так называемыми PolyMorph движками.

Наиболее дорогие и мощные решения линейки вышли ещё весной, и быстрейший из них GeForce GTX 480 имеет 480 процессоров (в чипе их 512) и 15 движков PolyMoprh (в чипе — 16). За счёт этого, GTX 480 имеет максимальную производительность, особенно в DX11-приложениях с использованием тесселяции, где важна быстрая обработка геометрических данных.

Далее, этим летом мы рассматривали решение уже среднего ценового уровня, основанное на видеочипе GF104, имеющем в своей основе последнюю графическую архитектуру NVIDIA — GeForce GTX 460. На наш взгляд, это наиболее выгодное приобретение для игроков, не желающих тратить слишком крупные суммы на видеосистему. Естественно, количество потоковых процессоров и блоков обработки геометрии в этом чипе было значительно уменьшено. И GTX 460, хоть и не может соперничать с GTX 480, но показывает отличную производительность в своём классе, оставаясь непревзойдённым в играх с поддержкой DX11.

Неохваченным у NVIDIA до сегодняшнего дня оставался только сегмент наиболее недорогих видеокарт с поддержкой DX11. Анонсированная модель GeForce GTS 450 предназначена для нижнего-среднего ценового диапазона, и сегодня мы познакомимся с ещё одним новым GPU и первой моделью видеокарты на его основе, предназначенной для ценового диапазона «чуть более $100».

Именно такие недорогие решения обычно имеют массовые продажи на рынке, и вот наконец-то NVIDIA выпустила соответствующее решение. Интересно, что по данным Valve Steam Survey, наиболее востребованными разрешениями экрана у игроков всего мира являются 1680х1050 и 1280х1024. Каждое из них используют порядка 17% игроков. То есть, в сумме дисплеями этих разрешений располагает треть игроков. А если к ним ещё и присоединить и все остальные близкие разрешения, вроде 1366х768 и 1440х900, то получается и вовсе почти 60% игроков.

Получается, что большинство играющих на ПК людей имеют мониторы размером 19-22". И GTS 450 отлично для них подойдёт, предлагая достаточный уровень производительности для таких условий. Новая модель видеокарты от NVIDIA призвана заменить порядком устаревший GeForce GTS 250, основанный ещё на чипе G92, а основным её конкурентом считается Radeon HD 5750, хотя рыночная ситуация вполне может сложиться так, что реальным конкурентом станет и более мощная модель — Radeon HD 5770.

Теперь NVIDIA остаётся выпустить, пожалуй, ещё один видеочип линейки GeForce 400, предназначенный для совсем уж дешёвых low-end видеокарт. И тогда у компании наконец-то будут решения с поддержкой DirectX 11 во всех ценовых диапазонах. Но эти решения с ценой менее $100 ещё будут анонсированы и выпущены в ближайшем будущем. Понятно, что они будут отличаться ещё более сниженным количеством исполнительных блоков, урезанной шиной памяти и т.п. Что, соответственно, приведет к сниженному быстродействию. Но это произойдёт несколько позже, и не факт, что получит особую огласку в прессе — всё-таки нижний ценовой диапазон привлекает не так много внимания. Ну а сегодня мы поговорим о GeForce GTS 450, основанном на GPU, известном под кодовым именем GF106.

Теоретическая часть статьи снова будет небольшой, так как GF106 во многом повторяет архитектурно GF104 и GF100, отличаясь от первого вовсе лишь по количеству исполнительных блоков. А вычислительную архитектуру «Fermi» анонсировали ещё осенью прошлого года, и большинство теоретических данных о ней было раскрыто ещё в январе. И перед прочтением этого материала, неплохо будет убедиться, что специальный обзор архитектуры GF100 и обзор GeForce GTX 470 и GTX 480 были внимательно прочитаны.

Полезно будет прочитать и остальные предшествующие материалы о последней архитектуре NVIDIA, если вы ещё не знакомы с ними, это базовые обзоры видеокарт серии GeForce 400 (GF1xx):

Будем считать, что с нынешней архитектурой видеочипов NVIDIA читатели хорошо знакомы, и рассмотрим подробные характеристики нового графического процессора этой компании и новой модели видеокарт GeForce GTS 450, основанной на чипе GF106.

Графический ускоритель GeForce GTS 450

  • Кодовое имя чипа GF106;
  • Технология производства 40 нм;
  • 1.17 миллиарда транзисторов;
  • Унифицированная архитектура с массивом процессоров для потоковой обработки различных видов данных: вершин, пикселей и др.;
  • Аппаратная поддержка DirectX 11 API, в том числе шейдерной модели Shader Model 5.0, геометрических (geometry) и вычислительных (compute) шейдеров, а также тесселяции;
  • 192-битная шина памяти, три независимых контроллера шириной по 64 бита каждый, с поддержкой GDDR5 памяти;
  • Частота ядра 783 МГц (для GTS 450);
  • Удвоенная частота ALU 1566 МГц (для GTS 450);
  • 4 потоковых мультипроцессора, включающих 192 скалярных ALU для расчётов с плавающей точкой (поддержка вычислений в целочисленном формате, с плавающей запятой, с FP32 и FP64 точностью в рамках стандарта IEEE 754-2008);
  • 1 блок растеризации с четырьмя движками PolyMorph;
  • 32 блока текстурной адресации и фильтрации с поддержкой FP16 и FP32 компонент в текстурах и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов;
  • 3 широких блока ROP (24 пикселя) с поддержкой режимов антиалиасинга до 32 выборок на пиксель, в том числе при FP16 или FP32 формате буфера кадра. Каждый блок состоит из массива конфигурируемых ALU и отвечает за генерацию и сравнение Z, MSAA, блендинг;
  • Запись результатов до 8 буферов кадра одновременно (MRT);
  • Интегрированная поддержка RAMDAC, двух портов Dual Link DVI, а также HDMI и DisplayPort.

Спецификации референсной видеокарты GeForce GTS 450

  • Частота ядра 783 МГц;
  • Частота универсальных процессоров 1566 МГц;
  • Количество универсальных процессоров 192;
  • Количество текстурных блоков — 32, блоков блендинга — 16;
  • Эффективная частота памяти 3608 (902*4) МГц;
  • Тип памяти GDDR5, 128-бит шина памяти;
  • Объем памяти 1024 МБ;
  • Пропускная способность памяти 57.7 ГБ/с;
  • Теоретическая максимальная скорость закраски 12.5 гигапикселей в секунду;
  • Теоретическая скорость выборки текстур 25.1 гигатекселей в секунду;
  • Два Dual Link DVI-I разъема, один Mini HDMI, поддерживается вывод в разрешениях до 2560х1600;
  • Одинарный SLI разъем;
  • Шина PCI Express 2.0;
  • Поддержка HDCP, HDMI, DisplayPort;
  • Энергопотребление до 106 Вт (один 6-штырьковый разъём);
  • Двухслотовое исполнение;
  • Рекомендуемая цена для американского рынка $129 (в России — 4999 руб).

Новый графический процессор GF106, предназначенный для нижнего-среднего ценового диапазона, также выполнен по 40 нм технологическим нормам, как и предшествующие ему видеочипы линейки. Для данного рыночного сектора новый GPU довольно мощный и сложный, он состоит из заметно более чем 1 млрд. транзисторов, а цены готового решения GeForce GTS 450 лишь немногим превысят $100.

Принцип наименования видеокарт NVIDIA остался прежним. В случае рассматриваемой видеокарты, по сравнению с более мощными моделями, поменялась не только средняя цифра в индексе. Новое решение получило наименование GTS 450, и буква «S» в названии указывает на средний уровень в линейке ниже, чем у серии GTX. Изменилось и цифровое обозначение, 450 это меньше, чем более мощная 460, что вполне логично.

На базе чипа GF106 пока что анонсирована только одна модель — GeForce GTS 450, которая приходит на смену решению GTS 250 (как видите, изменилась только цифра поколения, с 2 на 4). Как видно по характеристикам чипа GF106 и видеокарты GTS 450, аппаратно имеется поддержка 192-битной шины памяти и 24 блока ROP, но выпущенная видеокарта имеет лишь 128-битную шину и 16 активных блоков ROP (а также 256 КБ кэша вместо имеющихся 384 КБ).

Логично ожидать выхода и полноценного решения на основе данного GPU. Тем более что аналогично чипу GF104, новый GPU также отличается приличным разгонным потенциалом. По данным NVIDIA, большинство видеокарт GeForce GTS 450 способны обеспечить работу GPU на частоте до 900 МГц и даже выше, а многие из партнёров компании планируют предложить фабрично разогнанные варианты таких карт.

Поэтому, со временем весьма вероятен выход как минимум ещё одной модели видеокарты на основе этого графического процессора. Можно предположить, что он будет медленнее 460, но быстрее 450, и иметь GPU со всеми активными каналами памяти, а также более высокими частотами работы. Есть и ещё один вариант — установка на карту 1.5 ГБ более дешёвой памяти типа GDDR3. Ну а если и GDDR5, то даже 768 МБ для такой платы вполне хватит. Возможно, есть смысл со временем вообще убрать GTX 460 768 MB с рынка, оставив только вероятный GTX 455 на основе урезанного GF104, а также GeForce GTX 460 1GB.

Архитектура графического процессора GF106

Новый чип получил кодовое имя GF106, и оно означает, что это графический чип, основанный на вычислительной архитектуре «Fermi», а числовое значение с окончанием на «6» — принято для видеочипов архитектуры NVIDIA, нацеленных на нижний-средний ценовой диапазон рынка. Понятно, что эта архитектура поддерживает все нововведения современного DirectX 11 API, такие как аппаратная тесселяция и вычислительные возможности DirectCompute, и отличается от старших GPU в основном количественно.

GF106 очень похож на GF104, и, глядя на их сравнительные характеристики, поначалу кажется, что это ровно половинка от GF104. На деле отличий больше, и в GF106 скорее 0.6 или даже 0.7 от GF104. В новом GPU содержится ровно вдвое меньше потоковые мультипроцессоров (Streaming Multiprocessor), а соответственно и вычислительных процессоров, но количество каналов памяти, а вместе с этим и блоков ROP и L2 кэша, отличается менее чем в два раза.

Известно, что наиболее важным отличием текущей архитектуры NVIDIA является значительная переработка геометрического конвейера. Чтобы соответствовать новым возможностям DirectX 11, в современных GPU от NVIDIA была значительно увеличена пиковая производительность обработки геометрии. Новая архитектура геометрической обработки использует несколько полиморфных движков (PolyMorph Engines) и блоков растеризации (Raster Engines), работающих параллельно.

Аналогично предыдущим чипам линейки, в основе GF106 лежит кластере графической обработки (Graphics Processing Cluster), в данном случае он один и содержит четыре потоковых мультипроцессора (Streaming Multiprocessors), которые, в свою очередь, имеют в своём составе по 48 потоковых процессоров, как и у GF104.

Учитывая эти данные, получается, что в целом чип имеет 192 потоковых процессора и 32 текстурных модуля. А также три (в отличие от четырёх у GF104) 64-битных контроллера памяти, сблокированных с кэш-памятью второго уровня (384 КБ) и восемью блоками ROP (всего 24 штуки, в отличие от 32-х у GF104).

Но, как указано выше, пока что компания NVIDIA выпустила только одну модель видеокарты на базе GF106, и один из контроллеров памяти в нём отключен. Зато количество активных потоковых процессоров соответствует их физическому количеству в GPU, в отличие от всех ранее выпущенных чипов новой архитектуры. Итого, шина памяти у выпущенного GeForce GTS 450 получается 128-битная, хотя аппаратно в чипе есть три контроллера по 64-бит и в будущем вполне возможен выход 192-битного варианта на основе GF106.

За исключением количественных отличий, GF106 идентичен GF104. Кластер Graphics Processing Cluster содержит лишь один движок растеризации (Raster Engine), выполняющий установку треугольников, растеризацию и отбрасывание невидимых поверхностей, и четыре движка PolyMorph, выполняющих выборку вершинных атрибутов и тесселяцию, привязанные к каждому из мультипроцессоров SM в кластере. То есть, по сравнению с GF104 и GF100, у сегодняшнего чипа производительность обработки геометрии и тесселяции не будет такой высокой, что несколько нивелирует преимущества новой архитектуры.

По устройству мультипроцессоры SM в GF106 такие же, как и в GF104, они содержат по 48 потоковых CUDA ядер, что в полтора раза больше, чем в GF100. Потоковые процессоры имеют в своём составе исполнительное устройство для целочисленных вычислений (INT) и исполнительное устройство для вычислений с плавающей запятой (FPU).

Каждый из мультипроцессоров имеет 16 блоков загрузки и сохранения данных (load/store unit, LD/ST или LSU), позволяющих вычислять адреса источника и назначения для 16 потоков за такт. А также удвоенное количество блоков для выполнения специальных функций (Special Function Units, SFU) и диспетчеров (Dispatch Unit) — то есть, никаких изменений по сравнению с GF104 тут нет.

Каждый из мультипроцессоров имеет восемь текстурных блоков, в отличие от четырёх TMU в GF100, и всего получается 32 TMU. Кроме их количества на SM, никаких изменений по сравнению с GF100 нет. Да и подсистема памяти осталась той же: каждый мультипроцессор в GF106 имеет 64 килобайта начиповой памяти, которая может быть сконфигурирована в двух разных вариантах: 48 килобайт общей памяти и 16 килобайт L1 кэш-памяти, и наоборот — 16 КБ общей памяти и 48 КБ кэша. Кроме этого, новый GPU имеет 384 КБ унифицированной кэш-памяти второго уровня, которая обслуживает запросы по загрузке и сохранению данных, а также текстурные выборки.

Другие особенности GeForce GTS 450

Похоже, что GeForce GTS 450 неплохо подойдёт для сборки высокопроизводительных HTPC. Хотя видеокарта довольно крупная по размеру, она занимает в корпусе два слота и требует дополнительного питания, но также отличается и неплохой 3D производительностью, что в некоторых случаях важно и для HTPC, являющихся одновременно и домашними ПК.

А новый GPU, как и его старший брат GF104, поддерживает битстриминг аудиопотоков форматов Dolby True HD и DTS-HD Master Audio при передаче сигнала по HDMI на внешние ресиверы. Немаловажно отметить и полную поддержку декодирования Blu-ray фильмов, в том числе и в стереоформате, который набирает популярность в последнее время.

Новое решение NVIDIA поддерживает и технологию 3D Vision Surround, позволяющую выводить стереоизображение сразу на три монитора. Но это снова относится лишь к мультичиповым конфигурациям, технология поддерживается программно в драйверах, и для поддержки вывода на три монитора потребуются две видеокарты в SLI режиме.

Специально к выходу нового решения, NVIDIA подготовила и новую версию драйверов. Основным, важнейшим для пользователей изменением, является оптимизация производительности для всей новой линейки видеокарт: GTX 480/470/465, GTX 460 и GTS 450. Пользователям решений новой линейки обещано по 7-13% прироста на видеокартах серии GeForce 400 во многих современных играх, а в отдельных случаях и вовсе до 20%.

Из других нововведений драйвера версии 260 можно отметить некие улучшения в поддержке стереорендеринга NVIDIA 3D Vision и его Surround модификации, а также поддержку проигрывания Blu-ray 3D дисков на устройствах отображения, имеющих HDMI версии 1.4 вместе с поддержкой стереоотображения. Удобнее стала и настройка вывода картинки сразу на несколько дисплеев.

Ну а завершает список изменений новый инсталлятор драйвера. Во-первых, теперь в едином пакете устанавливается и стереодрайвер, ранее требующий отдельной установки. Да и все остальные компоненты (PhysX, аудиодрайвер) теперь можно выбрать. Ну а во-вторых, и это даже важнее для большинства пользователей, не имеющих комплектов 3D Vision, инсталлятор стал удобнее, теперь при установке он предлагает несколько возможностей: «быстрая» и выборочная установка, при которой можно выбрать требуемые компоненты, а также «чистая» установка драйвера, при которой сначала корректно удаляются предыдущие видеодрайверы компании NVIDIA.

Теоретические выводы

Новый видеопроцессор GF106 основан на последней модификации архитектуры NVIDIA, с которой мы познакомились в GF104. Новый GPU нижнего-среднего ценового диапазона отличается от него только количественными изменениями и выгодно отличается от топового GPU улучшениями, связанными с графическими задачами: увеличенным количеством текстурных блоков и потоковых процессоров на каждый из четырёх мультипроцессоров.

Преимущества графической архитектуры Fermi относятся и к GF106, хотя некоторые из них несколько померкли. Это и немудрено, в таком недорогом GPU приходится идти на компромиссы. Изменения в графическом конвейере новых чипов NVIDIA безусловно позитивны, но в состав нового GPU входит лишь четыре движка тесселяции и лишь один блок растеризации, что хоть и лучше, чем у предыдущих чипов компании, но не даст такого преимущества в современных DirectX 11 приложениях, как это мы видели в случае более производительных GPU.

С позитивной стороны можно отметить физическое наличие трёх 64-битных контроллеров памяти в GF106, хотя в конкретной модели GeForce GTS 450 включены лишь два из них. Несмотря на вдвое уменьшенное количество потоковых процессоров и блоков TMU, в GF106 оставили 3/4 от ширины шины памяти, количества ROP и кэш-памяти, по сравнению с GF104. Когда на его основе выйдет более производительное решение, то это должно положительно сказаться на игровой производительности, на практике зачастую упирающейся в эффективный филлрейт.

Что касается конкретной модели, выпущенной под индексом GTS 450, то мы отметим, что, судя по характеристикам, она получилась неплохой и при указанной цене вполне способна завоевать часть рынка, так как отличается неплохо сбалансированными характеристиками и ценой. Также будет интересно, под каким именем, с какой ценой и в какие сроки выйдет модель на основе полноценного GF106 с 192-битной шиной памяти, так как она может стать даже ещё более привлекательной, особенно при условии повышенных частот работы GPU.

Итак, в первой части материала были рассмотрены характеристики и теоретические особенности нового графического процессора GF106 и видеокарты на его основе — GeForce GTS 450. Следующая часть статьи будет посвящена практической части исследования в синтетических тестах, там мы сравним производительность нового решения со скоростью других решений компании NVIDIA и их конкурентов от AMD в предельных тестах.



NVIDIA GeForce GTS 450 — Часть 2: видеоплаты и синтетические тесты










  • Поделиться:
Дополнительно

ВИКТОРИНА HIGHSCREEN

Каких смартфонов НЕТ в актуальной линейке Highscreen?

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.