Nvidia Geforce GTX 650 Ti:

описание видеокарт и результаты синтетических тестов

Содержание

В этой части мы изучим видеокарты, а также познакомимся с результатами синтетических тестов. В нашей лаборатории побывала карта компании Zotac.

Платы

Zotac Geforce GTX 650 Ti 2048 МБ 128-битной GDDR5 PCI-E
  • GPU: Geforce GTX 650 Ti (GK106)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs): 1033 МГц (номинал — 925 МГц)
  • Частота работы памяти (физическая (эффективная)): 1500 (6000) МГц (номинал — 1350 (5400) МГц)
  • Ширина шины обмена с памятью: 128 бит
  • Число вычислительных блоков в GPU/частота работы блоков: 4/1033 МГц (номинал — 4/925 МГц)
  • Число операций (ALU) в блоке: 192
  • Суммарное число операций (ALU): 768
  • Число блоков текстурирования: 64 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 16
  • Размеры: 150×100×30 мм (последняя величина — максимальная толщина видеокарты)
  • Цвет текстолита: черный
  • Энергопотребление (пиковое в 3D/в режиме 2D/в режиме «сна»): 120/34/22 Вт
  • Выходные гнезда: 1×DVI (Dual-Link/HDMI), 1×DVI (Single-Link/VGA), 2×HDMI 1.4a
  • Поддержка многопроцессорной работы: SLI (Software)

Zotac Geforce GTX 650 Ti 2048 МБ 128-битной GDDR5 PCI-E
Карта имеет 2048 МБ памяти GDDR5 SDRAM, размещенной в 8 микросхемах (по 4 на каждой стороне PCB).

Микросхемы памяти Hynix (GDDR5). Микросхемы рассчитаны на максимальную частоту работы в 1500 (6000) МГц.

Сравнение с эталонным дизайном, вид спереди
Zotac Geforce GTX 650 Ti 2048 МБ 128-битной GDDR5 PCI-E Reference card Nvidia Geforce GTX 650 Ti

Сравнение с эталонным дизайном, вид сзади
Zotac Geforce GTX 650 Ti 2048 МБ 128-битной GDDR5 PCI-E Reference card Nvidia Geforce GTX 650 Ti

Инженеры использовали ядро, поддерживающее 192-битную шину обмена с памятью, для установки на более простую PCB с 128-битной шиной. Собственно, реально PCB очень простая и суперкомпактная. Отличия между дизайном от Zotac и референсным минимальны. По сути только в гнездах вывода: у Zotac их четыре, а у референс-карты — три. Остальные отличия незначительны.

Видеокарта имеет оригинальный набор гнезд вывода: 2 DVI (один из которых Single-Link и совместим с выводом на VGA) и два HDMI (второе гнездо DVI обладает возможностью через адаптер передавать сигнал на HDMI, поэтому суммарно можно подключить 3 приемника с HDMI). Напомним, что ускорители Nvidia достаточно давно обладают собственными звуковыми кодеками, поэтому передача на HDMI-монитор будет полноценной, со звуком.

Максимальные разрешения и частоты:

  • 240 Гц — максимальная частота обновления;
  • 2048×1536@85 Гц — по аналоговому интерфейсу;
  • 2560×1600@60 Гц — по цифровому интерфейсу (для DVI-гнезд с Dual-Link/HDMI).

Что касается возможностей по ускорению декодирования видео — в 2007 году мы проводили такое исследование, с ним можно ознакомиться здесь.

Карта требует дополнительного питания, причем одним 6-контактным разъемом.

О системе охлаждения.

Zotac Geforce GTX 650 Ti 2048 МБ 128-битной GDDR5 PCI-E
Кулер состоит из большого центрального алюминиевого радиатора и кожуха с большим вентилятором. Собственно, ничего особенного. Подобные СО мы уже видели многократно, они стандартны.

Микросхемы памяти без охлаждения.

СО получилась очень нешумная. Максимальная частота вращения вентилятора ниже 1200 оборотов в минуту.

Мы провели исследование температурного режима с помощью новой версии утилиты EVGA PrecisionX (автор А. Николайчук AKA Unwinder) и получили следующие результаты.

Zotac Geforce GTX 650 Ti 2048 МБ 128-битной GDDR5 PCI-E

После 6 часов прогона карты под максимальной игровой нагрузкой максимальная температура ядра составила 65 градусов, что говорит о том, что СО получилась очень достойной и высокоэффективной.

Комплектация. Базовый комплект поставки должен включать в себя руководство пользователя и диск с драйверами и утилитами.

Zotac Geforce GTX 650 Ti 2048 МБ 128-битной GDDR5 PCI-E
Перед нами базовый комплект плюс разветвитель на 6-контактный коннектор питания и адаптер DVI-to-VGA.

Упаковка.

Zotac Geforce GTX 650 Ti 2048 МБ 128-битной GDDR5 PCI-E

Установка и драйверы

Конфигурация тестового стенда:

    Компьютеры на базе процессора Intel Core i7-3960X (Socket 2011):
    • процессор Intel Core i7-3960X (o/c 4 ГГц);
    • системная плата Asus Sabertooth X79 на чипсете Intel X79;
    • системная плата MSI X79A-GD45(8D) на чипсете Intel X79;
    • оперативная память 8 ГБ DDR3 SDRAM Corsair 1866 МГц;
    • жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA2;
    • жесткий диск WD Caviar Blue WD10EZEX 1 TБ SATA2;
    • 2 блока питания Enermax Platimax 1200 Вт.
  • операционная система Windows 7 64-битная; DirectX 11;
  • монитор Dell UltraSharp U3011 (30″);
  • драйверы AMD версии Catalyst 12.11beta; Nvidia версии 306.97

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

В качестве синтетических тестов DirectX 11 мы использовали примеры из пакетов SDK компаний Microsoft и AMD, а также демонстрационной программой Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010).

Мы взяли и приложения обоих производителей видеочипов: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain, также известная как Island11.

Синтетические тесты проводились на следующих видеокартах:

  • Geforce GTX 650 Ti со стандартными параметрами (далее GTX 650 Ti);
  • Geforce GTX 660 со стандартными параметрами (далее GTX 660);
  • Geforce GTX 560 Ti со стандартными параметрами (далее GTX 560 Ti);
  • Geforce GTX 550 Ti со стандартными параметрами (далее GTX 550 Ti);
  • Radeon HD 7850 со стандартными параметрами (далее HD 7850);
  • Radeon HD 7770 со стандартными параметрами (далее HD 7770).

Для сравнения результатов новой модели видеокарты Geforce GTX 650 Ti данные решения были выбраны по следующим причинам. Geforce GTX 660 является ближайшей к GTX 650 Ti моделью, основанной на базе того же графического процессора GK106 архитектуры Kepler. Сравнение с GTX 550 Ti и GTX 560 Ti будет интересно по причине разных поколений и ценовых диапазонов видеокарт — насколько увеличилась производительность модели новой линейки, по сравнению с предшественниками новинки.

Две видеоплаты конкурирующей компании AMD были выбраны для наших тестов потому, что Radeon HD 7770 имеет чуть меньшую цену, по сравнению с рекомендованной ценой анонсированной видеокарты Nvidia Geforce GTX 650 Ti, а вторая модель — Radeon HD 7850 — имеет несколько большую цену. Другими словами, прямого конкурента для Geforce GTX 650 Ti у AMD нет, но ими можно считать сразу обе эти видеокарты из новой линейки Radeon HD 7000.

Direct3D 9: тесты Pixel Shaders

Тесты текстурирования и заполнения (филлрейта) из пакета 3DMark Vantage мы рассмотрим ниже, а первая группа пиксельных шейдеров, которую мы используем, включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся в старых играх, и она очень проста для современных видеочипов.

Как мы уже отметили, тесты очень простые для современных GPU, и скорость в них часто упирается в производительность текстурирования или филлрейт. Поэтому они способны показать далеко не все возможности современных видеочипов, но всё же интересны с точки зрения устаревших игровых приложений, которых до сих пор достаточно много. Судя по нашим предыдущим сравнениям, производительность последних видеокарт в этих тестах ограничена чаще всего филлрейтом, хотя и влияние скорости текстурных модулей также есть.

Новый 3D-ускоритель Nvidia в этом сравнении смотрится неплохо — чуть быстрее Geforce GTX 560 Ti и не так много уступает GTX 660, которая лидирует в этих тестах. Что касается сравнения с видеоплатами компании AMD, то, как ни удивительно, но новинка Geforce GTX 650 Ti показала результат скорее на уровне Radeon HD 7850 (кроме пары подтестов), чем HD 7770, как можно было предположить, исходя из цены.

Понятно, что Geforce GTX 550 Ti тут ловить вовсе нечего, новинка значительно опередила её во всех тестах, равно как и Radeon HD 7770. Посмотрим на результаты более сложных пиксельных программ промежуточных версий:

Тест Cook-Torrance более интенсивен вычислительно, скорость в нём зависит от количества ALU и их частоты, но также и от скорости TMU. Хотя данный тест исторически лучше подходил для графических решений компании AMD, все новые платы Geforce на базе архитектуры Kepler в нём оказываются также сильны.

Новинка Nvidia показывает результат между GTX 560 Ti и GTX 660, и её скорость в обоих тестах значительно превышает показатели обеих видеоплат AMD, и HD 7770, и HD 7850. Причём, что в тесте освещения, больше зависящем от скорости ALU, что в тесте Water, скорость в котором больше зависит от текстурирования, мы видим примерно одно и то же. Сегодняшняя героиня в лице Geforce GTX 650 Ti показывает второй результат, а абсолютное лидерство в обоих тестах ожидаемо заняла GTX 660. Неудивительно, что новая Geforce GTX 650 Ti опередила GTX 560 Ti (и тем более GTX 550 Ti) в этой паре тестов — старые платы явно не столь быстры в математических и текстурных задачах.

Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье «Современная терминология 3D-графики».
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

Существует два варианта этих шейдеров: с ориентацией на математические вычисления и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это универсальные тесты, производительность в которых зависит и от скорости блоков ALU, и от скорости текстурирования, также в них важен общий баланс чипа и эффективность исполнения вычислительных программ. Результаты теста показывают, что в этих конкретных задачах архитектура AMD смотрится несколько лучше, чем графическая архитектура Nvidia.

Производительность старшей из пары Radeon такова, что она обходит даже Geforce GTX 660, являющуюся самой дорогой платой сравнения. В тесте «Frozen Glass» скорость сильно зависит от математической производительности, и Radeon HD 7850 оказывается быстрее всех. Что касается новинки Nvidia, то в первом тесте она отстаёт от GTX 660, но опережает GTX 560 Ti и GTX 550 Ti.

Во втором тесте «Parallax Mapping» новая видеокарта Nvidia показала производительность почти на уровне Radeon HD 7850 и оказалась заметно быстрее чем HD 7770. Отставание от старшей GTX 660 осталось примерно таким же. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:

В этот раз положение плат на чипах производства Nvidia явно улучшилось, и Geforce GTX 650 Ti теперь во всех тестах опережает обоих конкурентов от AMD и совсем чуть-чуть уступает старшей модели Nvidia. Современные чипы Nvidia и в этих задачах явно работают несколько эффективнее, и новая видеокарта Geforce GTX 650 Ti в тестах с запасом обогнала GTX 560 Ti, не говоря уже о GTX 550 Ti.

Но это были устаревшие задачи, с упором в текстурирование и филлрейт. Далее мы рассмотрим результаты ещё двух тестов пиксельных шейдеров — но уже версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9. Они наиболее показательны с точки зрения современных игр на ПК, среди которых много мультиплатформенных. Тесты отличаются тем, что сильно нагружают и ALU, и текстурные модули, обе шейдерные программы сложны и длинны, и включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье «Современная терминология 3D-графики».
  • Fur — процедурный шейдер, визуализирующий мех.

Эти тесты не ограничены производительностью текстурных выборок и больше всего зависят от эффективности исполнения сложного шейдерного кода. В самых тяжёлых DX9-тестах из первой версии пакета RightMark видеокарты производства Nvidia в предыдущие годы были сильнее, но в последних архитектурах сравнялись и теперь идут на равных. Естественно, что Geforce GTX 660 в сравнении показала лучший результат, так как она из более высокого ценового диапазона.

Рассматриваемая нами сегодня модель Geforce GTX 650 Ti заметно уступает старшей сестре, что вполне объяснимо с точки зрения теории. Любопытны почти идентичные результаты в обоих тестах у GTX 650 Ti и GTX 560 Ti и почти двукратное отставание GTX 550 Ti. Ещё интереснее сравнение с видеоплатами компании AMD — новинка снова расположилась близко к Radeon HD 7850, а не к HD 7770.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два знакомых теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

В этом тесте производительность зависит в большей степени от количества и эффективности блоков TMU, влияет и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает ещё и эффективный филлрейт, и пропускная способность памяти. Результаты при детализации уровня «High» получаются до полутора раза ниже, чем при «Low».

В задачах процедурной визуализации меха с большим количеством текстурных выборок за пару поколений графических архитектур компания AMD не только сократила разницу с платами Nvidia, но с выпуском GCN и вовсе вырвалась вперёд. Теперь именно платы Radeon всегда являются лидерами таких сравнений, что говорит о высокой эффективности выполнения ими данных программ. Что мы и видим на диаграмме, где HD 7850 выступила на уровне более дорогой Geforce GTX 660. А вот новинка им серьёзно уступила.

Рассматриваемая нами сегодня модель Geforce GTX 650 Ti показала самый слабый результат, уступив и младшей из пары Radeon, и даже GTX 560 Ti. Вероятно, в этом виновата снизившаяся пропускная способность памяти. Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: возможно, в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

Но и в этот раз ситуация аналогична предыдущей, разве что GTX 650 Ti опередила старенькую GTX 560 Ti, результаты которой упали значительнее. Видеокарты новой линейки Geforce GTX 600 в этом тесте улучшают результаты относительно старой линейки Geforce GTX 500. Кроме того, теперь GTX 660 является лидирующим решением в сравнении. Вероятно, при включении суперсэмплинга, увеличивающего теоретическую нагрузку вчетверо, результаты AMD немного ухудшились, по сравнению с показателями видеокарт компании Nvidia.

Протестированная нами сегодня плата компании Nvidia опередила разве что GTX 560 Ti и стала второй с конца. Удивительно, но Radeon HD 7770 и HD 7850 в этот раз показали почти одинаковые результаты. В любом случае они выше, чем у новинки Nvidia. Так что отмечаем сильный проигрыш GTX 650 Ti своим конкурентам из AMD. Преимущество в сложных вычислениях явно у чипов компании AMD, предпочитающих попиксельные вычисления.

Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип ещё примерно в два раза — такой режим называется «High».

Диаграмма в целом похожа на предыдущую (без включения SSAA), хотя старая Geforce GTX 560 Ti немного потеряла. Решения Nvidia в этом тесте справляются всё так же хуже конкурирующих, но новая плата Geforce GTX 650 Ti в обновленном D3D10-варианте теста без суперсэмплинга почти догнала своего младшего соперника в виде Radeon HD 7770. Ну а HD 7850 вместе с GTX 660 оказались быстрейшими видеокартами. Посмотрим, что изменит включение суперсэмплинга, ведь он обычно вызывает сильное падение скорости на платах Nvidia.

Всё снова примерно так же, что и в «Fur». При включении суперсэмплинга и самозатенения задача получается ещё более тяжёлой, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьёзное падение производительности. Разница между скоростными показателями протестированных видеокарт изменилась, включение суперсэмплинга сказывается, как и в предыдущем случае — видеокарты Radeon HD 7850 и Geforce GTX 560 Ti ухудшили свои относительные показатели.

Теперь Geforce GTX 660 стала явным лидером, а героиня нашего обзора хоть и уступает обеим Radeon, но уже совсем не так много. Снова удивляемся резкому снижению результатов Radeon HD 7850. Но даже в этом случае GTX 650 Ti не может конкурировать с ней в этом тесте, так как графические решения Nvidia в наших D3D10-тестах пиксельных шейдеров работают менее эффективно. Ну хотя бы GTX 560 Ti новинка обогнала, и то хлеб.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты наших предельных математических тестов более-менее соответствуют разнице в частотах и количестве вычислительных блоков, но с влиянием разной эффективности их использования. Архитектуры AMD последних лет в таких тестах ранее имели большое преимущество перед конкурирующими видеокартами Nvidia, но калифорнийская компания в архитектуре Kepler увеличила число потоковых процессоров, и пиковая математическая производительность свежих моделей Geforce значительно возросла.

Результаты видеокарт на диаграмме расположились примерно соответственно теории, хотя и с некоторыми исключениями. Рассматриваемая Geforce GTX 650 Ti опередила обоих прямых конкурентов в лице Radeon HD 7770 и HD 7850, что совсем необычно для наших сравнений, потому что Radeon схожей цены чаще всего оказываются быстрее. Это объясняется худшей эффективностью видеочипов AMD — их скорость должна быть выше, но карты семейства Geforce GTX 600 в этой задаче работают явно эффективнее.

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нём только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Во втором математическом тесте относительный результат новинки компании Nvidia оказался несколько ниже — чуть выше уровня Geforce GTX 560 Ti. Новая модель всё так же опережает обе платы семейства AMD Radeon HD 7000, но разница в скорости между Radeon и GTX 650 Ti уже совсем не так велика — эффективность вычислений архитектуры Kepler во втором математическом тесте явно чуть ниже, чем у предыдущей архитектуры Fermi.

В любом случае, новая плата компании на базе чипа GK106 опередила устаревшую модель GTX 560 Ti, из-за большего количества математических блоков, которые вошли в GPU. Новая архитектура Kepler куда эффективнее в целом, и для приложений такого рода подходит заметно лучше.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаковое для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS почти двукратное. Задача эта для современных видеокарт не слишком сложная, и производительность в ней ограничена скоростью обработки геометрии и пропускной способностью памяти.

Сразу же видна разница между результатами видеокарт на чипах Nvidia и решений AMD — налицо отличия в геометрических конвейерах. Если в предыдущих тестах с пиксельными шейдерами платы AMD были в среднем эффективнее и быстрее, то первый же тест геометрии показал, что в таких задачах платы Nvidia остаются лидерами. Впрочем, сегодняшняя новинка Geforce GTX 650 Ti имеет меньшее количество геометрических блоков и прилично отстаёт от GTX 660, хотя это не сильно ей мешает в борьбе с настоящими конкурентами, да и GTX 560 Ti из предыдущего поколения осталась позади.

Показанная скорость GTX 650 Ti позволяет ей обойти обоих конкурентов в данной задаче, и итог сравнения вполне логичен — разница между Geforce GTX 650 Ti и обеими платами Radeon налицо. Хотя в этом поколении платы Radeon улучшили свои показатели, но им пока что удаётся догнать разве что Fermi. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры не изменились для устаревшей платы Nvidia и немного улучшились для плат AMD и решений Nvidia из современного поколения. Все видеокарты в данном тесте слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, а поэтому и все выводы остаются прежними. Новая модель Geforce GTX 650 Ti оказалась заметно медленнее GTX 660, но всё так же быстрее обеих видеоплат семейства Radeon HD 7000 и старой платы на чипе архитектуры Fermi. Интересно, что изменится в следующем тесте, который предполагает большую нагрузку именно на геометрические шейдеры.

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленным в «Heavy» — ещё и для их отрисовки, то есть в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер.

Увы, но в этом тесте нет результатов для Radeon HD 7850, поскольку по какой-то причине они просто не запустились на этой модели. Относительные результаты остальных решений в разных режимах также примерно соответствуют изменению нагрузки: во всех случаях производительность неплохо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть чуть менее чем в два раза медленней.

В этом тесте скорость рендеринга ограничена в основном геометрической производительностью. И на этот раз Geforce GTX 650 Ti показала скорость ближе к старшей модели GTX 660. Эти цифры могут серьёзно измениться на следующей диаграмме, в тесте с более активным использованием геометрических шейдеров. Кроме того, будет интересно сравнить друг с другом результаты, полученные в режимах «Balanced» и «Heavy».

Старшая плата Radeon отсутствует по указанной выше причине, а младшая стала худшей в сравнении. Что неудивительно, ведь в этом тесте важна скорость обработки геометрии, с которой дела у Nvidia обстоят явно лучше. При переносе вычислений в геометрический шейдер диаграмма поменялась, новая видеокарта Nvidia уступила старшей сестре чуть больше, но всё так же опередила Geforce GTX 560 Ti из предыдущего поколения.

Скорость в этом тесте явно упирается именно в производительность геометрических блоков, которые у решений Nvidia традиционно очень мощные. Хотя результат новой платы на базе GK106 хуже, чем у Geforce GTX 660 с полноценным чипом, это вполне объяснимо, так как последняя имеет большее количество активных геометрических блоков и более высокую рабочую частоту.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Наши предыдущие исследования показали, что на результаты этого теста может влиять и скорость текстурирования и пропускная способность памяти, особенно в лёгком режиме. А результаты некоторых видеокарт Nvidia и вовсе бывают ограничены ещё чем-то непонятным. Между схожими по классу платами разница в этом тесте зачастую порой получается очень небольшой.

Geforce GTX 650 Ti показала результат явно хуже, чем GTX 660, но всё же справилась с GTX 560 Ti. Самой медленной стала Radeon HD 7770, а вот в сравнении HD 7850 и GTX 650 Ti всё несколько сложнее. С задачей они справляются с переменным успехом. В лёгком режиме HD 7850 быстрее, в среднем решения примерно равны, а в сложном режиме впереди уже сегодняшняя новинка. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Взаимное расположение карт на диаграмме немного изменилось за счёт того, что платы Nvidia обеспечили почти ту же скорость рендеринга во всех режимах, в отличие от решений AMD, результаты которых ухудшились. Результаты Geforce GTX 650 Ti снова хуже, чем у GTX 660, но близки к скорости GTX 560 Ti, и даже чуть выше. Также новинка оказалась быстрее обеих плат компании AMD, опередив даже более дорогую Radeon HD 7850. Ну а слабейшей ожидаемо стала младшая модель серии Radeon HD 7700.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты во втором тесте вершинного текстурирования «Waves» не похожи на то, что мы видели на предыдущих диаграммах. В этот раз по каким-то странным причинам показатели новой модели Geforce GTX 650 Ti оказались низкими — на уровне Radeon HD 7770. Именно эти две платы стали самыми медленными. Скорость Radeon HD 7850 примерно соответствует показателям GTX 660, а старая GTX 560 Ti несколько медленнее их. Рассмотрим второй вариант этого же теста:

В лёгких режимах видеоплаты компании Nvidia несколько пострадали, что позволило Radeon HD 7850 стать наравне с Geforce GTX 660, и эта пара в сравнении быстрейшая. А вот результаты сегодняшней новинки стали только хуже. Geforce GTX 650 Ti просто провалилась на последнее место, уступив даже Radeon HD 7770. Причём, в тяжёлом режиме уступила прилично. Вероятно, провал можно объяснить недоработками в драйверах и сравнительно низкой ПСП. В очередной раз в тестах вершинного текстурирования новинка выступила довольно слабо.

3DMark Vantage: тесты Feature

Синтетические тесты из пакета 3DMark Vantage покажут нам то, что мы ранее упустили. Feature-тесты из этого тестового пакета обладают поддержкой DirectX 10 и интересны тем, что отличаются от наших и до сих пор актуальны. При анализе результатов новой видеокарты Nvidia в этом пакете мы сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark. Feature Test 1: Texture Fill

Первый тест — тест скорости текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Тест компании Futuremark не показывает теоретически возможного уровня производительности текстурных выборок, но эффективность видеокарт AMD и Nvidia в нём достаточно высока и сравнительные цифры моделей довольно близки к соответствующим теоретическим параметрам, за исключением Radeon HD 7850, показавшей аномально низкий результат. В остальном получилось похоже на истину — новая Geforce GTX 650 Ti отстала от GTX 660 настолько, насколько и должна по теории. А последняя и по теории быстрейшая в текстурировании видеокарта, и в этом тесте.

В случае сравнения Geforce GTX 650 Ti с парой конкурентов (Radeon HD 7850 и HD 7770) всё бы также соответствовало теории, если бы странность со старшей платой от AMD. В общем, новинка Nvidia по текстурной скорости заметно обогнала прямого конкурента с чуть большей ценой, да и Geforce GTX 560 Ti из предыдущего поколения осталась позади, уступив GTX 650 Ti, что можно считать хорошим признаком. Feature Test 2: Color Fill

Это тест скорости заполнения. Используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Надо сказать, что этот тест производительности блоков ROP показывает довольно странный результат. Мы определили ранее, что цифры этого подтеста из 3DMark Vantage показывают производительность блоков ROP с учётом величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), и тест измеряет скорее пропускную способность памяти, чем производительность ROP. Но даже в этом случае непонятно, почему новая Geforce GTX 650 Ti показала вдвое более низкий результат, по сравнению с GTX 660.

Что касается сравнения скорости GTX 650 Ti с платами от соперничающей компании AMD, то представленная сегодня модель показала сравнительно неплохую скорость заполнения сцены с учётом ПСП, заметно опередив младшего из конкурентов и уступив Radeon HD 7850 по понятной причине (более чем полуторакратная разница в ПСП). Результаты явно указывают на одно из слабых мест новинки — в случае ограничения общей производительности в играх пропускной способностью видеопамяти, как это часто бывает в играх, GTX 650 Ti может оказаться не слишком быстрой. Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нём рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоёмкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжёлого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчёты освещения по Strauss.

Тест отличается от проведённых нами ранее тем, что результаты в нём зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а много от чего сразу. Для достижения высокой скорости тут важен верный баланс GPU, а также эффективность выполнения сложных шейдеров. В данном случае больше важна математическая и текстурная производительность, поэтому в синтетике из 3DMark Vantage плата Geforce GTX 650 Ti уступила GTX 660 столько, сколько и должна по теории. Естественно, что лучшей стала старшая модель на базе GK106, как и в аналогичных тестах из нашего тестового пакета.

Geforce GTX 650 Ti с запасом выигрывает у видеокарты среднего уровня из предшествующей серии GTX 560 Ti и опережает обоих конкурентов компании AMD (тут снова необъясним близкий результат Radeon HD 7770 и HD 7850). Похоже, что Nvidia наконец-то избавилась от недостатков своих чипов во всей линейке и даже бюджетные GPU в подобных вычислительных задачах справляются с работой не хуже решений компании AMD. Feature Test 4: GPU Cloth

Тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте также зависит сразу от нескольких параметров, но основными факторами влияния являются производительность обработки геометрии и эффективность выполнения геометрических шейдеров. Из-за влияния геометрических блоков вполне логично, что все видеокарты производства Nvidia чувствуют себя в этом тестировании весьма неплохо, обгоняя соответствующие по цене платы Radeon. Собственно, все Geforce опередили обе Radeon.

Анонсированная недавно модель Geforce GTX 650 Ti легко опережает обоих своих конкурентов от AMD. В данном случае низкая скорость Radeon HD 7850 вполне объяснима, так как в геометрических вычислениях важна тактовая частота, а количество одновременно обрабатываемых треугольников у чипов AMD равное. Это один из тех тестов, в которых видно явное преимущество решений Nvidia, имеющих по несколько геометрических блоков. И новинка на базе чипа GK106 не слишком сильно отстала от старшей сестры GTX 660, показав отличный результат. Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчётами, также тестируется stream out.

Это ещё один геометрический тест из 3DMark Vantage, и самый интересный вывод из данной диаграммы мы сделали ещё давно — это единственный тест, в котором новые платы на базе чипа с архитектурой Kepler серьёзно уступают лучшим представителям архитектуры Fermi. В сегодняшнем случае Geforce GTX 560 Ti оказалась на одном уровне с GTX 660.

Если же сравнивать скорость новой Geforce GTX 650 Ti с производительностью её соперников, то новинка от Nvidia снова оказалась впереди, даже несмотря на улучшение позиций обоих решений компании AMD. В общем, синтетические тесты имитации тканей и частиц из тестового пакета 3DMark Vantage, в которых активно используются геометрические шейдеры, традиционно показывают, что платы Nvidia продолжают выигрывать у соперников в таких задачах. Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических расчётов.

В чисто математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы видим несколько иное распределение результатов, по сравнению с аналогичными тестами из нашего тестового пакета. В этом случае производительность решений также не полностью соответствует теории, но ещё и расходится с тем, что мы видели ранее в математических тестах из пакета RightMark 2.0.

Видеокарты Radeon от компании AMD, созданные на базе чипов архитектуры GCN, очень хорошо справляются с такими задачами, и почти всегда они показывают лучшие результаты в случаях, когда выполняется сравнительно простая, но весьма интенсивная математика. Но Radeon HD 7850 снова не слишком нас впечатлила, а лучшим решением в сравнении стала более дорогая видеокарта компании Nvidia.

Рассматриваемая сегодня модель Geforce GTX 650 Ti расположилась между GTX 660 и соперниками от AMD, обгоняя последних не слишком сильно, но всё же ощутимо. У видеокарт на основе чипов архитектуры Kepler эффективность в этой задаче явно увеличилась и стала достаточной для того, чтобы опередить соответствующие по цене платы Radeon.

Direct3D 11: Вычислительные шейдеры

Чтобы протестировать новое решение компании Nvidia в задачах, использующих такие новые возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы воспользовались примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, Nvidia и AMD.

Сначала мы рассмотрим тесты, использующие вычислительные (Compute) шейдеры. Их появление — одно из наиболее важных нововведений в последних версиях DX API, они уже используются в современных играх для выполнения различных задач: постобработки, симуляций и т. п. В первом тесте показан пример HDR-рендеринга с tone mapping из DirectX SDK, с постобработкой, использующей пиксельные и вычислительные шейдеры.

Это не самый удачный пример для вычислительных шейдеров, но разницу в производительности в одной из конкретных задач он показывает. Разницы в скорости расчётов в вычислительном и пиксельном шейдерах для всех плат уже нет, в отличие от того, что было с предыдущими архитектурами. Судя по нашим предыдущим тестам, результаты в задаче явно зависят не только от математической мощи и эффективности вычислений, но и от других факторов, вроде ПСП и производительности ROP.

Новинка компании Nvidia в этом тесте отстаёт от старшей модели GTX 660 и находится ровно посередине между Radeon HD 7770 и HD 7850, как и предполагается, исходя из цен. Второй тест вычислительных шейдеров также взят из Microsoft DirectX SDK, в нём показана расчётная задача гравитации N тел (N-body) — симуляция динамической системы частиц, на которую воздействуют физические силы, такие как гравитация.

В этом тесте результаты Radeon HD 7850 снова немало удивляют тем, что старшее решение лишь ненамного опережает Radeon HD 7770. А вот разница между Geforce GTX 660 и новой GTX 650 Ti только увеличилась — похоже, что в этом тесте явно наблюдается больший упор в ПСП, а не в скорость исполнения математических вычислений.

В любом случае, выпущенная в октябре видеокарта семейства Kepler весьма неплохо справляется с работой, так как Geforce GTX 650 Ti снова опережает обе платы серии Radeon HD 7000, являющиеся её конкурентами. Переходим к тестам производительности в задачах тесселяции, которые традиционно должны показать ещё одну сильную сторону новой платы серии Geforce GTX 600.

Direct3D 11: Производительность тесселяции

Вычислительные шейдеры очень важны, но ещё одним важным нововведением в Direct3D 11 считается аппаратная тесселяция. Мы очень подробно рассматривали её в своей теоретической статье про Nvidia GF100. Тесселяцию уже довольно давно начали использовать в DX11-играх, таких как STALKER: Зов Припяти, DiRT 2, Aliens vs Predator, Metro 2033, Civilization V, Crysis 2, Battlefield 3 и других. В некоторых из них тесселяция используется для моделей персонажей, в других — для имитации реалистичной водной поверхности или ландшафта.

Существует несколько различных схем разбиения графических примитивов (тесселяции). Например, phong tessellation, PN triangles, Catmull-Clark subdivision. Так, схема разбиения PN Triangles используется в STALKER: Зов Припяти, а в Metro 2033 — Phong tessellation. Эти методы сравнительно быстро и просто внедряются в процесс разработки игр и существующие движки, поэтому и стали популярными.

Первым тестом тесселяции будет пример Detail Tessellation из ATI Radeon SDK. В нём реализована не только тесселяция, но и две разные техники попиксельной обработки: простое наложение карт нормалей и parallax occlusion mapping. Что ж, сравним DX11-решения AMD и Nvidia в различных условиях:

В тесте простого бампмаппинга платы упираются в ПСП. Именно поэтому новинка Nvidia уступает так много даже своей старшей сестре на основе того же чипа. К сожалению, раскрыться Geforce GTX 650 Ti не даёт низкая пропускная способность памяти. Даже Radeon HD 7770 обгоняет новинку в этом тесте! К сожалению, главный недостаток GTX 650 Ti может проявиться и в игровых приложениях, которые всегда чувствительны к ПСП.

Но и во втором подтесте с более сложными попиксельными расчётами похвастать нечем. Результаты показывают, что эффективность выполнения сложных математических вычислений в пиксельных шейдерах у чипов архитектуры GCN выше, чем у GPU компании Nvidia. Radeon HD 7850 лишь немного уступает более дорогой Geforce GTX 660 в этом подтесте, да и HD 7770 совсем недалеко.

И в самом интересном подтесте тесселяции у обеих видеокарт Radeon результаты весьма сильные. Это объясняется тем, что в данном тесте тесселяции разбиение треугольников весьма умеренное и скорость в нём не полностью упирается в производительность обработки геометрии. Поэтому платы компании AMD почти не теряют в производительности, и их скорости обработки треугольников вполне хватает, чтобы показывать отличные результаты. Поэтому Radeon HD 7850 лидирует в данном тесте, да и HD 7770 обгоняет новинку компании Nvidia.

Вторым тестом производительности тесселяции будет ещё один пример для 3D-разработчиков из ATI Radeon SDK — PN Triangles. Собственно, оба примера входят также и в состав DX SDK, так что мы уверены, что на их основе создают свой код игровые разработчики. Этот пример мы протестировали с различным коэффициентом разбиения (tessellation factor), чтобы понять, как сильно влияет его изменение на общую производительность.

В этом примере применяется уже более сложная геометрия, и сравнение геометрической мощи различных решений по этому тесту приносит совершенно другие выводы. Хотя все представленные в материале современные решения хорошо справляются с лёгкой и средней геометрической нагрузкой, показывая высокую скорость, но в самых тяжёлых условиях графические процессоры Nvidia всё же остаются непревзойдёнными, даже после того, как AMD частично исправила положение.

Анонсированная сегодня видеоплата Geforce GTX 650 основана на чипе GK106, который имеет меньше активных геометрических блоков, по сравнению с GK106 в GTX 660, поэтому она и уступает своей старшей сестре. Но у конкурентов в сложных условиях выигрывает. Обе Radeon из соответствующего ценового диапазона также неплохо выглядят почти во всех условиях, кроме режима экстремальной нагрузки на геометрические блоки.

Рассмотрим результаты ещё одного теста — демонстрационной программы Nvidia Realistic Water Terrain, также известной как Island. В этой демке используется тесселяция и карты смещения (displacement mapping) для рендеринга реалистично выглядящей поверхности океана и ландшафта.

Island не является чисто синтетическим тестом для измерения исключительно геометрической производительности GPU, так как он содержит и сложные пиксельные и вычислительные шейдеры в том числе, и такая нагрузка ближе к реальным играм, в которых используются все блоки GPU, а не только геометрические, как в предыдущих тестах геометрии. К сожалению, на Radeon HD 7850 программа не работает, поэтому сравниваем новинку только с HD 7770.

Мы протестировали демо-программу при четырёх разных коэффициентах тесселяции, в данном случае настройка называется Dynamic Tessellation LOD. Если при самом первом коэффициенте разбиения треугольников, когда скорость не ограничена производительностью геометрических блоков, единственная оставшаяся видеокарта компании AMD показала отличный результат на уровне Geforce GTX 650 Ti, то при увеличении геометрической работы платы компании Nvidia сразу же начинают довольно сильно отрываться, а производительность Radeon падает слишком сильно.

Новая бюджетная плата Nvidia во всех режимах заметно уступает GTX 660 на базе того же чипа, что объясняется меньшим количеством активных геометрических блоков в графическом процессоре GK106. Зато налицо явный выигрыш у конкурирующего решения в виде Radeon HD 7770. Хотя в текущей графической архитектуре компании AMD геометрическая производительность была серьёзно улучшена, в соответствующих синтетических тестах они всё ещё продолжают проигрывать решениям Nvidia.

Выводы по синтетическим тестам

Результаты синтетических тестов новой модели Geforce GTX 650 Ti, основанной на графическом процессоре GK106 из семейства Kepler, а также результаты других моделей видеокарт производства обоих производителей дискретных видеочипов показали, что новое решение компании Nvidia вполне соответствует своему ценовому диапазону и при определённой розничной цене вполне может быть одной из самых выгодных видеокарт нижнего ценового сегмента.

По техническим характеристикам и синтетическим тестам отставание новой модели от Geforce GTX 660 оказалось невелико, и, за исключением нескольких тестов, по сравнению с конкурирующей моделью Radeon HD 7770, новинка неплохо выступила. Наш набор синтетических тестов показал, что производительность Geforce GTX 650 Ti в среднем где-то между скоростью моделей Radeon HD 7770 и HD 7850. В играх, скорее всего, новинка покажет неплохие результаты, особенно если принять во внимание выпуск фабрично разогнанных моделей, так как графический процессор GK106 архитектуры Kepler весьма неплох по производительности и энергоэффективности.

Но синтетика на то и синтетика, чтобы показывать лишь предельные случаи. Мы нашли два недостатка в Geforce GTX 650 Ti. Во-первых, небольшой недостаток есть в виде меньшего количества геометрических блоков, по сравнению с полноценным GK106, не говоря уже про GK104, на котором основаны топовые решения. Но такой подход традиционен для бюджетных чипов Nvidia, да и в реальных играх скорость обработки геометрии не так важна, как остальное. В играх важнее математическая мощь и эффективный филлрейт (с влиянием ПСП). И вот если с первым у GTX 650 Ti всё в порядке, то пропускной способности видеопамяти для этой модели явно маловато. Именно из-за недостатка ПСП отставание от GTX 660 в некоторых тестах доходило чуть ли не до двукратного, и именно это может негативно повлиять на результаты тестов в играх, особенно с учётом высоких разрешений и включенного полноэкранного сглаживания.

Исходя из теории, видеокарта Geforce GTX 650 Ti — это неплохое предложение для игроков и энтузиастов, которые хотят заплатить менее $200 за видеокарту соответствующего уровня. Radeon HD 7850 и HD 7770 получили ещё одного конкурента, с которым им придётся соперничать. В следующей части статьи мы проверим производительность нового решения в играх, и будет очень интересно посмотреть на результаты Geforce GTX 650 Ti в игровых приложениях из нашего тестового набора.

Nvidia Geforce GTX 650 Ti — Часть 3: производительность в игровых тестах →

2 блока питания Platimax для тестового стенда предоставлены компанией Enermax

Корпус ThermalTake 8430 для тестового стенда предоставлен компанией 3Logic

Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт

Системная плата Asus Sabertooth X79 для тестового стенда предоставлена компанией AsusTeK

Системная плата MSI X79A-GD45(8D) для тестового стенда предоставлена компанией MSI

Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестовых стендов предоставлен компанией Seagate

Накопитель SSD OCZ Octane 512 ГБ для тестового стенда предоставлен компанией OCZ Russia




31 октября 2012 Г.

Nvidia Geforce GTX 650 Ti. 2 — ,

Nvidia Geforce GTX 650 Ti:

, . Zotac.

Zotac Geforce GTX 650 Ti 2048 128- GDDR5 PCI-E
  • GPU: Geforce GTX 650 Ti (GK106)
  • : PCI Express x16
  • GPU (ROPs): 1033 ( — 925 )
  • ( ()): 1500 (6000) ( — 1350 (5400) )
  • : 128
  • GPU/ : 4/1033 ( — 4/925 )
  • (ALU) : 192
  • (ALU): 768
  • : 64 (BLF/TLF/ANIS)
  • (ROP): 16
  • : 150×100×30 ( — )
  • :
  • ( 3D/ 2D/ «»): 120/34/22
  • : 1×DVI (Dual-Link/HDMI), 1×DVI (Single-Link/VGA), 2×HDMI 1.4a
  • : SLI (Software)

Zotac Geforce GTX 650 Ti 2048 128- GDDR5 PCI-E
2048  GDDR5 SDRAM, 8 ( 4 PCB).

Hynix (GDDR5). 1500 (6000) .

,
Zotac Geforce GTX 650 Ti 2048 128- GDDR5 PCI-E Reference card Nvidia Geforce GTX 650 Ti

,
Zotac Geforce GTX 650 Ti 2048 128- GDDR5 PCI-E Reference card Nvidia Geforce GTX 650 Ti

, 192- , PCB 128- . , PCB . Zotac . : Zotac , - — . .

: 2 DVI ( Single-Link VGA) HDMI ( DVI HDMI, 3 HDMI). , Nvidia , HDMI- , .

:

  • 240 — ;
  • 2048×1536@85 — ;
  • 2560×1600@60 — ( DVI- Dual-Link/HDMI).

— 2007 , .

, 6- .

.

Zotac Geforce GTX 650 Ti 2048 128- GDDR5 PCI-E
. , . , .

.

. 1200 .

EVGA PrecisionX ( . AKA Unwinder) .

Zotac Geforce GTX 650 Ti 2048 128- GDDR5 PCI-E

6 65 , , .

. .

Zotac Geforce GTX 650 Ti 2048 128- GDDR5 PCI-E
6- DVI-to-VGA.

.

Zotac Geforce GTX 650 Ti 2048 128- GDDR5 PCI-E

:

    Intel Core i7-3960X (Socket 2011):
    • Intel Core i7-3960X (o/c 4 );
    • Asus Sabertooth X79 Intel X79;
    • MSI X79A-GD45(8D) Intel X79;
    • 8 DDR3 SDRAM Corsair 1866 ;
    • Seagate Barracuda 7200.14 3 SATA2;
    • WD Caviar Blue WD10EZEX 1 T SATA2;
    • 2 Enermax Platimax 1200 .
  • Windows 7 64-; DirectX 11;
  • Dell UltraSharp U3011 (30″);
  • AMD Catalyst 12.11beta; Nvidia 306.97

VSync .

:

RightMark3D 2.0 MS Visual Studio 2005 runtime, DirectX runtime.

DirectX 11 SDK Microsoft AMD, Nvidia. -, HDRToneMappingCS11.exe NBodyGravityCS11.exe DirectX SDK (February 2010).

: Nvidia AMD. ATI Radeon SDK DetailTessellation11 PNTriangles11 ( DirectX SDK). Nvidia — Realistic Water Terrain, Island11.

:

  • Geforce GTX 650 Ti ( GTX 650 Ti);
  • Geforce GTX 660 ( GTX 660);
  • Geforce GTX 560 Ti ( GTX 560 Ti);
  • Geforce GTX 550 Ti ( GTX 550 Ti);
  • Radeon HD 7850 ( HD 7850);
  • Radeon HD 7770 ( HD 7770).

Geforce GTX 650 Ti . Geforce GTX 660 GTX 650 Ti , GK106 Kepler. GTX 550 Ti GTX 560 Ti — , .

AMD , Radeon HD 7770 , Nvidia Geforce GTX 650 Ti, — Radeon HD 7850 — . , Geforce GTX 650 Ti AMD , Radeon HD 7000.

Direct3D 9: Pixel Shaders

() 3DMark Vantage , , , : 1.1, 1.4 2.0, , .

, GPU, . , , . , , .

3D- Nvidia — Geforce GTX 560 Ti GTX 660, . AMD, , , Geforce GTX 650 Ti Radeon HD 7850 ( ), HD 7770, , .

, Geforce GTX 550 Ti , , Radeon HD 7770. :

Cook-Torrance , ALU , TMU. AMD, Geforce Kepler .

Nvidia GTX 560 Ti GTX 660, AMD, HD 7770, HD 7850. , , ALU, Water, , . Geforce GTX 650 Ti , GTX 660. , Geforce GTX 650 Ti GTX 560 Ti ( GTX 550 Ti) — .

Direct3D 9: Pixel Shaders 2.0

DirectX 9 , , , . 2.0:

  • Parallax Mapping — , « 3D-».
  • Frozen Glass — .

: . , :

, ALU, , . , AMD , Nvidia.

Radeon , Geforce GTX 660, . «Frozen Glass» , Radeon HD 7850 . Nvidia, GTX 660, GTX 560 Ti GTX 550 Ti.

«Parallax Mapping» Nvidia Radeon HD 7850 HD 7770. GTX 660 . :

Nvidia , Geforce GTX 650 Ti AMD - Nvidia. Nvidia , Geforce GTX 650 Ti GTX 560 Ti, GTX 550 Ti.

, . — 3.0, Direct3D 9. , . , ALU, , , :

  • Steep Parallax Mapping — «» parallax mapping, « 3D-».
  • Fur — , .

. DX9- RightMark Nvidia , . , Geforce GTX 660 , .

Geforce GTX 650 Ti , . GTX 650 Ti GTX 560 Ti GTX 550 Ti. AMD — Radeon HD 7850, HD 7770.

Direct3D 10: PS 4.0 (, )

RightMark3D PS 3.0 Direct3D 9, DirectX 10, . , .

( ) ALU. , .

Fur. 15 30 . Effect detail — «High» 40—80, «» — 60—120 , «High» SSAA «» — 160 320 .

, , «Low» «High» .

TMU, . , . «High» , «Low».

AMD Nvidia, GCN . Radeon , . , HD 7850 Geforce GTX 660. .

Geforce GTX 650 Ti , Radeon, GTX 560 Ti. , . , «» , : , - , :

, GTX 650 Ti GTX 560 Ti, . Geforce GTX 600 Geforce GTX 500. , GTX 660 . , , , AMD , Nvidia.

Nvidia GTX 560 Ti . , Radeon HD 7770 HD 7850 . , Nvidia. GTX 650 Ti AMD. AMD, .

DX10- Steep Parallax Mapping. 10 50 . , . 80 400 , . :

- Direct3D 10 , parallax mapping , , steep parallax mapping, , Crysis Lost Planet. , , , , — «High».

( SSAA), Geforce GTX 560 Ti . Nvidia , Geforce GTX 650 Ti D3D10- Radeon HD 7770. HD 7850 GTX 660 . , , Nvidia.

, «Fur». , , . , , — Radeon HD 7850 Geforce GTX 560 Ti .

Geforce GTX 660 , Radeon, . Radeon HD 7850. GTX 650 Ti , Nvidia D3D10- . GTX 560 Ti , .

Direct3D 10: PS 4.0 ()

TMU. , , .

— Mineral. , 65 sin cos.

- , . AMD Nvidia, Kepler , Geforce .

, . Geforce GTX 650 Ti Radeon HD 7770 HD 7850, , Radeon . AMD — , Geforce GTX 600 .

, Fire. ALU, , sin cos , 130. , :

Nvidia — Geforce GTX 560 Ti. AMD Radeon HD 7000, Radeon GTX 650 Ti — Kepler , Fermi.

, GK106 GTX 560 Ti, - , GPU. Kepler , .

Direct3D 10:

RightMark3D 2.0 , «Galaxy», «point sprites» Direct3D. GPU, , . DirectX 10.

, , . «GS load» , — . .

«Galaxy», , :

, , FPS . , .

Nvidia AMD — . AMD , , Nvidia . , Geforce GTX 650 Ti GTX 660, , GTX 560 Ti .

GTX 650 Ti , — Geforce GTX 650 Ti Radeon . Radeon , Fermi. , :

Nvidia AMD Nvidia . GS load, , . Geforce GTX 650 Ti GTX 660, Radeon HD 7000 Fermi. , , .

«Hyperlight» — , : instancing, stream output, buffer load. , Direct3D 10 — stream output. , , , . 14 , .

«», «GS load», «Heavy» — , «Balanced» «» , «instancing», «Heavy» .

, Radeon HD 7850, - . : , «Polygon count» .

. Geforce GTX 650 Ti GTX 660. , . , , «Balanced» «Heavy».

Radeon , . , , Nvidia . , Nvidia , Geforce GTX 560 Ti .

, Nvidia . GK106 , Geforce GTX 660 , , .

Direct3D 10:

«Vertex Texture Fetch» . , , «Earth» «Waves» . displacement mapping , , «Waves» , «Earth» — .

«Earth», «Effect detail Low»:

, , . Nvidia - . .

Geforce GTX 650 Ti , GTX 660, GTX 560 Ti. Radeon HD 7770, HD 7850 GTX 650 Ti . . HD 7850 , , . :

, Nvidia , AMD, . Geforce GTX 650 Ti , GTX 660, GTX 560 Ti, . AMD, Radeon HD 7850. Radeon HD 7700.

. «Waves» , . 14 («Effect detail Low») 24 («Effect detail High») . .

«Waves» , . - Geforce GTX 650 Ti — Radeon HD 7770. . Radeon HD 7850 GTX 660, GTX 560 Ti . :

Nvidia , Radeon HD 7850 Geforce GTX 660, . . Geforce GTX 650 Ti , Radeon HD 7770. , . , . .

3DMark Vantage: Feature

3DMark Vantage , . Feature- DirectX 10 , . Nvidia - , RightMark.

Feature Test 1: Texture Fill

— . , , .

Futuremark , AMD Nvidia , Radeon HD 7850, . — Geforce GTX 650 Ti GTX 660 , . , .

Geforce GTX 650 Ti (Radeon HD 7850 HD 7770) , AMD. , Nvidia , Geforce GTX 560 Ti , GTX 650 Ti, .

Feature Test 2: Color Fill

. , . (render target) -. 16- FP16, , HDR-, .

, ROP . , 3DMark Vantage ROP (. . « »), , ROP. , Geforce GTX 650 Ti , GTX 660.

GTX 650 Ti AMD, , Radeon HD 7850 ( ). — , , GTX 650 Ti .

Feature Test 3: Parallax Occlusion Mapping

feature-, . (, ) Parallax Occlusion Mapping, . . Strauss. , , Strauss.

, , , . GPU, . , 3DMark Vantage Geforce GTX 650 Ti GTX 660 , . , GK106, .

Geforce GTX 650 Ti GTX 560 Ti AMD ( Radeon HD 7770 HD 7850). , Nvidia - GPU AMD.

Feature Test 4: GPU Cloth

, ( ) . , , . stream out . , stream out.

, . - , Nvidia , Radeon. , Geforce Radeon.

Geforce GTX 650 Ti AMD. Radeon HD 7850 , , AMD . , Nvidia, . GK106 GTX 660, .

Feature Test 5: GPU Particles

, . , . Stream out , . , , .

RightMark3D 2.0, , , . , stream out.

3DMark Vantage, — , Kepler Fermi. Geforce GTX 560 Ti GTX 660.

Geforce GTX 650 Ti , Nvidia , AMD. , 3DMark Vantage, , , Nvidia .

Feature Test 6: Perlin Noise

feature- Vantage - , Perlin noise . . Perlin noise — , , .

Futuremark, , , . , , RightMark 2.0.

Radeon AMD, GCN, , , , . Radeon HD 7850 , Nvidia.

Geforce GTX 650 Ti GTX 660 AMD, , . Kepler , Radeon.

Direct3D 11:

Nvidia , DirectX 11, , (SDK) Microsoft, Nvidia AMD.

, (Compute) . — DX API, : , . . HDR- tone mapping DirectX SDK, , .

, . , , . , , , ROP.

Nvidia GTX 660 Radeon HD 7770 HD 7850, , . Microsoft DirectX SDK, N (N-body) — , , .

Radeon HD 7850 , Radeon HD 7770. Geforce GTX 660 GTX 650 Ti — , , .

, Kepler , Geforce GTX 650 Ti Radeon HD 7000, . , Geforce GTX 600.

Direct3D 11:

, Direct3D 11 . Nvidia GF100. DX11-, STALKER: , DiRT 2, Aliens vs Predator, Metro 2033, Civilization V, Crysis 2, Battlefield 3 . , — .

(). , phong tessellation, PN triangles, Catmull-Clark subdivision. , PN Triangles STALKER: , Metro 2033 — Phong tessellation. , .

Detail Tessellation ATI Radeon SDK. , : parallax occlusion mapping. , DX11- AMD Nvidia :

. Nvidia . , Geforce GTX 650 Ti . Radeon HD 7770 ! , GTX 650 Ti , .

. , GCN , GPU Nvidia. Radeon HD 7850 Geforce GTX 660 , HD 7770 .

Radeon . , . AMD , , . Radeon HD 7850 , HD 7770 Nvidia.

3D- ATI Radeon SDK — PN Triangles. , DX SDK, , . (tessellation factor), , .

, . , , Nvidia , , AMD .

Geforce GTX 650 GK106, , GK106 GTX 660, . . Radeon , .

— Nvidia Realistic Water Terrain, Island. (displacement mapping) .

Island GPU, , , GPU, , . , Radeon HD 7850 , HD 7770.

- , Dynamic Tessellation LOD. , , AMD Geforce GTX 650 Ti, Nvidia , Radeon .

Nvidia GTX 660 , GK106. Radeon HD 7770. AMD , Nvidia.

Geforce GTX 650 Ti, GK106 Kepler, , Nvidia .

Geforce GTX 660 , , , Radeon HD 7770, . , Geforce GTX 650 Ti - Radeon HD 7770 HD 7850. , , , , GK106 Kepler .

, . Geforce GTX 650 Ti. -, , GK106, GK104, . Nvidia, , . ( ). GTX 650 Ti , . - GTX 660 , , .

, Geforce GTX 650 Ti — , $200 . Radeon HD 7850 HD 7770 , . , Geforce GTX 650 Ti .

Nvidia Geforce GTX 650 Ti — 3: →

2 Platimax Enermax

ThermalTake 8430 3Logic

Dell UltraSharp U3011

Asus Sabertooth X79 AsusTeK

MSI X79A-GD45(8D) MSI

Seagate Barracuda 7200.14 3 Seagate

SSD OCZ Octane 512 OCZ Russia