Nvidia Geforce GTX 770:

описание видеокарт и результаты синтетических тестов


Содержание

В этой части мы изучим видеокарту, а также познакомимся с результатами синтетических тестов. В нашей лаборатории побывала эталонная карта Nvidia.

Платы

Nvidia Geforce GTX 770 2048 МБ 256-битной GDDR5 PCI-E
  • GPU: Geforce GTX 770 (GK104)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs): 1046-1075 МГц (номинал — 1046-1075 МГц)
  • Частота работы памяти (физическая (эффективная)): 1750 (7000) МГц (номинал — 1750 (7000) МГц)
  • Ширина шины обмена с памятью: 256 бит
  • Число вычислительных блоков в GPU/частота работы блоков: 8/1046-1075 МГц (номинал — 8/1046-1075 МГц)
  • Число операций (ALU) в блоке: 192
  • Суммарное число операций (ALU): 1536
  • Число блоков текстурирования: 128 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 32
  • Размеры: 270×100×38 мм (карта занимает 2 слота в системном блоке)
  • Цвет текстолита: черный
  • Энергопотребление (пиковое в 3D/в режиме 2D/в режиме «сна»): 231/85/60 Вт
  • Выходные гнезда: 1×DVI (Dual-Link/HDMI), 1×DVI (Single-Link/VGA), 1×HDMI 1.4a, 1×DisplayPort 1.2
  • Поддержка многопроцессорной работы: SLI (Hardware)

Nvidia Geforce GTX 770 2048 МБ 256-битной GDDR5 PCI-E
Карта имеет 2048 МБ памяти GDDR5 SDRAM, размещенной в 8 микросхемах на лицевой стороне PCB.

Микросхемы памяти Samsung (GDDR5). Микросхемы расчитаны на максимальную частоту работы в 1785 (7140) МГц.

Сравнение с эталонным дизайном, вид спереди
Nvidia Geforce GTX 770 2048 МБ 256-битной GDDR5 PCI-E Reference card Nvidia Geforce GTX 680

Сравнение с эталонным дизайном, вид сзади
Nvidia Geforce GTX 770 2048 МБ 256-битной GDDR5 PCI-E Reference card Nvidia Geforce GTX 680

Как уже ранее говорилось, GTX 770 — это по сути тот же GTX 680, поэтому сравнивать будем именно с последним. Очевидно, что левые стороны у обеих карт очень схожи: гнезда вывода и расположение микросхем памяти идентичны. А вот над блоком питания хорошо поработали. Система питания стала 6-фазной, цифровой контроллер цепей питания переместился на лицевую сторону. Кроме того, компания Nvidia отказалась от идиотского двухэтажного разъема питания, который явно имел неудачную конструкцию (пальцы сломаешь, пока нажмешь рычажок запора одного из разъемов), и мы видим привычные два разъема на 6 и 8 пин.

Ускоритель имеет следующий набор гнезд вывода: 2 DVI (один из которых Single-Link и совместим с выводом на VGA) и по одному DisplayPort и HDMI (второе гнездо DVI обладает возможностью через адаптер передавать сигнал на HDMI, поэтому суммарно можно подключить 2 приемника с HDMI). Напомним, что ускорители Nvidia достаточно давно обладают собственными звуковыми кодеками, поэтому передача на HDMI-монитор будет полноценной, со звуком. Также уместно напомнить, что возможность одновременного вывода картинки максимально на 4 монитора (каждый до разрешения Full HD), реализована и тут. Но если в случае GTX 780/Titan она наиболее полно востребована, учитывая мощность и возможности тех ускорителей, то для GTX 770 в некоторых играх придется снижать настройки качества, чтобы получить приемлемую играбельность в таком высочайшем разрешении.

Максимальные разрешения и частоты:

  • 240 Гц — максимальная частота обновления;
  • 2048×1536@85 Гц — по аналоговому интерфейсу;
  • 2560×1600@60 Гц — по цифровому интерфейсу (для DVI-гнезд с Dual-Link/HDMI).

Что касается возможностей по ускорению декодирования видео, в 2007 году мы проводили такое исследование, с ним можно ознакомиться здесь.

Напомним, что карта требует дополнительного питания, причем двумя разъемами: один с шестью контактами, второй — с восемью.

О системе охлаждения.

Nvidia Geforce GTX 770 2048 МБ 256-битной GDDR5 PCI-E
СО очень схожа со своим аналогом от GTX Titan (хотя бы внешне), однако есть и отличия. Кулер имеет закрытую форму с цилиндрическим вентилятором на конце. Радиатор, прижимающийся к ядру, основан на испарительной камере, внутри которой находится особая легкоиспаряемая жидкость. Отличие от кулера GTX Titan в размерах данной камеры: у GTX 770 она меньше и соотносима с размерами корпуса GPU GK104. Нижняя пластина камеры прижимается к ядру, тепло передается жидкости, которая испаряется и уносит тепло к верхней пластине (имеющей ребра охлаждения), где пары конденсируются и т. д.

Вентилятор гонит воздух через вышеупомянутый радиатор и имеет особую форму крыльчатки, дающую пониженный уровень шума. Надо сказать, что при максимальной нагрузке в случае GTX 770 шум практически не ощущается (в отличие от Titan), и максимальная частота вращения — около 2000 оборотов в минуту.

Микросхемы памяти имеют охлаждение: у кулера есть специальная пластина, прижимающаяся к микросхемам памяти и транзисторам силового блока.

Мы провели исследование температурного режима с помощью новой версии утилиты EVGA PrecisionX (автор А. Николайчук AKA Unwinder) и получили следующие результаты.

Nvidia Geforce GTX 770 2048 МБ 256-битной GDDR5 PCI-E

После 6 часов прогона карты под максимальной игровой нагрузкой максимальная температура ядра составила 82 градуса, что для ускорителя такого класса является приемлемым результатом. Таким образом, СО получилась весьма эффективной и очень малошумной.

Комплектация. Reference-карты всегда поставляются без комплектов, поэтому этот пункт мы пропустим.

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютеры на базе процессора Intel Core i7-3960X (Socket 2011):
    • 2 процессора Intel Core i7-3960X (o/c 4 ГГц);
    • СО Hydro SeriesT H100i Extreme Performance CPU Cooler;
    • СО Intel Thermal Solution RTS2011LC;
    • системная плата Asus Sabertooth X79 на чипсете Intel X79;
    • системная плата MSI X79A-GD45(8D) на чипсете Intel X79;
    • оперативная память 16 ГБ DDR3 Corsair Vengeance CMZ16GX3M4A1600C9 1600 МГц;
    • жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA2;
    • жесткий диск WD Caviar Blue WD10EZEX 1 TБ SATA2;
    • 2 SSD Corsair Neutron SSD CSSD-N120GB3-BK;
    • 2 блока питания Corsair CMPSU-1200AXEU (1200 Вт);
    • корпус Corsair Obsidian 800D Full-Tower.
  • операционная система Windows 7 64-битная; DirectX 11;
  • монитор Dell UltraSharp U3011 (30″);
  • драйверы AMD версии Catalyst 13.5beta; Nvidia версии 320.18 (для GTX 780/770), 320.14 (для остальных карт).

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

В качестве синтетических тестов DirectX 11 мы использовали примеры из пакетов SDK компаний Microsoft и AMD, а также демонстрационной программы Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010).

Мы взяли и приложения обоих производителей видеочипов: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain, также известная как Island11.

Синтетические тесты проводились на следующих видеокартах:

  • Geforce GTX 770 2GB со стандартными параметрами (далее GTX 770)
  • Geforce GTX 780 3GB со стандартными параметрами (далее GTX 780)
  • Geforce GTX 680 2GB со стандартными параметрами (далее GTX 680)
  • Radeon HD 7970 3GB(не GHz Edition) со стандартными параметрами (далее HD 7970)

Для сравнения результатов новой модели видеокарты Geforce GTX 770 именно эти решения были выбраны по следующим причинам. Geforce GTX 680 является практически полной копией новинки из предыдущего семейства, она основана на точно таком же GPU и имеет близкие частоты, отличаясь только разной ПСП видеопамяти, поэтому будет интересно оценить влияние быстрой видеопамяти и проведённые оптимизации драйверов со времени выхода GTX 680. Geforce GTX 780 интересна как видеокарта текущего поколения, но более высокого уровня, основанная на топовом графическом процессоре GK110.

От конкурирующей компании AMD была взята единственная видеоплата, которая и является прямым соперником для представленной сегодня модели GTX 770. Radeon HD 7970 до сих пор остаётся наиболее мощным одночиповым решением компании AMD и примерно соответствует по цене и производительности новой видеокарте Nvidia. Других соперников у GTX 770 пока нет, так как AMD обновленную линейку ещё не выпустила.

Direct3D 9: тесты Pixel Shaders

Тесты текстурирования и заполнения (филлрейта) из пакета 3DMark Vantage мы рассмотрим чуть позже, а первая группа пиксельных шейдеров, которую мы используем, включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся в старых играх, — и она очень проста для современных видеочипов.

Тесты простые для современных видеокарт, и скорость мощных решений в них упирается в различные ограничители вроде филлрейта. Они способны показать далеко не все возможности современных видеочипов и интересны лишь с точки зрения устаревших игровых приложений. В случае самых мощных видеокарт все они показывают сравнимые результаты, немного выделяется разве что видеокарта Radeon.

Новая плата компании Nvidia в этом сравнении ожидаемо опередила полностью аналогичную плату на базе GK104, причём её преимущество было от 4% до 15% — строго по теории. Geforce GTX 780 на базе GK110 оказалась слегка впереди, хотя в большинстве тестов до сих пор лидирует единственная в сравнении плата AMD на базе чипа Tahiti. Посмотрим на результаты более сложных пиксельных программ промежуточных версий:

Тест Cook-Torrance более интенсивен вычислительно, и скорость в нём сильнее зависит от количества ALU и их частоты, но также и от скорости TMU. Этот тест исторически лучше подходит для графических решений компании AMD, но новые платы Geforce на базе архитектуры Kepler в нём также показывают довольно сильные результаты.

Вторая плата из новой линейки Geforce GTX 700 оказалась быстрее предшествующей GTX 680 примерно на 3-5%, что объясняется приростом частоты, и уступила мощнейшей в линейке GTX 780 менее 20%, как и следовало ожидать, исходя из теории. Интересно, что в тесте освещения, больше зависящем от скорости ALU, Radeon HD 7970 оказалась немного впереди, а в тесте Water, скорость в котором больше зависит от текстурирования, победила уже новинка.

Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье «Современная терминология 3D-графики».
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

Существует два варианта этих шейдеров: с ориентацией на математические вычисления и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это универсальные тесты, производительность в которых зависит и от скорости блоков ALU, и от скорости текстурирования, также в них важен общий баланс чипа и эффективность исполнения вычислительных программ. Прошлые наши исследования показывают, что в этих конкретных задачах архитектура AMD смотрится заметно лучше графической архитектуры Nvidia.

В тесте «Frozen Glass» скорость больше зависит от математической производительности и эффективности в конкретной задаче, поэтому Radeon HD 7970 оказывается быстрее новинки Nvidia, да и всех остальных, включая GTX 780, так как все Geforce во что-то упираются: разница между GTX 770 и GTX 680 оказалась равной 3%, а между GTX 770 и GTX 780 — лишь 4%.

Во втором тесте «Parallax Mapping» новая видеокарта Nvidia также отстала от Radeon HD 7970, но оказалась к этой плате уже ближе. Преимущество GTX 770 над GTX 680 составило 7%, а разница между двумя моделями линейки GTX 700 достигла впечатляющей величины почти в 20%. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:

В условиях предпочтительности текстурных выборок положение плат на чипах производства Nvidia заметно улучшилось. Новая Geforce GTX 770 сильно приблизилась к лучшей одночиповой плате AMD, хотя в одном из тестов отставание осталось. Анонсированная сегодня видеокарта Nvidia в этих задачах работает сравнительно неплохо, почти на уровне GTX 780, разница между ускорителями составила лишь 3-5%. Ну а GTX 680 новинка обогнала на 5-14%.

Всё это давно устаревшие задачи, с упором в текстурирование и филлрейт. Далее мы рассмотрим результаты ещё двух тестов пиксельных шейдеров, но уже версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9. Они наиболее показательны с точки зрения современных игр на ПК, среди которых много мультиплатформенных. Тесты отличаются тем, что сильно нагружают и ALU, и текстурные модули, обе шейдерные программы сложны и длинны и включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье «Современная терминология 3D-графики».
  • Fur — процедурный шейдер, визуализирующий мех.

Вот эти тесты уже практически не ограничены производительностью текстурных выборок или филлрейтом и больше всего зависят от эффективности исполнения сложного шейдерного кода. В самых тяжёлых DX9-тестах из первой версии пакета RightMark видеокарты производства Nvidia в предыдущие годы были сильнее, но в последних архитектурах решения AMD сильно ускорились, особенно после доводки драйверов.

Свежая модель Nvidia выступила тут сравнительно неплохо, по сравнению с предшественницей на базе того же чипа GK104, опередив GTX 680 на 3-7%. Своей старшей сестре из того же семейства новинка проиграла почти 20% — что точно соответствует теоретической разнице между ними. Что касается сравнения с Radeon HD 7970, то в тесте Fur две сравниваемые платы оказались равны, но в тесте параллаксмаппинга новинка всё так же сильно проигрывает единственной модели Radeon.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два уже знакомых нам теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

В этом тесте производительность зависит от количества и эффективности блоков TMU, влияет и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает ещё и эффективный филлрейт и пропускная способность памяти. Результаты при детализации уровня «High» получаются до полутора раз ниже, чем при «Low».

В задачах процедурной визуализации меха с большим количеством текстурных выборок, за пару поколений графических архитектур компания AMD сократила разницу с платами Nvidia, а с выпуском GCN и вовсе вырвалась вперёд. И сейчас именно платы Radeon являются лидерами таких сравнений, что говорит о высокой эффективности выполнения ими данных программ, что видно и по сегодняшнему сравнению.

Сегодняшняя новинка Geforce GTX 770 опередила аналогичную плату GTX 680 на 5-7%, а Titan она же уступает немного побольше. Впрочем, все решения Nvidia проигрывают в этом тесте единственной модели конкурента — Radeon HD 7970. Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: возможно, в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

В целом всё похоже на то, что мы видели на предыдущей диаграмме, но видеокарты Nvidia уступают своему единственному сопернику от AMD ещё больше. Новинка Geforce GTX 770 всё так же впереди GTX 680 на несколько процентов, но отстаёт от GTX 780, основанной на другом GPU. Ну а что касается сравнения с платой AMD при включении суперсэмплинга, увеличивающего теоретическую нагрузку вчетверо, то тут даже уже старенький Radeon HD 7970 далеко впереди, так как преимущество в подобных вычислениях явно у чипов компании AMD, предпочитающих попиксельные вычисления.

Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип ещё примерно в два раза — такой режим называется «High».

Диаграмма похожа на предыдущую, также без включения SSAA, и снова даже Geforce GTX 780 не смогла догнать Radeon HD 7970, не говоря о более слабой модели новой линейки. В общем, платы Nvidia и в этом тесте справляются с работой хуже конкурирующих от AMD, и новая модель Geforce GTX 770 в обновленном D3D10-варианте теста без суперсэмплинга уступает конкурирующей с ней плате Radeon HD 7970, которая снова стала быстрейшим решением. Разница между GTX 770 и 680 чуть увеличились, до 6-9%. Посмотрим, что изменит включение суперсэмплинга.

Видим примерно то же, что и в «Fur» — при включении суперсэмплинга и самозатенения задача получается ещё более тяжёлой, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьёзное падение производительности. Разница между скоростными показателями протестированных видеокарт немного изменилась, включение суперсэмплинга сказывается меньше, чем в предыдущем случае — и видеокарта Radeon HD 7970 не улучшила свои показатели относительно всех плат Nvidia, всё равно оставшись впереди них.

Графические решения Nvidia в наших D3D10-тестах пиксельных шейдеров работают менее эффективно, и героиня сегодняшнего обзора в этой задаче показывает скорость почти ровно как у Geforce GTX 680, основанной на точно таком же графическом процессоре. Модель GTX 780 же является быстрейшей из Geforce, но она всё же не дотягивается до HD 7970. Посмотрим, что будет в чисто вычислительных задачах.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты наших предельных математических тестов обычно примерно соответствуют разнице в частотах и количестве вычислительных блоков, но с влиянием разной эффективности их использования и с учётом оптимизации драйверов. К сожалению, в случае теста Mineral новая модель Geforce GTX 770 по какой-то странной причине показала ровно такой же результат, что и GTX 680, хотя по теории у неё должно быть небольшое преимущество в 3-4%.

В остальном, нам остаётся снова отметить, что хотя архитектуры AMD в таких тестах ранее имели серьёзное преимущество перед конкурирующими видеокартами Nvidia, но в чипах семейства Kepler компании Nvidia удалось увеличить число потоковых процессоров, и пиковая математическая производительность моделей Geforce, начиная с GTX 680, значительно возросла. Это мы и видим по результатам нашего первого математического теста, где рассматриваемая Geforce GTX 770 показала хороший результат, почти догнав аналогичную плату конкурента — Radeon HD 7970.

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нём только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Интересно, что во втором математическом тесте мы видим несколько иной относительный результат. Если сравнивать GTX 770 и GTX 680, то видно, что разница между ними составила аж 10%, что явно не объяснить одной лишь скоростью обработки вычислений. Вероятно, в этом конкретном тесте новинке также помогло и увеличение пропускной способности видеопамяти. Или сработала дальнейшая оптимизация драйверов. Но GTX 770 всё же отстаёт от Radeon HD 7970 по скорости в этом тесте.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаковое для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близкое к двукратному. Задача эта для современных видеокарт не слишком сложная, и производительность в ней ограничена скоростью обработки геометрии и пропускной способностью памяти.

Разница между результатами видеокарт на чипах Nvidia и AMD (при одинаковом количестве GPU) обусловлена отличиями в геометрических конвейерах чипах этих компаний. Если в предыдущих тестах с пиксельными шейдерами платы AMD были заметно эффективнее и быстрее, то тесты геометрии показывают, что в таких задачах платы Nvidia оказываются производительнее.

Сегодняшняя новинка Geforce GTX 770 имеет достаточное количество геометрических блоков, и частота GPU в нём выше, чем у GTX 680, поэтому её преимущество равно 3-4% — точно по теории. Понятно, что новая плата легко справляется и со своим единственным одночиповым конкурентом — Radeon HD 7970 новая Geforce обходит с приличным запасом. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры слегка улучшились и для плат AMD, и для решений Nvidia. Видеокарты в первом тесте геометрических шейдеров слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, а поэтому и все выводы остаются прежними. Новая модель Geforce GTX 770 всё так же немного отстаёт от GTX 780, основанной на GK110, и она явно быстрее единственной видеоплаты семейства Radeon HD 7000. Посмотрим далее — интересно, что изменится в следующем тесте, который предполагает большую нагрузку именно на геометрические шейдеры.

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленным в «Heavy» — ещё и для их отрисовки. Иначе говоря, в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер.

Относительные результаты остальных решений в разных режимах примерно соответствуют изменению нагрузки: во всех случаях производительность неплохо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть чуть менее чем в два раза медленней.

В случае сбалансированной загрузки геометрических шейдеров, все результаты весьма близки и скорость рендеринга в этом тесте ограничена непонятно чем — возможно растеризацией. Новая модель Geforce GTX 770 показала скорость даже выше, чем у GTX 780, что можно объяснить лишь более высокой частотой GPU, что также наталкивает на мысль об ограничении производительности скоростью растеризации.

Цифры могут серьёзно измениться на следующей диаграмме, в тесте с более активным использованием геометрических шейдеров. Также будет интересно сравнить друг с другом результаты, полученные в режимах «Balanced» и «Heavy».

А вот в этом тесте получилось как всегда — единственная плата от AMD ухудшила сравнительный результат, заметно уступив всем платам Nvidia, в том числе и новой GTX 770. В этом тесте единственно важным параметром является скорость обработки геометрии, с которой дела у Nvidia обстоят заметно лучше, особенно что касается топовых решений. Интересно, что несмотря на идентичный видеочип и близкие рабочие частоты, Geforce GTX 770 даже немного уступила GTX 680, чего ранее не встречалось. Впрочем, разница между всеми платами Nvidia оказалась весьма небольшой.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Наши предыдущие исследования показали, что на результаты этого теста может влиять и скорость текстурирования и пропускная способность памяти (в лёгком режиме), а результаты видеокарт Nvidia были ограничены ещё чем-то необъяснимым. И вот теперь мы обнаружили это что-то. Всё очень прозаично — оказалось, что драйверы ранее были недостаточно оптимизированы для этого теста, и в случае с последней версий драйверов Nvidia всё наконец-то наладилось.

Результаты новой платы на чипе GK104 явно лучше, чем у GTX 680, хотя в лёгком режиме она всё ещё ограничена ПСП, зато в среднем и сложном режимах оказалась значительно быстрее. Интересно, что новинка и стала самой быстрой в этой задаче, хотя она и близка к старшей сестре GTX 780. Radeon HD 7970 новая плата обогнала с хорошим запасом. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Взаимное расположение карт на диаграмме слабо изменилось — сравнительные результаты решений компании AMD в тяжёлых режимах ещё больше ухудшились, и теперь Radeon HD 7970 показывает скорость где-то на уровне GTX 680, протестированной на старых драйверах. Свежая их версия дала возможность новой плате GTX 770 показать максимальную скорость наравне с GTX 780.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты во втором тесте вершинного текстурирования «Waves» не похожи на те, что мы видели на предыдущих диаграммах, хотя GTX 770 с новой версией драйверов явно расцвела. Показатели Geforce GTX 680 заметно ниже, чем у новинки, что можно объяснить только программной оптимизацией. В этом тесте скорость всех плат (кроме GTX 680) примерно одинаковая, даже Radeon HD 7970 очень близко. Рассмотрим второй вариант этого же теста:

С усложнением задачи скорость всех решений стала несколько ниже, но это мало что изменило. Во всех режимах этого теста новая GTX 770 показывает скорость на уровне своего соперника Radeon HD 7970. Результаты сегодняшней новинки только в лёгком режиме уступают скорости GTX 780, а GTX 680 обе платы обошли с хорошим запасом.

3DMark Vantage: тесты Feature

Синтетические тесты из пакета 3DMark Vantage покажут нам то, что мы ранее упустили. Feature-тесты из этого тестового пакета обладают поддержкой DirectX 10 и интересны тем, что отличаются от наших и до сих пор актуальны. При анализе результатов новой видеокарты Nvidia в этом пакете мы сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark.

Feature Test 1: Texture Fill

Первый тест — тест скорости текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Эффективность видеокарт AMD и Nvidia в текстурном тесте компании Futuremark достаточно высока, и сравнительные цифры моделей близки к соответствующим теоретическим параметрам. Вторая видеокарта семейства Geforce GTX 700 очень серьёзно отстала от первой (GTX 780) по той причине, что старшая модель основана на графическом процессоре GK110, имеющем гораздо больше текстурных блоков.

А вот над GTX 680 у новинки есть преимущество в 9%, что можно объяснить как повышенной частотой, так и более эффективной работой GPU Boost 2.0. Что касается сравнения производительности Geforce GTX 770 с единственным представленным решением от конкурента, то и тут всё более-менее соответствует теории — новинка Nvidia по текстурной скорости оказалась чуть быстрее платы Radeon HD 7970.

Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нём используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Как мы ранее определили, цифры этого подтеста из 3DMark Vantage показывают производительность блоков ROP с учётом величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), и тест иногда измеряет скорее пропускную способность памяти, а не производительность ROP, но в данном случае разница в скорости не соответствует ни тому, ни другому параметру.

В тесте производительности блоков ROP мы ещё в прошлой статье отмечали аномально низкий результат у Geforce GTX 780, вот и сегодня странность подтвердилась — новинка GTX 770 оказалась даже быстрее, чем GTX 780 в этом подтесте, и стала лучшей. Возможно, в последней версии драйвера компания Nvidia оптимизировала код в т. ч. и для 3DMark Vantage. Что касается сравнения скорости Geforce GTX 770 с видеоплатой AMD, то представленная сегодня модель Nvidia имеет лучшую скорость заполнения сцены, чем её одночиповый конкурент с примерно такой же ценой.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нём рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоёмкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжёлого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчёты освещения по Strauss.

Третий тест отличается от проведённых нами ранее тем, что результаты в нём зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости тут важен верный баланс GPU, а также эффективность выполнения сложных шейдеров.

В данном случае важнее математическая и текстурная производительность, поэтому в синтетике из 3DMark Vantage новая плата Geforce GTX 770 примерно на 10% обгоняет свою предшественницу GTX 680, но серьёзно отстаёт от GTX 780, как и должно быть по теории. Да и Radeon HD 7970 опередила новинку Nvidia — GPU производства AMD до сих пор отличаются более эффективной работой в данном тесте. И лучшей в сравнении стала именно модель AMD на базе чипа Tahiti, она чуть-чуть обогнала GTX 780.

Feature Test 4: GPU Cloth

Четвёртый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте также зависит сразу от нескольких параметров, но основными факторами влияния является уже производительность обработки геометрии и эффективность выполнения геометрических шейдеров, поэтому и картину на диаграмме мы видим совершенно иную. Из-за значительного влияния геометрических блоков получается, что видеокарты производства Nvidia чувствуют себя в этом тестировании заметно лучше конкурентов, обгоняя единственную плату AMD. Это один из тех тестов, в которых видно преимущество решений Nvidia, имеющих распараллеленный геометрический конвейер.

В этом тесте даже Geforce GTX 680 опережает топовую одночиповую плату конкурента — Radeon HD 7970, а уж рассматриваемая сегодня модель Geforce GTX 770 так и вовсе стала лучшей и легко опережает не только видеоплату соперника, но и GTX 780! Это объясняется более высокой тактовой частотой GPU и программными оптимизациями в драйверах, так как аппаратно GTX 680 и GTX 770 идентичны, и геометрическая производительность у них должна быть схожей.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчётами, также тестируется stream out.

Во втором геометрическом тесте 3DMark Vantage Geforce GTX 770 хоть и снова оказалась быстрее GTX 680 и Radeon, но всё же уступила старшей плате GTX 780, основанной на топовом GPU. Оба синтетических теста имитации тканей и частиц из тестового пакета 3DMark Vantage, в которых активно используются геометрические шейдеры, показывают, что платы Nvidia в них остаются лучшими и опережают соперников в таких задачах.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических расчётов.

В чисто математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы видим отличающееся распределение результатов, по сравнению с двумя аналогичными тестами из нашего тестового пакета. В этом случае производительность решений также не полностью соответствует теории и расходится с тем, что мы видели ранее в математических тестах из пакета RightMark 2.0.

Видеокарты Radeon компании AMD, созданные на базе чипов архитектуры GCN, всегда очень хорошо справляются с такими задачами и показывают лучшие результаты в случаях, когда выполняется сравнительно простая, но весьма интенсивная математика. Вот и плата Radeon HD 7970 показала сегодня отличный результат, чуть-чуть уступив лишь топовому решению новой линейки конкурента — Geforce GTX 780.

А рассматриваемая сегодня видеокарта GTX 770 показала скорость на 7% выше, чем GTX 680, что соответствует теории, и серьёзно уступила как плате на GK110, так и конкуренту от AMD. Возросшая эффективность видеокарт на основе чипов архитектуры Kepler в этой задаче всё же не позволила плате на основе GK104 на равных бороться с соответствующей платой конкурента.

Direct3D 11: Вычислительные шейдеры

Чтобы протестировать новое решение компании Nvidia в задачах, использующих такие новые возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы воспользовались примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, Nvidia и AMD.

Сначала мы рассмотрим тесты, использующие вычислительные (Compute) шейдеры. Их появление — одно из наиболее важных нововведений в последних версиях DX API, они уже используются в современных играх для выполнения различных задач: постобработки, симуляций и т. п. В первом тесте показан пример HDR-рендеринга с tone mapping из DirectX SDK, с постобработкой, использующей пиксельные и вычислительные шейдеры.

Пусть это и не самый удачный пример с вычислительными шейдерами, но разницу в производительности в этой конкретной задаче он показывает. Скорость расчётов в вычислительном и пиксельном шейдерах для всех плат давно примерно одинаковая, хотя у видеокарт с GPU предыдущих архитектур были различия. Судя по нашим предыдущим тестам, результаты в задаче явно зависят не только от математической мощи и эффективности вычислений, но и от других факторов вроде ПСП и производительности ROP.

Анонсированная видеокарта нового семейства компании Nvidia в этом тесте оказалась ровно между GTX 780 и GTX 680 по скорости, опередив последнюю на 10%. Что касается сравнения с конкурирующей моделью Radeon HD 7970, то новинка всё же немного уступает, но разница совсем невелика. Второй тест вычислительных шейдеров также взят из Microsoft DirectX SDK, в нём показана расчётная задача гравитации N тел (N-body) — симуляция динамической системы частиц, на которую воздействуют физические силы, такие как гравитация.

В этом случае расклад совершенно иной, и у решений Nvidia есть явное преимущество в таких сложных расчётных задачах. Поэтому в этом тесте совершенно логично побеждает мощнейшая Geforce GTX 780 на базе GK110, а следом за ней идёт анонсированная сегодня вторая плата семейства Geforce GTX 700 на GK104. Свою предшественницу из 6-й серии GTX 770 опережает на 8%.

Похоже на то, что в этом тесте наблюдается упор в скорость исполнения математических вычислений, но с учётом эффективности в конкретной задаче, в которой графические чипы Nvidia сильны. А вот Radeon HD 7970 в этой задаче оказался лишь на последнем месте, серьёзно уступив и GTX 680. Давайте перейдём к тестам производительности в задачах тесселяции, которые традиционно должны показать одну из сильных сторон новинки.

Direct3D 11: Производительность тесселяции

Вычислительные шейдеры очень важны, но ещё одним важным нововведением в Direct3D 11 считается аппаратная тесселяция. Мы очень подробно рассматривали её в своей теоретической статье про Nvidia GF100. Тесселяцию уже довольно давно начали использовать в DX11-играх, таких как STALKER: Зов Припяти, DiRT 2, Aliens vs Predator, Metro Last Light, Civilization V, Crysis 3, Battlefield 3 и других. В некоторых из них тесселяция используется для моделей персонажей, в других — для имитации реалистичной водной поверхности или ландшафта.

Существует несколько различных схем разбиения графических примитивов (тесселяции). Например, phong tessellation, PN triangles, Catmull-Clark subdivision. Так, схема разбиения PN Triangles используется в STALKER: Зов Припяти, а в Metro 2033 — Phong tessellation. Эти методы сравнительно быстро и просто внедряются в процесс разработки игр и существующие движки, поэтому и стали популярными.

Первым тестом тесселяции будет пример Detail Tessellation из ATI Radeon SDK. В нём реализована не только тесселяция, но и две разные техники попиксельной обработки: простое наложение карт нормалей и parallax occlusion mapping. Что ж, сравним DX11-решения AMD и Nvidia в различных условиях:

В тесте простого бампмаппинга платы в основном упираются в ПСП, и результат новой видеокарты Nvidia лишь немногим (8%) выше, чем у Geforce GTX 680 на том же чипе. А до GTX 780 и Radeon HD 7970 новинке всё же далеко по этому параметру. Всё намного интереснее о втором подтесте с более сложными попиксельными расчётами — в нём GTX 770 опередила свою предшественницу уже на 18%, то есть можно предположить, что скорость ограничена ПСП и/или в Nvidia успешно оптимизировали драйвер для подобных задач. Впрочем, догнать HD 7970 и GTX 780 новинке всё равно не удалось, уж очень они сильны.

Но в самом интересном тесте с тесселяцией результат новинки весьма неплох — она показала скорость выше, чем Radeon HD 7970, хотя в данном тесте тесселяции разбиение треугольников весьма умеренное и скорость в нём совсем не упирается в производительность блоков обработки геометрии. Поэтому скорости обработки треугольников у платы компании AMD вполне хватает, чтобы показывать результаты, близкие к тем, что мы видим у GTX 680. Впрочем, у GTX 770 скорость ещё выше, и она уступила только старшей сестре из нового поколения.

Вторым тестом производительности тесселяции будет ещё один пример для 3D-разработчиков из ATI Radeon SDK — PN Triangles. Собственно, оба примера входят также и в состав DX SDK, так что мы уверены, что на их основе создают свой код игровые разработчики. Этот пример мы протестировали с различным коэффициентом разбиения (tessellation factor), чтобы понять, как сильно влияет его изменение на общую производительность.

В этом примере применяется уже более сложная геометрия, поэтому сравнение геометрической мощи различных решений по этому тесту приносит другие выводы. Все представленные в материале современные решения хорошо справляются с лёгкой и средней геометрической нагрузкой, показывая высокую скорость, но в тяжёлых условиях графические процессоры Nvidia оказываются заметно более производительными (см. нижний столбик на диаграмме).

Так как анонсированная сегодня модель Geforce GTX 770 основана на чипе GK104, который имеет среднее количество геометрических блоков по сравнению с GK110, но гораздо большее, чем у Tahiti, то новинка становится второй по скорости среди представленных видеокарт, вместе с почти такой же GTX 680. В сложных условиях скорость Radeon HD 7970 серьёзно падает, а у плат Nvidia она остаётся сравнительно высокой.

Рассмотрим результаты ещё одного теста — демонстрационной программы Nvidia Realistic Water Terrain, также известной как Island. В этой демке используется тесселяция и карты смещения (displacement mapping) для рендеринга реалистично выглядящей поверхности океана и ландшафта.

Тест Island не является чисто синтетическим тестом для измерения исключительно геометрической производительности GPU, так как он содержит и сложные пиксельные и вычислительные шейдеры в том числе, и такая нагрузка ближе к реальным играм, в которых используются все блоки GPU, а не только геометрические, как в предыдущих тестах геометрии.

Мы протестировали эту программу при четырёх разных коэффициентах тесселяции (в данном случае настройка называется Dynamic Tessellation LOD). Если при самом первом коэффициенте разбиения треугольников, когда скорость не ограничена производительностью геометрических блоков, старшая одночиповая видеокарта компании AMD показывает достаточно высокий результат — лучше, чем у Geforce GTX 680, то при усложнении геометрической работы решения компании Nvidia вырываются далеко вперёд, а производительность единственной в тесте Radeon заметно падает.

Топовая видеокарта Geforce GTX 780 на базе чипа GK110 в этом тесте чувствует себя замечательно, и неудивительно, что именно она стала лидером, так как этот чип имеет наибольшее количество блоков тесселяции. Да и новая плата Geforce GTX 770 во всех режимах показывает отличные результаты, заметно опережая топовую плату предыдущего поколения. Причём, разница больше в лёгких режимах, в которых сказывается большая ПСП. Сравнение с конкурентом можно не проводить, налицо разгромный выигрыш новинки в тестах тесселяции.


Результаты синтетических тестов новой модели видеокарты Geforce GTX 770, основанной на графическом процессоре GK104 из семейства Kepler, а также результаты других моделей видеокарт производства обоих производителей дискретных видеочипов показали, что новое решение компании Nvidia является довольно удачным обновлением топовой линейки и одной из самых мощных видеокарт вообще.

Судя по результатам синтетических тестов, небольшое превосходство новой модели в производительности перед Geforce GTX 680 есть, и оно было вполне ожидаемо. Его можно объяснить как повышенной частотой GPU, так и большей пропускной способностью памяти и более эффективной работой GPU Boost 2.0, позволяющей достичь более высокой реальной частоты. За исключением ряда задач, анонсированная сегодня модель Nvidia выгодно смотрится и по сравнению с самой мощной моделью конкурента — Radeon HD 7970.

Похоже, что Geforce GTX 770 будет интересным предложением для тех энтузиастов, которые планируют играть при максимальных настройках и иметь один из мощнейших GPU, но не готовы заплатить цену ни Geforce GTX Titan, ни GTX 780, ни даже GTX 680. Новая плата стоит даже дешевле топовой из предыдущего поколения, а разница между ними по скорости хоть и небольшая, но в пользу новинки. Аппаратно в GTX 780 нет ничего нового, но с учётом цены новой видеокарты рынок получил ещё одно удачное решение, производительность которого в играх мы проверим в следующей части статьи.

Nvidia Geforce GTX 770 — Часть 3: производительность в игровых тестах →

2 блока питания Corsair CMPSU-1200AXEU для тестового стенда предоставлены компанией Corsair

Корпус Corsair Obsidian 800D-Full Tower для тестового стенда предоставлен компанией Corsair

Модули памяти Corsair Vengeance CMZ16GX3M4X1600C9 для тестового стенда предоставлены компанией Corsair

Corsair Hydro SeriesT H100i CPU Cooler для тестового стенда предоставлен компанией Corsair

Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт

Системная плата Asus Sabertooth X79 для тестового стенда предоставлена компанией AsusTeK

Системная плата MSI X79A-GD45(8D) для тестового стенда предоставлена компанией MSI

Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate

Накопитель SSD OCZ Octane 512 ГБ для тестового стенда предоставлен компанией OCZ Russia

2 накопителя SSD Corsair Neutron SeriesT 120 ГБ для тестового стенда предоставлены компанией Corsair




Дополнительно

Обзор нового видеоускорителя Nvidia Geforce GTX 770. Часть 2 — Особенности видеокарты, результаты синтетических тестов

Nvidia Geforce GTX 770:

описание видеокарт и результаты синтетических тестов

Содержание

В этой части мы изучим видеокарту, а также познакомимся с результатами синтетических тестов. В нашей лаборатории побывала эталонная карта Nvidia.

Платы

Nvidia Geforce GTX 770 2048 МБ 256-битной GDDR5 PCI-E
  • GPU: Geforce GTX 770 (GK104)
  • Интерфейс: PCI Express x16
  • Частота работы GPU (ROPs): 1046-1075 МГц (номинал — 1046-1075 МГц)
  • Частота работы памяти (физическая (эффективная)): 1750 (7000) МГц (номинал — 1750 (7000) МГц)
  • Ширина шины обмена с памятью: 256 бит
  • Число вычислительных блоков в GPU/частота работы блоков: 8/1046-1075 МГц (номинал — 8/1046-1075 МГц)
  • Число операций (ALU) в блоке: 192
  • Суммарное число операций (ALU): 1536
  • Число блоков текстурирования: 128 (BLF/TLF/ANIS)
  • Число блоков растеризации (ROP): 32
  • Размеры: 270×100×38 мм (карта занимает 2 слота в системном блоке)
  • Цвет текстолита: черный
  • Энергопотребление (пиковое в 3D/в режиме 2D/в режиме «сна»): 231/85/60 Вт
  • Выходные гнезда: 1×DVI (Dual-Link/HDMI), 1×DVI (Single-Link/VGA), 1×HDMI 1.4a, 1×DisplayPort 1.2
  • Поддержка многопроцессорной работы: SLI (Hardware)

Nvidia Geforce GTX 770 2048 МБ 256-битной GDDR5 PCI-E
Карта имеет 2048 МБ памяти GDDR5 SDRAM, размещенной в 8 микросхемах на лицевой стороне PCB.

Микросхемы памяти Samsung (GDDR5). Микросхемы расчитаны на максимальную частоту работы в 1785 (7140) МГц.

Сравнение с эталонным дизайном, вид спереди
Nvidia Geforce GTX 770 2048 МБ 256-битной GDDR5 PCI-E Reference card Nvidia Geforce GTX 680

Сравнение с эталонным дизайном, вид сзади
Nvidia Geforce GTX 770 2048 МБ 256-битной GDDR5 PCI-E Reference card Nvidia Geforce GTX 680

Как уже ранее говорилось, GTX 770 — это по сути тот же GTX 680, поэтому сравнивать будем именно с последним. Очевидно, что левые стороны у обеих карт очень схожи: гнезда вывода и расположение микросхем памяти идентичны. А вот над блоком питания хорошо поработали. Система питания стала 6-фазной, цифровой контроллер цепей питания переместился на лицевую сторону. Кроме того, компания Nvidia отказалась от идиотского двухэтажного разъема питания, который явно имел неудачную конструкцию (пальцы сломаешь, пока нажмешь рычажок запора одного из разъемов), и мы видим привычные два разъема на 6 и 8 пин.

Ускоритель имеет следующий набор гнезд вывода: 2 DVI (один из которых Single-Link и совместим с выводом на VGA) и по одному DisplayPort и HDMI (второе гнездо DVI обладает возможностью через адаптер передавать сигнал на HDMI, поэтому суммарно можно подключить 2 приемника с HDMI). Напомним, что ускорители Nvidia достаточно давно обладают собственными звуковыми кодеками, поэтому передача на HDMI-монитор будет полноценной, со звуком. Также уместно напомнить, что возможность одновременного вывода картинки максимально на 4 монитора (каждый до разрешения Full HD), реализована и тут. Но если в случае GTX 780/Titan она наиболее полно востребована, учитывая мощность и возможности тех ускорителей, то для GTX 770 в некоторых играх придется снижать настройки качества, чтобы получить приемлемую играбельность в таком высочайшем разрешении.

Максимальные разрешения и частоты:

  • 240 Гц — максимальная частота обновления;
  • 2048×1536@85 Гц — по аналоговому интерфейсу;
  • 2560×1600@60 Гц — по цифровому интерфейсу (для DVI-гнезд с Dual-Link/HDMI).

Что касается возможностей по ускорению декодирования видео, в 2007 году мы проводили такое исследование, с ним можно ознакомиться здесь.

Напомним, что карта требует дополнительного питания, причем двумя разъемами: один с шестью контактами, второй — с восемью.

О системе охлаждения.

Nvidia Geforce GTX 770 2048 МБ 256-битной GDDR5 PCI-E
СО очень схожа со своим аналогом от GTX Titan (хотя бы внешне), однако есть и отличия. Кулер имеет закрытую форму с цилиндрическим вентилятором на конце. Радиатор, прижимающийся к ядру, основан на испарительной камере, внутри которой находится особая легкоиспаряемая жидкость. Отличие от кулера GTX Titan в размерах данной камеры: у GTX 770 она меньше и соотносима с размерами корпуса GPU GK104. Нижняя пластина камеры прижимается к ядру, тепло передается жидкости, которая испаряется и уносит тепло к верхней пластине (имеющей ребра охлаждения), где пары конденсируются и т. д.

Вентилятор гонит воздух через вышеупомянутый радиатор и имеет особую форму крыльчатки, дающую пониженный уровень шума. Надо сказать, что при максимальной нагрузке в случае GTX 770 шум практически не ощущается (в отличие от Titan), и максимальная частота вращения — около 2000 оборотов в минуту.

Микросхемы памяти имеют охлаждение: у кулера есть специальная пластина, прижимающаяся к микросхемам памяти и транзисторам силового блока.

Мы провели исследование температурного режима с помощью новой версии утилиты EVGA PrecisionX (автор А. Николайчук AKA Unwinder) и получили следующие результаты.

Nvidia Geforce GTX 770 2048 МБ 256-битной GDDR5 PCI-E

После 6 часов прогона карты под максимальной игровой нагрузкой максимальная температура ядра составила 82 градуса, что для ускорителя такого класса является приемлемым результатом. Таким образом, СО получилась весьма эффективной и очень малошумной.

Комплектация. Reference-карты всегда поставляются без комплектов, поэтому этот пункт мы пропустим.

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютеры на базе процессора Intel Core i7-3960X (Socket 2011):
    • 2 процессора Intel Core i7-3960X (o/c 4 ГГц);
    • СО Hydro SeriesT H100i Extreme Performance CPU Cooler;
    • СО Intel Thermal Solution RTS2011LC;
    • системная плата Asus Sabertooth X79 на чипсете Intel X79;
    • системная плата MSI X79A-GD45(8D) на чипсете Intel X79;
    • оперативная память 16 ГБ DDR3 Corsair Vengeance CMZ16GX3M4A1600C9 1600 МГц;
    • жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA2;
    • жесткий диск WD Caviar Blue WD10EZEX 1 TБ SATA2;
    • 2 SSD Corsair Neutron SSD CSSD-N120GB3-BK;
    • 2 блока питания Corsair CMPSU-1200AXEU (1200 Вт);
    • корпус Corsair Obsidian 800D Full-Tower.
  • операционная система Windows 7 64-битная; DirectX 11;
  • монитор Dell UltraSharp U3011 (30″);
  • драйверы AMD версии Catalyst 13.5beta; Nvidia версии 320.18 (для GTX 780/770), 320.14 (для остальных карт).

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

В качестве синтетических тестов DirectX 11 мы использовали примеры из пакетов SDK компаний Microsoft и AMD, а также демонстрационной программы Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010).

Мы взяли и приложения обоих производителей видеочипов: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain, также известная как Island11.

Синтетические тесты проводились на следующих видеокартах:

  • Geforce GTX 770 2GB со стандартными параметрами (далее GTX 770)
  • Geforce GTX 780 3GB со стандартными параметрами (далее GTX 780)
  • Geforce GTX 680 2GB со стандартными параметрами (далее GTX 680)
  • Radeon HD 7970 3GB(не GHz Edition) со стандартными параметрами (далее HD 7970)

Для сравнения результатов новой модели видеокарты Geforce GTX 770 именно эти решения были выбраны по следующим причинам. Geforce GTX 680 является практически полной копией новинки из предыдущего семейства, она основана на точно таком же GPU и имеет близкие частоты, отличаясь только разной ПСП видеопамяти, поэтому будет интересно оценить влияние быстрой видеопамяти и проведённые оптимизации драйверов со времени выхода GTX 680. Geforce GTX 780 интересна как видеокарта текущего поколения, но более высокого уровня, основанная на топовом графическом процессоре GK110.

От конкурирующей компании AMD была взята единственная видеоплата, которая и является прямым соперником для представленной сегодня модели GTX 770. Radeon HD 7970 до сих пор остаётся наиболее мощным одночиповым решением компании AMD и примерно соответствует по цене и производительности новой видеокарте Nvidia. Других соперников у GTX 770 пока нет, так как AMD обновленную линейку ещё не выпустила.

Direct3D 9: тесты Pixel Shaders

Тесты текстурирования и заполнения (филлрейта) из пакета 3DMark Vantage мы рассмотрим чуть позже, а первая группа пиксельных шейдеров, которую мы используем, включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся в старых играх, — и она очень проста для современных видеочипов.

Тесты простые для современных видеокарт, и скорость мощных решений в них упирается в различные ограничители вроде филлрейта. Они способны показать далеко не все возможности современных видеочипов и интересны лишь с точки зрения устаревших игровых приложений. В случае самых мощных видеокарт все они показывают сравнимые результаты, немного выделяется разве что видеокарта Radeon.

Новая плата компании Nvidia в этом сравнении ожидаемо опередила полностью аналогичную плату на базе GK104, причём её преимущество было от 4% до 15% — строго по теории. Geforce GTX 780 на базе GK110 оказалась слегка впереди, хотя в большинстве тестов до сих пор лидирует единственная в сравнении плата AMD на базе чипа Tahiti. Посмотрим на результаты более сложных пиксельных программ промежуточных версий:

Тест Cook-Torrance более интенсивен вычислительно, и скорость в нём сильнее зависит от количества ALU и их частоты, но также и от скорости TMU. Этот тест исторически лучше подходит для графических решений компании AMD, но новые платы Geforce на базе архитектуры Kepler в нём также показывают довольно сильные результаты.

Вторая плата из новой линейки Geforce GTX 700 оказалась быстрее предшествующей GTX 680 примерно на 3-5%, что объясняется приростом частоты, и уступила мощнейшей в линейке GTX 780 менее 20%, как и следовало ожидать, исходя из теории. Интересно, что в тесте освещения, больше зависящем от скорости ALU, Radeon HD 7970 оказалась немного впереди, а в тесте Water, скорость в котором больше зависит от текстурирования, победила уже новинка.

Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье «Современная терминология 3D-графики».
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

Существует два варианта этих шейдеров: с ориентацией на математические вычисления и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это универсальные тесты, производительность в которых зависит и от скорости блоков ALU, и от скорости текстурирования, также в них важен общий баланс чипа и эффективность исполнения вычислительных программ. Прошлые наши исследования показывают, что в этих конкретных задачах архитектура AMD смотрится заметно лучше графической архитектуры Nvidia.

В тесте «Frozen Glass» скорость больше зависит от математической производительности и эффективности в конкретной задаче, поэтому Radeon HD 7970 оказывается быстрее новинки Nvidia, да и всех остальных, включая GTX 780, так как все Geforce во что-то упираются: разница между GTX 770 и GTX 680 оказалась равной 3%, а между GTX 770 и GTX 780 — лишь 4%.

Во втором тесте «Parallax Mapping» новая видеокарта Nvidia также отстала от Radeon HD 7970, но оказалась к этой плате уже ближе. Преимущество GTX 770 над GTX 680 составило 7%, а разница между двумя моделями линейки GTX 700 достигла впечатляющей величины почти в 20%. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:

В условиях предпочтительности текстурных выборок положение плат на чипах производства Nvidia заметно улучшилось. Новая Geforce GTX 770 сильно приблизилась к лучшей одночиповой плате AMD, хотя в одном из тестов отставание осталось. Анонсированная сегодня видеокарта Nvidia в этих задачах работает сравнительно неплохо, почти на уровне GTX 780, разница между ускорителями составила лишь 3-5%. Ну а GTX 680 новинка обогнала на 5-14%.

Всё это давно устаревшие задачи, с упором в текстурирование и филлрейт. Далее мы рассмотрим результаты ещё двух тестов пиксельных шейдеров, но уже версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9. Они наиболее показательны с точки зрения современных игр на ПК, среди которых много мультиплатформенных. Тесты отличаются тем, что сильно нагружают и ALU, и текстурные модули, обе шейдерные программы сложны и длинны и включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье «Современная терминология 3D-графики».
  • Fur — процедурный шейдер, визуализирующий мех.

Вот эти тесты уже практически не ограничены производительностью текстурных выборок или филлрейтом и больше всего зависят от эффективности исполнения сложного шейдерного кода. В самых тяжёлых DX9-тестах из первой версии пакета RightMark видеокарты производства Nvidia в предыдущие годы были сильнее, но в последних архитектурах решения AMD сильно ускорились, особенно после доводки драйверов.

Свежая модель Nvidia выступила тут сравнительно неплохо, по сравнению с предшественницей на базе того же чипа GK104, опередив GTX 680 на 3-7%. Своей старшей сестре из того же семейства новинка проиграла почти 20% — что точно соответствует теоретической разнице между ними. Что касается сравнения с Radeon HD 7970, то в тесте Fur две сравниваемые платы оказались равны, но в тесте параллаксмаппинга новинка всё так же сильно проигрывает единственной модели Radeon.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два уже знакомых нам теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

В этом тесте производительность зависит от количества и эффективности блоков TMU, влияет и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает ещё и эффективный филлрейт и пропускная способность памяти. Результаты при детализации уровня «High» получаются до полутора раз ниже, чем при «Low».

В задачах процедурной визуализации меха с большим количеством текстурных выборок, за пару поколений графических архитектур компания AMD сократила разницу с платами Nvidia, а с выпуском GCN и вовсе вырвалась вперёд. И сейчас именно платы Radeon являются лидерами таких сравнений, что говорит о высокой эффективности выполнения ими данных программ, что видно и по сегодняшнему сравнению.

Сегодняшняя новинка Geforce GTX 770 опередила аналогичную плату GTX 680 на 5-7%, а Titan она же уступает немного побольше. Впрочем, все решения Nvidia проигрывают в этом тесте единственной модели конкурента — Radeon HD 7970. Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: возможно, в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

В целом всё похоже на то, что мы видели на предыдущей диаграмме, но видеокарты Nvidia уступают своему единственному сопернику от AMD ещё больше. Новинка Geforce GTX 770 всё так же впереди GTX 680 на несколько процентов, но отстаёт от GTX 780, основанной на другом GPU. Ну а что касается сравнения с платой AMD при включении суперсэмплинга, увеличивающего теоретическую нагрузку вчетверо, то тут даже уже старенький Radeon HD 7970 далеко впереди, так как преимущество в подобных вычислениях явно у чипов компании AMD, предпочитающих попиксельные вычисления.

Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип ещё примерно в два раза — такой режим называется «High».

Диаграмма похожа на предыдущую, также без включения SSAA, и снова даже Geforce GTX 780 не смогла догнать Radeon HD 7970, не говоря о более слабой модели новой линейки. В общем, платы Nvidia и в этом тесте справляются с работой хуже конкурирующих от AMD, и новая модель Geforce GTX 770 в обновленном D3D10-варианте теста без суперсэмплинга уступает конкурирующей с ней плате Radeon HD 7970, которая снова стала быстрейшим решением. Разница между GTX 770 и 680 чуть увеличились, до 6-9%. Посмотрим, что изменит включение суперсэмплинга.

Видим примерно то же, что и в «Fur» — при включении суперсэмплинга и самозатенения задача получается ещё более тяжёлой, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьёзное падение производительности. Разница между скоростными показателями протестированных видеокарт немного изменилась, включение суперсэмплинга сказывается меньше, чем в предыдущем случае — и видеокарта Radeon HD 7970 не улучшила свои показатели относительно всех плат Nvidia, всё равно оставшись впереди них.

Графические решения Nvidia в наших D3D10-тестах пиксельных шейдеров работают менее эффективно, и героиня сегодняшнего обзора в этой задаче показывает скорость почти ровно как у Geforce GTX 680, основанной на точно таком же графическом процессоре. Модель GTX 780 же является быстрейшей из Geforce, но она всё же не дотягивается до HD 7970. Посмотрим, что будет в чисто вычислительных задачах.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты наших предельных математических тестов обычно примерно соответствуют разнице в частотах и количестве вычислительных блоков, но с влиянием разной эффективности их использования и с учётом оптимизации драйверов. К сожалению, в случае теста Mineral новая модель Geforce GTX 770 по какой-то странной причине показала ровно такой же результат, что и GTX 680, хотя по теории у неё должно быть небольшое преимущество в 3-4%.

В остальном, нам остаётся снова отметить, что хотя архитектуры AMD в таких тестах ранее имели серьёзное преимущество перед конкурирующими видеокартами Nvidia, но в чипах семейства Kepler компании Nvidia удалось увеличить число потоковых процессоров, и пиковая математическая производительность моделей Geforce, начиная с GTX 680, значительно возросла. Это мы и видим по результатам нашего первого математического теста, где рассматриваемая Geforce GTX 770 показала хороший результат, почти догнав аналогичную плату конкурента — Radeon HD 7970.

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нём только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Интересно, что во втором математическом тесте мы видим несколько иной относительный результат. Если сравнивать GTX 770 и GTX 680, то видно, что разница между ними составила аж 10%, что явно не объяснить одной лишь скоростью обработки вычислений. Вероятно, в этом конкретном тесте новинке также помогло и увеличение пропускной способности видеопамяти. Или сработала дальнейшая оптимизация драйверов. Но GTX 770 всё же отстаёт от Radeon HD 7970 по скорости в этом тесте.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаковое для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близкое к двукратному. Задача эта для современных видеокарт не слишком сложная, и производительность в ней ограничена скоростью обработки геометрии и пропускной способностью памяти.

Разница между результатами видеокарт на чипах Nvidia и AMD (при одинаковом количестве GPU) обусловлена отличиями в геометрических конвейерах чипах этих компаний. Если в предыдущих тестах с пиксельными шейдерами платы AMD были заметно эффективнее и быстрее, то тесты геометрии показывают, что в таких задачах платы Nvidia оказываются производительнее.

Сегодняшняя новинка Geforce GTX 770 имеет достаточное количество геометрических блоков, и частота GPU в нём выше, чем у GTX 680, поэтому её преимущество равно 3-4% — точно по теории. Понятно, что новая плата легко справляется и со своим единственным одночиповым конкурентом — Radeon HD 7970 новая Geforce обходит с приличным запасом. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры слегка улучшились и для плат AMD, и для решений Nvidia. Видеокарты в первом тесте геометрических шейдеров слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, а поэтому и все выводы остаются прежними. Новая модель Geforce GTX 770 всё так же немного отстаёт от GTX 780, основанной на GK110, и она явно быстрее единственной видеоплаты семейства Radeon HD 7000. Посмотрим далее — интересно, что изменится в следующем тесте, который предполагает большую нагрузку именно на геометрические шейдеры.

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленным в «Heavy» — ещё и для их отрисовки. Иначе говоря, в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер.

Относительные результаты остальных решений в разных режимах примерно соответствуют изменению нагрузки: во всех случаях производительность неплохо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть чуть менее чем в два раза медленней.

В случае сбалансированной загрузки геометрических шейдеров, все результаты весьма близки и скорость рендеринга в этом тесте ограничена непонятно чем — возможно растеризацией. Новая модель Geforce GTX 770 показала скорость даже выше, чем у GTX 780, что можно объяснить лишь более высокой частотой GPU, что также наталкивает на мысль об ограничении производительности скоростью растеризации.

Цифры могут серьёзно измениться на следующей диаграмме, в тесте с более активным использованием геометрических шейдеров. Также будет интересно сравнить друг с другом результаты, полученные в режимах «Balanced» и «Heavy».

А вот в этом тесте получилось как всегда — единственная плата от AMD ухудшила сравнительный результат, заметно уступив всем платам Nvidia, в том числе и новой GTX 770. В этом тесте единственно важным параметром является скорость обработки геометрии, с которой дела у Nvidia обстоят заметно лучше, особенно что касается топовых решений. Интересно, что несмотря на идентичный видеочип и близкие рабочие частоты, Geforce GTX 770 даже немного уступила GTX 680, чего ранее не встречалось. Впрочем, разница между всеми платами Nvidia оказалась весьма небольшой.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Наши предыдущие исследования показали, что на результаты этого теста может влиять и скорость текстурирования и пропускная способность памяти (в лёгком режиме), а результаты видеокарт Nvidia были ограничены ещё чем-то необъяснимым. И вот теперь мы обнаружили это что-то. Всё очень прозаично — оказалось, что драйверы ранее были недостаточно оптимизированы для этого теста, и в случае с последней версий драйверов Nvidia всё наконец-то наладилось.

Результаты новой платы на чипе GK104 явно лучше, чем у GTX 680, хотя в лёгком режиме она всё ещё ограничена ПСП, зато в среднем и сложном режимах оказалась значительно быстрее. Интересно, что новинка и стала самой быстрой в этой задаче, хотя она и близка к старшей сестре GTX 780. Radeon HD 7970 новая плата обогнала с хорошим запасом. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Взаимное расположение карт на диаграмме слабо изменилось — сравнительные результаты решений компании AMD в тяжёлых режимах ещё больше ухудшились, и теперь Radeon HD 7970 показывает скорость где-то на уровне GTX 680, протестированной на старых драйверах. Свежая их версия дала возможность новой плате GTX 770 показать максимальную скорость наравне с GTX 780.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты во втором тесте вершинного текстурирования «Waves» не похожи на те, что мы видели на предыдущих диаграммах, хотя GTX 770 с новой версией драйверов явно расцвела. Показатели Geforce GTX 680 заметно ниже, чем у новинки, что можно объяснить только программной оптимизацией. В этом тесте скорость всех плат (кроме GTX 680) примерно одинаковая, даже Radeon HD 7970 очень близко. Рассмотрим второй вариант этого же теста:

С усложнением задачи скорость всех решений стала несколько ниже, но это мало что изменило. Во всех режимах этого теста новая GTX 770 показывает скорость на уровне своего соперника Radeon HD 7970. Результаты сегодняшней новинки только в лёгком режиме уступают скорости GTX 780, а GTX 680 обе платы обошли с хорошим запасом.

3DMark Vantage: тесты Feature

Синтетические тесты из пакета 3DMark Vantage покажут нам то, что мы ранее упустили. Feature-тесты из этого тестового пакета обладают поддержкой DirectX 10 и интересны тем, что отличаются от наших и до сих пор актуальны. При анализе результатов новой видеокарты Nvidia в этом пакете мы сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark.

Feature Test 1: Texture Fill

Первый тест — тест скорости текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Эффективность видеокарт AMD и Nvidia в текстурном тесте компании Futuremark достаточно высока, и сравнительные цифры моделей близки к соответствующим теоретическим параметрам. Вторая видеокарта семейства Geforce GTX 700 очень серьёзно отстала от первой (GTX 780) по той причине, что старшая модель основана на графическом процессоре GK110, имеющем гораздо больше текстурных блоков.

А вот над GTX 680 у новинки есть преимущество в 9%, что можно объяснить как повышенной частотой, так и более эффективной работой GPU Boost 2.0. Что касается сравнения производительности Geforce GTX 770 с единственным представленным решением от конкурента, то и тут всё более-менее соответствует теории — новинка Nvidia по текстурной скорости оказалась чуть быстрее платы Radeon HD 7970.

Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нём используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Как мы ранее определили, цифры этого подтеста из 3DMark Vantage показывают производительность блоков ROP с учётом величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), и тест иногда измеряет скорее пропускную способность памяти, а не производительность ROP, но в данном случае разница в скорости не соответствует ни тому, ни другому параметру.

В тесте производительности блоков ROP мы ещё в прошлой статье отмечали аномально низкий результат у Geforce GTX 780, вот и сегодня странность подтвердилась — новинка GTX 770 оказалась даже быстрее, чем GTX 780 в этом подтесте, и стала лучшей. Возможно, в последней версии драйвера компания Nvidia оптимизировала код в т. ч. и для 3DMark Vantage. Что касается сравнения скорости Geforce GTX 770 с видеоплатой AMD, то представленная сегодня модель Nvidia имеет лучшую скорость заполнения сцены, чем её одночиповый конкурент с примерно такой же ценой.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нём рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоёмкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжёлого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчёты освещения по Strauss.

Третий тест отличается от проведённых нами ранее тем, что результаты в нём зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости тут важен верный баланс GPU, а также эффективность выполнения сложных шейдеров.

В данном случае важнее математическая и текстурная производительность, поэтому в синтетике из 3DMark Vantage новая плата Geforce GTX 770 примерно на 10% обгоняет свою предшественницу GTX 680, но серьёзно отстаёт от GTX 780, как и должно быть по теории. Да и Radeon HD 7970 опередила новинку Nvidia — GPU производства AMD до сих пор отличаются более эффективной работой в данном тесте. И лучшей в сравнении стала именно модель AMD на базе чипа Tahiti, она чуть-чуть обогнала GTX 780.

Feature Test 4: GPU Cloth

Четвёртый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте также зависит сразу от нескольких параметров, но основными факторами влияния является уже производительность обработки геометрии и эффективность выполнения геометрических шейдеров, поэтому и картину на диаграмме мы видим совершенно иную. Из-за значительного влияния геометрических блоков получается, что видеокарты производства Nvidia чувствуют себя в этом тестировании заметно лучше конкурентов, обгоняя единственную плату AMD. Это один из тех тестов, в которых видно преимущество решений Nvidia, имеющих распараллеленный геометрический конвейер.

В этом тесте даже Geforce GTX 680 опережает топовую одночиповую плату конкурента — Radeon HD 7970, а уж рассматриваемая сегодня модель Geforce GTX 770 так и вовсе стала лучшей и легко опережает не только видеоплату соперника, но и GTX 780! Это объясняется более высокой тактовой частотой GPU и программными оптимизациями в драйверах, так как аппаратно GTX 680 и GTX 770 идентичны, и геометрическая производительность у них должна быть схожей.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчётами, также тестируется stream out.

Во втором геометрическом тесте 3DMark Vantage Geforce GTX 770 хоть и снова оказалась быстрее GTX 680 и Radeon, но всё же уступила старшей плате GTX 780, основанной на топовом GPU. Оба синтетических теста имитации тканей и частиц из тестового пакета 3DMark Vantage, в которых активно используются геометрические шейдеры, показывают, что платы Nvidia в них остаются лучшими и опережают соперников в таких задачах.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических расчётов.

В чисто математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы видим отличающееся распределение результатов, по сравнению с двумя аналогичными тестами из нашего тестового пакета. В этом случае производительность решений также не полностью соответствует теории и расходится с тем, что мы видели ранее в математических тестах из пакета RightMark 2.0.

Видеокарты Radeon компании AMD, созданные на базе чипов архитектуры GCN, всегда очень хорошо справляются с такими задачами и показывают лучшие результаты в случаях, когда выполняется сравнительно простая, но весьма интенсивная математика. Вот и плата Radeon HD 7970 показала сегодня отличный результат, чуть-чуть уступив лишь топовому решению новой линейки конкурента — Geforce GTX 780.

А рассматриваемая сегодня видеокарта GTX 770 показала скорость на 7% выше, чем GTX 680, что соответствует теории, и серьёзно уступила как плате на GK110, так и конкуренту от AMD. Возросшая эффективность видеокарт на основе чипов архитектуры Kepler в этой задаче всё же не позволила плате на основе GK104 на равных бороться с соответствующей платой конкурента.

Direct3D 11: Вычислительные шейдеры

Чтобы протестировать новое решение компании Nvidia в задачах, использующих такие новые возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы воспользовались примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, Nvidia и AMD.

Сначала мы рассмотрим тесты, использующие вычислительные (Compute) шейдеры. Их появление — одно из наиболее важных нововведений в последних версиях DX API, они уже используются в современных играх для выполнения различных задач: постобработки, симуляций и т. п. В первом тесте показан пример HDR-рендеринга с tone mapping из DirectX SDK, с постобработкой, использующей пиксельные и вычислительные шейдеры.

Пусть это и не самый удачный пример с вычислительными шейдерами, но разницу в производительности в этой конкретной задаче он показывает. Скорость расчётов в вычислительном и пиксельном шейдерах для всех плат давно примерно одинаковая, хотя у видеокарт с GPU предыдущих архитектур были различия. Судя по нашим предыдущим тестам, результаты в задаче явно зависят не только от математической мощи и эффективности вычислений, но и от других факторов вроде ПСП и производительности ROP.

Анонсированная видеокарта нового семейства компании Nvidia в этом тесте оказалась ровно между GTX 780 и GTX 680 по скорости, опередив последнюю на 10%. Что касается сравнения с конкурирующей моделью Radeon HD 7970, то новинка всё же немного уступает, но разница совсем невелика. Второй тест вычислительных шейдеров также взят из Microsoft DirectX SDK, в нём показана расчётная задача гравитации N тел (N-body) — симуляция динамической системы частиц, на которую воздействуют физические силы, такие как гравитация.

В этом случае расклад совершенно иной, и у решений Nvidia есть явное преимущество в таких сложных расчётных задачах. Поэтому в этом тесте совершенно логично побеждает мощнейшая Geforce GTX 780 на базе GK110, а следом за ней идёт анонсированная сегодня вторая плата семейства Geforce GTX 700 на GK104. Свою предшественницу из 6-й серии GTX 770 опережает на 8%.

Похоже на то, что в этом тесте наблюдается упор в скорость исполнения математических вычислений, но с учётом эффективности в конкретной задаче, в которой графические чипы Nvidia сильны. А вот Radeon HD 7970 в этой задаче оказался лишь на последнем месте, серьёзно уступив и GTX 680. Давайте перейдём к тестам производительности в задачах тесселяции, которые традиционно должны показать одну из сильных сторон новинки.

Direct3D 11: Производительность тесселяции

Вычислительные шейдеры очень важны, но ещё одним важным нововведением в Direct3D 11 считается аппаратная тесселяция. Мы очень подробно рассматривали её в своей теоретической статье про Nvidia GF100. Тесселяцию уже довольно давно начали использовать в DX11-играх, таких как STALKER: Зов Припяти, DiRT 2, Aliens vs Predator, Metro Last Light, Civilization V, Crysis 3, Battlefield 3 и других. В некоторых из них тесселяция используется для моделей персонажей, в других — для имитации реалистичной водной поверхности или ландшафта.

Существует несколько различных схем разбиения графических примитивов (тесселяции). Например, phong tessellation, PN triangles, Catmull-Clark subdivision. Так, схема разбиения PN Triangles используется в STALKER: Зов Припяти, а в Metro 2033 — Phong tessellation. Эти методы сравнительно быстро и просто внедряются в процесс разработки игр и существующие движки, поэтому и стали популярными.

Первым тестом тесселяции будет пример Detail Tessellation из ATI Radeon SDK. В нём реализована не только тесселяция, но и две разные техники попиксельной обработки: простое наложение карт нормалей и parallax occlusion mapping. Что ж, сравним DX11-решения AMD и Nvidia в различных условиях:

В тесте простого бампмаппинга платы в основном упираются в ПСП, и результат новой видеокарты Nvidia лишь немногим (8%) выше, чем у Geforce GTX 680 на том же чипе. А до GTX 780 и Radeon HD 7970 новинке всё же далеко по этому параметру. Всё намного интереснее о втором подтесте с более сложными попиксельными расчётами — в нём GTX 770 опередила свою предшественницу уже на 18%, то есть можно предположить, что скорость ограничена ПСП и/или в Nvidia успешно оптимизировали драйвер для подобных задач. Впрочем, догнать HD 7970 и GTX 780 новинке всё равно не удалось, уж очень они сильны.

Но в самом интересном тесте с тесселяцией результат новинки весьма неплох — она показала скорость выше, чем Radeon HD 7970, хотя в данном тесте тесселяции разбиение треугольников весьма умеренное и скорость в нём совсем не упирается в производительность блоков обработки геометрии. Поэтому скорости обработки треугольников у платы компании AMD вполне хватает, чтобы показывать результаты, близкие к тем, что мы видим у GTX 680. Впрочем, у GTX 770 скорость ещё выше, и она уступила только старшей сестре из нового поколения.

Вторым тестом производительности тесселяции будет ещё один пример для 3D-разработчиков из ATI Radeon SDK — PN Triangles. Собственно, оба примера входят также и в состав DX SDK, так что мы уверены, что на их основе создают свой код игровые разработчики. Этот пример мы протестировали с различным коэффициентом разбиения (tessellation factor), чтобы понять, как сильно влияет его изменение на общую производительность.

В этом примере применяется уже более сложная геометрия, поэтому сравнение геометрической мощи различных решений по этому тесту приносит другие выводы. Все представленные в материале современные решения хорошо справляются с лёгкой и средней геометрической нагрузкой, показывая высокую скорость, но в тяжёлых условиях графические процессоры Nvidia оказываются заметно более производительными (см. нижний столбик на диаграмме).

Так как анонсированная сегодня модель Geforce GTX 770 основана на чипе GK104, который имеет среднее количество геометрических блоков по сравнению с GK110, но гораздо большее, чем у Tahiti, то новинка становится второй по скорости среди представленных видеокарт, вместе с почти такой же GTX 680. В сложных условиях скорость Radeon HD 7970 серьёзно падает, а у плат Nvidia она остаётся сравнительно высокой.

Рассмотрим результаты ещё одного теста — демонстрационной программы Nvidia Realistic Water Terrain, также известной как Island. В этой демке используется тесселяция и карты смещения (displacement mapping) для рендеринга реалистично выглядящей поверхности океана и ландшафта.

Тест Island не является чисто синтетическим тестом для измерения исключительно геометрической производительности GPU, так как он содержит и сложные пиксельные и вычислительные шейдеры в том числе, и такая нагрузка ближе к реальным играм, в которых используются все блоки GPU, а не только геометрические, как в предыдущих тестах геометрии.

Мы протестировали эту программу при четырёх разных коэффициентах тесселяции (в данном случае настройка называется Dynamic Tessellation LOD). Если при самом первом коэффициенте разбиения треугольников, когда скорость не ограничена производительностью геометрических блоков, старшая одночиповая видеокарта компании AMD показывает достаточно высокий результат — лучше, чем у Geforce GTX 680, то при усложнении геометрической работы решения компании Nvidia вырываются далеко вперёд, а производительность единственной в тесте Radeon заметно падает.

Топовая видеокарта Geforce GTX 780 на базе чипа GK110 в этом тесте чувствует себя замечательно, и неудивительно, что именно она стала лидером, так как этот чип имеет наибольшее количество блоков тесселяции. Да и новая плата Geforce GTX 770 во всех режимах показывает отличные результаты, заметно опережая топовую плату предыдущего поколения. Причём, разница больше в лёгких режимах, в которых сказывается большая ПСП. Сравнение с конкурентом можно не проводить, налицо разгромный выигрыш новинки в тестах тесселяции.


Результаты синтетических тестов новой модели видеокарты Geforce GTX 770, основанной на графическом процессоре GK104 из семейства Kepler, а также результаты других моделей видеокарт производства обоих производителей дискретных видеочипов показали, что новое решение компании Nvidia является довольно удачным обновлением топовой линейки и одной из самых мощных видеокарт вообще.

Судя по результатам синтетических тестов, небольшое превосходство новой модели в производительности перед Geforce GTX 680 есть, и оно было вполне ожидаемо. Его можно объяснить как повышенной частотой GPU, так и большей пропускной способностью памяти и более эффективной работой GPU Boost 2.0, позволяющей достичь более высокой реальной частоты. За исключением ряда задач, анонсированная сегодня модель Nvidia выгодно смотрится и по сравнению с самой мощной моделью конкурента — Radeon HD 7970.

Похоже, что Geforce GTX 770 будет интересным предложением для тех энтузиастов, которые планируют играть при максимальных настройках и иметь один из мощнейших GPU, но не готовы заплатить цену ни Geforce GTX Titan, ни GTX 780, ни даже GTX 680. Новая плата стоит даже дешевле топовой из предыдущего поколения, а разница между ними по скорости хоть и небольшая, но в пользу новинки. Аппаратно в GTX 780 нет ничего нового, но с учётом цены новой видеокарты рынок получил ещё одно удачное решение, производительность которого в играх мы проверим в следующей части статьи.

Nvidia Geforce GTX 770 — Часть 3: производительность в игровых тестах →

2 блока питания Corsair CMPSU-1200AXEU для тестового стенда предоставлены компанией Corsair

Корпус Corsair Obsidian 800D-Full Tower для тестового стенда предоставлен компанией Corsair

Модули памяти Corsair Vengeance CMZ16GX3M4X1600C9 для тестового стенда предоставлены компанией Corsair

Corsair Hydro SeriesT H100i CPU Cooler для тестового стенда предоставлен компанией Corsair

Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт

Системная плата Asus Sabertooth X79 для тестового стенда предоставлена компанией AsusTeK

Системная плата MSI X79A-GD45(8D) для тестового стенда предоставлена компанией MSI

Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate

Накопитель SSD OCZ Octane 512 ГБ для тестового стенда предоставлен компанией OCZ Russia

2 накопителя SSD Corsair Neutron SeriesT 120 ГБ для тестового стенда предоставлены компанией Corsair