Nvidia Geforce GTX 780 Ti

Мощнейший ответ на «Гавайи» — новый однопроцессорный король в 3D


Содержание

Не успели отгреметь залпы фейерверков по поводу запуска новых флагманов AMD, как «зеленоватый краб» (детали смотреть здесь) резко активизировался и мощным движением клешни погнал ранее приготовленный шар в свою норку. Почему ранее приготовленный? Да потому, что, если уйти от аллегорий, уже в трех продуктах для игрового рынка используется один и тот же чип (ядро) — GK110. Он и в GTX 780, и в GTX Titan. И теперь он же в GTX 780 Ti. Просто с разными степенями «обрезанности». Полноценный (если вести речь о вычислениях с двойной точностью) GK110 идет исключительно в рабочие станции Tesla. В остальном можно сказать, что GTX 780 Ti имеет ядро GK110 со всеми рабочими блоками.

О деталях, как обычно, расскажет Алексей Берилло.

Часть 1: Теория и архитектура

Было понятно, что после выхода топовой видеокарты Radeon R9 290X компании AMD ее конкурент, калифорнийская компания Nvidia, обязательно выпустит еще более мощное решение. Да, номинально Radeon R9 290X не превзошла эксклюзивную модель Geforce GTX Titan по производительности, да и в сражении с Geforce GTX 780 она не всегда побеждает. Однако Nvidia вряд ли потерпела бы посягательство на лидерство от представителя конкурента на базе видеочипа Hawaii, ведь возможности их лучшего графического процессора GK110 были не исчерпаны даже в GTX Titan, основанном на таком чипе с частично отключенными исполнительными блоками.

По этой причине почти сразу после выхода топовой платы конкурента компания Nvidia на одном из своих мероприятий анонсировала скорый выход еще более мощной модели — Geforce GTX 780 Ti, которую мы сегодня и рассмотрим. Видеокарта модели Geforce GTX 780 Ti является самым мощным решением компании для тех, кто хочет играть в требовательные игры при максимальных настройках качества и в самых высоких разрешениях, включая Ultra HD. На момент своего выхода эта модель обеспечивает максимальную производительность в 3D-играх среди одночиповых видеокарт.

Чтобы добиться этого, в Geforce GTX 780 Ti применяется новая ревизия графического процессора GK110 с активными потоковыми вычислительными ядрами в количестве 2880 штук, что даже больше, чем у дорогущего эксклюзива GTX Titan! В число других улучшений, которыми отличается GTX 780 Ti, входит и повышенная до 7 ГГц эффективная частота работы видеопамяти, позволившая серьезно увеличить ее пропускную способность, а также более совершенная система управления питанием и частотой GPU, которая позволяет видеочипу работать на максимально возможной в текущих условиях частоте.

При этом, благодаря весьма энергоэффективной графической архитектуре Kepler, а также некоторым доработкам в последней ревизии видеочипа GK110 и примененной эффективной системе охлаждения, Geforce GTX 780 Ti остается достаточно тихой и прохладной видеокартой для своего уровня производительности. Это особенно важно для набирающих популярность компактных системных блоков, которые имеют жесткие ограничения по питанию, тепловыделению и шумности системы охлаждения. Geforce GTX 780 Ti вполне может применяться в данных решениях: пусть эта модель потребляет немало энергии, но она вполне соответствует требованиям по питанию и охлаждению даже для использования в таких ПК.

Однако не будем забегать слишком далеко вперед и рассмотрим все особенности новой видеоплаты подробнее. В связи с тем, что рассматриваемая сегодня видеокарта Nvidia Geforce GTX 780 Ti основана на базе графического процессора GK110 архитектуры «Kepler», о которой мы уже не раз подробно рассказывали, то читателям будет полезно ознакомиться со статьями о более ранних моделях графических решений компании:

  • [23.05.13] Nvidia Geforce GTX 780 — урезанная версия GTX Titan, ускоритель премиум-класса;
  • [18.03.13] Nvidia Geforce Titan — новый однопроцессорный флагман 3D-графики игрового класса;
  • [22.03.12] Nvidia Geforce GTX 680 — новый однопроцессорный лидер 3D-графики.

Рассмотрим подробные характеристики анонсированной сегодня видеоплаты Geforce GTX 780 Ti, основанной на полной версии топового графического процессора компании Nvidia.

Графический ускоритель Geforce GTX 780 Ti

  • Кодовое имя чипа GK110;
  • Технология производства 28 нм;
  • 7,1 миллиардов транзисторов;
  • Унифицированная архитектура с массивом процессоров для потоковой обработки различных видов данных: вершин, пикселей и др.;
  • Аппаратная поддержка DirectX 11 API, в том числе шейдерной модели Shader Model 5.0, геометрических и вычислительных шейдеров, а также тесселяции;
  • 384-битная шина памяти, шесть независимых контроллеров шириной по 64 бита каждый, с поддержкой GDDR5-памяти;
  • Частота ядра 875 (турбочастота — 928) МГц;
  • 15 потоковых мультипроцессоров, включающих 2880 скалярных ALU для расчетов с плавающей запятой одинарной точности (FP32) в рамках стандарта IEEE 754-2008 и 960 ALU для расчетов с плавающей запятой двойной точности (FP64), работающих с темпом 1/8 (а не полноскоростными, как в GTX Titan;
  • 240 блоков текстурной адресации и фильтрации с поддержкой FP16- и FP32-компонент в текстурах и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов;
  • 6 широких блоков ROP (48 пикселей) с поддержкой режимов сглаживания до 32 выборок на пиксель, в том числе при FP16- или FP32-формате буфера кадра. Каждый блок состоит из массива конфигурируемых ALU и отвечает за генерацию и сравнение Z, MSAA, блендинг;
  • Интегрированная поддержка RAMDAC, двух портов Dual Link DVI, а также HDMI и DisplayPort;
  • Интегрированная поддержка четырех мониторов, включая два порта Dual Link DVI, а также HDMI 1.4a и DisplayPort 1.2;
  • Поддержка шины PCI Express 3.0.

Спецификации референсной видеокарты Geforce GTX 780 Ti

  • Частота ядра 875 (928) МГц;
  • Количество универсальных процессоров 2880;
  • Количество текстурных блоков — 240, блоков блендинга — 48;
  • Эффективная частота памяти 7000 (1750×4) МГц;
  • Тип памяти GDDR5, 384-битная шина памяти;
  • Объем памяти 3 ГБ;
  • Пропускная способность памяти 336 ГБ/с;
  • Вычислительная производительность (FP32) 5,0 терафлопс;
  • Теоретическая максимальная скорость закраски 42 гигапикселя в секунду;
  • Теоретическая скорость выборки текстур 210 гигатекселей в секунду;
  • Два разъема Dual Link DVI-I, один Mini-HDMI, один DisplayPort 1.2;
  • Шина PCI Express 3.0;
  • Типичное энергопотребление (TDP) 250 Вт;
  • Один 8-контактный и один 6-контактный разъемы питания;
  • Двухслотовое исполнение;
  • Рекомендуемая цена для рынка США — $699 (для России — 24990 руб).

Название новой платы соответствует системе наименований, принятой в рамках текущего семейства Geforce GTX 700. Nvidia дала самой быстрой своей видеокарте такое же наименование, что и менее мощной GTX 780, но добавила к нему суффикс «Ti» (не путать с Titan!). Новинка Geforce GTX 780 Ti будет продаваться в США за $699 (у нас — за 25 тысяч рублей, с учетом налогов и дополнительных расходов). Она располагается в линейке компании Nvidia над Geforce GTX 780, а поступление модели на наш рынок ожидается после 15 ноября.

Несмотря на мощную новинку, Geforce GTX Titan, за который просят аж $1000, продолжит существовать в параллельной вселенной продаваться как специализированное решение для CUDA-разработчиков, которым нужна полноскоростная обработка данных в формате с двойной точностью, а также большой объем локальной памяти в 6 ГБ. Тем же, кому не нужны эти возможности, а требуется просто максимальная 3D-производительность, лучше подойдет самая быстрая видеокарта Geforce GTX 780 Ti с увеличенным количеством вычислительных ядер, работающих на более высокой частоте.

Что касается решений компании AMD, которые могут быть конкурентами для представленной сегодня GTX 780 Ti, то тут всё просто. Прямого соперника для новой модели у AMD нет, Radeon R9 290X явно будет несколько медленнее, чем GTX 780 Ti, которая, в свою очередь, должна превзойти в играх даже GTX Titan. Однако несмотря на то, что настоящего соперника для GTX 780 Ti в семействе Radeon R9 не существует, сравнивать новинку мы будем с R9 290X — ближайшей к ней по цене и являющейся топовой одночиповой моделью AMD.

В характеристиках GTX 780 Ti нас немного тревожит лишь то, что объем видеопамяти, по сравнению с GTX Titan, всё-таки урезали, поставив на GTX 780 Ti лишь 3 ГБ видеопамяти, а не 6 ГБ, как у эксклюзивной платы. Да, сегодня такого объема всё еще вполне достаточно, и разница заметна лишь в сверхвысоких разрешениях, многомониторном выводе изображения или стереорендеринге. Но уже в ближайшем будущем, с распространением игр для следующего поколения консолей, объема в 3 ГБ может уже не хватить. Впрочем, всегда можно надеяться, что выпуск моделей GTX 780 Ti с 6 ГБ видеопамяти наладят партнеры Nvidia, если это не будет строжайше запрещено калифорнийской компанией ради продаж пары десятков плат GTX Titan в год.

Печатная плата референсного варианта Geforce GTX 780 Ti компании Nvidia имеет длину в 10,5 дюймов (267 мм) — ровно такую же, что и у GTX 780. Для вывода изображения на плате установлено два разъема Dual-Link DVI, один HDMI и один DisplayPort 1.2 порт, как и на младшей модели. Для питания видеокарты на ней предусмотрены привычные для топовых моделей разъемы дополнительного питания: по одному 8-контактному и 6-контактному разъему. Дизайн корпуса аналогичен платам GTX Titan и GTX 780 и схож с дизайном двухчиповой видеокарты Geforce GTX 690.

Интересной новой особенностью, связанной с системой питания видеокарты, которая появилась в Geforce GTX 780 Ti, стала функция регулировки (балансировки) питания, весьма важная в случае серьезного разгона видеочипа. Как известно, современные топовые видеокарты получают питание по трем источникам: от 8-контактного и 6-контактного разъемов дополнительного питания, а также по разъему PCI Express. В обычных условиях питание видеокарты, получаемое из этих источников, сбалансировано, но при разгоне видеокарта может требовать гораздо больше питания от одного из трех указанных источников, по сравнению с другими, что может вызвать некоторые проблемы со стабильностью.

Новая функция регулировки питания, появившаяся в Geforce GTX 780 Ti, позволяет направить энергию, получаемую от одного источника к другому. Другими словами, при исчерпании возможностей одного из источников видеокарта будет получать недостающее ей питание из других. Это должно эффективно помогать при серьезном разгоне и может позволить достичь максимально возможной частоты для Geforce GTX 780 Ti по сравнению с предыдущими моделями на этом же GPU: Geforce GTX Titan и GTX 780.

Графическая архитектура

Как и ее топовые предшественники, новая модель Geforce GTX 780 Ti основана на самом сложном графическом процессоре, который получил первое практическое применение в универсальных вычислительных устройствах Nvidia Tesla. Топовый GPU компании поддерживает все возможности, известные со времен GK104 (Geforce GTX 680), и все особенности архитектуры Kepler относятся и к нему в полной мере. Полная версия графического процессора GK110 имеет в своем составе пять кластеров графической обработки Graphics Processing Cluster (GPC), каждый из которых состоит из трех мультипроцессоров SMX:

В целом GK110 состоит из 15 мультипроцессоров SMX, содержащих по 192 вычислительных блока. Каждый мультипроцессор имеет по одному движку PolyMorph Engine и по 16 блоков текстурной фильтрации. Подсистема памяти GK110, лежащего в основе Geforce GTX 780 Ti, содержит шесть 64-битных каналов памяти, что в сумме дает 384-битный доступ к ней. И так как блоки растровых операций ROP «привязаны» к контроллерам памяти, то их количество в данном GPU равно 48 блокам. Объем кэш-памяти второго уровня на весь чип составляет 1,5 МБ.

Модель Geforce GTX 780 Ti основана на графическом процессоре GK110 с 2880 вычислительными ядрами и отличается от всех предыдущих моделей на базе этого чипа тем, что все 15 блоков SMX в GK110, объединенные в пять кластеров GPC, разблокированы и используются в работе. А ведь даже Geforce GTX Titan основан на версии GK110 с одним отключенным мультипроцессором SMX, не говоря уже о модели GTX 780, имеющей еще меньше активных вычислительных блоков. Топовая новинка Nvidia содержит на четверть больше вычислительных ядер, по сравнению с Geforce GTX 780. Количество текстурных блоков TMU в данной версии чипа равно 240 штукам, да и по блокам ROP никаких ограничений нет — работают все 48.

Для того, чтобы это стало возможным, в Nvidia выпустили специальную новую ревизию данного GPU, которая была оптимизирована для достижения лучшей энергоэффективности. С соотношением производительности и потребляемой энергии в видеочипах архитектуры Kepler и так всё весьма неплохо со времени Geforce GTX 680 на базе GK104, но в обновленном GK110 она была повышена дополнительно, что дало возможность обеспечить работу видеочипа на достаточно высокой тактовой частоте при всех разблокированных мультипроцессорах в GPU.

Подсистема памяти Geforce GTX 780 Ti не изменилась по отношению к предыдущим решениям на основе GK110 и она содержит шесть 64-битных контроллеров памяти, что в целом составляет 384-битную шину. Применяется GDDR5-память объемом 3 ГБ (в случае референсных вариантов партнеры компании могут выпустить и 6-гигабайтные варианты). А вот частота видеопамяти в Geforce GTX 780 Ti была повышена даже по сравнению с Titan, и она равна 7000 МГц (эффективная частота), поэтому обеспечивается приличная пропускная способность в 336 ГБ/с, что даже больше, чем у конкурирующей модели AMD Radeon R9 290X, имеющей 512-битную шину памяти. На сегодняшний день данная модель имеет самую быструю видеопамять и максимальную ПСП для одночиповых видеокарт.

Базовая частота GPU в модели Geforce GTX 780 Ti равна 875 МГц, а турбочастота («Boost Clock») составляет 928 МГц. Естественно, новой моделью поддерживается технология GPU Boost 2.0, обеспечивающая работу видеочипа на максимально возможной частоте в различных условиях. При этом Boost 2.0 гарантирует и минимальный уровень производительности, независимый от условий питания и охлаждения в виде базовой частоты, ниже которой частота не снизится. Указанная турбочастота является средней для набора современных игр и 3D-приложений, на которой работает графический процессор этой видеоплаты, а реальная частота в играх будет отличаться для каждого приложения, также она зависит и от условий охлаждения.

Понятно, что Geforce GTX 780 Ti поддерживает все современные технологии компании Nvidia, о которых мы ранее неоднократно писали, в том числе Adaptive VSync и PhysX. Обо всех этих технологиях подробно написано в предыдущих обзорах видеокарты семейства Kepler, ссылки на которые даны в начале страницы. Так как Geforce GTX 780 Ti имеет в основе топовый графический процессор GK110 той же архитектуры, то новая модель предлагает все современные возможности в виде DirectX 11, PhysX, TXAA, адаптивного VSync и других технологий.

Игры и сотрудничество с игровыми разработчиками

Как всегда, аппаратная часть в видеокартах хоть и самая важная, но не единственная. Большую роль играет и программная поддержка, и это касается не только выпущенных вовремя оптимизированных видеодрайверов, чем занимается соответствующий отдел Nvidia, но и сотрудничества с разработчиками игр в виде помощи и удобного инструментария для внедрения современных эффектов, а также помощи по оптимизации игрового кода для собственных решений.

Nvidia является признанным лидером в деле сотрудничества с игровыми разработчиками, у них давно есть множество соответствующих программ, а игровые проекты, выходящие с помощью Nvidia, объединяются в известную программу The Way It's Meant To Be Played (TWIMTBP). Для облегчения труда разработчиков компания недавно вышла с еще одной обобщенной инициативой, получившей название GameWorks, служащей для ускорения и упрощения внедрения новых графических эффектов в игры.

Программа GameWorks включает множество утилит и технологий, это результат работы нескольких сотен инженеров компании Nvidia, работающих над самыми современными и технологичными алгоритмами, связанными с графическими и физическими эффектами. За несколько лет компания собрала лучшие эффекты, утилиты, алгоритмы, движки, библиотеки и т. п. в то, что известно сейчас под названием GameWorks. Более того, в рамках этой кампании инженеры Nvidia продолжают работать вместе с игровыми разработчиками, помогая им внедрять эффекты, исправлять ошибки, улучшать 3D-производительность в их проектах и обучаться новым графическим технологиям.

Результат работы Nvidia в этом направлении, включающий сотрудничество в рамках программы GameWorks, можно увидеть в большом количестве самых современных и популярных игр. Все они получают от сотрудничества с Nvidia дополнительные эффекты, оптимизации производительности, а также другую поддержку. Вот лишь некоторые из последних примеров:

Эффекты, которые вошли в состав вышеперечисленных игр, включают объемные лучи света («god rays») в Assassin’s Creed 4: Black Flag, поддержку физических эффектов GPU PhysX в играх Call of Duty: Ghosts, Batman: Arkham Origins и The Witcher: Wild Hunt, имитацию глобального освещения HBAO+ в Watch_Dogs и почти всех указанных играх, DirectX 11-тесселяцию в большинстве проектов и т. д. и т. п.

Ну а Geforce GTX 780 Ti является, несомненно, лучшей видеокартой для того, чтобы насладиться всеми этими технологиями и эффектами, в максимальном качестве и при любом разрешении рендеринга. А игроки, которые уже обзавелись мониторами Ultra HD (да-да, оба два) могут получить приемлемую производительность в таких играх, как Batman: Arkham Origins и Assassin’s Creed 4: Black Flag именно на мощнейшей модели Geforce GTX 780 Ti или даже на парочке таких видеокарт, объединенных в SLI-систему.

К примеру, в игре Assassin’s Creed IV: Black Flag при всех включенных эффектах: DX11 (тесселяция), HBAO+, тени по алгоритму cfontact-hardening shadows, объемные лучи света god rays, сглаживание методом 2x TXAA и рендеринге в разрешении Ultra HD (3840×2160) потребуется система из пары видеокарт Geforce GTX 780 Ti в SLI, чтобы получить всего лишь около 32 FPS.

А чтобы поиграть в Batman: Arkham Origins со всеми эффектами: тесселяция, HBAO+, улучшенные тени (contact-hardening shadows), глубина резкости (Depth of Field), PhysX (системы частиц, турбулентность и имитация тканей), 4x TXAA сглаживание в разрешении Ultra HD, — также нужны две Geforce GTX 780 Ti — они обеспечат 46 FPS в этой игре. Чего только не сделают энтузиасты ПК-игр, на какие только траты не пойдут ради четкой картинки.

А давайте посмотрим, стоит ли графика в Batman: Arkham Origins того, чтобы потратиться на пару недешевых видеокарт. Во-первых, в этой игре используется технология Nvidia PhysX для создания реалистичных физических эффектов. Игровые настройки дают возможность полного отключения физических эффектов, но гораздо красивее и реалистичнее игра выглядит при PhysX-эффектах, выставленных хотя бы на уровень «Normal», когда включается имитация тканей для персонажей и некоторых объектов: флагов, баннеров, листов бумаги и др. При установке PhysX в положение «High» включаются эффекты модуля APEX Turbulence, которые усиливают эффекты с системами частиц, вроде дыма, снега, пара и тумана.

Хотя «нормальный» режим PhysX (с эффектами имитации тканей) можно включить на системах с любыми видеокартами, полноценные PhysX-эффекты потребуют современной видеокарты компании Nvidia с поддержкой DirectX 11 и видеопамятью объемом от 1 ГБ. При максимальных установках качества (PhysX выставлен в «High», включено сглаживание TXAA, HBAO+, улучшенные тени, тесселяция) и в высоких разрешениях рекомендуется использовать видеокарты уровня Geforce GTX 780 и выше.

Рассмотрим используемые в этой игре эффекты поближе. Имитация тканей PhysX Cloth используется в Batman: Arkham Origins для рендеринга таких реалистичных объектов, как листы бумаги, одежда персонажей, баннеры и плащ главного героя — все эти материалы взаимодействуют с другими объектами подобно настоящим.

Второй интересный эффект — APEX Turbulence. Это аппаратно-ускоренные физические PhysX-алгоритмы, помогающие создать такие эффекты с множеством частиц, как дым, снег, пар и объемный туман. Все они динамически взаимодействуют с окружающим миром, подвержены силам гравитации, ветру, взрывам и др. Более того, спрайты частиц могут отбрасывать тени друг на друга и на окружение по алгоритму particle shadow mapping, что придает им еще более реалистичный вид.

При рендеринге плаща Бэтмена в игре используется аппаратная тесселяция и наложение карт смещения (displacement mapping), что придает этому предмету одежды дополнительную детализацию и реалистичность. Неоттесселированный плащ имеет гораздо меньше проработанных деталей и выглядит не настолько объемным, так как его складки не могут отбрасывать тень сами на себя. Тесселяция плаща главного героя включается настройкой «Geometry Detail», выставленной в значение «DX11 Enhanced».

Также аппаратная DirectX 11 тесселяция с картами смещения используется и при рендеринге реалистичных деформаций лежащего снега. С выключенной тесселяцией используется попиксельный алгоритм, который дает неплохие результаты, но слишком плоские, без геометрической детализации, которая нужна также и для корректного просчета имитации глобального освещения, чтобы правильно затенять сцену. При включении же тесселяции используются динамические карты смещения, которые деформируют реальную геометрическую поверхность. Поэтому вышеперечисленные проблемы исчезают, следы на снегу приобретают объем, корректно взаимодействуют с тенями и имитацией глобального освещения (ambient occlusion HBAO+).

Эффект имитации глубины резкости в оптике (Depth of Field — DOF) давно применяется в играх, но разные алгоритмы существенно отличаются друг от друга по сложности. Одним из наиболее продвинутых является Nvidia Depth-of-Field (NVDOF) — эта техника способна отрисовывать эффект боке крупного размера при фиксированной производительности. Эффект работает и заметен не везде, но с опцией «Depth of Field», выставленной в «DX11 Enhanced», NVDOF применяется в некоторых сценах игры с приближениями к камере лиц персонажей, гаджетов и т. п.

Для улучшения техники имитации глобального освещения (Screen Space Ambient Occlusion — SSAO) компания Nvidia разработала алгоритм HBAO+, который достаточно быстро выполняется при рендеринге в полном разрешении 1920×1200 на графических процессорах уровня Geforce GTX 660 и выше и особенно эффективен на GPU с поддержкой DirectX 11. Результат работы HBAO+ выглядит даже лучше того, что получается при использовании обычного HBAO, особенно в сценах с тонкими и узкими объектами, вроде листьев и травы.

Алгоритм Nvidia HBAO+ более качественный и менее требовательный к вычислительным ресурсам, по сравнению с аналогичными техниками. Nvidia приводит такие цифры: расчет буфера HBAO+ на Geforce GTX 680 в разрешении 1920×1200 занимает 2,7 мс на кадр, тогда как традиционный алгоритм HBAO требует 9,2 мс в тех же условиях (учитывается время рендеринга всех проходов, требуемых для просчета имитации глобального освещения).

В игре Batman: Arkham Origins при рендеринге теней применяется алгоритм (Percentage-Closer Soft Shadows — PCSS) — техника, дополняющая оригинальный алгоритм проекционных теней. Чтобы его включить, нужно выставить настройку «Dynamic Shadows» в положение «DX11 Enhanced». PCSS применяется ко всем моделям персонажей и обеспечивает несколько улучшений: границы теней сильнее размываются по мере удаления от источника света, используется высококачественная фильтрация карт теней, устраняющая алиасинг, а использование теневого буфера позволяет устранить некорректное перекрытие нескольких теней. Похоже, что на скриншоте для персонажа используется улучшенный PCSS алгоритм, а для других объектов (посмотрите на «зубчатую» тень справа) — упрощенный.

Также в последней игре сериала про Бэтмена применяется полноэкранное сглаживание методом TXAA. Это сравнительно новый метод сглаживания, о котором мы уже писали не раз. Главная его задача — в устранении временны́х артефактов вроде мелькающих пикселей на краях объектов при движении. TXAA — это смесь аппаратного сглаживания и специальной постобработки — временного фильтра (temporal filter). Метод обеспечивает высокое качество сглаживания, но картинка при этом слегка замыливается, что нравится не всем. Отличие TXAA от FXAA в том, что последний призван обеспечить максимальную производительность ценой сниженного качества, а первый — максимальное качество при дополнительных (небольших) потерях в производительности.

Хорошо, есть такие симпатичные игры, как Batman: Arkham Origins и Assassin’s Creed 4: Black Flag, но за них ведь еще платить надо… Первым счастливым покупателям Geforce GTX 780 Ti не надо! Купившие топовую новинку до конца текущего года получат бесплатные цифровые копии игр Assassin's Creed IV: Black Flag, Batman: Arkham Origins и Splinter Cell Blacklist от партнеров компании Nvidia. Так, к самой быстрой одночиповой видеокарте добавились еще три современных игры, в которых применяются последние графические технологии. А североамериканским покупателям Geforce GTX 780 Ti повезло еще больше, при покупке новинки Nvidia до 21 ноября они получат еще и ваучер на скидку $100 для покупки карманной игровой консоли Nvidia Shield.

Geforce Experience 1.7 с новой функцией ShadowPlay

О Geforce Experience (GFE) мы писали в своих статьях уже не раз, со времени ее выхода она была установлена на миллионы игровых систем во всем мире. Это часть драйверов Nvidia, которая обеспечивает дополнительные возможности, не связанные напрямую с работой GPU. Основной задачей GFE является своевременное обновление драйверов для видеокарт Geforce и оптимизация игровых настроек для пользовательской системы, исходя из системных требований игры и конфигурации ПК.

Буквально при помощи одного клика мышью можно оптимизировать графические настройки установленных на пользовательском ПК игр так, чтобы обеспечивалась достаточная производительность при оптимальном качестве картинки. GFE способна найти и установить оптимальные настройки более чем для сотни игр и для всех современных GPU компании, включая Geforce GTX 780 Ti.

Кроме игровых оптимизаций, Geforce Experience также занимается автоматической проверкой обновленных версий драйверов Nvidia, их загрузкой и установкой, что значительно облегчает задачу по обновлению драйверов, оптимизированных для самых современных игр.

Но наиболее интересной возможностью, появившейся 28 октября в последней версии Geforce Experience 1.7, кроме новых профилей, обновленных настроек для игр и других новых возможностей, стал давно обещанный компанией Nvidia инструмент видеозахвата под названием ShadowPlay.

ShadowPlay — это простой бесплатный инструмент для захвата изображения игрового процесса в движении, использующий аппаратный H.264-кодер NVENC, встроенный во все современные графические процессоры, на которых основаны видеокарты Nvidia серий Geforce GTX 600 и 700. Соответственно, в преимущества ShadowPlay входит: минимальное влияние на общую производительность (менее 10%) из-за использования аппаратного блока кодирования видеоданных в Kepler, запись роликов в разрешении 1920×1080 с частотой кадров 60 FPS и битрейтом до 50 МБит/с, неограниченное время записи в ручном режиме (только для Windows 8) и 10–20-минутные ролики в режиме постоянной записи Shadow Mode. Увы, но продолжительность записи в Windows 7 ограничена размером файла в 4 ГБ из-за особенностей этой версии операционной системы.

Наиболее интересен режим Shadow, который записывает игровой процесс постоянно, без нужды в нажатии кнопок при начале записи, в этом режиме просто сохраняются последние 10 или 20 минут (в зависимости от операционной системы) игрового процесса в специальный буфер на накопителе. В любой момент, если в игре произошел какой-то интересный момент, требующий его сохранения (точный снайперский выстрел в сетевом шутере, веселые «баги» с проникновением через стены и т. п.), можно нажать комбинацию клавиш «Alt+F10» для того, чтобы сохранить видео в отдельном файле. А чтобы записать всю игровую сессию, потребуется выбрать ручной режим записи при помощи комбинации клавиш «Alt+F9».

Так как видео сохраняется в обычном H.264-формате, то для дальнейшего его использования и редактирования можно применить любой популярный видеоредактор: Sony Vegas, Adobe Premiere и их бесплатные аналоги, поддерживающие MP4-контейнер и формат H.264. Можно также сразу залить видеофайл и на YouTube, а в будущих версиях Geforce Experience появится возможность интеграции с онлайн-сервисом Twitch.tv, которая позволит пользователям ShadowPlay пересылать записанное на Twitch.

Из-за того, что функция ShadowPlay при работе использует блок аппаратного H.264-кодирования, который встроен во все GPU компании Nvidia семейств Geforce GTX 600 и 700, в минимальных требованиях указана видеокарта Geforce GTX 650, а мобильные GPU пока что не поддерживаются. Возможность записи можно использовать в играх, использующих DirectX 9 и выше. Не слишком мягкие требования к GPU оправданы тем, что аппаратное кодирование имеет явное преимущество по сравнению с программными решениями, использующими ресурсы CPU, такими как FRAPS. Аппаратное кодирование на графическом процессоре снижает общую производительность лишь на единицы процентов даже при записи видеороликов с максимальным качеством, в то время как программные методы обычно требуют куда большего.

Из числа других нововведений в Geforce Experience 1.7 выделим еще несколько функций. Так, Geforce GTX LED Visualizer позволяет настроить пользовательский режим яркости, мерцания и рисунка для светодиодов, подсвечивающих логотипы в таких видеокартах, как Geforce GTX 690, GTX 770, GTX 780, GTX 780 Ti и GTX Titan. А Nvidia GameStream 1.0 дает возможность играть в ПК-игры при помощи игровой консоли Shield, когда изображение рендерится на ПК и по беспроводной сети передается на карманную консоль. Помимо того, начиная с версии Geforce Experience 1.7 в ней появились оптимальные игровые настройки для пары десятков поддерживаемых GFE игр для разрешения 3840×2160 (Ultra HD или 4K). А все выходящие в будущем игры изначально будут иметь оптимальные настройки для этого разрешения в GFE.

Теоретическое сравнение с Radeon R9 290X

Интересно, что в этот раз в своих материалах для прессы Nvidia пошла на прямое и подробное сравнение новинки с конкурентом в лице Radeon R9 290X. Обычно дело ограничивалось парой диаграмм с привычными красными и зелеными столбиками, но в этот раз все достоинства своего продукта и недостатки конкурирующего были расписаны весьма подробно.

К примеру, одним из важнейших достоинств Geforce GTX 780 Ti по сравнению с Radeon R9 290X компания Nvidia считает более высокую энергоэффективность и стабильность при работе на высоких частотах при максимальной нагрузке. При этом приводятся интересные цифры сравнения Geforce GTX 780 Ti и Radeon R9 290X (при расчетах тут используется общее потребление видеокартой, включая видеопамять и другие компоненты, а не только GPU):

По данным Nvidia, модель Radeon R9 290X при максимальной частоте GPU потребляет заметно больше: 290 Вт против 250 Вт у GTX 780 Ti. При этом рассеять тепло, исходящее от GPU, их конкурентам сложнее еще и потому, что графический процессор Hawaii, применяемый в R9 290X, меньше по площади: 455 мм2 по сравнению с 533 мм2 для GK110, на базе которого основана модель Geforce GTX 780 Ti.

Естественно, что с каждого миллиметра поверхности GPU компании AMD приходится отводить большее количество тепла. Неудивительно, что более низкий параметр плотности тепловыделения (соотношения выделяемого тепла к площади чипа) означает более эффективное охлаждение, что выражается в более высоких тактовой частоте и производительности, а также в меньшей шумности вентилятора системы охлаждения. И если установкой более мощного кулера можно как-то отвести выделяемое тепло от Radeon R9 290X, то проблем с шумностью системы охлаждения не решить.

Таким образом, недостаток большей площади чипа, который выражается в повышенной себестоимости производства, Nvidia обратила в фундаментальное преимущество своей графической архитектуры. Иными словами, по словам Nvidia, они чуть ли не специально делают крупные по площади чипы, чтобы добиться лучшего охлаждения и производительности. В результате видеокарта Geforce GTX 780 Ti явно более энергоэффективна, по сравнению с Radeon R9 290X, поэтому она тише и прохладнее. По данным компании Nvidia, GPU в Radeon R9 290X работает на температурах до 95 градусов Цельсия, в то время как температура видеочипа Geforce GTX 780 Ti в тех же условиях не превышает 83 градусов.

Есть и еще один момент, связанный с энергоэффективностью и высоким потреблением, который позволяет Geforce GTX 780 Ti работать на более высоких частотах при мощных вычислительных нагрузках. На следующей диаграмме Nvidia указывает реальную тактовую частоту Geforce GTX 780 Ti и Radeon R9 290X от одного из производителей (в «тихом режиме», что важно), которые рендерят сцены из игры Crysis 3 на протяжении 20 минут в разрешении 2560×1440:

Как отмечает Nvidia, частоты обоих графических процессоров начинаются от отметки в 1 ГГц, но по мере возрастания 3D-нагрузки частоты начинают изменяться, начиная примерно с двухминутной отметки. Видеочип Radeon R9 290X, работающей в тихом режиме, сбрасывает частоту вплоть до 727 МГц, а Geforce GTX 780 Ti, благодаря высокой энергоэффективности и меньшей плотности тепловыделения, продолжает работу на 940 МГц при гарантированной частоте в 875 МГц. И средняя за 20 минут частота GPU в случае Geforce GTX 780 Ti получается заметно выше, чем у Radeon R9 290X: 968 МГц против 799 МГц.

Несмотря на то, что по-хорошему нужно было протестировать Radeon R9 290X еще и в суперрежиме («Uber»), Nvidia выделила важный момент — ведь игроки не бросают играть после пары минут, а делают это на протяжении нескольких десятков минут или даже часов, в отличие от тестов производительности, которые как раз очень редко когда продолжаются больше одной-двух минут. Другими словами, падение частоты ниже 1 ГГц в случае AMD Radeon R9 290X может заметно снизить реальную производительность, по сравнению с тем, что мы видим в коротких бенчмарках на всех сайтах.

Nvidia даже рекомендует «прогревать» тестируемые GPU на протяжении не менее пяти минут, чтобы получить реальную картину производительности, которую увидит конечный пользователь. Кроме того, они утверждают, что их решения с поддержкой GPU Boost обеспечивают гарантированную основную частоту (875 МГц в случае GTX 780 Ti), ниже которой реальная частота не опустится даже в самых плохих условиях, а AMD указывает для своих решений только пиковую частоту, которая никогда не достигается.

Поэтому в реальности разница по производительности между Geforce GTX 780 Ti и Radeon R9 290X (как минимум в тихом режиме) может оказаться даже большей, чем в тестах. Так как частота видеочипа Radeon R9 290X может серьезно снизиться при длительной нагрузке, игроки не получат при этом заявленного компанией AMD уровня производительности. Впрочем, это тема отдельного исследования, требующая времени и внимательного подхода. При этом обязательно нужно исследовать и Uber-режим для Radeon R9 290X.

Предварительная оценка производительности

А теперь переходим к вопросу предварительной оценки производительности нового решения. Модель Geforce GTX 780 Ti основана на том же GK110, что используется в GTX Titan и GTX 780, но имеет 2880 активных вычислительных ядер, что на четверть больше количества математических блоков в младшей модели без суффикса. Есть преимущества перед некогда топовым одночиповым решением и по скорости текстурирования, и по пропускной способности видеопамяти: 336 ГБ/с против 288 ГБ/с.

Давайте сначала оценим теоретическую производительность Geforce GTX 780 Ti, основываясь на пиковых цифрах, полученных из теоретических показателей количества исполнительных блоков и частоты работы GPU.

По большинству пиковых показателей Geforce GTX 780 Ti превосходит все остальные видеокарты, исключая лишь самые мощные двухчиповые решения. Исходя из теории, GTX 780 Ti имеет на 24% большую геометрическую производительность, скорость текстурных блоков на 35% выше и чуть более высокие показатели математической производительности и пропускной способности памяти, по сравнению со своим конкурентом в исполнении AMD.

Естественно, что на диаграмме Nvidia не представлена производительность блоков ROP, которых у Hawaii в Radeon R9 290X на треть больше. А ведь эта разница вполне может негативно повлиять на общую производительность в самых высоких разрешениях и при многомониторном рендеринге.

Но это всё в теории, а во что это теоретическое преимущество Geforce GTX 780 Ti превращается, если смотреть на скорость рендеринга в играх? Сама Nvidia приводит вот такое сравнение по нескольким современным игровым проектам:

Указанные игры запускались на тестовой системе с процессором Intel Core i7-3960X (3,3 ГГц), в высоких настройках, с включенным полноэкранным сглаживанием и в разрешении 2560×1440. Последнее означает, что меньшее количество блоков ROP и меньший объем локальной видеопамяти у Geforce GTX 780 Ti, скорее всего, никак не сказались на средней частоте кадров, по сравнению с Radeon R9 290X.

Итак, благодаря большому количеству активных исполнительных блоков, работающих на высокой частоте, Geforce GTX 780 Ti показывает в протестированных Nvidia играх заметно более высокую производительность, по сравнению с главным конкурентом. Так, Geforce GTX 780 Ti обеспечивает более чем на 40% большую скорость рендеринга в играх Assassin’s Creed 3 и Far Cry 3, а в Batman: Arkham City, Tomb Raider и Metro Last Light преимущество новинки превышает 30%.

В остальных указанных на диаграмме играх Geforce GTX 780 Ti хоть и быстрее, чем Radeon R9 290X, но уже не столь впечатляюще. Так, в Crysis 3 и Battlefield 3 (четвертую часть игры в Nvidia еще не завезли, похоже) преимущество калифорнийской платы составляет лишь 10%. При этом необходимо помнить, что это — оценка Nvidia, то есть одной из заинтересованных сторон, а независимое тестирование игровой производительности вы найдете в третьей части нашего материала.

По нашим предварительным прикидкам получается, что Geforce GTX 780 Ti должна стать самой производительной в 3D-играх графической картой, включая и Radeon R9 290X от конкурента, и Geforce GTX Titan, номинально не входящий в «игровую» линейку и стоящий гораздо больше. Хотя топовая новинка является видеокартой для небедных энтузиастов компьютерных игр и любителей разгона, но она дает лучшие возможности гораздо более широкому кругу потенциальных покупателей, чем это делала GTX Titan в свое время.

Из потенциальных недостатков модели GTX 780 Ti можно выделить лишь сравнительно малый объем видеопамяти в 3 ГБ, которого может быть недостаточно для экстремальных настроек качества в высоких разрешениях, ведь требуемый объем локальной памяти в будущем будет расти вместе с распространением игр для следующего поколения консолей. Остается надеяться, что Nvidia не будет чинить препоны на пути своих партнеров, если те пожелают выпустить модификации GTX 780 Ti с 6 ГБ видеопамяти.

Далее мы переходим к следующей части нашей статьи, которая традиционно посвящена практической части исследования в нашем привычном наборе синтетических тестов, в которых мы сравним производительность новой топовой видеокарты серии Geforce GTX 700 со скоростью близких по производительности и цене решений компаний Nvidia и AMD.



Nvidia Geforce GTX 780 Ti — Часть 2: видеоплаты и синтетические тесты →



Дополнительно

iXBT BRAND 2016

«iXBT Brand 2016» — Выбор читателей в номинации «Процессоры (CPU)»:
Подробнее с условиями участия в розыгрыше можно ознакомиться здесь. Текущие результаты опроса доступны тут.

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.