Исследование масштабирования производительности ATI Radeon HD 5870 в современных играх


Во время выхода первых обзоров обновленной графической архитектуры компании AMD, в лице серии Radeon HD 5800, многие обозреватели высказывали такую мысль, что даже HD 5870 в некоторых случаях может быть ограничен пропускной способностью видеопамяти. Такое предположение делали в своём обзоре и мы.

Действительно, возможности математических и текстурных блоков выросли сильнее, чем частота GDDR5-памяти, по сравнению с предыдущим поколением видеокарт AMD. Плюс к этому производительность HD 5870 бывает довольно близка к скорости HD 5850, что также косвенно указывает на возможную нехватку ПСП старшему решению в некоторых случаях.

Впрочем, наши дальнейшие тесты показали, что не всё так просто и что производительность рендеринга в играх даже на таких мощных решениях зачастую ограничена скоростью математических вычислений и текстурных выборок, а упоры в ПСП не так уж часты. В сегодняшнем материале мы постараемся выяснить, что и насколько сильно ограничивает скорость рендеринга в тестовой системе с четырёхъядерным процессором Phenom II и видеокартой Radeon HD 5870.

В нашем исследовании мы определим, какие параметры больше всего влияют на производительность современных игр, и исследуем зависимость производительности от частот CPU и GPU, а также оперативной и видеопамяти, так как давно этого не делали в своих материалах. Мы решили восполнить недостаток, протестировав в разных условиях видеокарту на основе чипа RV870 и определив основные ограничители скорости рендеринга при использовании набора современных игр.

Конфигурация и настройки тестовой системы

Использовалась следующая программно-аппаратная конфигурация:

  • Процессор: AMD Phenom II X4 940
  • Системная плата: Asus M3A78-T
  • Оперативная память: 4GB DDR2 SDRAM (2*2GB OCZ2N1000SR4GK)
  • Видеокарты: ATI Radeon HD 5870
  • Жесткий диск: Seagate Barracuda 7200.10 320GB SATA
  • Операционная система: Microsoft Windows Vista Home Premium SP2
  • Видеодрайвер: AMD Catalyst 10.6

В качестве центрального процессора системы мы традиционно использовали достаточно мощный четырёхъядерный CPU семейства AMD Phenom II. Он уже не является топовым решением, да и DDR2-память несколько устарела, но мощности системы обычно вполне хватает, чтобы не ограничивать производительность видеоподсистемы в большинстве случаев. Но ещё раз — это всё же не топовый CPU на данный момент, и более дорогие процессоры могут показать большую производительность в протестированных играх. Мы проверим сегодня в том числе и это.

В тестах использовался единственный режим видеонастроек — стандартное высокое разрешение 1920x1080, весьма распространённое сейчас и в ЖК-мониторах с большой диагональю, и в телевизорах. Естественно, так как Radeon HD 5870 является весьма мощной видеокартой, то все тесты проводились с включенными мультисемплингом с четырьмя выборками (MSAA 4x) и анизотропной фильтрацией максимально возможного уровня — 16x. Остальные игровые настройки приложений были выставлены на максимально возможный уровень. Мультисемплинг и анизотропная фильтрация включались при помощи игровых настроек, в тех играх, где это возможно.

Набор игр, использовавшихся в наших тестах, включает многие современные проекты, имеющие встроенную возможность тестирования. Предпочтение отдавалось новым играм, интересным с точки зрения технологий 3D-графики, но некоторые из них были добавлены для большего разнообразия. В играх с поддержкой дополнительных PhysX-эффектов, таковые были отключены.

Вот полный список используемых игр: Crysis Warhead (DX10), Just Cause 2 (DX10), S.T.A.L.K.E.R.: Call of Pripyat (DX11), Batman: Arkham Asylum (DX9), DiRT 2 (DX11), Dark Void (DX9), Far Cry 2 (DX10), World in Conflict (DX10), The Last Remnant (DX9), Resident Evil 5 (DX10).

Дополнительно было решено протестировать псевдоигровой бенчмарк Unigine Heaven в режиме DX11 с включенной тесселяцией, чтобы определить масштабирование производительности рендеринга в зависимости от скорости различных подсистем и в будущих приложениях с полноценной поддержкой этой версии API.

Результаты тестирования

Зависимость производительности от частоты CPU

Для определения зависимости скорости рендеринга от рабочей частоты центрального процессора системы мы изменяли частоту тестового AMD Phenom II X4 940 от 2200 до 3400 МГц с шагом в 400 МГц. Изменение частоты должно вызывать заметное изменение производительности в играх, производительность которых ограничена в основном мощностью используемого CPU. Естественно, не нужно забывать об используемом в тестах сравнительно высоком разрешении рендеринга и включенных анизотропной фильтрации и сглаживании, в других режимах всё будет иначе.

На диаграмме можно сразу отметить те игровые приложения, скорость рендеринга в которых сильно зависит от мощности CPU, в данном случае — его тактовой частоты. Это игры Batman: Arkham Asylum (она упиралась в CPU во многом потому, что сглаживание в ней было отключено), Resident Evil 5, Dark Void и The Last Remnant (обе основаны на движке Unreal Engine 3 и также отличаются невозможностью включения сглаживания из игры), а также стратегия World in Conflict.

В остальных случаях, ограничение мощностью центрального процессора было не таким явным, хотя мизерная разница есть почти всегда. Но оставшиеся игры, похоже, упираются в скоростные показатели видеокарты или, что менее вероятно, в ПСП оперативной памяти.

Для наглядности приведем результаты в другом виде — где за 100% частоты кадров в секунду взята производительность тестовой системы с процессором, работающим на частоте 2200 МГц. А все остальные цифры выше 100% показывают относительный прирост в FPS в каждой отдельной игре.

Подтверждаются ранее сделанные выводы о наиболее процессороёмких игровых приложениях. Набор игр разделился на три группы: сильно зависящие от скорости CPU приложения, средняя группа и слабо зависящие. При росте частоты процессора более чем в полтора раза (с 2200 до 3400), частота кадров игр первой группы выросла примерно на четверть, а во второй группе 15-20%, и в третьей — 1-2%.

Напрашивается вывод, что при использовании столь мощной видеокарты для многих игр из нашего набора мощности тестового CPU уже недостаточно даже для разрешения 1920х1080. И в таких условиях современные игры всё-таки довольно сильно ограничены скоростными характеристиками центрального процессора системы. Хотя наиболее требовательные игры, такие как Crysis Warhead, STALKER: Call of Pripyat, Just Cause 2, отличаются сравнительно низкой требовательностью к мощности CPU, и скорость в них зависит больше от видеокарты, к исследованию параметров которой мы перейдём чуть позже.

Что касается бенчмарка Unigine Heaven, то вполне понятно, что его скорость почти не зависит от мощности CPU, так как наиболее сложная работа в нём возложена на видеокарту, и это приложение должно упираться в скорость GPU, прежде всего. А точнее — в скорость математических блоков.

Зависимость производительности от частоты оперативной памяти

Масштабируемость производительности в играх в зависимости от пропускной способности оперативной (системной) памяти мы рассмотрим, изменяя тактовую частоту ОЗУ от 200 МГц (DDR2-400) до 400 МГц (DDR2-800 МГц) с шагом в 133 МГц. То есть мы использовали четыре значения: DDR2-400, DDR2-533, DDR2-667, DDR2-800. Такое изменение частоты памяти (при прочих неизменных параметрах, вроде таймингов) должно вызвать изменение производительности в тех приложениях, в которых скорость рендеринга заметно зависит от пропускной способностью системной памяти. Мы не думаем, что таких приложений будет много, но проверить это также интересно. Есть ли смысл в дальнейшем повышении ПСП системной памяти, да и переходе на DDR3 память для тестовой системы?

Приложения, сильно зависящие от ПСП оперативной памяти, то есть её частоты, также выделяются сразу. Причём это ровно тот же список, что и был в предыдущей части: Batman: Arkham Asylum, Resident Evil 5, Dark Void, The Last Remnant и World in Conflict. Некоторые из них не используют полноэкранное сглаживание и поэтому не упираются в GPU, а движки других просто весьма процессорозависимы. Причём это ещё с учётом отключенной программной обработки физических эффектов PhysX в Batman и Dark Void...

Посмотрим эти же цифры в другом виде — относительной частоты кадров в разных условиях с изменяющейся частотой оперативной памяти, где за 100% принята средняя частота кадров при частоте ОЗУ 400 МГц:

И снова мы видим три группы, аналогичные полученным ранее в тестах с изменением частоты CPU. Четыре игры явно зависят от пропускной способности системной памяти, при росте её частоты вдвое, прирост в частоте кадров в первой группе достигает 25%. Вторая группа получает прирост от повышенной ПСП в наших условиях порядка 7-10%, а несколько приложений вообще не показывают зависимости от частоты ОЗУ.

В случае масштабируемости скорости рендеринга в зависимости от ПСП системной памяти вывод будет таким: производительность некоторых современных 3D-игр зависит от тактовой частоты ОЗУ, но лишь небольшая часть приложений получает выгоду от очень высокой ПСП. Посмотрите на разницу между DDR2-667 и DDR2-800 — она минимальна. А вот в случае меньших частот, производительность падает гораздо сильнее. Но всё же, слишком большого упора в ПСП системной памяти ни в одной из протестированных игр не отмечено.

Зависимость производительности от частоты видеопамяти

Изменение скорости рендеринга в зависимости от пропускной способности локальной видеопамяти мы исследуем, плавно изменяя её реальную (эффективная в случае GDDR5 будет вчетверо больше) тактовую частоту от 1000 (4000) до 1300 (5200) МГц с шагом в 100 (400) МГц. Подобное изменение частоты видеопамяти должно вызвать плавное изменение производительности в играх, производительность которых ограничена в большей степени именно пропускной способностью (ПСП) видеопамяти или так называемым эффективным филлрейтом, что одно и то же в таких случаях.

И снова, не нужно забывать, что наши результаты относятся исключительно к тестовым условиям: сравнительно высокое разрешение 1920x1080, анизотропная фильтрация максимального уровня и сглаживание MSAA 4x. Разрешение и полноэкранное сглаживание сильно влияют на требовательность 3D-приложений к величине ПСП, и именно в таком случае и можно ожидать упоров в её недостаток. У нас получились следующие результаты:

Приложения, хоть как-то зависящие от ПСП и эффективного филлрейта (частоты видеопамяти в нашем случае), видны невооруженным глазом. Это Batman: Arkham Asylum и The Last Remnant (даже с учётом того, что в обеих играх нет возможности включения полноэкранного сглаживания), Far Cry 2 и, в меньшей степени, DiRT 2 вместе со STALKER: Call of Pripyat.

Что ж, посмотрим те же цифры, но в более удобном виде — относительной частоты кадров в разных условиях с изменяющейся частотой локальной видеопамяти, за 100% принята средняя частота кадров при частоте видеопамяти 1000 (4000) МГц:

На этой диаграмме зависимость от ПСП и филлрейта видна ещё лучше. При росте частоты видеопамяти тестовой видеокарты на 30%, прирост в частоте кадров во многих играх составляет 7-8%. Это не прямая зависимость, безусловно, но она явная. Лишь в случае игр Just Cause 2 и World in Conflict получилось менее 5%, а для Dark Void и Resident Evil 5 — вообще 0%. То есть в ПСП видеопамяти эти приложения не упираются никак.

В целом, большинство современных игр зависит от ПСП в наших условиях в той или иной степени. Но пара игр вообще не показывает зависимости от филлрейта и ПСП. К сожалению, в случае World in Conflict трудно что-то утверждать на 100%, так как встроенный в игру бенчмарк не показывает десятых долей в показаниях достигнутой средней частоты кадров.

Вывод из этого раздела тестов такой: производительность большинства современных 3D-игр на видеокарте Radeon HD 5870 зависит от тактовой частоты видеопамяти, а значит и от показателей эффективного филлрейта и ПСП, пусть и не слишком сильно. И всё же, большая часть проектов в условиях нашего тестирования была ограничена скоростью видеопамяти, хотя изменение ПСП в них и не даёт прямо пропорционального ускорения.

Зависимость производительности от частоты GPU

Ну и последним тестом будет проверка зависимости средней частоты кадров в секунду от тактовой частоты видеочипа RV870, установленном на тестовой видеокарте Radeon HD 5870. Тактовую частоту GPU мы изменяли от 750 до 900 МГц с шагом в 50 МГц. Такое изменение частоты видеочипа должно вызывать изменение производительности в тех игровых проектах, скорость рендеринга в которых по большей части не ограничивается пропускной способностью видеопамяти и эффективным филлрейтом и не упёрто в CPU, а зависит от скорости текстурирования (количества и частоты блоков TMU), математических вычислений (блоки ALU, потоковые процессоры), а в редких случаях также и других операций (triangle setup, input assembler и т.п.), за которые отвечает видеочип.

Понятно, что мы говорим исключительно о разрешении 1920x1080 с включенными анизотропной фильтрацией (что тоже важно, так как мы проверяем зависимость в том числе и от производительности TMU) и полноэкранным сглаживанием (увеличивается зависимость от производительности блоков ROP). Но, судя по предыдущим исследованиям, в современных играх скорость рендеринга часто зависит именно от математической мощи GPU, от скорости его потоковых процессоров. Проверяем:

Наиболее зависимыми от частоты GPU стали: игра STALKER: Call of Pripyat и бенчмарк Heaven, что неудивительно. Затем идут Batman, DiRT 2, Far Cry 2, ну и все остальные. Менее всего зависят от частоты видеочипа игры с устаревшими движками: Dark Void и Resident Evil 5, они больше упираются в CPU и RAM, судя по всему. Для того чтобы убедиться в сделанных нами выводах, посмотрим цифры относительной производительности в более удобном виде, когда за 100% принят средний FPS при частоте GPU равной 750 МГц:

Так и есть, лидером по зависимости от математической и текстурной мощи видеочипа идёт игра STALKER, и лишь немного от неё отстаёт бенчмарк Unigine Heaven. В этот раз чёткого разделения на группы просто нет, все игры зависят от скорости GPU в той или иной степени. Хотя есть сильно зависящие от частоты GPU, средне-зависящие и две указанные игры, упирающиеся в CPU/RAM. Любопытно, что при изменении рабочей частоты чипа на 20%, максимальный прирост составил около 13-14%, а чаще всего и того меньше — 5-10%. Другими словами, зависящих исключительно от мощи GPU игр в наборе нет.

Поэтому и вывод будет такой: для видеокарты Radeon HD 5870 в тестовом разрешении с включенными анизотропной фильтрацией и сглаживанием упор в производительность блоков TMU, ALU, ROP и др. хоть и весьма значительный, но ограничения скорости рендеринга часто бывают вызваны и упором в производительность CPU и пропускную способность системной и видеопамяти, что было обнаружено в предыдущих частях.

Выводы

Выводы отдельно по играм:

  • Crysis Warhead — как ни странно, но производительность в этой игре зависит практически от всего. Но заметнее всего, относительно других игр, зависимость от пропускной способности видеопамяти, то есть эффективного филлрейта. Ну и от производительности универсального процессора системы, как ни удивительно. При изменении частоты видеопамяти на 30% производительность увеличилась на 7%, что близко к максимуму среди всех приложений. А при увеличении частоты CPU на 55%, скорость рендеринга возрастает на 16%. Зависимость от мощности GPU тоже явно выражена — при увеличении его частоты на 20%, производительность выросла на 6%. Изменение пропускной способности системной памяти на 100% вызвало повышение производительности на 10%.


  • Just Cause 2 — эта игра отличается требовательностью исключительно к возможностям видеокарты и не упирается в CPU и RAM вовсе (менее 1% роста скорости при 55% и 100% изменении в частотах). Just Cause 2 получает почти одинаковый прирост скорости от увеличения пропускной способности видеопамяти и производительности видеочипа (математические операции и текстурные), но не слишком большой. Увеличение частоты чипа на 20% приводит к росту средней частоты кадров в секунду на 5%, а увеличение ПСП видеопамяти на 30% даёт такое же ускорение. Меньше всего влияния оказывает частота ОЗУ — 0% при двукратном изменении её частоты.


  • S.T.A.L.K.E.R.: Call of Pripyat больше всего ускоряется при увеличении частоты видеочипа и несколько меньше — от изменения ПСП видеопамяти. Мощность CPU и пропускная способность ОЗУ не влияет на показанные в этой игре результаты вовсе (лишь 0-2% прироста, чем можно пренебречь). А вот скорость GPU весьма важна, при увеличении его частоты на 20%, игра ускоряется на целых 14%, что является рекордом среди протестированных игр. Увеличение ПСП видеопамяти на 30% даёт 7%-ное ускорение, что также немало.


  • Far Cry 2 отличается тем, что наибольшее влияние на производительность в игре оказывает пропускная способность видеопамяти, то есть эффективная скорость заполнения. Довольно сильно игра зависит и от мощности GPU, средне — от ПСП оперативной памяти. В случае ПСП VRAM рост частоты видеопамяти на 30% даёт 9%-ный прирост в FPS, а +20% к частоте GPU вылились в 7% прироста к частоте кадров в секунду. От скорости CPU игра почти не зависит, при ускорении процессора на 55%, скорость рендеринга в игре возрастает лишь на 2%. ПСП ОЗУ влияет на средний FPS не слишком сильно — +11% к FPS при увеличении частоты системной памяти на 100%.


  • World in Conflict — в этой слегка устаревшей стратегии бенчмарк абсолютно точно ограничен, прежде всего, производительностью центрального процессора и системной памяти, остальные параметры влияют на скорость в значительно меньшей степени, а ПСП видеопамяти менее всего. Рост частоты CPU на 55% дал преимущество в средней частоте кадров в секунду на четверть, а вот ускорение видеочипа на 20% привело лишь к 4% преимущества в скорости. Рост частоты видеопамяти на 30% дал прирост всего 2% к FPS, зато двукратное повышение ПСП оперативной памяти ОЗУ — целых 26% дополнительной скорости.


  • Dark Void продолжает список процессорозависимых игр в условиях нашей тестовой системы. Больше всего скорость рендеринга в этой игре зависит от частоты CPU. В меньшей степени производительность ограничена ПСП оперативной памяти. А вот в мощность блоков GPU и ПСП видеопамяти игра не упирается вообще. Видимо, сказывается её мультиплатформенность и простота графики. Итак, при изменении частоты CPU на 55%, средний FPS в игре возрос на 27%, что близко к максимальному значению среди всех игр, а вот увеличение частоты GPU на 20% дало лишь 2%-ное ускорение. Двукратный рост ПСП системной памяти дал 21% преимущества, а увеличенная на 30% ПСП видеопамяти не вызвала изменений в производительности вообще.


  • Batman: Arkham Asylum — вторая игра, использующая Unreal Engine, и у неё снова нет чётко выраженной зависимости от какого-то определённого параметра, которые мы изменяли в исследовании. Но более всего, скорость рендеринга в Batman зависит от мощности CPU. Увеличение его частоты на 55% привело к 19%-ному росту FPS, а изменение ПСП системной памяти привело к увеличению скорости на 11%. Но и от мощности математических и текстурных блоков зависит FPS в этом случае: 20% ускорения GPU даёт +7%, а увеличение ПСП видеопамяти — 8%, что довольно много.


  • DiRT 2 — одна из наиболее современных игр обзора, использующая многие возможности нынешних видеочипов, поэтому наибольший упор скорости рендеринга наблюдается в случае изменения частоты GPU — её рост на 20% вызвал повышение FPS на 9%. Зависит скорость смены кадров в DiRT 2 и от эффективного филлрейта, повышение частоты VRAM на 30% даёт +7% к производительности. Даже от повышения ПСП системной памяти игра получает приличный прирост — до 7%, а вот изменение частоты центрального процессора не приводит к заметному ускорению — лишь 1%.


  • Resident Evil 5 — хоть игра не слишком старая и имеет движок с поддержкой DirectX 10, она мультиплатформенная и соответственно, графика в ней довольно простая. Поэтому Resident Evil 5 явно зависит от мощности системных комплектующих: CPU и RAM, а скорость GPU и ПСП видеопамяти почти не влияют на общую производительность. Посмотрим цифры: максимальный среди всех игр бонус от изменения частоты CPU — 30%, максимальный рост FPS от увеличения ПСП системной памяти — 26%, и всего лишь 3% и 0% от изменения частот GPU и VRAM.


  • The Last Remnant — очередная игра на Unreal Engine 3, она также показывает упор в производительность уже давно не топового центрального процессора тестовой системы. Но что интересно, ещё больше скорость в этом проекте зависит от ПСП оперативной памяти и есть определённое влияние частоты GPU и VRAM. Увеличение частоты CPU на 55% дало результат в виде 14%-ного увеличения FPS (средний показатель), а двукратная разница в частоте RAM — 22%. С видеочастью хуже: 20%-ное ускорение GPU дало лишь 5% прироста. А вот от филлрейта скорость зависит больше, усиление ПСП видеопамяти на 30% ускорило рендеринг в этой игре на 8%.


  • Heaven — единственное приложение в исследовании, которое не является игровым. Оно показало значительную зависимость от скорости видеочипа (обработки математических и текстурных данных) и пропускной способности VRAM. От мощности центрального процессора системы и ПСП системной памяти Heaven не зависит вовсе, разница в обоих случаях составила лишь 1%. Этот 3D-бенчмарк заметно зависит от частоты GPU, рост частоты видеочипа на 20% дал в наших условиях 13%-ный прирост количества кадров в секунду, что говорит о явном упоре в математические и/или текстурные блоки. Но и частота локальной видеопамяти также влияет на производительность, рост ПСП на 30% даёт 8% разницы в скорости.

Общие итоги по всему набору игр:

  • Большая часть из использованных в тесте игровых приложений, заметно зависит от мощности центрального процессора и пропускной способности оперативной памяти. Но всё же, самые современные игры получают наибольший прирост производительности от повышения частоты видеочипа, которое сказывается на математической производительности, а также скорости текстурирования. ПСП видеопамяти (частота видеопамяти) и величина эффективного филлрейта также могут ограничивать частоту кадров в некоторых играх.


  • То есть какого-то единственного упора нет, все игры ведут себя по-разному, в зависимости от того, мультиплатформенный это проект или нет и насколько давно он вышел. Но разделить их всё же можно. Приложения с более качественной и современной 3D-графикой чаще всего упираются в мощность видеочипа, в скорость математических и текстурных вычислений, а мультиплатформенные проекты, наоборот, больше зависят от мощности CPU и скорости RAM.


  • Один из важных выводов: вышедший полтора года назад четырёхъядерный AMD Phenom II X4 940 обеспечивает производительность, которой уже не хватает для большинства протестированных игр, три из которых явно упираются в CPU, и ещё три менее заметно. Даже в не самых простых условиях высокого разрешения и включенных анизотропной фильтрации и сглаживания. В связи с чем конфигурацию данной вспомогательной тестовой системы (не путать с основной, использующейся на нашем сайте) явно необходимо обновить.


  • И ещё одна мысль, связанная не только с участвовавшим в тестах HD 5870: одно лишь увеличение количества потоковых процессоров и частоты GPU в будущих решениях может не давать значительного прироста производительности без усиления мощности и остальных подсистем. А особенно важно соответствующее увеличение ПСП видеопамяти, которая ограничивает скорость рендеринга в нескольких тестовых приложениях. И уж тем более ПСП будет важна в ещё более жёстких условиях, чем наши тестовые (например, 2560х1600 и 8x MSAA или стереорендеринг).



Благодарим компанию
AMD Russia
и лично Кирилла Кочеткова
за предоставленный тестовый стенд
на основе процессора Phenom II X4 940






Дополнительно

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.