Многоядерные процессоры в 3D играх

Два четырёхъядерных CPU и мощная видеокарта



Это уже третье исследование темы производительности многоядерных процессоров в трёхмерных играх, опубликованное в нашем разделе. В первой статье был лишь один двухъядерный процессор, с момента её публикации прошло уже более двух лет. С тех пор произошло много изменений, место верхних моделей центральных процессоров обоих производителей x86 CPU заняли четырёхъядерные варианты, а компания AMD выпустила и продолжает выпускать довольно удачные модели с тремя рабочими ядрами.

Распространение многоядерных CPU и увеличение доли мультиплатформенных игр и портированных приложений с современных консолей, привели к увеличению доли игровых приложений, использующих возможности уже не просто двухпроцессорных систем, но и многопроцессорных. Напомним, что игровая консоль Microsoft Xbox 360 основана на трёхъядерном CPU с виртуальной многопоточностью (всего шесть потоков), а Sony PlayStation 3 — на процессоре Cell, состоящем из одного универсального ядра и нескольких вычислительных элементов.

Да и в современных ПК уже нет одноядерных процессоров, только двухъядерные, а для мощных игровых ПК — трёхъядерные или четырёхъядерные. И любопытным читателям всегда интересно, какую пользу игры получают от второго, третьего и четвёртого ядер CPU в современных 3D играх. Во второй части исследования у нас уже были тесты одного из первых четырёхъядерных CPU от Intel, а в данной статье мы продолжим исследование прироста частоты кадров в современных играх в зависимости от количества имеющихся ядер CPU.

В отличие от предыдущей статьи, в этот раз наша тестовая система отличается одной из наиболее производительных двухчиповых видеокарт. Она выбрана для того, чтобы определить необходимость в многоядерных процессорах не только для игровых систем с видеокартами средней и вышесредней мощности, но и для топовых видеосистем на основе двух и более GPU. Также мы сравним поведение игр на системах, основанных на CPU производства компаний AMD и Intel.

Конфигурация и настройки тестовой системы

Использовались две программно-аппаратные конфигурации:

  • Процессор: AMD Phenom II X4 940/Intel Core 2 Quad Q6600
  • Системная плата: Asus M3A78-T/Foxconn X38A
  • Оперативная память: 4GB DDR2 SDRAM (2*2GB OCZ2N1000SR4GK)
  • Видеокарта: ATI RADEON HD 4870 X2
  • Жесткий диск: Seagate Barracuda 7200.10 320GB SATA
  • Операционная система: Microsoft Windows Vista Home Premium

В качестве процессоров были взяты популярные четырёхъядерные модели от компаний AMD и Intel. Не для прямого сравнения друг с другом, а для относительного анализа. Тестирование проводилось при помощи отключения ядер четырёхъядерных процессоров, а у этого метода есть свои недостатки. Так, на Phenom II отключение отдельных ядер корректнее из-за «склеенности» Core 2 Quad из двух половинок и соответствующих особенностей взаимодействия ядер с кэш-памятью. Зато у Phenom II кэш-память L3 общая, и отключить её часть нельзя. Вот и проверим, сказывается ли это на результатах игровых тестов.

В прошлый раз мы заметили, что установка использования конкретных ядер CPU при помощи «Set affinity» в Диспетчере задач Windows не даёт корректных результатов при тестировании, так как некоторые игры определяют физическое количество ядер процессора при запуске или инициализации, и при дальнейшем запрете использования некоторых из ядер процессора, это приводит к тому, что на одном ядре запускаются сразу несколько потоков приложения. В результате производительность может получиться даже ниже, чем покажет реальная система на основе CPU с соответствующим количеством ядер.

Поэтому, для отключения процессорных ядер использовался встроенный в операционную систему метод изменения количества доступных ОС и приложениям процессоров при помощи утилиты bcdedit (аналог файла boot.ini в Windows XP, отсутствующий в Windows Vista). Так, чтобы использовать в Vista лишь два процессора, нужно выполнить в командной строке:

bcdedit /set {current} numproc 2

После перезагрузки система и приложения будут видеть только заданное число ядер (процессоров), что почти аналогично физическому наличию, за исключением указанных выше по тексту некоторых различий, специфичных для четырёхъядерных процессоров AMD Phenom II и Intel Core 2. И уж точно это аналогично отключению части ядер из BIOS, что возможно для некоторых системных плат.

Настройки видеодрайверов использовались устанавливаемые по умолчанию. Игровые приложения запускались в двух тестовых разрешениях: 1280x720 и 1920х1080 — это стандартные HD режимы для распространенных ЖК-мониторов и телевизоров, или близкие к ним.

Тесты проводились исключительно с использованием анизотропной текстурной фильтрации уровня 16х и антиалиасинга MSAA 4x из игровых настроек, если такие поддерживаются самим приложением. Влияние процессорной мощи было бы заметней в случае отключенных анизотропной фильтрации и антиалиасинга, но это противоречит цели нашего тестирования в реальных условиях, ведь на мощных системах играют с высокими настройками качества изображения.

Набор игр, использовавшихся в исследовании, включает и приложения со встроенными стандартными бенчмарками, часто используемых в статьях, и некоторые игры, не предоставляющие стандартных средств для измерения производительности. Поэтому в части игр использовался метод измерения производительности при помощи программы FRAPS, имеющий некоторые недостатки, отмеченные в наших статьях. Но для одноразового тестирования такой метод подходит, хотя погрешность такого тестирования и выше, чем при обычных методах.

Результаты тестирования

Crysis: Warhead

Это продолжение игры Crysis вместе с оригинальным проектом является вершиной технического прогресса во многих областях 3D игр, в том числе и использовании многопроцессорных систем. К сожалению для нашего тестирования, производительность рендеринга в Crysis: Warhead ограничена мощностью видеокарты, прежде всего. И даже представленная в нашем тесте сцена на открытом пространстве, с большим количеством геометрии и наличием физических взаимодействий, больше упирается в мощность видеокарты, а не центрального процессора.

Но не будем раньше времени печалиться, ведь в этом исследовании мы использовали одну из наиболее мощных видеокарт. Посмотрим, что дают игрокам многопроцессорные системы в таких условиях. В отличие от предыдущей статьи, в этот раз мы включили игровые настройки на максимально возможный уровень, и не отключали мультисэмплинг, поэтому FPS должен быть низким. Рассмотрим сразу две диаграммы, для разрешений 1280х720 и 1920х1080:

Как видим, хотя Crysis Warhead сильно загружает в том числе и центральный процессор системы, двух процессорных ядер ему в целом вполне хватает. Разница между конфигурациями с 2, 3 и 4 доступными ядрами CPU невелика, и не превосходит несколько процентов. А вот второе ядро действительно сильно увеличивает производительность в тестовых режимах, разница в обоих разрешениях примерно одинакова, то есть явно видно отсутствие упора в производительность видеокарты в более простом режиме.

Скорее всего, основным упором производительности в Crysis Warhead является обработка вызовов D3D API одним потоком на одном ядре CPU. А ускорение на двух ядрах получается за счёт переноса этих вызовов D3D на второе ядро, когда игровые вычисления остаются на первом. Небольшие приросты на 3 и 4 ядрах можно объяснить освободившимися ресурсами для физических и AI вычислений, например. То есть, оптимальным для Crysis Warhead будет быстрый двухъядерный процессор, большего количества ядер игра не требует. Разницы между процессорами AMD и Intel особенной нет, Phenom II немного производительнее, как и должно быть.

В дальнейшем мы ещё не раз увидим, как производительность игровых приложений упирается в то процессорное ядро, которое обрабатывает вызовы функций отрисовки Direct3D API. И в его версиях до Direct3D 10 включительно, просто не существует возможности распараллеливания этих расчётов на несколько потоков. Подобные возможности уже есть на современных игровых консолях и появятся на ПК лишь с выходом DirectX 11 и соответствующих приложений с такой оптимизацией.

Call of Duty 4: Modern Warfare

Modern Warfare — это довольно популярная часть мультиплатформенного сериала, корни движка которой идут ещё от Quake 3 Engine. Правда, модифицированного так сильно, что от него почти ничего уже и не осталось. Несмотря на некоторую техническую отсталость, в игре есть неплохая поддержка мультипроцессорных систем, что обусловлено выходом игры в том числе и на консолях, где без этого приходится нелегко.

По современным меркам игру нельзя считать требовательной к мощности видеокарт, поэтому ещё до анализа тестов можно предположить, что она будет упираться именно в скорость CPU. Кстати, несмотря на то, что вышла уже и следующая часть игры, и осенью 2009 планируется продолжение Modern Warfare 2, больших изменений в движке нет и не предвидится, по причине всё той же мультиплатформенности и фиксированного консольного «железа». Итак, посмотрим на результаты тестов:

В этот раз ситуация отличается от той, что мы видели в предыдущем случае с Crysis Warhead, и разница между конфигурациями с разным количеством ядер в этот раз больше. Очень большой рост производительности наблюдается при сравнении одноядерного и двухъядерного процессоров, когда разница близка к двукратной, но налицо разница и для трёх-, а в случае Core 2 Quad и для четырёх рабочих ядер против двух и трёх соответственно.

Поэтому можно уверенно утверждать, что Call of Duty 4 использует возможности многоядерных процессоров довольно эффективно. То есть, для Call of Duty 4 (да и всех последующих игр серии) вполне можно советовать мощный четырёхъядерный процессор.

Игра, драйверы и система в этом случае очень хорошо распределяют работу по имеющимся ядрам — загружая все четыре ядра CPU, и «прокармливают» даже современные многоядерные процессоры. Хотя нужно сказать, что в этой игре затраты на обработку вызовов функций отрисовки Direct3D сравнительно невелики, видимо поэтому отсутствует явный упор в производительность одного ядра.

Отметим интересную разницу между Phenom II и Core 2 Quad. Нет, дело не в том, что процессор AMD быстрее, это как раз понятно, ведь он дороже и работает на большей тактовой частоте. Речь о том, что в случае Core 2 Quad разница между 3 и 4 ядрами заметно выше, чем у системы на Phenom II. Вывод из этого напрашивается такой: в данном случае мы видим влияние неразделяемого кэша третьего уровня, ведь при отключении ядер Phenom II оставшиеся продолжают использовать весь объём L3 кэша, и теряют в производительности при отключении части ядер не так много. Отсюда и небольшая разница между конфигурациями с 3 и 4 включенными ядрами у системы на AMD.

Race Driver: GRID

Это ещё одна игра, основанная на мультиплатформенном игровом движке. Корни движка Codemasters идут от Colin McRae Rally: DiRT, он отличается тем, что очень хорошо использует возможности многопроцессорных систем. В зависимости от количества процессорных ядер, доступных системе, создаются несколько отдельных потоков для 3D рендеринга, физических расчётов, AI, звуковых данных, подгрузки данных с носителя, Force Feedback и т.д. В конфигурационных файлах есть настройки распределения потоков вплоть до восьмипроцессорных систем.

Естественно, все возможности восьми мощных процессоров игра не может использовать, но путь при распараллеливании работы для CPU разработчики избрали правильный. Игра не особенно требовательна к мощности видеосистемы, и можно ожидать, что её производительность на такой мощной видеокарте упрётся в скорость CPU, и мы снова увидим приросты от третьего и четвёртого ядер тестовых процессоров. К сожалению, в игре нет приемлемых возможностей , и нам пришлось воспользоваться методом измерения средней частоты кадров с использованием FRAPS:

Мы видим почти точное повторение диаграмм предыдущей игры. Действительно, разница между конфигурациями с двумя, тремя и четырьмя включенными ядрами есть на обеих системах, не говоря уже об одноядерных. Игра максимально эффективно использует два ядра в тестовых разрешениях, но и остальные дают приличную прибавку. А одноядерные CPU для GRID совершенно точно плохо подходят, отставая от двухъядерной конфигурации более чем в полтора раза. Снова мы видим полноценное многопоточное приложение, эффективно использующее несколько ядер CPU и не особенно требовательное к GPU.

В предыдущей статье по теме мы определили, что все четыре ядра в GRID загружены работой более чем наполовину в среднем, и почти полностью в пиковых случаях, что явно говорит об ограничении производительности игры именно процессором. В этом исследовании выводы подтвердились, игра способна использовать потенциал современных трёх- и четырёхъядерных процессоров от AMD и Intel. И пусть от третьего и четвёртого ядер прирост не такой большой, но он есть.

Что касается относительного сравнения процессоров AMD и Intel, то тут всё в порядке, Phenom II X4 940 должен быть производительнее Core 2 Quad Q6600 на десяток процентов, вот он где-то так и быстрее. Единственная любопытная деталь относится к сравнению одноядерных конфигураций — в таком случае Core 2 Quad оказывается быстрее своего напарника в данном тесте. Причины этому назвать сложно, впрочем, разница эта остаётся в пределах погрешностей измерений, особенно учитывая метод тестирования с применением FRAPS.

Company of Heroes: Opposing Fronts

Итак, от шутеров от первого лица и автогонок переходим к игре другого жанра. Возможно, в стратегиях от многопроцессорных конфигураций также будет толк и мы сможем наблюдать приличные приросты скорости. Рассмотрим давно известный бенчмарк в игре Company of Heroes, получивший поддержку Direct3D 10 в дополнении Opposing Fronts.

К сожалению, встроенный бенчмарк в игре не отражает игровую производительность, так как показывает скриптовый ролик на движке игры, не относящийся к игровому процессу. Но так как он используется тестерами и подобные ролики нередки в игре, нам всё равно будет интересно посмотреть на разницу в производительности между разными конфигурациями:

Видно, что упор полностью в способности системы, а оба GPU на тестовой плате явно простаивают. В этом случае разница довольно мала даже при сравнении систем с включенным одним и двумя ядрами тестовых процессоров, не говоря уже о более мощных конфигурациях. Прирост от второго ядра присутствует, но весьма небольшой — лишь около 10%. Можно сделать вывод о том, что производительность скриптовых роликов (а возможно и в ходе игрового процесса) в игре Company of Heroes: Opposing Fronts немного ускоряется лишь на двухпроцессорных конфигурациях.

Вероятно, эта часть прироста получается из-за оптимизации видеодрайвера и несколько более эффективного распределения нагрузки от фоновых и системных процессов. Хотя есть ещё такой вариант, что драйвер видеокарты AMD неважно справляется с распараллеливанием задач центрального процессора, ведь в прошлом тестировании у нас была плата Nvidia и разница между одно- и двухъядерной конфигурацией была больше… В любом случае, можно отметить, что для данной игры будет достаточно двухъядерного процессора, а дальнейшее увеличение количества процессоров в системе для этой конкретной игры бессмысленно.

Разницы между процессорами AMD Phenom II и Intel Core 2 Quad почти не обнаружено. Хотя и странно, что процессор Intel в этой игре догнал Phenom II, ведь последний работает на значительно более высокой частоте. Есть вероятность ограничения скорости чем-то иным, не CPU и не GPU, а к примеру, пропускной способностью системной памяти или шины PCI Express.

Need for Speed: Undercover

Need for Speed: Undercover — это очередная игра известной серии, движок которой мультиплатформенный в своей основе, и изначально разрабатывался так, чтобы хорошо работать на многопроцессорных системах. Предыдущая часть отличалась неплохой распараллеленностью, что важно для игровых консолей. Нагрузка на современные GPU при этом невелика, и скорость рендеринга почти всегда ограничена CPU.

К сожалению, в игре также нет абсолютно никаких возможностей по измерению производительности, отсутствуют и возможности записи и проигрывания повторов гонок, поэтому приходится использовать FRAPS метод с большей чем обычно погрешностью. Однако, игра весьма интересна с точки зрения основной темы исследования, она мультиплатформенная, и должна получать преимущество на многопроцессорных системах. Посмотрим, оправдала ли она наши ожидания:

Абсолютно одинаковый результат во всех разрешениях и на разных системах с процессорами от AMD и Intel. И, к сожалению, видна разница разве что между одноядерной и всеми остальными конфигурациями. Разница в случае других конфигураций мизерная, и из-за погрешности тестирования ей можно пренебречь.

Преимущество у многоядерных конфигураций перед одноядерным получилось почти двукратным. А в остальных случаях разницы просто нет, что опровергает наши ожидания. Также возможно, что видеодрайвер AMD снова не смог распараллелить работу более чем на два процессора, так как в предыдущем исследовании разница между трёх- и четырёхъядерными системами была ощутимой, хотя и в предыдущей игре серии.

Получается, что для Need for Speed: Undercover в случае тестовой системы с видеокартой AMD вполне достаточно двухъядерного центрального процессора, а большее количество процессоров она использовать не может.

Процессор Phenom II X4 940 показал чуть лучшие результаты, по сравнению с Core 2 Quad Q6600 в этой игре, но разница весьма мала. Поэтому нам остаётся повторить выводы, сделанные при анализе результатов тестов предыдущей игры, что ограничение скорости рендеринга связано не с мощностью CPU.

Lost Planet

Мультиплатформенная игра, движок которой должен уметь использовать возможности многопроцессорных игровых систем. Данная игра отличается неплохой технологичной графикой, основная нагрузка в которой приходится всё же на видеокарту. Хотя, в случаях большого количества динамических объектов в кадре, количество вызовов функций отрисовки Direct3D возрастает, и вместе с этим увеличивается нагрузка на центральный процессор системы.

Что очень удобно для тестеров, игра содержит встроенный бенчмарк, разделённый на два теста. Первый из них предназначен GPU, второй — CPU. Рассмотрим цифры, полученные в обоих подтестах и в двух тестовых разрешениях, сначала «Snow»:

Ну очень интересные результаты для первой части теста! Мы видим движок, отлично использующий возможности и CPU и GPU. Даже с учётом таких мощных систем, как у нас в тесте, игра редко упирается в одну из составляющих игрового ПК. Так, в разрешении 1920х1080 мы видим явный упор в возможности GPU для конфигураций с 2, 3 и 4 ядрами, но одноядерная отстаёт в полтора раза.

В случае низкого разрешения показаны те же цифры FPS для одноядерной конфигурации, но двухъядерная уже вдвое быстрее, также виден прирост и от третьего и даже от четвёртого ядра, особенно в случае процессора Intel.

Крайне интересно и то, что в 1920х1080 процессор Core 2 Quad показывает чуть более высокий результат, по сравнению с Phenom II. И так как в этом случае производительность упирается в GPU, можно предположить, что система на основе процессора Intel обеспечивает более производительное снабжение данными тестовой видеокарты. Посмотрим, что покажет второй тест, который должен ещё лучше продемонстрировать разницу между конфигурациями:

Так и есть, второй игровой тест, отличающийся большим количеством объектов в кадре, очень сильно ограничен скоростью центральных процессоров, прослеживается очень хорошая масштабируемость вплоть до четырёх ядер, пусть и не достигающая теоретически возможного максимума, но явно лучшая среди всех тестов. В этом случае мощности одного ядра даже не хватает для приемлемой производительности хотя бы на уровне 30 кадров в секунду. А преимущество от включения двух ядер доходит до двукратного.

Видно, что движок игры хорошо распараллелен, и в первой части бенчмарка CPU простаивает в высоком разрешении, когда с подтестом «Snow» справляются и два ядра. Но в случае второй части под названием «Cave», есть явное преимущество даже у четырёхъядерников! Поэтому для систем на основе мощных видеокарт, для Lost Planet можно посоветовать трёх- и четырёхъядерные процессоры.

И ещё кое-что интересное в этот раз — большое преимущество процессора AMD Phenom II X4 940 перед Core 2 Quad Q6600. Ведь обычно разница между показателями составляла около 10-15%, но во втором подтесте Lost Planet процессор Phenom II вдруг обгоняет напарника на целых 25%. Тест «Cave» явно лучше подходит процессорам AMD, то ли из-за большого L3 кэша, то ли по каким-то иным причинам. Правда, сама игра больше похожа на подтест «Snow», так что это преимущество искусственное.

World in Conflict

Это уже вторая стратегическая игра в нашем обзоре, которой выпала возможность показать необходимость в многоядерных процессорах для этого жанра. В игре также есть встроенный бенчмарк, но, в отличие от Company of Heroes, он вполне отражает игровую производительность, хоть и не так кинематографичен.

С точки зрения технологий, это одна из самых интересных и технически продвинутых стратегических игр, она очень сильно нагружает как CPU, так и видеокарту. Вы можете убедиться в этом, глядя на диаграмму — частота кадров на максимальных настройках весьма низка для наших мощных тестовых систем. Очень жаль, что встроенный бенчмарк не показывает десятые доли среднего FPS, нам очень хотелось бы иметь возможность определять производительность точнее.

Но даже так видно, что игра неплохо показывает себя на многопроцессорных системах, хотя и не так, как это было в предыдущей статье с тестовой системой на базе видеокарты Nvidia. Приросты производительности получаются при переходах с одноядерной на двухъядерную и с двухъядерной на трёхъядерную конфигурации. От четвёртого ядра толку есть лишь немного.

Однопроцессорная система отстаёт от двухпроцессорной почти ровно в два раза, что говорит об упоре в производительность универсального процессора в этом случае. Результаты подтверждают выводы предыдущего исследования, игре желателен как минимум двухъядерный CPU, а лучше трёх- или четырёхъядерный.

Сравнение результатов, полученных на тестовых системах с процессорами AMD и Intel, показывает типичный уровень относительной производительности Phenom II и Core 2 Quad. Более дорогой и новый процессор AMD опережает Core 2 Quad в этом тесте на 10-15%, и никаких аномальных результатов нами не обнаружено.

S.T.A.L.K.E.R.: Clear Sky

Это продолжение (точнее — предыстория) оригинальной игры S.T.A.L.K.E.R. Естественно, игровой движок получил множество дальнейших усовершенствований, и его характеристики изменились. Оригинальная игра не была оптимизирована для многопроцессорных систем и использовала лишь одно ядро многоядерников. Проверим, изменилось ли что-то в плане поддержки приложением многопроцессорных систем, или оно продолжает упираться в скорость единственного ядра центрального процессора, как и тот же Crysis: Warhead?

На счастье тестеров, разработчик игры выпустил отдельный бенчмарк S.T.A.L.K.E.R.: Clear Sky, включающий один из последних патчей, его мы и использовали. Смотрим на диаграммы:

Почти ровно то же самое, что и в нашей предыдущей статье, игра очень процессорозависимая. Судя по диаграмме, создаётся такое впечатление, что это тот же S.T.A.L.K.E.R., просто заметно медленней. Наблюдается примерно такой же прирост производительности от второго ядра, и такой же упор в производительность одного ядра CPU в обоих тестовых разрешениях: 1280x720 и 1920х1080.

Хотя при тестировании второе ядро CPU даёт до трети прироста в количестве средней частоты кадров в секунду, такая разница есть только в низком разрешении, в более высоком ситуация немного меняется, и мы видим уже только 20-25% разницы.

Похоже, что лишь одно ядро загружено работой полностью, а остальные выполняют какие-то небольшие задачи: системные и вторичные игровые. Но одного ядра CPU игре всё-таки не хватает, учитывая и так невысокую скорость даже на четырёхъядерниках. Хотя и более двух процессоров игра просто не может использовать эффективно. Следовательно, для Clear Sky лучшим выбором будет быстрый двухъядерник.

В этот раз мы снова видим чуть большую разницу между системами с процессорами AMD и Intel, по сравнению со средней. Phenom II быстрее тестового Core 2 Quad на 20-30% в низком разрешении, что выше среднего значения для игровых тестов. Так что Clear Sky тоже неплохо подходит процессорам AMD, и вполне возможно, что именно из-за большого L3 кэша.

The Last Remnant

Ещё одной мультиплатформенной игрой, в отличие от пары протестированных выше ПК-эксклюзивов, стала игра The Last Remnant, основанная на базе известного движка Unreal Engine третьего поколения. Сначала мы хотели использовать Unreal Tournament 3, но он снова показал свою слабую применимость для тестов. Flyby демки слабо грузят CPU, а botmatch, которые хорошо подходят для CPU тестов, дают слишком большой разброс в результатах.

А вот создатели The Last Remnant сделали отдельный бенчмарк, который не просто визуально интересен, но и позволяет удобно протестировать эту игру. Многим разработчикам поучиться надо, кстати. Игра, как и все другие на основе Unreal Engine 3, весьма неплохо распараллелена и использует возможности многопроцессорных систем. Проверим, так ли это на самом деле:

Получилось гораздо лучше, чем flyby для Unreal Tournament 3 в прошлой статье. Явный упор в производительность GPU виден в высоком разрешении (1920х1080), но польза от второго ядра CPU есть и там, а вот для 1280х720 всё совсем иначе. В низком разрешении скорость увеличивается и при переходе на два ядра, и на три. И только от четвёртого ядра прирост уже совсем небольшой, но даже в таком случае он есть.

Вполне можно назвать эту игру на Unreal Engine процессорозависимой и многопоточной. В условиях отсутствия упора в скорость GPU, она загружает все ядра четырёхъядерника, хотя одно из них больше всего. Так как игра получает ускорение и на трёхъядерных и на четырёхъядерных процессорах, именно их мы и можем посоветовать для данной игры.

При сравнении разных систем с процессорами AMD и Intel, отметим тот интересный факт, что Core 2 Quad показывает себя даже немного лучше, чем Phenom II, а ведь разница должна быть в пользу изделия компании AMD. Получается, что играм на основе Unreal Engine 3 лучше подойдут процессоры Intel.

Far Cry 2

Ещё одной игрой нашего исследования, в котором вы увидели и старые и некоторые новые игры, будет Far Cry 2. Которая не имеет ничего общего с оригинальной Far Cry, кроме названия, и основана на совершенно ином мультиплатформенном движке производства компании Ubisoft, которое активно использует возможности мультипроцессорных систем на ПК и современных консолях.

Игра весьма хороша технологически, несмотря на свою мультиплатформенность, и требовательна как к мощности видеокарты, так и к центральному процессору. Посмотрим, что получается в сравнении конфигураций с разным количеством активных процессорных ядер и в разных разрешениях:

В общем, можно сказать, что основной упор в тестах был не в такую мощную видеокарту, которую мы использовали в тестах. От многоядерных процессоров толк есть, особенно от второго ядра (около 60-70%). А вот между двух-, трёх- и четырёхъядерниками разница намного меньше, хотя и есть небольшая, до 10-15% между каждой из смежных пар. Вероятно, Far Cry 2 также упирается в мощность основного ядра даже современных процессоров Core 2 и Phenom II, по крайней мере при максимальных настройках.

Как и Crysis Warhead и Clear Sky, игра упирается в мощность одного основного ядра CPU, который выполняет вызовы D3D API. Это явно является основным ограничителем скорости для всех технологичных игр. Поэтому делаем вывод о том, что вполне достаточными CPU для данной игры будут двухъядерные модели, но и от трёх- и четырёхъядерников небольшой толк всё же есть.

X3 Terran Conflict

Не самая привычная игра производительности, конечно, но тем она и интереснее. X3 Terran Conflict — это очередная серия ПК-эксклюзивного космического симулятора, которая отличается неплохой графикой и многополигональными сценами. Нам он интересен как игра оригинального жанра, будет полезно узнать, используют ли подобные игры возможности мультипроцессорных систем.

Выпущенный отдельно демо-бенчмарк требователен и к мощности видеокарты и к CPU, но на наших мощных тестовых системах всё-таки будет упираться в центральный процессор. Посмотрим, что получается в сравнении разных конфигураций:

Очень похоже на то, что мы уже видели в случае того же Far Cry 2. Основной упор в тестах X3 был явно в CPU, но не в распараллеленную задачу, а в поток рендеринга. Конечно же, от второго ядра универсального процессора прирост есть, но не такой большой, лишь 30-40% для обоих разрешений. А между конфигурациями с 2, 3 и 4 ядрами разница составляет лишь единицы процентов, что обусловлено скорее переносом системных процессов на свободные ядра. Вывод точно такой же — игра упирается в скорость CPU, но ей хватит и быстрого двухъядерника.

А вот что снова любопытно, так это относительная производительность систем на основе процессоров Core 2 Quad и Phenom II. Игра X3 явно лучше подходит процессорам AMD, наш тестовый Phenom II X4 940 был примерно на 20% быстрее, чем Core 2 Quad Q6600, что немного выше средней цифры их относительной производительности в 3D играх.

Grand Theft Auto IV

И последней игрой нашего исследования будет продолжение сериала Grand Theft Auto, его последняя часть, использующая собственный мультиплатформенный движок. Игра довольно интересна с точки зрения технологий, отличается хорошей графикой и отличной физикой.

Особенность ПК-версии этой игры заключается ещё и в том, что соответствующая версия движка была выполнена неидеально, и игра в основном упирается в CPU, а не в мощную тестовую видеокарту RADEON HD 4870 X2. С другой стороны, от такого проекта можно ожидать активного использования всех возможностей мультипроцессорных систем.

Необходимо написать пару слов о встроенном бенчмарке. Очень хорошо, что разработчики его сделали, но плохо то, что они сделали его так неудачно. Результаты на разных системах очень нестабильные, разброс цифр средней частоты кадров от прохода к проходу может отличаться на десятки процентов. Поэтому нам пришлось тестировать игру по несколько раз, отбрасывая явно некорректные результаты. Итак, смотрим на диаграммы:

Пожалуй, это один из лучших результатов с точки зрения использования возможностей многоядерных CPU в современных играх. Упора в видеокарту нет никогда, скорость всё время ограничена возможностями центрального процессора.

Зависимость от количества имеющихся ядер очень велика, прирост от второго ядра близок к 100%-ному, а третье и четвёртое ядра добавляют где-то по 15-25%, что тоже совсем неплохо. Учитывая и так невысокий FPS, для этой игры можно порекомендовать исключительно четырёхъядерные модели, благо они сейчас стоят уже не так дорого.

Интересно, что процессор Core 2 Quad снова хоть и немного, но таки обошёл Phenom II, особенно в разрешении 1280х720. Разница невелика, но она есть, хотя в среднем тестовый процессор AMD даже быстрее модели Core 2 Quad Q6600 от Intel. То есть, Grand Theft Auto IV — это ещё одна игра, которой лучше подойдёт система на основе процессора Intel.

Выводы

Подведём основные выводы, полученные при анализе результатов тестирования:

  • Зависимость от времени выхода игр прослеживается очень хорошо. Более новые игровые приложения обычно эффективнее используют возможности многопроцессорных систем, получая большую производительность. Хотя есть случаи, где основная часть увеличения производительности относится скорее к оптимизации видеодрайверов под многопроцессорные системы, а также к выполнению потока графического API на дополнительном ядре CPU (не том, которое выполняет игровой код). Но в целом, чем новее игра, тем лучше она оптимизирована для многопроцессорных конфигураций.


  • Характерно, что наибольшие приросты на многоядерных системах получают мультиплатформенные игры, движки которых предназначены и оптимизируются в том числе и под игровые консоли нынешнего поколения: Microsoft Xbox 360 и Sony PlayStation 3. В этих консолях используются многоядерные центральные процессоры (в т.ч. и с виртуальной многопоточностью), поэтому такие игры получают преимущества от многоядерных CPU и на ПК тоже.


  • Современные игровые приложения используют несколько потоков, исполняющихся на разных ядрах процессора, выделяют потоки для расчётов AI, физических эффектов, динамической подгрузки, рендеринга и т.п. Это говорит о необходимости использования многоядерных CPU в мощных игровых ПК. Но наиболее технологичные ПК-эксклюзивные проекты зачастую упираются в возможности лишь одного ядра CPU, на котором выполняется поток графического API Direct3D. И к сожалению, улучшения ситуации можно ждать лишь с выходом Direct3D 11 приложений, которые будут оптимизированы для многопоточного рендеринга.


  • Хотя до сих пор минимально допустимыми игровыми CPU можно считать производительные двухъядерные модели процессоров, для топовых игровых систем с мощными видеокартами установка трёх- и четырёхъядерных процессоров уже почти обязательна. Пусть большая часть игр использует лишь два ядра CPU активнее всего, и часто скорость упирается именно в производительность одного из них, существует уже довольно много приложений, которые требуют большего. И чем дальше, тем это преимущество многоядерников будет заметней. Ну а для игровых систем средней мощности оптимальным выбором до сих пор остаётся быстрые двухъядерные CPU.



Благодарим компанию AMD Russia и лично Кирилла Кочеткова за предоставленные тестовый стенд на основе процессора Phenom II X4 940 и видеокарту ATI RADEON HD 4870 X2




Дополнительно

iXBT BRAND 2016

«iXBT Brand 2016» — Выбор читателей в номинации «Процессоры (CPU)»:
Подробнее с условиями участия в розыгрыше можно ознакомиться здесь. Текущие результаты опроса доступны тут.

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.