Рендеринг сцен в 3ds max 5.1: топовые x86-процессоры всех архитектур

Часть 2. Final Render Stage-1 и общие выводы по однопроцессорным системам


Напомним, что данная статья не является самостоятельной, она представляет собой продолжение опубликованной нами ранее первой части, посвященной рендерингу с помощью Brazil r/s и встроенного движка 3ds max 5.x Scanline. Вторая часть (что видно из названия) посвящена тестированию скорости рендеринга с помощью внешнего рендера Final Render Stage-1 SP2 и подведению итогов по однопроцессорным системам.

Закончить цикл статей, посвященных скорости рендеринга в 3ds max, мы планируем третьей частью, где будут рассмотрены наиболее популярные варианты двухпроцессорных систем (AMD Athlon MP, Opteron, Intel Xeon), и влияние на скорость рендеринга поддержки «виртуальной многопроцессорности» (Hyper-Threading), присутствующей во всех топовых моделях процессоров Intel Pentium 4.

Тесты в Final Render Stage-1

FR_Caustic


Первая ласточка, но заранее предупредим, что в тестах с использованием Final Render она отнюдь не единственная: верхнюю строчку диаграммы (наилучший результат) неожиданно занял процессор на ядре Prescott — Pentium 4 3.2E ГГц. Ненамного отстал от него eXtreme Edition (та же частота, но старое ядро и большой кэш третьего уровня). Далее плотной группой следуют: самый высокочастотный на данный момент Pentium 4 3.4 ГГц Northwood и оба процессора архитектуры AMD64. Athlon XP 3200+ — в хвосте, но к этому мы уже успели привыкнуть. Здесь наиболее интересен результат соперничества Prescott и eXtreme Edition с равной частотой. Напомним, что eXtreme Edition — это фактически Xeon (Gallatin), то есть «серверный Northwood». Стало быть, проиграть Prescott он мог по двум причинам:

  1. Быстрый одномегабайтовый кэш второго уровня оказался предпочтительнее медленного двухмегабайтового кэша третьего уровня (напомним, что шина L3 у Xeon имеет ширину всего 64 бита).
  2. Архитектура ядра Prescott (та ее часть, что не относится к кэшу), сработала в данном подтесте лучше, чем архитектура ядра Northwood.

Пока остановимся на этом. Конечно, нехорошо так поступать, но раскроем маленькую тайну: окончательный ответ на вопрос, почему Prescott иногда оказывается так удивительно хорош, мы сможем получить только из последней (третьей) части данной трилогии.

FR_Displace


Фэны AMD наверняка вздохнули с облегчением, тут же распечатали диаграмму на цветном принтере, обвели красным цветом результаты любимых процессоров, и повесили на стенку в деревянной рамочке :). Да, в рендеринге сцены с эффектом Displace лидирует платформа AMD. Причем лидирует везде и на топе Athlon 64 3400+, и внизу Athlon XP 3200+ обходит самый высокочастотный Northwood. Остается задуматься: а почему так? Что ж, посмотрим, какие общие закономерности можно отследить в сложившейся картине.

Первая закономерность: в группе Pentium 4 проиграл процессор с самым маленьким общим размером кэша. Вторая закономерность: лучшим из Pentium 4 оказался CPU на ядре Prescott. Третья: в стане AMD Athlon 64 3400+ существенно обгоняет равный ему по частоте и обладающий к тому же двухканальным контроллером памяти Athlon 64 FX-51. Что ж, пожалуй, мы рискнем сделать смелое предположение: все дело в латентности памяти. Это согласуется с тем, что латентность является единственным показателем, по которому Athlon 64 3400+ лучше Athlon 64 FX-51, а также (косвенно) с тем, что Pentium 4 eXtreme Edition оказался немного лучше Northwood, при меньшей частоте: в данном случае, латентность частично компенсировал гигантский кэш третьего уровня. И, в конце концов, это предположение замечательно согласуется с тем, что процессоры архитектуры AMD64 за счет встроенного контроллера памяти стабильно обходят по такому показателю как латентность все Pentium 4. Немного непонятен только результат Athlon XP 3200+ у него-то контроллер памяти внешний! Однако если вспомнить про «хитрый» DASP, встроенный в северный мост NVIDIA nForce2…

FR_GI


Достаточно стандартная картина. Prescott не лучший, но обгоняет Northwood с более высокой чем у него частотой, AMD64 намного лучше «AMD32» :). Но все же не настолько, чтобы выбиться в лидеры.

FR_SSS


Pentium 4 3.2E ГГц (Prescott) и Pentium 4 3.4 ГГц (Northwood) поменялись местами, в остальном картина примерно такая же как во многих предыдущих подтестах (и не только для Final Render): впереди единым блоком платформа Pentium 4 («единым» в том смысле что все процессоры подряд), посередине AMD64, в самом хвосте (и существенно отставая даже от середины) плетется Athlon XP 3200+. Ничего экстраординарного.

FR_Volume_Caustic


Середина в лице AMD64 немного приблизилась к лидирующей подгруппе. В остальном стандартная картина.

FR_Volume_Light


Беспрецедентный результат. Разумеется, проверенный несколько раз. Однако количество проверок может подтвердить правильность, но никак не в состоянии помочь в трактовке. Единственное предположение, которое нам пришло в голову это отсутствие у Athlon XP 3200+ поддержки набора инструкций SSE2. Мы не знаем других различий между этим единственным аутсайдером и всеми остальными процессорами, которые могли бы послужить причиной настолько существенного отставания.

FR_Final


Громадный отрыв Pentium 4 eXtreme Edition в этом подтесте мы объяснить не можем да, он является лучшим и в Final Render / Global Illumination, и в Final Render / Volume Light (оба этих эффекта используются в финальной сцене), но даже по сумме обоих выигрышей такого превосходства быть не должно. А вот разгромный проигрыш Athlon XP 3200+ как раз легко объясним именно присутствием в сцене объемного света (Volume Light) на предыдущей диаграмме мы уже наблюдали, что рендеринг этого эффекта в исполнении Final Render на данном процессоре происходит очень медленно. Прочие четыре процессора выстроились плотной группой, причем Intel чередуется с AMD64. Пожалуй, можно сказать, что если отбросить «копейки» то скорость они демонстрируют примерно одинаковую. А вот на то, что группу середнячков возглавляет Pentium 4 3.2E ГГц (Prescott), все-таки хочется обратить особое внимание.

FR_Preview


«Быстрая» сцена с заниженными установками качества… удивительно хорошо дается платформе AMD! Причем всей без исключения даже старичку Athlon XP 3200+. Весьма интересный результат, наводящий на мысль о том, что нам удалось выявить еще одну особенность во взаимодействии Final Render и платформы AMD.

Подводя итоги

Здесь мы традиционно приведем пару диаграмм с различными вариациями на тему средней температуры по больнице. Разумеется, всем (и нам тоже) понятно, что говорить о корректности выводов, сделанных на основании взвешивания цыплят в одном корыте с бегемотами не приходится. Поэтому мы сами (опять-таки традиционно) предупреждаем читателей: да, это «просто еще одни попугаи».

Начнем с того их варианта, который принято считать наиболее корректным: среднего геометрического от времени рендеринга всех сцен. Напомним, что в нижеследующих диаграммах учитываются результаты тестирований не только второй, но и первой части статьи т.е. диаграммы представляют собой сведение воедино времени рендеринга в группах подтестов Brazil, Scanline и Final Render Stage-1.

Мы не наблюдаем ничего такого, что могло бы удивить внимательно прочитавших обе части данного материала. Впереди все Pentium 4, за ними с явно видимым но не громадным отставанием следуют оба процессора архитектуры AMD64, ну и явный аутсайдер Athlon XP 3200+. Prescott 3.2 ГГц все же обогнал в общем зачете Northwood 3.4 ГГц, и явно за счет результатов в подгруппе тестов Final Render в Brazil и Scanline этот процессор не блистал, нелишним будет об этом напомнить.

Если сложить все результаты между собой, получив таким образом общее время исполнения всех тестов, то Athlon 64 3400+ и Athlon FX-51 вырываются вперед, и им удается обогнать Pentium 4 3.4 ГГц т.е. картина частично изменяется. Причина возможности подобного явления понятна любому, кто понимает разницу между средним геометрическим и просто суммой (а также средним арифметическим т.к. введение общего коэффициента на распределение мест не влияет). Поэтому не думаем, что данный факт нуждается в дополнительных пояснениях это алгебра в рамках средней школы. А какие попугаи кому больше нравятся (красненькие или зелененькие, суммарные или средне-геометрические) это, как говорится, дело вкуса.

Выводы по однопроцессорным системам

Все-таки, нам кажется, имеет смысл расставить точки над «i», пусть это и вызовет раздражение некоторых излишне ретивых поклонников продукции одной из компаний. Итак: в рамках нашей методики исследования производительности финального рендеринга в пакете трехмерного моделирования 3ds max версии 5.1 SP1, лидером по результатам тестов является платформа Intel Pentium 4. Как минимум два ее представителя в подавляющем большинстве случаев занимают верхние строчки на диаграммах, и этого более чем достаточно для обобщения, что бы там ни говорилось.

С другой стороны, ту часть фразы, что выделена курсивом, мы рекомендуем прочитать очень внимательно. Без понимания ее сути, вы можете совершенно неправильно понять выводы, присутствующие в этой статье. Или попытаться приписать нам утверждения, которых мы не делали.

В подгруппе процессоров Intel явным лидером является eXtreme Edition, но он же самый дорогой процессор из всех рассматриваемых. Далее идут вариации: Brazil r/s и Scanline предпочитают обычный Northwood, а вот Final Render Stage-1 явно тяготеет к CPU на ядре Prescott. Платформа AMD64 демонстрирует стабильно средние результаты. Однако для тех, кто все-таки выбрал имеенно ее, одна рекомендация все же имеется: увлекаться «экстремальными вариантами» в лице Athlon 64 FX вряд ли стоит обычный Athlon 64 чаще всего не хуже, но стоит дешевле. Равно как и плата для него. Athlon XP 3200+ проигрывает почти всем и почти всегда, поэтому для тех, кому нужна скорость, и кто не особенно стеснен в средствах, данный процессор является худшим выбором из всех рассмотренных.




Дополнительно

iXBT BRAND 2016

«iXBT Brand 2016» — Выбор читателей в номинации «Процессоры (CPU)»:
Подробнее с условиями участия в розыгрыше можно ознакомиться здесь. Текущие результаты опроса доступны тут.

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.