CMP vs SMP на платформе Intel:

сравнение Pentium XE 840 с двухпроцессорными системами на базе Xeon


Как мы уже писали ранее, на основании анализа технических характеристик двухъядерных процессоров Intel, напрашивался вывод, что их быстродействие должно быть примерно аналогично быстродействию обычной SMP-системы на базе двух процессоров типа Xeon с аналогичными характеристиками (пропускная способность шины, частота работы ядра, размер кэша второго уровня). Однако даже самая правильная с точки зрения логики и здравого смысла гипотеза, остаётся не более чем гипотезой, если она не подтверждена результатами эксперимента. Поэтому мы всё-таки решили такой эксперимент провести. Соперники флагманскому двухъядернику Pentium XE 840 были подобраны самые близкие по характеристикам: пара Xeon 3,2 GHz на ядре Nocona (фактически полный аналог Pentium XE 840, только «разделённый» на два CPU) и пара Xeon 3,2 GHz на ядре Irwindale (по идее, эта пара должна быть быстрее Pentium XE 840 за счёт наличия у каждого CPU кэша второго уровня объёмом 2 МБ). Правда, 100%-ной чистоты эксперимента нам не удалось достигнуть по объективным причинам: десктопные чипсеты для двухъядерных процессоров Intel официально не поддерживают процессоры Xeon, поэтому платформа для последних использовалась другая: на базе чипсета Intel E7525, предназначенного для построения рабочих станций. Собственно, в этом и состояла основная интрига данного теста: сможет ли платформа для рабочих станций (где, как и в серверах, основной упор делается больше на надёжность, чем на скорость), соревноваться на равных с быстрым десктопом? Некоторые сомнения в этом у нас возникли ещё до проведения тестов (см. далее комментарии к конфигурации стендов), однако дать однозначный ответ на данный вопрос могло только тестирование…

Тестирование

Конфигурация тестовых стендов

  • Процессоры
    • Intel Pentium eXtreme Edition 840 (2 x 1 MB L2, 800 MHz FSB, 2 x 3.2 GHz core)
    • 2 x Intel Xeon 3.2 GHz (ядро «Nocona», 1 MB L2, 800 MHz FSB)
    • 2 x Intel Xeon 3.2 GHz (ядро «Irwindale», 2 MB L2, 800 MHz FSB)
  • Системные платы
  • Память
  • Видеокарта ATI Radeon X800 (256 MB)
  • Жесткий диск Samsung SP1614C (SATA), 7200 об/мин, 8 МБ кэша
  • Блок питания: FSP 550-60PLN (500-550W)
  • Windows XP Professional SP2, DirectX 9.0c
  • ATI CATALYST 5.4 (Display Driver 6.14.10.6525)

Особо хотелось бы обратить внимание читателей на то, что в дуальной платформе на базе CPU Intel Xeon, использовалась системная плата на чипсете Intel E7525. Данный чипсет поддерживает только память типа DDR2-400, причем использовались рекомендованные самой Intel Registered DDR2-модули с поддержкой ECC. Безусловно, это не могло не отразиться на производительности системы на базе Xeon, так как Pentium eXtreme Edition 840 тестировался с применением обычных (не-ECC, не-Registered) модулей, к тому же DDR2-533. Однако именно E7525 Intel сейчас рекомендует использовать для построения двухпроцессорных рабочих станций на базе Xeon с ядрами Nocona и Irwindale. Поэтому быстродействие, которое вы увидите далее на диаграммах с результатами тестов — это именно то, с чем вам, скорее всего, придётся столкнуться на практике, если вы сделаете сегодня выбор в пользу рабочей станции на базе дуального Xeon.

Результаты тестов

Напомним, что диаграммы со всеми результатами тестов (в количестве 65 штук), вынесены на отдельную страницу без комментариев, просто «as is». В статье же приведены только сводные диаграммы, объединяющие результаты целой группы тестов в некий средний балл. Такой подход позволяет с одной стороны удовлетворить любопытство особо пытливых читателей, возражающих против сокращения количества приводимых в статьях результатов тестов, а с другой сделать «основной» материал менее пёстрым и насыщенным графикой.

SPECapc for 3ds max 6 + 3ds max 7.0

Полный набор диаграмм

3ds max 7 демонстрирует практически полную индифферентность к типу многопроцессорности и объёму кэша: стенд на базе Xeon Irwindale практически не обогнал Pentium XE 840, а стенд на базе Xeon Nocona хоть и отстал от всех прочих, но не более чем на 3%, что несущественно.

Maya 6.5

Полный набор диаграмм

А вот в Maya Pentium XE вырвался вперёд, причем как в тесте SPEC (хотя ненамного), так и в тесте на скорость рендеринга (более ощутимо). Кстати, обратите внимание: отключение Hyper-Threading во всех трёх случаях приводит к незначительному увеличению производительности системы в тесте SPEC. Не настолько, чтобы данный способ можно было всерьёз рекомендовать для поднятия скорости работы, но всё-таки тенденция налицо…

Lightwave 8.2, рендеринг

Примерное равенство всех систем как при включенной, так и при отключенной Hyper-Threading, при этом её включение определённо даёт положительный эффект…

SPECapc for SolidWorks 2003

Полный набор диаграмм

Та же ситуация, что и в тесте SPEC для Maya: двухъядерник является самым быстрым. Если сравнивать его с Irwindale, то превосходство не очень сильное, однако напомним, что сравнивать Pentium XE 840 следует в первую очередь с парой Xeon Nocona, так как Irwindale находится в более выигрышной ситуации за счёт преимущества в объёме L2-кэша.

Adobe Photoshop CS (8)

Полный набор диаграмм

…И снова двухъядерник, пусть и не очень заметно, но выигрывает у обоих Xeon…

Adobe Acrobat 6.0

Здесь можно констатировать приблизительное равенство, вот только почему-то отключение Hyper-Threading более заметно повлияло на Pentium XE и Xeon Irwindale, и практически не повлияло на Xeon Nocona.

«Универсальное» сжатие данных (архивация)

Полный набор диаграмм

Вот так! Архиваторы, как это уже давно известно, очень чувствительны именно к скорости подсистемы памяти, и использование Registered ECC, да ещё и DDR2-400, да ещё и с чуть более худшими таймингами (3-3-3-10 на Xeon против 3-3-3-8 в случае с Pentium XE) привело к тому, что этот тест двухъядерник выигрывает с очень большим отрывом.

Сжатие мультимедийных данных с потерями (MP3/MPEG2-4)

Полный набор диаграмм

Мультимедийные кодеки в очередной раз продемонстрировали, что в целом они достаточно индифферентно относятся как к скорости подсистемы памяти, так и к «сверхбольшому» (2 мегабайта) кэшу.

CPU RightMark 2004B

Полный набор диаграмм

Какая-то разница есть, но, право же, она не выходит за границы неизбежной погрешности при проведении измерений…

Трехмерные игры и визуализация графики
в профессиональных пакетах

DOOM 3

Far Cry

Painkiller

Unreal Tournament 2004

Общий балл по играм

Полный набор диаграмм

SPEC viewperf

Полный набор диаграмм

Игры, равно как и SPEC viewperf, продемонстрировали существование зависимости от скорости работы с ОЗУ (глядя на результаты тестов архивации можно практически не сомневаться, что дело именно в ней). Как и всегда, проигрыш дуальных систем двухъядерной нельзя назвать громадным, но он, безусловно, есть.

Падение скорости исполнения основного процесса
при различном количестве фоновых

За счёт более высокой скорости работы с памятью, при отключенной Hyper-Threading Pentium XE с самого начала и почти до конца довольно существенно обгоняет как Xeon Irwindale, так и Xeon Nocona (тёмно-коричневая линия в сравнении с тёмно-зелёной и тёмно-синей). Впрочем, при максимальном количестве фоновых процессоров, он всё же им проигрывает. При включенной Hyper-Threading Xeon Irwindale обходит Nocona в случае с двумя фоновыми процессами (видимо, всё ёще «хватает» большого кэша), но уже с тремя фоновыми процессами это преимущество сходит на нет. Pentium XE 840 оказывается в среднем лучше всех, лишь чуть-чуть проиграв обеим системам с «честным» SMP в самом тяжёлом тесте.

Заключение

Общий итог закономерен, и был вполне предсказуем ещё до начала тестирования: производительность двухъядерного Pentium XE и двух Xeon Nocona, при одинаковой частоте работы ядра, как легко заметить по некоторым результатам тестов, примерно идентична. Однако использованная нами (и рекомендованная самой Intel для новых дуальных Xeon) платформа на базе чипсета E7525, позволяющая использовать только Registered ECC DDR2-400 модули, обусловила вполне естественный проигрыш SMP-систем двухъядерному Pentium eXtreme Edition во всех подтестах, критичных к скорости работы с памятью. Вывод напрашивается очевидный: если вам нужна производительность то использование двухъядерников в случае с платформой Intel оказывается более предпочтительным, причем не из-за разницы в производительности CPU, а именно из-за возможности использовать быструю десктопную платформу (i955X). Если же важна надёжность (Registered ECC память) и серверные функции (поддержка PCI-X) то за них придётся платить. В том числе более низким быстродействием в некоторых классах задач, критичных к скорости подсистемы памяти.

Забавно, что по идее всем трём использованным процессорам вполне должно хватать DDR2-400, так как суммарная пропускная способность двухканального контроллера памяти уже в этом случае равна пропускной способности процессорной шины. Поэтому вполне логично предположить, что мы наблюдаем отнюдь не преимущество DDR2-533 над DDR2-400, а скорее влияние использования Registered ECC модулей. Однако данная статья всё-таки посвящена исследованию реальной производительности систем в реальном ПО, поэтому сравнение скорости работы подсистемы памяти i955X vs. E7525 с помощью низкоуровневых тестов, наверное, следует сделать темой отдельного небольшого материала…




Дополнительно

iXBT BRAND 2016

«iXBT Brand 2016» — Выбор читателей в номинации «Процессоры (CPU)»:
Подробнее с условиями участия в розыгрыше можно ознакомиться здесь. Текущие результаты опроса доступны тут.

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.