SPEC CPU2000: Часть 6 — сравнительное тестирование процессоров от Intel и AMD


Спасибо всем, что дотерпели до этой статьи :). Здесь мы наконец добрались до самого интересного, а именно - сравнения современных процессоров в тесте SPEC CPU2000.

Как вы понимаете, специальные комментарии, как, например, в тестах материнских плат или платформ, здесь делать сложно. Про процессоры на нашем сайте опубликовано множество статей, про тест SPEC CPU2000 также вышло более пяти материалов.

Задача на самом деле стоит очень сложная — для процессоров Intel и AMD в настоящий момент существует более 10 различных платформ. Кроме того, как мы видели в прошлых статьях, есть существенная зависимость от используемого компилятора и ключей оптимизации. Ну и, собственно, суть теста SPEC CPU2000 — скорость процессора и оперативной памяти играют ведущую роль. Так что совсем правильная и полная  таблица должна быть как минимум четырехмерной :).

Мы решили здесь сократить все до одной, максимальной цифры для каждого процессора. Но, безусловно, зависимость от платформ и памяти будет исследоваться и в дальнейшем.

Не очень понятно, как быть с тем, что разные процессоры поддерживают разные наборы SIMD. Если мы решим использовать полностью идентичный код, то, например, в сравнении процессоров AMD и Intel последние будут показывать не максимальные результаты. А если взять разный код, то сравнение становится менее строгим. Так что будем считать, что эта проблема нивелируется поставкой SPEC CPU2000 в исходных кодах и будем сравнивать именно максимально достижимые цифры на каждом процессоре.

Итак, мы начинаем публикацию с результатов следующих процессоров:

  • Intel Pentium III
  • Intel Pentium 4
  • Intel Celeron (Willamette-128)
  • AMD Athlon XP

Платформы для них были выбраны следующие (естественно, в будущем возможно их изменение, и это будет дополнительно указано):

  • Intel i850, RDRAM для Intel Pentium 4, Celeron
  • VIA KT333, DDR333 для Athlon XP
  • Intel i815, PC133 для Pentium III

Процессор Pentium III не рассматривается как серьезный конкурент для Pentium 4 и Athlon XP и приведен только для сравнения в помощь тем, кто планирует перейти на новую платформу и хочет оценить эффект от этого процесса.

Использовалась конфигурация теста iXBT.060202 с вариацией по наборам SIMD. Подробнее смотрите на этой странице. Напомним, что эта конфигурация основана на коде компиляторов Intel C/C++/Fortran версии 5.0.1 и практически совпадает с используемой Intel и AMD для публикации на www.spec.org. Также укажем, что используются только base метрики.

Приведенные в этой статье цифры получены официальными трехкратными запусками тестов, так что каждая интегральная оценка "стоила" около трех часов счета (время работы на Pentium 4 2.0).

В дальнейшем мы постараемся оформить результаты этого теста в интерактивную базу данных, а пока используем знакомые всем диаграммы:



Приведенные данные будут дополняться по мере выполнения новых тестов.

А сейчас рассмотрим подробные данные по нескольким интересным парам.

AMD Athlon XP 2000+ и Intel Pentium 4 2.0

Процессор компании AMD здесь сравнивается с Intel Pentium 4 на базе ядра Willamette. Безусловно, Northwood быстрее, но это уже совсем другая история (см. следующую пару диаграмм). Отметим, что тесты на Athlon XP используют набор SSE, а на Pentium 4 — SSE2. Это, конечно, повлияло на результаты. Но… что есть, то есть. Будем ждать SSE2 в следующих процессорах от AMD.



По набору CINT2000 процессор Athlon XP лидирует в девяти приложениях из двенадцати. Максимальный отрыв составляет 48.6% в тесте 186.crafty. А вот в 176.gcc, 181.mcf и 254.gap быстрее оказывается Pentium 4 (на 29,7, 36,6 и 13% соответственно). Счет по интегральной оценке: +3,9% в пользу AMD.

В десяти приложениях из набора CFP2000 лидирует Pentium 4. Наиболее выдающийся тест — 183.equake, Intel выигрывает в нем 40,9%. В остальных четырех задачах впереди Athlon XP (максимально на 16,7% в тесте 188.ammp). Отставание процессора компании AMD составляет 16,4% по интегральной оценке.

В целом, мы видим, что, несмотря на популярное мнение о высокой скорости FPU у процессоров Athlon XP, в тестах с вещественной арифметикой SPEC CPU2000 он проигрывает своему конкуренту. Такая ситуация обусловлена использованием в наших тестах компилятора от Intel и SSE/SSE2. Если провести тесты без использования SIMD (но с тем же компилятором), то результаты заметно поменяются. В частности, Athlon станет выигрывать в пяти тестах CFP2000 из четырнадцати (причем максимальная разница в скорости достигает в этом случае 68,1% в 177.mesa) . А интегральная оценка будет всего на 2,7% ниже, чем у Pentium 4.

Это еще раз доказывает, что просто сделать быстрый процессор мало. Нужно еще и обеспечить его быстро работающими на нем программами.

Intel Pentium 4 2.0 и 2.0A

На следующей паре диаграмм мы увидим, как реагирует тест SPEC CPU2000 на возросший до 512KB кэш ядра Northwood.



Наибольшая реакция наблюдается у тестов набора CINT2000. Интегральная оценка возросла на 12,1%. При этом наиболее заметен эффект от роста объема кэша в подтесте 176.gcc — 27.7%. Что касается CFP2000, то ему, видимо, достаточно и 256KB L2. Только 188.ammp показал прибавку в 16.7%. А интегральная оценка возросла на 4%.

Intel Pentium 4 2.4 и 2.4B

Как вы знаете, памяти (точнее памяти+чипсета), способной "по-честному" обслужить шину Pentium 4 с частотой 533 MHz, официально не существует. Так что данные диаграммы приведены по принципам  "а что если…" и "спрашивали? отвечаем!" :)



Комментировать здесь особо нечего. Тесты SPEC CPU2000 сильно зависят от скорости обмена с оперативной памятью, а здесь она у нас не изменилась. Так что влияние частоты FSB при прочих равных условиях минимально.

Intel Celeron 1.7 и Pentium 4 1.7

Можно долго спорить о том, подходит ли процессор Celeron на ядре Willamette-128 для интенсивных вычислений. Однако большинство читателей согласится, что в вопросе использования "не предусмотренных производителем" решений мы "впереди планеты всей" :). Можно рассматривать это сравнение и как проверку реакции SPEC CPU2000 на уменьшение кэша второго уровня до 128KB.



Интересно сопоставить эти диаграммы с сравнением Pentium 4 на ядрах  Willamette и Northwood. По их сочетанию можно признать, что хотя кэш 128KB - это хорошо, но 256KB обеспечивают заметно большую скорость в приложениях CINT2000. Особенно это заметно по понятным задачам: архиватор, компилятор и интерпретатор показали заметное падение скорости. Интегральная оценка снизилась на 14,7%. И снова CFP2000 практически не пострадал — падение составило всего 3%. На самом деле, все приложения ведут себя по-своему — например, 252.eon совсем не зависит от объема кэша второго уровня. В качестве примера приведем также 171.swim, который при переходе 128–256 растет на 14,5%, а на 256-512 всего на 1,3% и 188.ammp, ведущий себя совершенно по-другому — 128-256 рост 5,5%, 256-512 рост 16,7%.




Дополнительно

iXBT BRAND 2016

"iXBT Brand 2016" - Выбор читателей в номинации "Процессоры (CPU)":
Подробнее с условиями участия в розыгрыше можно ознакомиться здесь. Текущие результаты опроса доступны тут.

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.