SPEC CPU2000. Часть 13. High End процессоры по состоянию на конец 2003 года


В конце 2003 года мы подводим итог соревнований в производительности в тесте SPEC CPU2000 среди самых быстрых процессоров от ведущих компаний. В их число вошли продукты компании Intel — Pentium 4 и Pentium 4 EE (полное название Pentium 4 Processor with HT Technology Extreme Edition), а также последние процессоры от AMD — Athlon 64 и Athlon 64 FX.

В следующем году нас уже ждут новые продукты. В том числе как уже известные процессоры, но с более высокими тактовыми частотами, так и новинки от Intel и AMD. Кроме того, мы исследуем выпущенные недавно компиляторы от Intel версии 8.0. Кроме того возможно появится новая информация о следующей версии теста — SPEC CPU2004, о которой уже начинают ходить интересные слухи (подтестов: 40, объем дистрибутива на диске: 3 ГБ, требуемый размер ОЗУ: 2 ГБ, время работы однократного запуска: 20 часов).

Конфигурации

  • Intel Pentium 4, Penium 4 EE: плата на чипсете i875, два модуля памяти DDR400 по 256 МБ (тайминги 2-2-2-5)
  • AMD Athlon 64 FX/Opteron: материнская плата на чипсете nForce3, два модуля памяти DDR400 по 512 МБ (регистровые, тайминги 2.5-3-3-5)
  • AMD Athlon 64: материнская плата на чипсете nForce3, один модуль памяти DDR400 256 МБ (тайминги 2-3-3-5)
  • AMD Athlon XP: материнская плата на чипсете nForce2, два модуля памяти DDR400 по 256 МБ (тайминги 2-3-3-5)

Из ПО используется ОС Microsoft Windows XP SP1, конфигурация теста от 12.03.03: компиляторы Intel версии 7.1 и Microsoft Visual.NET 2003 для библиотек. Отметим, что из всех представленных процессоров только Athlon XP не поддерживает дополнительный набор команд SSE2, что приводит к значительному отрыву от других участников. Отметим, что процессоры Athlon 64/64FX/Opteron используются в этот раз исключительно в 32-х битном режиме. Также в этом материале мы считаем, что Athlon 64 FX-51 это то же самое, что и Opteron 148, поскольку никаких отличий кроме «позиционирования на рынке» нам не известно.

Сначала приведем общие диаграммы интегральных показателей, а потом посмотрим на интересные пары подробнее.

Итак, по работе с целыми числами у нас снова впереди компания Intel с процессором Pentium 4 EE. Отметим однако, что на втором месте AMD Athlon 64 FX-51, который, отставая от лидера на 9%, опережает «обычную» версию Pentium 4 на 7%. Несмотря на одноканальный контроллер памяти и меньшую в полтора раза частоту, Athlon 64 3200+ практически догоняет Pentium 4 3,2 ГГц в этом тесте. Ну а Athlon XP 3200+ в этот раз на последнем месте. Одна из причин этого – отсутствие поддержки набора команд SSE2.

По интегральной оценке SPECfp процессоры AMD сдвинулись на одну ступеньку ниже. Теперь уже конкуренцию Pentium 4 составляет Athlon 64 FX. И на 12% от него отстает Athlon 64. Очень может быть, что с выходом версии AMD64 процессора с двухканальным контроллером памяти, который будет работать с обычными (не регистровыми) модулями DDR400 ситуация изменится.

Pentium 4 EE против Pentium 4

К сожалению в отличие от простого роста частоты, скорости обмена с памятью и других непрерывных величин, установка кеша третьего уровня с одной стороны заметно меняет результаты, а с другой ее эффект гораздо менее прогнозируем при выходе из используемого в тестах класса задач. Мы уже рассматривали зависимость результатов теста SPEC CPU2000 от объема кеша L2 и видели, что на приложения набора CINT2000 объема кеша влияет в каждом случае по своему. Иногда задача показывает значительный рост скорости при увеличении с 128 КБ до 256 КБ, но при этом не замечает увеличения L2 до 512 КБ. Так что можно сказать, что влияние очень зависит от задачи и ее алгоритма. При этом приложения набора CFP2000 показали в целом гораздо меньшую зависимость от объема L2. Это, в частности, привело к мысли о том, что для счетных задач можно использовать и линейки недорогих процессоров с маленьким кешем (правда у них обычно используется и медленная процессорная шина, что уже существенно).

Таким образом, результаты данного сравнения, к сожалению, показывают только принципиально возможные дивиденды от установки кеша третьего уровня и их сложно перенести на другие задачи.

Итак, по первой диаграмме мы видим, что для набора CINT2000 установка L3 кеша позволила значительно ускорить большинство приложений. При этом максимальный рост показали задачи, которые сильно зависят от скорости работы оперативной памяти. Оставшиеся пять задач почти не заметили изменений в процессоре. Причины в этом случае, на мой взгляд, может быть две – или им достаточно и кеша L2 (или даже L1) или мало 2 МБ L3 :)

Несмотря на то, что по интегральному показателю рост составил 16%, что недалеко от 17%, полученных для CINT2000, здесь мы наблюдаем огромный разброс в показателях отдельных тестов. Особенно отличился 179.art. В принципе такое поведение этого подтеста не является новостью – если внимательно просмотреть результаты, опубликованные Sun Microsystems на www.spec.org, то можно заметить, что именно 179.art позволил процессорам этой компании с относительно низкими частотами (до 1,2 ГГц) достичь высокого интегрального показателя, на уровне Pentium 4 3,2 ГГц. При этом процессоры Sun используют от 1 до 8 МБ кеша L2 и достигают в этом подтесте 8000 баллов и выше.

Как мы видим в случае с Pentium 4 EE скорость 179.art увеличилась более чем в 2,5 раза и достигла небывалых для Pentium 4 высот в 2389 баллов против 950 у его предшественника. Так что модель нейронной сети еще раз подтвердила свое желание иметь в распоряжении как можно больше быстрой памяти.

Что касается других подтестов (178.galgel – вычислительная гидродинамика и 188.ammp – вычислительная химия), то первый из них ранее почти нигде не выделялся по своим предпочтениям, а второй в принципе «засветился» заметным увеличением скорости при переходе на Athlon XP (Barton) с 512 КБ L2.

Странно, что в этот раз не проявился 171.swim, видимо ему мало и такого кеша.

Масштабируемость Athlon 64 FX/Opteron по частоте

Протестировав модели процессоров Athlon 64 FX-51 и Opteron 146, мы сможем оценить масштабируемость этой серии процессоров по частоте. Для сравнения можно использовать данные, полученные в прошлом году для процессоров Pentium 4. Отметим, что эти данные характеризуют скорее особенности отдельных подтестов, чем процессоров и систем. Также стоит учесть, что за год скоростные показатели систем возросли почти в 2 раза.

По тестам CINT2000 мы видим аналогичную прошлогодней картину – почти все рады увеличению частоты, за исключением подтеста 181.mcf, который увеличил свой показатель всего на 1,7% при 10% увеличении частоты. Интегральная оценка изменила свой показатели на 8%, против 7 в прошлый раз.

В этот раз небольшие отличия от прошлого исследования есть. Уменьшили свою зависимость от частоты 173.applu, 188.ammp, 189.lucas. Однако 171.swim и 179.art теперь показывают 1,7 и 2,8% соответственно, против 1 и 0,5% в прошлый раз. Интегральная оценка снова показала 6% рост при 10% увеличении тактовой частоты.

Память DDR400 для AMD Opteron

Как вы помните, в момент анонса процессоров AMD Opteron для них была заявлена поддержка двухканальной памяти типа DDR333 (обязательно регистровой, опционально – с ECC). Однако с последующим появлением регистровых модулей DDR400 оказалось, что Opteron прекрасно работает и с ними. Посмотрим, насколько увеличение ПСП влияет на скорость в тесте SPEC CPU2000. Кстати эти диаграммы тоже можно сравнить с приведенными в старой статье.

Несмотря на то, что частота работы с памятью возросла на 20%, тесты набора CINT2000 увеличили свои показатели на гораздо меньшую величину. Отличился только 181.mcf, который прибавил почти 12%. Это вполне согласуется с ранее полученными данными о особенностях этого теста.

А вот задачи из CFP2000 повели себя заметно активнее. За исключением 177.mesa и 200.sixtrack, рост составил более 3%. Снова отличились 171.swim и 179.art. Кроме того уже упомянутый 189.lucas явно сместил свой акцент на ПСП.

Четыре вышеприведенные диаграммы можно считать современной оценкой влияния скорости ядра (тактовой частоты) и скорости памяти на результаты теста SPEC CPU2000. Кстати если цифры в двух последних диаграммах разделить на 2 и прибавить к данным в первых двух, то мы снова получим все значения около 10 :)

Контроллеры памяти Athlon 64 и Athlon 64 FX/Opteron

Следующей парой у нас будут два процессора архитектуры AMD64 — Athlon 64 и Opteron. На стороне первого – быстрая не регистровая DDR400 память, а второй отличается двухканальным контроллером памяти, правда требующим установки регистровых модулей. Использовались процессоры, работающие на одинаковой частоте в 2 ГГц – Athlon 64 3200+ и Opteron 146.

Как мы видим, в целом процессоры идут на равных. Разница результатов не превышает 3,5%. Отметим преимущество Opteron в тесте, чувствительном к ПСП – 181.mcf. А вот для тестов 175.vpr и 255.vortex видимо важнее меньшие задержки у не регистровых модулей (мы пока не исследовали подробно влияние «регистровости» на скорость, однако попробуем в будущем провести и такие тесты).

Преимущество двухканального контроллера памяти заметно выражено в тестах набора CFP2000. Два теста ускорились на 30% и 35%, пять тестов на 5% и выше. Хотя и здесь мы можем наблюдать падение скорости у двух тестов – 188.ammp и 301.aspi. Запишем и их в кандидаты на высокую зависимость от задержек оперативной памяти и в следующих материалах попробуем ее оценить.

Заключение

Итак, по состоянию на конец 2003 года лучшие результаты в тесте SPEC CPU2000 показывает флагман компании Intel процессор Intel Pentium 4 EE с тактовой частотой 3,2 ГГц. Сразу за ним идет AMD Athlon 64 FX-51. От отстает от лидера на 9 и 13 процентов в SPECint_base2000 и SPECfp_base2000 соответственно, но при этом работает на частоте почти на треть меньшей.

Заметим, что оба этих продукта очень выделяются из стандартных линеек компаний для настольных компьютеров. У Pentium 4 EE установлен кеш третьего уровня объемом 2 МБ, а Athlon 64 FX использует редко используемую на десктопах регистровую память. Можно сказать, что оба производителя в борьбе за рынок декстопов использовали свои серверные наработки. Однако подход AMD более прозрачен – по всем характеристикам выпущенный в сентябре Athlon 64 FX-15 совпадает с объявленным позже Opteron 148. При этом существуют процессоры и серий 200/800 (для многопроцессорных систем) с аналогичными характеристиками. А вот Pentium 4 EE уже не имеет аналогов среди Xeonов.

Третье место занимает процессор Intel Pentium 4 с частотой 3,2 ГГц, но уже без приставки «EE». Он проигрывает Athlon 64 FX-51 при работе с целыми числами 7%, а в расчетах с вещественными переменными идет вровень.

Чисто десктопный процессор Athlon 64 3200+ на четвертом месте. Он примерно равен Pentium 4 3,2 ГГц для задач из набора CINT2000 и проигрывает ему 12% на наборе CFP2000. Проигрыш в основном обусловлен использованием одноканального контроллера памяти, поскольку задачи этого набора очень чувствительны с ПСП.

Что касается Athlon XP, то его применение обосновано только при условии использования старых готовых программ, которые не используют полностью возможности современных процессоров в плане SIMD. В этом случае он может поспорить с решениями на базе Athlon 64/64FX.




Дополнительно

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.