Pentium 4 «Prescott» 1066 МГц FSB: заглянуть за горизонт!


Основная причина возникновения данной статьи банальна: в нашей тестовой лаборатории появилась системная плата на чипсете Intel 925XE, позволяющая вручную выставлять параметры частоты FSB и поднимать вольтаж на процессорном ядре и памяти, благодаря чему нам удалось добиться стабильной работы процессора Pentium 4 560 (Socket 775, ядро Prescott, поддержка Hyper-Threading, штатная частота FSB 800 МГц) на частоте FSB 1066 МГц при сохранении штатных частот для всех остальных устройств. Таким образом, мы получили «почти оригинальный» Pentium 4 3.74 ГГц, работающий на частоте FSB 1066 МГц.

Для сравнения с ним мы выбрали (что логично) единственный CPU от Intel, работающий на той же частоте FSB штатно: Pentium 4 Extreme Edition 3.46 ГГц. Разумеется, намного интереснее было бы сравнить два процессора, работающих на одной частоте, однако, увы, у Prescott коэффициент умножения не может быть менее 14, даже у инженерных сэмплов. Однако два столбца на диаграммах выглядят как-то слишком сиротливо, поэтому дополнительно мы протестировали по той же методике совсем недавно попавшую в нашу тестовую лабораторию новую платформу от ATI: чипсет Radeon Xpress 200 первый набор системной логики для платформы AMD64 с поддержкой шины PCI Express x16. К сожалению, недавно объявленные топовые процессоры AMD Athlon 64 4000+ и Athlon 64 FX-55 до нас еще не доехали, поэтому был взят Athlon 64 3500+. Впрочем, мы решили эту проблему просто: система на Athlon 64 3500+ в данном тесте объявляется «на правах guest star», т.е. вроде бы она есть, но исключительно в порядке справочной информации :). Разумеется, как платформа ATI, так и топовые CPU от AMD достойны отдельного материала, и мы искренне надеемся, что нам удастся выпустить его достаточно скоро…

Однако есть у данной статьи и второе дно: она является отражением некоторых изменений, которые мы в ближайшем будущем внесем в нашу стандартную методику тестирования производительности процессоров. Те тесты, что представлены ниже, еще не являются финальной версией тестового набора, однако оценить общую направленность перемен можно уже сейчас. Этим же моментом объясняется, опять-таки, не очень большой набор результатов: у всех программ поменялась либо версия, либо методика снятия результатов, поэтому данные из всех прошлых материалов не могут быть использованы.

Думаем, что основная идея статьи понятна и без лишних объяснений: все равно рано или поздно мы увидим Pentium 4 на ядре Prescott, работающие с частотой системной шины 1066 МГц. Так почему бы ни попытаться «заглянуть за горизонт», и примерно прикинуть их производительность уже сейчас? Согласитесь, это всегда заманчиво — посмотреть на результаты тестов процессора, еще не увидевшего свет официально. Разумеется, на 100% гарантировать сопоставимость наших результатов с будущими тестами мы не можем, однако, как показала практика, они не очень сильно отличаются от полученных подобными «нештатными» способами.

Конфигурация тестовых стендов

Оснащение тестовых стендов:

  • Процессоры:
    • Intel Pentium 4 XE 3.46 ГГц (1066 МГц FSB)
    • Intel Pentium 4 560 (3.6 ГГц, Prescott, Socket 775) @ 3.74 ГГц (266x14)
    • AMD Athlon 64 3500+ (2.2 ГГц, 512 КБ L2, Socket 939)
  • Системные платы:
    • ECS PF21 Extreme на чипсете i925XE
    • MSI MS-7093 на чипсете ATI Radeon Xpress 200
  • Модули памяти:
    • 2x512 MB DDR400 SDRAM Corsair (тайминги 2-2-2-5)
    • 2x512 MB DDR2-533 SDRAM Corsair (тайминги 4-4-4-12)
  • Видеокарты:
    • NVIDIA GeForce PCX 5900
  • Накопители:
    • Samsung SpinPoint SP1614C (7200 rpm, SATA)
    • CD-ROM ASUS 50x

Системное программное обеспечение:

  • Windows XP Professional SP2
  • DirectX 9.0c
  • NVIDIA ForceWare 66.93
  • Intel Chipset Installation Utility Intel 6.0.1.1002
  • ATI Radeon Xpress 200 Resource Tool Kit

Результаты тестов

CPU RightMark 2003 beta 5

C настоящего момента мы полностью переходим на версию CPU RM 2003, т.к. она уже вполне «stable», статус «beta» в данном случае обозначает лишь то, что наши программисты еще не ввели в программу все те функции, которые планируется поддержать в релизе. Отметим, что ситуация с производительностью несколько изменилась процессоры на ядре NetBurst показывают уже более высокие результаты. Однако, сравнив абсолютные значения с результатами предыдущих тестов, мы не заметили, чтобы какие-то CPU (в том числе AMD) стали работать медленнее, просто код для P4 стал лучше оптимизированным. Ну и, конечно, в случае с Prescott наверняка сказалась доведенная до ума поддержка SSE3. Разумеется, в процессорах AMD тоже «есть что поддержать» (хотя бы архитектуру AMD64), однако затянувшийся выход релиза 64-битной Windows for AMD64 пока не позволяет работать над данной проблемой.

Модуль решателя (физическая модель)

Обсуждать имеет смысл только значительный отрыв Prescott. Он не может быть объясним исключительно возросшей частотой: она больше чем у Pentium 4 XE всего на 8%, в то время как по результатам тестов Prescott @ 1066 FSB обогнал его примерно на 16%. Остается предположить, что еще 8% прироста обусловлены улучшенной оптимизацией под SSE3. Впрочем, также имеет смысл упомянуть значительно улучшенный в ядре Prescott аппаратный prefetch на быстрой памяти он должен был сказать свое веское слово.

Модуль рендеринга (отображение)

Модуль рендеринга в случае с процессорами Intel работал в двухпоточном режиме (т.к. оба они поддерживают технологию Hyper-Threading), и, в принципе, не преподнес никаких сюрпризов здесь ядро NetBurst показывало лучшие результаты и раньше.

SPEC viewperf 8

Мы вернулись (или, скажем так, сделали пробную попытку вернуться) к тестированию CPU с помощью SPEC viewperf, т.к. 8-я версия этого пакета значительно осовременена и содержит много весьма потенциально «вкусных» приложений: CATIA, Maya, SolidWorks, Pro/ENGINEER. Однако здесь следует сделать одно важное примечание: viewperf не может считаться тестом, результаты которого в полной мере отражают производительность процессоров при работе в указанных приложениях, т.к. отражает лишь один аспект скорость визуализации. Кроме того, результаты viewperf в немалой степени зависят от видеокарты и ее драйверов.

Наивысшую скорость визуализации в 3ds max показали процессоры Intel, но это как раз не так важно (напомним, что платформа AMD играет в этом тесте роль «guest star» и не может быть напрямую сопоставлена с системами на базе Intel CPU, т.к. вовсе не является топовым решением). Интересно, что оба Pentium 4 идут вровень. Скорее всего, данный подтест уперся в производительность видеокарты.

Ситуация, приблизительно аналогичная предыдущей.

…И опять то же самое…

Вот тут, пожалуй, можно говорить о явном наличии большой нагрузки на процессор и кое-каких архитектурных предпочтениях. Последние, скорее всего, выражаются в зависимости производительности от длины конвейера уж очень ровной лесенкой разместились результаты, и самый лучший у Athlon 64, а самый худший у Prescott.

А подтест Maya явно еще и кэшелюбив. Нельзя, конечно, делать выводы по одному тестированию всего с тремя процессорами, но Prescott еле догнал Athlon 64 3500+, имея в два раза больший кэш и гигантское преимущество в частоте, а обогнал всех все равно P4 Extreme Edition, и, похоже, именно за счет двухмегабайтового L3.

…Опять упираемся в видеокарту… Судя по всему, если бы у процессора AMD были больше частота и кэш, то все три столбца вообще выстроились бы в линеечку.

Примерно аналогичная ситуация, только разрыв еще меньше.

Вообще, по-хорошему, нечего комментировать.

Что же, «возврат к SPEC veiwperf», несмотря на обновленный набор приложений, не преподнес никаких особых сюрпризов. Судя по всему, в последующих статьях мы будем приводить только общий балл для всего теста: большинство отдельных подтестов вряд ли заслуживают пристального рассмотрения.

Работа с графикой

SPECapc for 3ds max 6

В целом, тестирование производительности в 3ds max 6 с помощью тестового скрипта от www.spec.org следует признать более информативным, чем используемый нами ранее набор сцен для рендеринга, поэтому мы решили вышеупомянутый набор оставить для расширенных тестов, а в обычных использовать пакет от SPEC. Дело в том, что он более полно отражает процесс работы в 3ds max, благодаря тому, что объединяет в себе собственно рендеринг с другими операциями. Вы можете даже посмотреть, как примерно это происходит, скачав 10-мегабайтный видеофайл в формате Windows Media Video (разумеется, в нем отражен не весь процесс тестирования, но представление получить можно). В качестве результирующего значения мы приводим общее время выполнения всего скрипта, хотя, в принципе, доступна и более детальная статистика.

«Будущий» Prescott демонстрирует наилучший результат, хотя это можно списать на более высокую частоту (в принципе, прирост сопоставим). Система на базе нового чипсета ATI и Athlon 64, к сожалению, этот тест пройти не смогла (постоянно зависала где-то посередине). Ничего страшного, спишем на «сырость» сэмпла.

Adobe Photoshop CS (8.0)

Новая (для нашей методики) версия Adobe Photoshop и новый тестовый скрипт. Он был значительно расширен и все еще находится в стадии доработки (в основном, изменениям подвергается количество различного типа операций с целью достижения большей сбалансированности), поэтому данные результаты следует воспринимать как промежуточные. На сегодняшний момент в скрипте используется следующий набор команд и фильтров:

  • Blur (Gaussian Blur, Motion, Radial);
  • Lighting Effects;
  • Unsharp mask;
  • Color Conversion (RGB --> CMYK --> LAB);
  • Image Resize (увеличение, уменьшение);
  • Rotate Canvas Arbitrary (значения не кратные 45 6, 12, 24, 48);
  • Free Transform;

Высокая скорость работы с памятью, «заточка» большинства используемых функций под многопоточность (но это не было самоцелью, они действительно используются чаще всех остальных!), относительно большой L2-кэш, и, конечно, частота вот тот список ключевых параметров, который, с нашей точки зрения, обеспечил победу Prescott. И даже великанский L3 не спас P4 XE от проигрыша в этом тесте…

Сжатие мультимедийных данных

Напомним, что наши стандартные тестовые настройки для кодирования MP3 с переменным битрейтом (VBR) не предусматривают прямого указания битрейта, т.е. его подбор полностью отдается на откуп алгоритмам кодека. Однако использование параметра q=0 (наивысшее качество CBR) в данной версии приводит к существенному замедлению работы и очень сильно повышает «прожорливость» кодека к кэшу. Поэтому в качестве альтернативного варианта мы использовали более стандартную настройку --alt-preset standard.

LAME (стандартный тест по методике iXBT.com)

При q=0 большой кэш имеет решающее значение, это видно сразу.

LAME (--alt-preset standard)

…А вот с --alt-preset standard все процессоры продемонстрировали примерно одинаковый результат. В связи с этим возникает некий парадокс: ни один из наборов параметров не может быть признан удачным с точки зрения его использования в тестах. В первом случае мы видим разницу, но набор можно назвать несколько «синтетическим», во втором пресет достаточно актуальный с точки зрения пользователей, но разницы между процессорами практически не видно…

Windows Media Audio 9

Еще один «кандидат на вылет»: очень быстро и очень малоинформативно. Однако в таком случае получается, что сжатие аудиоданных находится под угрозой выбывания из методики в полном составе…

Mainconcept MPEG Encoder

Обновленный MPEG Encoder поддерживает SSE3, и, можно предположить, именно это в сочетании с высокой скоростью работы с памятью и традиционно большим приростом от использования Hyper-Threading, обеспечило победу Prescott на 1066-мегагерцевой шине. Возможен и второй вариант: в его соперничестве с Pentium 4 XE все решила частота, а большой L3 последнего просто остался не у дел, не добавив последнему очков.

DivX Pro

Пока еще трудно сказать, к чему больше предрасположен DivX данной версии: то ли к большому кэшу, то ли к короткому конвейеру (напомним, что у ядра Prescott он длиннее, чем у Pentium 4 XE).

Windows Media Video 9

Ситуация аналогичная, а вот тревожным сигналом для нашего «будущего Pentium 4» является то, что даже отнюдь не самый топовый процессор AMD его успешно догоняет. К слову: именно ради отслеживания таких ситуаций мы и «пригласили» в этот тест Athlon 64 3500+ и новую платформу ATI: когда A64 проигрывает двум другим участникам это естественно, ведь он по всем параметрам слабее. А вот когда становится с одним из них вровень это означает, что в данном тесте топовые процессоры AMD видимо, окажутся «на коне».

XviD

Новому XviD явно «пофиксили» замеченные нами ранее «глюки», и теперь ситуация с производительностью Pentium 4 изменилась кардинально, особенно в отношении нового ядра. Что же, всегда приятно, когда новое быстрее старого: как минимум, это означает, что мы не зря платим за него деньги…

Архивация

7-zip

Здесь явно сказался большой кэш Pentium 4 XE. А вот Prescott выглядит не очень хорошо опять его практически догнал Athlon 64 3500+. Не помогла даже многопоточность 7-zip и наибольшая среди всех участников теста частота вкупе с быстрой памятью.

WinRAR

WinRAR и ранее отдавал предпочтение архитектуре AMD, так что ничего не изменилось. А вот большой кэш P4 XE уже не помог Prescott выглядит на его фоне вполне удачно.

Игры

DOOM 3

No comments, как говорится… Вряд ли DOOM 3 является хорошим тестом для процессоров. Конечно, видеокарта не из топовых но какой смысл рассматривать процессор применительно к тому ПО, для которого намного важнее графический чип?

Painkiller

Игра, которая по словам редактора видеораздела Андрея Воробьева была им замечена в очень сильной процессорозависимости. Последняя ее версия включает в себя два встроенных бенчмарка, мы решили проверить оба.



Для тестов процессоров явно больше подходит новый C5L2. И для платформы Intel результаты выглядят весьма оптимистично: сверхдорогой (и, соответственно, не шибко популярный у рядовых пользователей) Extreme Edition совершенно «никакой», а вот Prescott на 1066 МГц FSB демонстрирует весьма пристойный результат.

Unreal Tournament 2004



Демка Ons_dria на платформе ATI Radeon Xpress 200 + AMD Athlon 64 3500+ просто «вылетала в синий экран» (BSOD), поэтому на диаграмме результаты этого тестового стенда отсутствуют. Однако по обеим диаграммам создается впечатление, что данная игра не относится к категории сильно зависящих от процессора. Впрочем, дождемся результатов топовых процессоров AMD. Если кого-то Unreal Tournament 2004 и способен показать в лучшем свете, так это их (судя по отрыву Athlon 64 3500+ в демке Primeval).

Выводы

Мы заранее оговариваемся, что «заезжая звезда» она на то и заезжая, чтобы создавать общий фон, поэтому затрагивать в выводах результаты новой платформы ATI и процессора Athlon 64 3500+ мы не будем, это тема для отдельного тестирования (которое не за горами).

Что касается сопоставления результатов первого процессора Intel, официально поддерживающего 1066-мегагерцевую шину, с показателями быстродействия разогнанного Prescott то в целом они выглядят для последнего вполне радужно. Кое-где, конечно, есть провалы, но их количество не столь велико, а во многих случаях Pentium 4 Extreme Edition и вовсе отстал, причем иногда это нельзя объяснить даже разницей в частоте. Судя по всему (хотя, конечно, делать выводы на основании одного тестирования достаточно смело) наращивание частоты ядра и одновременно скорости подсистемы памяти является стратегически более правильным путем, чем увеличение объема кэша. Впрочем, с другой стороны, кашу маслом не испортишь, так что можно бы и совместить…

Так что в целом будущее Prescott после перехода 1066-мегагерцевую шину выглядит неплохо, осталось только дождаться CPU на этом ядре, которые будут поддерживать ее официально. А если это будет еще и Prescott с 2-мегабайтовым L2 (ходят и такие слухи…) — то он имеет все шансы объединить в себе лучшие черты обоих представленных в данном тесте процессоров Intel.




Дополнительно

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.