SPEC CPU2000. Часть 4


В четвертой части цикла, посвященного тесту SPEC CPU2000, мы будем исследовать его работу на различных платформах для процессора AMD Athlon XP. А в качестве приятного дополнения изучим влияние настроек BIOS материнских плат на результаты этого теста.

Мы решили не включать в тест плату на чипсете VIA KT133A, поскольку все остальные представленные платформы ориентированны на память типа DDR SDRAM, а, как мы помним по тестам Intel Pentium 4,  PC133 память в тестах SPEC CPU2000 заметно ограничивает скорость. Ветеран AMD 760 был заменен на последнюю модификацию чипсета от AMD — 760MPX.

В тестах использовались следующие конфигурации:

  • AMD Athlon XP 1900+ (1600MHz)
  • чипсеты и представляющие их материнские платы
    • VIA KT333 — Gigabyte GA-7VRXP
    • VIA KT266A — ABIT KR7A
    • NVIDIA nForce — ASUS A7N266
    • ALi MAGiK 1C — Iwill XP333R
    • SiS 735 — Chaintech 7SID
    • AMD 760MPX — ASUS A7M266-D
  • два модуля памяти 256 MB PC2700 (были также использованы и как PC2100)
  • видеокарта GeForce2 Pro
  • IBM DTLA 15 GB 7200 RPM HDD
  • Windows 2000 Pro SP2
  • необходимые драйвера для чипсетов и видео

Конфигурация SPEC CPU2000 v1.1:

  • компиляторы Intel C/C++/Fortran 5.0.1
  • используется оптимизация под SSE
  • только base / speed метрики

Как уже было неоднократно показано, скорость работы материнских плат, выполненных на одном чипсете, практически не отличается. Исключение обычно составляют случаи недоработок в BIOSах и неточности тактовых генераторов..

Большинство плат может быть настроено на конфигурацию "Load Optimized Defaults", которая и будет отправной точкой при наших попытках увеличить скорость. Отметим, собственно настройки BIOS у плат обычно разные, что затрудняет прямое сравнение. Результаты разгона памяти также могут зависеть непосредственно от платы. Например, на плате Gigabyte мы смогли в обоих случаях (DDR266 и DDR333) установить лучшие по быстродействию параметры работы памяти. А вот ABIT не позволил нам поставить Command Rate в 1T. 

Поскольку установки по умолчанию определяются производителем платы и BIOS, а также учитывая то, что большинство пользователей все-таки не очень экспериментирует с тонкими настройками, рост скорости при ручной установке оптимальных параметров работы памяти можно считать мерой качества реализации BIOS. И этот момент тоже можно принимать во внимание при покупке платы.

Начнем с последней разработки компании VIA — чипсета KT333.

Чипсет VIA KT333

Кроме настроек в BIOS таймингов памяти, еще одним вариантом повышения производительности этой платформы является использование памяти PC2700, работающей на частоте 333MHz (DDR). Хотя, конечно, в чисто вычислительном тесте ожидать многого от повышения скорости обмена с памятью не приходится.



На результаты тестов CINT2000 большее влияние оказывает установка минимальных задержек для памяти, чем частота ее работы. Рост результатов интегральных оценок составляет примерно 8% для уменьшения таймингов и 3% для увеличения частоты.

Для CFP2000 мы видим более выраженный эффект — 11% для оптимизации задержек и 6% для использования DDR333. Оба теста показали, что хорошая (то есть, с минимальными таймингами) память PC2100 может быть лучше некоторых представителей PC2700. В силу специфики теста (отсутствие работы с жестким диском и видео) никто не ожидал большого прироста от использования памяти на частоте 333MHz DDR, однако полученные в некоторых подтестах приросты производительности в 12-15% выглядят интересно (при максимально возможных 25%).

Чипсет VIA KT266A

Ставший уже классическим чипсет KT266A продолжает пользоваться заслуженной популярностью как у производителей, так и покупателей.



В целом картина аналогична предыдущему случаю -  тонкая настройка BIOS дает нам рост в 7 и 12% для целочисленной и вещественной арифметики соответственно. Напомним еще раз, что эти цифры зависят в основном от правильности написания BIOS. Вторым фактором является качество модулей памяти и адекватность записанных в их SPD данных.

Чипсет AMD 760MPX

Последователь удачного чипсета с поддержкой самого популярного сегодня типа памяти DDR SDRAM также показал хорошие  результаты в наших тестах. С чипсетом 760MP компания AMD стартовала на рынке двухпроцессорных систем. А 760MPX с новым южным мостом добавляет и поддержку PCI64/66MHz к таким конфигурациям.



Как вы видите, ASUS сохраняет репутацию производителя, "выжимающего" все из чипсетов -  ручной настройкой можно добавить всего 5.3/6% к интегральным оценкам INT/FP. Тем более удачно это выглядит для нового продукта. А максимальным ростом производительности — 11% — отметился 181.mcf. Но это не стало неожиданностью — по предыдущей части мы знаем, что это наиболее чувствительный к скорости памяти тест из CINT2000.

Чипсет ALi MAGiK 1C

Это еще один чипсет, который официально поддерживает DDR333. Последняя версия BIOS позволяет установить частоту работы памяти 166MHz при 133MHz FSB. 



Однако, судя по результатам, лучше так не делать :(. Скорость работы в режиме DDR333 значительно ниже, чем в DDR266. При этом автоматические установки для PC2100 являются оптимальными, а попытка выставить другие значения таймингов оказалась неудачной — результаты даже уменьшились. Это может быть вызвано тем, что некоторые настройки в "ручном" режиме продолжают устанавливаться BIOSом без спроса пользователя.

Чипсет NVIDIA nForce 420D

На нашем экземпляре материнской платы в BIOS была только одна настройка скорости работы памяти — SDRAM CAS Latency. Кроме того, при работе с этим чипсетом мы использовали два варианта конфигурации модулей памяти — два (в первом и втором разъеме) и один (в первом разъеме). Как вы помните, согласно спецификации чипсета, в первом случае ширина шины памяти составляет 128 бит, а во втором только 64. Итого, в сравнении участвовало 3 варианта - 64 бит, установки по умолчанию; 128 бит, установки по умолчанию; 128 бит, оптимизированные установки.



По интегральным оценкам прирост от использования двухканального контроллера памяти составляет всего 0.5% для CINT2000 и 1.5% для CFP2000. По отдельным приложениям эффект больше — наиболее чувствительные к памяти 171.swim, 172.mgrid и 179.art показывают 11.4, 4.8 и 5.1 процентов выигрыша соответственно. Остальные приложения отреагировали меньше — разница не превышает 2.2%. Оптимизация BIOS дает в среднем 2.5% прироста. В интегральных оценках те же цифры, а максимальное значение составляет 5.8%.

Чипсет SiS 735

Продукт компании SiS осенью прошлого года уступил пальму лидерства среди SocketA разработке компании VIA — KT266A. Однако в области недорогих интегрированных решений чипсет SiS 735 занимает прочные позиции.



Материнская плата Chaintech 7SID имеет совсем мало настроек памяти в BIOS, и они не оказывают заметного влияния на результат. Однако это может быть вызвано и тем, что при автоматической настройке выставляется правильное значение CAS Latency, а этот параметр оказывает максимальное влияние на скорость работы системы.

Сводные данные по всем чипсетам

Как мы видели, настройка BIOS может существенно повлиять на скорость работы системы. Поскольку все мы стремимся получить как можно более высокие результаты,  то для итогового сравнения выбор, использовать ли базовые или тюнинговые данные, был решен в пользу последних. Для сокращения диаграмм, печальные результаты ALi MAGiK 1C с DDR333 мы приводить не стали.

Тесты CINT2000 зависят более от процессора и потому отличия среди систем не очень большие. Однако на общем фоне резко выделяется низкий результат NVIDIA nForce. В нескольких материалах, посвященных этому чипсету, было показано, что использование технологии DASP безусловно оказывает влияние на работу системы и рост скорости может достигать 25% в синтетических тестах (по сравнению с VIA KT266A). Но здесь мы видим совершенно противоположный результат — падение скорости составляет практически 37%. Это достаточно странно, поскольку эти подтесты SPEC CPU2000 основаны на известных задачах, в частности gzip, bzip2, gcc. А как мы видели по интегральным тестам типа Sysmark 2001, nForce идет наравне с решениями на базе VIA KT266A. Видимо, в данном случае DASP мешает процессору показать все свои возможности, внося задержки в обмен с памятью. Возможно, набор CFP2000 даст нам новые объяснения.

Все остальные чипсеты показывают результаты с разницей в пределах 6.5% при работе с PC2100. Использование более быстрой памяти PC2700 с KT333 увеличивает отрыв до 10.4%. Отметим и прекрасные результаты этого чипсета при работе с памятью на 133MHz. Прирост по сравнению с недавним лидером KT266A составляет здесь 5.1%. Среди чипсетов с поддержкой только PC2100 лидером является AMD 760MPX.

Интегральная оценка производительности в операциях с вещественными числами практически повторяет результат CINT2000. Только поменялись местами чипсеты от ALi и SiS. NVIDIA nForce снова отстает, хотя и не так сильно, как ранее — на 16.3% от KT266A. Остальные результаты укладываются в дельту 10%. Преимущество нового фаворита KT333 перед KT266A на PC2100 памяти достигает 5.9%. И снова для чисто DDR266 чипсетов лидер — AMD 760MPX. Пожалуй, это и правильно, поскольку для двухпроцессорных систем скорость работы с памятью имеет большое значение и инженеры AMD хорошо поработали над этим. Что касается тестов SMP конфигураций, они будут проведены позже.

Если для CINT2000 поведение участников на всех подтестах было практически одинаковым, в CFP2000 есть несколько интересных моментов. Мы рассмотрим 4 теста, два из которых показали ранее сильную зависимость от скорости памяти, а два других — больше от процессора.

Как вы видите, картина здесь интереснее,  чем с чипсетами для Pentium 4. Мы наблюдаем даже существенное отличие в результатах подтестов 171.swim и 179.art, хотя раньше считали, что они зависят исключительно от пропускной способности памяти. В первом лидеры KT333/DDR333 и AMD 760MPX, а во втором неожиданно на второе место выходит nForce, а в отстающие в этот раз попадает ALi MAGiK 1C. Напомним, что в 179.art программа оперирует всего четырьмя мегабайтами оперативной памяти во время работы. И в этом случае DASP, похоже, оказывает положительное влияние - результат nForce максимальный из всех PC2100 конфигураций. В паре тестов 177.mesa и 200.sixtrack, зависящих в основном от скорости процессора, тоже не все гладко — первый показывает снижение скорости nForce, тогда как второй к этому безразличен.

Выводы

Сокращенный вариант такой: лучшей платформой для процессора AMD Athlon XP по результатам наших тестов является чипсет VIA KT333 с памятью PC2700.

Однако если разобрать результаты полнее, то можно выделить несколько интересных подробностей:

  • использование VIA KT333 даже с памятью PC2100 позволяет получить до 15.5% прироста относительно KT266A (тест 181.mcf)
  • на некоторых задачах AMD 760MPX с PC2100 близок к KT333/PC2700 и прочно занимает второе место среди чипсетов для Socket A
  • несмотря на поддержку ALi MAGiK 1C работы с памятью DDR333 при 266 MHz FSB, реально это приводит к снижению производительности, что свидетельствует об очень плохой реализации асинхронной работы с памятью в этом чипсете
  • чипсет NVIDIA nForce не очень подходит для больших счетных задач
  • настройкой BIOS (и, конечно, использованием хорошей памяти) можно добиться значительного роста производительности системы



Дополнительно

Тест SPEC CPU2000. Часть 4 - работа на различных платформах для процессора AMD Athlon XP

SPEC CPU2000. Часть 4

В четвертой части цикла, посвященного тесту SPEC CPU2000, мы будем исследовать его работу на различных платформах для процессора AMD Athlon XP. А в качестве приятного дополнения изучим влияние настроек BIOS материнских плат на результаты этого теста.

Мы решили не включать в тест плату на чипсете VIA KT133A, поскольку все остальные представленные платформы ориентированны на память типа DDR SDRAM, а, как мы помним по тестам Intel Pentium 4,  PC133 память в тестах SPEC CPU2000 заметно ограничивает скорость. Ветеран AMD 760 был заменен на последнюю модификацию чипсета от AMD — 760MPX.

В тестах использовались следующие конфигурации:

  • AMD Athlon XP 1900+ (1600MHz)
  • чипсеты и представляющие их материнские платы
    • VIA KT333 — Gigabyte GA-7VRXP
    • VIA KT266A — ABIT KR7A
    • NVIDIA nForce — ASUS A7N266
    • ALi MAGiK 1C — Iwill XP333R
    • SiS 735 — Chaintech 7SID
    • AMD 760MPX — ASUS A7M266-D
  • два модуля памяти 256 MB PC2700 (были также использованы и как PC2100)
  • видеокарта GeForce2 Pro
  • IBM DTLA 15 GB 7200 RPM HDD
  • Windows 2000 Pro SP2
  • необходимые драйвера для чипсетов и видео

Конфигурация SPEC CPU2000 v1.1:

  • компиляторы Intel C/C++/Fortran 5.0.1
  • используется оптимизация под SSE
  • только base / speed метрики

Как уже было неоднократно показано, скорость работы материнских плат, выполненных на одном чипсете, практически не отличается. Исключение обычно составляют случаи недоработок в BIOSах и неточности тактовых генераторов..

Большинство плат может быть настроено на конфигурацию "Load Optimized Defaults", которая и будет отправной точкой при наших попытках увеличить скорость. Отметим, собственно настройки BIOS у плат обычно разные, что затрудняет прямое сравнение. Результаты разгона памяти также могут зависеть непосредственно от платы. Например, на плате Gigabyte мы смогли в обоих случаях (DDR266 и DDR333) установить лучшие по быстродействию параметры работы памяти. А вот ABIT не позволил нам поставить Command Rate в 1T. 

Поскольку установки по умолчанию определяются производителем платы и BIOS, а также учитывая то, что большинство пользователей все-таки не очень экспериментирует с тонкими настройками, рост скорости при ручной установке оптимальных параметров работы памяти можно считать мерой качества реализации BIOS. И этот момент тоже можно принимать во внимание при покупке платы.

Начнем с последней разработки компании VIA — чипсета KT333.

Чипсет VIA KT333

Кроме настроек в BIOS таймингов памяти, еще одним вариантом повышения производительности этой платформы является использование памяти PC2700, работающей на частоте 333MHz (DDR). Хотя, конечно, в чисто вычислительном тесте ожидать многого от повышения скорости обмена с памятью не приходится.



На результаты тестов CINT2000 большее влияние оказывает установка минимальных задержек для памяти, чем частота ее работы. Рост результатов интегральных оценок составляет примерно 8% для уменьшения таймингов и 3% для увеличения частоты.

Для CFP2000 мы видим более выраженный эффект — 11% для оптимизации задержек и 6% для использования DDR333. Оба теста показали, что хорошая (то есть, с минимальными таймингами) память PC2100 может быть лучше некоторых представителей PC2700. В силу специфики теста (отсутствие работы с жестким диском и видео) никто не ожидал большого прироста от использования памяти на частоте 333MHz DDR, однако полученные в некоторых подтестах приросты производительности в 12-15% выглядят интересно (при максимально возможных 25%).

Чипсет VIA KT266A

Ставший уже классическим чипсет KT266A продолжает пользоваться заслуженной популярностью как у производителей, так и покупателей.



В целом картина аналогична предыдущему случаю -  тонкая настройка BIOS дает нам рост в 7 и 12% для целочисленной и вещественной арифметики соответственно. Напомним еще раз, что эти цифры зависят в основном от правильности написания BIOS. Вторым фактором является качество модулей памяти и адекватность записанных в их SPD данных.

Чипсет AMD 760MPX

Последователь удачного чипсета с поддержкой самого популярного сегодня типа памяти DDR SDRAM также показал хорошие  результаты в наших тестах. С чипсетом 760MP компания AMD стартовала на рынке двухпроцессорных систем. А 760MPX с новым южным мостом добавляет и поддержку PCI64/66MHz к таким конфигурациям.



Как вы видите, ASUS сохраняет репутацию производителя, "выжимающего" все из чипсетов -  ручной настройкой можно добавить всего 5.3/6% к интегральным оценкам INT/FP. Тем более удачно это выглядит для нового продукта. А максимальным ростом производительности — 11% — отметился 181.mcf. Но это не стало неожиданностью — по предыдущей части мы знаем, что это наиболее чувствительный к скорости памяти тест из CINT2000.

Чипсет ALi MAGiK 1C

Это еще один чипсет, который официально поддерживает DDR333. Последняя версия BIOS позволяет установить частоту работы памяти 166MHz при 133MHz FSB. 



Однако, судя по результатам, лучше так не делать :(. Скорость работы в режиме DDR333 значительно ниже, чем в DDR266. При этом автоматические установки для PC2100 являются оптимальными, а попытка выставить другие значения таймингов оказалась неудачной — результаты даже уменьшились. Это может быть вызвано тем, что некоторые настройки в "ручном" режиме продолжают устанавливаться BIOSом без спроса пользователя.

Чипсет NVIDIA nForce 420D

На нашем экземпляре материнской платы в BIOS была только одна настройка скорости работы памяти — SDRAM CAS Latency. Кроме того, при работе с этим чипсетом мы использовали два варианта конфигурации модулей памяти — два (в первом и втором разъеме) и один (в первом разъеме). Как вы помните, согласно спецификации чипсета, в первом случае ширина шины памяти составляет 128 бит, а во втором только 64. Итого, в сравнении участвовало 3 варианта - 64 бит, установки по умолчанию; 128 бит, установки по умолчанию; 128 бит, оптимизированные установки.



По интегральным оценкам прирост от использования двухканального контроллера памяти составляет всего 0.5% для CINT2000 и 1.5% для CFP2000. По отдельным приложениям эффект больше — наиболее чувствительные к памяти 171.swim, 172.mgrid и 179.art показывают 11.4, 4.8 и 5.1 процентов выигрыша соответственно. Остальные приложения отреагировали меньше — разница не превышает 2.2%. Оптимизация BIOS дает в среднем 2.5% прироста. В интегральных оценках те же цифры, а максимальное значение составляет 5.8%.

Чипсет SiS 735

Продукт компании SiS осенью прошлого года уступил пальму лидерства среди SocketA разработке компании VIA — KT266A. Однако в области недорогих интегрированных решений чипсет SiS 735 занимает прочные позиции.



Материнская плата Chaintech 7SID имеет совсем мало настроек памяти в BIOS, и они не оказывают заметного влияния на результат. Однако это может быть вызвано и тем, что при автоматической настройке выставляется правильное значение CAS Latency, а этот параметр оказывает максимальное влияние на скорость работы системы.

Сводные данные по всем чипсетам

Как мы видели, настройка BIOS может существенно повлиять на скорость работы системы. Поскольку все мы стремимся получить как можно более высокие результаты,  то для итогового сравнения выбор, использовать ли базовые или тюнинговые данные, был решен в пользу последних. Для сокращения диаграмм, печальные результаты ALi MAGiK 1C с DDR333 мы приводить не стали.

Тесты CINT2000 зависят более от процессора и потому отличия среди систем не очень большие. Однако на общем фоне резко выделяется низкий результат NVIDIA nForce. В нескольких материалах, посвященных этому чипсету, было показано, что использование технологии DASP безусловно оказывает влияние на работу системы и рост скорости может достигать 25% в синтетических тестах (по сравнению с VIA KT266A). Но здесь мы видим совершенно противоположный результат — падение скорости составляет практически 37%. Это достаточно странно, поскольку эти подтесты SPEC CPU2000 основаны на известных задачах, в частности gzip, bzip2, gcc. А как мы видели по интегральным тестам типа Sysmark 2001, nForce идет наравне с решениями на базе VIA KT266A. Видимо, в данном случае DASP мешает процессору показать все свои возможности, внося задержки в обмен с памятью. Возможно, набор CFP2000 даст нам новые объяснения.

Все остальные чипсеты показывают результаты с разницей в пределах 6.5% при работе с PC2100. Использование более быстрой памяти PC2700 с KT333 увеличивает отрыв до 10.4%. Отметим и прекрасные результаты этого чипсета при работе с памятью на 133MHz. Прирост по сравнению с недавним лидером KT266A составляет здесь 5.1%. Среди чипсетов с поддержкой только PC2100 лидером является AMD 760MPX.

Интегральная оценка производительности в операциях с вещественными числами практически повторяет результат CINT2000. Только поменялись местами чипсеты от ALi и SiS. NVIDIA nForce снова отстает, хотя и не так сильно, как ранее — на 16.3% от KT266A. Остальные результаты укладываются в дельту 10%. Преимущество нового фаворита KT333 перед KT266A на PC2100 памяти достигает 5.9%. И снова для чисто DDR266 чипсетов лидер — AMD 760MPX. Пожалуй, это и правильно, поскольку для двухпроцессорных систем скорость работы с памятью имеет большое значение и инженеры AMD хорошо поработали над этим. Что касается тестов SMP конфигураций, они будут проведены позже.

Если для CINT2000 поведение участников на всех подтестах было практически одинаковым, в CFP2000 есть несколько интересных моментов. Мы рассмотрим 4 теста, два из которых показали ранее сильную зависимость от скорости памяти, а два других — больше от процессора.

Как вы видите, картина здесь интереснее,  чем с чипсетами для Pentium 4. Мы наблюдаем даже существенное отличие в результатах подтестов 171.swim и 179.art, хотя раньше считали, что они зависят исключительно от пропускной способности памяти. В первом лидеры KT333/DDR333 и AMD 760MPX, а во втором неожиданно на второе место выходит nForce, а в отстающие в этот раз попадает ALi MAGiK 1C. Напомним, что в 179.art программа оперирует всего четырьмя мегабайтами оперативной памяти во время работы. И в этом случае DASP, похоже, оказывает положительное влияние - результат nForce максимальный из всех PC2100 конфигураций. В паре тестов 177.mesa и 200.sixtrack, зависящих в основном от скорости процессора, тоже не все гладко — первый показывает снижение скорости nForce, тогда как второй к этому безразличен.

Выводы

Сокращенный вариант такой: лучшей платформой для процессора AMD Athlon XP по результатам наших тестов является чипсет VIA KT333 с памятью PC2700.

Однако если разобрать результаты полнее, то можно выделить несколько интересных подробностей:

  • использование VIA KT333 даже с памятью PC2100 позволяет получить до 15.5% прироста относительно KT266A (тест 181.mcf)
  • на некоторых задачах AMD 760MPX с PC2100 близок к KT333/PC2700 и прочно занимает второе место среди чипсетов для Socket A
  • несмотря на поддержку ALi MAGiK 1C работы с памятью DDR333 при 266 MHz FSB, реально это приводит к снижению производительности, что свидетельствует об очень плохой реализации асинхронной работы с памятью в этом чипсете
  • чипсет NVIDIA nForce не очень подходит для больших счетных задач
  • настройкой BIOS (и, конечно, использованием хорошей памяти) можно добиться значительного роста производительности системы