Двухпроцессорные системы на Athlon: "в десятку" с первого раза



Материал предоставлен Тестовой лабораторией ITC

С выходом первых процессоров Athlon компания AMD начала проводить очень агрессивную ценовую политику. Поскольку чип получился на редкость удачным, AMD смогла за короткие сроки отвоевать довольно большую долю рынка ПК. Но на "персоналках", как известно, компьютеры не заканчиваются, а сектор высокопроизводительных рабочих станций и серверов по-прежнему оставался "несокрушимым бастионом" Intel. Однако теперь AMD идет в атаку и на него…

Самое интересное в загадочной истории появления поддержки SMP в новом поколении процессоров AMD состоит в том, что, судя по заявлениям AMD, в двухпроцессорных конфигурациях могли работать даже первые Athlon (Slot A). Однако для построения многопроцессорной системы, как общеизвестно, нужен еще и соответствующий чипсет, и он появился лишь сейчас. С чем это связано? Как нам кажется, прежде всего с тем, что компании все это время было в некоторой степени "не до того". Сначала нужно было доказать производителям компьютеров и пользователям, что сам процессор устойчив в работе, демонстрирует высокую производительность и хорошую совместимость, словом — является выгодным приобретением. Потом — наладить его выпуск в количестве, необходимом для завоевания существенной части рынка. Далее — разработать его более совершенную версию (ядро Thunderbird), лишенную основных выявленных в процессе "рыночной обкатки" недостатков. А если учесть, что на новом ядре был налажен еще и выпуск low-end-варианта (Duron), то становится понятно, что дел было действительно невпроворот. И двухпроцессорность, скорее всего, решили отложить до более спокойных времен.

Также, наверняка, сыграл свою роль чисто рыночный прагматизм: продажи SMP-систем несравнимы с обычными по количеству, и таких же больших денег на них не заработаешь. Тем более что, как и в случае с выходом первых Athlon, AMD на этом рынке пришлось бы начинать практически с нуля — ни соответствующей репутации, ни налаженных контактов с производителями таких компьютеров у компании просто не было, да и быть не могло. К тому же потенциальный покупатель многопроцессорной системы очень сильно отличается от динамичного и падкого на новое "рядового пользователя" — его не убедишь сногсшибательными результатами в Quake III, здесь нужна надежность, стабильность… и опять-таки — репутация. Которая у AMD в данном случае не плоха, но и не хороша — она попросту отсутствует как таковая.

С этой точки зрения действительно было вполне оправданным решение не торопиться с выпуском многопроцессорного чипсета для Athlon, потратив значительное время на его доводку и отладку. От того, что он выйдет на полгода-год позже, компания теряла не так уж и много, но вот если бы его появление закончилось провалом — второго шанса AMD могли и не дать, и соответствующий сектор рынка оказался бы закрытым для нее если не навсегда, то очень надолго.

Чипсет AMD-760MP

Для начала ознакомимся вкратце с основными возможностями чипсета и поддерживаемыми им спецификациями:

  • северный мост AMD-762 (system controller);
    • поддержка одно- и двухпроцессорных конфигураций;
    • частоты FSB 200/266 MHz;
    • до 4 GB PC1600/PC2100 Registered DDR SDRAM;
    • до четырех слотов DIMM;
    • AGP 2.0 с поддержкой режимов 1X/2X/4X;
    • PCI 2.2 с частотой 33/66 MHz и поддержкой 32- и 64-битового режима;


  • южный мост AMD-766 (peripheral bus controller);
    • интерфейс с северным мостом посредством шины PCI;
    • двухканальный EIDE-контроллер с поддержкой UATA 33/66/100;
    • поддержка шин LPC (Low Pin Count) и SM-Bus;
    • USB-контроллер (четыре внешних порта);
    • встроенный IOAPIC, поддержка сериализации IRQ;
    • совместимость со спецификациями ACPI и Microsoft PC'99.

Учитывая то, что по спецификациям чипсет AMD-760MP очень похож на уже неоднократно рассмотренный нами ранее AMD-760, мы не будем описывать его полностью, а лишь остановимся на основных их отличиях.

Как легко заметить, анонсирована поддержка не только обычной 32-битовой 33-мегагерцевой шины PCI, но и более производительных вариантов: 64-битовая шина, работающая на частоте 33 MHz, и даже 64-битовая шина на частоте 66 MHz. Однако в спецификации тестируемой нами платы Tyan Thunder K7 указана возможность реализации только первого режима: 64 bit/33 MHz. Почему? Все становится понятно, если внимательно прочитать документацию на северный мост AMD-762. В ней присутствует очень интересная диаграмма, озаглавленная "AMD-760MPX System Block Diagram (66 MHz PCI)", и там вместо южного моста AMD-766 мы видим некий гипотетический "Future Southbridge". Теперь все понятно: на данный момент у AMD просто нет в наличии готовой микросхемы южного моста, способной работать в режиме 64 bit/66 MHz PCI, соответственно, не выпускаются и платы, поддерживающие такой режим.

Также хотелось бы обратить внимание на обязательность использования в системах на базе AMD-760MP регистровой (registered) памяти. Фактически это означает, что обычные PC1600/PC2100-модули, уже довольно распространенные, работать в подобных платах не будут.

Ну и напоследок: на сайте AMD мы обнаружили документ с весьма красноречивым названием "Incompatibilities between the AMD-762 System Controller and the VIA Technologies VT82C686B "Super South" Southbridge". Кратко анализируя содержимое данного документа, можно констатировать, что появления полюбившихся многим пользователям плат на комбинации северного моста AMD с южным от VIA в данном случае ждать не приходится. По крайней мере, сама AMD официально открещивается от такой возможности.

Tyan Thunder K7 — первая двухпроцессорная платформа под Socket A

Эта материнская плата на данный момент является единственным в мире решением на базе чипсета AMD-760MP, производимым в промышленных масштабах. Впрочем, ничего удивительного в этом нет — ведь именно Tyan являлась разработчиком reference-дизайна двухпроцессорных плат для AMD.

Плата относится к серии Thunder — самой старшей линейке материнских плат Tyan, предназначенных для рабочих станций и серверов. Фактически на Thunder K7 есть все, что нужно для построения на ее основе сервера или мощной рабочей станции. Взглянем на спецификацию платы:

  • чипсет AMD-760MP (AMD-762 плюс AMD-766);
  • два процессорных гнезда Socket A (Socket 462);
  • четыре разъема для Registered DDR DIMM;
  • пять слотов PCI 64 бита/33 MHz
  • один слот AGP Pro;
  • интегрированный видеоадаптер на базе ATI RageXL (4 MB видеопамяти);

  • два интегрированных чипа 3Com 3C920 10/100 Mb LAN и два сетевых разъема RJ45;

  • двухканальный Ultra 160 SCSI-контроллер Adaptec 7899W, два 68-контактных разъема LVD SCSI;

  • два коннектора IDE (UATA 33/66/100) и один FDD;
  • два COM-порта, LPT-порт, разъемы PS/2 (клавиатура и мышь);

  • четыре разъема USB (два дополнительных — в виде отдельной планки);
  • системный мониторинг на базе чипа Winbond W83627HF (LPC Super I/O + Hardware Monitor);
  • восемь разъемов для вентиляторов с мониторингом частоты вращения трех из них.

Заметим, что на Thunder K7 используются Ethernet-чипы производства 3Com, тогда как все прочие платы Tyan оснащаются микросхемами Intel 82559. Фактически плата предоставляет сборщику максимум удобства: практически все устройства, необходимость в которых может возникнуть при сборке готовой системы соответствующего класса, на плате уже есть, хотя каждое из них может быть отключено посредством перемычек. При тестировании мы так и поступили: после проверки на работоспособность были отключены встроенный графический чип и один из сетевых чипов. Но стоит отметить один отрицательный момент: и сетевой, и графический чипы, будучи отключенными с помощью перемычек, все равно нагревались при работе системы. Судя по всему, напряжение питания на них подается независимо от того, используются их функции или нет. Учитывая общую "прожорливость" системы (на этом мы подробнее остановимся ниже), такое решение представляется нам не очень удачным.

На Thunder K7 используется Phoenix ServerBIOS 2 Release 6.0. Набор опций BIOS Setup не отличается разнообразием — можно упомянуть разве что включение "фирменной" функции AMD Super Bypass (которая, кстати, работает только при установке одного процессора).

Настроечные функции Thunder K7 весьма небогаты, и этого следовало ожидать. Любимые оверклокерами функции тонкой настройки таймингов памяти или ставшая популярной опция изменения коэффициента умножения процессора — все это в "серьезной" материнской плате смотрелось бы совершенно неестественно. Фактически все, что разрешается делать, — отключать неиспользуемые устройства и выставлять перемычками частоту FSB 200/266 MHz.

Отдельного внимания заслуживает тот факт, что интегрированный на плату видеочип, возможностей которого будет вполне достаточно для сервера, подключен к шине PCI, а не к AGP. "Нелюбовь" сборщиков серверов к AGP-видеокартам давно известна, видимо, именно это и учитывали в Tyan при разработке дизайна платы. Также становится очевидной серверная ориентация платы при взгляде на наклоненные под углом 25 градусов разъемы для модулей памяти.

Такое решение применяется для сборки "стоечных" (rackmount) серверов в корпусах высотой 1U/2U. Но здесь есть один "подводный камень". Как известно, процессоры AMD Athlon, особенно с частотой более 1000 MHz, очень требовательны к подсистеме охлаждения. А кулеры, способные обеспечить их устойчивую работу, зачастую имеют высоту намного большую, чем даже расположенные обычным образом модули памяти. Поэтому для использования Thunder K7 в "стоечных" серверах, наверняка, придется прибегать к каким-либо "экзотическим" охлаждающим решениям (к примеру, низкопрофильным кулерам с медными радиаторами).

Блок питания

В данном случае нам пришлось отвести отдельный небольшой раздел для такой часто остающейся за кадром вещи, как блок питания (БП) системы. Учитывая энергопотребление старших моделей Athlon, блок питания для многопроцессорных систем на их базе должен быть очень мощным. На текущий момент в списке рекомендованных БП для платы Thunder K7 на сайте Tyan можно увидеть… всего две модели, производимые компаниями Delta и NMB. Мощность этих моделей -одинакова и составляет ни много ни мало 460 Вт.

Причина такой "энерголюбивости" становится понятной, если подсчитать, какая мощность требуется хотя бы просто двум процессорам AMD Athlon 1400 MHz. В режиме пиковой нагрузки один такой процессор потребляет более 70 Вт, соответственно для двух процессоров требуется порядка 140 Вт. Добавим к этому потребности чипсета, видеокарты (а слот AGP Pro позволяет установить очень "прожорливый" акселератор с потреблением до 110 Вт), SCSI-контроллера, сетевых и видеочипов... Если же прибавить к этому вполне естественно выглядящий в составе подобной системы SCSI-винчестер с частотой вращения шпинделя 10000 об/мин или же RAID-массив из нескольких таких дисков, то причина столь жестких требований Tyan к мощности БП для двухпроцессорной платы под Athlon становится понятной.

Отметим еще один принципиальный момент, касающийся платы Thunder K7 и совместимых с ней блоков питания. Именно совместимых, поскольку стандартный блок питания ATX, пусть даже и достаточно мощный, для этой материнской платы оказывается непригодным. Питание на Thunder K7 подается через два коннектора — основной 24-контактный (у стандартного БП этот разъем 20-контактный) и дополнительный 8-контактный, по которому от отдельного выпрямителя подводится питание для самих процессоров. Учитывая требовательность старших Athlon к питанию, такое решение выглядит крайне разумным. Минусом же является то, что подобные блоки питания нестандартны, в результате чего их стоимость, а следовательно, и стоимость соответствующих корпусов, будет поначалу довольно высокой.

         

Методика тестирования

В принципе, двухпроцессорная материнская плата может использоваться в достаточно широком классе систем — от графической станции или станции видеомонтажа до сервера (баз данных, Web-сервера и т. д.). Вспомним хотя бы старый добрый 440BX, двухпроцессорные платформы на базе которого использовались повсеместно. Точно так же один из "героев" нашего тестирования — плата Tyan Thunder K7 — учитывая ее оснащение, вполне могла бы использоваться в составе небольшого сервера.

Но рынок серверных систем, как известно, отличается значительной консервативностью в отношении новых "альтернативных" платформ. Это легко объяснимо: для серверов прежде всего важна стабильность и надежность, пусть даже в ущерб производительности и новым полезным возможностям. Возьмем хотя бы чипсет VIA Apollo Pro133A (694X), который, несмотря на поддержку двухпроцессорности, так и не нашел широкого применения в серверах. Вместе с тем многие компании используют платы на VIA 694X для производства недорогих графических станций.

Поэтому основное применение дуальных Athlon-систем на сегодняшний день видится именно в рабочих станциях. Соответственно основной упор в тестировании мы делали именно на задачах, свойственных таким компьютерам.

Для испытаний были подобраны тесты, использующие приложения из разных категорий — интенсивные расчетные задачи, работа с 2D-графикой, визуализация и рендеринг 3D-графики в профессиональных пакетах, обработка мультимедийных данных, видеомонтаж и пр. При этом включались как приложения, хорошо оптимизированные для работы в многопроцессорных системах, так и такие, которые получают минимальную прибавку в быстродействии от установки второго CPU. Итоговый набор тестов выглядел следующим образом:

  • Визуализация и рендеринг трехмерной сцены в 3D Studio MAX R4.
  • Рендеринг в Lightwave 6.5.
  • Adobe Photoshop 5.5 — набор тестов Grand Pix.
  • SPEC ViewPerf 6.1.2 — имитация работы в шести приложениях, использующих профессиональный OpenGL.
  • Стресс-тест с запуском нескольких копий архиватора, каждая их которых выполняла компрессию файла объемом 256 MB.
  • Кодирование видеоклипа в Windows Media Encoder 7.0.

В качестве дополнительного теста в двухпроцессорную Athlon-систему устанавливалась профессиональная плата захвата видео Pinnacle Targa 3000 и проверялась работа компьютера в качестве станции нелинейного видеомонтажа.

Более подробно каждый тест мы опишем вместе с его результатами, пока же перейдем к определению того, с какими же системами-конкурентами стоило бы сравнить двухпроцессорную Athlon-систему на предмет производительности и функциональных возможностей.

Конфигурации тестовых платформ

Официально в двухпроцессорных конфигурациях работают только CPU Athlon MP, но они пока нашего рынка не достигли. Поэтому Thunder K7 тестировалась с "обычными" Athlon с тактовыми частотами 1,4 GHz и 1 GHz (оба рассчитаны на FSB 266 MHz), которые вполне успешно работали "в паре". Собственно, второй вариант с Athlon 1 GHz был специально добавлен для сравнения с Pentium III такой же частоты (максимальной для доступных на рынке P-III).

Для этого, помимо основной тестовой платформы на базе Thunder K7, нам была предоставлена еще одна двухпроцессорная система на основе "тяжелой" платы от того же производителя — Tyan Thunder HEsl на чипсете ServerSet III HE-SL от ServerWorks. Обе платы — Thunder K7 и Thunder HEsl — обладают схожими возможностями и оснащены примерно одинаково — двухпроцессорность, поддержка до 4 GB регистровой памяти, интегрированные Ethernet-чип(ы) и контроллер Ultra 160 SCSI, слот AGP Pro, 64-битовая шина PCI. Цены обеих плат также находятся на одном уровне, и с учетом относительно небольшого разброса цен на процессоры стоимость конечных систем получается практически равной. Кроме того, для высокоуровневых рабочих станций, которым необходимы большие объемы памяти (2 GB и выше), платы на основе ServerSet III HE-SL являются на сегодня едва ли не единственным выбором. И именно с такими платформами придется конкурировать новым высокоуровневым моделям плат, использующих AMD-760MP.

Дополнительно нами были взяты еще две системы:

  • Двухпроцессорная на базе Pentium III и платы на чипсете VIA Apollo Pro133A (694X). Эта платформа выступала в качестве примера недорогой дуальной системы на P-III с несколько "урезанными" возможностями, но хорошим быстродействием.
  • Однопроцессорная с Pentium 4 1,7 GHz и платы на чипсете Intel i850. Эта платформа является на сегодня лидером по тактовой частоте процессора, и нам было интересно сравнить показатели ее быстродействия с результатами двухпроцессорных систем в различных классах задач.

Конфигурации тестовых стендов приведены в таблице. Во всех системах использовалось по 512 MB памяти соответствующих типов и жесткие диски IBM Ultrastar 36LZX (10000 об/мин, Ultra 160 SCSI, 4 MB кэш). В качестве видеокарты устанавливались AGP-акселераторы на базе GeForce3 (ASUS V8200 Deluxe с 64 MB памяти), которые хорошо показывают себя, в том числе и в профессиональных OpenGL-приложениях, достойно справляясь с отображением как текстурированных, так и каркасных 3D-моделей.

Еще одним кандидатом на участие в тестировании была двухпроцессорная система на основе 440BX. Однако двухпроцессорные платы на 440BX оснащаются разъемами Slot 1, а быстрые процессоры Pentium III, рассчитанные на разъем Slot 1 и частоту шины 100 MHz, являются все большим дефицитом. Поэтому дуальный 440BX в число тестируемых не попал, хотя списывать такие системы со счетов, несмотря на почтенный возраст чипсета, по-прежнему рано.

Испытания проводились под управлением Windows 2000 Professional с Service Pack 2, DirectX 8.0а и драйверами Detonator 12.41. Для каждой системы (кроме Pentium 4) все тесты запускались как в одно-, так и в двухпроцессорных конфигурациях. Для дуальной Athlon-системы использовался блок питания Delta DPS465AB-A, для остальных — БП FSP Group мощностью 250 или 300 Вт.

Конфигурации тестовых систем:

ПроцессорAthlonPentium IIIPentium IIIPentium 4
Тактовые частоты1,4 GHz/1 GHz1 GHz1 GHz1,7 GHz
ЧипсетAMD-760MPServerSet III HE-SLVIA 694X (Apollo Pro 133A)Intel i850
Материнская платаTyan Thunder K7 (S2462UNG)Tyan Thunder HEsl (S2567U3AN)Tyan Tiger 200 (S2505DNGR)AOpen AX4T
Память512 MB Registered PC2100 DDR SDRAM512 MB Registered PC133 SDRAM с ECC512 MB PC133 SDRAM512 MB PC800 RDRAM
Жесткий дискIBM Ultrastar 36LZX (DDYS-T18350, 10000 rpm, 4 MB буфер)
SCSI-контроллерAdaptec AIC-7899W (интегр.)LSI Symbios 53C1010-66 (интегр.)Adaptec 29160N
ВидеокартаASUS V8200 Deluxe (NVIDIA GeForce3, 64 MB)

Результаты тестов и комментарии

Рендеринг и визуализация в 3D Studio MAX R4

3D Studio MAX — без преувеличения самый популярный пакет 3D-моделирования, а его алгоритмы рендеринга чрезвычайно эффективно используют возможности многопроцессорных систем. Мы провели два теста в 3D Studio MAX R4. В первом производился финальный рендеринг сцены размером 800 * 600 точек, содержащей 32252 полигонов и 16 источников света. Результатом теста являлось время, за которое каждая система выполнила расчет.

Как можно видеть, все системы получают практически двойное ускорение при установке второго процессора, а абсолютным чемпионом является Athlon 1,4 GHz — как в одно-, так и в двухпроцессорной конфигурации. Младший Athlon 1 GHz показывает второй результат, ощутимо опережая в этом тесте и систему с Pentium 4, и обе системы на Pentium III. Таким образом, и обычные, а тем более дуальные Athlon-системы выглядят достаточно привлекательно для тех, кто работает в 3D Studio MAX. Быстродействие при рендеринге в этом пакете определяется исключительно "вычислительной мощью" — ни подсистема памяти, ни видеоподсистема в данном случае влияния не оказывают, в результате чего две совершенно разные платформы на Pentium III (ServerSet III HE-SL и VIA 694X) демонстрирует абсолютно одинаковую производительность.

Второй тест с использованием 3D Studio MAX задействует видеоподсистему и замеряет скорость отображения движущихся объектов в окнах проекции. Работа со сценой в окнах проекции с задействованием каркасных моделей — это то, с чем сталкиваются все пользователи пакета, и от того, насколько быстро идет перерисовка, во многом зависит эффективность работы.

Мы провели достаточно тяжелый тест: в четырех окнах проекции отображались различные представления сцены, содержащей 28688 полигонов. Использовалась аппаратная OpenGL-акселерация видеокарты, для режима wireframe включалось сглаживание линий (anti-aliasing). Естественно, кроме самой видеокарты, в тесте задействуется центральный процессор(ы), а также шина AGP, по которой поступают данные к акселератору. В этом случае результаты, полученные с одним и с двумя процессорами, практически не различаются, мы приводим данные для двухпроцессорных конфигураций.

Здесь во всей красе проявила себя система с Pentium 4, которая более чем наполовину опередила ближайшего конкурента — дуальный Athlon 1,4 GHz. Скорее всего, сказалась оптимизация драйверов видеокарты (NVidia в последнее время очень много внимания уделяла SSE2) и "родная" AGP от Intel (все-таки вряд ли кто-то реализует эту шину в чипсете лучше, чем компания, которая ее разработала).

Система на основе Pentium III и платы Thunder HEsl (чипсет ServerWorks) несколько отстала от аналогичной системы на VIA 694X. Как известно, реализация AGP в чипсете ServerWorks оставляет желать лучшего, однако в данном тесте это проявилось лишь отчасти.

Рендеринг в LightWave 6.5

Этот пакет от компании NewTek весьма распространен и входит в тройку самых популярных программ 3D-моделирования и анимации. Мы также включили его в состав тестов, поскольку алгоритмы рендеринга LightWave 6.5 значительно отличаются от тех, которые используются в 3D Studio MAX. На всех системах выполнялся рендеринг сцены, состоящей из пяти объектов, содержащей 10080 полигонов и три источника света и использующей эффекты отражения и преломления. Размер изображения задавался 1000 * 1000 пикселов, в настройках рендеринга явно указывалось число потоков (threads), равное количеству имеющихся процессоров.

Основная особенность LightWave (и именно с этой точки зрения он более всего интересен) в том, что это "неродное" для платформы Wintel (Windows/Intel) приложение — первоначально этот пакет был разработан для компьютеров Silicon Graphics. Соответственно, можно предположить, что его расчетная часть вряд ли подвергалась существенным изменениям, т. е. по коду она является "чистым x86", без учета каких-нибудь специфических особенностей конкретных процессоров Intel или AMD.

И результат не заставил себя ждать — все процессоры с одинаковой частотой показали примерно равные результаты, а первое место занял Athlon 1,4 GHz (как в одно-, так и в двухпроцессорной подгруппе). Pentium 4 оказался "в хвосте", несмотря на самую высокую среди всех участников частоту, что еще раз подтверждает давно уже известную специфику этого CPU — в приложениях, не оптимизированных с учетом его особенностей, он, как правило, не показывает хороших результатов.

Adobe Photoshop, тест Grand Pix

Как известно, Photoshop является стандартом де-факто для обработки растровой графики. Тесты Grand Pix (разработка компании Wega Distribution), уже неоднократно применявшиеся нами, состоят из набора сценариев для Adobe Photoshop 5.5, задействующего максимально полный спектр его возможностей. Этот тест более предпочтителен, чем использование всего нескольких эффектов ("фильтров"), — известно, что в зависимости от их подбора могут получиться совершенно разные результаты. Для данного тестирования использовалась первая часть пакета Grand Pix, работающая с .psd-файлом объемом 20 MB. Таким образом, почти все операции выполнялись в оперативной памяти без обращений к жесткому диску.

При одинаковой частоте Pentium III и Athlon показывают примерно равные результаты с небольшим преимуществом Athlon — как в одно-, так и в двухпроцессорных конфигурациях. Pentium 4 1,7 GHz немного обогнал дуальный Athlon 1 GHz, но отстал от однопроцессорной системы на базе Athlon 1,4 GHz. Ну а абсолютным чемпионом, как нетрудно догадаться, стала система на дуальном Athlon 1,4 GHz. Хорошо заметно, что прирост производительности в Photoshop на двухпроцессорных системах наблюдается, но не очень большой — порядка 12-14% (совершенно несравнимо с теми же 3D Studio MAX и Lightwave, где он в некоторых случаях почти двукратный). По результатам отдельных подтестов (здесь мы их не приводим из соображений экономии места) можно сказать, что сильнее всего многопроцессорность влияет на результаты операций поворота изображения, работы с градиентами и фильтрами Blur/Sharpen (в них выигрыш установки в систему второго CPU с такой же частотой составляет до 50%).

Двухпроцессорность и Photoshop — более детально

Мы решили более детально исследовать то, насколько Adobe Photoshop чувствителен к двухпроцессорности.

Тестовая лаборатория ITC достаточно давно использует набор тестов Grand Pix, разработанный в киевской компании Wega Distribution. Тесты состоят из набора скриптов для Adobe Photoshop 5.5, задействующих максимально полный набор возможностей программы. Соответственно, с их помощью можно проверить то, насколько различные операции Photoshop, этого повсеместно используемого приложения, чувствительны к различным изменениям в конфигурации.

На диаграммах — результаты для двух различных двухпроцессорных систем, прирост быстродействия от установки второго CPU. Тесты разбиты на подгруппы, соответствующие категориям операций Photoshop, мы приводим результаты производительности для этих категорий.


Можем видеть, что в обоих случаях картина одинакова:

  • операции поворота и масштабирования (Rotate, Scale, Transform) — прирост от установки второго процессора 17-18%
  • операции градиентной заливки, работы с областямы выделения и слоями (Gradients, Selections, Layers) — 34-35%
  • фильтры Sharpen, Blur and Noise — 55%
  • фильтры Distort and Clouds — 8-12%

В остальных случаях прироста нет ровным счетом никакого (разницу в 2-3% мы, естественно, не учитываем).

Таким образом, широко используемый Photoshop 5.5 может считаться частично оптимизированным под SMP (Symmetrical Multy Processing). Далеко не во всех операциях использование двухпроцессорной системы даст выигрыш, но в некоторых все же дает, и довольно большой. А поскольку среди графических пакетов очень многие по-настоящему оптимизированы под SMP (например, 3D Studio MAX, LightWave и др.), то двухпроцессорная графическая станция является "тем что доктор прописал"... естественно, если позволяют средства.

Windows Media Encoder 7.0

Это приложение было взято нами из состава Pentium 4 Application Launcher, и, как легко догадаться по названию, оно предназначено для кодирования аудиовидеоданных (в этом конкретном случае файл формата AVI кодировался в формат WMV). Windows Media Encoder 7.0 оптимизирован для наборов инструкций SSE/SSE2, но, с другой стороны, он очень хорошо умеет использовать второй процессор при его наличии в системе. Таким образом, это приложение в известной степени уравнивает шансы многопроцессорных систем на базе AMD Athlon (не поддерживающих SSE/SSE2) и системы на Pentium 4 (не поддерживающей многопроцессорность).

Результаты — соответствующие: Pentium 4 1,7 GHz обогнал в этом тесте все без исключения однопроцессорные конфигурации, но в то же время все-таки уступил системе на дуальном Athlon 1,4 GHz (и довольно существенно — порядка 13%). Интересно еще и то, что однопроцессорная система на Athlon 1 GHz уступила однопроцессорной же системе на Pentium III с аналогичной частотой, а вот при добавлении второго CPU ситуация изменилась — наоборот, выиграла система на базе дуального Athlon. Похоже, что в некоторых случаях использование двухпроцессорности при прочих равных условиях дает больший выигрыш на Athlon, чем на Pentium III.

Архивация с помощью WinAce

Этот тест проводился следующим образом: на системах последовательно с интервалом в 5 секунд запускалось от одной до восьми копий архиватора WinAce, каждой из которых давалась команда на упаковку тестового файла размером 256 MB (с максимальными сжатием и размером словаря). Измерялся временной интервал от запуска первого процесса до окончания выполнения последнего.

Отметим, что этот тест довольно близок по характеру нагрузки к серверу приложений. Для такого сервера основная польза от многопроцессорности проявляется не в ускорении исполнения специально оптимизированных под SMP приложений, а просто в умении системы равномерно распределять между процессорами нагрузку, создаваемую массой "однопроцессорных" задач, исполняемых на сервере разными пользователями. Конечно, в реальном сервере приложений и памяти на каждого пользователя отводится больше, да и количество одновременно исполняемых приложений может быть свыше восьми, однако… при взгляде на график становится понятно, что приведенное нами сравнение не столь уж некорректно.

Действительно: четко видно, что с увеличением числа процессов время выполнения всего теста возрастает линейно. Пожалуй, основной вывод из этого теста может звучать так: при одновременном исполнении нескольких одинаковых процессов выигрыш от SMP строго пропорционален количеству процессоров. То есть, к примеру, четыре однотипных задачи на однопроцессорной системе закончат выполнение одновременно с восемью задачами на системе с двумя процессорами (при прочих равных условиях).

В этом тесте все системы на базе процессоров с одинаковой частотой продемонстрировали редкостное единодушие: результаты Pentium III и Athlon 1 GHz в одиночном и дуальном варианте, как легко заметить, практически полностью идентичны, а показатели Pentium III 1 GHz на чипсетах VIA 694X и ServerWorks HE-SL мы вообще объединили, потому что разница между ними измерялась в десятых долях процента.

Выводы очевидны: системы на процессорах Intel Pentium III и AMD Athlon одинаково хорошо справляются с большим количеством одновременно исполняемых приложений. Свидетельствует это, скорее, в пользу AMD — ей "с первого захода" удалось сделать поддержку SMP, ничем не уступающую по качеству довольно давно разрабатываемым решениям на базе процессоров Intel. А если учесть, что Athlon уверенно опережает Pentium III по максимальным частотам, то, право же, это дает серьезную почву для размышлений. Что же касается Pentium 4, то многозадачность — явно "не его конек", системе на базе этого процессора удалось обогнать лишь только однопроцессорные конфигурации с частотой 1 GHz (т. е. на 70% меньшей, чем у него!).

SPEC ViewPerf 6.1.2

Картина производительности в большинстве подтестов была во многом сходной, поэтому мы решили ограничиться приведением результатов двух самых показательных — AWadvs-04 (Alias|Wavefront Advanced Visualizer) и DX-06 (IBM Data Explorer).

Первое, что бросается в глаза, — существенное преимущество системы на базе Intel Pentium 4. Сразу скажем, что во всех остальных подтестах оно сохранилось. Мы уже упоминали ранее возможную причину — компания NVIDIA постоянно оптимизирует свои драйверы, "выжимая" из доступных наборов дополнительных инструкций все что только можно, а поддержке SSE2 в новых Detonator 12.41 даже был посвящен отдельный пресс-релиз. Похоже, что, по крайней мере в данном случае, этот набор команд полностью оправдал надежды компании и помог Pentium 4 продемонстрировать всю свою мощь.

Однако не менее интересны результаты других систем. Например, в подтесте AWadvs четко видно, что у чипсета ServerWorks серьезные проблемы с некоторыми аспектами производительности — результаты однопроцессорной системы очень низкие, и даже второй процессор не исправляет положения. Причем, что интересно, только на этой системе видна какая-то польза от многопроцессорности. Как нам кажется, это связано с тем, что во всех остальных случаях производительность уже обусловливается исключительно видеокартой и скоростью передачи данных по шине AGP, т. е. второму процессору просто "нечего делать". А вот VIA 694X, наоборот, на фоне ServerSet HE-SL выглядит очень даже неплохо.

В IBM Data Explorer ситуация, в принципе, повторяется, с той лишь разницей, что никакого реального преимущества от второго процессора не видно вообще нигде. Распределение мест также не изменилось: впереди Pentium 4 1,7 GHz, за ним — обе системы на Athlon (соответственно частотам), в комбинации с Pentium III лучше показал себя чипсет VIA.

Особенности производительности SMP-систем, или
Почему нет тестов в SYSmark?

Исследование производительности в SYSmark 2000/2001 на самом деле проводилось, но мы сознательно исключили его результаты из статьи по причине того, что они… по сути, ни о чем не свидетельствуют. Специфика этого теста состоит в том, что реально в каждый момент времени только одно приложение является активным, к тому же в его составе почти нет задач, оптимизированных для SMP-систем. В результате при взгляде на раскладку результатов по отдельным приложениям четко видно, что лишь в подтестах Netscape Communicator (это может показаться странным, но данный броузер поддерживает многопоточность!) и Windows Media Encoder наблюдается прирост производительности в двухпроцессорных системах. Все остальные приложения либо никак не реагируют на наличие второго процессора в системе, либо (и того хуже) показывают более низкие результаты.

В принципе, ничего нового в этом нет. Уже давно известно, что многопроцессорность как способ повышения производительности имеет смысл либо когда на SMP-системе исполняются приложения, специально для этого оптимизированные (вариант "рабочей станции"), либо множество задач одновременно (вариант "сервер"). Тест SYSmark не подходит ни под одно из этих определений, поэтому в данном случае его результаты были бы совершенно неинформативными.

Захват и обработка видео

В качестве дополнительного теста дуальной Athlon-системы мы провели ее испытания на предмет пригодности для обработки видео. Для этого в нее устанавливалась высокопроизводительная плата нелинейного видеомонтажа Pinnacle Targa 3000 в комплекте с коммутационным пультом (наверное, для непосвященных лучшим свидетельством о "серьезности" этого оборудования будет его цена — порядка 7 тыс. долл.). Плата Targa 3000 способна в реальном времени и без предварительных просчетов одновременно обрабатывать до четырех слоев видео или три слоя видео плюс пять графических слоев. Обладая очень высокой производительностью, она вместе с тем весьма требовательна к аппаратной платформе. Обязательными являются наличие 64-битовой шины PCI и дисковая подсистема с высокой пропускной способностью, так как поток видео в данном случае может достигать 40 MBps при захвате видео и 160 MBps при проигрывании.

Испытания проводились лишь на двух из четырех тестовых систем (на платах Thunder K7 и Thunder HEsl), поскольку две другие платформы не поддерживают 64-битовую шину PCI. В каждую из двух систем добавлялись четыре SCSI-винчестера Seagate Barracuda 36ES 18,4 GB, которые объединялись в stripped-массив (RAID 0). Видеофрагмент оцифровывался и записывался на жесткий диск, после чего выполнялось его редактирование в Adobe Premiere с наложением эффектов и дополнительных слоев видео.

Этот тест носил в основном качественный характер, и по его результатам обе системы — и Thunder K7 с двумя Athlon 1,4 GHz, и Thunder HEsl с двумя P-III 1 GHz — оказались вполне пригодными для таких задач. Athlon-система работала стабильно, а ее "время отклика" оказалось ощутимо меньшим (не только за счет более высокой тактовой частоты процессоров). Отметим, что в случае с Thunder K7 использовалась та же AGP-видеокарта, что и в других тестах. Вместе с тем на Thunder HEsl ввиду "особенностей" реализации поддержки AGP в чипсете ServerSet HE-SL нормальная работа с видео становится возможной лишь при установке видеокарты с интерфейсом PCI. В итоге дуальная Athlon-система достаточно неплохо показала себя в задачах видеомонтажа, не вызвав никаких проблем ни при установке и настройке оборудования, ни в процессе работы.

"Декларация состоятельности"

Подведение итогов знакомства с двухпроцессорной Athlon-системой мы начнем, пожалуй, с впечатлений (хотя их и нельзя назвать стопроцентно объективным критерием оценки). Одним из основных моментов, которые мы постарались выяснить, являлась даже не столько производительность новой платформы, сколько ее устойчивость, совместимость и возможное наличие тех "подводных камней", которые при эксплуатации могут испортить впечатление, несмотря на выдающиеся скоростные характеристики.

К примеру, установка OC. Эта процедура должна быть элементарной, и если уже на этом этапе начинают возникать сложности, то что уж говорить обо всем остальном? Windows 2000 на систему с AMD-760MP установилась совершенно беспроблемно. Видимо, следуя примеру VIA Technologies, AMD сейчас распространяет со своего сайта так называемый AMD Drivers Pack, который при запуске сам определяет чипсет и операционную систему и "в один прием" устанавливает все необходимые драйверы. Собственно, его запуском с последующей перезагрузкой и исчерпывается весь список операций, необходимых для правильной работы ОС с этим чипсетом.

В процессе прохождения тестов система ни разу не зависала, ни одно приложение не завершило работу с сообщением об ошибке. Да, так и должно быть. И тем не менее, описывая новую платформу, мы считаем вполне уместным упомянуть о том, что система на базе AMD-760MP работала именно так, как и должна работать любая хорошая, стабильная система. С нашей точки зрения, это ничуть не менее важно, чем характеристики производительности.

Место под солнцем

Что же касается производительности и в более широком смысле — позиционирования компьютеров на базе нового чипсета, то тут все немного сложнее. Как нам кажется, новая платформа от AMD является самым сильным конкурентом для аналогичных по функциональности систем на базе Pentium III, т. е. продуктов на основе чипсетов ServerWorks, Intel i440GX и двухпроцессорных систем на базе i820/i840, оснащенных RDRAM.

VIA 694X (Apollo Pro133A) по отношению к AMD-760MP находится в совершенно другой весовой категории — компьютер на основе этого чипсета обойдется значительно дешевле, но в то же время он будет намного менее функциональным с точки зрения "тяжелых" задач: в два раза меньший максимальный объем ОЗУ, отсутствие поддержки 64-битовой шины PCI и так далее. Чипсет Apollo Pro266 — пока еще "темная лошадка", да и по производительности ненамного выше Apollo Pro133A, несмотря на поддержку DDR SDRAM. Таким образом, дешевую двухпроцессорную систему на AMD-760MP собрать просто не получится, а дорогую на чипсетах VIA для платформы Socket 370 — вряд ли имеет смысл.

Pentium 4 благодаря своей специфике очень хорош для определенного круга задач, но этот круг все-таки значительно уже, чем возможная область применения двухпроцессорных систем на базе AMD Athlon. Что же касается Pentium 4 Xeon (серверного варианта этого процессора), то по отношению к нему уже AMD-760MP выглядит "приемлемым по цене решением", ибо стоимость системы с хотя бы двумя Pentium 4 Xeon и соответствующим объемом RDRAM-памяти для многих покупателей еще остается нереально большой.

А вот "высокоуровневые" двухпроцессорные чипсеты для платформы Socket 370 (мы уже перечисляли их выше) получили в лице AMD-760MP действительно весьма серьезного конкурента. AMD Athlon традиционно обгоняет Pentium III по максимальной частоте, поэтому даже в тех случаях, когда "при равных условиях" быстродействие двухпроцессорных систем на базе этих процессоров и оказывается одинаковым, на базе AMD-760MP все равно можно собрать более производительный компьютер просто за счет установки CPU с большей частотой. По всем прочим характеристикам новый чипсет AMD также "на высоте", а единственный недостаток в виде отсутствия в текущем варианте поддержки 64-битовой 66 MHz PCI, скорее всего, будет исправлен в очень короткие сроки. Естественно, финальный вердикт вынесет только время — когда будет накоплена статистика отказоустойчивости, стабильности в работе, совместимости и прочих весьма критичных для высокоуровневой платформы параметров. Но, как мы уже писали выше, пока что новый чипсет AMD оставил у нас самые благоприятные впечатления.

Вместо P. S., или
"Мы не так богаты, чтобы покупать дешевые вещи"

Возможно, у кого-то возникнет вопрос, почему в этом тестировании не была затронута тема дуального Duron. Вкратце скажем так: мы пробовали, "это" работает. То есть при установке в систему с Tyan Thunder K7 двух процессоров AMD Duron 800 система Windows 2000 загрузилась, "увидела" оба процессора и без проблем запускала всевозможнейшие приложения. Однако… а имеет ли смысл собирать такую систему сейчас? Стоимость платы и памяти настолько сильно перекрывает разницу между ценой Athlon и Duron, что экономия получается копеечной, а результат — весьма неоднозначным. Во-первых, по максимальной частоте Athlon обгоняет Duron более чем в полтора раза, а во-вторых, ввиду отсутствия оверклокерских функций на плате работать Duron будет на штатной 200-мегагерцевой FSB, что, безусловно, скажется на производительности системы. В результате при минимальной экономии мы получим серьезнейший downgrade по производительности. Быть может, в будущем ситуация изменится, но пока что двухпроцессорные системы на Duron могут быть интересны, по нашему мнению, только в качестве забавной экзотики, но не более того.

SMP системы на базе Pentium III и Athlon предоставлены компанией OST
Материнские платы Tyan предоставлены компанией Entry




Дополнительно

TYAN Thunder K7 - SMP система на базе чипсета AMD 760MP

Двухпроцессорные системы на Athlon: "в десятку" с первого раза


Материал предоставлен Тестовой лабораторией ITC

С выходом первых процессоров Athlon компания AMD начала проводить очень агрессивную ценовую политику. Поскольку чип получился на редкость удачным, AMD смогла за короткие сроки отвоевать довольно большую долю рынка ПК. Но на "персоналках", как известно, компьютеры не заканчиваются, а сектор высокопроизводительных рабочих станций и серверов по-прежнему оставался "несокрушимым бастионом" Intel. Однако теперь AMD идет в атаку и на него…

Самое интересное в загадочной истории появления поддержки SMP в новом поколении процессоров AMD состоит в том, что, судя по заявлениям AMD, в двухпроцессорных конфигурациях могли работать даже первые Athlon (Slot A). Однако для построения многопроцессорной системы, как общеизвестно, нужен еще и соответствующий чипсет, и он появился лишь сейчас. С чем это связано? Как нам кажется, прежде всего с тем, что компании все это время было в некоторой степени "не до того". Сначала нужно было доказать производителям компьютеров и пользователям, что сам процессор устойчив в работе, демонстрирует высокую производительность и хорошую совместимость, словом — является выгодным приобретением. Потом — наладить его выпуск в количестве, необходимом для завоевания существенной части рынка. Далее — разработать его более совершенную версию (ядро Thunderbird), лишенную основных выявленных в процессе "рыночной обкатки" недостатков. А если учесть, что на новом ядре был налажен еще и выпуск low-end-варианта (Duron), то становится понятно, что дел было действительно невпроворот. И двухпроцессорность, скорее всего, решили отложить до более спокойных времен.

Также, наверняка, сыграл свою роль чисто рыночный прагматизм: продажи SMP-систем несравнимы с обычными по количеству, и таких же больших денег на них не заработаешь. Тем более что, как и в случае с выходом первых Athlon, AMD на этом рынке пришлось бы начинать практически с нуля — ни соответствующей репутации, ни налаженных контактов с производителями таких компьютеров у компании просто не было, да и быть не могло. К тому же потенциальный покупатель многопроцессорной системы очень сильно отличается от динамичного и падкого на новое "рядового пользователя" — его не убедишь сногсшибательными результатами в Quake III, здесь нужна надежность, стабильность… и опять-таки — репутация. Которая у AMD в данном случае не плоха, но и не хороша — она попросту отсутствует как таковая.

С этой точки зрения действительно было вполне оправданным решение не торопиться с выпуском многопроцессорного чипсета для Athlon, потратив значительное время на его доводку и отладку. От того, что он выйдет на полгода-год позже, компания теряла не так уж и много, но вот если бы его появление закончилось провалом — второго шанса AMD могли и не дать, и соответствующий сектор рынка оказался бы закрытым для нее если не навсегда, то очень надолго.

Чипсет AMD-760MP

Для начала ознакомимся вкратце с основными возможностями чипсета и поддерживаемыми им спецификациями:

  • северный мост AMD-762 (system controller);
    • поддержка одно- и двухпроцессорных конфигураций;
    • частоты FSB 200/266 MHz;
    • до 4 GB PC1600/PC2100 Registered DDR SDRAM;
    • до четырех слотов DIMM;
    • AGP 2.0 с поддержкой режимов 1X/2X/4X;
    • PCI 2.2 с частотой 33/66 MHz и поддержкой 32- и 64-битового режима;


  • южный мост AMD-766 (peripheral bus controller);
    • интерфейс с северным мостом посредством шины PCI;
    • двухканальный EIDE-контроллер с поддержкой UATA 33/66/100;
    • поддержка шин LPC (Low Pin Count) и SM-Bus;
    • USB-контроллер (четыре внешних порта);
    • встроенный IOAPIC, поддержка сериализации IRQ;
    • совместимость со спецификациями ACPI и Microsoft PC'99.

Учитывая то, что по спецификациям чипсет AMD-760MP очень похож на уже неоднократно рассмотренный нами ранее AMD-760, мы не будем описывать его полностью, а лишь остановимся на основных их отличиях.

Как легко заметить, анонсирована поддержка не только обычной 32-битовой 33-мегагерцевой шины PCI, но и более производительных вариантов: 64-битовая шина, работающая на частоте 33 MHz, и даже 64-битовая шина на частоте 66 MHz. Однако в спецификации тестируемой нами платы Tyan Thunder K7 указана возможность реализации только первого режима: 64 bit/33 MHz. Почему? Все становится понятно, если внимательно прочитать документацию на северный мост AMD-762. В ней присутствует очень интересная диаграмма, озаглавленная "AMD-760MPX System Block Diagram (66 MHz PCI)", и там вместо южного моста AMD-766 мы видим некий гипотетический "Future Southbridge". Теперь все понятно: на данный момент у AMD просто нет в наличии готовой микросхемы южного моста, способной работать в режиме 64 bit/66 MHz PCI, соответственно, не выпускаются и платы, поддерживающие такой режим.

Также хотелось бы обратить внимание на обязательность использования в системах на базе AMD-760MP регистровой (registered) памяти. Фактически это означает, что обычные PC1600/PC2100-модули, уже довольно распространенные, работать в подобных платах не будут.

Ну и напоследок: на сайте AMD мы обнаружили документ с весьма красноречивым названием "Incompatibilities between the AMD-762 System Controller and the VIA Technologies VT82C686B "Super South" Southbridge". Кратко анализируя содержимое данного документа, можно констатировать, что появления полюбившихся многим пользователям плат на комбинации северного моста AMD с южным от VIA в данном случае ждать не приходится. По крайней мере, сама AMD официально открещивается от такой возможности.

Tyan Thunder K7 — первая двухпроцессорная платформа под Socket A

Эта материнская плата на данный момент является единственным в мире решением на базе чипсета AMD-760MP, производимым в промышленных масштабах. Впрочем, ничего удивительного в этом нет — ведь именно Tyan являлась разработчиком reference-дизайна двухпроцессорных плат для AMD.

Плата относится к серии Thunder — самой старшей линейке материнских плат Tyan, предназначенных для рабочих станций и серверов. Фактически на Thunder K7 есть все, что нужно для построения на ее основе сервера или мощной рабочей станции. Взглянем на спецификацию платы:

  • чипсет AMD-760MP (AMD-762 плюс AMD-766);
  • два процессорных гнезда Socket A (Socket 462);
  • четыре разъема для Registered DDR DIMM;
  • пять слотов PCI 64 бита/33 MHz
  • один слот AGP Pro;
  • интегрированный видеоадаптер на базе ATI RageXL (4 MB видеопамяти);

  • два интегрированных чипа 3Com 3C920 10/100 Mb LAN и два сетевых разъема RJ45;

  • двухканальный Ultra 160 SCSI-контроллер Adaptec 7899W, два 68-контактных разъема LVD SCSI;

  • два коннектора IDE (UATA 33/66/100) и один FDD;
  • два COM-порта, LPT-порт, разъемы PS/2 (клавиатура и мышь);

  • четыре разъема USB (два дополнительных — в виде отдельной планки);
  • системный мониторинг на базе чипа Winbond W83627HF (LPC Super I/O + Hardware Monitor);
  • восемь разъемов для вентиляторов с мониторингом частоты вращения трех из них.

Заметим, что на Thunder K7 используются Ethernet-чипы производства 3Com, тогда как все прочие платы Tyan оснащаются микросхемами Intel 82559. Фактически плата предоставляет сборщику максимум удобства: практически все устройства, необходимость в которых может возникнуть при сборке готовой системы соответствующего класса, на плате уже есть, хотя каждое из них может быть отключено посредством перемычек. При тестировании мы так и поступили: после проверки на работоспособность были отключены встроенный графический чип и один из сетевых чипов. Но стоит отметить один отрицательный момент: и сетевой, и графический чипы, будучи отключенными с помощью перемычек, все равно нагревались при работе системы. Судя по всему, напряжение питания на них подается независимо от того, используются их функции или нет. Учитывая общую "прожорливость" системы (на этом мы подробнее остановимся ниже), такое решение представляется нам не очень удачным.

На Thunder K7 используется Phoenix ServerBIOS 2 Release 6.0. Набор опций BIOS Setup не отличается разнообразием — можно упомянуть разве что включение "фирменной" функции AMD Super Bypass (которая, кстати, работает только при установке одного процессора).

Настроечные функции Thunder K7 весьма небогаты, и этого следовало ожидать. Любимые оверклокерами функции тонкой настройки таймингов памяти или ставшая популярной опция изменения коэффициента умножения процессора — все это в "серьезной" материнской плате смотрелось бы совершенно неестественно. Фактически все, что разрешается делать, — отключать неиспользуемые устройства и выставлять перемычками частоту FSB 200/266 MHz.

Отдельного внимания заслуживает тот факт, что интегрированный на плату видеочип, возможностей которого будет вполне достаточно для сервера, подключен к шине PCI, а не к AGP. "Нелюбовь" сборщиков серверов к AGP-видеокартам давно известна, видимо, именно это и учитывали в Tyan при разработке дизайна платы. Также становится очевидной серверная ориентация платы при взгляде на наклоненные под углом 25 градусов разъемы для модулей памяти.

Такое решение применяется для сборки "стоечных" (rackmount) серверов в корпусах высотой 1U/2U. Но здесь есть один "подводный камень". Как известно, процессоры AMD Athlon, особенно с частотой более 1000 MHz, очень требовательны к подсистеме охлаждения. А кулеры, способные обеспечить их устойчивую работу, зачастую имеют высоту намного большую, чем даже расположенные обычным образом модули памяти. Поэтому для использования Thunder K7 в "стоечных" серверах, наверняка, придется прибегать к каким-либо "экзотическим" охлаждающим решениям (к примеру, низкопрофильным кулерам с медными радиаторами).

Блок питания

В данном случае нам пришлось отвести отдельный небольшой раздел для такой часто остающейся за кадром вещи, как блок питания (БП) системы. Учитывая энергопотребление старших моделей Athlon, блок питания для многопроцессорных систем на их базе должен быть очень мощным. На текущий момент в списке рекомендованных БП для платы Thunder K7 на сайте Tyan можно увидеть… всего две модели, производимые компаниями Delta и NMB. Мощность этих моделей -одинакова и составляет ни много ни мало 460 Вт.

Причина такой "энерголюбивости" становится понятной, если подсчитать, какая мощность требуется хотя бы просто двум процессорам AMD Athlon 1400 MHz. В режиме пиковой нагрузки один такой процессор потребляет более 70 Вт, соответственно для двух процессоров требуется порядка 140 Вт. Добавим к этому потребности чипсета, видеокарты (а слот AGP Pro позволяет установить очень "прожорливый" акселератор с потреблением до 110 Вт), SCSI-контроллера, сетевых и видеочипов... Если же прибавить к этому вполне естественно выглядящий в составе подобной системы SCSI-винчестер с частотой вращения шпинделя 10000 об/мин или же RAID-массив из нескольких таких дисков, то причина столь жестких требований Tyan к мощности БП для двухпроцессорной платы под Athlon становится понятной.

Отметим еще один принципиальный момент, касающийся платы Thunder K7 и совместимых с ней блоков питания. Именно совместимых, поскольку стандартный блок питания ATX, пусть даже и достаточно мощный, для этой материнской платы оказывается непригодным. Питание на Thunder K7 подается через два коннектора — основной 24-контактный (у стандартного БП этот разъем 20-контактный) и дополнительный 8-контактный, по которому от отдельного выпрямителя подводится питание для самих процессоров. Учитывая требовательность старших Athlon к питанию, такое решение выглядит крайне разумным. Минусом же является то, что подобные блоки питания нестандартны, в результате чего их стоимость, а следовательно, и стоимость соответствующих корпусов, будет поначалу довольно высокой.

         

Методика тестирования

В принципе, двухпроцессорная материнская плата может использоваться в достаточно широком классе систем — от графической станции или станции видеомонтажа до сервера (баз данных, Web-сервера и т. д.). Вспомним хотя бы старый добрый 440BX, двухпроцессорные платформы на базе которого использовались повсеместно. Точно так же один из "героев" нашего тестирования — плата Tyan Thunder K7 — учитывая ее оснащение, вполне могла бы использоваться в составе небольшого сервера.

Но рынок серверных систем, как известно, отличается значительной консервативностью в отношении новых "альтернативных" платформ. Это легко объяснимо: для серверов прежде всего важна стабильность и надежность, пусть даже в ущерб производительности и новым полезным возможностям. Возьмем хотя бы чипсет VIA Apollo Pro133A (694X), который, несмотря на поддержку двухпроцессорности, так и не нашел широкого применения в серверах. Вместе с тем многие компании используют платы на VIA 694X для производства недорогих графических станций.

Поэтому основное применение дуальных Athlon-систем на сегодняшний день видится именно в рабочих станциях. Соответственно основной упор в тестировании мы делали именно на задачах, свойственных таким компьютерам.

Для испытаний были подобраны тесты, использующие приложения из разных категорий — интенсивные расчетные задачи, работа с 2D-графикой, визуализация и рендеринг 3D-графики в профессиональных пакетах, обработка мультимедийных данных, видеомонтаж и пр. При этом включались как приложения, хорошо оптимизированные для работы в многопроцессорных системах, так и такие, которые получают минимальную прибавку в быстродействии от установки второго CPU. Итоговый набор тестов выглядел следующим образом:

  • Визуализация и рендеринг трехмерной сцены в 3D Studio MAX R4.
  • Рендеринг в Lightwave 6.5.
  • Adobe Photoshop 5.5 — набор тестов Grand Pix.
  • SPEC ViewPerf 6.1.2 — имитация работы в шести приложениях, использующих профессиональный OpenGL.
  • Стресс-тест с запуском нескольких копий архиватора, каждая их которых выполняла компрессию файла объемом 256 MB.
  • Кодирование видеоклипа в Windows Media Encoder 7.0.

В качестве дополнительного теста в двухпроцессорную Athlon-систему устанавливалась профессиональная плата захвата видео Pinnacle Targa 3000 и проверялась работа компьютера в качестве станции нелинейного видеомонтажа.

Более подробно каждый тест мы опишем вместе с его результатами, пока же перейдем к определению того, с какими же системами-конкурентами стоило бы сравнить двухпроцессорную Athlon-систему на предмет производительности и функциональных возможностей.

Конфигурации тестовых платформ

Официально в двухпроцессорных конфигурациях работают только CPU Athlon MP, но они пока нашего рынка не достигли. Поэтому Thunder K7 тестировалась с "обычными" Athlon с тактовыми частотами 1,4 GHz и 1 GHz (оба рассчитаны на FSB 266 MHz), которые вполне успешно работали "в паре". Собственно, второй вариант с Athlon 1 GHz был специально добавлен для сравнения с Pentium III такой же частоты (максимальной для доступных на рынке P-III).

Для этого, помимо основной тестовой платформы на базе Thunder K7, нам была предоставлена еще одна двухпроцессорная система на основе "тяжелой" платы от того же производителя — Tyan Thunder HEsl на чипсете ServerSet III HE-SL от ServerWorks. Обе платы — Thunder K7 и Thunder HEsl — обладают схожими возможностями и оснащены примерно одинаково — двухпроцессорность, поддержка до 4 GB регистровой памяти, интегрированные Ethernet-чип(ы) и контроллер Ultra 160 SCSI, слот AGP Pro, 64-битовая шина PCI. Цены обеих плат также находятся на одном уровне, и с учетом относительно небольшого разброса цен на процессоры стоимость конечных систем получается практически равной. Кроме того, для высокоуровневых рабочих станций, которым необходимы большие объемы памяти (2 GB и выше), платы на основе ServerSet III HE-SL являются на сегодня едва ли не единственным выбором. И именно с такими платформами придется конкурировать новым высокоуровневым моделям плат, использующих AMD-760MP.

Дополнительно нами были взяты еще две системы:

  • Двухпроцессорная на базе Pentium III и платы на чипсете VIA Apollo Pro133A (694X). Эта платформа выступала в качестве примера недорогой дуальной системы на P-III с несколько "урезанными" возможностями, но хорошим быстродействием.
  • Однопроцессорная с Pentium 4 1,7 GHz и платы на чипсете Intel i850. Эта платформа является на сегодня лидером по тактовой частоте процессора, и нам было интересно сравнить показатели ее быстродействия с результатами двухпроцессорных систем в различных классах задач.

Конфигурации тестовых стендов приведены в таблице. Во всех системах использовалось по 512 MB памяти соответствующих типов и жесткие диски IBM Ultrastar 36LZX (10000 об/мин, Ultra 160 SCSI, 4 MB кэш). В качестве видеокарты устанавливались AGP-акселераторы на базе GeForce3 (ASUS V8200 Deluxe с 64 MB памяти), которые хорошо показывают себя, в том числе и в профессиональных OpenGL-приложениях, достойно справляясь с отображением как текстурированных, так и каркасных 3D-моделей.

Еще одним кандидатом на участие в тестировании была двухпроцессорная система на основе 440BX. Однако двухпроцессорные платы на 440BX оснащаются разъемами Slot 1, а быстрые процессоры Pentium III, рассчитанные на разъем Slot 1 и частоту шины 100 MHz, являются все большим дефицитом. Поэтому дуальный 440BX в число тестируемых не попал, хотя списывать такие системы со счетов, несмотря на почтенный возраст чипсета, по-прежнему рано.

Испытания проводились под управлением Windows 2000 Professional с Service Pack 2, DirectX 8.0а и драйверами Detonator 12.41. Для каждой системы (кроме Pentium 4) все тесты запускались как в одно-, так и в двухпроцессорных конфигурациях. Для дуальной Athlon-системы использовался блок питания Delta DPS465AB-A, для остальных — БП FSP Group мощностью 250 или 300 Вт.

Конфигурации тестовых систем:

ПроцессорAthlonPentium IIIPentium IIIPentium 4
Тактовые частоты1,4 GHz/1 GHz1 GHz1 GHz1,7 GHz
ЧипсетAMD-760MPServerSet III HE-SLVIA 694X (Apollo Pro 133A)Intel i850
Материнская платаTyan Thunder K7 (S2462UNG)Tyan Thunder HEsl (S2567U3AN)Tyan Tiger 200 (S2505DNGR)AOpen AX4T
Память512 MB Registered PC2100 DDR SDRAM512 MB Registered PC133 SDRAM с ECC512 MB PC133 SDRAM512 MB PC800 RDRAM
Жесткий дискIBM Ultrastar 36LZX (DDYS-T18350, 10000 rpm, 4 MB буфер)
SCSI-контроллерAdaptec AIC-7899W (интегр.)LSI Symbios 53C1010-66 (интегр.)Adaptec 29160N
ВидеокартаASUS V8200 Deluxe (NVIDIA GeForce3, 64 MB)

Результаты тестов и комментарии

Рендеринг и визуализация в 3D Studio MAX R4

3D Studio MAX — без преувеличения самый популярный пакет 3D-моделирования, а его алгоритмы рендеринга чрезвычайно эффективно используют возможности многопроцессорных систем. Мы провели два теста в 3D Studio MAX R4. В первом производился финальный рендеринг сцены размером 800 * 600 точек, содержащей 32252 полигонов и 16 источников света. Результатом теста являлось время, за которое каждая система выполнила расчет.

Как можно видеть, все системы получают практически двойное ускорение при установке второго процессора, а абсолютным чемпионом является Athlon 1,4 GHz — как в одно-, так и в двухпроцессорной конфигурации. Младший Athlon 1 GHz показывает второй результат, ощутимо опережая в этом тесте и систему с Pentium 4, и обе системы на Pentium III. Таким образом, и обычные, а тем более дуальные Athlon-системы выглядят достаточно привлекательно для тех, кто работает в 3D Studio MAX. Быстродействие при рендеринге в этом пакете определяется исключительно "вычислительной мощью" — ни подсистема памяти, ни видеоподсистема в данном случае влияния не оказывают, в результате чего две совершенно разные платформы на Pentium III (ServerSet III HE-SL и VIA 694X) демонстрирует абсолютно одинаковую производительность.

Второй тест с использованием 3D Studio MAX задействует видеоподсистему и замеряет скорость отображения движущихся объектов в окнах проекции. Работа со сценой в окнах проекции с задействованием каркасных моделей — это то, с чем сталкиваются все пользователи пакета, и от того, насколько быстро идет перерисовка, во многом зависит эффективность работы.

Мы провели достаточно тяжелый тест: в четырех окнах проекции отображались различные представления сцены, содержащей 28688 полигонов. Использовалась аппаратная OpenGL-акселерация видеокарты, для режима wireframe включалось сглаживание линий (anti-aliasing). Естественно, кроме самой видеокарты, в тесте задействуется центральный процессор(ы), а также шина AGP, по которой поступают данные к акселератору. В этом случае результаты, полученные с одним и с двумя процессорами, практически не различаются, мы приводим данные для двухпроцессорных конфигураций.

Здесь во всей красе проявила себя система с Pentium 4, которая более чем наполовину опередила ближайшего конкурента — дуальный Athlon 1,4 GHz. Скорее всего, сказалась оптимизация драйверов видеокарты (NVidia в последнее время очень много внимания уделяла SSE2) и "родная" AGP от Intel (все-таки вряд ли кто-то реализует эту шину в чипсете лучше, чем компания, которая ее разработала).

Система на основе Pentium III и платы Thunder HEsl (чипсет ServerWorks) несколько отстала от аналогичной системы на VIA 694X. Как известно, реализация AGP в чипсете ServerWorks оставляет желать лучшего, однако в данном тесте это проявилось лишь отчасти.

Рендеринг в LightWave 6.5

Этот пакет от компании NewTek весьма распространен и входит в тройку самых популярных программ 3D-моделирования и анимации. Мы также включили его в состав тестов, поскольку алгоритмы рендеринга LightWave 6.5 значительно отличаются от тех, которые используются в 3D Studio MAX. На всех системах выполнялся рендеринг сцены, состоящей из пяти объектов, содержащей 10080 полигонов и три источника света и использующей эффекты отражения и преломления. Размер изображения задавался 1000 * 1000 пикселов, в настройках рендеринга явно указывалось число потоков (threads), равное количеству имеющихся процессоров.

Основная особенность LightWave (и именно с этой точки зрения он более всего интересен) в том, что это "неродное" для платформы Wintel (Windows/Intel) приложение — первоначально этот пакет был разработан для компьютеров Silicon Graphics. Соответственно, можно предположить, что его расчетная часть вряд ли подвергалась существенным изменениям, т. е. по коду она является "чистым x86", без учета каких-нибудь специфических особенностей конкретных процессоров Intel или AMD.

И результат не заставил себя ждать — все процессоры с одинаковой частотой показали примерно равные результаты, а первое место занял Athlon 1,4 GHz (как в одно-, так и в двухпроцессорной подгруппе). Pentium 4 оказался "в хвосте", несмотря на самую высокую среди всех участников частоту, что еще раз подтверждает давно уже известную специфику этого CPU — в приложениях, не оптимизированных с учетом его особенностей, он, как правило, не показывает хороших результатов.

Adobe Photoshop, тест Grand Pix

Как известно, Photoshop является стандартом де-факто для обработки растровой графики. Тесты Grand Pix (разработка компании Wega Distribution), уже неоднократно применявшиеся нами, состоят из набора сценариев для Adobe Photoshop 5.5, задействующего максимально полный спектр его возможностей. Этот тест более предпочтителен, чем использование всего нескольких эффектов ("фильтров"), — известно, что в зависимости от их подбора могут получиться совершенно разные результаты. Для данного тестирования использовалась первая часть пакета Grand Pix, работающая с .psd-файлом объемом 20 MB. Таким образом, почти все операции выполнялись в оперативной памяти без обращений к жесткому диску.

При одинаковой частоте Pentium III и Athlon показывают примерно равные результаты с небольшим преимуществом Athlon — как в одно-, так и в двухпроцессорных конфигурациях. Pentium 4 1,7 GHz немного обогнал дуальный Athlon 1 GHz, но отстал от однопроцессорной системы на базе Athlon 1,4 GHz. Ну а абсолютным чемпионом, как нетрудно догадаться, стала система на дуальном Athlon 1,4 GHz. Хорошо заметно, что прирост производительности в Photoshop на двухпроцессорных системах наблюдается, но не очень большой — порядка 12-14% (совершенно несравнимо с теми же 3D Studio MAX и Lightwave, где он в некоторых случаях почти двукратный). По результатам отдельных подтестов (здесь мы их не приводим из соображений экономии места) можно сказать, что сильнее всего многопроцессорность влияет на результаты операций поворота изображения, работы с градиентами и фильтрами Blur/Sharpen (в них выигрыш установки в систему второго CPU с такой же частотой составляет до 50%).

Двухпроцессорность и Photoshop — более детально

Мы решили более детально исследовать то, насколько Adobe Photoshop чувствителен к двухпроцессорности.

Тестовая лаборатория ITC достаточно давно использует набор тестов Grand Pix, разработанный в киевской компании Wega Distribution. Тесты состоят из набора скриптов для Adobe Photoshop 5.5, задействующих максимально полный набор возможностей программы. Соответственно, с их помощью можно проверить то, насколько различные операции Photoshop, этого повсеместно используемого приложения, чувствительны к различным изменениям в конфигурации.

На диаграммах — результаты для двух различных двухпроцессорных систем, прирост быстродействия от установки второго CPU. Тесты разбиты на подгруппы, соответствующие категориям операций Photoshop, мы приводим результаты производительности для этих категорий.


Можем видеть, что в обоих случаях картина одинакова:

  • операции поворота и масштабирования (Rotate, Scale, Transform) — прирост от установки второго процессора 17-18%
  • операции градиентной заливки, работы с областямы выделения и слоями (Gradients, Selections, Layers) — 34-35%
  • фильтры Sharpen, Blur and Noise — 55%
  • фильтры Distort and Clouds — 8-12%

В остальных случаях прироста нет ровным счетом никакого (разницу в 2-3% мы, естественно, не учитываем).

Таким образом, широко используемый Photoshop 5.5 может считаться частично оптимизированным под SMP (Symmetrical Multy Processing). Далеко не во всех операциях использование двухпроцессорной системы даст выигрыш, но в некоторых все же дает, и довольно большой. А поскольку среди графических пакетов очень многие по-настоящему оптимизированы под SMP (например, 3D Studio MAX, LightWave и др.), то двухпроцессорная графическая станция является "тем что доктор прописал"... естественно, если позволяют средства.

Windows Media Encoder 7.0

Это приложение было взято нами из состава Pentium 4 Application Launcher, и, как легко догадаться по названию, оно предназначено для кодирования аудиовидеоданных (в этом конкретном случае файл формата AVI кодировался в формат WMV). Windows Media Encoder 7.0 оптимизирован для наборов инструкций SSE/SSE2, но, с другой стороны, он очень хорошо умеет использовать второй процессор при его наличии в системе. Таким образом, это приложение в известной степени уравнивает шансы многопроцессорных систем на базе AMD Athlon (не поддерживающих SSE/SSE2) и системы на Pentium 4 (не поддерживающей многопроцессорность).

Результаты — соответствующие: Pentium 4 1,7 GHz обогнал в этом тесте все без исключения однопроцессорные конфигурации, но в то же время все-таки уступил системе на дуальном Athlon 1,4 GHz (и довольно существенно — порядка 13%). Интересно еще и то, что однопроцессорная система на Athlon 1 GHz уступила однопроцессорной же системе на Pentium III с аналогичной частотой, а вот при добавлении второго CPU ситуация изменилась — наоборот, выиграла система на базе дуального Athlon. Похоже, что в некоторых случаях использование двухпроцессорности при прочих равных условиях дает больший выигрыш на Athlon, чем на Pentium III.

Архивация с помощью WinAce

Этот тест проводился следующим образом: на системах последовательно с интервалом в 5 секунд запускалось от одной до восьми копий архиватора WinAce, каждой из которых давалась команда на упаковку тестового файла размером 256 MB (с максимальными сжатием и размером словаря). Измерялся временной интервал от запуска первого процесса до окончания выполнения последнего.

Отметим, что этот тест довольно близок по характеру нагрузки к серверу приложений. Для такого сервера основная польза от многопроцессорности проявляется не в ускорении исполнения специально оптимизированных под SMP приложений, а просто в умении системы равномерно распределять между процессорами нагрузку, создаваемую массой "однопроцессорных" задач, исполняемых на сервере разными пользователями. Конечно, в реальном сервере приложений и памяти на каждого пользователя отводится больше, да и количество одновременно исполняемых приложений может быть свыше восьми, однако… при взгляде на график становится понятно, что приведенное нами сравнение не столь уж некорректно.

Действительно: четко видно, что с увеличением числа процессов время выполнения всего теста возрастает линейно. Пожалуй, основной вывод из этого теста может звучать так: при одновременном исполнении нескольких одинаковых процессов выигрыш от SMP строго пропорционален количеству процессоров. То есть, к примеру, четыре однотипных задачи на однопроцессорной системе закончат выполнение одновременно с восемью задачами на системе с двумя процессорами (при прочих равных условиях).

В этом тесте все системы на базе процессоров с одинаковой частотой продемонстрировали редкостное единодушие: результаты Pentium III и Athlon 1 GHz в одиночном и дуальном варианте, как легко заметить, практически полностью идентичны, а показатели Pentium III 1 GHz на чипсетах VIA 694X и ServerWorks HE-SL мы вообще объединили, потому что разница между ними измерялась в десятых долях процента.

Выводы очевидны: системы на процессорах Intel Pentium III и AMD Athlon одинаково хорошо справляются с большим количеством одновременно исполняемых приложений. Свидетельствует это, скорее, в пользу AMD — ей "с первого захода" удалось сделать поддержку SMP, ничем не уступающую по качеству довольно давно разрабатываемым решениям на базе процессоров Intel. А если учесть, что Athlon уверенно опережает Pentium III по максимальным частотам, то, право же, это дает серьезную почву для размышлений. Что же касается Pentium 4, то многозадачность — явно "не его конек", системе на базе этого процессора удалось обогнать лишь только однопроцессорные конфигурации с частотой 1 GHz (т. е. на 70% меньшей, чем у него!).

SPEC ViewPerf 6.1.2

Картина производительности в большинстве подтестов была во многом сходной, поэтому мы решили ограничиться приведением результатов двух самых показательных — AWadvs-04 (Alias|Wavefront Advanced Visualizer) и DX-06 (IBM Data Explorer).

Первое, что бросается в глаза, — существенное преимущество системы на базе Intel Pentium 4. Сразу скажем, что во всех остальных подтестах оно сохранилось. Мы уже упоминали ранее возможную причину — компания NVIDIA постоянно оптимизирует свои драйверы, "выжимая" из доступных наборов дополнительных инструкций все что только можно, а поддержке SSE2 в новых Detonator 12.41 даже был посвящен отдельный пресс-релиз. Похоже, что, по крайней мере в данном случае, этот набор команд полностью оправдал надежды компании и помог Pentium 4 продемонстрировать всю свою мощь.

Однако не менее интересны результаты других систем. Например, в подтесте AWadvs четко видно, что у чипсета ServerWorks серьезные проблемы с некоторыми аспектами производительности — результаты однопроцессорной системы очень низкие, и даже второй процессор не исправляет положения. Причем, что интересно, только на этой системе видна какая-то польза от многопроцессорности. Как нам кажется, это связано с тем, что во всех остальных случаях производительность уже обусловливается исключительно видеокартой и скоростью передачи данных по шине AGP, т. е. второму процессору просто "нечего делать". А вот VIA 694X, наоборот, на фоне ServerSet HE-SL выглядит очень даже неплохо.

В IBM Data Explorer ситуация, в принципе, повторяется, с той лишь разницей, что никакого реального преимущества от второго процессора не видно вообще нигде. Распределение мест также не изменилось: впереди Pentium 4 1,7 GHz, за ним — обе системы на Athlon (соответственно частотам), в комбинации с Pentium III лучше показал себя чипсет VIA.

Особенности производительности SMP-систем, или
Почему нет тестов в SYSmark?

Исследование производительности в SYSmark 2000/2001 на самом деле проводилось, но мы сознательно исключили его результаты из статьи по причине того, что они… по сути, ни о чем не свидетельствуют. Специфика этого теста состоит в том, что реально в каждый момент времени только одно приложение является активным, к тому же в его составе почти нет задач, оптимизированных для SMP-систем. В результате при взгляде на раскладку результатов по отдельным приложениям четко видно, что лишь в подтестах Netscape Communicator (это может показаться странным, но данный броузер поддерживает многопоточность!) и Windows Media Encoder наблюдается прирост производительности в двухпроцессорных системах. Все остальные приложения либо никак не реагируют на наличие второго процессора в системе, либо (и того хуже) показывают более низкие результаты.

В принципе, ничего нового в этом нет. Уже давно известно, что многопроцессорность как способ повышения производительности имеет смысл либо когда на SMP-системе исполняются приложения, специально для этого оптимизированные (вариант "рабочей станции"), либо множество задач одновременно (вариант "сервер"). Тест SYSmark не подходит ни под одно из этих определений, поэтому в данном случае его результаты были бы совершенно неинформативными.

Захват и обработка видео

В качестве дополнительного теста дуальной Athlon-системы мы провели ее испытания на предмет пригодности для обработки видео. Для этого в нее устанавливалась высокопроизводительная плата нелинейного видеомонтажа Pinnacle Targa 3000 в комплекте с коммутационным пультом (наверное, для непосвященных лучшим свидетельством о "серьезности" этого оборудования будет его цена — порядка 7 тыс. долл.). Плата Targa 3000 способна в реальном времени и без предварительных просчетов одновременно обрабатывать до четырех слоев видео или три слоя видео плюс пять графических слоев. Обладая очень высокой производительностью, она вместе с тем весьма требовательна к аппаратной платформе. Обязательными являются наличие 64-битовой шины PCI и дисковая подсистема с высокой пропускной способностью, так как поток видео в данном случае может достигать 40 MBps при захвате видео и 160 MBps при проигрывании.

Испытания проводились лишь на двух из четырех тестовых систем (на платах Thunder K7 и Thunder HEsl), поскольку две другие платформы не поддерживают 64-битовую шину PCI. В каждую из двух систем добавлялись четыре SCSI-винчестера Seagate Barracuda 36ES 18,4 GB, которые объединялись в stripped-массив (RAID 0). Видеофрагмент оцифровывался и записывался на жесткий диск, после чего выполнялось его редактирование в Adobe Premiere с наложением эффектов и дополнительных слоев видео.

Этот тест носил в основном качественный характер, и по его результатам обе системы — и Thunder K7 с двумя Athlon 1,4 GHz, и Thunder HEsl с двумя P-III 1 GHz — оказались вполне пригодными для таких задач. Athlon-система работала стабильно, а ее "время отклика" оказалось ощутимо меньшим (не только за счет более высокой тактовой частоты процессоров). Отметим, что в случае с Thunder K7 использовалась та же AGP-видеокарта, что и в других тестах. Вместе с тем на Thunder HEsl ввиду "особенностей" реализации поддержки AGP в чипсете ServerSet HE-SL нормальная работа с видео становится возможной лишь при установке видеокарты с интерфейсом PCI. В итоге дуальная Athlon-система достаточно неплохо показала себя в задачах видеомонтажа, не вызвав никаких проблем ни при установке и настройке оборудования, ни в процессе работы.

"Декларация состоятельности"

Подведение итогов знакомства с двухпроцессорной Athlon-системой мы начнем, пожалуй, с впечатлений (хотя их и нельзя назвать стопроцентно объективным критерием оценки). Одним из основных моментов, которые мы постарались выяснить, являлась даже не столько производительность новой платформы, сколько ее устойчивость, совместимость и возможное наличие тех "подводных камней", которые при эксплуатации могут испортить впечатление, несмотря на выдающиеся скоростные характеристики.

К примеру, установка OC. Эта процедура должна быть элементарной, и если уже на этом этапе начинают возникать сложности, то что уж говорить обо всем остальном? Windows 2000 на систему с AMD-760MP установилась совершенно беспроблемно. Видимо, следуя примеру VIA Technologies, AMD сейчас распространяет со своего сайта так называемый AMD Drivers Pack, который при запуске сам определяет чипсет и операционную систему и "в один прием" устанавливает все необходимые драйверы. Собственно, его запуском с последующей перезагрузкой и исчерпывается весь список операций, необходимых для правильной работы ОС с этим чипсетом.

В процессе прохождения тестов система ни разу не зависала, ни одно приложение не завершило работу с сообщением об ошибке. Да, так и должно быть. И тем не менее, описывая новую платформу, мы считаем вполне уместным упомянуть о том, что система на базе AMD-760MP работала именно так, как и должна работать любая хорошая, стабильная система. С нашей точки зрения, это ничуть не менее важно, чем характеристики производительности.

Место под солнцем

Что же касается производительности и в более широком смысле — позиционирования компьютеров на базе нового чипсета, то тут все немного сложнее. Как нам кажется, новая платформа от AMD является самым сильным конкурентом для аналогичных по функциональности систем на базе Pentium III, т. е. продуктов на основе чипсетов ServerWorks, Intel i440GX и двухпроцессорных систем на базе i820/i840, оснащенных RDRAM.

VIA 694X (Apollo Pro133A) по отношению к AMD-760MP находится в совершенно другой весовой категории — компьютер на основе этого чипсета обойдется значительно дешевле, но в то же время он будет намного менее функциональным с точки зрения "тяжелых" задач: в два раза меньший максимальный объем ОЗУ, отсутствие поддержки 64-битовой шины PCI и так далее. Чипсет Apollo Pro266 — пока еще "темная лошадка", да и по производительности ненамного выше Apollo Pro133A, несмотря на поддержку DDR SDRAM. Таким образом, дешевую двухпроцессорную систему на AMD-760MP собрать просто не получится, а дорогую на чипсетах VIA для платформы Socket 370 — вряд ли имеет смысл.

Pentium 4 благодаря своей специфике очень хорош для определенного круга задач, но этот круг все-таки значительно уже, чем возможная область применения двухпроцессорных систем на базе AMD Athlon. Что же касается Pentium 4 Xeon (серверного варианта этого процессора), то по отношению к нему уже AMD-760MP выглядит "приемлемым по цене решением", ибо стоимость системы с хотя бы двумя Pentium 4 Xeon и соответствующим объемом RDRAM-памяти для многих покупателей еще остается нереально большой.

А вот "высокоуровневые" двухпроцессорные чипсеты для платформы Socket 370 (мы уже перечисляли их выше) получили в лице AMD-760MP действительно весьма серьезного конкурента. AMD Athlon традиционно обгоняет Pentium III по максимальной частоте, поэтому даже в тех случаях, когда "при равных условиях" быстродействие двухпроцессорных систем на базе этих процессоров и оказывается одинаковым, на базе AMD-760MP все равно можно собрать более производительный компьютер просто за счет установки CPU с большей частотой. По всем прочим характеристикам новый чипсет AMD также "на высоте", а единственный недостаток в виде отсутствия в текущем варианте поддержки 64-битовой 66 MHz PCI, скорее всего, будет исправлен в очень короткие сроки. Естественно, финальный вердикт вынесет только время — когда будет накоплена статистика отказоустойчивости, стабильности в работе, совместимости и прочих весьма критичных для высокоуровневой платформы параметров. Но, как мы уже писали выше, пока что новый чипсет AMD оставил у нас самые благоприятные впечатления.

Вместо P. S., или
"Мы не так богаты, чтобы покупать дешевые вещи"

Возможно, у кого-то возникнет вопрос, почему в этом тестировании не была затронута тема дуального Duron. Вкратце скажем так: мы пробовали, "это" работает. То есть при установке в систему с Tyan Thunder K7 двух процессоров AMD Duron 800 система Windows 2000 загрузилась, "увидела" оба процессора и без проблем запускала всевозможнейшие приложения. Однако… а имеет ли смысл собирать такую систему сейчас? Стоимость платы и памяти настолько сильно перекрывает разницу между ценой Athlon и Duron, что экономия получается копеечной, а результат — весьма неоднозначным. Во-первых, по максимальной частоте Athlon обгоняет Duron более чем в полтора раза, а во-вторых, ввиду отсутствия оверклокерских функций на плате работать Duron будет на штатной 200-мегагерцевой FSB, что, безусловно, скажется на производительности системы. В результате при минимальной экономии мы получим серьезнейший downgrade по производительности. Быть может, в будущем ситуация изменится, но пока что двухпроцессорные системы на Duron могут быть интересны, по нашему мнению, только в качестве забавной экзотики, но не более того.

SMP системы на базе Pentium III и Athlon предоставлены компанией OST
Материнские платы Tyan предоставлены компанией Entry