nForce4 SLI Intel Edition — NVIDIA начинает и…


Одним из самых громких событий 2004-го стало пришедшееся на конец года известие о «допуске» NVIDIA к рынку процессоров Intel. Компании наконец подписали соглашение о перекрестном лицензировании, которого многие ждали еще во времена выхода первого поколения nForce. Этот чипсет сразу по выходу наделал немало шума, и казалось вполне логичным, чтобы NVIDIA продолжала развивать успех, предложив решение для большей части рынка настольных систем. Однако время шло, Intel анонсировала новые частоты FSB своих процессоров (для каждой из которых компания почитает нужным заново выдавать лицензию на производство чипсетов), а NVIDIA nForce так и оставались принадлежностью рынка решений AMD.

Чипсеты калифорнийцев, несомненно, получили признание производителей и покупателей: поставки nForce3 и nForce4 составляли до половины рынка чипсетов под AMD64 к четвертому кварталу 2004 года. Но о возможности выпуска продуктов под решения Intel руководство компании уклончиво отзывалось как о лишней головной боли без ясных перспектив. Разумеется, после подписания кросс-лицензионного соглашения тональность комментариев сменилась на обратную: ну наконец-то мы можем заработать много денег и реализовать мечту каждого обладателя Pentium 4.

Вполне понятно, зачем все это Intel. По производительности в играх топовые процессоры компании более или менее держат паритет с Athlon 64/FX при условии использования одной видеокарты. А вот если по максимуму задействовать возможности платформы AMD64, для которой выпущен nForce4 SLI, и использовать два топовых видеоускорителя NVIDIA в связке, то в абсолютном большинстве случаев такая система будет лидировать в 3D. Да, очень дорогой ценой (в прямом смысле этих слов), но ниша бескомпромиссно-быстрых решений имеет большую важность для рынка в целом — это, фактически, показатель престижности марки, опора для рекламирования и продвижения всего набора процессоров. Intel уже достаточно давно не пытается оспаривать лавры самого эффективного («цена-производительность») решения в нижнем сегменте, но за производительность в топовом сегменте биться будет до конца.

Ну а что дает выход nForce4 SLI Intel Edition покупателям? Об этом мы и поговорим сегодня.

Чипсет NVIDIA nForce4 SLI Intel Edition

Если для процессоров AMD NVIDIA выпустила целую линейку чипсетов nForce4, то приверженцам другого производителя процессоров предлагается (пока?) лишь топовая версия — nForce4 SLI в варианте для Intel (Intel Edition). Не самое, мягко говоря, удачное название — ужасно громоздкое и трудноотличимое (от nForce4 SLI «просто»). Мы, с вашего позволения, позволим себе сократить его до nForce4 SLI IE — надеемся, у NVIDIA не возникнет проблем из-за использования торговой марки Microsoft :)

Не нужно даже смотреть на блок-схему чипсета, чтобы представить себе его возможности, так как все функции nForce4 SLI перекочевали в новинку без изменений, за исключением двух неизбежных: смены процессорной шины и интеграции контроллера памяти. Напомним, что у AMD Athlon 64/FX контроллер памяти интегрирован в процессор, поэтому чипсет его лишен, что сильно уменьшает сложность и размер северного моста и даже дает возможность объединить мосты чипсета в один чип, как у nForce3/4. Продукт с именем «Intel Edition» по необходимости обладает двухканальным контроллером памяти (NVIDIA прогнозируемо сделала выбор в пользу DDR2), и компания снова вернулась к практике двух мостов. Итак, nForce4 SLI IE имеет следующую функциональность:

  • Северный мост SPP:
    • поддержка процессоров Intel Pentium 4, Pentium 4 Extreme Edition, Celeron D с частотой системной шины 400/533/800/1066 МГц;
    • двухканальный контроллер памяти DDR2-400/533/667 (допускается асинхронная работа относительно FSB) с поддержкой до 4 модулей DIMM;
    • графический интерфейс PCIEx16 с возможностью «разбивки» на два канала PCIEx8 для организации SLI;
    • выделенный блок, обеспечивающий работу двух видеоускорителей в режиме SLI;
    • до 3 портов PCIEx1;
  • двунаправленная шина HyperTransport (частота работы 800 МГц) до южного моста;
  • Южный мост MCP:
    • до 6 слотов PCI (до 5 устройств Bus Master);
    • до 4 портов Serial ATA на 4 устройства SATA300 (SATA II, второе поколение стандарта), с поддержкой функций вроде NCQ);
    • до 4 устройств (2 канала) ATA133;
    • возможность организации RAID-массива уровней 0, 1 и 0+1 из дисков, подключенных к любым из встроенных ATA-контроллеров;
    • до 10 устройств USB 2.0;
    • MAC-контроллер для сети 10/100/1000 Мбит/с (Gigabit Ethernet) с поддержкой функций программно-аппаратного брандмауэра;
    • AC'97-аудио (7.1) и MC'97-модем;
    • обвязка для низкоскоростной и устаревшей периферии.


         

Функциональность, которая у версии nForce4 SLI для Intel не отличается от оригинальной (в nForce4 SLI), мы лишний раз разбирать не будем (еще раз отсылаем к обзору семейства чипсетов nForce4 для AMD64). Не заслуживают лишних слов и параметры процессорной шины — заметим лишь, что частоту 1066 МГц также поддерживает реальный чипсет Intel 925XE и остающиеся бумажными VIA PT894/Pro, с процессорной же стороны поддержка пока ограничена двумя моделями Pentium 4 Extreme Edition.

Поговорим о единственном новом блоке — контроллере памяти. В nForce и nForce2 он, по сути, представлял собой два независимых 64-битных контроллера с перекрестной коммутацией. Это было удобно, в первую очередь, для одновременного обслуживания запросов от разных устройств — например, CPU и GPU (вспомним, что тогда NVIDIA была озабочена успехом чипсета с интегрированной графикой). В случае nForce4 SLI IE первоочередная задача контроллера — ускорение доступа процессора к данным в памяти. Важным новшеством является выделенная шина данных и адреса для каждого модуля DIMM — при этом появляется возможность работы в режиме 1T command rate. А вследствие меньшей величины burst length чипсет NVIDIA получает возможность эффективнее заполнять шину командами регенерации памяти.

Присутствующий со времен nForce блок предвыборки и кэширования данных DASP представлен в nForce4 SLI IE третьим поколением, оптимизированным для работы в многопоточном режиме. Наконец, новая технология QuickSync позволяет тактовать FSB и шину памяти независимо, что дает возможность применять более быструю память, а также произвольно увеличивать частоты этих шин при разгоне.

Исследование производительности

Тестовый стенд:

  • Процессор: Intel Pentium 4 Extreme Edition 3,73 ГГц, Socket 775
  • Материнские платы:
    • инженерный образец платы на чипсете NVIDIA nForce4 SLI Intel Edition
    • Gigabyte 8AENXP-D (версия BIOS 1.02F) на чипсете Intel 925XE
  • Память: 2x512 МБ PC2-5400(DDR2-675) DDR2 SDRAM DIMM Corsair, использовалась с таймингами 3-3-3-12 в качестве DDR2-533 и с таймингами 4-4-4-12 в качестве DDR2-667
  • Видеокарта: [PCIEx16] ATI Radeon X800 XT 256 МБ
  • Жесткий диск: Seagate Barracuda 7200.7 (SATA), 7200 об/мин

Программное обеспечение:

  • ОС и драйверы:
    • Windows XP Professional SP2
    • DirectX 9.0c
    • NVIDIA nForce unified drivers package 7.02
    • Intel chipset drivers 6.2.1.1001
    • ATI Catalyst 5.2
  • Тестовые приложения:
    • RightMark Memory Analyzer 3.42
    • 7-Zip 4.10b
    • WinRAR 3.41
    • кодек DivX 5.2.1 Pro
    • кодек XviD 1.0.2 (29.08.2004)
    • SPECviewperf 8.01
    • Doom 3 (v1.0.1282)
    • FarCry (v1.1.3.1337)
    • Unreal Tournament 2004 (v3339)

Результаты тестов

Обозначим предмет сегодняшнего исследования. Эффект от SLI мы оценивать не будем: понятно, что на примерно одинаковых процессорах этот эффект будет также примерно одинаков, а в статьях нашего раздела «Видеосистема» уже накоплена приличная база результатов по SLI на платформе AMD64. Таким образом, задача сегодня довольно скромная: выяснить предварительный уровень производительности nForce4 SLI IE как обычного настольного чипсета относительно конкурентов. Почему оценка предварительная — понятно: все-таки на тестировании инженерный образец. Кто конкуренты? Здесь еще проще, так как очевидно нет смысла сравнивать топовый продукт NVIDIA с бюджетными чипсетами под FSB 800 МГц — стоимость и функциональность таких решений сильно различается. Методом исключения получаем одного-единственного соперника — Intel 925XE (представленного быстрейшей платой).

Если чипсеты NVIDIA обходили соперников в равных условиях (частота памяти и FSB), работая с Athlon XP, то для процессоров Intel наиболее быстрыми при прочих равных обычно получаются чипсеты от Intel же (хотя конкуренты периодически берут верх за счет поддержки нестандартных частот и т. п.). Очень интересно посмотреть, как выглядят контроллеры памяти от Intel и NVIDIA в очном состязании. Поскольку nForce4 SLI IE поддерживает DDR2-667, проверим, какова польза от такой памяти с учетом сообразно повышенных таймингов. В нашем случае пара модулей Corsair XMS2 PC2-5400 (DDR2-675) смогла заработать при таймингах 3-3-3-12 в режиме DDR2-533 и при 4-4-4-12 в режиме DDR2-667. Вопрос о падении скорости в случае несимметричного заполнения каналов мы исследуем подробнее с серийными платами, сегодня же «честно» установим два одинаковых модуля в разъемы, относящиеся к разным каналам. Что ж, давайте приступим к исследованию производительности подсистемы памяти, воспользовавшись разработанным нашими программистами тестовым пакетом RightMark Memory Analyzer.

Первый тест — словно удар под дых: i925XE почти в полтора раза быстрее читает из памяти.

Причем и пишет он тоже чуть быстрее. Информации об архитектуре чипсетов для объяснения не хватает, так что просто констатируем результат (специфичный для алгоритмов доступа RMMA) и отметим, что при упомянутых выше таймингах nForce4 SLI IE с DDR2-533 выглядит лучше, чем с DDR2-667.

Еще одна интересная картинка — латентность [псевдослучайного] чтения из памяти. Здесь i925XE и чипсет NVIDIA примерно равны, с легким преимуществом последнего. Понятно, что в тестах латентности DDR2-667 с такими таймингами всегда будет медленнее (частота работы выше в 667/533=1,25 раза, а основные тайминги — в 4/3=1,33 раза), так что на этот режим особого внимания обращать не стоит.

Но совсем уж увлекательной получается развязка: латентность [истинно] случайного чтения из памяти у nForce4 SLI IE примерно на 5% меньше, чем у продукта Intel. Вспоминаем, что в RMMA случайное чтение отличается от псевдослучайного тем, что быстрее исчерпывает D-TLB (трансляционный буфер данных), так как открывает много страниц памяти почти одновременно. Конечно, в этом случае потери скорости избежать не удается, но nForce4 страдает меньше! По-видимому, перед нами демонстрация функции чипсета DASP (3.0) — предвыборка и кэширование данных из памяти.

Низкоуровневое тестирование памяти хотя и интересно, но в общем случае не дает представления о том, как ведет себя исследуемый в реальных приложениях. Так что переходим к практической части.

Производительность архиваторов сильно зависит от латентности памяти, но все-таки мы ожидали хоть сколь-нибудь заметного отрыва у чипсета Intel. Однако в реальности высокая скорость чтения и записи i925XE никак не помогла, он идет наравне с nForce4 SLI IE. Аналогично, имеющий худшую латентность режим с DDR2-667 проигрывает им пару процентов.

Скорость кодирования видео не слишком зависит от производительности памяти, а в нашем случае все три системы и вовсе показали одинаковый результат. Уже очевидно, что в реальных приложениях никакого преимущества в скорости у i925XE, как можно было подумать по тестам RMMA, нет.

Пакет визуализации профессиональных 3D-приложений SPECviewperf, конечно, требователен к процессору и видеоускорителю, но и между контроллерами памяти разных чипсетов мы в свое время видели немалую разницу. Однако к данному случаю это не относится, результаты очень близки, а побеждает все-таки nForce4 SLI IE. Причем поскольку и с DDR2-667 этот чипсет обходит i925XE, мы вполне можем предположить, что NVIDIA традиционно оптимизирует работу чипсета (не то драйверами, не то параметрами в BIOS) с видеокартой.

У игр свои предпочтения. Doom 3 в нижних режимах немного подтормаживает на nForce4 с DDR2-667, не находя разницы между двумя другими конфигурациями.

Unreal Tournament 2004, не обращая внимания на разрешение экрана и настройки графики, чуть быстрее на i925XE.

В FarCry в низких разрешениях nForce4 все-таки вырывается на пару процентов вперед, но уже в 800x600 разрыв между участниками легко перекрывается погрешностью измерений. Таким образом, в целом в играх, да и в прочих реальных тестах, чипсеты Intel и NVIDIA равны, но именно в 3D-приложениях некоторая разница все-таки намечается. Вероятную причину этого мы уже указали, возможно также, что это сказывается влияние блока, отвечающего в nForce4 за SLI.

Выводы

…и, как минимум, не проигрывает — это мы вернулись к заголовку статьи. Говоря про результаты сегодняшнего тестирования, иначе как равной скорость nForce4 SLI IE и i925XE назвать нельзя. Причем поскольку исследование мы проводили с одинаковыми таймингами у обеих систем (при использовании DDR2-533), различий между этими чипсетами ожидать очень трудно. Правда, потенциально у nForce4 есть козырь в виде поддержки DDR2-667, но чтобы этот козырь сыграл, нужна очень быстрая (=дорогая) память, способная работать на частоте 667 МГц с основными таймингами порядка 3. Иначе получится как сегодня. Также можно было бы надеяться на то, что серийные платы будут быстрее, но многие думали так и про nForce

Впрочем, что там считать доли процентов, когда у nForce4 IE есть SLI! Еще раз адресуем вас к статьям «Видеосистемы», из которых вы можете узнать о примерном эффекте от SLI для интересующих вас игр. В большинстве случаев ресурсоемкие современные игры серьезно выигрывают от использования второго ускорителя, и понятно, что такая система далеко оставит позади и i925XE, и любое другое существующее на данный момент на рынке решение.

Если же говорить о функциональности, то тут nForce4 SLI IE есть чем похвастать, его характеристики, пожалуй, наилучшие среди всех решений под современные Pentium 4. Правда, бесплатного сыра никто не обещал, и вряд ли цена плат на этом чипсете порадует рядового покупателя (она ожидается на уровне более 200 долларов за продукцию ведущих производителей). Ну так на «рядовых» этот продукт и не ориентирован, мало у кого найдутся Pentium 4 Extreme Edition и два топовых видеоускорителя NVIDIA. В общем, без учета совокупной стоимости система на nForce4 SLI Intel Edition — лучшее решение на сегодня, а с учетом цены — равный соперник для лучших чипсетов под Socket 775.




Дополнительно

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.