Одноканальность vs двухканальность у nForce2


Помнится, на нашем сайте была опубликована одна статья, связанная с чипсетом NVIDIA, где речь заходила о суевериях и предрассудках, но надо сказать, с появлением пошедшего в народ nForce2 число этих самых суеверий и слухов вокруг продукции NVIDIA возросло так, что стало заметно, кажется, уже всем. Мы решили посвятить маленькое практическое исследование исключительно просвещению масс, и сразу предупреждаем, что ничего действительно нового внимательные читатели здесь не найдут. Более того, статья написана намеренно простым языком и ужасно сложные термины вроде «банк памяти» в ней не используются — пожалуйста, будьте снисходительны: это, можно сказать, объяснение для начинающих.

Простые истины чипсета nForce2

Первый, самый забавный вопрос, которой чересчур часто задается в форумах и письмах в редакцию: будут ли работать видеокарты ATI (имеется в виду — на чипах ATI) на чипсете NVIDIA? Пожалуй, больший интерес мог бы вызвать только вопрос о работоспособности процессоров Intel на чипсетах AMD (или наоборот) — к чипсетам VIA как-то все попривыкли уже, и сомневаются в них разве что самые упертые и глухие. Комментировать на полном серьезе тут нечего, просто констатируем: видеокарты линеек ATI без каких-либо проблем работают в материнских платах на чипсетах NVIDIA, а видеокарты линеек NVIDIA аналогично успешно функционируют в системных платах на чипсетах ATI (правда, скорость тут… ну, это уже совсем другая, гораздо более грустная история…).

Дальше пошли вопросы интереснее, связанные как раз с двухканальным контроллером nForce/2. Итак, внимание: для двухканального режима используются самые обычные модули памяти, причем объем памяти в этом режиме равен суммарному объему установленных модулей, а не его половине (и это справедливо для всех без исключения двухканальных чипсетов). Вроде бы очевидно, но спрашивают, факт.

Теперь копнем чуть глубже: что же именно нужно для организации двухканальности на nForce/2? Потребуется как минимум 2 модуля памяти, причем один из них обязательно должен быть установлен в выделенный своим расположением на материнской плате разъем. (Как правило, он называется DIMM0, в противовес DIMM1/2, или же DIMM1, при наличии также DIMM2/3.) Неверная установка приведет к невозможности задействовать второй контроллер памяти. Модули не обязательно должны быть полностью идентичны (и уж тем более не требуется совпадения их производителей), а вот скоростные характеристики желательно иметь одинаковыми, так как иначе в двухканальном режиме скорость будет выставлена по наиболее медленному (например, DDR266 при одном модуле DDR266 и одном DDR400). Также можно использовать три модуля, но тут следует иметь в виду, что двухканальный доступ может быть обеспечен только для объема, равного удвоенному размеру первого модуля (того, что установлен в разъем с минимальным номером) — в случае, конечно, если размер первого не превосходит суммы размеров второго и третьего. Очевидно, таким образом, что наиболее оптимальны следующие два случая: одинаковые по размеру модули памяти, установленные в первый и второй разъемы, или же три модуля, причем объем первого равен сумме объемов второго и третьего.

Ну а теперь самое интересное. Очень часто (в том числе, и в наших статьях) вы можете видеть/слышать рядом два выражения: «двухканальный nForce2» и «самый быстрый среди чипсетов под Socket A nForce2». По отдельности они абсолютно корректны, но отсюда совсем не следует взаимно-однозначного соответствия между «двухканальным» и «самым быстрым». В самом деле, как хорошо известно, системная шина EV6, используемая для Socket A, имеет ограниченную пропускную способность в 2100 МБ/с при частоте 133 МГц и 2700 МБ/с при частоте 166 МГц. Это означает, что сколь бы быстро ни отрабатывал(и) контроллер(ы) памяти, до процессора данные дойдут не быстрее, чем позволяет шина, а потому именно процессору не требуется память быстрее DDR266 в первом случае и DDR333 во втором. Разумеется, цифры приведены для одноканального режима доступа — так нужен ли тут вообще двухканальный, с его нереально большой пропускной способностью?

Рассуждая теоретически, можно предположить две ситуации, когда он нужен: при преобладании доступа к памяти по случайному алгоритму (двухканальность позволяет уменьшить задержку доступа по следующему случайному адресу, но в жизни такая ситуация почти не встречается) и при наличии иных, кроме процессора, устройств, читающих из памяти или пишущих в нее. Собственно, таковых можно припомнить два наиболее важных типа: видеокарты и IDE-устройства с DMA (а также устройства для шины CSA в чипсетах Intel 875P/865x).

Однако «чистый» вывод о том, насколько ускоряет систему двухканальный контроллер памяти, мы сделать не можем, потому что NVIDIA в своих чипсетах применяет еще одно оригинальное техническое решение — DASP. Этот, являющийся, по сути, буфером при контроллере памяти, модуль обладает продвинутыми возможностями по предсказанию и предвыборке данных, так что он и сам по себе может обеспечивать некоторое превосходство в скорости над конкурентами nForce и особенно nForce2, в котором применяется его переработанная и улучшенная версия.

Именно исследованию того, насколько отличаются друг от друга одноканальный и двухканальный режимы nForce2 (а значит, какая часть его превосходства в скорости обусловлена этим фактором, а какая — другими, включая, конечно, и DASP) и посвящено тестирование, результаты которого перед вами.

Исследование производительности

Тестовый стенд:

  • Процессор: AMD Athlon XP 2700+ (13x166 МГц = 2167 МГц), Socket 462
  • Материнские платы:
    • MSI K7N2G-LISR (версия BIOS 1.1) на чипсете NVIDIA nForce2-GT
    • ABIT AT7-MAX2 (версия BIOS DC) на чипсете VIA KT400
  • Память: 2x256 МБ PC3200(DDR400) DDR SDRAM DIMM Winbond, CL 2,5 (использовалась в качестве DDR333 с CL 2)
  • Внешние видеокарты:
    • Palit Daytona GeForce4 Ti 4600
    • Inno3D GeForce4 MX 440
  • Жесткий диск: IBM IC35L040AVER07-0, 7200 об/мин

Программное обеспечение:

  • ОС и драйверы:
    • Windows XP Professional SP1
    • DirectX 8.1b
    • NVIDIA nForce UDP 2.03
    • VIA 4-in-1 4.45
    • NVIDIA Detonator XP 40.72 (VSync=Off)
  • Тестовые приложения:
    • Cachemem 2.4MMX
    • Wstream
    • VirtualDub 1.4.10 + DivX codec 5.02 Pro
    • WinAce 2.2
    • SPECviewperf 7.0
    • MadOnion 3DMark2001 SE build 330
    • Gray Matter Studios & Nerve Software Return to Castle Wolfenstein v1.1
    • Croteam/GodGames Serious Sam: The Second Encounter v1.07

Мы использовали процессор со 166-мегагерцовой шиной, и память на обоих протестированных чипсетах работала на той же частоте при минимальных таймингах (напомним, что применение DDR400 c CL 2,5 на KT400 лишь тормозит этот чипсет). Также, вспоминая о том, что изначально двухканальный режим контроллера памяти задумывался NVIDIA для ускорения работы варианта чипсета с интегрированной графикой, мы проверили и этот режим. Ну и заодно сравнили в игровых приложениях интегрированную графику nForce2-G (обозначена на диаграммах как IGP) c теоретически соответствующей ей внешней видеокартой на чипе GeForce4 MX 440. Прямой задачи сравнить в очередной раз nForce2 c KT400 у нас не было, так что цифры чипсета VIA приведены, скорее, для наглядности.

Результаты тестов

При чтении и записи по «прямолинейному» алгоритму Cachemem результаты nForce2 почти совпадают во всех режимах, за исключением одноканального при использовании интегрированной графики, а вот при потоковом копировании Wstream двухканальный режим обеспечивает вполне приличный выигрыш в 20%. Такое преимущество достигается как раз за счет большей скорости работы памяти при двухканальности, но вот увидим ли мы подобное в реальных приложениях? Также хорошо видно, что KT400 заведомо медленнее одноканального nForce2 во всех тестах, кроме скорости копирования, где они равны.



Кодирование видеопотока в MPEG4 и архивирование с 4-мегабайтным словарем — это, пожалуй, наилучшие тесты связки «память—процессор». Они дают очень похожие по характеру результаты, причем вновь заметно отстает лишь одноканальный режим с интегрированным видео, а вот двухканальность обеспечивает системе незначительный прирост скорости в 2—3%, и оставшегося «запаса» пропускной способности с лихвой хватает на компенсацию работы со встроенным видеоядром.

Таким образом, мы видим, что двухканальность в реальной жизни практически не ускоряет процессорные задачи, и превосходство nForce2 над KT400 в этих тестах обусловлено иными преимуществами архитектуры чипсета NVIDIA. А вот для работы с интегрированной графикой nForce2-G двухканальный режим подходит как нельзя лучше, обеспечивая нулевое падение производительности в сравнении с дискретной версией чипсета (или работой с внешней видеокартой).



Использование профессионального пакета тестов для ускорителей трехмерной графики позволит нам проверить еще один тип взаимодействия компонентов платформы. Разумеется, здесь уже у nForce2 IGP нет никаких шансов догнать GeForce4 Ti 4600, так как производительность «убивается» его возможностями в ускорении 3D, поэтому эффект от задействования двухканальности для него сродни синтетическим тестам памяти — так же неприменим к реальной жизни.

А вот теперь самое интересное. Для понимания полученных результатов давайте взглянем на суть тестов SPECviewperf. Все они предполагают интенсивное задействование 3D-функций видеокарт, а от процессора требуется в основном быстро рассчитывать базовые параметры и координаты сцены и быстро же пересылать полученные огромные массивы данных по AGP видеоускорителю. От положения дел с играми ситуация отличается очень сильно, так как там на процессоре дополнительно «висит» большое количество задач, и не удается так точно сопоставить загрузку процессора и видеокарты. Например, в низких разрешениях при низком качестве графики фактически игру тормозит процессор, а видеокарта быстро отрисовывает очередной кадр, а вот в высоких разрешениях при повышенном качестве графики уже видеоускоритель занят «украшательствами» картинки, в то время как процессор свою часть задачи выполняет гораздо быстрее. Очевидно, что «где-то посередине» мы можем встретить ситуацию, аналогичную положению дел в SPECviewperf, к анализу которого мы сейчас и переходим.

Итак, в первую очередь бросается в глаза долгожданный отрыв двухканального режима nForce2 от одноканального. Причем это явно не случайный результат: он наблюдается в трех тестах пакета (из шести). В остальных тестах все участники, использующие GeForce4 Ti 4600, идут более или менее вровень, и отрыв двухканального nForce2 невелик, но 16, 19 и 25% (в dx-07, proe-01 и drv-08 соответственно) — это, безусловно, очень значимо, и даже больше, чем удалось «выжать» в синтетическом тесте Wstream. Скорее всего, здесь как раз налицо ситуация идеального баланса между процессором и видеоускорителем, когда они выполняют свою часть работы с примерно одинаковой скоростью, а потому расширение пропускной способности памяти позволяет контроллеру памяти полностью утилизировать процессорную шину и одновременно выдавать данные по AGP видеокарте. Кстати, любопытно, что в тесте с максимальной разницей (drv-08) KT400 впервые обгоняет nForce2 (одноканальный), и если там сравнивать двухканальный nForce2 c KT400, то получим как раз примерно те же 15—19%, что и в двух остальных тестах. Так что, возможно, мы наблюдаем некий артефакт производительности у чипсета NVIDIA.





В играх, увы, ничего интересного и неожиданного. В любых сочетаниях разрешений и настроек графики при использовании внешней видеокарты преимущество от двухканальности не достигает и 4%, причем максимально оно в «слабых» условиях, то есть когда ускорять получается уже рассмотренную нами связку «процессор—память», и получается это с тем же успехом. Из остального можно отметить прекрасный эффект от задействования двух каналов при интегрированной графике, что, впрочем, никак не позволяет IGP выглядеть достойно в сравнении с внешним GeForce4 MX 440.

Для наглядности сведем данные по основной линии сегодняшнего сравнения в таблицу (пишите нам, что вы думаете о таком способе представления информации):

Двухканальный режим против одноканального, разница в процентахПри использовании внешней видеокарты (GF4Ti4600)При использовании интегрированного графического ядра (IGP)
чтение из памяти+0,4+4,4
запись в память+2,3+15,5
копирование памяти+20,9+31,5
MPEG4+2,2+6,7
WinAce+2,9+8,4
drv-08+24,7+55,0
dx-07+15,9+65,8
3dsmax-01+1,8+13,5
light-05+4,6+45,0
proe-01+19,0+24,6
3DMark2001+1,7+65,0
RtCW(Fast)+3,5+42,4
RtCW(High)+1,1+76,1
SS2(Speed)+2,8+40,6
SS2(Normal)+1,8+67,1

Выводы

На основании приведенных данных можно сделать два уверенных вывода. Во-первых, двухканальность для nForce2 всегда дает положительный эффект, и поскольку достигается эта двухканальность фактически бесплатно (требуется два модуля памяти меньшего размера вместо одного большого), то вполне имеет смысл получить эти 2—4% прироста производительности.

Во-вторых, однако, важно отметить, что двухканальность — не то оружие, с помощью которого NVIDIA добилась победы на чипсетном фронте. Прекрасный чипсет VIA KT400 капитулирует перед одноканальным nForce2 в тех же условиях, что и перед двухканальным (за исключением одного-единственного случая), так что причину успеха следует искать в других компонентах системной логики калифорнийской фирмы, в том числе, вполне вероятно, в удачном применении действительно уникального блока DASP.

Ну и в заключение отметим, что если вы собираетесь использовать интегрированную графику чипсета nForce2-G/T, то обеспечение двухканального режима работы для вас — обязательная задача: от 10 до 70% потери в скорости вы наверняка сможете заметить визуально, безо всяких тестов. И имейте в виду, что указанное в спецификации чипсета nForce2-G соответствие использованного там графического ядра чипу GF4 MX440-8x к реальной жизни имеет отдаленное отношение: меньшие частоты работы самого чипа в IGP и системной памяти приводят к значительно худшим показателям в тестах трехмерной графики, так что не окажитесь разочарованными после покупки.

Системная плата MSI K7N2G-LISR предоставлена компанией Neo Group




Дополнительно

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.