DDR2 vs DDR. Результаты тестирования в одноканальном режиме


Это небольшое приложение к нашим предыдущим результатам тестирования, показавшим весьма спорное преимущество нового типа памяти DDR2, относительно DDR призвано, по сути, «немного показать DDR2 в действии». А именно — достичь тех величин реальной пропускной способности, которые были бы максимально близки к заявленным в спецификации теоретическим значениям. Как этого можно добиться? — ответ весьма прост: для этого нужно сравнить DDR2-533 и DDR-400 в одноканальном режиме доступа, при котором теоретическая ПСП обеих типов памяти (4.3 ГБ/с и 3.2 ГБ/с, соответственно) заведомо ниже, чем предельная теоретическая пропускная способность шины процессора (6.4 ГБ/с). Именно этим мы и займемся.

Конфигурации тестовых стендов и ПО

Тестовый стенд №1

  • Процессор: Intel Pentium 4 3.4 ГГц (ядро Prescott, Socket 478, FSB 800/HT, 1 МБ L2)
  • Материнская плата: ASUS P4C800 Deluxe на чипсете Intel 875P
  • Память: 1x512 МБ PC3200 DDR SDRAM DIMM TwinMOS (тайминги 2.5-3-3-6)

Тестовый стенд №2

  • Процессор: Intel Pentium 4 3.4 ГГц (ядро Prescott, Socket 775, FSB 800/HT, 1 МБ L2)
  • Материнская плата: ECS PF4 на чипсете Intel 915
  • Память: 1x512 МБ PC2-4300 DDR2 SDRAM DIMM Samsung (тайминги 4-4-4-8)

Программное обеспечение

Максимальная реальная пропускная способность памяти

Начнем с оценки главной характеристики памяти — ее пропускной способности. Ведь на существенное ее увеличение и направлен новый стандарт DDR2. Как и прежде, измерение максимальной реальной пропускной способности памяти проводилось с помощью подтеста Memory Bandwidth, пресетов Maximal RAM Bandwidth, Software Prefetch, MMX/SSE/SSE2, использующих метод оптимизации в виде предварительной выборки данных, которые будут востребованы позже, из оперативной памяти в L2 кэш процессора. Для оптимизации записи в память в этих тестах используется метод прямого сохранения данных (Non-Temporal Store), позволяющий исключить влияние подсистемы кэша процессора. Для наглядности приведем картину, полученную на платформе Prescott/DDR2 с использованием регистров SSE2.


Prescott/DDR2, максимальная реальная ПСП

Но интереснее, конечно же, взглянуть на сравнительные количественные характеристики, полученные в этой серии тестов.

Тип памяти Максимальная реальная пропускная способность, МБ/с
Чтение (Software Prefetch) Запись (Non-Temporal)
DDR-4003290.13167.3
DDR2-5334287.24093.7

Итак, наконец-то нам удалось максимально приблизиться к «заявленному» значению ПСП нового типа памяти DDR2-533! Максимальная реальная ПСП DDR2 при операциях чтения составила 4287.2 МБ/с (отметим, что частота шины памяти в обоих случаях завышена на 2-3%, что особенно хорошо видно из результатов тестирования DDR-400). Можно сказать, что она достигла своего предельного значения (которое на самом деле, несмотря на обозначение PC2-4300, составляет 4266.7 МБ/с = 533.3 МГц x 64 бит), причем — даже в таком, асинхронном режиме работы памяти. Эффективность операций записи в DDR2 несколько ниже — но здесь важно упомянуть, что почти такое же значение мы получили и в наших предыдущих тестах, в которых использовался двухканальный режим работы, и сказываются здесь, как мы уже отмечали, скорее всего, микроархитектурные особенности процессоров Prescott.

Латентность памяти

Методика измерений латентности, применительно к процессорам семейства Pentium 4, была подробно разработана, обоснована и описана ранее. Поэтому остановимся на ней лишь вкратце: в тесте латентности используется псевдослучайный режим обхода сравнительно большого блока памяти (4 МБ) с шагом в 64 байта (действительный размер строки L2- кэша процессоров Pentium 4) и 128 байт («эффективный» размер, связанный с аппаратной предвыборкой смежной строки из памяти в кэш во всех режимах обхода).

Для наглядности, представим графики разгрузки шины L2-RAM на платформе Prescott/DDR2, полученные с шагом 128 байт.


Prescott/DDR2, латентность памяти, длина строки 128 байт

Обращаясь к количественным оценкам, прежде всего, следует упомянуть, что значения латентности при использовании одноканального режима во всех случаях оказались несколько меньшими по сравнению с теми, которые были получены в двухканальном режиме. Собственно, было бы странно, если бы получилось обратное — ибо вполне очевидно, что «двухканальность» влечет за собой увеличение задержек при доступе в память (на уровне чипсета). Кстати, в связи с этим более «правильными» величинами латентности памяти (т.е. более близкими к «истинным» характеристикам) следует считать значения, полученные именно в одноканальном режиме.

Длина строки Тип памяти Латентность псевдослучайного доступа, нс
МинимальнаяСредняя*Максимальная
64 байта DDR-40028.031.431.6
DDR2-53329.330.534.8
128 байт DDR-40046.654.654.6
DDR2-53351.952.758.9
*латентность в условиях отсутствия разгрузки шины L2-RAM

Сравнивать «некорректные» величины, полученные при 64-байтном размере шага, которые, к тому же, весьма близки между собой, вряд ли имеет особый смысл — скорее можно считать, что они просто приведены для полноты картины. Гораздо интереснее сопоставить между собой более «объективные» значения, полученные при обходе цепочки с шагом, равным «эффективной» длине строки (128 байт). Результаты этих тестов вновь никак нельзя назвать неожиданными — очевидно, что по латентности DDR2 явно проигрывает DDR. На этот раз различие (если не учитывать «средние» значения, полученные в условиях отсутствия разгрузки шины) находится в пределах 8-11% в пользу DDR — несколько меньше, чем это было в двухканальном режиме (15-16%). Что, в общем-то, означает, что задействование двухканальности сказывается на латентности DDR2 чуть сильнее по сравнению с DDR.

Итоги

Представленные результаты тестирования едва ли можно назвать «сенсационными», сколь бы то ни было оправдывающими использование памяти типа DDR2 на данный момент. Можно констатировать лишь нижеследующее: максимальная реальная ПСП памяти типа DDR2-533 действительно соответствует заявленному в спецификации значению порядка 4.3 ГБ/с в одноканальном режиме, и превышает ПСП памяти типа DDR-400 в том же одноканальном режиме. Тем не менее, это никак нельзя считать ее неоспоримым преимуществом. Хотя бы по той простой причине, что уже реально существующие на сегодняшний день чипсеты Intel i915/i925, поддерживающие DDR2, превосходно поддерживают двухканальный режим работы памяти. Что делает «одноканальную DDR2» совершенно непривлекательным вариантом, по сравнению хотя бы с той же «двухканальной DDR». Таким образом, основной вывод, который был сделан раньше, продолжает оставаться в силе — использование DDR2 оправдает себя, как минимум, не ранее того момента, когда появятся первые процессоры с частотой шины 1067 МГц и выше, что позволит преодолеть ограничение, накладываемое скоростью шины процессора на реальную пропускную способность подсистемы памяти в двухканальном режиме ее функционирования.

Модули памяти Samsung DDR2 предоставлены компаниями MERLION и Русский Стиль




Дополнительно

iXBT BRAND 2016

«iXBT Brand 2016» — Выбор читателей в номинации «Процессоры (CPU)»:
Подробнее с условиями участия в розыгрыше можно ознакомиться здесь. Текущие результаты опроса доступны тут.

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.