Экспресс-тестирование разных конфигураций ОЗУ на платформе LGA2011


В прошлом месяце, тестируя процессоры под LGA2011, мы не стали особо мудрствовать с настройками системы памяти, просто установив четыре модуля DDR3-1333 — по одному на канал и с той же частотой, что была выбрана для конкурирующих платформ самой Intel: LGA1155 и LGA1366. Так было проще и удобнее всего сравнивать разные процессоры друг с другом, тем более что в нашу тестовую методику входят как приложения, к подсистеме памяти требовательные, так и наоборот. Во всяком случае, от ее частоты зависят достаточно многие. Поэтому для чистоты эксперимента над собственно процессорными ядрами и стоило немножко ограничить различия в «сопутствующих факторах».

А насколько они могут быть критичны? Тут без подробного тестирования (а лучше нескольких) сразу и не скажешь: ведь возможностей тюнинга очень много. Во-первых, по частоте: официально поддерживается любая частота памяти вплоть до DDR3-1600, а «полуофициально» (поскольку разгон для процессоров с индексами «К» и «Х» не считается чем-то постыдным) — аж до 2666 МГц. Причем без каких-либо плясок с бубном — просто множитель соответствующий выставить, и всё. Если, конечно, получится добыть подходящие модули памяти: официальных стандартов на частоты выше 2133 МГц на данный момент нет, что, впрочем, никогда не останавливало ни оверклокеров, ни ориентирующихся на их нужды производителей :)

Но в данном случае не частотой единой — встроенный четырехканальный контроллер памяти, естественно, позволяет использовать на практике и меньшее количество каналов. Это справедливо и для всех остальных платформ, но здесь выбор вариантов шире: их уже целых четыре — от одноканального режима до «штатного» четырехканального. Установка меньшего числа модулей может оказаться актуальной, поскольку, очевидно, «старшие» режимы предлагают такой объем памяти, который будет избыточным для многих сфер применения. Для некоторых, безусловно, большой поддерживаемый объем является преимуществом платформы, но что делать тем, кто уверен в достаточности для его задач и 8-12 ГБ памяти, а вот шестиядерный процессор при этом нужен? Забивать слоты модулями малой емкости или пренебречь количеством каналов? Вопрос на деле абсолютно не праздный.

Поэтому мы решили исследовать работу системы памяти на платформе LGA2011 более подробно. Но прежде чем «копать», нужно определиться с направлением: в какую сторону «копать» сто́ит, а в какую — и смысла нет. В нашем случае это чистая оптимизация расходования временны́х ресурсов: все-таки полное тестирование по «стандартной» версии методики занимает достаточно большое количество времени, так что для избавления от «пустой» работы нужна «пристрелка», которой мы сегодня и займемся.

Конфигурация тестовых стендов

Что касается аппаратных конфигураций, то их будет ровным счетом девять. Основных вариаций две — количество задействованных каналов (один, два, три и четыре) и тактовая частота. Естественно, немного будет меняться и общая емкость ОЗУ: в одно- и двухканальной конфигурациях мы используем 8 ГБ, в трехканальной — 12 ГБ, и «штатный» режим — с 16 ГБ. Этого изменения можно было бы избежать, подбирая наборы модулей разной емкости, но мы решили этим для первого раза не заниматься — вот если разницу будет сложно объяснить другими факторами, тогда займемся и объемом :) А с частотой все просто — мы взяли два варианта: 800 и 1600 МГц, благо отличаются они ровно в два раза. Причем не только по пропускной способности, но и таймингами: во всех случаях мы использовали одну и ту же относительную схему «9-9-9-24».

Четырежды два — восемь. Плюс вариант, который использовался в базовом тестировании — четыре модуля на тактовой частоте 1333 МГц. Процессор и системная плата во всех случаях одинаковые: Core i7-3960X Extreme Edition на ASUS P9X79 Pro.

Чем будем проверять? На ум сразу же приходят архиваторные тесты — эти программы точно зависят от системы памяти, при этом работают они достаточно быстро, чтобы с их помощью организовать экспресс-тестирование. Архиваторов у нас в методике два, каждый используется и для создания архивов, и для распаковки файлов, нагрузка на процессор во всех случаях имеет разный характер — словом, есть на что посмотреть. Сначала для каждого из четырех тестов приведем подробные диаграммы, на которых отражены результаты восьми «новых» тестовых конфигураций, нормированные по «базовой».

7-Zip: упаковка

Чем хорош этот архиватор, так это способностью использовать до 16 потоков вычислений. Core i7-3960X имеет шесть ядер и поддержку Hyper-Threading, что в сумме обеспечивает 12 потоков, т. е. меньше, чем потенциальные возможности теста. В общем, в этом случае все ядра загружаются «по полной программе», а значит, и требования к пропускной способности памяти должны быть максимальными.

И что же мы видим в итоге? Хорошая новость — производительность зависит от количества каналов. Плохая новость — максимальный прирост наблюдается при переходе от одного канала к двум. Совсем плохая новость — прирост ярко выражен при использовании «медленной» памяти, но куда скромнее, если задействовать «быструю» (заметим — далеко не самую быструю, которую может «переварить» платформа). Т. е. двух каналов DDR3-1600 уже достаточно, чтобы обогнать четыре канала DDR3-1333, а дальше производительность не растет вообще. Вот при использовании DDR3-800 она продолжает расти, однако такого скачка, как при переходе от одного канала к двум, уже нет нигде. И даже четыре канала DDR3-800 все равно немного медленнее одного DDR3-1600! В общем, можно не мудрствовать лукаво: двух высокоскоростных модулей необходимо и достаточно для обеспечения потребностей даже многопоточных приложений, «жадных» до скорости памяти. Вот в одноканальном режиме производительность системы памяти может оказаться серьезным сдерживающим фактором. Особенно хорошо это видно на примере 70-процентного прироста при переходе от одноканальной DDR3-800 к одноканальной же DDR3-1600: давненько мы такой красоты не видели :) В четырехканальном режиме разница порядка 19% — куда меньше, но вполне весомо.

7-Zip: распаковка

Как и везде в однопроходной декомпрессии (может, конечно, и не совсем везде, но контрпримеры нам лично неизвестны), 7-Zip работает лишь в один поток, причем делает это очень быстро…

…и от количества каналов памяти его производительность вообще не зависит! А вот 14% прироста при переходе от DDR3-800 к DDR3-1600 — цифра вполне серьезная. Впрочем, как мы увидим чуть позже, на деле прирост можно считать не настолько значимым, да и на фоне мелькнувших чуть выше (пусть только в одном случае) 70% он уже не впечатляет :)

WinRAR: упаковка

Этот архиватор в плане поддержки многопоточности «застрял» в нулевых годах текущего столетия: для него «много» все еще означает «два». Но, хотя бы, не «один».

Хотя на деле разницы между одно- и двухканальным режимами уже почти нет, а выше ее нет вообще — независимо от частоты памяти. Вот зависимость от частоты сохраняется, и разница превышает 16% во всех случаях. В одноканальном режиме разница чуть больше — почти 18%.

WinRAR: распаковка

Еще один однопоточный тест, в котором (как и в предыдущем) «канальность» ни на что не влияет, а частота — как обычно. Правда, тут от нее прирост самый маленький — даже до 10% не дотягивает. Зато он есть всегда — хозяйке на заметку :)

Подробные результаты

Поскольку их не так много, вместо традиционной ссылки на таблицу приведем в статье результаты целиком.

  7-Zip, упаковка 7-Zip, распаковка WinRAR, упаковка WinRAR, распаковка
4×1333 0:00:44 0:00:08 0:00:57 0:00:31
1×800 0:01:21 0:00:08 0:01:03 0:00:33
2×800 0:00:54 0:00:08 0:01:01 0:00:33
3×800 0:00:51 0:00:08 0:01:01 0:00:33
4×800 0:00:49 0:00:08 0:01:01 0:00:33
1×1600 0:00:48 0:00:07 0:00:54 0:00:30
2×1600 0:00:41 0:00:07 0:00:53 0:00:30
3×1600 0:00:41 0:00:07 0:00:53 0:00:30
4×1600 0:00:41 0:00:07 0:00:53 0:00:30

Собственно, поэтому мы и говорили о том, что 14% разницы при распаковке архива в 7-Zip — это не так много: на деле тест выполняется менее 10 секунд, а минимальной единицей измерения является одна секунда. С другой стороны, стабильность результатов при такой небольшой абсолютной величине хорошо показывает, что число каналов тут точно никакого значения не имеет — иначе могли бы и какие-нибудь «взбрыки» обнаружиться. При одиночных прогонах они, конечно, и обнаруживаются, но поскольку, согласно методике, у нас каждый тест выполняется несколько раз, на конечном итоге «элемент случайности» не сказывается.

Итого

В общем и целом никаких неожиданностей не оказалось. Причина понятна: между вычислительными ядрами и собственно оперативной памятью давно уже «живут» несколько уровней кэша. Который намного быстрее DRAM, но тоже имеет не беспредельную производительность. Равно как и сам контроллер памяти. И предел его способностей далек от теоретической пропускной способности, которую можно было бы получить от четырех каналов высокочастотной памяти типа DDR3. Скорее всего (пусть и достаточно грубо) этот предел можно на основании тестирования предположить где-то на планке в 25 ГБ/с, для достижения чего достаточно двух модулей DDR3-1600, трех DDR3-1066 или четырех DDR3-800. Возможно, что «потолок» находится немного выше, но стоит в обязательном порядке учитывать и то, что «нащупать» его без серьезной многопоточной нагрузки просто невозможно. Один вычислительный поток даже в таких программах, как архиваторы, традиционно славящиеся своими требованиями к пропускной способности памяти, не утилизирует и пару каналов DDR3-800, которая давно уже не производится, т. е. скорость работы этого типа памяти имеет исключительно теоретическое значение. Как, впрочем, и одноканальный режим: даже если много памяти не нужно, уж восемь-то гигабайт чем занять найдется, а такой объем дешевле и проще получить двумя модулями по 4 ГБ, нежели одним до сих пор экзотическим на 8 ГБ.

Что это дает на практике? Свободу выбора :) Если нам нужно много памяти, то четырехканальный контроллер позволяет ее много и установить, причем без снижения производительности (на что приходится идти при установке более двух модулей на канал). Если же много не нужно (какая-нибудь вычислительная задача с небольшими объемами данных или вообще всякие игрушки и подобные непотребства), то можно парой-тройкой модулей и ограничиться. Также при переходе на LGA2011 с другой платформы вовсе не обязательно бежать докупать или покупать новую память — и старая поработает. Конечно, желательно иметь память высокоскоростную — эффект от нее проявляется везде и всегда просто потому, что, увеличивая частоту, мы не только увеличиваем ПСП (которая все равно ограничена сверху другими компонентами), но и уменьшаем задержки, а в их случае нет пределов совершенству.



Благодарим компании Corsair, G.Skill и Palit
за помощь в комплектации тестовых стендов.



Дополнительно

iXBT BRAND 2016

«iXBT Brand 2016» — Выбор читателей в номинации «Процессоры (CPU)»:
Подробнее с условиями участия в розыгрыше можно ознакомиться здесь. Текущие результаты опроса доступны тут.

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.