Влияние производительности системы памяти на быстродействие Intel Core i7-3970X Extreme Edition


Платформа LGA2011 к массовому рынку не относится (хотя бы потому, что для нее нет процессоров с ценой, попадающей в массовых диапазон $80–$200), однако вызывает интерес (как минимум, теоретический) многих наших читателей. Тем более подогреваемый тем, что по осени ожидается ее небольшое обновление — выпуск процессоров на ядре IB-E. Это не так уж много, поскольку в массовом сегменте Ivy Bridge уже превращается в отмирающую архитектуру, но не так уж и мало, поскольку определенные преимущества перед Sandy Bridge у нее есть.

Однако пока новые процессоры не появились, тестировать нам некого — старые уже изучены. А вот определенные пробелы в области функционирования системы памяти пока остались, так что мы решили сегодня их закрыть. Тем более что в рамках основной линейки тестов все модели под LGA2011 мы изучали совместно с DDR3-1333, что несколько меньше, чем официально поддерживаемые 1600, и вдвое ниже, чем теоретически достижимые путем разгона 2666 МГц. Впрочем, как показали наши тестирования памяти, достичь максимума не так уж просто, да и от конкретного процессора он зависит, однако на чуть более низкие ступеньки (2400 и, тем более, 2133 МГц) «запрыгнуть» проблем не составляет. Нужно или нет — другой вопрос. Равно как и часто муссируемые преимущества четырехканального контроллера: с точки зрения житейской логики очевидно, что четыре — вдвое больше, чем два, однако какова вероятность превратить потенциальную производительность в реальную? Хотя этот-то вопрос, как нам кажется, более теоретический, чем практический — большинство пользователей этой платформы уж четыре-то модуля памяти покупает, так что встреча с «менее канальной» конфигурацией в реальной жизни маловероятна. Но ведь интересно же!

Некоторую «пристрелку» мы уже проводили в рамках экспресс-тестирования полтора года назад. Выяснили, что частота и тайминги на производительности сказываются по крайней мере до 1600 МГц, а вот более двух каналов задействовать архисложно. Но ограничились мы тогда только архиваторными тестами, так что, возможно, полной картины не получили: эти программы хорошо подходят для тестирования, поскольку требовательны к системе памяти, однако интересны и другие приложения. Вот сегодня мы ими и займемся.

Конфигурация тестовых стендов

Разных «систем» сегодня будет три — правда, две из них физически идентичны (различаются только настройки), а третью отличает от них небольшая переустановка двух модулей памяти из четырех в другие слоты. Благо использовали мы системную плату Intel DX79SI, где слотов для ОЗУ восемь, так что один и тот же объем в 16 ГБ модулями по 4 ГБ можно набрать как в двух-, так и в четырехканальном режиме. Что мы и сделали, выставив заодно и режим DDR3-1333 с относительными таймингами 9-9-9-24: как раз такой четырехканальный режим и является стандартным для основной линейки тестов. Ну а последний вариант — тоже четыре канала, но DDR3-2400 10-10-10-27. Вообще говоря, не слишком мягкий режим, но наш комплект Corsair Dominator Platinum на указанной выше плате совместно с процессором Core i7-3970X Extreme Edition справляется с ним даже без необходимости повышать напряжение на контроллере памяти и лишь с небольшим «добросом» на сами модули. Вот таким вот образом у нас набрались три тестовые конфигурации, которые чуть ниже мы и будем изучать подробно.

Тестирование

Традиционно, мы разбиваем все тесты на некоторое количество групп и приводим на диаграммах средний результат по группе тестов/приложений (детально с методикой тестирования вы можете ознакомиться в отдельной статье). Результаты на диаграммах приведены в баллах, за 100 баллов принята производительность референсной тестовой системы iXBT.com образца 2011 года. Основывается она на процессоре AMD Athlon II X4 620, ну а объем памяти (8 ГБ) и видеокарта (NVIDIA GeForce GTX 570 1280 МБ в исполнении Palit) являются стандартными для всех тестирований «основной линейки» и могут меняться только в рамках специальных исследований. Тем, кто интересуется более подробной информацией, опять-таки традиционно предлагается скачать таблицу в формате Microsoft Excel, в которой все результаты приведены как в преобразованном в баллы, так и в «натуральном» виде.

Интерактивная работа в трехмерных пакетах

Как несложно было предположить на основании уже имеющихся у нас знаний, на количество каналов памяти эти программы внимания не обращают, а вот на уменьшение задержек в более высокочастотном режиме реагируют положительно. Хотя и незаметно для невооруженного глаза.

Финальный рендеринг трехмерных сцен

Аналогичная картина, только вот и от повышения частоты памяти эффект еще уменьшился. Что ж, можно считать, что с определенного момента приложения такого рода становятся независимыми от системы памяти. Какого момента? А практически любого, что показывало и наше тестирование Core i7-3770K .

Упаковка и распаковка

Эта группа программ нами уже изучалась подробно, так что с ней было все ясно априори: к характеристикам системы памяти архиваторы требовательны, но на повышение частоты реагируют всегда (пусть и слабо — после достижения определенного уровня), а вот увеличение канальности может пригодиться лишь при многопоточной работе. Если для архивации это условие уже худо-бедно выполняется (в частности, за прошедшее с момента ввода тестовой методики в эксплуатацию время и WinRar стал действительно много-, а не двухпоточным), то куда более частая обратная операция массовыми программами почти всегда выполняется всего в один поток. Ну а если использовать в тестах обе операции (что мы и делаем), то общий результат оказывается закономерным.

Кодирование аудио

Как и рендеринг, это задача на чистую математику. Правда, одновременная работа 12 потоков вычислений приводит к тому, что что какая-никакая разница между двух- и четырехканальным режимами есть, а вот частота значения не имеет — пропускной способности даже DDR3-1333 достаточно, задержки в потоковом режиме минимальны.

Компиляция

Многопоточность здесь «врожденная», а не внешняя, как в предыдущей группе, но очень важны и задержки. Однако в конечном итоге, как видите, увеличение числа каналов памяти дает эффект, аналогичный приросту частоты. Казалось бы, чистая победа… Но слишком уж омраченная тем, что прирост, вообще говоря, копеечный: даже между 2×1333 и 4×2400 не набралось и 5% разницы.

Математические и инженерные расчеты

Три приложения из пяти — те же, что и в самой первой группе, а вот результат совершенно иной, что логично: работы процессора стало больше. В особенности порадовал MATLAB — этот математический пакет отреагировал на канальность памяти чуть ли не самым заметным среди всех приложений методики образом. Как и следовало ожидать, у него наилучшая многопоточная оптимизация во всей группе. Другие ее члены отреагировали на изменение количества каналов менее бурно, а некоторые — и вовсе не заметили разницы. Но что-то — лучше, чем ничего.

Растровая графика

…Поскольку бывает и ничего или почти ничего. То есть нельзя сказать, что разницы нет совсем — просто она почти неуловима.

Векторная графика

То же и в этой группе однопоточных (фактически) программ, где результирующий один балл разницы можно списать на погрешность измерения и особенности округления. Вот к частоте памяти эти программы восприимчивы, что, впрочем, очевидно: задержки снижаются.

Кодирование видео

А вот эти приложения восприимчивы и к пропускной способности памяти, что немудрено: все-таки обработка видео предполагает работу с большим количеством данных. С другой стороны, процессоры такого класса справляются с нашими тестовыми заданиями легко, так что реальная разница между конфигурациями исчисляется в секундах.

Офисное ПО

Кто-нибудь сомневался в том, что в этой группе приложений все варианты окажутся практически равнозначными? Мы — нет. То есть в очередной раз имеем случай, когда какие-либо изменения в системе фиксируются лишь тестами, да и их-то результаты нужно изучать под микроскопом.

Java

SPECjvm всегда относился к числу тестов, чувствительных к количеству каналов памяти — настолько, что недавно оказался единственным, где медленная память в двухканальном режиме оказалась равна быстрой в одноканальном. Ничего удивительного, что и в сегодняшнем тестировании картина схожая. И омрачает радость лишь то, что в очередной раз прирост производительности оказался столь небольшим. Работает себе Core i7-3970X в таких условиях в три раза быстрее, чем эталонный (по совместительству — еще и старый бюджетный) Athlon II X4 620, и работает — никаким конфигурированием «периферийной» составляющей его не замедлить и не ускорить настолько, чтоб это было заметно без длительных специальных тестирований.

Игры

Игровые приложения, как мы знаем, к системе памяти достаточно требовательны. Но все равно на итоговом результате это может отразиться весьма слабо — даже слабее, чем эффект от замены процессора, который, в свою очередь, значительно уступает вкладу от видеокарты.

Игры: низкое качество

Для систем такого уровня, конечно, подобные настройки — чистой воды синтетика. Тем более что мы уже установили, что «на минималке» и требования к процессору тоже снижаются. А к видеокарте — естественно, снижаются многократно. И вот только в таких условиях можно искать заметную (хоть в какой-то степени) разницу от частоты памяти. Заметим: именно частоты — она обеспечивает умопомрачительные 5% разницы в производительности. А четырехканальный режим быстрее двухканального лишь примерно на 1% — комментарии излишни.

Многозадачное окружение

Казалось бы — серьезная многопоточная нагрузка с числом активных потоков, превышающим аппаратные возможности процессора, причем в число активных задач входят и компиляция, и упаковка 7-Zip, которые и по одиночке очень требовательны к системе памяти. Однако… В очередной раз получаем все тот же результат: производительность меняется, но крайне незначительно. То есть как ни крути, как ни подгоняй условия, а «узкое место» обычно вовсе не в системе памяти. Улучшение характеристик последней, безусловно, нередко сказывается на производительности, однако, как видно, даже при атипичной для среднестатистического настольного компьютера нагрузке величина эффекта составляет 1-2%.

Итого

С точки зрения ортодоксального подхода к представлению экспериментальных результатов, за 100 баллов следовало бы принять самый медленный из трех сегодняшних скоростных режимов. К счастью, мы не стали его придерживаться — иначе диаграммы стали бы еще более однообразными, а цифры на столбиках практически не различались бы. Но относительно чего производительность ни меряй, а относительная итоговая разница между лучшим и худшим результатом сегодня не достигает и 3%. И это легко объяснимо: поведение части приложений от производительности системы памяти вообще не зависит никоим образом; многие программы реагируют на задержки, но не на ПСП; а способные задействовать четыре канала ОЗУ можно вообще пересчитать по пальцам. Впрочем, в практическом плане в этом нет ничего страшного. В конце концов, возможность установки большого объема памяти является одним из вполне реальных преимуществ LGA2011, так что меньше четырех модулей никто использовать и не будет. А к частоте отношение простое: если после подбора конфигурации осталось некоторое количество неоприходованных денежных средств, то можно купить более быстрые модули; а если не осталось — и аллах с ним! Будет чуть меньше «попугаев», но никакого заметного глазу эффекта. Да и для разгона процессоров на современных платформах «оверклокерские» модули уже не подспорье — опорная частота, как правило, остается стандартной, а если и меняется, то настолько незначительно, что этому можно не придавать значения.

Есть в этой ситуации и еще один любопытный момент. Процессоры для массовых платформ (Intel LGA1155/1150 или AMD FM2) «снабжены» прекрасным потребителем производительной памяти, а именно видеоядром. Нет никаких сомнений, что GPU могли бы утилизировать и четырехканальный режим, вот только… отсутствует таковой в их случаях. А на LGA2011 четырехканальный режим есть, зато нет видеоядра. Конечно, это объяснимо: на данный момент IGP занимает площадь, примерно равную паре ядер и 4 МиБ кэш-памяти, а в серверном сегменте (откуда родом данная платформа) второе куда более востребовано. С другой стороны, гетерогенные вычисления потихоньку перестают быть оторванной от жизни теорией, так что со временем ситуация может измениться. Не в этом году, и вряд ли в следующем, но со временем идея добавления к процессорным ядрам графического (не для 3D и прочего видео, а именно для GPGPU) способна стать здравой. И вот тут-то многоканальные конфигурации системы памяти могут оказаться козырным тузом в колоде. Но до этого момента еще нужно дожить.




Дополнительно

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.