Влияние производительности системы памяти на быстродействие Intel Core i7-3770K


Компания Intel долгое время отказывалась от использования интегрированных контроллеров памяти в своих процессорах, «переживая» войну стандартов. Такое решение было вполне оправданным. AMD за период с 2003 по 2009 год пришлось несколько раз менять контроллеры и даже сокеты как раз ради поддержки разных версий DDR SDRAM (S754 — одноканальная DDR, S939 — двухканальная DDR, AM2/AM2+ — DDR2, AM3 — DDR3), причем совместимость новых процессоров со старыми платами удалось сохранить лишь на последнем этапе, а у Intel как в 2004 массовой платформой стала LGA775, так и оставалась ей до второй половины 2009. Поддержка памяти определялась чипсетом, так что эта платформа как раз успела поработать со всеми — начиная с двухканальной DDR400 (i915P) на старте, через DDR2 разной частоты (последующие чипы 900-й серии) и заканчивая DDR3-1333 в последнем поколении плат.

Однако при всей своей привлекательности такой подход имел серьезный технический недостаток — поддерживалась любая память, но вот высокоскоростная работала неэффективно. Дело в том, что для связи процессора с чипсетом использовалась шина QPB, дебютировавшая еще в Pentium 4. На старте (т.е. в 2000 году) ее пропускная способность в 3,2 ГБ/с на частоте 400 МГц казалась огромным запасом на будущее — единственным типом памяти, способным задействовать такую ПС, являлась двухканальная RDRAM 800 МГц. Обычная SDRAM имела пропускную способность втрое ниже (причем широкая шина затрудняла использование многоканальных конфигураций), а DDR еще не было. Появилась эта память изначально в виде модулей с частотой 200 и 266 МГц, что давало пропускную способность в 1,6 или 2,1 ГБ/с. Но к этому моменту появился уже и 533 МГц вариант QPB, где пропускная способность была повышена до 4,2 ГБ/с. В общем, у процессора оставался двукратный запас по сравнению с памятью, так что и выход DDR-333 ничего существенно не изменил. Радикальный прорыв случился в 2003 году, когда на рынок вышел чипсет i875P (а чуть позднее — и его вариант для массового рынка под именем i865PE), где поддержка системной шины с частотой 800 МГц сочеталась с двухканальным контроллером DDR SDRAM с частотой до 400 МГц. И там 6,4 ГБ/с, и там 6,4 ГБ/с — идеальный баланс. Но только при использовании топовых процессоров — при шине 533 МГц (напомним — 4,2 ГБ/с) можно было использовать DDR2-333 (2,7 ГБ/с на канал или 5,4 ГБ/с суммарно), т.е. память начала уже уходить вперед.

«Гонка с препятствиями» продолжалась все время существования DDR2, причем процессоры отставали в ней все сильнее и сильнее. Частоту FSB удалось нарастить до 1600 МГц, но лишь в одной единственной модели процессора. А ведь этого достаточно для синхронной работы лишь с памятью, частотой 800 МГц. При этом DDR2 доросла до 1067 МГц, а DDR3 с 800 только стартовала. Таким образом, к 2008 году двухканальность чипсетов стала бесполезной с точки зрения производительности — большинству процессоров было достаточно (а многим моделям — даже слишком много) одноканальной DDR3-1333, к тому моменту ставшей массовой и недорогой. Фактически польза от двух каналов стала ограничиваться тем, что на плату можно было поставить четыре слота для памяти и использовать ее на полной скорости — конфигурации с тремя модулями на канал всегда были менее стабильными, а четыре для обычной SDRAM почти никто использовать и не пытался (точнее, это пробовали делать во времена i440BX, когда вся система работала на куда более низких частотах).

Таким образом, необходимость перехода к интегрированному контроллеру памяти стала очевидной. И это было сделано в рамках LGA1366 в конце 2008 года. Во второй половине 2009 к ней присоединилась и массовая LGA1156. Эти две платформы, по сути, лишь сокращали отставание от памяти, поскольку частота последней по-прежнему была ограниченной: трехканальная DDR3-1066 для первой и двухканальная DDR3-1333 для второй, т.е. все улучшения и ускорения касались лишь внутренней работы контроллера. Более высокие частоты можно было получить лишь при разгоне, причем это вызывало и повышение тактовой частоты всех или части внутренних блоков процессора — желанный эффект для оверклокера, но несколько не то, что требовалось при желании увеличить лишь производительность системы памяти.

Платформа LGA1155 тоже была ограничена штатной поддержкой лишь DDR3-1333, но подход к разгону памяти изменился радикально. На платах с чипсетом P67 (а позднее и Z68) для памяти можно было использовать множители, вплоть до 21,33, т.е. даже DDR3-2133 (и все более медленные варианты), никак не затрагивая остальные схемы процессоров. Естественно, это касалось не всех процессоров — Celeron и часть Pentium вообще оказались ограниченными DDR3-1066, но, по крайней мере, любимые энтузиастами модели поддержкой (пусть и нештатной) высокоскоростной памяти обделенными не оказались.

А последние месяцы принесли нам и штатную поддержку DDR3-1600 — в процессорах Sandy Bridge-E (LGA2011) и Ivy Bridge (LGA1155). Последним и разгон памяти улучшили — теперь можно даже DDR3-2667 использовать. Однако мы, тестируя и те, и другие, ограничивались ранее простой и привычной DDR3-1333. Что вызывало нарекания среди части читателей — дескать, неправильное сравнение получается, поскольку часть моделей искусственно ограничена. Но, как уже было сказано недавно если уж повышать частоту, то не с 1333 до 1600 МГц, а повыше. Вот этим мы сегодня и займемся. Т.е. тестирование должно помочь найти ответы на два вопроса. Первый — что дает увеличение частоты памяти в реальных приложениях (а других мы в методике и не держим). И второй немного провокационный — не является ли двухканальный контроллер памяти рудиментом эпохи Pentium 4? :)

Конфигурация тестовых стендов

Нами был взят нынешний флагман для платформы LGA1155 — Core i7-3770K. Причины очевидны: быстрая память может быть востребована лишь быстрым процессором. Младшие модели в какой-то степени могут быть более восприимчивы к частоте памяти, поскольку у них кэш меньше и медленнее, но ведь и все остальное у них тоже медленнее, т.е. возможностей «упереться» именно в память меньше.

  Системная плата Оперативная память
Base Biostar TH67XE (H67) Corsair Vengeance CMZ8GX3M2A1600C9B (2×1333; 9-9-9-24)
1×1066 Intel DZ77GA-70K (Z77) G.Skill [RipjawsX] F3-14900CL9D-8GBXL (1×1066; 9-9-9-28)
2×1066 Intel DZ77GA-70K (Z77) G.Skill [RipjawsX] F3-14900CL9D-8GBXL (2×1066; 9-9-9-28)
1×1866 Intel DZ77GA-70K (Z77) G.Skill [RipjawsX] F3-14900CL9D-8GBXL (1×1866; 9-10-9-28)
2×1866 Intel DZ77GA-70K (Z77) G.Skill [RipjawsX] F3-14900CL9D-8GBXL (2×1866; 9-10-9-28)

Пять тестовых конфигураций. Первая — та, в которой процессор тестировался в рамках «стандартной» линейки. Именно она взята за эталон, т.е. за 100 баллов на диаграммах ниже. В остальных материнская плата другая, поскольку на Н67 мы можем множитель разве что снизить. Или повысить, но только до 16, а нам хотелось большего. Например, DDR3-1866, благо такая память у нас есть и давно используется для тестирования процессоров AMD. Ну и как граница снизу — DDR3-1066. Этот вариант, кстати, имеет не только теоретическое значение — у пользователя, решившего сделать апгрейд с LGA775 на LGA1155 вполне может остаться как раз пара таких модулей. Да, небольшого объема, однако как мы уже выяснили иногда и 4 ГБ может вполне хватить. Особенно на первое время — с перспективой увеличения. Но, мы, естественно, проводили тестирование с 8 ГБ памяти, устанавливая модули либо в один, либо в два канала. Видеокарта (NVIDIA GeForce GTX 570 1280 МБ в исполнении Palit), как и емкость памяти, тоже является  стандартной для большинства тестирований.

Тестирование

Традиционно, мы разбиваем все тесты на некоторое количество групп, и приводим на диаграммах средний результат по группе тестов/приложений (детально с методикой тестирования вы можете ознакомиться в отдельной статье). Результаты на диаграммах приведены в баллах, за 100 баллов в данной статье принята производительность «референсной» системы на Core i7-3770K из основной линейки тестов. Тем, кто интересуется более подробной информацией, опять-таки традиционно предлагается скачать таблицу в формате Microsoft Excel, в которой все результаты приведены как в преобразованном в баллы, так и в «натуральном» виде.

Интерактивная работа в трёхмерных пакетах

Есть ощущение, что работа с видеокартой на топовой плате Intel на топовом же Z77 происходит несколько медленнее, чем на середнячке от Biostar на мейнстримном Н67. Впрочем, возможно так и должно быть, а быть может — и просто временное явление, связанное с исходной «сыроватостью» прошивок для более новой платы. Нам же тут важна разница между четырьмя конфигурациями ОЗУ, которые можно сравнивать непосредственно, благо тут-то условия вообще идентичные. И видно, что какой-то прок от двухканальности есть везде, но вот при наличии высокоскоростной памяти выигрыш снижается до минимума. Т.е., фактически, два модуля DDR3-1066 медленнее всех, а вот три остальных варианта примерно равны друг другу.

Финальный рендеринг трёхмерных сцен

Теоретически чисто вычислительная задача могла бы оказаться и вовсе невосприимчивой к подсистеме памяти, однако на практике какое-никакое ее влияние есть. Но только при использовании самой медленной DDR3-1066, да и то — в двухканальном режиме можно считать, что и последней вполне достаточно, поскольку результаты лишь на 1% ниже, чем в «правильных» конфигурациях. Впрочем, и 2% потерь при использовании одноканальной DDR3-1066 совсем не то, о чем стоит расстраиваться :)

Упаковка и распаковка

Как и ожидалось, эти программы очень восприимчивы к характеристикам системы памяти. На первом месте, впрочем, задержки, а потом уже ПСП — 2х1066 медленнее, чем 1х1866. Но один низкоскоростной модуль медленнее всех и его отставание от «среднестатистического» варианта составляет весомые 15%. В свою очередь, один модуль DDR3-1866 уже держится на уровне двух 1333 (проиграв в ПСП выигрываем в более весомом — задержках доступа), а два таких позволяют выжать еще примерно 5% производительности.

Кодирование аудио

Как и следовало ожидать, в среднем аудиокодирование к системе памяти вообще невосприимчиво. А один-два процента тудемо-сюдемо — типовой разброс результатов на быстром процессоре.

Компиляция

А вот еще одна «жадная» до памяти группа, пусть и в меньшей степени, нежели архиваторы. Но все равно — отставание одноканальной DDR3-1066 от канонически правильной конфигурации составляет весомые 10%, чем уже никак не стоит пренебрегать. Да и двухканальная DDR3-1066 тоже медленнее «нормальной» памяти. А вот повышение тактовой частоты до 1866 МГц заметных преференций уже не приносит — максимум 2%.

Математические и инженерные расчёты

Три из пяти программ не только считают что-то несложное, но и визуализацией полученного занимаются, а в этом случае производительность системы памяти какое-никакое значение имеет. Впрочем, уже не в первый раз однозначным аутсайдером является одноканальная DDR3-1066, но стоит даже такие модули поставить в разные каналы, как большая часть отставания отыгрывается. Причем, как обычно, на первом месте задержки, а не пропускная способность: одного модуля DDR3-1866 будет достаточно для выхода на средний уровень и обойти два DDR3-1066 (хотя теоретическая ПСП в последнем случае выше), а два прибавляют к результату уже привычные 2%.

Растровая графика

Предпочтения входящих в группу программ разные, однако подробное их изучение мы оставим как самостоятельную работу :) В среднем же, как видим, на производительность влияют оба фактора — и ПСП, и задержки, но с перевесом в сторону последних. Причем в очередной уже раз более-менее заметно из общего ряда выбивается лишь одноканальная DDR3-1066, т.е. вот такой конфигурации уже маловато (относительно — 5% нельзя назвать глобальной разницей), а начиная с двух каналов такой памяти дальнейшие приросты укладываются в формулу в час по чайной ложке.

Векторная графика

Пожалуй, некоторая разница между платами присутствует — иначе сложно объяснить тот факт, что при одинаковом результате он оказался ниже, чем в «базовой» линейке тестирований. Но нас сегодня больше волнует не это, а разница между конфигурациями памяти в одинаковых условиях. Которая, как видим, отсутствует целиком и полностью.

Кодирование видео

Работа с видео есть обработка больших массивов данных, так что у нас даже были надежды, что вот здесь-то двухканальная DDR3-1066 сумеет обогнать одноканальную DDR3-1866. Но не судьба — они почти равны, однако вторая все равно чуть-чуть быстрее за счет задержек. Однако и пользу от двухканального режима тут сложно проигнорировать — есть. И заметная. Но заметная в максимальной степени на частоте 1066, а вовсе не 1866 МГц. Т.е. есть тут некоторая «точка насыщения», определяемая контроллером. И все больше и больше крепнет уверенность, что находится она где-то в районе 1333 МГц, которые до последнего времени были официальным максимумом для платформы.

Офисное ПО

Что любопытно, так это схожесть программ офисного назначения с... рендерингом: получились две абсолютно одинаковых диаграммы. Однако вряд ли кого-то это способно удивить: все требование входящих в эту группу программ к памяти ограничиваются одним — лишь бы емкости хватило.

Java

А вот JVM в очередной раз подтвердила свою заинтересованность во всех параметрах системы памяти. Что неудивительно — в свое время она оказалась одной из редких программ, однозначно голосующих за трехканальность на LGA1366 и не менее однозначно брезговала одноканальными конфигурациями. Вот и сейчас стараниями этой виртуальной машины нам удалось найти хоть одну сферу, где двухканальная DDR3-1066 сумела выступить вровень с одноканальной DDR3-1866. Да и в случае последней прирост от двухканального режима чуть ли не максимальный во всем тестировании.

Игры

Необходимость быстрой памяти для игровых приложений давно уже никем не оспаривается. Естественно, она выражена в меньшей степени, чем для архиваторов или компиляторов, но есть. Однако на первом месте, как и в большинстве тестов, задержки, а вот ПСП нужна постольку-поскольку. Точнее, медленным модулям нужна, а вот быстрые могут оказаться и более быстрыми, чем способен переварить интегрированный в процессор контроллер.

Игры: низкое качество

А что будет, если уменьшить нагрузку на видео и, соответственно, «выпятить» остальные подсистемы компьютера? Очевидно, влияние скорости памяти увеличится, что мы и наблюдаем на диаграмме. Однако принципиально ситуация не изменилась: первым делом — задержки, а канальность — потом. Причем разница между одним и двумя каналами заметно выражена лишь для медленных модулей, но не для быстрых.

Итого

Что имеем в сухом остатке? Использование медленной памяти способно замедлить работу системы, а использование быстрой — почти неспособно ее ускорить. Точнее, когда испробованы все остальные способы повышения производительности, выбор более высокочастотной памяти может помочь «выжать» еще несколько процентов. Что крайне востребовано бенчерами, но не слишком актуально для широких масс простых трудящихся :) С другой стороны, последние вряд ли будут разгонять память (да и вообще — приобретать платы на чипсетах, где такое возможно), так что для них наиболее приятным результатом является то, что обычной DDR3-1600 (поддерживаемой новыми процессорами штатно) или даже DDR3-1333 вполне достаточно. Да и от использования более медленных вариантов отвращает не то, что это слишком уж медленно (каких-то 5% даже в наиболее «жадных» типах приложений — было бы о чем говорить), а то, что их на данный момент не так-то просто приобрести. С другой стороны, если такая память уже есть, можно и закрыть глаза на небольшой проигрыш в производительности.

Что касается двухканального режима работы, то, как видим, он по-прежнему вполне востребован, причем даже при использовании высокочастотных моделей. Хотя в целом один высокочастотный не хуже двух низкочастотных, однако выбрать именно такой вариант мешают разные цены и то, что на данный момент модули с частотой 1866 МГц и выше по одному все равно практически не встречаются :) А вот DDR3-1600 — бывает и недорого. Что особенно полезно в тех случаях, когда большой объем памяти не планируется (вообще или на ближайшую перспективу): один модуль на 4 ГБ обойдется дешевле, чем 2х2 ГБ, да и устареет позднее. Тем более, в этом случае наращивание объема памяти (если, все же, это покажется необходимым) окажется более простой и дешевой операцией. Ну а на потери от отсутствия двухканального режима на первом этапе можно и не обращать внимания — на таких частотах они не столь уж критичны.

Итак, какие можно сделать практически полезные выводы? Использовать в системе на базе Ivy Bridge память от старого компьютера можно — даже двухканальная DDR3-1066 к слишком уж заметным потерям производительности не приведет. Покупать при сборке нового компьютера для экономии на первом этапе один модуль памяти, а не пару, тоже можно — широко доступная ныне недорогая DDR3-1600 и при таком использовании обеспечит нормальный уровень производительности. Но если задача сэкономить (в том числе, и на емкости) не стоит, оптимальным вариантом, все же, будет покупка комплекта на 8 ГБ из двух модулей DDR3-1600. Хотя можно и 1333 или, наоборот, 1866 МГц (особенно если платы позволяет разгон памяти, т.е. основана на одном из чипсетов оверклокерской серии: P67, Z68, Z75 или Z77) — все зависит от цен в выбранном магазине. Более скоростные варианты позволят еще немного увеличить производительность, однако тут уже прирост будет слишком скромным и непропорциональным цене: хороший комплект DDR3-2400 с легкостью может оказаться втрое дороже, чем аналогичный по емкости DDR3-1600, ну или «потянуть» на ту же сумму, что последний вдвое больший по объему. И последний по списку (но не по значимости) совет — если уж руки чешутся заняться ручным тюнингом, эту энергию стоит направить в мирное русло, т.е. на оптимизацию задержек. Тем более, что такая операция возможна независимо от чипсета, а ее эффективность в системах с ИКП выше, чем у лобового повышения тактовой частоты.

Благодарим компании Corsair, Enermax, G.Skill и Palit
за помощь в комплектации тестовых стендов



Дополнительно

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.