Phenom II и DDR3

В чем преимущества от перехода на Socket AM3?


Говорят, что если собрать целый стадион людей и попросить всех одновременно загадать одинаковое желание, то оно непременно исполнится. Например, если все дружно начнут медитировать на фотографию какого-то дерева в лесу, представляя, что оно горит, то это самое дерево действительно может загореться. Не беремся утверждать, имеет ли этот психологический эксперимент что-то общее с действительностью, просто не проводили такого тестирования :) Однако, если представить: сколько обозревателей и интересующихся пользователей в разное время говорили о бесполезности перехода с DDR2 на DDR3, то теперь новому типу памяти, действительно, должно быть непросто оправдать свое существование, даже если какие-то предпосылки с технической точки зрения и начинают появляться. И мы, вполне отдавая себе отчет, что какого-то качественного скачка производительности, особенно в случае близких по частоте модулей, ожидать не приходится, решили провести полноценное тестирование.

Теория, между тем, содержит два аргумента в актив и одно — в пассив DDR3 (разумеется, не с точки зрения выбора системы охлаждения, тут у DDR3 есть преимущество в сниженном напряжении, и, как следствие, меньшем тепловыделении на равных частотах с DDR2, и, как минимум, не худших экономических показателях при сравнении реальных экземпляров одного класса, скажем, DDR2-1066 с DDR3-1600 или DDR2-667 с DDR3-1066 и т.п.). Положительные свойства касаются, во-первых, более высокой частоты, нежели доступная в стандарте DDR2, и, во-вторых, даже если пренебречь стандартом, и обратить внимание на частоты оверклокерских модулей, очевидно, что DDR3 все же штурмует более высокие рубежи, для чего и создавалась. В минусах, как нетрудно догадаться, находятся более высокие задержки, вернее: менее агрессивные тайминги, которые пользователь имеет возможность выставить. Но поскольку реальная величина задержек в равной мере определяется и частотой, и таймингами, имея достаточное превосходство по частоте, DDR3 должна выиграть или, как минимум, сравняться с DDR2 и по латентности, имея при этом более высокую пропускную способность, которая определяется почти только частотой.

Отсюда и должен происходить выигрыш в реальной производительности, разумеется, если процессор сумеет утилизировать прибавку в пропускной способности памяти, и на тех приложениях, которые ранее испытывали недостаток в эффективности обмена процессора с памятью. Но это — в теории, давайте, теперь посмотрим, как обстоят дела на практике.

Конфигурация тестового стенда

  • процессор: Phenom II X4 810
  • системные платы: Gigabyte MA790GP-DS4H, ASUS M4A78T-E (для тестов с интегрированной графикой), MSI 790FX-GD70
  • память: 2×2 ГБ Corsair CM2X2048-8500C5D DDR2-1066, Apacer DDR3-1333 CL9, OCZ 3G18004GK DDR3-1800, во всех случаях был установлен режим контроллера памяти «Unganged»
  • видеокарта: ASUS HD4870X2 (ATI Radeon HD 4870 X2, 1×2 ГБ GDDR5, установлены штатные частоты: 750 МГц для ядра и 900 (3600) МГц память GDDR5)
  • жёсткий диск: Seagate ES2 SATA II 750 ГБ
  • кулер: Zalman CNPS9700 AM2
  • блок питания: SeaSonic M12D 750 Вт

Используемое ПО и настройки

  • Windows Vista SP1 64 bit, Catalyst 9.2, AMD OverDrive 2.1.6, AMD Fusion for Gaming Ultility 1.0
  • RMMA 3.8, методика измерений описана в руководстве
  • 7-Zip 4.65 x64
  • WinRAR 3.80
  • GTA IV: встроенный бенчмарк, разрешение: 1680×1050, настройки: Texture Quality: high, Render Quality: high, View Distance: 52, Detail Distance: 100, Vehicle Density: 100, Shadow Density: 16
  • FarCry 2: прилагаемый к игре бенчмарк, разрешение: 1680×1050, демо Ranch (карта среднего размера), настройки Very High для всех параметров, кроме Post FX и Ambient (High)
  • Lost Planet Extreme Condition: встроенный бенчмарк, разрешение: 1440×900, все настройки на максимум, DX10, AFx16, взят результат сцены Cave
  • World in Conflict: встроенный бенчмарк, разрешение: 1680×1050, DX10, тест запускался в двух режимах с настройками Very High и High
  • PT Boards Knights of the Sea: демо-бенчмарк, разрешение: 1680×1050, DX10, все настройки на максимум

Штатным режимом контроллера памяти в процессорах для Socket AM3 на сегодняшний день является DDR3-1333, но мы протестировали и на меньшей частоте (1066) и на большей (1600), множитель для установки которой (автономно, то есть без подъема опорной частоты и прочего) также поддерживается процессорами для разъема Socket AM3 и, соответственно, присутствует в BIOS. Кроме того, мы протестировали стабильность работы с частотой DDR3-1333 при установке двух модулей на канал (то есть при заполнении всех 4 слотов памяти), а также сравнили результаты при подъеме частоты ядра и северного моста.

  DDR2 DDR3 DDR3 (8 ГБ, 4 модуля) DDR2 и DDR3 (режим разгона ЦП)
Частота памяти, МГц
(DDR2/DDR3 МГц)
400 (800) 533 (1066) 533 (1066) 667
(1333)
667
(1333)
800 (1600) 800 (1600) 667
(1333)
380 (DDR2-760) 772 (DDR3-1544)
Частота «северного моста» процессора, МГц 2000 (200×10) 2000 (200×10) 2000 (200×10) 2000 (200×10) 2000 (200×10) 2000 (200×10) 2000 (200×10) 2000 (200×10) 2574 (286x9) 2610 (290x9)
Частота ядер процессора, МГц 2600
(200×13)
2600
(200×13)
2600
(200×13)
2600
(200×13)
2600
(200×13)
2600
(200×13)
2600
(200×13)
2600
(200×13)
3718
(286×13)
3770
(290×13)
Тайминги памяти 5-5-5-15-2T 5-5-5-15-2T 8-8-8-24-1T
9-9-9-24-2T
9-9-9-24-1T
9-9-9-24-2T 9-9-9-24-1T 9-9-9-24-1T 5-5-5-15-2T 9-9-9-24-1T
Средняя ПСП на чтение (МБ/с),
1 ядро
5930 6704 6536 6835 6985 7250 7377 6910 6449 8589
Средняя ПСП на запись (МБ/с),
1 ядро
3800 4295 4146 4323 4432 4746 4777 4530 3918 5638
Макс. ПСП на чтение (МБ/с),
1 ядро
6840 7798 7373 7824 7908 8466 8596 7882 7319 9546
Макс. ПСП на запись (МБ/с),
1 ядро
6612 6628 6573 6368 6572 6573 6640 6528 8607 8720
Средняя ПСП на чтение (МБ/с),
4 ядра
11280 14780 14155 15215 15105 15400 15432 15300 10950 18178
Средняя ПСП на запись (МБ/с),
4 ядра
4770 6100 5810 6532 6566 7475 7500 6688 4635 7765
Макс. ПСП на чтение (w/PF, МБ/с),
4 ядра
11412 14990 14780 16002 16024 16500 16600 15282 11080 19114
Макс. ПСП на запись (NT, МБ/с),
4 ядра
8010 8031 7794 7995 8113 8150 8020 7992 10040 10602
Минимальная латентность псевдослучайного доступа, нс 35,7 32,2 32,0 31,6 31,7 29,0 28,9 31,6 33,1 25,3
Минимальная латентность случайного доступа, нс 85,5 76,5 85,9 82,8 82,8 75,3 74,4 82,8 76,4 66,2

Первой, обратившей на себя внимание, приятной особенностью оказалась стабильность режима с минимальной задержкой командного интерфейса (1T). Ранее такую задержку удавалось использовать далеко не со всеми модулями, даже на частоте DDR2-800, а для DDR2-1066 почти всегда на практике устанавливалось 2T. Теперь же минимальную задержку удалось установить не только на штатной частоте, но и при подъеме до 1600, а также при установке сразу 4 модулей на 1333 МГц (причем мы установили комплекты от разных производителей: в дополнение к Apacer пару стандартных Kingston DDR3-1333). Последнее обстоятельство нас порадовало даже больше, поскольку в новостях проскакивала информация о возможных ограничениях по частоте для 4 модулей, а в действительности оказывается, что не только не приходится снижать частоту, но и тайминги можно сохранить те же самые, вплоть до вовсе не ожидавшейся возможности оставить 1T! Аналогичная картина наблюдалась на обоих платах, участвовавших в тестировании. Судя по всему, соответствующие поправки, если они и были нужны, уже внесены в BIOS плат. И это радует, пусть сразу ставить 4 модуля не имеет смысла в подавляющем большинстве случаев, но со временем, когда пользователь соберется расширить объем памяти, он сможет сделать это, не жертвуя производительностью.

Ясно, что какого-то радикального влияния на производительность, величина этой задержки не имеет (и возможно, для каких-то менее удачных модулей придется выставить и 2T, исходно эта задержка и была введена для повышения совместимости), но само по себе это обстоятельство свидетельствует, что контроллер памяти у AM3-процессоров уже с первых ревизий отлажен как следует. С другой стороны, для AMD это уже третье поколение интегрированных контроллеров, и видимо накоплен соответствующий опыт.

Что касается сравнения производительности в сочетании с DDR2 и DDR3, то в полном соответствии с теорией, режим DDR3-1333 приносит преимущество лишь в пропускной способности, а задержки при случайном поиске оказываются выше, чем у DDR2-1066. А DDR3-1600 превосходит DDR2-1066 уже по всем показателям. И наоборот: переход на DDR3-1066 является однозначно вредной затеей, пропускная способность аналогична DDR2 c той же частотой, а задержки выше. Кстати, на частоте 1600 МГц неожиданно смогли стабильно работать и модули Apacer, штатно являющиеся DDR3-1333, причем с минимальным подъемом напряжения до 1,6 В.

Но действительно существенный контраст между конфигурациями с DDR2 и DDR3 наблюдается в режиме разгона. Как мы отмечали, для успешного разгона Phenom II X4 810 нам пришлось скомпенсировать частоту памяти таким образом, чтобы она стремилась к DDR2-800, даже если в штатном режиме память работала как DDR2-1066. При переходе на DDR3 такого ограничения не наблюдается, да и стабильный максимум частоты оказался чуть выше. Впрочем, имея дело с процессором с разблокированным множителем, который позволяет в режиме разгона оставить DDR2-1066, разница несколько сократится. Но очевиден и тот факт, что разогнанный процессор в большей степени нуждается (и может эффективно использовать скоростную память), поэтому разница практически по всем тестам оказывается выше, нежели мы видим, сравнивая результаты на штатной частоте при использовании DDR2-800 и DDR3-1600, особено при многопоточном доступе. А значит для энтузиастов и любителей технических экспериментов переход на DDR3 будет оправдан в большей степени, нежели для тех, кто пользуется штатными режимами.

Но чтобы аргументированно судить, надо посмотреть результаты не только в синтетике, но и реальных приложениях, возьмем самые распространенные для такого рода оценок тесты: архиваторы и игры.

Phenom II X4 810 Штатные частоты Разгон
Частота ядер, ГГц 2,6 2,6 2,6 2,6 3,7 3,77
Частота CPU NB, ГГц 2,0 2,0 2,0 2,0 2,5 2,6
Частота памяти DDR2-800 DDR2-1066 DDR3-1333 DDR3-1600 DDR2-759 DDR3-1544
Тайминги памяти 5-5-5-15-2T 5-5-5-15-2T 9-9-9-24-1T 9-9-9-24-1T 5-5-5-15-2T 9-9-9-24-1T
7-Zip, мин:сек 2:23 2:17 2:15 2:13 1:58 1:44
WinRAR, мин:сек 1:18 1:15 1:15 1:13 1:02 0:56
GTA IV, fps 42,5 43,8 47,6 49,0 55,0 60,4
Lost Planet Extreme Condition, Cave , fps 76 79 82 82 100 108
FarCry 2, Ranch,
fps
56 61 62 64 76 85
World in Conflict, Very High,
fps
36 39 41 42 48 52
World in Conflict, High,
fps
44 50 51 54 57 66
PT Boards: Knights of the Sea,
fps
35 39 39 40 52 56

Фактически можно повторить выводы, сделанные по результатам синтетических тестов. Переход с DDR2-1066 на DDR3-1333 при работе процессора на штатных частотах приносит лишь небольшое преимущество, заметное в программах с активной многопоточностью (то есть когда все ядра вразнобой и под управлением разных процессов читают и пишут в память). Из нашей подборки к таким программам относятся две первые игры из таблицы. А вот если сравнивать DDR3-1600 с DDR2-1066, что само по себе логично, поскольку в обоих случаях соответствует максимальным частотам памяти, выставляемым с помощью штатного множителя (то есть без подъема опорной частоты и разгона процессора), то отличия уже более ощутимы. Но становится и заметно, что в ряде тестов, участвующий в тестах процессор уже просто не нуждается на штатных частотах в столь быстрой памяти. Поэтому, конечно, в тестировании с разгоном отличия проявляются наиболее заметно.

Ну а оправдывают или нет эти преимущества расходы на DDR3 каждый может ответить для себя самостоятельно. Главное, что процессоры для Socket AM3 предоставляют возможность выбора платформы с поддержкой обоих типов памяти, и пользователи (а равно и производители компьютеров) могут ориентироваться, исходя из собственных соображений.

А мы, тем временем, решили проверить еще один теоретически обоснованный вопрос: влияет ли хоть в какой-то степени смена типа оперативной памяти на производительность интегрированного в чипсет графического ядра. Ведь на платах с чипсетом AMD 790GX обычно устанавливается видеобуфер, причем в максимальной конфигурации именно стандарта DDR3-1333, но 128 МБ по современным меркам, это все же маловато, и для размещения текстур этот буфер используется совместно с буфером в оперативной памяти. Разумеется, влияние можно попробовать вытащить на поверхность, взяв какие-то особенно старые игры типа Quake 3, и наверняка обнаружить приличную разницу. Мы решили так не делать, пусть условия будут реальные, а поскольку интегрированное в чипсет AMD 790GX ядро все же достаточно мощное, чтобы пользователь смог поиграть и в относительно современные игры, пусть и на низких настройках качества, мы такие игры и взяли. Здесь уже согласно теории упирание должно быть в первую очередь в вычислительные ресурсы графического ядра, но вдруг не только?

790 GX (128 MB UMA+128 MB SidePort DDR3-1333) + Phenom II X4 810 DDR2-800 DDR2-1066 DDR3-1333
FarCry 2 (Low для параметров графики, High для Performance, демо Ranch Medium), 1280×720, fps 33,9 34,3 34,7
Crysis (VGA test, Low, встроенное демо), 1024×768, fps 34 34 38
World in Conflict (Low, 1280×720),
среднее/минимальное значение fps
52/14 53/14 53/16

Практическая разница есть лишь в Crysis, в остальных случаях, в выбранных разрешениях и видеорежимах, скорее всего, объем активно задействуемой видеопамяти не превышает 128 МБ.

Выводы

Судя по всему, максимально, насколько это возможно, эволюционная стратегия перехода на DDR3, предложенная компанией AMD, адекватна реальному положению дел на рынке памяти. Ведь с одной стороны, небольшое преимущество в штатных режимах явно не оправдывает разницу в российских розничных ценах на комплекты DDR2 и DDR3 одинакового объема и класса (на момент публикации статьи). С другой стороны, компании-производители компьютеров уже сейчас могут закупать стандартные модули DDR3, получая гораздо более привлекательное соотношение, нежели в рознице, и, судя по всему, миграция уже становится оправданной даже с экономической точки зрения, а тем более, вводя поправку на небольшое, но все же существующее преимущество по производительности. Еще одна категория пользователей, которая может быть заинтересована в переходе (вернее выборе для нового компьютера) DDR3 — это последовательные любители разгона. Процессоры, работающие на поднятых частотах, могут выжать из высокочастотной DDR3 больший потенциал и, как следствие, пользователь получает более высокую общую производительность. Разница хотя и не так велика, но ее уже не требуется «искать с лупой», то есть она, например, сравнима с добавкой в сотню-другую мегагерц частоты ядер.

Благодарим компанию Джаст за помощь в комплектации тестовых стендов,
компанию Apacer за предоставленные модули памяти DDR3-1333,
видеокарта ATI Radeon HD4870X2 предоставлена компанией ASUS




Дополнительно

iXBT BRAND 2016

«iXBT Brand 2016» — Выбор читателей в номинации «Процессоры (CPU)»:
Подробнее с условиями участия в розыгрыше можно ознакомиться здесь. Текущие результаты опроса доступны тут.

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.