Rambus не унывает и не сдается

практическое исследование производительности PC600/800/1066 и PC3200/4200 Rambus DRAM


Версия статьи с диаграммами под Flash 4

Всеобщее «засилье» памяти стандарта DDR, которая в последнее время имеет наилучшую (по крайней мере с точки зрения количества выпускаемых продуктов) поддержку в индустрии, создает подчас впечатление, что с RDRAM мы скоро распрощаемся раз и навсегда. Однако на самом деле стандарт тоже развивается, и с недавнего времени мы стали свидетелями появления сразу трех новых разновидностей Rambus DRAM — PC1066, PC3200 и PC4200. Более подробно со спецификой новых типов памяти вы можете ознакомиться в специальном теоретическом материале, мы же ввиду его наличия остановимся больше на практике. Чем же они отличаются друг от друга и от привычных нам уже PC600 и PC800? Самым простым способом отследить «генеалогию» новых модулей будет описание их отличий от старых.

Итак, PC800 представляла собой 16-битную память, работающую на релаьной частоте 400 MHz (с DDR-эквивалентом пропускной способности равным 800 MHz). PC1066, соответственно — это, грубо говоря, та же PC800, только работающая на более высокой частоте — 533 MHz (1066 DDR MHz). PC3200 — это опять-таки PC800, но уже не с 16-, а с 32-битной шиной. Ну а PC4200 — это синтез двух предыдущих изменений — 533 MHz частота плюс 32-битная шина. Вот так вот просто все объясняется. Конечно, использование для маркировки в одном случае частоты (PC800/1066) а в другом — максимальной теоретической пропускной способности в MB/s (PC3200/4200), создает изрядную путаницу, но задала тон в этой «гонке цифр» все-таки память стандарта DDR (PC1600/2100/2700), поэтому в данном случае RDRAM лишь подстроилась под общую тенденцию. Также стоит обратить внимание на то, что ничего принципиально нового нам Rambus не предлагает — стандарт пока развивается чисто экстенсивно, за счет увеличения частоты и ширины шины. Вот так выглядят внешне модули стандартов PC800 (два нижних) и PC1066 (два верхних, соответственно):

Легко заметить, что за исключением маркировки, модули абсолютно идентичны и разъемы у них физически совместимы. Чего не скажешь о 32-битных PC3200/4200 -- память такого стандарта в старые платы установить не удастся. Мы даем для примера фото модуля PC4200, однако PC3200 внешне выглядит точно так же.



Обратите внимание на основные отличия в конструкции — во-первых, количество контактов увеличилось (что естественно, ведь ширина шины выросла в два раза), во-вторых — один из вырезов изчез. Это не даст установить память типа PC3200/4200 в старые платы, рассчитанные на PC800 (впрочем, равно как и в новые, рассчитанные на PC1066). Третье изменение менее заметно — вырез на PC3200/4200 стал шире, соответственно, шире стал и выступ на разъеме, куда вставляется модуль. Это, в свою очередь, не даст установить PC800/PC1066 в плату с поддержкой 32-битовых модулей RDRAM — выступ на разъеме «не влезет» в более узкий вырез на этих модулях. Впрочем, это смотря с какой силой его впихивать :), поэтому заранее предупреждаем — если модуль PC800/1066 RDRAM «не лезет» в свежекупленную плату, то это вовсе не означает, что нужно срочно брать круглый надфиль и «устранять заводской брак» :). Следует также заметить, что у 32-битовой RDRAM есть еще одна особенность — теперь модули можно устанавливать не только попарно, но и «поодиночке». Что, впрочем, естественно, т.к. на 16-битовых модулях «парность» требовалась именно для того, чтобы получить те самые 32 бита, которые на PC3200/4200 у нас и так уже есть.

Ну а теперь перейдем собственно к тестам. Для начала, как и всегда, мы предлагаем вам ознакомиться с конфигурацией тестовых стендов, программного обеспечения, а также с подробной информацией о конкретных платах, на основе которых строились все тестовые системы.

Тестовый стенд:

  • Процессоры:
    • Intel Pentium 4 2.4B ГГц, Socket 478
    • Intel Pentium 4 2.4 ГГц, Socket 478
  • Системные платы:
  • Память:
    • 512 MB PC4200 RIMM RDRAM Samsung
    • 2x256 MB PC800 RIMM RDRAM Samsung
    • 2x256 MB PC1066 RIMM RDRAM Kingston
  • Video: Palit Daytona GeForce 4 Ti4600
  • HDD: IBM IC35L040AVER07-0, 7200 rpm, 40Gb
  • CD-ROM ASUS 50x

Программное обеспечение:

  • Windows 2000 Professional SP2
  • DirectX 8.1a
  • Intel Inf 4.00.1013
  • Intel Application Accelerator 2.2
  • NVIDIA Detonator XP 29.42 (VSync=Off)
  • BapCo & Mad Onion SYSmark 2002 Internet Content Creation
  • BapCo & Mad Onion SYSMark 2002 Office Productivity
  • Gray Matter Studios & Nerve Software Return To Castle Wolfenstein v1.1, demo checkpoint.dm_57
  • Croteam/GodGames Serious Sam: The Second Encounter 1.07, demo Grand Cathedral
  • MadOnion 3Dmark 2001 SE build 330
  • Spec ViewPerf 6.1.2
  • Spec ViewPerf 7.0
  • 3D Studio MAX 4.26
  • DronezMark
  • RazorLame 1.1.5.1342 + Lame codec 3.92
  • VirtualDub 1.4.10 + DivX codec 5.02 Pro
  • WinAce 2.11
  • Wstream
  • Cachemem 2.4MMX
  • CPU RightMark 1.01, Model 1
ПлатаASUS P4T533ASUS P4T533-CGigabyte 8IHXP
ЧипсетIntel i850E (KC82850E + FW82801BA)Intel i850E (KC82850E + FW82801BA)Intel i850E (KC82850E + FW82801DB)
Поддержка процессоровSocket 478, Intel Pentium 4, Intel CeleronSocket 478, Intel Pentium 4, Intel CeleronSocket 478, Intel Pentium 4, Intel Celeron
Разъемы памяти2 32bit RDRAM4 RDRAM4 RDRAM
Слоты расширения AGP / 6 PCIAGP / 5 PCI / CNRAGP / 6 PCI / CNR
Порты ввода/вывода1 FDD, 2 COM, 1 LPT, 2 PS/21 FDD, 2 COM, 1 LPT, 2 PS/21 FDD, 2 COM, 1 LPT, 2 PS/2
USB2 USB 2.0 + 2 USB 1.1 + 1 разъем на 2 USB 2.0 + 1 разъем на 2 USB 1.12 USB 2.0 + 2 USB 1.1 + 1 разъем на 2 USB 2.0 + 1 разъем на 2 USB 1.12 USB 2.0 + 4 разъема на 2 USB 2.0
Интегрированный в чипсет IDE контроллерATA100ATA100ATA100
Внешний IDE контроллер Promise PDC20276-Promise PDC20276
ЗвукPCI Audio, C-Media CMI8738/PCI-6ch-MXAC'97 кодек, Avance Logic ALC650PCI Audio, Creative CT5880-DEQ
Встроенный сетевой контроллер-10 BaseT/100 BaseTXRealtek RTL8100BL
I/O контроллерITE IT8708F-AWinbond W83627GF-AWWinbond W83627HF-AW
BIOS4 Mbit Award BIOS v. 6.002 Mbit Award BIOS v. 6.004 Mbit AMI BIOS v. 3.31a
Форм-фактор, размерыATX, 30.5x24.5 смATX, 30.5x24.5 смATX, 30.5x24.5 см

Результаты тестов

Wstream и Cachemem



Ну, что тут говорить… Понятно, что низкоуровневые тесты, которые эмулируют чисто гипотетическую ситуацию 100% загрузки контроллера памяти запросами на потоковое чтение или запись, демонстрируют теоретические преимущества новой быстрой памяти над старой медленной очень хорошо. Эти результаты нельзя назвать бесполезными — они, по крайней мере, дают нам посмотреть на то насколько фактически увеличилась производительность именно этой подсистемы. Однако принимать их близко к сердцу все же не стоит — синтетика, она синтетика и есть. Можно еще сказать и так: здесь мы видим, насколько PC4200/1066 быстрее своих конкурентов в идеальной ситуации.

CPU RightMark 1.01

Можно сказать, что в этом тестировании тест нашей разработки с гордостью подтвердил звание теста для оценки быстродействия процессоров. Результаты настолько стройные и одинаковые :), что хочется лишь еще раз поблагодарить наших программистов: они действительно смогли создать инструмент, который может почти на любой системе с минимальным разбросом показать именно то, для чего он предназначен: каким потенциальным быстродействием характеризуется данный CPU. Применительно к подсистеме памяти разброс между результатами практически отсутствует, и в данном случае это скорее плюс теста, чем минус методики. Впрочем, скорее всего, после этой «единичной демонстрации» мы не будем включать результаты CPU RM в тестирования, посвященные исследованию быстродействия подсистемы памяти.

WAV-to-MP3, VideoCD-to-MPEG4



Весьма скромные результаты, системы идут практически наравне. Можно предположить, что объем одновременно обрабатываемых данных в случае сжатия в эти форматы не очень велик, что же касается скорости обработки всего потока целиком (да, довольно большого по размеру), то тут мы упираемся уже не столько в быстродействие памяти, сколько в дисковую подсистему.

WinAce, словарь размером 4 MB

Тоже программа сжатия, но посмотрите как разительно сказался на скорости различных конфигураций большой объем одновременно обрабатываемых данных! WinAce, безусловно, является одним из самых хороших «высокоуровневых» тестов быстродействия подсистемы памяти, не подвел он нас и в этот раз. Остается только посетовать, что нюансы работы многочисленных других программ для сжатия и/или архивации, нам в полном объеме не доступны — зачастую нельзя узнать, как интересующий компрессор проводит паковку, какой используется словарь, и, соответственно, насколько сильно скажется на его работе увеличение пропускной способности ОЗУ.

SYSmark 2002

Довольно умеренные результаты — преимущество есть, но назвать его подавляющим сложно. Стимул к покупке быстрой памяти для работы в приложениях того класса что входят в SYSmark, имеют скорее не потенциальные апгрейдеры, а те кто приобретают новые системы.

3ds max 4.26

Мы уже ранее озвучивали как-то предположение о том, каким образом идет рендеринг в 3ds max на уровне организации кода. Существует мнение, что эта программа автоматически бьет обрабатываемые данные на фрагменты, которые можно разместить в кэше второго уровня процессора, и только потом обрабатывает их такими вот «кусочками». Не видя исходников, конечно, судить о том насколько это предположение справедливо, нельзя, однако результаты тестов его как минимум не опровергают — 3ds max весьма малочувствителен к скорости подсистемы памяти.

SPEC Viewperf 6.1.2

Фактически, мы наблюдаем практически полное игнорирование скорости подсистемы памяти во всех тестах за исключением AWadvs (Alias|Wavewfront Advanced Visualizer). Последний давно известен своей страстью к использованию AGP-текстурирования, поэтому его реакцию предсказать было довольно легко. В целом же мы видим у рендеринговых ядер профессиональных OpenGL-приложений довольно консервативную реакцию на быструю подсистему памяти.

SPEC Viewperf 7.0



Здесь картина немного другая т.к. уже два приложения очень хорошо реагируют на ускорение работы с ОЗУ. Что симптоматично — это приложения «новой волны», не входившие в более старый Viewperf 6.1.2 — Design Review и ProENGINEER. В общем-то, это подтверждает предположение о том, что современный софт, пишущийся с учетом основных тенденций на рынке компьютерного железа, по идее должен быть более чувствителен к полосе пропускания памяти.

3DMark 2001

Представитель «умеренного крыла» т.е. польза от быстрой памяти есть, но она не так велика, чтобы, к примеру, рекомендовать владельцам систем с более медленным ОЗУ этот вид апгрейда. Скорее эти результаты могут подвигнуть на покупку системы с PC4200/1066 RDRAM тех, кто еще не приобрел компьютер. Разница между 32- и 16-битными модулями такова, что можно смело говорить об ее отсутствии.

RtCW, Serious Sam, DroneZmark





Почти везде одно и то же — замечательная картина в 640x480x16 (или 800x600x16) и гораздо более грустная в 1024x768x32. Что ж, хоть и печально, зато абсолютно логично. При низких разрешениях бОльшее значение имеет то, с какой скоростью работает «процессорная» часть движка игры, при высоких все больше работы достается видеокарте. Кстати, по сути — «еще один великолепный миф» — громадное преимущество, которое от быстрой памяти получают игры. При этом как-то не хочется замечать такой «мелочи» как то, что самые берущие за душу результаты как правило сняты в низких разрешениях :). Нет, нельзя утверждать что пользы нет совсем, но давайте все же будем спокойнее…

PC4200 (32-битная) vs. PC1066 (16-битная), а также PC3200 vs. PC800

Как ни странно (с чего бы, если рассуждать теоретически?), разница между ними все же видна. Не громадная, но иногда довольно хорошо заметная. Нам остается разобраться с возможными причинами. Итак, чем же одноканальный 32-битный модуль может быть лучше теоретически равной по производительности двухканальной 16-битной схеме? Ответ в общем-то напрашивается — именно одноканальностью. Дорога удвоенной ширины в общем случае дает все-таки больше простора всем участникам движения, чем две узких. Однако не стоит сбрасывать со счетов и еще одну возможность — с увеличением спроса на Rambus DRAM, гораздо более быстрыми темпами стали совершенствоваться продукты, предназначенные для ее использования. Можем ли мы достоверно судить о том, отличаются ли более поздние платы, рассчитанные на PC3200/4200 от ранее вышедших «16-битных» вариантов только поддержкой нового типа памяти или процесс тюнинга под максимальную производительность зашел в них более далеко? Вряд ли нам когда-нибудь станет это известно доподлинно, однако кто знает, кто знает… По крайней мере, ничто не мешает нам это предположить.

Общие выводы

Не будем размазывать кашу фактов по тарелке статьи, ограничимся кратким обобщением результатов. Несомненно, PC4200 — самая быстрая память стандарта RDRAM на сегодня. PC3200 также несколько быстрее PC800, впрочем, оговоримся — пока что с уверенностью мы можем это утверждать лишь относительно плат ASUS. Поэтому, естественно, если вы покупаете новую систему, и разницы в цене между вариантами на PC4200 и PC1066 (PC3200 и PC800) нет или же она для вас несущественно мала — зачем же получать меньшее быстродействие за те же деньги? Однако если планируется модернизация имеющейся системы — не думаем, что время для нее настало сегодня. Продать плату под PC800, купить плату под PC4200, продать память, купить память… Компьютер стоит, деньги уходят, прирост в лучшем случае где-то в районе 10%… Пожалуй, апгрейд с PC800 на PC4200 можно посоветовать только фанатам или же очень богатым людям, любящим удовлетворять любую свою прихоть.

Что же касается самой памяти Rambus DRAM, то давайте все-таки постепенно отходить от советской практики судить об американских машинах по интервенции во Вьетнам :). Компания Rambus, конечно, совершила парочку не очень, прямо скажем, «вкусно пахнущих» поступков, и ее маркетинговая политика, как стало сейчас уже окончательно понятно, пользы не принесла ни индустрии, ни самой Rambus. Однако при чем тут, собственно, стандарт памяти RDRAM? А он и есть ни при чем. И сейчас, объективно — это самая быстрая память в сегменте x86 машин (имея в виду «предельные достижения» каждого стандарта). Учитывая тенденции к дальнейшему ее удешевлению и увеличению объемов производства, а также произошедшее на днях «официальное признание» стандарта PC1066 компанией Intel, мы не видим никаких поводов для того чтобы хоронить RDRAM. Скорее даже наоборот.

Процессор Intel Pentium 4 2.4 ГГц, Socket 478 предоставлена компанией OLDI




Дополнительно

ВИКТОРИНА ASUSTOR

Процессор с какой архитектурой установлен в ASUSTOR AS6302T, благодаря которому производительно выросла на 30% по сравнению с прошлым поколением?

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.