Системная память: взгляд в будущее


Введение

Сначала немного необходимой предыстории. Вообще то, статья задумывалась как сравнение чипсетов i820, готовящегося к выходу осенью, и Apollo Pro Plus с поддержкой PC133/PC266 SDRAM, вышедшего только что. Однако по мере подготовки ее содержание весьма и весьма отклонилось от этой темы. Дело в том, что по своим функциональным качествам эти чипсеты совпадают процентов на 95, и стоят ли оставшиеся различия, вроде наличия генератора случайных чисел у i820 того, чтобы разбирать их на нескольких страницах? В общем, при прочих равных, оба чипсета абсолютно мирно сосуществовали бы, как сегодня сосуществуют 440BX и Apollo Pro Plus. И у человека, делающего выбор при покупке материнской платы, нет никаких сомнений в том, что комплектующие, приобретаемые одновременно с этим, будут с равным успехом работать как на плате на 440BX, так и на плате на Apollo Pro Plus. Процессор, память, винчестер, видеокарта…

Вообще, за последние годы процесс эволюции уже не пользуется таким уважением у фирмы Intel, как ранее. Вспомним прежние годы, когда пользователи PC стройными рядами переходили с Socket3 на Socket 4, Socket 7. Каждый знал, что процессор какой бы фирмы он не купил, он будет работать на его материнской плате. Тоже относилось и к платам расширения на шине ISA. Началось все несколько лет назад, когда разразилась война между шинами VESA Local Bus и PCI. Бедные производители, пытаясь угодить растерянным покупателям, порой доходили до того, что на одной материнской плате можно было увидеть как VLB, так и PCI слоты. (Что интересно, несколько лет спустя, в моменты перехода с платформы на платформу, точно так же на материнских платах можно было увидеть одновременно гнезда под модули SIMM и DIMM, или сразу и Slot 1 и Socket 370.)

Pentium Pro прошел более-менее незаметно для широкой публики, так и оставшись чисто серверным процессором. А вот когда вышел Pentium II, шуму было уже много. Потом был Slot 1 Celeron, Slot 2 Xeon, потом Celeron перевели на Socket 370, сейчас ожидают переход на Socket и Pentium III. AMD, которой надо было уходить с Socket 7, изобрела Slot A, затем серверный Slot B. И каждый раз, при объявлении нового, не совместимого с разработанными ранее форм-фактора, раздавались возмущенные возгласы пользователей. Впрочем, деваться им особо было некуда, по крайней мере, вплоть до сегодняшнего дня. Поскольку Intel традиционно занимается процессорами и чипсетами, прочие комплектующие PC, как правило, спокойно эволюционировали, без бурь и потрясений — взять хотя бы винчестеры, развившиеся до UltraDMA/66, сохранив при этом обратную совместимость с черт знает каким числом предыдущих поколений.

Однако, поскольку Intel плавно расширяет область своих интересов, круги по воде начинают расходиться все шире и шире. Здесь не будут затрагиваться такие инициативы, как, например, FutureATA или USB 2.0, тем более что ни в одном из чипсетов, о которых говорилось в самом начале, они не применяются — эта головная боль с появлением винчестеров, несовместимых с ATA, нам предстоит еще через год-другой. Нет, в этой статье речь пойдет о той области, в которой действия Intel сказываются уже сегодня, причем самым непосредственным образом влияя на то, материнская плата на каком чипсете окажется в наших PC следующей — вот так вот все закручено. Речь идет об оперативной памяти.

Речь идет о ней, поскольку в этом году при выборе материнской платы для PC среднего уровня не будет стоять вопрос — "Какой чипсет?", только — "Какая память?". И i820, и Apollo Pro Plus обладают одними и тем же возможностями, единственная, но зато весьма большая разница между ними — поддерживаемая спецификация памяти. И при покупке материнской платы первым вопросом будет: Direct Rambus DRAM, или PC133/PC266 SDRAM, при ответе на него выбор чипсета будет делаться автоматически. Таким образом, из первоначально намеченного сравнения Apollo Pro Plus и i820 эта статья превратилась в сравнение PC133/266 и Direct RDRAM — при выборе материнской платы выбор из одного из вторых автоматически подразумевает выбор одного из первых.

Итак, из чего же нам предстоит выбирать?

Direct Rambus DRAM

Понятно, что на PC100 останавливаться было нельзя, — тут и AGP 4X, для проявления потенциала которой нужна память побыстрее сегодняшней, и интегрированные чипсеты, большинство которых использует архитектуру Unified Memory Architecture (UMA), где графическое ядро использует часть системной памяти, и более быстрые процессоры, уже приближающиеся к барьеру в 1 Ггц, и процессоры, неудержимо стремящиеся к использованию системной шины с частотой 133 Мгц. В общем, надо было двигаться дальше. И вполне естественно, что первый шаг сделала компания, которая была главным вдохновителем, координатором спецификаций PC66 и PC100 SDRAM — Intel.

Однако, тут в дело вступила договоренность еще декабря 1996, когда Intel и Rambus Inc. договорились о совместной работе по доработке существующей технологии Rambus до того уровня, когда ее можно будет применять на PC. Речь шла о расширении интерфейса до 16 бит, переходе на частоту 800 Мгц, и внедрении более эффективного протокола.

И вот, в феврале 1998 года, когда доработка была завершена, на Intel Developer Forum, компания предложила свое видение того, как будет обстоять дело с памятью на PC в ближайшее время:

Как видим, предполагалось, что в данный момент на столах уже будет стоять какое-то количество High-End PC, использующих Direct RDRAM. Однако, этим надеждам не суждено было сбыться, и сейчас трудно сказать, кто виноват в этом — производители памяти ли, которые не смогли обеспечить к сроку приемлемое количество чипов Direct RDRAM, или же Intel, чьи инженеры не смогли вовремя довести i820 до рабочего состояния.

Так или иначе, а этот чипсет, который будет первым, использующим этот вид памяти, был перенесен на три месяца от первоначального планируемого срока своего выхода, с июня на сентябрь. Что, по некоторым оценкам, задержало выход материнских плат на нем примерно на полгода.

Но давайте посмотрим, что же это за технология, ради которой Intel пошел на такой решительный шаг, как тотальная смена архитектуры памяти. По утверждению Rambus, со всеми внесенными доработками, Direct RDRAM может обеспечить троекратное превосходство по эффективной пропускной способности перед PC100 SDRAM, и все это по сравнимой цене и с меньшим энергопотреблением. Вернемся к этому утверждению несколько позже, а пока стоит залезть немного глубже в технические дебри и посмотреть, за счет чего же стало возможным такое тройное превосходство?

Технология Direct RDRAM состоит из трех функциональных частей: Rambus Interface, Rambus Channel, и, собственно, чипы RDRAM. Rambus Interface реализован как в чипах RDRAM, так и в связующем их Rambus Channel. Выглядит это все примерно так:

Таким образом, канал Rambus (а их в системе может быть и несколько и каждый способен поддерживать до 32 чипов Direct RDRAM) способен передавать данные к контроллеру памяти на полных 800 Мгц, будучи изолированным от остальных компонентов системы. Контроллер работает на частоте до 200 Мгц, что вполне достаточно даже для 200 Мгц системной шины K7, не говоря уже о 133 Мгц шине Pentium III 600.

Согласно спецификации, емкость чипов Rambus DRAM должна сначала составлять 64 и 128 Мбит, позднее расширяясь до 256 Мбит и 1 Гбита. Определение и использование 9 бита на байт спецификация оставляет производителю, большинство стало использовать его либо для введения контроля ECC, либо просто для увеличения емкости. Таким образом, появились, соответственно, 72 и 144 Мбит варианты чипов.

Тактовая частота RDRAM — 400 Мгц, но по спецификации данные передаются на обеих границах сигнала, таким образом мы получаем скорость передачи данных 800 Мгц. Что, в сочетании с двумя шинами передачи данных шириной по байту, и дает нам пиковую пропускную способность чипа RDRAM в 1.6 Гб/c, в восемь раз превосходящую соответствующее значение чипа PC100 SDRAM, используемого в сегодняшних PC.

Однако, у подобной технологии есть и свои недостатки, главным образом влияющие на длину задержек при выполнении циклов чтения/записи. Для иллюстрации можно привести, например, такой пример: операция записи, следующая за чтением, должна выдержать паузу, в зависимости от длины Rambus Channel. Для короткого канала она может составить всего один такт, 2.5 мс, тогда как в худшем случае она может затянуться на 5 тактов, что уже дает весьма длинные 12.5 мс. И эта лишь одна из многих возможных задержек, причем достаточно побочная, не относящаяся к самим циклам, где своих задержек более чем хватает.

Для упрощения чипа, а значит и для уменьшения площади его поверхности и соответствующего снижения себестоимости, по спецификации чипы RDRAM определены достаточно тупыми, и способными лишь отвечать на получаемые запросы. Которые, в свою очередь, генерирует контроллер памяти. Каждый контроллер содержит Rambus Interface, а стоит учесть, что сегодня этот интерфейс лицензирован практически всеми крупными производителями полупроводников. Контроллер ведь может располагаться где угодно — и на плате модуля RIMM, и на чипе микропроцессора, и в видеочипе одного из следующих поколений.

Теперь очень интересный момент, связанный с энергопотреблением, тепловыделением, и гм… мягко выражаясь, интересным режимом управления питания. Для уменьшения энергопотребления, питание всех чипов RDRAM уменьшено с 3.3 В, потребляемых чипами SDRAM, до 2.5 В. Кроме того, для этих же целей RDRAM имеет 4 режима работы — Active, Standby, Nap, и PowerDown. Каждый из них характеризуется собственно энергопотреблением и временем, которое потребуется для выполнения операции передачи данных в этом режиме. Основным для всех чипов RDRAM, не отвечающих в данный момент на запрос контроллера, является режим Standby, иначе перегрев системы будет весьма велик.

Вообще забавная идеология: привычные механизмы управления питанием переводят устройства в спящий режим тогда, когда в них нет особой нужды, чип RDRAM же впадает в спячку, чтобы не допустить перегрева, именно тогда, когда он нужен, во время интенсивной работы — игр, тестов, проигрывания потокового видео или аудио и т.д. А на включение в работу неактивного чипа RDRAM требуется порядка 100 нс… Таким образом, при активной работе, пропускная способность подсистемы памяти на Direct Rambus может упасть вплоть до жалких 100 Мб/с!

Таким образом, для нормальной работы PC, часть материнской платы, где находятся модули RIMM, должна будет выглядеть примерно так:

А что делать?

По спецификации, по размеру модуль RIMM и коннектор, весьма схожи со знакомым DIMM, что должно облегчить производителям всех рангов переход на этот тип памяти. С каждой стороны модуля может располагаться до 8 чипов RDRAM, что в случае 64 Мбит чипов дает нам 128 Мб на модуль. Таких модулей в системе может находиться до 3 штук.

Это изложение не претендовало на полноту, его задачей являлось лишь краткое знакомство с предметом разговора, чтобы было легче вести речь дальше и сравнивать с позицией конкурентов.

Подведем небольшие итоги. Мы имеем совершенно новую для PC архитектуру, могущую обеспечить так необходимые сегодня скорости передачи данных — до 1.6 Гб/с. Но это увеличение максимальной пропускной способности по сравнению с PC100 SDRAM, сопряжено со значительным ухудшением второго, не менее важного показателя — задержек при выполнении операций чтения/записи.

Далее, Direct RDRAM, по спецификации работающий на частоте 800 Мгц, требует от производителей памяти использования весьма продвинутого техпроцесса, желательно 0.18 мкм и ниже, только тогда чипы RDRAM будут достаточно доступными. А у производителей, подкошенных длящимся второй год кризисом, денег на подобное переоснащение производства не так уж и много. Что и вынудило Intel активно вкладывать в них свои деньги. Micron и Samsung, это всего лишь две компании, довольно громко получившие деньги от Intel на техническое перевооружение для выпуска RDRAM. А переговоры велись с куда большим количеством крупнейших производителей, и вряд ли все они окончились ничем.

Тем не менее, многие и многие из производителей DRAM не смогли обеспечить требуемый для полномасштабного выпуска выход 800 Мгц чипов RDRAM. Что, как утверждает Intel, вынудило его отложить выход i820 на осень, а Rambus Inc. вынужден был добавить в спецификацию к 600 и 800 Мгц вариантам еще и промежуточный — 700 Мгц чипы RDRAM.

В результате чего модель стала выглядеть так: 600 Мгц Direct DRAM — для дешевых систем (читай, единственно доступный по цене), 700 Мгц — для высокопроизводительных PC, и 800 Мгц — для рабочих станций, серверов, и т.д. Но стоило ли тогда городить весь огород с новой, несовместимой, дорогой технологией, если у 600 Мгц Direct RDRAM пиковая пропускная способность составляет всего 1,2 Гб/с — на треть больше, чем у PC100 SDRAM? Если технические возможности производителей памяти не дотягивают пока до таких технологий? Если сегодня цифра, предполагавшаяся Rambus — 5% увеличение цены 64 Мбит чипов RDRAM по сравнению с 64 Мбит чипами SDRAM выглядит абсолютно нереальной, куда больше напоминая 70%?

По этому поводу VIA была сказана замечательная фраза:

PC133

"800 Мгц шина — это технология, а не продукт!!!" С этими словами, VIA Technologies и начала сколачивать свой лагерь, лагерь сторонников PC133. Здесь подход к делу был абсолютно противоположным: пусть скорость новой памяти будет меньше максимальной возможной, но она будет сегодня, по разумной цене, и совместима с имеющимися сегодня материнскими платами.

Появление PC133 было неизбежно, — когда Intel, вдохновитель PC66 и PC100, ушел, и место осталось незанятым, просто не мог не появиться кто-то, кто продолжил бы логичный эволюционный процесс. И этим кем-то оказался второй крупнейший производитель чипсетов для PC — VIA Technologies. К тому же, индустрия, как правило, без особой радости встречает появление продуктов, за производство которых следует отчислять лицензионные отчисления, что мы имеем в случае с Direct RDRAM.

Перейдем сразу к делу. Совсем необязательно, что PC133 SDRAM — это только для систем с процессорами, использующими частоту системной шины 133 Мгц. На чипсетах серии Apollo Pro Plus, поддерживающих PC133, выигрыш будет и при использовании ее в связке с сегодняшними 100 Мгц Pentium II/III. Для наглядности можно представить работу PC133 системы в таком виде:

То есть, системная шина, и шина памяти выступают достаточно независимо и ничто не мешает, чтобы процессор работал на одной частоте, а память на другой. В общем и целом, по сути картина та же, что и с Direct RDRAM. В результате становиться возможной масса комбинаций:

Частота системной шиныЧастота памятиЧастота AGPЧастота PCIСоотношение FSB:PCI
133 Мгц133 Мгц
100 Мгц
66 Мгц33 Мгц4
100 Мгц133 Мгц
100 Мгц
66 Мгц
3
66 Мгц100 Мгц
66 Мгц
2

Достаточно удобно, не так ли? Появляется возможность спокойно перейти на 133 Мгц память, оставаясь при этом на 100 Мгц FSB процессоре, подготовив тылы, а потом, к тому моменту, когда финансы позволят покупку, скажем, 600 Мгц Pentium III, подсистема памяти будет полностью готова к его появлению на материнской плате.

Теперь, что касается скорости PC133. Сравним для начала ее с PC100 SDRAM. Вот результаты тестов, сделанных VIA на следующей конфигурации: PII 400, 256 Мб DRAM, TNT2 с 32 Мб.



Теперь попробуем сравнить PC133 c Direct RDRAM. Да, по пиковой пропускной способности она проигрывает даже 600 Мгц Direct RDRAM — 1 Гб/с против 1.2 Гб/с. Проигрывает она и по реальной, средней пропускной способности — примерно 650 Мб/с против 840 Мб/с. Однако, зададимся маленьким таким вопросом: а нужна ли сегодня та пропускная способность, которую предлагает нам Direct RDRAM? Ведь не копим же мы, почему то, на крутой и сверхбыстрый Cray, довольствуясь скромным маленьким PC. Но зато сегодня.

Итак, прикинем, а сколько же Мб/с понадобится компьютеру к концу этого года:

 Пиковая пропускная способностьСредняя пропускная способностьПримечание
Pentium II/III с FSB 133 Мгц1 Гб/с250 Мб/спри 93% попадании в кэш
AGP 4X1 Гб/с200 Мб/сберя за размер кадрового буфера 8 Мб
PCI на 33 Мгц132 Мб/с66 Мб/с 
Итого2.1 Гб/с516 Мб/с 

Вот такая вот интересная ситуация. Если исходить из требуемой пиковой пропускной способности, то до нее не дотягивает и 800 Мгц Direct RDRAM, не говоря уже о его 600 Мгц варианте. Если же смотреть на среднюю, то для нее сегодня вполне хватит даже PC100 SDRAM. В любом случае, PC133 SDRAM хватает, чтобы удовлетворить максимальные требования как системной шины с частотой 133 Мгц, так и AGP 4X.

Что же касается задержек, то они у PC133 примерно на четверть меньше, чем даже у PC100. Возьмем для примера подготовку к процедуре чтения или записи. На нее PC100 или PC 133 потребуется 3 такта, что для PC 100 займет 30 (3х10) нс, а для PC133 — 22.5 (3х7.5) нс. Для сравнения — на то, чтобы разбудить чип RDRAM уйдет 23 такта. Они, правда, у RDRAM намного меньше, но тем не менее должно получиться 57.5 (23х2.5) нс.

И конечно, все это венчает то, что производители памяти способны были предложить 133 Мгц чипы SDRAM практически сразу после начала выпуска PC100 чипов. Другой вопрос, что тогда они были практически не нужны, — только для разгона, да и выход их оставлял желать лучшего.

Сегодня же возможности пользователей и производителей вновь соответствуют друг другу, — у первых есть чипсет, ориентированный на использование 133 Мгц памяти даже с процессорами, работающими на частоте системной шины 100 Мгц. Вторые за прошедший год сумели значительно увеличить выход 133 Мгц чипов SDRAM, а продолжающееся снижение цен на SDRAM и тот факт, что для выпуска PC133 DRAM разработчиком не пришлось делать больших дополнительных вложений в производство, позволяет приобрести PC133 модули, не расставшись с последней рубашкой.

VCM133

Впрочем, кроме грубого увеличения частоты, есть и более тонкие способы увеличить эффективность работы SDRAM. Это использование технологии Virtual Channel Memory, которую ее разработчик, NEC, объявил еще год назад. Весьма интересная технология, особенно если учесть, что она обеспечивает достаточно заметный прирост в быстродействии, в то же время, практически никак не сказываясь на стоимости чипа DRAM. При разработке VCM основными целями являлись дальнейшее снижение длительности задержки, а также снижение энергопотребления модулей памяти.

Добиться выполнения этой задачи, невыполнимой, если судить по опыту Direct RDRAM, где механизм управления питанием является одним из основных источников задержек, удалось следующим образом. Как работает обычная память?

Memory Master (любое системное устройство, которому по какой-то причине понадобился доступ к системной памяти — контроллер PCI или AGP, кэш процессора L2, видеокарта, и тому подобные вещи) делает запрос, обладающий уникальными характеристиками — адресом, размером блока данных, и т.д. Причем вся эта игра в морской бой ведется на одной доске и несколькими игроками одновременно: грубо говоря, процессору срочно понадобились данные по одному адресу, а видеокарте так же позарез надо подгрузить текстуру, которая находится вообще в другом банке памяти.

Понятно, что при нескольких устройствах, одновременно выполняющих запросы в разные области памяти (причем доступ то в один момент времени может иметь только одно из них), о большой эффективности работы говорить не приходится. Как же предлагает выйти из положения NEC?

Каждому устройству назначается свой высокоскоростной виртуальный канал, учитывающий специфические характеристики его запросов. В том числе, функцией виртуальных каналов является и кэширование — Memory Master посылает каналу приказ на запись или чтение, а тот уже занимается его выполнением со всеми сопутствующими деталями, вроде задержек между циклами, нахождением блоков, и т.д. В результате чего внешние и внутренние операции абсолютно независимы друг от друга и могут исполняться параллельно.

В итоге, эффективность доступа к памяти значительно повышается, особенно если учесть, что ничто не мешает, например, той же видеокарте открыть, допустим, три таких канала — один для загрузки вершин треугольников, второй для загрузки текстур, третий для системного обмена с памятью.

По данным NEC увеличение эффективности может достичь до 90%, а вообще по тестам VCM133 SDRAM превосходит PC133 процентов на 10-30. Это и уменьшившиеся задержки, и более высокая пропускная способность, и уменьшение энергопотребления (примерно на те же 30 процентов) за счет того, что в тот момент, когда происходит передача результатов приказа системному устройству, вся фоновая активность по другую сторону виртуального канала может быть заморожена.

Теперь, уже традиционный вопрос о стоимости. А что стоимость? По выводам чипы VCM полностью аналогичны обычным чипам SDRAM, совместимы они с ними и по используемому интерфейсу, BIOS может легко распознать модули VCM SDRAM путем использование SPD. Модули, естественно, абсолютно взаимозаменяемы с обычными SDRAM DIMM, причем все последние чипсеты от SiS, ALI, и, разумеется, VIA, VCM полностью поддерживают. Увеличение площади чипа по сравнению с тем же SDRAM составляет всего 1-3%, при этом используется то же производственное и тестовое оборудование, что и для обычного SDRAM, а за счет несколько более высокого выхода, себестоимость, скажем, VCM133 для производителей должна быть примерно равна себестоимости PC133 SDRAM.

Причем VCM полностью независима от типа памяти, и с легкостью может быть в дальнейшем встроена, например, в DDR SDRAM.

DDR SDRAM

Далее, как положено, встает вопрос: "Ну хорошо, PC133, а тем более VCM133 — это малое время задержек, Direct RDRAM подходит с другого боку — во главу угла ставиться высокая пропускная способность. А вот как бы исхитриться, чтобы и то, и то?" И в ответ с полной уверенностью можно заявить — есть такая партия.

PC133 SDRAM должна стать последней в династии, властвовавшей последнее время: PC66 и PC100. По планам, после нее на смену SDRAM должна придти новая архитектура — Double Data Rate DRAM, или, проще говоря, DDR DRAM. Память, которая наилучшим образом решает оба вопроса, связанные с быстродействием — и задержки, и величину пропускной способности.

DDR DRAM, в отличие от Direct RDRAM, — это не революция, а эволюция. Этот тип памяти основан на тех же принципах, что и SDRAM, добавляя в то же время ряд весьма существенных возможностей. Во первых, используется более "продвинутая" синхронизация, отсутствующая в SDRAM; а во-вторых DDR использует DLL (delay-locked loop — цикл с фиксированной задержкой) для выдачи сигнала DataStrobe, означающего доступность данных на выходных контактах. Используя один сигнал DataStrobe на каждые 16 выводов, контроллер может осуществлять доступ к данным более точно и синхронизировать входящие данные, поступающие из разных модулей, находящихся в одном банке.

Впрочем, если бы дело ограничивалось только этим, чемпионом по скорости однозначно стал бы Direct RDRAM. Но основным отличием DDR DRAM от SDRAM является возможность, подобно Direct RDRAM, передавать данные на обеих границах сигнала тактовой частоты. Что автоматически вдвое увеличивает пиковую пропускную способность по сравнению с SDRAM, работающим на той же базовой частоте.

Так, если за базовую мы возьмем постепенно сходящую со сцены частоту 100 Мгц, то в итоге мы получим DDR 200, пиковая пропускная способность которой будет, как уже говорилось выше, вдвое больше чем у PC100 SDRAM — 1.6 Гб/с. Столько же, сколько и у 800 Мгц Direct Rambus DRAM! Вот только 100 Мгц чипы у производителей памяти сегодня получаются свободно, а 400 Мгц (речь в обоих случаях идет о базовой частоте) Direct RDRAM выходит с трудом.

Более того, DDR 200 по всей видимости будет экзотикой, хотя и весьма дешевой — по всем планам за основу будет выбрана базовая частота 133 Мгц, то есть в основном будут производиться чипы DDR 266. А у них пиковая пропускная частота составляет ни много, ни мало — 2.1 Гб/с. Direct RDRAM отдыхает и по пропускной способности, и, тем более, по задержкам. Причем и 266 Мгц — не предел. В планах производителей DDR 400, а это — 3.2 Гб/с.

Хотя, как уже отмечалось ранее, между пиковой пропускной способностью и той, что будет чаще всего использоваться в реальной жизни, есть значительная разница. Если на спидометре машины есть отметка "200 км/ч", на российских дорогах это еще ни о чем не говорит. Вот как оценивает возможности DDR 266 и 800 Мгц Direct RDRAM Hyundai Electronics, которая после покупки LG Semicon стала крупнейшим производителем DRAM в мире:

 DDR-PC266Direct RDRAM
Пиковая пропускная способность2.1 Гб/с1.6 Гб/с
Эффективность работы шины памяти65%85%
Эффективная пропускная способность1.37 Гб/с1.36 Гб/с

Куда менее внушительно. (По данным VIA, реальная пропускная способность DDR 266 и 800 Мгц DRDRAM составляет, соответственно, 1.36 и 1.12 Гб/с, но поскольку VIA — лицо заинтересованное, ее результаты мы заранее отводим, как явно необъективные. ;-) )

Как видим, на наших проселках что "Жигули", что "Вольво" — по скорости все едино. Но извините, при равной скорости вроде бы более естественным будет выбор той памяти, которая опирается на уже проверенную временем платформу, имеет большие планы на будущее, да и цена, опять же, — фактор немаловажный.

При этом, как уже упоминалось, базой для DDR DRAM является SDRAM, и большинство прочих характеристик помимо скорости, DDR позаимствовал у своего предшественника. Например, превосходя Direct RDRAM по скорости, он значительно уступает ему по энергопотреблению. Модуль DDR 200 потребляет примерно столько же, сколько и модуль PC100.

Единственным минусом является несовпадение контактов у модулей DIMM. Хоть их размеры и равны, но DIMM DDR имеет 184 контакта против 164 контактов DIMM SDRAM. Так что прямого перехода, к сожалению не будет. Но, скорее всего, это препятствие будет обойдено путем размещения на одной материнской плате разъемов как под 168- , так и под 184-контактные модули DIMM. Подобно тому, как сегодня на большинстве материнских плат начального уровня можно встретить одновременно разъемы как под SIMM, так и под DIMM.

Что касается стоимости, то опять же, при производстве DDR требуются минимальные вложения — используется то же оборудование, что и для производства SDRAM, те же тестеры, та же упаковка чипов — TSOP. В общем, в отличие от ситуации с Direct RDRAM, производители уже сегодня готовы к массовому производству и ждут только наличия материнских плат.

А эволюция продолжается — на горизонте уже маячит DDR II, о которой пока мало что известно. Хотя, например, известно, о каком уровне пиковой пропускной способности может идти речь — 3 Гб/с и выше. Однако, поскольку этот тип памяти появится "аж" в следующем году, речь здесь о нем идти не будет. Просто, следует иметь в виду эту перспективу.

Выводы

Пусть их лучше сделает эксперт в этой области — Hyundai Electronics:

  • [+ + +] — хорошо
  • [+ +] — нормально
  • [+] — плохо
 SDRAM PC133DDR PC266Direct RDRAM
Пиковая пропускная способность шины+ ++ + ++ +
Эффективность шины+ +++ + +
Скорость доступа+ + ++ + ++
Цена+ + ++ + ++
Упаковка+ + ++ + ++
Открытость стандарта+ + ++ + ++
Средняя загрузка шин адресов и данных+ ++ ++ + +
Влияние количества контактов+ ++ ++ + +
Совместимость по размерам с существующими DIMM+ + ++ + ++
Энергопотребление+ + ++ ++
Поддержка ECC+ + ++ + ++
Совместимость с существующими спецификациями+ + ++ + ++
Наибольшее удобство при использовании+ + ++ + ++

Вряд ли к этой таблице стоит что-то добавлять. Разве что, вот такой вот нехитрый расчет примерной стоимости перехода на Direct RDRAM:

 Дополнительная стоимостьПримечание
256 Мб модуль DRDRAM$210Примерно на 70% дороже 256 Мб модуля SDRAM
Профиль для охлаждения модулей DRDRAM$10Цена его самого. Стоимость возможной смены корпуса не учитывается
Увеличенный размер модуля$3 
Регулятор напряжения$20Средняя цена. Колеблется от 10 до $35
Генератор тактовой частоты$2 
i820$20Примерная разница в цене между i820 и 440BX или PC133 чипсетом
6-слойная материнская плата$10 

Итого переплата — $275. За что?




27 мая 1999 Г.

Системная память: взгляд в будущее

Системная память: взгляд в будущее

Введение

Сначала немного необходимой предыстории. Вообще то, статья задумывалась как сравнение чипсетов i820, готовящегося к выходу осенью, и Apollo Pro Plus с поддержкой PC133/PC266 SDRAM, вышедшего только что. Однако по мере подготовки ее содержание весьма и весьма отклонилось от этой темы. Дело в том, что по своим функциональным качествам эти чипсеты совпадают процентов на 95, и стоят ли оставшиеся различия, вроде наличия генератора случайных чисел у i820 того, чтобы разбирать их на нескольких страницах? В общем, при прочих равных, оба чипсета абсолютно мирно сосуществовали бы, как сегодня сосуществуют 440BX и Apollo Pro Plus. И у человека, делающего выбор при покупке материнской платы, нет никаких сомнений в том, что комплектующие, приобретаемые одновременно с этим, будут с равным успехом работать как на плате на 440BX, так и на плате на Apollo Pro Plus. Процессор, память, винчестер, видеокарта…

Вообще, за последние годы процесс эволюции уже не пользуется таким уважением у фирмы Intel, как ранее. Вспомним прежние годы, когда пользователи PC стройными рядами переходили с Socket3 на Socket 4, Socket 7. Каждый знал, что процессор какой бы фирмы он не купил, он будет работать на его материнской плате. Тоже относилось и к платам расширения на шине ISA. Началось все несколько лет назад, когда разразилась война между шинами VESA Local Bus и PCI. Бедные производители, пытаясь угодить растерянным покупателям, порой доходили до того, что на одной материнской плате можно было увидеть как VLB, так и PCI слоты. (Что интересно, несколько лет спустя, в моменты перехода с платформы на платформу, точно так же на материнских платах можно было увидеть одновременно гнезда под модули SIMM и DIMM, или сразу и Slot 1 и Socket 370.)

Pentium Pro прошел более-менее незаметно для широкой публики, так и оставшись чисто серверным процессором. А вот когда вышел Pentium II, шуму было уже много. Потом был Slot 1 Celeron, Slot 2 Xeon, потом Celeron перевели на Socket 370, сейчас ожидают переход на Socket и Pentium III. AMD, которой надо было уходить с Socket 7, изобрела Slot A, затем серверный Slot B. И каждый раз, при объявлении нового, не совместимого с разработанными ранее форм-фактора, раздавались возмущенные возгласы пользователей. Впрочем, деваться им особо было некуда, по крайней мере, вплоть до сегодняшнего дня. Поскольку Intel традиционно занимается процессорами и чипсетами, прочие комплектующие PC, как правило, спокойно эволюционировали, без бурь и потрясений — взять хотя бы винчестеры, развившиеся до UltraDMA/66, сохранив при этом обратную совместимость с черт знает каким числом предыдущих поколений.

Однако, поскольку Intel плавно расширяет область своих интересов, круги по воде начинают расходиться все шире и шире. Здесь не будут затрагиваться такие инициативы, как, например, FutureATA или USB 2.0, тем более что ни в одном из чипсетов, о которых говорилось в самом начале, они не применяются — эта головная боль с появлением винчестеров, несовместимых с ATA, нам предстоит еще через год-другой. Нет, в этой статье речь пойдет о той области, в которой действия Intel сказываются уже сегодня, причем самым непосредственным образом влияя на то, материнская плата на каком чипсете окажется в наших PC следующей — вот так вот все закручено. Речь идет об оперативной памяти.

Речь идет о ней, поскольку в этом году при выборе материнской платы для PC среднего уровня не будет стоять вопрос — "Какой чипсет?", только — "Какая память?". И i820, и Apollo Pro Plus обладают одними и тем же возможностями, единственная, но зато весьма большая разница между ними — поддерживаемая спецификация памяти. И при покупке материнской платы первым вопросом будет: Direct Rambus DRAM, или PC133/PC266 SDRAM, при ответе на него выбор чипсета будет делаться автоматически. Таким образом, из первоначально намеченного сравнения Apollo Pro Plus и i820 эта статья превратилась в сравнение PC133/266 и Direct RDRAM — при выборе материнской платы выбор из одного из вторых автоматически подразумевает выбор одного из первых.

Итак, из чего же нам предстоит выбирать?

Direct Rambus DRAM

Понятно, что на PC100 останавливаться было нельзя, — тут и AGP 4X, для проявления потенциала которой нужна память побыстрее сегодняшней, и интегрированные чипсеты, большинство которых использует архитектуру Unified Memory Architecture (UMA), где графическое ядро использует часть системной памяти, и более быстрые процессоры, уже приближающиеся к барьеру в 1 Ггц, и процессоры, неудержимо стремящиеся к использованию системной шины с частотой 133 Мгц. В общем, надо было двигаться дальше. И вполне естественно, что первый шаг сделала компания, которая была главным вдохновителем, координатором спецификаций PC66 и PC100 SDRAM — Intel.

Однако, тут в дело вступила договоренность еще декабря 1996, когда Intel и Rambus Inc. договорились о совместной работе по доработке существующей технологии Rambus до того уровня, когда ее можно будет применять на PC. Речь шла о расширении интерфейса до 16 бит, переходе на частоту 800 Мгц, и внедрении более эффективного протокола.

И вот, в феврале 1998 года, когда доработка была завершена, на Intel Developer Forum, компания предложила свое видение того, как будет обстоять дело с памятью на PC в ближайшее время:

Как видим, предполагалось, что в данный момент на столах уже будет стоять какое-то количество High-End PC, использующих Direct RDRAM. Однако, этим надеждам не суждено было сбыться, и сейчас трудно сказать, кто виноват в этом — производители памяти ли, которые не смогли обеспечить к сроку приемлемое количество чипов Direct RDRAM, или же Intel, чьи инженеры не смогли вовремя довести i820 до рабочего состояния.

Так или иначе, а этот чипсет, который будет первым, использующим этот вид памяти, был перенесен на три месяца от первоначального планируемого срока своего выхода, с июня на сентябрь. Что, по некоторым оценкам, задержало выход материнских плат на нем примерно на полгода.

Но давайте посмотрим, что же это за технология, ради которой Intel пошел на такой решительный шаг, как тотальная смена архитектуры памяти. По утверждению Rambus, со всеми внесенными доработками, Direct RDRAM может обеспечить троекратное превосходство по эффективной пропускной способности перед PC100 SDRAM, и все это по сравнимой цене и с меньшим энергопотреблением. Вернемся к этому утверждению несколько позже, а пока стоит залезть немного глубже в технические дебри и посмотреть, за счет чего же стало возможным такое тройное превосходство?

Технология Direct RDRAM состоит из трех функциональных частей: Rambus Interface, Rambus Channel, и, собственно, чипы RDRAM. Rambus Interface реализован как в чипах RDRAM, так и в связующем их Rambus Channel. Выглядит это все примерно так:

Таким образом, канал Rambus (а их в системе может быть и несколько и каждый способен поддерживать до 32 чипов Direct RDRAM) способен передавать данные к контроллеру памяти на полных 800 Мгц, будучи изолированным от остальных компонентов системы. Контроллер работает на частоте до 200 Мгц, что вполне достаточно даже для 200 Мгц системной шины K7, не говоря уже о 133 Мгц шине Pentium III 600.

Согласно спецификации, емкость чипов Rambus DRAM должна сначала составлять 64 и 128 Мбит, позднее расширяясь до 256 Мбит и 1 Гбита. Определение и использование 9 бита на байт спецификация оставляет производителю, большинство стало использовать его либо для введения контроля ECC, либо просто для увеличения емкости. Таким образом, появились, соответственно, 72 и 144 Мбит варианты чипов.

Тактовая частота RDRAM — 400 Мгц, но по спецификации данные передаются на обеих границах сигнала, таким образом мы получаем скорость передачи данных 800 Мгц. Что, в сочетании с двумя шинами передачи данных шириной по байту, и дает нам пиковую пропускную способность чипа RDRAM в 1.6 Гб/c, в восемь раз превосходящую соответствующее значение чипа PC100 SDRAM, используемого в сегодняшних PC.

Однако, у подобной технологии есть и свои недостатки, главным образом влияющие на длину задержек при выполнении циклов чтения/записи. Для иллюстрации можно привести, например, такой пример: операция записи, следующая за чтением, должна выдержать паузу, в зависимости от длины Rambus Channel. Для короткого канала она может составить всего один такт, 2.5 мс, тогда как в худшем случае она может затянуться на 5 тактов, что уже дает весьма длинные 12.5 мс. И эта лишь одна из многих возможных задержек, причем достаточно побочная, не относящаяся к самим циклам, где своих задержек более чем хватает.

Для упрощения чипа, а значит и для уменьшения площади его поверхности и соответствующего снижения себестоимости, по спецификации чипы RDRAM определены достаточно тупыми, и способными лишь отвечать на получаемые запросы. Которые, в свою очередь, генерирует контроллер памяти. Каждый контроллер содержит Rambus Interface, а стоит учесть, что сегодня этот интерфейс лицензирован практически всеми крупными производителями полупроводников. Контроллер ведь может располагаться где угодно — и на плате модуля RIMM, и на чипе микропроцессора, и в видеочипе одного из следующих поколений.

Теперь очень интересный момент, связанный с энергопотреблением, тепловыделением, и гм… мягко выражаясь, интересным режимом управления питания. Для уменьшения энергопотребления, питание всех чипов RDRAM уменьшено с 3.3 В, потребляемых чипами SDRAM, до 2.5 В. Кроме того, для этих же целей RDRAM имеет 4 режима работы — Active, Standby, Nap, и PowerDown. Каждый из них характеризуется собственно энергопотреблением и временем, которое потребуется для выполнения операции передачи данных в этом режиме. Основным для всех чипов RDRAM, не отвечающих в данный момент на запрос контроллера, является режим Standby, иначе перегрев системы будет весьма велик.

Вообще забавная идеология: привычные механизмы управления питанием переводят устройства в спящий режим тогда, когда в них нет особой нужды, чип RDRAM же впадает в спячку, чтобы не допустить перегрева, именно тогда, когда он нужен, во время интенсивной работы — игр, тестов, проигрывания потокового видео или аудио и т.д. А на включение в работу неактивного чипа RDRAM требуется порядка 100 нс… Таким образом, при активной работе, пропускная способность подсистемы памяти на Direct Rambus может упасть вплоть до жалких 100 Мб/с!

Таким образом, для нормальной работы PC, часть материнской платы, где находятся модули RIMM, должна будет выглядеть примерно так:

А что делать?

По спецификации, по размеру модуль RIMM и коннектор, весьма схожи со знакомым DIMM, что должно облегчить производителям всех рангов переход на этот тип памяти. С каждой стороны модуля может располагаться до 8 чипов RDRAM, что в случае 64 Мбит чипов дает нам 128 Мб на модуль. Таких модулей в системе может находиться до 3 штук.

Это изложение не претендовало на полноту, его задачей являлось лишь краткое знакомство с предметом разговора, чтобы было легче вести речь дальше и сравнивать с позицией конкурентов.

Подведем небольшие итоги. Мы имеем совершенно новую для PC архитектуру, могущую обеспечить так необходимые сегодня скорости передачи данных — до 1.6 Гб/с. Но это увеличение максимальной пропускной способности по сравнению с PC100 SDRAM, сопряжено со значительным ухудшением второго, не менее важного показателя — задержек при выполнении операций чтения/записи.

Далее, Direct RDRAM, по спецификации работающий на частоте 800 Мгц, требует от производителей памяти использования весьма продвинутого техпроцесса, желательно 0.18 мкм и ниже, только тогда чипы RDRAM будут достаточно доступными. А у производителей, подкошенных длящимся второй год кризисом, денег на подобное переоснащение производства не так уж и много. Что и вынудило Intel активно вкладывать в них свои деньги. Micron и Samsung, это всего лишь две компании, довольно громко получившие деньги от Intel на техническое перевооружение для выпуска RDRAM. А переговоры велись с куда большим количеством крупнейших производителей, и вряд ли все они окончились ничем.

Тем не менее, многие и многие из производителей DRAM не смогли обеспечить требуемый для полномасштабного выпуска выход 800 Мгц чипов RDRAM. Что, как утверждает Intel, вынудило его отложить выход i820 на осень, а Rambus Inc. вынужден был добавить в спецификацию к 600 и 800 Мгц вариантам еще и промежуточный — 700 Мгц чипы RDRAM.

В результате чего модель стала выглядеть так: 600 Мгц Direct DRAM — для дешевых систем (читай, единственно доступный по цене), 700 Мгц — для высокопроизводительных PC, и 800 Мгц — для рабочих станций, серверов, и т.д. Но стоило ли тогда городить весь огород с новой, несовместимой, дорогой технологией, если у 600 Мгц Direct RDRAM пиковая пропускная способность составляет всего 1,2 Гб/с — на треть больше, чем у PC100 SDRAM? Если технические возможности производителей памяти не дотягивают пока до таких технологий? Если сегодня цифра, предполагавшаяся Rambus — 5% увеличение цены 64 Мбит чипов RDRAM по сравнению с 64 Мбит чипами SDRAM выглядит абсолютно нереальной, куда больше напоминая 70%?

По этому поводу VIA была сказана замечательная фраза:

PC133

"800 Мгц шина — это технология, а не продукт!!!" С этими словами, VIA Technologies и начала сколачивать свой лагерь, лагерь сторонников PC133. Здесь подход к делу был абсолютно противоположным: пусть скорость новой памяти будет меньше максимальной возможной, но она будет сегодня, по разумной цене, и совместима с имеющимися сегодня материнскими платами.

Появление PC133 было неизбежно, — когда Intel, вдохновитель PC66 и PC100, ушел, и место осталось незанятым, просто не мог не появиться кто-то, кто продолжил бы логичный эволюционный процесс. И этим кем-то оказался второй крупнейший производитель чипсетов для PC — VIA Technologies. К тому же, индустрия, как правило, без особой радости встречает появление продуктов, за производство которых следует отчислять лицензионные отчисления, что мы имеем в случае с Direct RDRAM.

Перейдем сразу к делу. Совсем необязательно, что PC133 SDRAM — это только для систем с процессорами, использующими частоту системной шины 133 Мгц. На чипсетах серии Apollo Pro Plus, поддерживающих PC133, выигрыш будет и при использовании ее в связке с сегодняшними 100 Мгц Pentium II/III. Для наглядности можно представить работу PC133 системы в таком виде:

То есть, системная шина, и шина памяти выступают достаточно независимо и ничто не мешает, чтобы процессор работал на одной частоте, а память на другой. В общем и целом, по сути картина та же, что и с Direct RDRAM. В результате становиться возможной масса комбинаций:

Частота системной шины Частота памяти Частота AGP Частота PCI Соотношение FSB:PCI
133 Мгц 133 Мгц
100 Мгц
66 Мгц 33 Мгц 4
100 Мгц 133 Мгц
100 Мгц
66 Мгц
3
66 Мгц 100 Мгц
66 Мгц
2

Достаточно удобно, не так ли? Появляется возможность спокойно перейти на 133 Мгц память, оставаясь при этом на 100 Мгц FSB процессоре, подготовив тылы, а потом, к тому моменту, когда финансы позволят покупку, скажем, 600 Мгц Pentium III, подсистема памяти будет полностью готова к его появлению на материнской плате.

Теперь, что касается скорости PC133. Сравним для начала ее с PC100 SDRAM. Вот результаты тестов, сделанных VIA на следующей конфигурации: PII 400, 256 Мб DRAM, TNT2 с 32 Мб.



Теперь попробуем сравнить PC133 c Direct RDRAM. Да, по пиковой пропускной способности она проигрывает даже 600 Мгц Direct RDRAM — 1 Гб/с против 1.2 Гб/с. Проигрывает она и по реальной, средней пропускной способности — примерно 650 Мб/с против 840 Мб/с. Однако, зададимся маленьким таким вопросом: а нужна ли сегодня та пропускная способность, которую предлагает нам Direct RDRAM? Ведь не копим же мы, почему то, на крутой и сверхбыстрый Cray, довольствуясь скромным маленьким PC. Но зато сегодня.

Итак, прикинем, а сколько же Мб/с понадобится компьютеру к концу этого года:

  Пиковая пропускная способность Средняя пропускная способность Примечание
Pentium II/III с FSB 133 Мгц 1 Гб/с 250 Мб/с при 93% попадании в кэш
AGP 4X 1 Гб/с 200 Мб/с беря за размер кадрового буфера 8 Мб
PCI на 33 Мгц 132 Мб/с 66 Мб/с  
Итого 2.1 Гб/с 516 Мб/с  

Вот такая вот интересная ситуация. Если исходить из требуемой пиковой пропускной способности, то до нее не дотягивает и 800 Мгц Direct RDRAM, не говоря уже о его 600 Мгц варианте. Если же смотреть на среднюю, то для нее сегодня вполне хватит даже PC100 SDRAM. В любом случае, PC133 SDRAM хватает, чтобы удовлетворить максимальные требования как системной шины с частотой 133 Мгц, так и AGP 4X.

Что же касается задержек, то они у PC133 примерно на четверть меньше, чем даже у PC100. Возьмем для примера подготовку к процедуре чтения или записи. На нее PC100 или PC 133 потребуется 3 такта, что для PC 100 займет 30 (3х10) нс, а для PC133 — 22.5 (3х7.5) нс. Для сравнения — на то, чтобы разбудить чип RDRAM уйдет 23 такта. Они, правда, у RDRAM намного меньше, но тем не менее должно получиться 57.5 (23х2.5) нс.

И конечно, все это венчает то, что производители памяти способны были предложить 133 Мгц чипы SDRAM практически сразу после начала выпуска PC100 чипов. Другой вопрос, что тогда они были практически не нужны, — только для разгона, да и выход их оставлял желать лучшего.

Сегодня же возможности пользователей и производителей вновь соответствуют друг другу, — у первых есть чипсет, ориентированный на использование 133 Мгц памяти даже с процессорами, работающими на частоте системной шины 100 Мгц. Вторые за прошедший год сумели значительно увеличить выход 133 Мгц чипов SDRAM, а продолжающееся снижение цен на SDRAM и тот факт, что для выпуска PC133 DRAM разработчиком не пришлось делать больших дополнительных вложений в производство, позволяет приобрести PC133 модули, не расставшись с последней рубашкой.

VCM133

Впрочем, кроме грубого увеличения частоты, есть и более тонкие способы увеличить эффективность работы SDRAM. Это использование технологии Virtual Channel Memory, которую ее разработчик, NEC, объявил еще год назад. Весьма интересная технология, особенно если учесть, что она обеспечивает достаточно заметный прирост в быстродействии, в то же время, практически никак не сказываясь на стоимости чипа DRAM. При разработке VCM основными целями являлись дальнейшее снижение длительности задержки, а также снижение энергопотребления модулей памяти.

Добиться выполнения этой задачи, невыполнимой, если судить по опыту Direct RDRAM, где механизм управления питанием является одним из основных источников задержек, удалось следующим образом. Как работает обычная память?

Memory Master (любое системное устройство, которому по какой-то причине понадобился доступ к системной памяти — контроллер PCI или AGP, кэш процессора L2, видеокарта, и тому подобные вещи) делает запрос, обладающий уникальными характеристиками — адресом, размером блока данных, и т.д. Причем вся эта игра в морской бой ведется на одной доске и несколькими игроками одновременно: грубо говоря, процессору срочно понадобились данные по одному адресу, а видеокарте так же позарез надо подгрузить текстуру, которая находится вообще в другом банке памяти.

Понятно, что при нескольких устройствах, одновременно выполняющих запросы в разные области памяти (причем доступ то в один момент времени может иметь только одно из них), о большой эффективности работы говорить не приходится. Как же предлагает выйти из положения NEC?

Каждому устройству назначается свой высокоскоростной виртуальный канал, учитывающий специфические характеристики его запросов. В том числе, функцией виртуальных каналов является и кэширование — Memory Master посылает каналу приказ на запись или чтение, а тот уже занимается его выполнением со всеми сопутствующими деталями, вроде задержек между циклами, нахождением блоков, и т.д. В результате чего внешние и внутренние операции абсолютно независимы друг от друга и могут исполняться параллельно.

В итоге, эффективность доступа к памяти значительно повышается, особенно если учесть, что ничто не мешает, например, той же видеокарте открыть, допустим, три таких канала — один для загрузки вершин треугольников, второй для загрузки текстур, третий для системного обмена с памятью.

По данным NEC увеличение эффективности может достичь до 90%, а вообще по тестам VCM133 SDRAM превосходит PC133 процентов на 10-30. Это и уменьшившиеся задержки, и более высокая пропускная способность, и уменьшение энергопотребления (примерно на те же 30 процентов) за счет того, что в тот момент, когда происходит передача результатов приказа системному устройству, вся фоновая активность по другую сторону виртуального канала может быть заморожена.

Теперь, уже традиционный вопрос о стоимости. А что стоимость? По выводам чипы VCM полностью аналогичны обычным чипам SDRAM, совместимы они с ними и по используемому интерфейсу, BIOS может легко распознать модули VCM SDRAM путем использование SPD. Модули, естественно, абсолютно взаимозаменяемы с обычными SDRAM DIMM, причем все последние чипсеты от SiS, ALI, и, разумеется, VIA, VCM полностью поддерживают. Увеличение площади чипа по сравнению с тем же SDRAM составляет всего 1-3%, при этом используется то же производственное и тестовое оборудование, что и для обычного SDRAM, а за счет несколько более высокого выхода, себестоимость, скажем, VCM133 для производителей должна быть примерно равна себестоимости PC133 SDRAM.

Причем VCM полностью независима от типа памяти, и с легкостью может быть в дальнейшем встроена, например, в DDR SDRAM.

DDR SDRAM

Далее, как положено, встает вопрос: "Ну хорошо, PC133, а тем более VCM133 — это малое время задержек, Direct RDRAM подходит с другого боку — во главу угла ставиться высокая пропускная способность. А вот как бы исхитриться, чтобы и то, и то?" И в ответ с полной уверенностью можно заявить — есть такая партия.

PC133 SDRAM должна стать последней в династии, властвовавшей последнее время: PC66 и PC100. По планам, после нее на смену SDRAM должна придти новая архитектура — Double Data Rate DRAM, или, проще говоря, DDR DRAM. Память, которая наилучшим образом решает оба вопроса, связанные с быстродействием — и задержки, и величину пропускной способности.

DDR DRAM, в отличие от Direct RDRAM, — это не революция, а эволюция. Этот тип памяти основан на тех же принципах, что и SDRAM, добавляя в то же время ряд весьма существенных возможностей. Во первых, используется более "продвинутая" синхронизация, отсутствующая в SDRAM; а во-вторых DDR использует DLL (delay-locked loop — цикл с фиксированной задержкой) для выдачи сигнала DataStrobe, означающего доступность данных на выходных контактах. Используя один сигнал DataStrobe на каждые 16 выводов, контроллер может осуществлять доступ к данным более точно и синхронизировать входящие данные, поступающие из разных модулей, находящихся в одном банке.

Впрочем, если бы дело ограничивалось только этим, чемпионом по скорости однозначно стал бы Direct RDRAM. Но основным отличием DDR DRAM от SDRAM является возможность, подобно Direct RDRAM, передавать данные на обеих границах сигнала тактовой частоты. Что автоматически вдвое увеличивает пиковую пропускную способность по сравнению с SDRAM, работающим на той же базовой частоте.

Так, если за базовую мы возьмем постепенно сходящую со сцены частоту 100 Мгц, то в итоге мы получим DDR 200, пиковая пропускная способность которой будет, как уже говорилось выше, вдвое больше чем у PC100 SDRAM — 1.6 Гб/с. Столько же, сколько и у 800 Мгц Direct Rambus DRAM! Вот только 100 Мгц чипы у производителей памяти сегодня получаются свободно, а 400 Мгц (речь в обоих случаях идет о базовой частоте) Direct RDRAM выходит с трудом.

Более того, DDR 200 по всей видимости будет экзотикой, хотя и весьма дешевой — по всем планам за основу будет выбрана базовая частота 133 Мгц, то есть в основном будут производиться чипы DDR 266. А у них пиковая пропускная частота составляет ни много, ни мало — 2.1 Гб/с. Direct RDRAM отдыхает и по пропускной способности, и, тем более, по задержкам. Причем и 266 Мгц — не предел. В планах производителей DDR 400, а это — 3.2 Гб/с.

Хотя, как уже отмечалось ранее, между пиковой пропускной способностью и той, что будет чаще всего использоваться в реальной жизни, есть значительная разница. Если на спидометре машины есть отметка "200 км/ч", на российских дорогах это еще ни о чем не говорит. Вот как оценивает возможности DDR 266 и 800 Мгц Direct RDRAM Hyundai Electronics, которая после покупки LG Semicon стала крупнейшим производителем DRAM в мире:

  DDR-PC266 Direct RDRAM
Пиковая пропускная способность 2.1 Гб/с 1.6 Гб/с
Эффективность работы шины памяти 65% 85%
Эффективная пропускная способность 1.37 Гб/с 1.36 Гб/с

Куда менее внушительно. (По данным VIA, реальная пропускная способность DDR 266 и 800 Мгц DRDRAM составляет, соответственно, 1.36 и 1.12 Гб/с, но поскольку VIA — лицо заинтересованное, ее результаты мы заранее отводим, как явно необъективные. ;-) )

Как видим, на наших проселках что "Жигули", что "Вольво" — по скорости все едино. Но извините, при равной скорости вроде бы более естественным будет выбор той памяти, которая опирается на уже проверенную временем платформу, имеет большие планы на будущее, да и цена, опять же, — фактор немаловажный.

При этом, как уже упоминалось, базой для DDR DRAM является SDRAM, и большинство прочих характеристик помимо скорости, DDR позаимствовал у своего предшественника. Например, превосходя Direct RDRAM по скорости, он значительно уступает ему по энергопотреблению. Модуль DDR 200 потребляет примерно столько же, сколько и модуль PC100.

Единственным минусом является несовпадение контактов у модулей DIMM. Хоть их размеры и равны, но DIMM DDR имеет 184 контакта против 164 контактов DIMM SDRAM. Так что прямого перехода, к сожалению не будет. Но, скорее всего, это препятствие будет обойдено путем размещения на одной материнской плате разъемов как под 168- , так и под 184-контактные модули DIMM. Подобно тому, как сегодня на большинстве материнских плат начального уровня можно встретить одновременно разъемы как под SIMM, так и под DIMM.

Что касается стоимости, то опять же, при производстве DDR требуются минимальные вложения — используется то же оборудование, что и для производства SDRAM, те же тестеры, та же упаковка чипов — TSOP. В общем, в отличие от ситуации с Direct RDRAM, производители уже сегодня готовы к массовому производству и ждут только наличия материнских плат.

А эволюция продолжается — на горизонте уже маячит DDR II, о которой пока мало что известно. Хотя, например, известно, о каком уровне пиковой пропускной способности может идти речь — 3 Гб/с и выше. Однако, поскольку этот тип памяти появится "аж" в следующем году, речь здесь о нем идти не будет. Просто, следует иметь в виду эту перспективу.

Выводы

Пусть их лучше сделает эксперт в этой области — Hyundai Electronics:

  • [+ + +] — хорошо
  • [+ +] — нормально
  • [+] — плохо

  SDRAM PC133 DDR PC266 Direct RDRAM
Пиковая пропускная способность шины + + + + + + +
Эффективность шины + + + + + +
Скорость доступа + + + + + + +
Цена + + + + + + +
Упаковка + + + + + + +
Открытость стандарта + + + + + + +
Средняя загрузка шин адресов и данных + + + + + + +
Влияние количества контактов + + + + + + +
Совместимость по размерам с существующими DIMM + + + + + + +
Энергопотребление + + + + + +
Поддержка ECC + + + + + + +
Совместимость с существующими спецификациями + + + + + + +
Наибольшее удобство при использовании + + + + + + +

Вряд ли к этой таблице стоит что-то добавлять. Разве что, вот такой вот нехитрый расчет примерной стоимости перехода на Direct RDRAM:

  Дополнительная стоимость Примечание
256 Мб модуль DRDRAM $210 Примерно на 70% дороже 256 Мб модуля SDRAM
Профиль для охлаждения модулей DRDRAM $10 Цена его самого. Стоимость возможной смены корпуса не учитывается
Увеличенный размер модуля $3  
Регулятор напряжения $20 Средняя цена. Колеблется от 10 до $35
Генератор тактовой частоты $2  
i820 $20 Примерная разница в цене между i820 и 440BX или PC133 чипсетом
6-слойная материнская плата $10  

Итого переплата — $275. За что?