AMD K7


Сегодня компания AMD как никогда близка к тому, чтобы вырвать у корпорации Intel пальмовую ветвь первенства на рынке настольных PC. Ее надежда, ее главный козырь, носит очень короткое название — K7. И если на рынке дешевых, <$1000 PC, победа AMD — это реальность, что доказывают результаты только что завершившегося квартала, то для завоевания верхнего уровня Desktop’ов — от полутора тысяч долларов и выше, в 1999 году ей потребуется как следует поработать. Поскольку противником K7 в этой сфере будет выступать не менее ожидаемый и ангажированный соперник от Intel — Katmai.

В этой статье предпринята попытка собрать в одном месте всю известную на сегодня информацию об AMD K7 и попытаться на основании этих данных создать портрет одного из участников битвы за наши кошельки.

Начнем с того, что по своим технологическим качествам, по микроархитектуре, K7 превосходит Katmai, который должен появиться на рынке раньше своего соперника. Это вовсе не значит, что Intel упустила инициативу из своих рук — Willamette по своим качествам будет заметно превосходить K7. Но на этом повороте AMD обошел Intel на любимой дистанции того — процессорах для высокопроизводительных настольных PC / серверов начального уровня.

Ведь по сути, если не учитывать KNI, Katmai — это абсолютно тот же самый Pentium II. Никаких существенных изменений в ядре не произошло. С одной стороны это правильно: Intel действовал по принципу лучшее — враг хорошего. Однако, это дало возможность не сбавляющему последние полгода свой темп AMD вырваться вперед. K7 должен вдребезги разнести представления об AMD, как о компании, собирающей крохи со стола технологического пионера.

Вспомним, однако, что перед появлением K6 мы слышали аналогичные заявления. На каждом углу AMD утверждалось, что этот процессор будет превосходить равные ему по частоте процессоры Pentium, при этом стоя дешевле. И вспомним, чем кончились все эти обещания — проблемы с производством сбили набирающий высоту K6 эффективнее любых конструктивных недоработок. Также, свою лепту внесла и команда разработчиков, не справившаяся с разработкой блока операций с плавающей точкой. Получившийся инвалидом от рождения, сопроцессор K6 явно не вытягивал ту производительность, которую требовал от него вышедшие тогда же Quake. Вспомним, что 3D ускорителей тогда еще толком не было, и в основном графику приходилось считать центральному процессору.

Таким образом, отсеяв большую часть рынка домашних PC, AMD K6 самой судьбой был предназначен к установке на офисные PC, однако там его встретил консерватизм компаний, предпочитающих ради обладания компьютером с логотипом "Intel Inside" закрыть глаза на более оптимальные варианты.

Есть надежда, что на сей раз AMD удастся проскочить эти подводные камни.

Во-первых, скоро начнет работать на расчетных мощностях фабрики Fab30 под Дрезденом, предназначенной главным образом для производства пластин с чипами K7. Массовый выпуск процессоров намечен на 1999 год. До того момента основная масса K7 будет производиться на основной фабрике AMD — Fab25, в Техасе.

Во-вторых, это унификация технологического процесса с новыми фабриками Motorola, что позволит использовать их мощности для производства K7, в случае неспособности AMD справиться с удовлетворением спроса собственными силами.

Однако есть и места, вызывающие некоторую тревогу. Есть подозрение, что ситуация, как это не обидно, будет складываться по аналогии с выходом на рынок K6 и K6-2. Судите сами: Дрезденская фабрика выйдет на полную мощность в 1999 году, но может и позже, на фабрики Motorola надежда в основном в плане выпуска следующей версии K7, сделанной на базе технологии медных соединений — примерно тогда же, в районе 2000 года. Таким образом, в начале выхода K7 на рынок мы можем рассчитывать только на Fab25. А как она справлялась с выпуском K6 и K6-2, мы все видели.

Другой вопрос, что за одну вещь можно ручаться без колебаний — после K5, K6 и K6-2, проигрывавших Pentium/Pentium II по скорости сопроцессора, K7 будет чем–то качественно иным: впервые процессор AMD будет очевидно превосходить технологически своего Intel’овского соперника практически по всем параметрам.

Естественно, главным виновником данного факта, является инженерная команда K7: 150 человек под руководством Дирка Мейера, до присоединения к AMD в 1995 году бывшего одним из создателей Alpha 21264.

Таким образом, с Digital’овской шиной EV-6, используемой K7, у команды разработчиков проблем быть не должно. 200 Мгц системная шина полностью идентична используемой процессором Alpha 21264PC, что дает потенциальную возможность Compaq выпускать дочерние платы с этим процессором, вставляемый в механически совместимый со Slot 1 Slot-A. Несмотря на вдвое большую по сравнению с сегодняшними системными шинами скорость, EV-6 проще в разработке и дешевле в производстве. По сравнению со 100 Мгц шиной P6, используемой в Slot 1, 200 Мгц EV-6 в Slot-A понадобится на 25-30 контактов меньше.

Конечно, и у той, и другой шины есть свой запас по прочности. В среднем, он равен двукратному значению сегодняшней частоты. Для Slot 1 Intel’овские планы предусматривают постепенное поднятие ее до 200 Мгц, для Slot-A речь идет о 400 Мгц в будущем. Если бы такая частота поддерживалась сегодняшними Pentium II, то PII 400 имел бы коэффициент умножения 1.0!

В результате, K7 будет иметь минимальную тактовую частоту 500 Мгц. А в 2000 году, со вводом в действие Fab30 и переходом на медные соединения, компания надеется достичь скорости в 1 ГГц.

Что же касается технологии производства, то сначала K7 (состоящий из 22 миллионов транзисторов) будет производиться по 0.25 мкм технологии, но к концу 99 года должен перейти на 0.18 мкм, за счет чего площадь кристалла снизится с 184 до менее чем 100 кв. мм. Что должно повлечь за собой снижение себестоимости, а значит, и розничной цены.

Если бы AMD использовала кэш второго уровня, работающий на таких скоростях… В общем, вспомните цену Xeon’ов, у которых кэш L2 работает на частоте ядра (400-450 Мгц), и, полагаю, мне не надо будет объяснять почему AMD решила на первых порах ограничиться размещением кэша второго уровня на дочерней плате. (Так же, как это сделано на сегодняшних Pentium II и будет сделано на Katmai). Для неотложного кэширования вполне хватит 128 Кбайт кэша L1, расположенного на чипе, и работающего на его частоте. В результате того, что на чипе будет интегрировано довольно малое количество весьма капризной памяти, меньше чипов будет идти в отбраковку, а значит будет ниже и себестоимость — гораздо легче заменить дешевую сбойную микросхему SRAM на дочерней плате, работающую на половинной скорости, чем выбрасывать чип процессора или дорогой высокоскоростной SRAM.

Таким образом, получается весьма привлекательная и логичная картина. В вопросе, что предпочесть: баснословно дорогой процессор с 0.5-2 Мб кэша, работающего на частоте процессора (Xeon) или дешевый процессор с 0.5 — 8 Мбайтами (!!!) кэша второго уровня, работающего на пониженной частоте (K7), AMD предпочла наиболее, скажем так, правильный путь. Она ведь, в конце концов, позиционирует K7 не только на сервера, но и на обычные компьютеры. И никто ведь не мешает поставить на дочернюю плату более дорогой высокоскоростной кэш и сделать аналог Xeon’а.

Один из самых острых вопросов, которые проглядывают в наступающем году — наборы инструкций. Intel’овский KNI и AMD’шный 3DNow!. С одной стороны, у K7 будет фора перед Katmai в 7-8 месяцев. Именно столько времени будет применяться в программной индустрии 3DNow! к моменту выхода Katmai. И он действительно ускоряет приложения, напряженно работающие с графикой. Значительно, или незначительно — это уже зависит от программистов. За уже прошедший, довольно небольшой срок, нам были продемонстрированы как те, так и другие примеры. Таким образом, к моменту выхода K7 мы будем иметь годичный срок жизни 3DNow!, гарантирующий полную поддержку K7.

С другой стороны, более комплексный KNI будет способен придать большее ускорение операциям с графикой, и звуком. Однако, сомнительно, чтобы большинство из разработчиков придало приоритет только одному набору инструкций, независимо от его превосходства. Скорее всего, чтобы избежать потери потенциальных покупателей, все пойдут по уже пройденному пути — поддержка как того, так и иного набора команд. Благо, что Microsoft в DX6 сделала несколько довольно важных шагов в этом направлении, включив в состав пакета динамические библиотеки для 3DNow!.

Что интересно, в принципе возможен вариант с кросс лицензированием — когда Katmai и K7 будут выходить с поддержкой как KNI, так и 3DNow!. С одной стороны, вроде как маразм, но с другой, есть у этой идеи и свои несомненные плюсы. По крайней мере, — для нас, покупателей. Поддержка одним процессором и KNI и 3DNow!, — это было бы удобно.

Что касается скорости исполнения команд, то тут K7 не имеет себе равных — утроено все, что можно было утроить. Процессор имеет 3 блока операций с целыми числами, 3 блока операций с числами с плавающей запятой/MMX/3DNow! и три блока вычисления адресов. Вообще же, пиковая производительность, например, сопроцессора в K7 в 4 раза превышает его скорость в Pentium II. Так что, на Quake 3, например, по идее, K7 должен показать лучшие результаты по сравнению с Katmai. Впрочем, в данном конкретном случае, как и в целом по программной индустрии, все зависит от того, насколько эффективно ребята из id Software реализуют поддержку KNI и 3DNow!

Если погрузиться немного глубже, то можно увидеть достаточно сильные расхождения в подходах инженеров. Если Pentium II/Katmai разбивает CISC X86 команды на более мелкие и быстрые RISC команды, которые затем можно параллельно исполнять, то у K7 подход будет несколько иным. Он оперирует блоками X86 инструкций, которые AMD называет macroOPS. Некоторые такие блоки могут содержать одну X86 инструкцию, а большинство содержит две. Например, загрузить данные, и инвертировать их.

Конвейер декодирования инструкций может обрабатывать до 3 macroOPS за цикл, после чего они идут в модуль контроля инструкций. Всего "в работе" одновременно могут находиться до 72 X86 команд. С одной стороны, такие блоки, несомненно, больше небольших RISC-команд, с другой стороны, за счет такого подхода ядро может непосредственно работать с X86 инструкциями, вместо того, чтобы эмулировать их через RISC команды.

Особое внимание уделялось тому, чтобы процессор не стал узким местом, снижающим потенциальную скорость 200Мгц шины. Буферизация команд была проработана на полную катушку: во входной очереди может находиться до 15 macroOPS (что соответствует 30 инструкциям X86), а у сопроцессора приемный буфер еще больше — до 44 команд. Отдельный буфер данных находится еще и на самом интерфейсе с шиной.

Без сомнений, вопросом номер один для выживания K7 станут смежники — производители BIOS, чипсетов, материнских карт. Ну, допустим, с самой легкой частью — BIOS, все в порядке: K7 будет поддерживаться и Award’ом, и Phoenix’ом (что сегодня, фактически, одно и то же), и AMI. С чипсетами вопрос более сложный. Во первых, AMD, как и в случае с K6 (AMD-640), ни на кого не надеясь, разрабатывает собственный чипсет для K7. Его, по 0.35 мкм технологии, вроде бы будет производить UMC. Однако, вспоминая бесславно почивший в бозе AMD-640, в его перспективы верится с большим трудом. Ну не получается у AMD стать поставщиком чипсетов. А вот второй вариант кажется наиболее правдоподобным: если не будет форс-мажорных обстоятельств — извержений, наводнений, высадки инопланетян, покупки Intel’ом, то свои чипсеты, поддерживающие K7 (а может, чем черт не шутит, еще и Альфу 21264PC) выпустят компании, неслабо зарабатывающие на производстве чипсетов для Socket7 плат: Via Technologies, SiS, Ali.

К тому же, AMD и так довольно сильно облегчил задачу производителям материнских плат, сделав Slot-A механически совместимым со Slot 1. В результате чего для выпуска вариантов плат Katmai/K7 понадобится только несколько поменять разводку — все основные компоненты, включая слот для процессора, будут одинаковы на обоих платах.

Вариантов чипсетов предполагается два — с поддержкой 100 Мгц SDRAM (сначала) и с поддержкой Direct RDRAM (попозже). По идее, первый чипсет предназначается для нас с вами, второй — для создания серверных платформ. Однако, если Direct RDRAM пойдет хорошо, и цены опустятся до приемлемых значений, то, возможно, к концу 99 года чипсет с поддержкой SDRAM будет снят с производства. Опять же, в серверном варианте будет поддержка нескольких процессоров — как никак, а K7 — первое творение AMD, поддерживающее многопроцессорность.

Кстати, что интересно. Интел весьма удружил AMD, активно проталкивая в последнее время Rambus Direct RDRAM. Ведь именно K7, а не Katmai, в первую очередь выиграет от перехода на эту память. Тут все завязано на системную шину: у первоначальных вариантов Katmai, которые будут работать на 440BX, с его FSB (Front Side Bus) 100 МГц, пиковая скорость обмена с Direct RDRAM составит всего 800 Мбайт/с. После подхода создаваемого специально под Katmai чипсета Camino, где FSB поднимется до 133 МГц, пиковая скорость обмена, соответственно, возрастет до 1066 Мбайт/с. По максимуму же, она у RDRAM равна 1,6 Гбайт/с. А теперь умножьте FSB K7 (200 Мгц) на 8Мбайт/с. Сколько у вас получится? Правильно — те самые 1,6 Гбайт/с. Спасибо, Intel!

Вот по цене есть одно небольшое "но", касающееся AMD’шного правила продавать аналоги Intel’овских процессоров на 25% дешевле. Аналогом Katmai AMD считает не K7, а K6-3 (может быть и справедливо), так что вроде облом — дешевле Katmai K7 никто не обещал. Впрочем, посмотрим, какую цену выставит Intel. Может оказаться, что цена будет меньше даже не на четверть. Что вряд ли — учитывая большой размер кристалла K7, мы автоматом получаем меньший выход процессоров с кремниевой пластины, а значит, высокую себестоимость. Впрочем, переход на медные соединения, который повлечет за собой довольно сильное уменьшение площади чипа, должен будет исправить эту неприятность.

По крайней мере, что хоть немного утешает, что не придется расставаться с недавно купленным корпусом ATX. А также, с клавиатурой, мышкой и монитором. До такой степени маршруты Intel и AMD еще не разошлись.

Попробуем вкратце подытожить вышесказанное.

Плюсы:

  • Быстрая шина, с потенциалом роста до 400 МГц
  • Большой дешевый кэш L2 (до 8МБ)
  • Традиционная дешевизна
  • Потенциальная скорость до 1 ГГц
  • Широкая поддержка 3DNow!
  • Поддержка Direct RDRAM
  • Потенциальная взаимоменяемость с Alpha 21264PC
  • Мультипроцессорность

Минусы:

  • Отсутствие поддержки KNI
  • Необходимость покупки новой материнской платы
  • Возможная неудовлетворенность спроса на процессор
  • Необкатанность чипсетов для K7, в отличие от 440BX для PII

Итого плюсов видится гораздо больше, чем минусов. По крайней мере, стоит подождать до лета 99 года, и только тогда задумываться об upgrade. Если, конечно, есть необходимость задумываться о таком параметре, как соотношение цена/скорость. А тут, в этом уже практически можно не сомневаться, K7 Katmai сделает!




Дополнительно

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.