Архитектура K8L на 65 нм SOI техпроцессе в четырехъядерных процессорах уже во втором квартале 2007 года?


Не секрет, что практически вся информация, преподносимая компаниями на официальных пресс-конференциях, не является неожиданной для тех, кто внимательно следит за ИТ-новостями и проникающей в сеть неофициальной информацией. Однако официальная позиция ценна тем, что она не только привязывает будущие проекты к определенным срокам, но и, как ни странно, отличается от «утечек» лаконичностью. Дело в том, что слухи, которыми нас обильно потчуют некие тайваньские и английские сайты, как правило, представляют лишь возможные пути развития. А реальные планы строятся на выборе из этих «возможных путей» наиболее удачного, точнее — технически реализуемого. И по нынешним высококонкурентным временам официальные планы обнародуются практически сразу, после того, как «технологи» определятся со своими возможностями и дадут отмашку «маркетологам».

В начале сентября своими, более чем свежими, планами с представителями московской ИТ-журналистики поделилась компания AMD.

«Официальную часть» провел Пьер Брансвик, вице-президент по продажам и маркетингу в СНГ, Восточной Европе и Турции, судя по регулярному присутствию на пресс-мероприятиях, уже прочно обосновавшийся в Москве. Кстати, «генеральская» должность для сотрудника, занимающегося «нашим» регионом, косвенно, но вполне объективно, демонстрирует, что AMD считает этот регион стратегически важным.

Очевидно, что на сегодня, основная задача людей «от маркетинга» в AMD — продемонстрировать, что, несмотря на выход конкурирующего продукта с более эффективной архитектурой, компания живет и развивается. И не собирается не только уступать завоеванную долю рынка, но и замедлять темпы роста. К чему есть масса экономических, и, как обнаружилось позже по ходу презентации, также и технологических причин.

Конечно, приобретение надежных позиций на весьма консервативном серверном рынке можно считать одним из основных достижений прошедших трех лет.

Переход компании Dell на использование процессоров от AMD важен и в плане привлечения еще одного крупного заказчика (особенно, с учетом возможного доведения доли компьютеров Dell на AMD-процессорах до 50%). Но в еще большей степени это, уже давно ожидаемое, событие сейчас важно как «политический» пример для «сомневающихся». Любопытно, что практически в те же сроки активное внедрение Opteron в свою серверную линейку допустила компания IBM. Давний технологический партнер AMD, по некоторым, уже не имеющим значения, причинам, в сегменте многопроцессорных серверов оставался верным Intel.

Гораздо менее ожидаемое (да, проще говоря — совершенно неожиданное!) событие лета — начавшееся присоединение компании ATI, тоже играет свою политическую роль. Тогда как с практической стороной дела — влиянием «совместного творчества» на характеристики конечных продуктов нам придется подождать. На сегодня есть лишь контрпродуктивное следствие — отсутствие поддержки технологии CrossFire в чипсетах 965-ого семейства от Intel. Первые инженерные образцы плат на этом чипсете имели такую поддержку, но, из-за проблем в функционировании, требовали доводки, участие в которой со стороны ATI «на всякий случай» было заморожено.

А поскольку NVIDIA не стала резко менять приоритеты, а продолжает действовать самостоятельно, поддержка SLI в интеловских чипсетах также пока не появляется. Более того, и с чипсетами семейства nForce 500 от самой NVIDIA дела обстоят не очень гладко — появившиеся было в анонсах модели, до сих пор недоступны (а некоторые производители даже убрали их упоминания с официальных сайтов). Причины задержки в поставках, как водится, не комментируются. Но, помножив ситуацию на маленький выбор и высокую стоимость плат хотя бы с одним графическим портом под Core 2 Duo, в данный конкретный момент, настольная AMD-платформа в большей степени достойна называться приобретением для всех «нормальных людей», тогда как Intel — для отдельных «энтузиастов». Что весьма непривычно.

Слайд производственных мощностей AMD по-прежнему умещает все фабрики, где производятся процессоры архитектуры AMD64 (если не считать совместного производства на Chartered Semiconductors, уже работающего в полную силу). Относительной новостью является намерение переоборудовать «старую» Fab 30 для производства по нормам 65 нм и более тонких техпроцессов. О еще более масштабных проектах в США, представители европейского подразделения, вероятно, из патриотических соображений, не распространяются.

Доклад продолжил Джузеппе Амато — технический директор отдела продаж и маркетинга в Европе, на Ближнем Востоке и Африке.

И сразу поделился ключевыми особенностями архитектуры, готовящихся к выпуску в 2007 году четырехъядерных процессоров, среди которых:

  • интеграция четырех ядер на один кристалл, выпускаемый по нормам 65 нм SOI техпроцессора, с сохранением теплового пакета, характерного для нынешних двухъядерных процессоров;
  • независимое динамическое управление частотой и напряжением для каждого ядра;
  • интегрированный контроллер памяти (двухканальной DDR2-667/800) и архитектура Direct Connect для непосредственного соединения процессоров в многопроцессорной системе.
Но, пожалуй, наиболее интересная для анализа конкурентоспособности информация касается новшеств, планируемых (уже официально) в микроархитектуре четырехъядерных процессоров.

Очень похожую картинку все, интересующиеся темой, уже встречали в качестве иллюстрации изменений, запланированных в ядре, известном под кодовым названием K8L. Таким образом, практически все они (по крайней мере, из тех, что, так или иначе, озвучивались и упоминались) должны войти уже в первое поколение четырехъядерных процессоров, запланированных к выпуску (а точнее — товарной доступности) во втором квартале 2007 года! А это означает, что AMD намерена перенести выход своего «ответа на Intel Core 2» на более ранний срок даже относительно наиболее оптимистичных прогнозов (середина 2007 года), имевшихся ранее. Первыми на новое ядро перейдут процессоры Opteron и Athlon 64 FX. И это, несомненно, наиболее важная новость.

Кэш-память в четырехъядерных процессорах будет организована в три уровня. И, как особо (и неоднократно) подчеркивается, упор будет сделан не на увеличение объема, а повышение эффективности обращения. Означает ли это, что ассоциативность кэша L1 возрастет, а шина между L1 и L2 уровнями расширится до 256 бит? С высокой вероятностью — да (в противном случае, чем же добиваться обещанного, если не этими, технически относительно несложными и давно напрашивающимися усовершенствованиями?).

Популярное деление на «эксклюзивную» и «инклюзивную» модель организации кэш-памяти постепенно теряет актуальность (вернее, и раньше существовало больше двух способов организации, а наглядной популяризации деления мы обязаны маркетологам AMD, впервые сообщивших о преимуществах «эксклюзивности» применительно к процессорам на ядре K7). На практике для двух- и многоядерных процессоров с объединенным (тем или иным образом) кэшем стремиться к чисто эксклюзивной модели было бы странно. В трехуровневой кэш-памяти, связка L1 и L2, скорее всего, унаследует эксклюзивный принцип (данные кэш-памяти одного уровня дополняют данные, хранящиеся в другом, причем определенный блок данных может в каждый момент времени находиться лишь в одном из кэшей, что позволяет говорить об эффективном сложении их объемов). А L3, помимо своих «эксклюзивных» данных, сможет содержать и блоки из кэшей более высоких уровней. Тем не менее, требования обязательного сохранения в нем данных, находящихся на других уровнях, как в процессорах с чисто инклюзивным кэшем, не будет. Такой принцип можно назвать «не инклюзивным» или «не эксклюзивным», как вам больше нравится.

В целом замысел выглядит убедительно. И AMD, имея в своем распоряжении интегрированный контроллер памяти, действительно, нет никакого смысла прибегать к механическому наращиванию объемов внутреннего кэша. Более универсальный путь состоит в ускорении обмена данными со всем массивом внешней памяти, тем более что потенциал DDR2 на сегодня еще полностью не раскрыт. А как показали исследования на нашем сайте, скорости, на которых современная оперативная память готова обмениваться данными с процессором, вполне сопоставимы со скоростями обмена внутри процессора. Кэш в таком случае, имеет смысл минимизировать в объеме, но сделать его максимально быстрым.

Управление частотой и напряжением питания будет реализовано для каждого ядра в отдельности. Алгоритм управления сможет допускать работу каждого ядра со своей частотой, в зависимости от того, насколько ресурсоемка, привязанная к нему в данный момент, задача.

Прогнозы на 2007 и 2008 год в отношении серверного сегмента не претерпели особых изменений по сравнению с аналогичным «цебитовским» слайдом. Впрочем, одно дополнение весьма интересно — архитектура Direct Connect к 2008 году будет обновлена до второй версии, и одно из новшеств называется Probe Filter. Дело в том, что, несмотря на планируемое увеличение пропускной способности шины Hyper-Transport для версии 3.0 до 10,4 Гбайт/c в каждом направлении, в тех случаях, когда она используется для соединения между собой процессоров (а не подключения периферии), с ростом числа процессоров, внутренний трафик может превратить ее в узкое место всей системы. А с планируемым появлением четвертого HT-канала у старших моделей Opteron, AMD упрощает (и поощряет) задачу построения 8-процессорных конфигураций. Означенный «фильтр» должен разгрузить эту шину за счет пересылки между кэш-памятями процессоров лишь необходимой информации! Технические детали пока не разглашаются, и серверные гуру могут придумать свои способы реализации (чтобы со временем сравнить с оригиналом).

Принципиальным, по мнению представителей AMD, отличием ее четырехъядерных процессоров, от, готовящихся к выпуску уже в четвертом квартале 2006 года, процессоров Intel на ядре Kentsfiled/Clovertown, является «естественная» четырехъядерность — все четыре ядра помещаются на одном кристалле и имеют общую кэш-память. Тогда как Intel лишь «склеивает» два кристалла из существующего ныне двухъядерного семейства Conroe/Woodcrest, чтобы ускорить выход своего продукта. Поскольку взаимодействовать процессорам в таком случае приходится через внешнюю шину и чипсет, такой подход напоминает использовавшийся в Pentium D, и, конечно, не вызывает восторга изяществом технического решения. Также Intel придется снизить частоту шины с 1333 до 1066 МГц, что тоже нельзя назвать прогрессом. С другой стороны, конечным потребителям, как правило, безразлично, насколько красиво, с инженерной точки зрения, реализована начинка приобретаемой техники, поэтому решающее слово будут иметь тесты производительности готовых продуктов.

Но побочным явлением «склеивания» ядер будет вполне естественное увеличение энергопотребления, которое точно можно сравнивать прямо сейчас, поскольку величины TDP для процессоров и остальных компонентов платформы (чипсетов, памяти) уже известны. Переходя к теме энергопотребления, докладчик отметил два момента:

  • практическое значение для потребителя (владеющего внушительным серверным парком и стремящегося сэкономить на электроэнергии) этот показатель имеет только при сравнении потребления всей платформы, а не выборочно процессоров. И в таком сравнении, оказывается, что даже платформа на нынешнем двухъядерном Opteron (90 нм SOI) выигрывает у Xeon-Woodcrest (65 нм), поскольку не нуждается во внешнем контроллере памяти и использует DDR2-память, существенно более экономичную, по сравнению с первым поколением FBDIMM;
  • при переходе на четырехъядерные процессоры, преимущество AMD-платформы увеличится, поскольку Intel, по упомянутым причинам, вынуждена будет расширить тепловой пакет относительно двухъядерного семейства, а у AMD он останется неизменным (хоть, и отметим, по абсолютной величине для средних моделей в линейке, превышающим «интеловский»).
Любопытно, что оценки AMD основываются на весьма консервативных данных, реальное потребление первых интеловских четырехъядерников, что уже демонстрируется независимыми тестами, практически вдвое выше двухъядерных прототипов, и достигает уровня «экстремальных» моделей прежнего Netburst-семейства. Для тех, кто планирует со временем обновить процессоры, на купленной сейчас платформе под Intel Conroe/Woodcrest, это обстоятельство может создать вполне определенные трудности, если преобразователи питания на вашей плате окажутся недостаточно мощными. Впрочем, та же практика показывает, что запустить новые процессоры, удается, иной раз, и на достаточно старых платах, но оптимальным выбором являются специально оптимизированные для них. И Intel, заинтересованная в сбыте собственных продуктов, среди которых значатся не только процессоры, конечно, не упустит случая предложить потребителям сначала обновленные версии плат, а затем и чипсетов, специально для новой платформы.

В заключительной части, Джузеппе Амато уделил внимание идеологическому вопросу — как «многоядерность» будет влиять на «многопроцессорность».

Количество ядер у процессоров растет, и, на первый взгляд, в четырехъядерную эпоху, пары-тройки двухпроцессорных серверов, должно хватать для «обслуживания» весьма крупных проектов. Дорогие 4 и 8-процессорные системы окончательно «задвигаются» в область научных вычислений и моделирования, а для бизнеса достаточно систем «попроще»? Не совсем так.

У многопроцессорного сервера по сравнению с несколькими двухпроцессорными, при изначально более высокой стоимости, ниже затраты на эксплуатацию и управление. На практике зачастую можно обойтись меньшим общим количеством физических процессоров.

Такая «памятка покупателю» еще раз демонстрирует, что для разных классов задач существуют свои наиболее предпочтительные схемы организации серверов (на базе одно-, двух- и многопроцессорных) конфигураций.

Часть 2. Комплексная методика оценки производительности и энергопотребления




Дополнительно

iXBT BRAND 2016

«iXBT Brand 2016» — Выбор читателей в номинации «Процессоры (CPU)»:
Подробнее с условиями участия в розыгрыше можно ознакомиться здесь. Текущие результаты опроса доступны тут.

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.