Платформа AMD AM4 и предварительные данные о микроархитектуре Zen

Чего нам ждать от компании в 2017 году?


Некоторое время назад AMD поделилась с широкой общественностью очередной порцией данных о новой микроархитектуре Zen, а также платформе AM4, которая (вкупе с новыми процессорами и APU) со следующего года должна стать основным продуктом компании для десктопного рынка. Понятно, что предварительная информация исчерпывающей не является, однако она достаточно интересна, поскольку позволяет примерно понять, чего следует ждать от новых продуктов (а чего — не стоит). Это и явилось поводом для написания данного материала, посвященного не микроархитектурным тонкостям (безусловно, важным, но далеко не всем), а, скажем так, потребительским характеристикам новой платформы.

Текущие проблемы

Как мы уже писали почти два года назад, последние несколько лет ситуация с настольными платформами AMD выглядела несколько странной. Фактически основные события происходили в области APU (как компания называет процессоры с интегрированной графикой), где с 2011 года сменились две с половиной платформы: FM1, FM2 и совместимая с последней сверху вниз FM2+. Впрочем, все перечисленные решения (даже платформу FM1, на рынке не слишком задержавшуюся) можно считать современными: высокая степень интеграции позволяет создавать законченные системы, используя буквально пару чипов — собственно процессор (большинство которых снабжено отличными по меркам интегрированных решений GPU) и чипсет. Линейка же чипсетов также соответствует современным требованиям — в плане интеграции функциональных возможностей AMD очень часто опережала Intel, первой снабдив свои микросхемы и встроенной поддержкой USB 3.0, и скоростью в 6 Гбит/с для всех SATA-портов, например. Единственное, что мешало широкой экспансии решений для этой платформы — относительно невысокая производительность и высокое энергопотребление процессорной части APU в сравнении с конкурирующими решениями. Более высокую производительность можно было получить, выбирая решения для платформы АМ3+, по сути восходящей еще к платформам начала века. Да и сами по себе многомодульные процессоры для нее существенно не обновлялись с 2012 года, так что могли продаваться лишь благодаря низким ценам при относительно высокой себестоимости, обусловленной использованием уже порядком устаревшего техпроцесса 32 нм. Последнее в какой-то степени касалось и APU, которые за время существования «перешли» с упомянутых норм лишь на 28 нм, что тоже пиком технологий давно не является — во многом именно это вызывало упомянутые проблемы с энергопотреблением.

Стоит отметить, что такое положение дел компания «нормальным» не считала никогда: унификация платформ изначально планировалась как раз на 2012 год. Однако на практике этого не случилось, так что своеобразное «сидение на двух стульях» продолжается до сих пор. Таким образом, по сути, ныне уже устарели и процессоры, и платформы AMD, так что ситуацию нужно менять радикально. Это компания и планирует сделать.

АМ4: наконец-то единая платформа

AMD полностью подтвердила существующие предположения о характеристиках новой платформы, причем даже «с горкой». В частности, к ключевым особенностям AM4 компания относит следующее:

  • Память типа DDR4
  • Полная поддержка PCIe 3.0
  • USB 3.1 («полноценный», т. е. Gen2 со скоростью до 10 Гбит/с)
  • NVMe и SATA Express

Что касается последнего пункта, то, в принципе, серьезные аппаратные доработки для его реализации не требовались: она возможна и в рамках существующих платформ. В частности, многие производители системных плат даже ассортимент моделей с АМ3+ обновили, предусмотрев для них загрузку с NVMe-накопителей. Более важным для полноценного функционирования NVMe-накопителей на максимальной скорости является поддержка PCIe 3.0, которой в рамках АМ3+ не было вообще, а APU для FM2+ поддерживали лишь 24 линии данного интерфейса, часть которых «уходила» на связь с чипсетом, а 16 могли потребоваться видеокарте. Кроме того, как уже было сказано выше, высокопроизводительных процессоров для FM2+ не существовало, так что платформа давно и прочно обосновалась в бюджетном секторе, где протокол NVMe не слишком актуален (просто потому, что пока все поддерживающие его накопители исключительно «небюджетны»). АМ4 же по планам должна стать решением для всех сегментов рынка, так что для нее это может стать необходимым — особенно учитывая тягу AMD к созданию «долгоживущих» платформ, что весьма ценят многие пользователи. Ровно то же самое относится и к поддержке USB 3.1: пока она необходимостью не является, однако в будущем может пригодиться. Опять же, как уже было сказано выше, предыдущую версию стандарта AMD реализовала в чипсетах на год раньше, чем Intel, так что логично того же ожидать и для новой версии USB.

Освоение DDR4 — это давно ожидавшийся шаг, поскольку производительность интегрированных GPU сильно зависит от пропускной способности памяти. Ранее решать эту проблему приходилось повышением частот DDR3, но такой подход, мягко говоря, не идеален с точки зрения цены и энергопотребления модулей. Собственно, именно поэтому разговоры о внедрении поддержки DDR4 в APU AMD шли еще с 2013 года (тогда высказывалась масса предположений о двух вариантах в ожидающихся Kaveri), но долгое время новые модули памяти были слишком дороги для использования в массовых системах. На данный момент отгрузки DDR4 уже превосходят DDR3, так что цены сравнялись — с тенденцией в пользу DDR4. В общем, пришло время прощаться со старыми стандартами, причем, судя по всему, AMD планирует это сделать более резко, чем Intel — та, напомним, пока полностью от DDR3 не отказывается. С другой стороны, последнее серьезное обновление LGA115x было в прошлом году, а наиболее интересные продукты для АМ4 появятся в следующем, так что такая разница в подходах вполне объяснима.

Bristol Ridge: промежуточное решение

Впрочем, «обкатка» платформы уже практически началась: как и предполагалось, некоторое количество процессоров для нее выпущено прямо сейчас и уже отгружается крупным производителям. Все они по-прежнему относятся к бюджетному сегменту, так что и самый функциональный из чипсетов (Х380) компания пока «зажала», поставляя лишь пару недорогих модификаций — А320 и В350. Тем не менее, на практике многим будет достаточно и их. Чего в них нет, так это поддержки PCIe 3.0 — лишь 4 или 6 линий PCIe 2.0 соответственно. С другой стороны, 10 линий PCIe 3.0 (не считая нужных для связи с чипсетом) поддерживаются самими нынешними процессорами/APU, а наличие в этих APU мощной (для решений такого класса) графики в недорогом компьютере точно оставит процессорные линии PCIe свободными для периферии.

Вообще же, по сути, можно наблюдать унификацию мобильных и настольных решений: APU семейства Bristol Ridge — это наследники уже знакомых нам Carrizo. Кроме упомянутых 10 линий PCIe 3.0 (х8+х1+х1, две последние можно одновременно «отдать» NVMe-накопителю), они сами поддерживают 4 порта USB 3.0 (оно же USB 3.1 Gen1) и 2 порта SATA600. Использование младшего чипсета А320 добавляет к вышеуказанному разъем USB 3.1 (полноскоростной, как уже было отмечено выше), 2 порта USB 3.0, 6 портов USB 2.0, 4 линии PCIe 2.0, 2 порта SATA600 и 1 разъем SATA Express (который можно использовать как пару SATA). В В350 функциональные возможности аналогичны, но добавлен еще 1 порт USB 3.1 и 2 линии PCIe 2.0. Кроме того, по доброй традиции все решения AMD поддерживают создание RAID-массивов уровней 0, 1 и 10.

Как это соотносится с бюджетными предложениями Intel, типа H110 и B150? Для упрощения понимания соберем характеристики платформ в таблицу, добавив к ней и массовый A78 для уходящей с рынка FM2+.

Чипсет AMD A78 AMD A320 AMD B350 Intel H110 Intel B150
Линий PCIe 3.0 (сумм.) 8/16 10 10 16 24
Линий PCIe 2.0 4 4 6 6 0
Портов SATA600 6 до 6 до 6 4 до 6
RAID 0/1/10 да да да нет нет
Портов SATA Express 0 1 1 0 0
Портов USB 3.1 0 1 2 0 0
Портов USB 3.0 4 6 6 4 6
Портов USB 2.0 14 6 6 6 6

Итак, единственное формально слабое место новой платформы — количество линий PCIe 3.0, обеспечиваемых процессором: всего 10 против обычных в массовом сегменте 16. Но это место слабое лишь пока — просто на данный момент других моделей APU нет, но в будущем они появятся. В конце концов, у решений на FM2+ (A78) линий PCIe 3.0 может и вовсе не оказаться — если установить в плату процессор под FM2, каковые поддерживали только PCIe 2.0. А у платформ Intel другая проблема: все процессоры для LGA1151 поддерживают PCIe 3.0 x16, но на платах с бюджетными чипсетами такая конфигурация линий будет единственной — «расщеплять» эти линии по слотам/устройствам не положено. AMD придерживается иной практики, так что в системе с А320 можно, например, «гонять» два NVMe-накопителя на PCIe 3.0 — а в системе с Н110 нельзя (впрочем, PCIe 3.0 x2 по пропускной способности равно PCIe 2.0 х4, но во многих ли недорогих платах на Н110 найдется возможность реализовать хотя бы такой слот?). Насколько это (равно как и поддержка SATA Express или RAID-массивов) востребовано в недорогих системах — вопрос отдельный. Но факт остается фактом: по сути, даже самые младшие варианты новой платформы сравнимы по функциональности со старшими решениями Intel.

Что же касается возможностей подключения внешней периферии, то по общему количеству USB-портов рекордсменом продолжают оставаться чипсеты для FM2+. Но рекорд этот чисто теоретический — на самом деле столько USB 2.0 в конечных решениях просто не бывает востребовано. А вот четырех высокоскоростных USB-портов иногда уже маловато, что «бьет» и по Intel Н110. При этом самый младший чипсет для АМ4 поддерживает семь портов USB 3.0 (один из которых вообще USB 3.1, что пока, как уже было сказано выше, является в основном заделом на будущее, однако на скорости USB 3.0 этот порт можно использовать уже сейчас) — даже больше, чем В150. Возможно, в «двухсотой» серии чипсетов Intel «подрихтует» и младшие модификации, но пока ее нет, а А320 и В350 уже отгружаются производителям.

Новыми красками должна заиграть разработка компактных компьютеров на базе процессоров AMD, поскольку часть функциональных возможностей традиционных чипсетов уже перенесена в собственно процессоры, что в какой-то степени роднит АМ4 не только с FM2+ или АМ3+, но и с АМ1. В АМ1, правда, функциональность SoC была сильно ограниченной, да и возможности ее расширения отсутствовали, но сейчас эта проблема снята. Точнее, она была снята в ноутбучных Carrizo год назад, и нет ничего удивительного в том, что при разработке новой настольной платформы эти достижения были учтены и унаследованы. Что это дает на практике? Например, без каких-либо особых сложностей можно выпускать платы формата Mini-STX с заменяемым процессором, но «сэкономив» на микросхеме чипсета — четырех портов USB 3.0 и пары SATA600 (один из которых в сочетании с PCIe 3.0 x4 разумно отвести под слот M.2) там хватит. Раньше с этим были сложности — теперь нет.

Процессор AMD A12-9800 AMD A12-9800E AMD A10-9700 AMD A10-9700E AMD A8-9600 AMD A6-9500 AMD A6-9500E AMD Athlon X4 950
Технология пр-ва 28 нм
Частота ядра std/max, ГГц 3,8/4,2 3,1/3,8 3,5/3,8 3,1/3,5 3,1/3,4 3,5/3,8 3,0/3,4 3,5/3,8
Кол-во модулей / потоков вычисления 2/4 2/4 2/4 2/4 2/4 1/2 1/2 2/4
Кэш L1 (сумм.), I/D, КБ 192/128 192/128 192/128 192/128 192/128 96/64 96/64 192/128
Кэш L2, КБ 2×1024 2×1024 2×1024 2×1024 2×1024 1×1024 1×1024 2×1024
Оперативная память 2×DDR4-2400
TDP, Вт 65 35 65 35 65 65 35 65
Графика Radeon R7 Radeon R7 Radeon R7 Radeon R7 Radeon R7 Radeon R5 Radeon R5
Кол-во ГП 512 512 384 384 384 384 384
Частота std/max, МГц 1108 900 1029 847 900 1029 800

Но почему при всех этих интересных особенностях мы текущую реализацию платформы склонны считать промежуточным решением? Дело в том, что сильно ограничены существующие сейчас для нее процессоры. AMD, конечно, высоко оценивает APU «седьмого поколения», но то же самое говорилось и про предыдущие модели. А на практике это лишь дальнейшее развитие все той же модульной архитектуры, дебютировавшей еще в 2011 году, и все тот же техпроцесс 28 нм, используемый с 2014 года. Да, как показали наши тесты, процессоры Carrizo нередко оказываются (благодаря оптимизациям) быстрее Kaveri, работающих на более высокой тактовой частоте, а поддержка памяти типа DDR4 должна их еще немного «подстегнуть». Интегрированный GPU и ранее был одним из лучших в своем классе, а с 2015 года получил обновленный блок видеообработки с аппаратной поддержкой VP9 и H.265/HEVC с разрешением до 4К. Все это верно — но тянет лишь на эволюционные изменения, не меняющие принципиально класс решения. Так, единственный на данный момент Athlon X4 для новой платформы, модель с индексом 950, во всем, кроме типа оперативной памяти, идентичен Athlon X4 845 для FM2+, да и другим новым процессорам более-менее близкие аналоги подобрать можно. Поэтому настоящий старт платформы АМ4 ожидается лишь в следующем году — во всяком случае, если планы AMD будут выполнены.

Zen: что нового?

Итак, какие проблемы стояли перед компанией? Первоочередным спорным моментом разработанной модульной архитектуры были сами модули: для экономии транзисторного бюджета входящая в них пара «х86-ядер» зависит друг от друга, поскольку разделяет некоторые блоки. В частности, в первых реализациях единым был даже декодер команд и кэш инструкций. Второе слабое место — система памяти. На момент разработки первых процессоров сделать быстрый кэш второго уровня получалось, а вот L3 так и остался внешним по отношению к основной части процессора, так что работал асинхронно с ней и на более низких тактовых частотах. В итоге в старших конфигурациях процессоров семейства FX суммарная емкость L2 оказывалась равной L3, что вынуждало AMD продолжать использование эксклюзивной архитектуры кэш-памяти. Та прекрасно работала во времена одноядерных процессоров, но затрудняла обмен данными между вычислительными потоками в многоядерных, усложняя алгоритмы: если чего-то нет в L3, оно может быть в L2 одного из модулей, а может — только в памяти. И даже единый L2 на пару ядер, столь удобный у Core 2 Duo, для синхронизации использовать не выходило: наибольшую эффективность демонстрировал модуль, выполняющий всего один поток команд, т. е. загружать «вторые половинки» (на самом деле, меньшую их часть) работой имело смысл только при слишком большом ее количестве, но не на привычных для массовых нагрузок двух-четырех потоках.

А в APU бо́льшую часть кристалла занимало графическое ядро, так что эти модели остались вовсе без единой кэш-памяти, пусть даже медленной, поскольку иначе процессор получился бы слишком большим. Собственно, при использовании одинаковых норм производства APU по себестоимости конкурировали со старшими четырехъядерными моделями массовой линейки процессоров Intel, а старшие процессоры с четырьмя модулями оказывались еще более дорогими. Но при этом о конкуренции в плане производительности можно было говорить, только сравнивая четыре модуля AMD с четырьмя же ядрами Intel — масла в огонь подливал и всего один SIMD-блок на модуль. При этом процессоры Intel и сами по себе были дешевле в производстве, а из-за особенностей платформ стоили существенно меньше. APU же «воевали» только с совсем дешевыми двухъядерными процессорами Intel, да и это делали с переменным успехом. Конечно, они имели преимущество в производительности графической части, но далеко не всегда оно было востребовано.

Что меняется в новом поколении (как мы и обещали — простым языком, не вдаваясь в технические дебри)? «Базовый элемент» Zen чем-то напоминает двухмодульный процессор предыдущей архитектуры, но с существенными доработками. Во-первых, он включает не четыре попарно объединенных «х86-ядра», а четыре полноценных и независимых ядра — независимых даже в плане кэш-памяти второго уровня, суммарная емкость которой уменьшилась вдвое, зато теперь у каждого ядра появился свой L2 (и, разумеется, собственный декодер команд вместе с кэш-памятью инструкций). Во-вторых, кэш-память третьего уровня стала неотъемлемой составляющей такого вот «кирпичика». Судя по всему, работать она будет существенно быстрее, чем в предшественниках, а ее емкость составляет 8 МБ. В-третьих, что немаловажно, в AMD тоже сумели реализовать технологию симметричной многопоточности, так что каждое ядро может выполнять команды не одного, а двух потоков.

Фактически, как видите, в «базовом» варианте Zen сильно напоминает топовые процессоры Intel массовых серий, т. е. четырехъядерные Core i7. При этом такой «модуль» во второй половине следующего года будет использоваться и в APU, где сейчас всего-навсего, напомним, два модуля «старого образца», причем без кэш-памяти третьего уровня вообще. Графическое ядро, возможно, «не дотянется» до топовых решений Intel (тем более, снабженных кэш-памятью четвертого уровня — ничего подобного AMD пока не обещает), но будет производительнее массовой интегрированной графики Intel. Причем, судя по имеющимся данным о внутренней организации процессоров, компания сможет освоить и бюджетную модификацию с парой ядер и уменьшенным до 4 МБ L3, т. е. выпустить непосредственных конкурентов для разнообразных Core i3 и прочих двухъядерных процессоров (особенно мобильных). Сейчас соперничать с ними могут только двухмодульные (в терминологии AMD — «четырехъядерные») процессоры, а в будущем это будут делать и «обычные» двухъядерные.

Однако нельзя сказать, что компании полностью удалось достичь «паритета по ядрам». В частности, блоки для работы с числами с плавающей запятой и прочими SIMD-инструкциями изменились в меньшей степени, чем хотелось бы. Нормальной поддержки работы с векторами по 256 бит у них нет, т. е. на AVX2-коде ожидать высоких результатов не приходится. С другой стороны, на данный момент преждевременно утверждать о производительности хоть что-либо — новая микроархитектура дебютирует в готовых изделиях только в следующем году. Тогда-то и будет полная ясность с их тактовыми частотами, ценами, да и производительностью в реальных задачах. Пока же мы можем оценивать лишь планы AMD.

А в них нашлось место и любителям высокой процессорной производительности, поскольку вариантов компоновки готовых изделий будет как минимум два (а если учесть возможность выпуска двухъядерных моделей, которые легко найдут свое место в бюджетном сегменте, то и три): кроме APU, где, как уже было сказано выше, один четырехъядерный «модуль» Zen будет соседствовать с GPU, планируется также выпуск «чистых» CPU — с двумя модулями. То есть такие решения получат 8 ядер, способных выполнять одновременно 16 потоков вычисления и снабженных кэш-памятью третьего уровня емкостью 16 МБ. С L3 полной ясности нет — будет ли это единый объем, доступный всем ядрам «составного» процессора, или два отдельных блока (что присуще «склейкам»), но емкость будет именно такой. При этом топовые процессоры сохранят совместимость со все той же платформой АМ4, что является немаловажным конкурентным преимуществом перед процессорами Intel для LGA2011-3 и их последователями, с массовой линейкой механически несовместимыми. Да, разумеется, верным будет сказанное выше насчет производительности векторных инструкций, да и контроллер памяти у этих новых моделей останется двух-, а не четырехканальным, но последнее имеет и свои достоинства: платы будут дешевле. Причем это будут те же самые платы, что и для недорогих APU, т. е. давно ожидаемая единая платформа AMD, вероятно, сможет использоваться еще шире, чем Intel LGA115x. А если компании удастся еще и «зафиксировать» ее лет на пять (реализуя хотя бы совместимость «сверху вниз»), превратив в «долгожителя» класса АМ3 — тем лучше для многих потребителей.

Возникает, разумеется, закономерный вопрос: если все изменения настолько логичны и ожидаемы, то почему «ожидание» затянулось так надолго? Ведь, по-хорошему, такие устройства нужны еще «вчера», а компания планирует их поставки только «завтра». Проблема есть, но собственно разработки она не касается — только производства. Фактически, всё, что до последнего времени было доступно AMD — техпроцесс с нормами 32 нм, которого достаточно разве что для FX. В лучшем случае — достижение уровня Intel Sandy Bridge, которому тоже уже больше пяти лет. Последние модели APU, впрочем, используют нормы 28 нм, но это не намного лучше, чем 32 нм. Поэтому и в производстве запланирован «большой скачок» — переход на техпроцесс 14 нм. Переход совершится с некоторым отставанием от Intel (которая использует этот техпроцесс уже два года), но понятным и объяснимым. В общем, сделать такие процессоры без освоения новых норм производства было невозможно — а их освоение требует времени. Нам же хочется верить, что у AMD все получится.

Итого

Итак, что мы получим? Во-первых — наконец-то! — переход на единую платформу, чего не было пять лет. Причем и в этом случае можно говорить о «большом скачке»: АМ4 по планам должна быть универсальнее, чем Intel LGA115x. Во-вторых, существенное изменение микроархитектуры — с ростом производительности и общей эффективности основанных на ней процессоров. В-третьих, резкое улучшение норм производства, что хорошо и само по себе, и без чего такие изменения были бы невозможны. То есть, как видите, AMD планирует одним махом ликвидировать все недостатки сегодняшних массовых систем своего производства. Получится ли? Это покажет только практика — пока мы можем оценивать лишь планы и предварительную информацию. Впрочем, в каком-то виде платформа АМ4 уже существует, причем в своем ценовом сегменте имеет ряд преимуществ перед конкурирующими разработками. В основном они унаследованы у предшественников (это не удивительно — выпускаемые сейчас APU «новыми» назвать сложно), но с добавлением (хотя бы потенциально) модернизируемости и более длинного жизненного цикла. А окончательный ответ на вопрос, насколько удачным окажется переход, мы получим в следующем году. Хочется верить, что ответ будет положительным — так, как минимум, интереснее :)




Дополнительно

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.