AMD Epyc: первый взгляд на новые серверные процессоры

Содержание

В последнее время у компании AMD наблюдается определенный подъем, особенно хорошо это видно по новым настольным процессорам Ryzen, но не только. К примеру, новые Apple iMac и MacBook Pro основаны на графических решениях Radeon, а игровая консоль Microsoft Xbox One X также имеет в своей базе однокристальную систему AMD. Ну и Ryzen уже завоевал признание пользователей и экспертов, а новые высокопроизводительные процессоры Threadripper планируются к включению во многие конфигурации соответствующих мощнейших решений.

Какая еще часть рынка не охвачена компанией, и в которой AMD тоже вполне может стать успешной, обладая отличным современным CPU-ядром? Конечно же, это процессоры для серьезных вычислительных задач, вроде центров обработки данных, где важно как количество вычислительных ядер, чем Ryzen выгодно отличается, так и однопоточной производительности, с чем у нового CPU все тоже очень неплохо. Именно на этом рынке и решила выступить AMD, выпустив решения семейства Epyc (Эпик), которые на специальном мероприятии представила президент и исполнительный директор компании — Лиза Су.

Очевидно, что серверные Epyc, основанные на микроархитектуре Zen, целятся на применение в ЦОД, для чего новые процессорные ядра AMD в большом количестве отлично подходят. Компания хочет укрепить и усилить успех Ryzen, полученный в сегменте настольных ПК, где новые CPU позволили вернуть несколько процентов рынка, и на серверные применения, которые гипотетически могут принести даже больше денег из-за заметно более высоких цен на продукцию и, соответственно, более высокой прибыли. Тем более что рынок облачных платформ и применений по анализу больших объемов данных еще далеко не достиг своего потолка.

Именно для таких задач компания AMD и выкатила линейку основанных на Zen серверных процессоров Epyc. Основными принципами, которыми руководствовались создатели Epyc, являются высокая производительность, максимально возможное количество ядер, правильный баланс вычислительных ресурсов под самые распространенные задачи, а также повышенная безопасность решения в виде аппаратных технологий по защите данных. Архитектура Zen создавалась в том числе явно в расчете и на серверные применения, и Epyc — это решения со сбалансированной производительностью высокого уровня, богатой функциональностью, высокой пропускной способностью памяти, отличными возможностями ввода-вывода и гибкой конфигурацией платформы для различных применений.

На фото показана готовая двухпроцессорная серверная система на основе AMD Epyc с 64 физическими CPU-ядрами и 128 потоками, с возможностью установки до 2 ТБ памяти в восемь каналов и 128 каналами PCIe, подключенными напрямую к CPU. Это явно очень мощная система, которая должна стать вполне конкурентоспособной на рынке, особенно с учетом предлагаемых компанией цен на серверные процессоры. Но мы забегаем вперед, давайте рассмотрим все представленные модели семейства AMD Epyc.

Модельная линейка серверных процессоров AMD

В отличие от многочисленных серверных моделей CPU у Intel, компания AMD представила лишь несколько моделей, которые отличаются друг от друга по числу вычислительных ядер, частотам и энергопотреблению. Серия серверных процессоров Epyc 7000 имеет основу в виде единого набора функциональности для всех решений, включая поддержку восьми каналов DDR4-памяти на каждый разъем объемом до 2 ТБ памяти, также на каждый сокет.

Важно, что абсолютно все модели Epyc имеют поддержку восьмиканальной DDR4-памяти с частотой до 2666 МГц и 128 линий PCI Express, предназначенных для расширения возможностей системы: подключения вычислительных ускорителей на базе GPU, быстрых хранилищ данных и т. п.), а также специализированные интегрированные ядра для функций, связанных с вопросами безопасности, о которых мы подробно поговорим далее.

В новую линейку процессоров для ЦОД входят модели CPU, включающие от 8 до 32 ядер Zen с поддержкой от 16 до 64 вычислительных потоков. Базовые частоты серверных процессоров AMD находятся в рамках 2,0-2,4 ГГц, а турбо-частоты — от 2,7 до 3,2 ГГц. Уровень TDP для них установлен в 155 Вт или больше (но не выше 180 Вт для самых мощных решений), и из стройного ряда выбивается только младшая модель Epyc 7251 с восемью ядрами и относительно низким TDP на уровне 120 Вт.

Хотя в семейство процессоров Epyc входят решения с разным количеством ядер, все они поддерживают 128 линий PCIe и восемь каналов DDR4-памяти с рабочей частотой до 2666 МГц и максимальным поддерживаемым объемом ОЗУ в 2 ТБ на процессор. В каждый канал памяти можно устанавливать по два модуля памяти, поэтому максимальный объем поддерживаемой памяти составляет 2 ТБ в однопроцессорной системе и 4 ТБ — в системе с двумя процессорными разъемами.

Разные уровни TDP (теплового пакета) для большинства моделей зависят от частоты DDR4-памяти и скорости шины Infinity Fabric. Верхний предел TDP указан для использования самой скоростной памяти DDR4-2666, а низкий уровень в 155 Вт будет соответствовать менее скоростным модулям памяти. Еще раз повторим, что все модели, включая младшие, включают поддержку восьми каналов DDR4-памяти, работающих со скоростью до 2666 МГц, так и 128 линий PCI-E, в отличие от решений конкурента, который любит урезать младшие модели Xeon по своим возможностям.

Топовым решением линейки является AMD Epyc 7601 с 32 ядрами и 64 потоками, а самым доступным — Epyc 7251 с «всего лишь» 8 ядрами, но ровно той же остальной функциональностью, что и старшие чипы. Самый доступный из серверных процессоров AMD в восьмиядерной конфигурации стоит $475, а топовая модель серии в виде 32-ядерного Epyc 7601 обойдется уже почти на порядок дороже — $4200. К слову, модели с относительно малым количеством ядер (восьмиядерники) могут быть выгодны для того программного обеспечения, которое «привязывает» стоимость лицензий к количеству физических ядер в системе, так что и младшие модели имеют смысл, несмотря на кажущуюся относительную несерьезность.

Кроме моделей процессоров, рассчитанных на двухсокетные системы, AMD также выпустила специальные версии Epyc и для конфигураций серверов с одним разъемом для CPU, они отличаются буквой P в конце названия модели. Выделим также и то, что процессорный разъем для процессоров Epyc 7000 будет использоваться и для серверных моделей следующего поколения, которые еще только разрабатываются. Это удешевит последующий апгрейд, позволяя нарастить количество ядер и их частоту простой заменой CPU на более новые модели. Уже сейчас известно о подготовке следующих поколений Epyc (кодовые имена Rome и Milan), основанных на 12-ядерных кристаллах, которые планируется производить по 7 нм техпроцессу.

Получается, что по количеству вычислительных ядер на один процессорный разъем у Epyc есть преимущество перед Intel Xeon, пусть и не слишком большое. Впрочем, мы сравниваем решения AMD лишь с текущим поколением серверных процессоров Xeon, а что будет в будущем — еще неизвестно. Хотя, судя по неофициальным утечкам о следующем поколении Intel Xeon, решения AMD вполне могут продолжить иметь преимущество по количеству вычислительных ядер. Но не забываем, что общая производительность зависит не только от количества CPU-ядер, но и многих других факторов.

Основа в виде поддержки 8 каналов DDR4 и 128 линий PCIe для всех моделей CPU является одним из явных преимуществ Epyc перед конкурирующими решениями Intel Xeon в их текущем виде. Возможности по подключению периферии по PCIe и поддержка широкой шины памяти даже у дешевых моделей Epyc не просто не уступают лучшим предложениям Intel, но Epyc даже имеет преимущество по этим параметрам.

Каждый кристалл в Epyc имеет контроллер PCI Express 3.0, поддерживающий два x16 канала, которые можно разбить на необходимое количество менее скоростных (но не более восьми штук), но в двухпроцессорных системах один из них занят шиной Infinity Fabric, а в однопроцессорных все линии PCIe можно вывести для подключения периферии, и набор из каналов x4 или x2 будет полезен для подключения NVMe-накопителей.

Большое количество поддерживаемых линий PCIe позволяет избавиться от лишних чипов-посредников и повысить плотность размещения накопителей в серверах. Многие ожидают 2U-серверов с 24 NVMe-накопителями, что требует поддержки 96 линий PCIe с достаточной пропускной способностью и для всего остального: сетевых контроллеров и т. д. Так что 128 линий PCIe у Epyc тут будут как нельзя кстати, и 96 из них выделить на быстрые накопители вполне возможно. Все это снизит стоимость содержания платформ, требующих большого количества быстрых накопителей.

Все эти преимущества сыграют свою роль и в системах на два процессорных разъема и, тем более, в системах с одним сокетом — AMD быстро смекнула, что тут можно поиметь дополнительный бонус, так как сегмент таких систем составляет примерно четверть от всего количества серверов центров обработки данных в мире. Однопроцессорный сервер на Epyc предложит все 128 линий PCIe, и по этому показателю решения AMD на данный момент просто не имеют конкурентов из стана Intel, как и по максимальному числу ядер на сокет.

Архитектурные решения Epyc

Процессорная архитектура в серверах особенно важна с точки зрения совместимости с программным обеспечением, но по возможностям AMD Epyc практически ничем не уступают Intel Xeon E5, пришедшим на рынок несколько лет назад и являющимися стандартом для одно- и двухпроцессорных серверов. Новые процессоры Epyc имеют такую же x86-совместимую архитектуру и поддерживают большинство расширений системы команд, поэтому переход на них особых проблем доставить не должен.

Процессоры серии Epyc 7000 основаны на той же архитектуре Zen, что и удачные настольные решения, вышедшие под маркой Ryzen. По сути, Ryzen и Epyc используют одинаковые восьмиядерные кристаллы, состоящие из двух четырехъядерных модулей CCX. Просто в Epyc четыре таких кристалла размещены на одной подложке и связаны между собой... правильно, при помощи уже известной нам быстрой шины Infinity Fabric. Таким образом у AMD и получилось до 32 вычислительных ядер (и 64 потоков) на процессор.

Модуль CCX содержит до четырех ядер с выделенной для них кэш-памятью первого и второго уровней (512 КБ на ядро) и общим кэшем третьего уровня (8 МБ). Два CCX-модуля при помощи шины Infinity Fabric и имеют общий контроллер памяти и общий PCI Express хаб. Восьмиядерный кристалл, составленный из двух CCX-модулей, используется во всех процессорах Ryzen и Epyc, он может выполнять 16 потоков и имеет 4 МБ L2-кэша и 16 МБ L3-кэша.

При создании серверных процессоров Epyc используются те же кристаллы, собранные на одной упаковке по четыре. Такой многокристальный подход позволяет минимизировать расходы за счет унификации всех кристаллов, предназначенных для разных рынков. Кроме этого, подобное решение позволяет обойтись сравнительно несложными кристаллами площадью менее 200 мм², в отличие от крупных кристаллов у конкурента, имеющего преимущества в виде собственного передового микроэлектронного производства.

Так как Epyc и Ryzen основаны на одинаковых ядрах архитектуры Zen, мы не будем подробно останавливаться на архитектурных изменениях и преимуществах этой микроархитектуры, которые были рассмотрены нами в других материалах, с которыми и предлагаем ознакомиться. Да и нечего тут особо добавить, ведь главное конкретно по Epyc — как соединены кристаллы между собой и процессоры в разных разъемах, а также новые возможности по безопасности и т. д.

Но если вкратце, то Zen — это полностью новая микроархитектура, позволяющая выполнять четыре целочисленные инструкции за такт и имеющая поддержку многопоточности (исполнение на каждом физическом вычислительном ядре двух потоков) SMT, аналогичную технологии Intel Hyper-Threading.

Микроархитектурные улучшения Zen (включая SenseMI, XFR, Neural Net Prediction, Pure Power, Precision Boost, изменения в кэшировании и т. п.) обеспечили более чем полуторакратный прирост по количеству выполняемых инструкций за такт, по сравнению с ядрами архитектуры предыдущего поколения Bulldozer, по данным компании AMD. Ядра Zen также куда более энергоэффективны и поддерживают дополнительные наборы инструкций.

Серия процессоров Epyc 7000 поддерживает такие стандартные наборы инструкций, как векторные AVX и AVX2, BMI1 и BMI2, AES, SHA1/SHA256, RDSEED, SMAP, а также несколько других, в том числе и эксклюзивных для решений AMD.

Из потенциальных недостатков, по сравнению с будущими решениями конкурента — отсутствие поддержки набора инструкций AVX-512 (который должен появиться в Skylake-SP), но в AMD считают, что оно того не стоит потому, что такая поддержка потребовала бы значительного усложнения вычислительных ядер, а энергоэффективность улучшилась бы незначительно. Да и для параллельных векторных вычислений у AMD есть возможность использования графических процессоров Radeon Instinct.

Если сравнивать микроархитектуру Zen с другими, то в новой заметно улучшили задержки во всем чипе, включая задержки кэш-памяти, которые значительно снизились. По данным компании AMD, задержки в Zen, связанные с кэш-памятью второго и третьего уровней сравнимы или даже чуть лучше задержек архитектуры Intel Broadwell и обе они, конечно же, значительно опережают предыдущее поколение микроархитектуры Bulldozer.

Еще одним важным преимуществом Epyc является то, что это не просто CPU, а целая однокристальная система (System-On-Chip, SoC). Кроме вычислительных ядер и контроллеров памяти, каждый чип Epyc включает и различные контроллеры: четыре порта USB 3.0, генератор частот, два порта SMBus, шесть I2C, таймеры, прерывания и др. Встроенная чипсетная функциональность означает, что новые процессоры AMD могут обходиться без отдельного чипсета, устанавливаемого на системную плату — это даст возможность уплотнить их дизайн и удешевить конечные решения.

В современных центрах обработки данных основными факторами являются энергоэффективность и гибкое управление энергопотреблением. Чтобы улучшить эффективность и снизить энергопотребление, компания AMD внедрила в Epyc ряд технологий, включая динамическое изменение частоты и напряжения, основанные на температуре и загрузке процессорных ядер.

Умные алгоритмы энергоэффективности стараются распознать, чувствительна ли к задержкам текущая нагрузка, и снижают частоту ядра по возможности для оптимизации производительность в расчете на ватт потребления энергии. Процессоры Epyc также имеют линейное регулирование питания отдельно по ядрам. Каждое из 32 ядер, размещенных в четырех кристаллах на чипе, может работать при собственном напряжении и частоте, если это необходимо, исходя из нагрузки и других условий.

Питание линий ввода-вывода на процессорах серии Epyc 7000 также масштабируется с использованием динамического изменения ширины линий. Полная пропускная способность между сокетами нужна не всегда и соединения PCIe между сокетами могут динамически отключаться. Одна эта функция способна повысить общую энергоэффективность до 8% на процессорный разъем.

Шина Infinity Fabric

Каким образом AMD удалось поместить в один CPU столько ядер и не потерять в производительности? Они сделали не единый монолитный CPU, огромный по размеру и очень сложный в производстве, а разделили ядра на четыре части, соединив их между собой скоростными линиями передачи данных. Использование нескольких кристаллов в одном чипе позволяет избавиться от ограничений закона Мура, снизить себестоимость продукции и увеличить количество ядер в CPU для центров обработки данных. Но для этого нужна быстрая передача данных между отдельными кристаллами, и именно о ней мы сейчас и поговорим.

Шина для передачи данных между блоками CPU или между различными кристаллами под названием Infinity Fabric уже известна нам по предыдущим решениям компании, включая настольные процессоры Ryzen. Главным преимуществом этой шины является универсальность, так как она объединяет не только блоки внутри ядра, но и между ними, и даже между сокетами.

Собственно, на создание Infinity Fabric компанию сподвигло желание сменить подход к созданию мощных чипов (не только CPU, мы ожидаем широкого использования шины и в APU и GPU). Политика отхода от создания крупных и дорогих кристаллов к нескольким менее сложным, но соединенным быстрой шиной, вполне себе имеет смысл, к ней пришла AMD и могут присмотреться и другие производители. Вместо проектирования одного сверхсложного кристалла, они решили сделать быстрые соединения между мелкими, размещенными на одной подложке, что дает возможность увеличения производительности и эффективности сравнительно малой кровью. Для этого потребовалась масштабируемая и эффективная шина с низкими задержками, способная связать CPU и GPU ядра, а также другие блоки в их процессорах, этой шиной и стала Infinity Fabric.

Infinity Fabric состоит из двух основных элементов: масштабируемой управляющей структуры и масштабируемой структуры данных. Управляющая структура содержит блоки управления с небольшими удаленными блоками, размещенными в разных модулях SoC. Масштабируемая структура данных оснащена общей шиной с низкими задержками и когерентной шиной Hyper Transport Plus, многопроцессорной и многокомпонентной. Infinity Fabric — главный элемент Epyc, который используется для соединения четырех 8-ядерных кристаллов на одной подложке, также он связывает и процессорные разъемы.

Все ядра каждого из пары процессоров Epyc 7000 в двухпроцессорной системе связаны друг с другом при помощи Infinity Fabric. Соединения между ядрами полностью когерентны в пределах сокета и оптимизированы для низких задержек и малого энергопотребления. Пропускная способность каждой из двунаправленных связей между ядрами на кристалле равна 42 ГБ/с, что в общем составляет 170 ГБ/с. Двунаправленные каналы между сокетами обеспечивают пропускную способность до 38 ГБ/с и в общем до 152 ГБ/с.

Каждое ядро внутри кристалла подключено к каждому из других трех собственным каналом, и каждый кристалл в CPU подключен к аналогичному кристаллу в другом процессорном разъеме, поэтому между любыми из восьми кристаллов двухпроцессорной системы есть связь при помощи одного (если ядра в пределах сокета) или двух каналов — внутреннего и внешнего. Такое решение дополнительно увеличивает задержки при связи между разными вычислительными ядрами (напомним, что восьмиядерный кристалл Zen уже и так состоит из пары четырехъядерных модулей CCX), но в AMD утверждают, что максимально оптимизировали связи для снижения задержек — но это можно проверить только опытным путем.

Восемь каналов памяти, поддерживаемых процессорами серии Epyc 7000, состоят из двух каналов памяти на кристалл — всего есть четыре кристалла на подложке и каждый из них обслуживает два канала — так и получается восемь каналов памяти. Infinity Fabric соединяет все кристаллы и память вместе в единый пул памяти с общей пропускной способностью до 171 ГБ/с.

Подсистема памяти при такой хитрой конструкции процессоров получается с неравномерным доступом, и задержки доступа к памяти в системах Epyc будут отличаться, в зависимости от того, к какому кристаллу подключена та область памяти, к которой обращается вычислительное ядро. Ну а для того, чтобы многокристальный процессорный модуль работал быстро, компания AMD как раз использует высокоскоростную шину Infinity Fabric.

Пиковые характеристики шины Infinity Fabric приведены для конфигурациям с памятью стандарта DDR4-2666, так как пропускная способность шины зависит от частоты работы памяти. Именно поэтому AMD рекомендует использовать максимально быструю память в серверных системах. Кроме этого, Infinity Fabric обслуживает вовсе не только доступ к памяти, но и передачу данных между контроллерами (PCIe, SATA), между кэшами и т. д. Вообще, можно смело говорить о том, что шина Infinity Fabric — главное нововведение в Epyc, именно она и позволила объединить несколько кристаллов в единое целое.

Подводя итог, еще раз повторим, что в двухпроцессорной системе есть четыре двунаправленных канала между каждым ядром каждого процессора и еще четыре двунаправленных канала между процессорами в разных сокетах. Подобная схема внутренних и внешних соединений позволяет компании AMD использовать один и тот же 8-ядерный кристалл во всех выпускаемых процессорах: Ryzen, Ryzen Pro, Threadripper и Epyc. Неплохой метод оптимизации издержек, надо сказать. Лишь бы это не вышло боком в каких-то задачах, требующих активного обмена данными между всеми ядрами системы.

Из дополнительных плюсов — высокий уровень выхода годных кристаллов у процессоров AMD с архитектурой Zen. По слухам, более 90% кристаллов идут в дело. Использовать кристаллы с дефектами помогает скоростной интерфейс Infinity Fabric, и продукцию с недостатками в работе систем ввода-вывода компания использует в неких заказных системах. И так как процессоры серий Epyc и Threadripper содержат по несколько компактных кристаллов, то и прибыль у AMD должна получиться весьма неплохой, что сейчас для них жизненно необходимо. Кроме этого, в случае необходимости, можно еще больше снизить розничные цены, сделав их еще более привлекательными.

Новая функциональность

Провайдеры облачных сервисов, на которых во многом ориентированы процессоры Epyc, предъявляют специфические требования к архитектуре систем и процессоров, и, кроме самой по себе производительности, они также весьма заинтересованы в повышении безопасности и улучшении работы виртуализации. Именно поэтому в AMD решили дать им расширенные возможности в этих сферах. В частности, в состав серверных процессоров Epyc включен сопроцессор, отвечающий за вопросы безопасности — Secure Processor. Это отдельный блок в составе однокристальной системы, который обеспечивает аппаратную поддержку специальных функций: шифрования и проверки подлинности информации.

Самая важная функция современного процессора безопасности AMD — новая технология Secure Memory Encryption (SME), которая разработана для защиты памяти от несанкционированного доступа. Это полностью аппаратное шифрование данных в памяти, которое позволяет хранить все данные в памяти в зашифрованном виде, чтобы противостоять атакам злоумышленников. Именно из-за применения выделенного сопроцессора, включение шифрования памяти сказывается на производительности незначительно.

Главная особенность решения AMD — полная «прозрачность» аппаратного шифрования памяти для приложений, и их не нужно модифицировать никоим образом, как это приходится делать на других решениях. Также очень важно, что шифрование добавляет сравнительно небольшие задержки доступа к памяти (специалисты AMD говорят о 7 нс) и общая потеря в производительности (речь уже о пропускной способности) составляет не более пары процентов, что весьма неплохо.

Шифрование данных в памяти особенно важно для задач виртуализации, ведь каждая виртуальная машина может защищать данные от других виртуальных машин — эта возможность может открыть сферы применения виртуализации в задачах, сверхтребовательных к вопросам безопасности. Все это позволяет сделать технология SEV (Secure Encrypted Virtualization) — виртуализация изолированных виртуальных машин.

Если продолжать разговор о виртуализации, то в Epyc был также внедрен набор современных функций виртуализации, что позволит потенциальным пользователям легко перейти на них с решений Intel. Также AMD добавила в новые серверные процессоры несколько собственных расширений системы команд: дополнительные инструкции для алгоритмов шифрования и безопасности (RDSEED, AES и SHA) и специальные команды для управления собственными аппаратными возможностями: кэшированием, доступом к памяти и т. п.

Предварительная оценка производительности

Главным преимуществом Epyc могут стать даже не впечатляющие характеристики и интересная новая функциональность, а лучшее соотношение производительности и цены. AMD традиционно придерживается агрессивной ценовой политики, как она это делает и на рынках настольных CPU и GPU. По оценкам специалистов компании, процессоры Epyc обеспечивают преимущество в производительности перед аналогичными Xeon (поколения Broadwell-EP) до 40%-70% — в основном, за счет большего количества вычислительных ядер.

Например, компания AMD сравнивает топовую модель Epyc 7601 с конкурирующей моделью Intel Xeon E5-2699A V4 (конечно, это представитель устаревшей архитектуры Broadwell, но так как у Intel архитектурно поменяется не слишком многое, похоже, то новые CPU AMD должны будут продолжить неплохо конкурировать и со Skylake).

Сравнения, предоставленные компанией AMD, говорят о том, что серия процессоров Epyc 7000 имеет лучшее соотношение производительности и потребления. Системы на основе новых процессоров AMD потребляют меньше энергии, по сравнению с аналогичными серверами на основе процессоров Intel Xeon E5 v4 (текущее поколение Broadwell) — экономия энергии составляет порядка 12%-22%.

Что касается энергоэффективности в целом, то тут оценки AMD еще более впечатляющи, они получили преимущество двухпроцессорной системы на паре Epyc 7601 над двухпроцессорной же системой на базе Intel Xeon E5-2699A в 1,54 раза для целочисленных вычислений и 1,76 — для вычислений с плавающей запятой. Конечно, не нужно забывать, что это — данные одной из заинтересованных сторон, и они могут быть (и, скорее всего, так и есть) слегка завышенными, скажем так. Речь не идет об откровенном обмане, конечно же, исключительно о чуть более выгодных условиях для себя.

Можно было бы сказать, что AMD сравнивает не то и не с тем, но ведь эта модель Xeon является 22-ядерным чипом, работающим на турбо-частоте в 3,6 ГГц, и является одним из самых мощных серверных процессоров Intel в семействе Xeon E5 v4, предназначенном для двухпроцессорных серверов.

Посмотрим и на другие сравнения AMD, которые они показали публике. Если смотреть на различные ценовые сегменты, то серия Epyc 7000 смотрится на уровне систем на основе Xeon очень сильно. Во всех однопроцессорных и двухпроцессорных конфигурациях и ценовых сегментах от $475 до более чем $4000, компания AMD заявила о явном преимуществе в производительности у Epyc перед Xeon — превосходство варьируется от весомых 21% до невероятных 70%, с наибольшим успехом в самых популярных и массовых сегментах от $600 до $1100.

Естественно, все это справедливо не только для CPU, предназначенных для двухпроцессорных систем, но и однопроцессорных моделей. Которые, по мнению AMD, обеспечивают лучшее соотношение цены и производительности даже по сравнению с двухпроцессорными системами на базе Xeon!

Кроме представленных выше слайдов, на мероприятии, посвященном запуску Epyc, специалисты компании AMD также показали несколько демонстрационных стендов с реальными приложениями, в которых можно ощутить преимущество Epyc.

Несколько вычислительных и «накопительных» стендов показывали преимущество систем на основе Epyc в вычислительной производительности, большей пропускной способности и более богатых возможностях по сравнению с аналогичными системами на Intel.



На демонстрациях показывали NVMe-хранилища, более высокую производительность памяти и вычислений в задачах аэродинамики и виртуальной реальности, более быструю компиляцию Linux, поддержку большего количества виртуальных машин на сервер, функции безопасности и т. д.

Естественно, сделано это было скорее в режиме шоу, но как еще можно оценить преимущество серверных систем? К слову, серверные стойки со всеми демо-стендами на основе Epyc и Xeon тихо стояли в сторонке — так что все показанное в демонстрационных стендах железо и ПО работало по-настоящему, в реальности.

Экосистема и партнеры

В мероприятии по запуску процессоров Epyc участвовало большое количество компаний-партнеров AMD. Многие из них тут же предлагали посмотреть на готовые серверы или компоненты, среди которых были как однопроцессорные, так и двухпроцессорные системные платы, так и готовые решения, в том числе двухпроцессорные серверы с 32 разъемами для памяти, заполненными модулями DDR4 — такое решение даст большой общий объем памяти и высокую пропускную способность.

Принятие рынком Epyc будет зависеть в том числе и от успешности вывода продукта компанией AMD и ее партнерами по экосистеме. Среди поддержавших запуск Epyc компаний были известные производители аппаратных и программных решений, такие как Asus, HPE, Gigabyte, Supermicro, Tyan, Dell/EMC, Microsoft и другие. Многие из них также выступали публично на сцене и в целом выражали явный оптимизм по поводу светлого будущего новых серверных процессоров AMD, сравнивая их с решениями конкурента:

На мероприятии, посвященном выходу новых процессоров, даже была организована специальная выставка с готовыми изделиями, среди которых были решения большинства поддержавших AMD партнеров, хоть и в разной степени готовности и открытости для обзора дотошных участников мероприятия:



О поддержке серверных продуктов AMD и выпуске решений на их основе сообщили такие крупные производители, как Asus, Dell EMC, HPE, Inventec, H3C, Lenovo, Gigabyte, Supermicro, Sugon, Tyan и Wistron. HPE представила системы серии Cloudline (CL3150), оценив заодно и преимущества Epyc перед процессорами Intel, в Dell EMC подготовили на базе новых процессоров AMD односокетный сервер 14G PowerEdge, хоть и пока что не показывали его вживую.



Также Epyc широко поддержали и провайдеры облачных сервисов, такие как Baidu и Microsoft Azure — они уже работают над соответствующими решениями и готовятся стать провайдерами облачных услуг на основе серверов, в составе которых находятся новые процессоры AMD.

Многие крупных компании показывали практически готовые к производству и поставке решения уже на запуске новых серверных процессоров Epyc, вот решения HP и Inventec, явно рассчитанные для разных применений:



Нельзя не отметить активность компании Supermicro, которая показала на мероприятии несколько моделей серверов на базе Epyc, которые серьезно отличаются друг от друга и предназначены для различных рыночных сегментов:

Для примера можно взять 2U-сервер из четырех систем, в каждую из которых можно поставить по два 32-ядерных процессора Epyc (или по одному, в зависимости от потребностей клиента):

Или 1U-решение, рассчитанное на установку десятка NVMe-накопителей:

Компания Supermicro вообще проявила значительную активность и в выступлении на мероприятии AMD, представив свои решения и указав на явные преимущества нового CPU, по сравнению с Intel Xeon в виде рекордной производительности:



Еще одним важным преимуществом процессоров AMD является поддержка односокетных систем, в отличие от большинства решений конкурента, имеющих двухсокетный дизайн. Системы с одним процессором предложат пользователям достаточно большое количество вычислительных ядер, поддержку 2 ТБ быстрой памяти и целых 128 линий PCI Express, которые можно использовать для различных целей. Например, вот один из однопроцессорных 1U серверов на Epyc (отдельное внимание обратите на размер платы):

А ведь производительности даже однопроцессорных систем будет для многих вполне достаточно и она превысит быстродействие некоторых двухпроцессорных конфигураций на Intel Xeon при явных преимуществах Epyc по цене, физическому размеру, возможностям и энергоэффективности.

Выводы

Серверные CPU — очень сложный рынок, и хотя во времена 64-битных процессоров Opteron у AMD была довольно большая его доля, затем они почти все потеряли, столкнувшись с мощнейшей машиной Intel, имеющей куда большие возможности и для разработок и для производства и для продвижения. Увы, но компания AMD не могла ничего противопоставить удачной микроархитектуре Intel Core очень долгое время. Но выход новых процессоров Epyc вполне может вернуть компанию в число сильных игроков в том числе и на этом рынке.

Официальный запуск Epyc получил широкую поддержку со стороны партнеров, формирующих экосистему, которая необходима для продвижения на серверном рынке. И это дает нам повод для оптимистичного настроя, тем более, что и в AMD настроены по-боевому. Президент AMD Лиза Су видит первой целью получение как минимум 10% доли серверного рынка для своей компании, но добиваться даже такой цели придется долго, ведь конкурент у них очень сильный.

Очень важно, насколько успешно новые процессоры AMD будут работать в приложениях для центров обработки данных, особенно в сфере Software as a Service (SaaS), в облачных решениях, аналитике больших объемов данных, задачах искусственного интеллекта и т. д. — именно на этих рынках архитектура Zen может «взлететь», что называется. Долгие годы применение в ЦОД требовало не только мощных вычислительных ресурсов, но и больших объемов памяти и огромных хранилищ. Теперь же все чаще применяются специализированные ускорители вроде графических процессоров Radeon Instinct, которые играют все более важную роль в ЦОД. Преимущество Epyc по богатым возможностям подключения (большое количество линий PCIe) по сравнению с решениями Intel приведет к появлению более гибких и сбалансированных конфигураций серверов, особенно в однопроцессорных системах.

Практически все модели Epyc выглядят конкурентоспособно, а уж процессоры, предназначенные для систем с одним сокетом, так и вовсе могут стать лучшими для определенных применений, которым достаточно 32 вычислительных ядер, но нужно много быстрой памяти и подключенных накопителей, к примеру. Да и двухпроцессорные модели вполне могут завоевать весомую часть рынка благодаря своему отличному соотношению цены, производительности и функциональности (не забываем о новых возможностях, вроде аппаратного шифрования памяти и расширенной поддержки виртуализации). Рыночный успех Epyc может случиться даже еще лучшим, чем у десктопных Ryzen, просто потому, что в жизни обычного пользователя не так уж много задач, где можно легко почувствовать разницу между 4, 6 и 8 ядрами, а вот в серьезных применениях таких задач куда больше.

Немаловажно и то, что AMD имеет в своем арсенале все основные «кирпичики» для построения современных платформ ЦОД, включая CPU и мощные GPU (хотя у Intel тоже есть свое решение в виде Xeon Phi). Графические процессоры используются в вычислительных системах все чаще и тесная интеграция Epyc и Radeon Instinct может сыграть на руку компании AMD. Похоже, что у них есть все возможности для того, чтобы вернуться на рынок центров обработки данных и вернуть компанию в число сильных игроков даже по сравнению с сильной Intel. И если у них получится отжать у конкурента хотя бы несколько процентов рынка, то это уже будет несомненным успехом просто потому, что AMD необходимы существенные финансовые успехи.

Конечно, не все эксперты разделяют такой оптимизм по поводу перспектив серверных процессоров AMD Epyc, и у них есть на это свои доводы. Многокристальная компоновка обязательно скажется в некоторых применениях, требующих высокой пропускной способности памяти, а NUMA все же хуже прямого доступа. Также, сравнение Epyc с решениями компании Intel смотрится оптимистично сейчас, до выпуска процессоров Skylake-EP (предположительно — в третьем квартале этого года), а новые модели конкурента точно изменят расстановку сил на рынке. Но не факт, что на успех AMD все это повлияет слишком сильно, ведь у них есть явное преимущество как минимум по соотношению цены и производительности, которое они вряд ли упустят по объективным причинам. Скорее, это именно компании Intel придется снижать цены на свои серверные процессоры, чтобы противостоять AMD Epyc.

Кроме этого, при необходимости, модельная линейка Epyc может быть расширена за счет появления модификаций с другим сочетанием числа ядер, частот, TDP, а может и каких-то других параметров, ведь серверные процессоры AMD легко масштабируются. На день анонса компания объявила о доступности четырех старших (двухпроцессорных) моделей Epyc, а остальные будут доступны уже к концу июля, в том числе и все односокетные модели.

Только время покажет, насколько хорошим будет семейство серверных процессоров Epyc 7000 и окупятся ли для AMD все труды по его созданию. С теоретической точки зрения все очень неплохо, но для того, чтобы сделать окончательные выводы, нужно еще посмотреть на производительность в критически важных приложениях, используемых в ЦОД по всему миру. Процессоры Epyc уже поставляются партнерам по экосистеме, и AMD несколько раз отметила, что Epyc стали доступны со дня публичного анонса. Вот и подождем, когда они массово появятся у тех, кто использует подобные CPU, и они опробуют их на практике. Но то, что мы видели на бумаге и в демонстрациях самой AMD, весьма впечатляет и говорит о том, что Epyc получились удачными.

6 июля 2017 Г.

AMD Epyc:

AMD Epyc

AMD , Ryzen, . , Apple iMac MacBook Pro Radeon, Microsoft Xbox One X AMD. Ryzen , Threadripper .

, AMD , CPU-? , , , , Ryzen , , CPU . AMD, Epyc (), — .

, Epyc, Zen, , AMD . Ryzen, , CPU , , - , , . .

AMD Zen Epyc. , Epyc, , , , . Zen , Epyc — , , , - .

AMD Epyc 64 CPU- 128 , 2 128 PCIe, CPU. , , . , AMD Epyc.

AMD

CPU Intel, AMD , , . Epyc 7000 , DDR4- 2 , .

, Epyc DDR4- 2666 128 PCI Express, : GPU, . .), , , .

CPU, 8 32 Zen 16 64 . AMD 2,0-2,4 , - — 2,7 3,2 . TDP 155 ( 180 ), Epyc 7251 TDP 120 .

Epyc , 128 PCIe DDR4- 2666 2 . , 2 4 — .

TDP ( ) DDR4- Infinity Fabric. TDP DDR4-2666, 155 . , , , DDR4-, 2666 , 128 PCI-E, , Xeon .

AMD Epyc 7601 32 64 , — Epyc 7251 « » 8 , , . AMD $475, 32- Epyc 7601 — $4200. , () , «» , , .

, , AMD Epyc CPU, P . , Epyc 7000 , . , CPU . Epyc ( Rome Milan), 12- , 7 .

, Epyc Intel Xeon, . , AMD Xeon, — . , Intel Xeon, AMD . , CPU-, .

8 DDR4 128 PCIe CPU Epyc Intel Xeon . PCIe Epyc Intel, Epyc .

Epyc PCI Express 3.0, x16 , ( ), Infinity Fabric, PCIe , x4 x2 NVMe-.

PCIe - . 2U- 24 NVMe-, 96 PCIe : . . 128 PCIe Epyc , 96 . , .

, , — AMD , , . Epyc 128 PCIe, AMD Intel, .

Epyc

, AMD Epyc Intel Xeon E5, - . Epyc x86- , .

Epyc 7000 Zen, , Ryzen. , Ryzen Epyc , CCX. Epyc ... , Infinity Fabric. AMD 32 ( 64 ) .

CCX - (512 ) (8 ). CCX- Infinity Fabric PCI Express . , CCX-, Ryzen Epyc, 16 4 L2- 16 L3-.

Epyc , . , . , 200 ², , .

Epyc Ryzen Zen, , , . , Epyc — , . .

, Zen — , ( ) SMT, Intel Hyper-Threading.

Zen ( SenseMI, XFR, Neural Net Prediction, Pure Power, Precision Boost, . .) , Bulldozer, AMD. Zen .

Epyc 7000 , AVX AVX2, BMI1 BMI2, AES, SHA1/SHA256, RDSEED, SMAP, , AMD.

, — AVX-512 ( Skylake-SP), AMD , , , . AMD Radeon Instinct.

Zen , , -, . AMD, Zen, - Intel Broadwell , , Bulldozer.

Epyc , CPU, (System-On-Chip, SoC). , Epyc : USB 3.0, , SMBus, I2C, , . , AMD , — .

. , AMD Epyc , , .

, , . Epyc . 32 , , , , .

- Epyc 7000 . PCIe . 8% .

Infinity Fabric

AMD CPU ? CPU, , , . , CPU . , .

CPU Infinity Fabric , Ryzen. , , , .

, Infinity Fabric ( CPU, APU GPU). , , , AMD . , , , . , CPU GPU , , Infinity Fabric.

Infinity Fabric : . , SoC. Hyper Transport Plus, . Infinity Fabric — Epyc, 8- , .

Epyc 7000 Infinity Fabric. . 42 /, 170 /. 38 / 152 /.

, CPU , ( ) — . (, Zen CCX), AMD , — .

, Epyc 7000, — — . Infinity Fabric 171 /.

, Epyc , , , . , , AMD Infinity Fabric.

Infinity Fabric DDR4-2666, . AMD . , Infinity Fabric , (PCIe, SATA), . . , , Infinity Fabric — Epyc, .

, , . AMD 8- : Ryzen, Ryzen Pro, Threadripper Epyc. , . - , .

— AMD Zen. , 90% . Infinity Fabric, - . Epyc Threadripper , AMD , . , , , .

, Epyc, , , , . AMD . , Epyc , — Secure Processor. , : .

AMD — Secure Memory Encryption (SME), . , , . - , .

AMD — «» , , . , ( AMD 7 ) ( ) , .

, — , . SEV (Secure Encrypted Virtualization) — .

, Epyc , Intel. AMD : (RDSEED, AES SHA) : , . .

Epyc , . AMD , CPU GPU. , Epyc Xeon ( Broadwell-EP) 40%-70% — , .

, AMD Epyc 7601 Intel Xeon E5-2699A V4 (, Broadwell, Intel , , CPU AMD Skylake).

, AMD, , Epyc 7000 . AMD , Intel Xeon E5 v4 ( Broadwell) — 12%-22%.

, AMD , Epyc 7601 Intel Xeon E5-2699A 1,54 1,76 — . , , — , (, , ) , . , , .

, AMD , Xeon 22- , - 3,6 , Intel Xeon E5 v4, .

AMD, . , Epyc 7000 Xeon . $475 $4000, AMD Epyc Xeon — 21% 70%, $600 $1100.

, CPU, , . , AMD, Xeon!

, , Epyc, AMD , Epyc.

«» Epyc , Intel.



NVMe-, , Linux, , . .

, , ? , - Epyc Xeon — -, .

Epyc - AMD. , , , , 32 , DDR4 — .

Epyc AMD . Epyc , Asus, HPE, Gigabyte, Supermicro, Tyan, Dell/EMC, Microsoft . AMD, :

, , , AMD , :



AMD , Asus, Dell EMC, HPE, Inventec, H3C, Lenovo, Gigabyte, Supermicro, Sugon, Tyan Wistron. HPE Cloudline (CL3150), Epyc Intel, Dell EMC AMD 14G PowerEdge, .



Epyc , Baidu Microsoft Azure — , AMD.

Epyc, HP Inventec, :



Supermicro, Epyc, :

2U- , 32- Epyc ( , ):

1U-, NVMe-:

Supermicro AMD, CPU, Intel Xeon :



AMD , , . , 2 128 PCI Express, . , 1U Epyc ( ):

Intel Xeon Epyc , , .

CPU — , 64- Opteron AMD , , Intel, . , AMD Intel Core . Epyc .

Epyc , , . , , AMD -. AMD 10% , , .

, AMD , Software as a Service (SaaS), , , . . — Zen «», . , . Radeon Instinct, . Epyc ( PCIe) Intel , .

Epyc , , , , 32 , , . , ( , ). Epyc , Ryzen, , , 4, 6 8 , .

, AMD «» , CPU GPU ( Intel Xeon Phi). Epyc Radeon Instinct AMD. , , Intel. , , AMD .

, AMD Epyc, . , , NUMA . , Epyc Intel , Skylake-EP ( — ), . , AMD , , . , Intel , AMD Epyc.

, , Epyc , , TDP, - , AMD . () Epyc, , .

, Epyc 7000 AMD . , , , , . Epyc , AMD , Epyc . , , CPU, . , AMD, , Epyc .