Xeon-Woodcrest, действительно, быстрее… но только на 7%


Часть 1. О четырехъядерных процессорах и микроархитектурных новшествах

Вторую часть мероприятия Джузеппе Амато начал с демонстрации слайда, весьма нелицеприятного для AMD (который впоследствии даже был исключен из PDF-версии презентации, чем и объясняется его «шпионское» качество в нашем материале):

Пообещав, по ходу действия, его скорректировать в более справедливом ключе. Для чего в первую очередь предстояло навести порядок в конфигурациях, дабы сравнивать «яблоки с яблоками».

Следующим шагом надлежало выяснить приоритеты пользовательских задач, которые для серверного сегмента, в отличие от настольно-домашнего, вовсе не обязательно вписываются в кэш-память, даже такую вместительную, как у новых Xeon.

И здесь в игру вступает такой фактор, как скорость доступа к оперативной памяти. «Спасительный» интегрированный контроллер в сочетании с архитектурой Direct Connect обеспечивает почти двукратное преимущество при доступе к памяти, непосредственно подключенной к тестируемому процессору, и до 19% — в случае удаленного доступа к массивам других процессоров в многопроцессорной системе.

Пропускная способность подсистемы памяти на AMD-платформе также выше и масштабируется с ростом числа процессоров, чего нельзя сказать об интеловской платформе.

В результате можно, при желании, «подобрать» достаточно представительный набор тестов, особенно из категории «научно-производственных» вычислений (HPCC), согласно которым семейство Opteron выиграет у обновленных Xeon за счет платформенных особенностей, несмотря на отставание в чистой производительности ядра процессора. А для серверов, работающих в режиме виртуализации, преимущество Opteron объясняется аппаратной поддержкой механизма разделения памяти за счет все того же интегрированного контроллера.

Новый слайд, «исправленный и дополненный» выглядит так:

И, в общем-то, имеет ровно такое же право на существование, как и любые «сравнения от Intel» (и любой другой компании), напоминая потребителям лишь о том, что даже если какая-то компания очень хочет срочно поправить свои дела и представляет действительно мощный по каким-то отдельным признакам продукт (применительно к данному случаю — с более прогрессивной микроархитектурой), это не означает, что ее конечная продукция магическим образом становится лучшей «для всех» :)

Впрочем, если перейти от сравнения по «двоичному» принципу, и посчитать среднее геометрическое по тестам, новая платформа Intel все же выигрывает у платформы AMD («представленной три года назад!» — добавляет Джузеппе Амато).

Да, на упомянутые в заголовке семь процентов.

Но тут же отыгрывается при сравнении производительности 4-процессорных серверов (вот, в чем причина такой «заботы» о многопроцессорном сегменте в первой части презентации, — отмечаем мы про себя).

Итого, что предлагает AMD для корректного сравнения производительности, если речь идет об оценке «в среднем»?

Использовать по возможности расширенный набор тестов, куда помимо синтетики, измеряющей чистую производительность микроархитектуры процессора (и с этой целью оптимизируемой для «целикового» помещения в кэш-память), войдут и тесты, основанные на приложениях и имитирующих реальные условия работы сервера и реалистичную нагрузку. Звучит, при вполне естественной конъюнктурности (такая позиция на сегодня выгодна для AMD), достаточно здраво.

Следующим пунктом программы надлежало разобраться с энергопотреблением. И, как уже упоминалось, в этом деле «неоценимую помощь» маркетологам AMD оказывает избранный Intel для своей новой платформы стандарт памяти — FBDIMM. Отличающийся от DDR2 не только более высокими задержками при обращении, но и высоким потреблением энергии (по вине управляющей электроники, установленной на каждом модуле). Установки восьми таких модулей вполне достаточно, чтобы покрыть разницу в TDP двух процессоров Opteron по сравнению с двумя Woodcrest.

Надо отметить, что представители AMD в данном случае (да и вообще) не торгуются по поводу способов измерения TDP, которые, как известно, различаются. И также не в пользу Intel. Для процессоров AMD, уровень TDP равен максимальному для худших экземпляров процессоров в массовом производстве (все, что не вписываются в тепловой пакет, отбраковываются). Intel допускает превышение проектного уровня при максимальной нагрузке на процессор. Учитывая, что реальное потребление (и тепловыделение) есть столь же индивидуальная характеристика каждого конкретного экземпляра, как и разгонный потенциал, для потребителя такая позиция означает, с некоторой вероятностью, приобретение процессора, который при максимальной нагрузке будет потреблять (и греться) больше, чем предусмотрено тепловым пакетом. Разумеется, какова именно эта вероятность для каждой модели процессора и степпинга, знают только в самой Intel, но, анализируя официальное определение «TDP по версии Intel», можно предположить, что она находится в пределах 5—20%.

На данном слайде, Джузеппе Амато, не отказал себе в удовольствии сравнить ситуацию с энергопотреблением в нынешних многопроцессорных системах, где со стороны Intel выступает один из немногих «оставшихся в живых» представителей поколения Netburst — Xeon MP на ядре Paxville. Зрелище, как и следовало ожидать, получилось душераздирающее :)

Впрочем, едва ли в обозримом будущем, Intel даст конкуренту шанс столь же сильно оторваться по этому параметру. Так, сравнение готовящихся четырехъядерников демонстрирует лишь простое преимущество, никакого «разгрома». Разумеется, надо учесть, что TDP равным 80 Вт будут располагать лишь относительно низкочастотные модели, у старших моделей уровень достигнет 120 Вт (в чем и состоял пафос претензии AMD насчет увеличения теплового пакета у Intel при переходе к четырехъядерным процессорам). Но потребителей, как известно, больше волнует сравнение моделей из середины линейки.

В многопроцессорном сегменте разница опять существенная. И здесь AMD, похоже, действительно не грозит конкуренция со стороны Intel в ближайший год, в том числе, и по экономичности.

Между прочим, переход на модули FBDIMM, так успешно «подогревающие» сегодня лишь сервера на процессорах последнего поколения от Intel, конечно, состоится и на AMD-платформе. Но только в 2008 году, когда они подешевеют и, надо полагать, будут отличаться от DDR2, по меньшей мере, не худшими характеристиками.

Еще одна иллюстрация темы энергопотребления представляет работу некоего типичного сервера с непостоянной в течение дня нагрузкой и завершает наше подробное знакомство с текущим видением компанией AMD ситуации на серверном рынке.




Дополнительно

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.