AMD Benchmarkfest в Варшаве: первый взгляд на платформу AMD Spider

Процессоры AMD Phenom, чипсеты AMD 790/770 и видео ATI Radeon HD 3850/3870

На второй день погода заметно улучшилась, впрочем, журналистам было не до прогулок, поскольку их ожидало основное мероприятие Benchmarkfest, собственно, возможность протестировать платформу в сборе.

Разумеется, речь не шла о том, чтобы за неполный рабочий день снять все результаты и составить всестороннее впечатление, тем более, когда одновременно анонсируется и процессор, и видео, и чипсет, причем все компоненты могут похвастаться оригинальными технологиями, достойными персонального внимания и практического исследования.

Впрочем, не исключено, что коллеги из некоторых изданий получили достаточно практических данных, чтобы проиллюстрировать обзоры, вовсе не занимаясь дальнейшим самостоятельным тестированием. Не секрет, что позволить себе роскошь глубоко исследовать тему, пусть даже столь важную, как выпуск платформы во главе с процессором нового поколения, могут лишь действительно крупные издания с большой аудиторией и, как следствие, достаточным штатом сотрудников со своей специализацией. И в получении сэмплов лишь половина проблемы (компании обычно рады предоставить образцы продукции даже самым небольшим СМИ, готовым на самостоятельные исследования), куда более времяемким является процесс «приручения» новых компонентов (не секрет, что с первыми ревизиями BIOS и драйверов нередко приходится изрядно повоевать, чтобы заставить систему пройти весь набор тестов).

Результаты надо уметь снять, чтобы получить достоверную картину (а не иллюстрацию, скажем, активности некоего фонового процесса в операционной системе), наконец, надо банально знать, как организовать условия для сравнительного тестирования, чтобы корректно «вытянуть» на поверхность эффект от той или иной аппаратной «фичи», рекламируемой производителем в качестве принципиального новшества (или убедиться в его непринципиальности). Похоже, многие коллеги воспользовались возможностью прояснить для себя общие вопросы, касающиеся тестирования платформ, под руководством технических специалистов AMD, а некоторые, например, впервые «пощупали» разные конфигурации CrossFire, до полноценного тестирования которых, порою, и у крупных лабораторий руки не доходят. Словом, затея AMD, судя по всему, удалась, традиция собирать журналистов для торжественного анонса основных продуктов существовала и раньше, но очень уместно дать возможность гостям почувствовать себя не пассивными зрителями, а активными участниками.

Мы, разумеется, тоже не сидели, сложа руки, и теперь воспользуемся результатами тестов в дальнейших обзорах.

Но кое-что, пожалуй, следует отметить сразу. В частности, закономерный интерес представляет работа четырех видеокарт в режиме CrossFire. Включается такой режим в драйверах, как и для двух карт, и принципиально работоспособен. Однако, как признают в самой AMD, с текущей версией Catalyst обнаружить ускорение возможно лишь в считанном числе игр, а для демонстрации самого режима были выбраны игра Call of Juarez и пакет 3DMark06. Как обещают, практическую пользу из данного режима в широком спектре игр можно будет извлечь лишь через месяц, с выпуском Catalyst 7.12.

Возможно, более актуальным для пользователей станет режим попарного объединения карт с выводом изображения на два монитора. Разумеется, такой режим требует еще более нетривиальной оптимизации. С другой стороны, зрелищность от игры на нескольких мониторах возрастает существенно, убедиться в этом нетрудно, но до сих пор у пользователей существовал выбор, либо подключить к видеокартам несколько мониторов, либо воспользоваться режимом совместного ускорения изображения на единственном мониторе. Ничего удивительно в том, что активных пользователей такая ситуация может не устраивать, мультимониторные конфигурации уже достаточно распространены.

Поклонники «цифрового дома» могли оценить качество и скорость декодирования HD-контента, впрочем, лишь визуально. Но в измерениях, пожалуй, нет необходимости, стоит ли говорить, что эта задача для платформы Spider даже слишком проста, четырехъядерный процессор (а, тем более, Phenom с его недюжинной производительностью на операциях с плавающей точкой), даже без поддержки видеокарты с блоком UVD, располагает достаточной мощностью для любой активности такого рода. Действительно интересно посмотреть, какой прогресс в вопросах видеодекодирования будет наблюдаться для готовящихся к выпуску чипсетов с интегрированным видео, где также должен появиться блок UVD.

А это стенд с демонстрацией потребляемой мощности для двух CrossFire-систем в следующих конфигурациях: Athlon 64 X2 6400+ и пара Radeon HD 2900 XT (слева) и Phenom 2,4 ГГц с парой Radeon HD 3850 (справа). Запускаем 3DMark06 и видим весьма солидную разницу. В первую очередь, проявляется преимущество 55 нм техпроцесса для GPU на видеокартах, вклад которых в общее потребление, в данном случае, максимальный.

Впрочем, если сравнивать, то корректнее было бы поставить Radeon HD 3870, как примерно равный HD 2900 XT по производительности. Поэтому гораздо любопытнее показались абсолютные величины потребляемой мощности — меньше 300 Вт под нагрузкой для системного блока с мощным процессором и CrossFire, это, разумеется, выше похвал (но для того и затеивалась такая демонстрация), однако и чуть больше 400 Вт для «старой» системы, смеем отметить, не такая уж запредельная величина. Если верить стонам в прессе на тему высокого потребления Radeon HD 2900 XT, можно было бы подумать, что без киловаттного блока, CrossFire на таких картах не соберешь. В действительности, все не так страшно, хотя, конечно, приятно, что прогресс в этом вопросе не заставил себя ждать.

Помимо возможности тестирования, на второй день были назначены технические сессии, на которых можно было подробно ознакомиться с каждым из компонентов платформы. Наши постоянные читатели, разумеется, уже знают, какие нововведения были запланированы для реализации в процессорах Phenom. Давайте посмотрим, что реализовано в результате.

Архитектура процессора с полным правом может называться «расширенной» по сравнению с Athlon 64 X2, во всяком случае, усилия разработчиков были направлены, в первую очередь, на увеличение пропускной способности различных блоков процессорного ядра. Вместо одного 128-битного контроллера памяти в процессоре теперь имеются два 64-битных, которые могут работать как совместно (аналогично схеме в предыдущем поколении процессоров), так и независимо. Режим выбирается в BIOS, а преимущество нового режима должно проявиться в многозадачной среде. Внутренняя шина между контроллером памяти и кэш-памятью удвоилась и стала 128-битной.

Усовершенствованный режим предвыборки должен дополнительно улучшить ситуацию с задержками при обращении к памяти, и без того весьма неплохую у процессоров AMD с интегрированным контроллером памяти. А 32-байтный буфер для команд, поступающих на исполнение, и усовершенствования традиционных технологий предсказания переходов (branch prediction), и исполнение микроопераций «про запас» (out of order execution) направлены на то, чтобы поддерживать вычислительные блоки процессора в оптимально загруженном состоянии.

Операции со стеком очень распространены в программах, но при интерпретации x86-команд работы со стеком в микрооперации процессора до сих пор возникала необходимость в добавлении к каждой такой команде дополнительной микрооперации, модифицирующей значение регистра ESP (указатель на верхушку стека), Phenom самостоятельно следит за текущим положением указателя, а операция обновления значения ESP добавляется в код автоматически перед командами, в которых данный регистр упоминается в явной форме.

Это основное функциональное улучшение архитектуры Phenom — возможность исполнения одной и выборки двух 128-битных SSE-инструкций за такт. Именно это дополнение позволяет нынешним четырехъядерным Opteron, несмотря на меньшие частоты, уверенно одерживать верх над любыми представителями линейки Intel Xeon в задачах с плавающей точкой. Однако, в сравнении настольных процессоров, нас будет интересовать результат в широком спектре приложений, среди которых есть более чувствительные к целочисленной производительности, поэтому AMD предпочитает сравнивать Phenom с равными по частоте процессорами из семейства Core 2 Quad. Что касается дальнейшего усовершенствования механизмов виртуализации, то они тем более интересны в контексте серверных процессоров, нежели настольных.

Шина Hyper-Transport версии 3.0 имеет удвоенную пропускную способность, однако, разные версии процессоров Phenom будут рассчитаны на промежуточные частоты этой шины. Впрочем, пропускная способность этой серверной шины для настольных ПК, даже максимально укомплектованных видеокартами, работающими в режиме CrossFire, выглядит избыточной даже на этих промежуточных частотах. Полная совместимость с Hyper-Transport 1.0 и 2.0 обеспечивается, поэтому новые процессоры можно установить на платы с поддержкой предыдущих версий Hyper-Transport.

Об отличиях второй версии Cool’n’Quiet в режиме динамического управления частотой и напряжением мы уже вскользь упоминали в первой части. Меры по снижению потребления в простое впечатляют не меньше, в частности, в режиме остановки процессорных ядер, отключается питание шины Hyper-Transport и понижается напряжение контроллера памяти, более того, процессор может управлять модулем VRM на плате, отключая «лишние» фазы преобразователя напряжения.

Платформа Socket AM2+, как нетрудно догадаться, является оптимальной для процессоров Phenom с поддержкой DDR2, и до перехода на DDR3 будет выпущено 45 нм семейство, также в расчете на данный разъем. Широкую совместимость между процессорами и платами для разных платформ планируется обеспечить в обещанных рамках.

Нагруженные результатами тестов и теоретическими сведениями журналисты дружно собрались на обозначенную в программе «вечернюю активность». Полчаса на автобусе по узким, и к семи вечера уже почти безлюдным улочкам Варшавы, неожиданно привели нас к весьма оригинальному дискоклубу, помещающемуся в здании, некогда явно производственной направленности.

Внутри все также стилизовано под заводскую дискотеку сугубо советского образца. Вероятно, в AMD справедливо рассудили, что суровые будни тестера способствуют к проведению свободного времени в простой обстановке :)

Ну, что, выпьем за Phenom?




21 ноября 2007 Г.

AMD Spider: Phenom, AMD 790/770 Radeon HD 3850/3870

AMD Benchmarkfest : AMD Spider

AMD Phenom, AMD 790/770 ATI Radeon HD 3850/3870


На второй день погода заметно улучшилась, впрочем, журналистам было не до прогулок, поскольку их ожидало основное мероприятие Benchmarkfest, собственно, возможность протестировать платформу в сборе.

, , , , , , , , .

, , , , . , , , , , , . ( , ), «» ( , BIOS , ).

Результаты надо уметь снять, чтобы получить достоверную картину (а не иллюстрацию, скажем, активности некоего фонового процесса в операционной системе), наконец, надо банально знать, как организовать условия для сравнительного тестирования, чтобы корректно «вытянуть» на поверхность эффект от той или иной аппаратной «фичи», рекламируемой производителем в качестве принципиального новшества (или убедиться в его непринципиальности). Похоже, многие коллеги воспользовались возможностью прояснить для себя общие вопросы, касающиеся тестирования платформ, под руководством технических специалистов AMD, а некоторые, например, впервые «пощупали» разные конфигурации CrossFire, до полноценного тестирования которых, порою, и у крупных лабораторий руки не доходят. Словом, затея AMD, судя по всему, удалась, традиция собирать журналистов для торжественного анонса основных продуктов существовала и раньше, но очень уместно дать возможность гостям почувствовать себя не пассивными зрителями, а активными участниками.

Мы, разумеется, тоже не сидели, сложа руки, и теперь воспользуемся результатами тестов в дальнейших обзорах.

-, , . , CrossFire. , , . , AMD, Catalyst , Call of Juarez 3DMark06. , , Catalyst 7.12.

, . , . , , , , , . , , .

Поклонники «цифрового дома» могли оценить качество и скорость декодирования HD-контента, впрочем, лишь визуально. Но в измерениях, пожалуй, нет необходимости, стоит ли говорить, что эта задача для платформы Spider даже слишком проста, четырехъядерный процессор (а, тем более, Phenom с его недюжинной производительностью на операциях с плавающей точкой), даже без поддержки видеокарты с блоком UVD, располагает достаточной мощностью для любой активности такого рода. Действительно интересно посмотреть, какой прогресс в вопросах видеодекодирования будет наблюдаться для готовящихся к выпуску чипсетов с интегрированным видео, где также должен появиться блок UVD.

А это стенд с демонстрацией потребляемой мощности для двух CrossFire-систем в следующих конфигурациях: Athlon 64 X2 6400+ и пара Radeon HD 2900 XT (слева) и Phenom 2,4 ГГц с парой Radeon HD 3850 (справа). Запускаем 3DMark06 и видим весьма солидную разницу. В первую очередь, проявляется преимущество 55 нм техпроцесса для GPU на видеокартах, вклад которых в общее потребление, в данном случае, максимальный.

Впрочем, если сравнивать, то корректнее было бы поставить Radeon HD 3870, как примерно равный HD 2900 XT по производительности. Поэтому гораздо любопытнее показались абсолютные величины потребляемой мощности — меньше 300 Вт под нагрузкой для системного блока с мощным процессором и CrossFire, это, разумеется, выше похвал (но для того и затеивалась такая демонстрация), однако и чуть больше 400 Вт для «старой» системы, смеем отметить, не такая уж запредельная величина. Если верить стонам в прессе на тему высокого потребления Radeon HD 2900 XT, можно было бы подумать, что без киловаттного блока, CrossFire на таких картах не соберешь. В действительности, все не так страшно, хотя, конечно, приятно, что прогресс в этом вопросе не заставил себя ждать.

Помимо возможности тестирования, на второй день были назначены технические сессии, на которых можно было подробно ознакомиться с каждым из компонентов платформы. Наши постоянные читатели, разумеется, уже знают, какие нововведения были запланированы для реализации в процессорах Phenom. Давайте посмотрим, что реализовано в результате.

Архитектура процессора с полным правом может называться «расширенной» по сравнению с Athlon 64 X2, во всяком случае, усилия разработчиков были направлены, в первую очередь, на увеличение пропускной способности различных блоков процессорного ядра. Вместо одного 128-битного контроллера памяти в процессоре теперь имеются два 64-битных, которые могут работать как совместно (аналогично схеме в предыдущем поколении процессоров), так и независимо. Режим выбирается в BIOS, а преимущество нового режима должно проявиться в многозадачной среде. Внутренняя шина между контроллером памяти и кэш-памятью удвоилась и стала 128-битной.

Усовершенствованный режим предвыборки должен дополнительно улучшить ситуацию с задержками при обращении к памяти, и без того весьма неплохую у процессоров AMD с интегрированным контроллером памяти. А 32-байтный буфер для команд, поступающих на исполнение, и усовершенствования традиционных технологий предсказания переходов (branch prediction), и исполнение микроопераций «про запас» (out of order execution) направлены на то, чтобы поддерживать вычислительные блоки процессора в оптимально загруженном состоянии.

, x86- , ESP ( ), Phenom , ESP , .

Это основное функциональное улучшение архитектуры Phenom — возможность исполнения одной и выборки двух 128-битных SSE-инструкций за такт. Именно это дополнение позволяет нынешним четырехъядерным Opteron, несмотря на меньшие частоты, уверенно одерживать верх над любыми представителями линейки Intel Xeon в задачах с плавающей точкой. Однако, в сравнении настольных процессоров, нас будет интересовать результат в широком спектре приложений, среди которых есть более чувствительные к целочисленной производительности, поэтому AMD предпочитает сравнивать Phenom с равными по частоте процессорами из семейства Core 2 Quad. Что касается дальнейшего усовершенствования механизмов виртуализации, то они тем более интересны в контексте серверных процессоров, нежели настольных.

Hyper-Transport 3.0 , , Phenom . , , , CrossFire, . Hyper-Transport 1.0 2.0 , Hyper-Transport.

Об отличиях второй версии Cool’n’Quiet в режиме динамического управления частотой и напряжением мы уже вскользь упоминали в первой части. Меры по снижению потребления в простое впечатляют не меньше, в частности, в режиме остановки процессорных ядер, отключается питание шины Hyper-Transport и понижается напряжение контроллера памяти, более того, процессор может управлять модулем VRM на плате, отключая «лишние» фазы преобразователя напряжения.

Socket AM2+, , Phenom DDR2, DDR3 45 , . .

Нагруженные результатами тестов и теоретическими сведениями журналисты дружно собрались на обозначенную в программе «вечернюю активность». Полчаса на автобусе по узким, и к семи вечера уже почти безлюдным улочкам Варшавы, неожиданно привели нас к весьма оригинальному дискоклубу, помещающемуся в здании, некогда явно производственной направленности.

Внутри все также стилизовано под заводскую дискотеку сугубо советского образца. Вероятно, в AMD справедливо рассудили, что суровые будни тестера способствуют к проведению свободного времени в простой обстановке :)

, , Phenom?