AMD Phenom X4 9850: об ошибках устранимых и неустранимых


В предыдущей статье, посвящённой исследованию производительности инженерного образца четырёхъядерного процессора AMD Phenom, нам так и не удалось поставить точку, потому что процессор содержал ошибку, существование которой признала сама AMD. Таким образом, мы могли исследовать производительность Phenom либо в режиме пониженного быстродействия (с патчем в BIOS, отключающим некоторые функциональные блоки), либо без задействования патча, но с потенциально некорректной работой этих самых блоков. И пусть даже тестовый стенд ни разу не завис, а режим работы без патча, по идее, должен был олицетворять реальное быстродействие будущих «исправленных» процессоров, всё равно осталось впечатление некой недосказанности. И вот, в наших руках — AMD Phenom X4 9850 степпинга B3. С исправленной ошибкой, частотой 2,5 ГГц, усовершенствованным встроенным северным мостом, работающим на частоте 2 ГГц, и даже поддержкой ещё не совсем официального стандарта памяти DDR2-1066. Судя по всему, это действительно самое быстрое решение, которое способна выпустить компания AMD на данный момент времени, поэтому сравнение Phenom X4 9850 с процессорами основного конкурента обещает быть интересным. В качестве оппонентов мы взяли 4 процессора Intel архитектуры Core 2, с частотами в районе тех же 2,5 ГГц, на базе старых и новых ядер, двухъядерные и четырёхъядерные. Таким образом, Phenom окажется в довольно тесном окружении всевозможных претендентов на звание прямого конкурента, что, по идее, поможет нам рассмотреть его производительность с должной тщательностью.

Интересующимся техническими подробностями архитектуры нового процессора AMD и сутью обнаруженной в нём ошибки, мы можем посоветовать прочитать выходившие ранее статьи «Детальное исследование платформ с помощью тестового пакета RightMark Memory Analyzer. Часть 15: процессоры AMD Phenom X4» и «Ошибка в процессорах AMD Phenom X4. Влияние «заплатки» AMD на низкоуровневые характеристики процессора и платформы». Здесь же мы лишь перечислим вкратце особенности арзхитектуры ядра Phenom (К10) в сравнении с предыдущей архитектурой AMD (Athlon 64 X2 / K8).

  • Реализация 128-битных (против 64-битных у AMD K8) исполнительных устройств с плавающей точкой (FP);
  • Расширение шины L1-LSU (Load-Store Unit) до 2x128 бит (чтение) и 2x64 бит (запись);
  • Расширение шины L1-L2 кэша ядра процессора до 128 бит;
  • Реализация предвыборки данных в L1-кэш процессора;
  • Наличие объединенного кэша инструкций/данных третьего уровня (L3) эксклюзивной (неинклюзивной) архитектуры, расположенного в интегрированном контроллере памяти и общего по отношению к ядрам процессора;
  • Наличие интегрированного двухканального контроллера памяти (2x64-бит, с возможностью «спаренного» (ganged) либо «распаренного» (unganged) режимов работы), поддерживающего память типа DDR2 и DDR3 (в первых моделях процессоров — только DDR2);
  • Усовершенствованный блок предсказания ветвлений, который теперь в состоянии предсказывать косвенные переходы;
  • Блок Sideband Stack Optimizer, входящий в состав декодера (аналог блока Stack Pointer Tracker в терминах архитектуры Intel Core);
  • Существенно усовершенствованный (ускоренный) механизм исполнения SSE-команд.

Что ж, звучит внушительно. А теперь посмотрим, так ли хорошо это работает, как звучит...

Аппаратное и программное обеспечение

Конфигурация тестовых стендов

CPU Mainboard Memory Video
Intel Core 2 Duo E6600 ASUS Maximus Extreme Corsair CM3X1024-1800C7DIN GeForce 8800 GTX
Intel Core 2 Duo E7200 ASUS Maximus Extreme Corsair CM3X1024-1800C7DIN GeForce 8800 GTX
Intel Core 2 Quad Q6600 ASUS Maximus Extreme Corsair CM3X1024-1800C7DIN GeForce 8800 GTX
Intel Core 2 Quad Q9300 ASUS Maximus Extreme Corsair CM3X1024-1800C7DIN GeForce 8800 GTX
AMD Phenom X4 9850 ASUS M3A32-MVP Deluxe Corsair TWIN2X4096-9136C5DF GeForce 8800 GTX
  • Объём памяти на стендах: 4 ГБ (4 модуля по 1 ГБ)
  • Жёсткий диск: Samsung HD401LJ (SATA-2)
  • Кулеры: Thermaltake TMG i1, Thermaltake TMG A1
  • Блок питания: Cooler Master RS-A00-EMBA
Процессор Phenom X4 9850 Core 2 Duo E6600 Core 2 Duo E7200 Core 2 Quad Q6600 Core 2 Quad Q9300
Название ядра Agena Conroe Wolfdale Kentsfield Yorkfield
Технология пр-ва 65 нм 65 нм 45 нм 65 нм 45 нм
Частота ядра, ГГц 2,5 2,4 2,53 2,4 2,5
Кол-во ядер 4 2 2 4 4
Кэш L1, I/D, КБ* 64/64 32/32 32/32 32/32 32/32
Кэш L2, КБ** 4x512 4096 3072 8192 6144
Кэш L3, КБ 2048
Частота шины***, МГц 533 (1066) 266 (1066) 266 (1066) 266 (1066) 333 (1333)
Коэффициент умножения 12,5 9 9,5 9 7,5
Сокет AM2+ LGA775 LGA775 LGA775 LGA775
Тепловыделение**** 125 Вт 65 Вт 65 Вт 95 Вт 95 Вт

* — в многоядерных процессорах — для одного ядра
** — если указано × x Y, подразумевается «X килобайт на каждое из Y ядер»
*** — у процессоров AMD — частота шины контроллера памяти
**** — у процессоров Intel и AMD указывается по-разному, поэтому сравнивать напрямую некорректно

Программное обеспечение

  64-битное приложение Многопоточное приложение*
Microsoft Windows XP Professional SP2 + +
Microsoft Windows Vista Ultimate SP1 + +
Autodesk 3ds max 9 SP2 + +
V-Ray 1.5 SP1 + +
Autodesk Maya 2008 Ultimate + +
NewTek Lightwave 3D 9.2 + +
SolidWorks 2007 SP0.0 + +
PTC Pro/ENGINEER Wildfire 3.0 M120 +
UGS NX5 5.0.0.25 + +
Wolfram Research Mathematica 6 + +
MapleSoft Maple 11 +
MathWorks MATLAB 2007 + +
Adobe Photoshop CS3 10.0 +
Microsoft Visual Studio 2008 + +
Apache HTTP Server 2.2.8 +
PHP 5.2.5 +
MySQL Community Server 5.0.51a +
ACDSee 10 Photo Manager +
xat.com Image Optimizer 5.10
IrfanView 4.10
XnView 1.93.4
Paint.NET 3.30 + +
7-Zip 4.57 + +
WinRAR 3.71 +
UltimateZip 3.2
FLAC 1.2.1
LAME-MT 3.97 + +
Musepack MPC Encoder 1.16
Nero Digital Audio Encoder 1.1.34.2 +
Ogg Encoder 2.83 (Lancer) +
Canopus ProCoder 3.0 +
DivX Codec 6.8.2 +
XviD Codec 1.1.3 Final
x264 Codec rev 807 +
VirtualDub 1.8.0 +
Call of Duty 4: Modern Warfare (Patch 1.5) +
Call of Juarez (Patch 1.1.0.0) + DX10 Enhancements Pack
Crysis (Patch 1.2) + +
S.T.A.L.K.E.R. (Patch 1.006) +
Unreal Tournament 3 (Patch 1.2) +
Company of Heroes (Patch 1.71) +
World in Conflict (Patch 1.007) +

* — имеется в виду не сам факт порождения процессом более одного потока, а наличие двух или более одновременно активных потоков в процессе выполнения тестов

Тестирование

Необходимое предисловие к диаграммам

Форма представления результатов в используемой нами методике тестирования имеет две особенности: во-первых, все типы данных приведены к одному — целочисленным относительным баллам (производительность рассматриваемого процессора относительно Intel Core 2 Quad Q6600, если скорость последнего принять за 100 баллов), и, во-вторых, подробные результаты приводятся в виде таблицы в формате Microsoft Excel, в статье присутствуют только сводные диаграммы по классам бенчмарков. Тем не менее, иногда мы будем обращать ваше внимание на подробные результаты, если они того заслуживают.

Профессиональная группа тестов

Пакеты трёхмерного моделирования

Первое разочарование не заставило себя ждать: если сравнивать Phenom X4 9850 с теми процессорами Intel, с которыми его, по идее, сравнивать следует (то есть с Core 2 Quad) — то он существенно проигрывает даже Core 2 Quad Q6600, у которого частота на 100 МГц меньше, да и ядро старое (Kentsfield). Ну а до равночастотного Q9300 на новом ядре Yorkfield, Phenom X4 9850 недотягивает аж 13%, что равносильно разгрому (ибо X4 9850 — топовый для своей линейки процессор, а вот про Q9300 этого никак не скажешь).

CAD/CAM пакеты

Несмотря на исправленную ошибку и несколько изменившийся список программного обеспечения для данной группы тестов, обидная тенденция, обнаруженная нами ещё при тестировании инженерного образца Phenom, подтвердилась ещё раз: ядро K10 почему-то совершенно не нравится этому классу программ. В прошлом тестировании Phenom проиграл в данной группе не только многим процессорам Intel, но даже Athlon 64 X2 6000+. Методика тестирования изменилась, версии ПО обновились, добавился ещё один тест, и вот… теперь топовый Phenom проигрывает даже более чем скромному Core 2 Duo E6600, у которого и частота меньше, и ядер всего два. Да, как-то не заладилось у AMD с CAD/CAM. Причём во всех трёх пакетах, используемых нами для тестирования — можете убедиться, взглянув на подробные результаты.

Компиляция

И снова Phenom тест, в общем-то, провалил. Причём провал позорный, потому что на два балла выше расположился двухъядерный процессор Intel с примерно равной тактовой частотой.

Профессиональная работа с фотографиями

Ну хоть что-то: в Adobe Photoshop, как показали наши многочисленные предыдущие тестирования, процессору с большим количеством ядер очень сложно проиграть процессору с меньшим их количеством, и хотя бы с этим немудрящим заданием Phenom X4 9850 справился более-менее успешно: обогнал и Core 2 Duo E6600 и Core 2 Duo E7200. Поддержал, так сказать, общую репутацию своей группы (четырёхъядерников) как хороших процессоров для Photoshop. Но в сравнении с равночастотным Q9300… ну, вы сами видите. Причём если обратится к подробным результатам, ничего утешительного не видно и там: всего мы используем для Adobe Photoshop 7 различных подтестов, и проиграл Phenom в каждом из них.

Научно-математические пакеты

Чудовищно низкий результат обусловлен почти 6-кратным (!) отставанием Pnenom X4 9850 от победителя в данной группе (Q9300) в подтесте Sparse из встроенного бенчмарка MATLAB. Что характерно: в более старой версии MATLAB таких ошеломляюще низких результатов не наблюдалось, а в новой (если чуть-чуть приоткрыть завесу над будущими статьями) таких «проколов» не наблюдается у трёхъядерного Phenom X3! Таким образом, можно предположить, что четырёхъядерность в исполнении AMD каким-то образом конфликтует с некоторыми функциями MATLAB 2007, никаких других логичных вариантов объяснения данного феномена нам в голову не приходит.

Веб-сервер

Впервые — достаточно неплохой результат. Phenom даже удалось выиграть 12% в одном подтесте (Synthetic MySQL) у абсолютного чемпиона в данной группе — Core 2 Quad Q9300. Кстати, если вспомнить прошлое, то Athlon 64 X2 в данной категории тоже были весьма неплохи, так что преемственность ядер сохранилась.

Общий «профессиональный» балл

Очень низкие показатели в группах CAD/CAM и научно-математических пакетов, плюс не очень, прямо скажем, высокие — во всех остальных, и вот — предсказуемый средний балл в классе профессионального ПО. Прямо скажем — совершенно не впечатляющий результат, особенно для процессора, который позиционируется как топовое решение от AMD.

Любительская/домашняя группа тестов

Архиваторы

Вполне бодро, но явно недостаточно. И результаты честно-однопоточного UltimateZip (см. Excel-табличку) наводят нас на грустные мысли о том, что «виноваты» в этом не сложные коммуникации между различными ядрами, а именно вычислительная мощность единичного ядра — более низкая, чем у архитектуры Intel Core.

Кодирование медиаданных

Плохо так, что хуже не придумаешь. Phenom проиграл даже двухъядерному Core 2 Duo E7200 — и это несмотря на то, что в данной подгруппе есть тесты, способные задействовать 4 ядра.

Игры

В играх тоже ничего хорошего.

Любительская работа с фотографиями

А это вообще, простите, позор. Причём, как и ранее, Phenom проигрывает абсолютно во всех подтестах группы. Если сравнивать с чемпионом — от «скромных» 12% до совсем нескромных 32% (то есть, практически, на треть!)

Общий «любительский» балл

Несмотря на кардинальную смену «жанров» программного обеспечения, усреднённый балл демонстрирует потрясающую стабильность: он опять такой же, как у Core 2 Duo E6600. Заметьте — даже не как у E7200…

Предположительное энергопотребление*

* — на самом деле, замеряется не энергопотребление процессора, а энергопотребление VRM на системной плате, поэтому полученные нами значения могут отличаться в большую сторону т.к. КПД VRM не равен 100%.

В состоянии покоя

В состоянии 100% нагрузки

К сожалению, ничего радостного мы не наблюдаем и здесь. И если высокое энергопотребление в состоянии 100% загрузки ещё можно попытаться объяснить «старым» 65-нанометровым техпроцессом и отсутствием опыта проектирования четырёхъядерников (всё-таки Phenom у AMD — «первый блин»), то вот поразительно высокое потребление электроэнергии в состоянии покоя мы объяснить ничем не можем. Однако — факт. Впрочем, по сравнению с процессорами архитектуры Intel Core и предыдущим AMD Athlon 64 X2 было особенно нечем хвастать…

Заключение

91 балл. Одинаковый показатель у AMD Phenom X4 9850 и Intel Core 2 Duo E6600. Эти слова звучат как стук молотка, забивающего гвозди в крышку гроба: топовый четырёхъядерный процессор AMD, вышедший в 2008 году, демонстрирует среднюю производительность, аналогичную стоящему на 14-м месте (!) в официальной линейке Intel двухъядернику (!), выпущенному около 2-х лет назад (три раза «!»). Разумеется, AMD будет играть в привычные игры из серии «зато у нас дешевле!» — что же ей ещё остаётся делать, с такой-то производительностью? Совершенно непонятно другое: ну а что дальше? Ядро K10 получилось откровенно слабым, это уже понятно. Однако оно, к тому же, пошло в массовое производство через несколько лет после Conroe, то есть у Intel есть двойная фора — и по производительности ныне существующего решения, и по времени на разработку нового. Как из этой ситуации будет выходить AMD — непонятно. Но глядя на результаты тестов, хочется горько пошутить, что самая главная (и неустранимая) ошибка в Phenom — это он сам.



Модули памяти для тестовых стендов предоставлены Corsair Memory
Процессор Intel Core 2 Duo E7200 предоставлен компанией Компьютер-центр КЕЙ
Процессор Intel Core 2 Quad Q9300 предоставлен компанией Ф-Центр



Дополнительно

iXBT BRAND 2016

«iXBT Brand 2016» — Выбор читателей в номинации «Процессоры (CPU)»:
Подробнее с условиями участия в розыгрыше можно ознакомиться здесь. Текущие результаты опроса доступны тут.

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.