Intel Wolfdale vs AMD Agena в «чистом» поединке: одно ядро, одна память, одна частота


Мы продолжаем серию исследований, которая призвана продемонстрировать на практике различные не совсем очевидные особенности влияния различных факторов на производительность современных x86-64 процессоров. В данном материале мы попытаемся (насколько это возможно) дать ответ на вопрос о производительности единичного, так сказать «почти в чистом виде» процессорного ядра от двух основных конкурентов. Для этого мы воспользовались функцией BIOS Setup двух плат для платформ LGA775 и Socket AM2+ — Biostar TPower I45 (IP45A-A7P) и ASUS M3A32-MVP Deluxe/WiFi-AP, позволяющей отключать все ядра CPU, кроме одного.



Некоторые, быть может, будут удивлены тому, что мы поменяли тестовую платформу для LGA775, причём на замену ASUS Maximus Extreme была взята более, скажем так, «простая» плата, и отнюдь не на таком топовом чипсете. Прежде всего, это было вызвано желанием обеспечить обоим ядрам максимально одинаковые условия функционирования: плата от BIOSTAR работает с той же памятью стандарта DDR2-800, что и наша стандартная платформа для Socket AM2+. И, кроме того, не последним доводом в пользу одноразовой замены тестовой платформы послужило то, что ASUS Maximus Extreme отключать ядра у Core 2 просто не умеет.



Как видите, условия можно назвать практически равными: работает только одно ядро, полностью совпадают тип, частота и тайминги памяти, частота работы ядра также идентична (для этого, в случае с платформой LGA775, нам пришлось воспользоваться способностью инженерного сэмпла Core 2 Duo E7200 менять коэффициент умножения на произвольный). И здесь у дотошных, но торопливых читателей, может возникнуть вопрос: а как кэш? Ведь у ядра Wolfdale размер L2 (который в данном случае весь достаётся одному ядру) равен 3 МБ, в то время как Agena (это ядро в тестировании представлял Phenom X4 9850 Black Edition) имеет лишь 2 МБ кэша третьего уровня.

Однако, на самом деле, всё не так плохо, как кажется на первый взгляд. Не будем забывать, что в процессорах Intel архитектура кэша неэксклюзивная, таким образом, максимальный объём кэшируемой информации определяется кэшем наибольшего размера. А на платформе AMD кэш эксклюзивный (L3 — адаптивно-эксклюзивный, но при одном ядре он по идее должен вырождаться в просто эксклюзивный), таким образом, максимальный объём кэшируемой информации определяется суммой размеров кэшей всех уровней. В нашем случае она составляет 128 (L1) + 512 (L2) + 2048 (L3) = 2688 КБ. Конечно, даже эта цифра на 13% меньше, чем 3072 КБ L2 у Wolfdale, однако ввиду того, что основные конкуренты не считают нужным договариваться друг с другом об объёмах кэшей, чтобы облегчить нам задачу, мы будем считать расхождение в 13% наименьшим из возможных зол.

Некоторые, возможно, скажут, что для достижения действительно идеальной ситуации, следовало бы отключить L2/L3-кэш. Спорная позиция. Во-первых, это нежизненная ситуация — никто не работает на современных x86-64 процессорах с отключенным L2-кэшем. Во-вторых, как раз в этом случае ядро AMD получило бы очень серьёзное преимущество, так как L1-кэш ни на одном процессоре отключить невозможно (по крайней мере, штатными средствами BIOS Setup), а размер L1-кэша у Agena ровно в два раза больше, чем у Wolfdale.

Тестирование

Как и всегда в подобных случаях, нас интересуют, в том числе результаты конкретных приложений, поэтому мы снова заменили диаграммы таблицами, а виртуальные баллы «сырыми» результатами тестов. В графе «Преимущество» указано преимущество ядра Wolfdale над Agena в процентах (ибо это самая частая ситуация). Соответственно, в тех случаях, когда Agena всё выигрывает, значение будет отрицательным, и, ввиду чрезвычайной редкости подобной ситуации, оно будет выделено жирным шрифтом и красным цветом.

Пакеты трёхмерного моделирования

 WolfdaleAgenaПреимущество
3ds max   
CPU Render2,592,1024%
Graphics3,613,0618%
Hardware Shaders9,437,4227%
Maya   
GFX2,812,4116%
CPU4,984,0523%
Render0:24:460:23:36
—5%
Lightwave0:16:270:17:286%
Group Score635415%

Как ни странно, рендер-движок Maya явным образом отдаёт предпочтение архитектуре К10. Конечно, решающим преимуществом 5% назвать нельзя, да и вряд ли 5% преимущества в скорости рендеринга перевесят проигрыш в районе 20% в скорости интерактивной работы с тем же пакетом, однако всё-таки мы видим воочию один из очень немногих случаев, когда Agena оказывается впереди. 3ds max однозначно голосует за Wolfdale, Lightwave присоединяется (хоть и с намного меньшим оптимизмом).

CAD/CAM пакеты

 WolfdaleAgenaПреимущество
UGS NX   
Total CPU3,653,359%
Total Graphics1,981,8010%
Pro/ENGINEER   
CPU Related tasks74081210%
Graphics Relatsed tasks883101014%
SolidWorks   
Graphics76,7480,174%
CPU52,3657,7810%
Group Score999110%

Проигрыш K10/Agena во всех без исключения подтестах при средней его величине в районе от 10 до 20 процентов, как мы увидим позднее, является рефреном данного тестирования.

Компиляция

R сожалению, тест на компиляцию у нас пока используется только один, поэтому сопоставлять и сравнивать нечего, остаётся только в очередной раз констатировать проигрыш Agena.

Профессиональная работа с фотографиями

 WolfdaleAgenaПреимущество
Photoshop   
Blur0:15:560:19:3223%
Color0:03:260:04:0619%
Filters0:05:240:06:5829%
Light0:02:560:03:3019%
Rotate0:05:580:06:165%
Sharp0:05:500:07:3229%
Size0:01:200:01:2810%
Transform0:03:080:03:2811%
Group Score574818%

Наименьший проигрыш в подтесте Rotate, видимо, обусловлен тем, что этот подтест сильно зависит от скорости памяти, и встроенный контроллер, видимо, помогает Agena сократить разрыв. В остальном всё довольно печально: по большинству подтестов Wolfdale уверенно выигрывает более 20%, иногда вплотную приближаясь к 30%.

Научно-математические пакеты

 WolfdaleAgenaПреимущество
Maple0,02780,0333—17%
Mathematica   
Internal2,32302,29501%
MMA1,18671,14883%
MATLAB   
LU0,11430,201076%
FFT0,14500,163112%
ODE0,18680,1834—2%
Sparse0,30230,370322%
2D0,29840,363322%
3D0,55490,56392%
Group Score817311%

В Maple ядро Agena ставит свой личный абсолютный рекорд: 17% превосходства над Wolfdale. Это самое большое преимущество, которое смогло продемонстрировать ядро от AMD в нашем тестировании. А MATLAB продолжает удивлять. Один раз он нас удивил, причём именно в комбинации с Phenom, и теперь  — снова, но уже при «одноядерном» тестировании. На этот раз ядро AMD К10 «отметилось» в подтесте LU (декомпозиция матрицы), где с треском проиграла архитектуре Intel Core целых 76%. Понятно, что это опять «какая-то трагическая ошибка» — то ли в библиотеке, то ли в процессоре, то ли ещё где-то, однако подобных феноменов в данном материале будет ещё парочка (причём в самых неожиданных местах), и, честно говоря, нам они успели надоесть…

Веб-сервер

 WolfdaleAgenaПреимущество
PHP Calculator423811%
PHPSpeed   
Synthetic PHP279025728%
Synthetic MySQL239423024%
Synthetic Read/Write181517583%
Real World PHP5069370037%
Real World PHP & MySQL2269143558%
Server184017515%
Group Score806817%

Да, кстати, и второй «феномен» — подтест Real World PHP & MySQL в PHPSpeed. Ядро Agena проиграло почти 60% — и это притом, что в других подтестах мы наблюдаем вполне утешительные 3-4-5%. Вам не кажется, что ситуация, когда всё идёт пусть и не идеально, но более-менее тихо, и вдруг посреди чистого поля зияет глубокий овраг — является достаточно типичной для нынешней реинкарнации этого ядра? Мы имеем по этому поводу свои предположения, но выскажем их позже.

Архиваторы

 WolfdaleAgenaПреимущество
7-Zip0:04:030:04:3513%
WinRAR0:01:480:02:0617%
Ultimate ZIP0:02:120:02:249%
Group Score776813%

В данной группе тестов всё традиционно, можно сказать «стандартный, типичный для Agena проигрыш».

Кодирование медиаданных

 WolfdaleAgenaПреимущество
FLAC0:01:110:01:178%
LAME0:02:590:03:148%
Musepack0:02:070:02:2212%
Vorbis0:04:090:05:2029%
Canopus ProCoder0:06:310:05:52—10%
DivX0:01:500:02:0715%
x2640:09:410:10:5913%
XviD0:07:280:09:2326%
Group Score766812%

Яркое выступление Canopus ProCoder, который однозначно проголосовал за Agena, последнему не помогло, так как остальные семь приложений придерживаются противоположного мнения. Проигрыш Agena более четверти наблюдается в двух кодеках — OGG Vorbis и XviD. Можно заметить, что обоих объединяет принадлежность к open source, однако присутствующие в этом же подтесте open source LAME и FLAC менее радикальны в своих пристрастиях, так что делать из этого совпадения какие-то далеко идущие выводы вряд ли стоит.

Игры

 WolfdaleAgenaПреимущество
Call of Duty 4756319%
Company of Heroes564817%
Call of Juarez48457%
Crysis12,6010,2523%
S.T.A.L.K.E.R.776322%
Unreal Tournament 3443816%
World in Conflict251932%
Group Score655419%

Достаточно стандартная ситуация: проигрыш Agena по всем позициям, начинающийся с утешительных 7% (сильно зависящий от видеокарты Call of Juarez), и заканчивающийся разгромными 32% (как ни странно, не менее 3D-зависимый World in Conflict). Ничего необычного не наблюдается.

Любительская работа с фотографиями

 WolfdaleAgenaПреимущество
ACDSee0:12:440:21:2468%
IrfanView0:18:210:22:5325%
Paint.NET9547312239628%
xat.com Image Optimizer0:37:350:42:2213%
XnView0:21:230:26:2223%
Group Score725530%

Более половины приложений (3 из 5, если быть точным) демонстрируют превосходство ядра Wolfdale над Agena на четверть и более, при этом проигрыш Agena в весьма популярном приложении ACDSee составляет целых 68%! Это третий (и, слава богу, последний) «феномен Phenom», который мы можем наблюдать в данном тестировании. Положительно, автор названия этого процессора продемонстрировал нам весьма своеобразное чувство юмора…

Заключение

 WolfdaleAgenaПреимущество
PRO SCORE766614%
HOME SCORE726118%
OVERALL SCORE746416%

Картина, скажем прямо, печальная. По состоянию на нынешний момент, даже при прочих практически равных условиях, ядро Agena отстаёт от Wolfdale почти везде, причём в наибольшем количестве случаев отставание заслуживает эпитета «существенное» (более 10%). Впрочем, иногда можно заменить этот эпитет утешающим «незначительное» (SolidWorks/Graphics, Photoshop/Rotate, Mathematica, многие подтесты PHPSpeed), а иногда на навевающий тоску «кошмарное» (MATLAB/LU, Real World PHP & MySQL, ACDSee). Последнее, как ни странно, и служит нам поводом для оптимизма.

Давайте вспомним новейшую историю x86-64 процессоров. Страничка AMD Phenom в ней началась с настолько громкого «прокола», какого не бывало со времён знаменитой ошибки в Intel Pentium. О чём это говорит нам в первую очередь? О том, что выпускался процессор второпях, в авральном режиме, и нормального, дотошного тестирования, скорее всего, не прошёл. Потом мы имели возможность наблюдать более чем странное поведение исправленного Phenom при тестировании c помощью функции Sparse в MATLAB, и  сейчас, в однопроцессорном режиме — снова MATLAB, уже с функцией LU, и в придачу PHP+MySQL и ACDSee.

Если быть оптимистом и надеяться на лучшее, то можно предположить, что все эти «феномены Phenom» являются следствием подобных недоработок, пусть и не приводящих к ошибкам, как в случае с пресловутой «ошибкой TLB», но, в частности, существенно снижающих быстродействие. Кстати, с нашей точки зрения, к этой категории «потенциальных странностей» вполне оправданно будет отнести все проигрыши с удельным весом около 25% и более. Исправить эти странности, будем надеяться, можно, что наверняка и попытаются сделать в следующей версии ядра K10. Разумеется, ядром всех времён и народов это его всё равно не сделает (поезд ушёл…), однако сократить «архитектурный» разрыв в производительности до более-менее приличного уровня (скажем, менее 10%) — кто знает, может быть, и удастся.

Модули памяти для тестовых стендов предоставлены Corsair Memory



7 октября 2008 Г.