Intel Wolfdale vs AMD Agena в «чистом» поединке: одно ядро, одна память, одна частота


Мы продолжаем серию исследований, которая призвана продемонстрировать на практике различные не совсем очевидные особенности влияния различных факторов на производительность современных x86-64 процессоров. В данном материале мы попытаемся (насколько это возможно) дать ответ на вопрос о производительности единичного, так сказать «почти в чистом виде» процессорного ядра от двух основных конкурентов. Для этого мы воспользовались функцией BIOS Setup двух плат для платформ LGA775 и Socket AM2+ — Biostar TPower I45 (IP45A-A7P) и ASUS M3A32-MVP Deluxe/WiFi-AP, позволяющей отключать все ядра CPU, кроме одного.



Некоторые, быть может, будут удивлены тому, что мы поменяли тестовую платформу для LGA775, причём на замену ASUS Maximus Extreme была взята более, скажем так, «простая» плата, и отнюдь не на таком топовом чипсете. Прежде всего, это было вызвано желанием обеспечить обоим ядрам максимально одинаковые условия функционирования: плата от BIOSTAR работает с той же памятью стандарта DDR2-800, что и наша стандартная платформа для Socket AM2+. И, кроме того, не последним доводом в пользу одноразовой замены тестовой платформы послужило то, что ASUS Maximus Extreme отключать ядра у Core 2 просто не умеет.



Как видите, условия можно назвать практически равными: работает только одно ядро, полностью совпадают тип, частота и тайминги памяти, частота работы ядра также идентична (для этого, в случае с платформой LGA775, нам пришлось воспользоваться способностью инженерного сэмпла Core 2 Duo E7200 менять коэффициент умножения на произвольный). И здесь у дотошных, но торопливых читателей, может возникнуть вопрос: а как кэш? Ведь у ядра Wolfdale размер L2 (который в данном случае весь достаётся одному ядру) равен 3 МБ, в то время как Agena (это ядро в тестировании представлял Phenom X4 9850 Black Edition) имеет лишь 2 МБ кэша третьего уровня.

Однако, на самом деле, всё не так плохо, как кажется на первый взгляд. Не будем забывать, что в процессорах Intel архитектура кэша неэксклюзивная, таким образом, максимальный объём кэшируемой информации определяется кэшем наибольшего размера. А на платформе AMD кэш эксклюзивный (L3 — адаптивно-эксклюзивный, но при одном ядре он по идее должен вырождаться в просто эксклюзивный), таким образом, максимальный объём кэшируемой информации определяется суммой размеров кэшей всех уровней. В нашем случае она составляет 128 (L1) + 512 (L2) + 2048 (L3) = 2688 КБ. Конечно, даже эта цифра на 13% меньше, чем 3072 КБ L2 у Wolfdale, однако ввиду того, что основные конкуренты не считают нужным договариваться друг с другом об объёмах кэшей, чтобы облегчить нам задачу, мы будем считать расхождение в 13% наименьшим из возможных зол.

Некоторые, возможно, скажут, что для достижения действительно идеальной ситуации, следовало бы отключить L2/L3-кэш. Спорная позиция. Во-первых, это нежизненная ситуация — никто не работает на современных x86-64 процессорах с отключенным L2-кэшем. Во-вторых, как раз в этом случае ядро AMD получило бы очень серьёзное преимущество, так как L1-кэш ни на одном процессоре отключить невозможно (по крайней мере, штатными средствами BIOS Setup), а размер L1-кэша у Agena ровно в два раза больше, чем у Wolfdale.

Тестирование

Как и всегда в подобных случаях, нас интересуют, в том числе результаты конкретных приложений, поэтому мы снова заменили диаграммы таблицами, а виртуальные баллы «сырыми» результатами тестов. В графе «Преимущество» указано преимущество ядра Wolfdale над Agena в процентах (ибо это самая частая ситуация). Соответственно, в тех случаях, когда Agena всё выигрывает, значение будет отрицательным, и, ввиду чрезвычайной редкости подобной ситуации, оно будет выделено жирным шрифтом и красным цветом.

Пакеты трёхмерного моделирования

  Wolfdale Agena Преимущество
3ds max      
CPU Render 2,59 2,10 24%
Graphics 3,61 3,06 18%
Hardware Shaders 9,43 7,42 27%
Maya      
GFX 2,81 2,41 16%
CPU 4,98 4,05 23%
Render 0:24:46 0:23:36
—5%
Lightwave 0:16:27 0:17:28 6%
Group Score 63 54 15%

Как ни странно, рендер-движок Maya явным образом отдаёт предпочтение архитектуре К10. Конечно, решающим преимуществом 5% назвать нельзя, да и вряд ли 5% преимущества в скорости рендеринга перевесят проигрыш в районе 20% в скорости интерактивной работы с тем же пакетом, однако всё-таки мы видим воочию один из очень немногих случаев, когда Agena оказывается впереди. 3ds max однозначно голосует за Wolfdale, Lightwave присоединяется (хоть и с намного меньшим оптимизмом).

CAD/CAM пакеты

  Wolfdale Agena Преимущество
UGS NX      
Total CPU 3,65 3,35 9%
Total Graphics 1,98 1,80 10%
Pro/ENGINEER      
CPU Related tasks 740 812 10%
Graphics Relatsed tasks 883 1010 14%
SolidWorks      
Graphics 76,74 80,17 4%
CPU 52,36 57,78 10%
Group Score 99 91 10%

Проигрыш K10/Agena во всех без исключения подтестах при средней его величине в районе от 10 до 20 процентов, как мы увидим позднее, является рефреном данного тестирования.

Компиляция

R сожалению, тест на компиляцию у нас пока используется только один, поэтому сопоставлять и сравнивать нечего, остаётся только в очередной раз констатировать проигрыш Agena.

Профессиональная работа с фотографиями

  Wolfdale Agena Преимущество
Photoshop      
Blur 0:15:56 0:19:32 23%
Color 0:03:26 0:04:06 19%
Filters 0:05:24 0:06:58 29%
Light 0:02:56 0:03:30 19%
Rotate 0:05:58 0:06:16 5%
Sharp 0:05:50 0:07:32 29%
Size 0:01:20 0:01:28 10%
Transform 0:03:08 0:03:28 11%
Group Score 57 48 18%

Наименьший проигрыш в подтесте Rotate, видимо, обусловлен тем, что этот подтест сильно зависит от скорости памяти, и встроенный контроллер, видимо, помогает Agena сократить разрыв. В остальном всё довольно печально: по большинству подтестов Wolfdale уверенно выигрывает более 20%, иногда вплотную приближаясь к 30%.

Научно-математические пакеты

  Wolfdale Agena Преимущество
Maple 0,0278 0,0333 —17%
Mathematica      
Internal 2,3230 2,2950 1%
MMA 1,1867 1,1488 3%
MATLAB      
LU 0,1143 0,2010 76%
FFT 0,1450 0,1631 12%
ODE 0,1868 0,1834 —2%
Sparse 0,3023 0,3703 22%
2D 0,2984 0,3633 22%
3D 0,5549 0,5639 2%
Group Score 81 73 11%

В Maple ядро Agena ставит свой личный абсолютный рекорд: 17% превосходства над Wolfdale. Это самое большое преимущество, которое смогло продемонстрировать ядро от AMD в нашем тестировании. А MATLAB продолжает удивлять. Один раз он нас удивил, причём именно в комбинации с Phenom, и теперь  — снова, но уже при «одноядерном» тестировании. На этот раз ядро AMD К10 «отметилось» в подтесте LU (декомпозиция матрицы), где с треском проиграла архитектуре Intel Core целых 76%. Понятно, что это опять «какая-то трагическая ошибка» — то ли в библиотеке, то ли в процессоре, то ли ещё где-то, однако подобных феноменов в данном материале будет ещё парочка (причём в самых неожиданных местах), и, честно говоря, нам они успели надоесть…

Веб-сервер

  Wolfdale Agena Преимущество
PHP Calculator 42 38 11%
PHPSpeed      
Synthetic PHP 2790 2572 8%
Synthetic MySQL 2394 2302 4%
Synthetic Read/Write 1815 1758 3%
Real World PHP 5069 3700 37%
Real World PHP & MySQL 2269 1435 58%
Server 1840 1751 5%
Group Score 80 68 17%

Да, кстати, и второй «феномен» — подтест Real World PHP & MySQL в PHPSpeed. Ядро Agena проиграло почти 60% — и это притом, что в других подтестах мы наблюдаем вполне утешительные 3-4-5%. Вам не кажется, что ситуация, когда всё идёт пусть и не идеально, но более-менее тихо, и вдруг посреди чистого поля зияет глубокий овраг — является достаточно типичной для нынешней реинкарнации этого ядра? Мы имеем по этому поводу свои предположения, но выскажем их позже.

Архиваторы

  Wolfdale Agena Преимущество
7-Zip 0:04:03 0:04:35 13%
WinRAR 0:01:48 0:02:06 17%
Ultimate ZIP 0:02:12 0:02:24 9%
Group Score 77 68 13%

В данной группе тестов всё традиционно, можно сказать «стандартный, типичный для Agena проигрыш».

Кодирование медиаданных

  Wolfdale Agena Преимущество
FLAC 0:01:11 0:01:17 8%
LAME 0:02:59 0:03:14 8%
Musepack 0:02:07 0:02:22 12%
Vorbis 0:04:09 0:05:20 29%
Canopus ProCoder 0:06:31 0:05:52 —10%
DivX 0:01:50 0:02:07 15%
x264 0:09:41 0:10:59 13%
XviD 0:07:28 0:09:23 26%
Group Score 76 68 12%

Яркое выступление Canopus ProCoder, который однозначно проголосовал за Agena, последнему не помогло, так как остальные семь приложений придерживаются противоположного мнения. Проигрыш Agena более четверти наблюдается в двух кодеках — OGG Vorbis и XviD. Можно заметить, что обоих объединяет принадлежность к open source, однако присутствующие в этом же подтесте open source LAME и FLAC менее радикальны в своих пристрастиях, так что делать из этого совпадения какие-то далеко идущие выводы вряд ли стоит.

Игры

  Wolfdale Agena Преимущество
Call of Duty 4 75 63 19%
Company of Heroes 56 48 17%
Call of Juarez 48 45 7%
Crysis 12,60 10,25 23%
S.T.A.L.K.E.R. 77 63 22%
Unreal Tournament 3 44 38 16%
World in Conflict 25 19 32%
Group Score 65 54 19%

Достаточно стандартная ситуация: проигрыш Agena по всем позициям, начинающийся с утешительных 7% (сильно зависящий от видеокарты Call of Juarez), и заканчивающийся разгромными 32% (как ни странно, не менее 3D-зависимый World in Conflict). Ничего необычного не наблюдается.

Любительская работа с фотографиями

  Wolfdale Agena Преимущество
ACDSee 0:12:44 0:21:24 68%
IrfanView 0:18:21 0:22:53 25%
Paint.NET 95473 122396 28%
xat.com Image Optimizer 0:37:35 0:42:22 13%
XnView 0:21:23 0:26:22 23%
Group Score 72 55 30%

Более половины приложений (3 из 5, если быть точным) демонстрируют превосходство ядра Wolfdale над Agena на четверть и более, при этом проигрыш Agena в весьма популярном приложении ACDSee составляет целых 68%! Это третий (и, слава богу, последний) «феномен Phenom», который мы можем наблюдать в данном тестировании. Положительно, автор названия этого процессора продемонстрировал нам весьма своеобразное чувство юмора…

Заключение

  Wolfdale Agena Преимущество
PRO SCORE 76 66 14%
HOME SCORE 72 61 18%
OVERALL SCORE 74 64 16%

Картина, скажем прямо, печальная. По состоянию на нынешний момент, даже при прочих практически равных условиях, ядро Agena отстаёт от Wolfdale почти везде, причём в наибольшем количестве случаев отставание заслуживает эпитета «существенное» (более 10%). Впрочем, иногда можно заменить этот эпитет утешающим «незначительное» (SolidWorks/Graphics, Photoshop/Rotate, Mathematica, многие подтесты PHPSpeed), а иногда на навевающий тоску «кошмарное» (MATLAB/LU, Real World PHP & MySQL, ACDSee). Последнее, как ни странно, и служит нам поводом для оптимизма.

Давайте вспомним новейшую историю x86-64 процессоров. Страничка AMD Phenom в ней началась с настолько громкого «прокола», какого не бывало со времён знаменитой ошибки в Intel Pentium. О чём это говорит нам в первую очередь? О том, что выпускался процессор второпях, в авральном режиме, и нормального, дотошного тестирования, скорее всего, не прошёл. Потом мы имели возможность наблюдать более чем странное поведение исправленного Phenom при тестировании c помощью функции Sparse в MATLAB, и  сейчас, в однопроцессорном режиме — снова MATLAB, уже с функцией LU, и в придачу PHP+MySQL и ACDSee.

Если быть оптимистом и надеяться на лучшее, то можно предположить, что все эти «феномены Phenom» являются следствием подобных недоработок, пусть и не приводящих к ошибкам, как в случае с пресловутой «ошибкой TLB», но, в частности, существенно снижающих быстродействие. Кстати, с нашей точки зрения, к этой категории «потенциальных странностей» вполне оправданно будет отнести все проигрыши с удельным весом около 25% и более. Исправить эти странности, будем надеяться, можно, что наверняка и попытаются сделать в следующей версии ядра K10. Разумеется, ядром всех времён и народов это его всё равно не сделает (поезд ушёл…), однако сократить «архитектурный» разрыв в производительности до более-менее приличного уровня (скажем, менее 10%) — кто знает, может быть, и удастся.



Модули памяти для тестовых стендов предоставлены Corsair Memory



Дополнительно

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.