Intel Wolfdale vs AMD Agena в «чистом» поединке: одно ядро, одна память, одна частота

Мы продолжаем серию исследований, которая призвана продемонстрировать на практике различные не совсем очевидные особенности влияния различных факторов на производительность современных x86-64 процессоров. В данном материале мы попытаемся (насколько это возможно) дать ответ на вопрос о производительности единичного, так сказать «почти в чистом виде» процессорного ядра от двух основных конкурентов. Для этого мы воспользовались функцией BIOS Setup двух плат для платформ LGA775 и Socket AM2+ — Biostar TPower I45 (IP45A-A7P) и ASUS M3A32-MVP Deluxe/WiFi-AP, позволяющей отключать все ядра CPU, кроме одного.

Некоторые, быть может, будут удивлены тому, что мы поменяли тестовую платформу для LGA775, причём на замену ASUS Maximus Extreme была взята более, скажем так, «простая» плата, и отнюдь не на таком топовом чипсете. Прежде всего, это было вызвано желанием обеспечить обоим ядрам максимально одинаковые условия функционирования: плата от BIOSTAR работает с той же памятью стандарта DDR2-800, что и наша стандартная платформа для Socket AM2+. И, кроме того, не последним доводом в пользу одноразовой замены тестовой платформы послужило то, что ASUS Maximus Extreme отключать ядра у Core 2 просто не умеет.

Как видите, условия можно назвать практически равными: работает только одно ядро, полностью совпадают тип, частота и тайминги памяти, частота работы ядра также идентична (для этого, в случае с платформой LGA775, нам пришлось воспользоваться способностью инженерного сэмпла Core 2 Duo E7200 менять коэффициент умножения на произвольный). И здесь у дотошных, но торопливых читателей, может возникнуть вопрос: а как кэш? Ведь у ядра Wolfdale размер L2 (который в данном случае весь достаётся одному ядру) равен 3 МБ, в то время как Agena (это ядро в тестировании представлял Phenom X4 9850 Black Edition) имеет лишь 2 МБ кэша третьего уровня.

Однако, на самом деле, всё не так плохо, как кажется на первый взгляд. Не будем забывать, что в процессорах Intel архитектура кэша неэксклюзивная, таким образом, максимальный объём кэшируемой информации определяется кэшем наибольшего размера. А на платформе AMD кэш эксклюзивный (L3 — адаптивно-эксклюзивный, но при одном ядре он по идее должен вырождаться в просто эксклюзивный), таким образом, максимальный объём кэшируемой информации определяется суммой размеров кэшей всех уровней. В нашем случае она составляет 128 (L1) + 512 (L2) + 2048 (L3) = 2688 КБ. Конечно, даже эта цифра на 13% меньше, чем 3072 КБ L2 у Wolfdale, однако ввиду того, что основные конкуренты не считают нужным договариваться друг с другом об объёмах кэшей, чтобы облегчить нам задачу, мы будем считать расхождение в 13% наименьшим из возможных зол.

Некоторые, возможно, скажут, что для достижения действительно идеальной ситуации, следовало бы отключить L2/L3-кэш. Спорная позиция. Во-первых, это нежизненная ситуация — никто не работает на современных x86-64 процессорах с отключенным L2-кэшем. Во-вторых, как раз в этом случае ядро AMD получило бы очень серьёзное преимущество, так как L1-кэш ни на одном процессоре отключить невозможно (по крайней мере, штатными средствами BIOS Setup), а размер L1-кэша у Agena ровно в два раза больше, чем у Wolfdale.

Тестирование

Как и всегда в подобных случаях, нас интересуют, в том числе результаты конкретных приложений, поэтому мы снова заменили диаграммы таблицами, а виртуальные баллы «сырыми» результатами тестов. В графе «Преимущество» указано преимущество ядра Wolfdale над Agena в процентах (ибо это самая частая ситуация). Соответственно, в тех случаях, когда Agena всё выигрывает, значение будет отрицательным, и, ввиду чрезвычайной редкости подобной ситуации, оно будет выделено жирным шрифтом и красным цветом.

Пакеты трёхмерного моделирования

	Wolfdale	Agena	Преимущество
3ds max
CPU Render	2,59	2,10	24%
Graphics	3,61	3,06	18%
Hardware Shaders	9,43	7,42	27%
Maya
GFX	2,81	2,41	16%
CPU	4,98	4,05	23%
Render	0:24:46	0:23:36	—5%
Lightwave	0:16:27	0:17:28	6%
Group Score	63	54	15%

Как ни странно, рендер-движок Maya явным образом отдаёт предпочтение архитектуре К10. Конечно, решающим преимуществом 5% назвать нельзя, да и вряд ли 5% преимущества в скорости рендеринга перевесят проигрыш в районе 20% в скорости интерактивной работы с тем же пакетом, однако всё-таки мы видим воочию один из очень немногих случаев, когда Agena оказывается впереди. 3ds max однозначно голосует за Wolfdale, Lightwave присоединяется (хоть и с намного меньшим оптимизмом).

CAD/CAM пакеты

	Wolfdale	Agena	Преимущество
UGS NX
Total CPU	3,65	3,35	9%
Total Graphics	1,98	1,80	10%
Pro/ENGINEER
CPU Related tasks	740	812	10%
Graphics Relatsed tasks	883	1010	14%
SolidWorks
Graphics	76,74	80,17	4%
CPU	52,36	57,78	10%
Group Score	99	91	10%

Проигрыш K10/Agena во всех без исключения подтестах при средней его величине в районе от 10 до 20 процентов, как мы увидим позднее, является рефреном данного тестирования.

Компиляция

R сожалению, тест на компиляцию у нас пока используется только один, поэтому сопоставлять и сравнивать нечего, остаётся только в очередной раз констатировать проигрыш Agena.

Профессиональная работа с фотографиями

	Wolfdale	Agena	Преимущество
Photoshop
Blur	0:15:56	0:19:32	23%
Color	0:03:26	0:04:06	19%
Filters	0:05:24	0:06:58	29%
Light	0:02:56	0:03:30	19%
Rotate	0:05:58	0:06:16	5%
Sharp	0:05:50	0:07:32	29%
Size	0:01:20	0:01:28	10%
Transform	0:03:08	0:03:28	11%
Group Score	57	48	18%

Наименьший проигрыш в подтесте Rotate, видимо, обусловлен тем, что этот подтест сильно зависит от скорости памяти, и встроенный контроллер, видимо, помогает Agena сократить разрыв. В остальном всё довольно печально: по большинству подтестов Wolfdale уверенно выигрывает более 20%, иногда вплотную приближаясь к 30%.

Научно-математические пакеты

	Wolfdale	Agena	Преимущество
Maple	0,0278	0,0333	—17%
Mathematica
Internal	2,3230	2,2950	1%
MMA	1,1867	1,1488	3%
MATLAB
LU	0,1143	0,2010	76%
FFT	0,1450	0,1631	12%
ODE	0,1868	0,1834	—2%
Sparse	0,3023	0,3703	22%
2D	0,2984	0,3633	22%
3D	0,5549	0,5639	2%
Group Score	81	73	11%

В Maple ядро Agena ставит свой личный абсолютный рекорд: 17% превосходства над Wolfdale. Это самое большое преимущество, которое смогло продемонстрировать ядро от AMD в нашем тестировании. А MATLAB продолжает удивлять. Один раз он нас удивил, причём именно в комбинации с Phenom, и теперь — снова, но уже при «одноядерном» тестировании. На этот раз ядро AMD К10 «отметилось» в подтесте LU (декомпозиция матрицы), где с треском проиграла архитектуре Intel Core целых 76%. Понятно, что это опять «какая-то трагическая ошибка» — то ли в библиотеке, то ли в процессоре, то ли ещё где-то, однако подобных феноменов в данном материале будет ещё парочка (причём в самых неожиданных местах), и, честно говоря, нам они успели надоесть…

Веб-сервер

	Wolfdale	Agena	Преимущество
PHP Calculator	42	38	11%
PHPSpeed
Synthetic PHP	2790	2572	8%
Synthetic MySQL	2394	2302	4%
Synthetic Read/Write	1815	1758	3%
Real World PHP	5069	3700	37%
Real World PHP & MySQL	2269	1435	58%
Server	1840	1751	5%
Group Score	80	68	17%

Да, кстати, и второй «феномен» — подтест Real World PHP & MySQL в PHPSpeed. Ядро Agena проиграло почти 60% — и это притом, что в других подтестах мы наблюдаем вполне утешительные 3-4-5%. Вам не кажется, что ситуация, когда всё идёт пусть и не идеально, но более-менее тихо, и вдруг посреди чистого поля зияет глубокий овраг — является достаточно типичной для нынешней реинкарнации этого ядра? Мы имеем по этому поводу свои предположения, но выскажем их позже.

Архиваторы

	Wolfdale	Agena	Преимущество
7-Zip	0:04:03	0:04:35	13%
WinRAR	0:01:48	0:02:06	17%
Ultimate ZIP	0:02:12	0:02:24	9%
Group Score	77	68	13%

В данной группе тестов всё традиционно, можно сказать «стандартный, типичный для Agena проигрыш».

Кодирование медиаданных

	Wolfdale	Agena	Преимущество
FLAC	0:01:11	0:01:17	8%
LAME	0:02:59	0:03:14	8%
Musepack	0:02:07	0:02:22	12%
Vorbis	0:04:09	0:05:20	29%
Canopus ProCoder	0:06:31	0:05:52	—10%
DivX	0:01:50	0:02:07	15%
x264	0:09:41	0:10:59	13%
XviD	0:07:28	0:09:23	26%
Group Score	76	68	12%

Яркое выступление Canopus ProCoder, который однозначно проголосовал за Agena, последнему не помогло, так как остальные семь приложений придерживаются противоположного мнения. Проигрыш Agena более четверти наблюдается в двух кодеках — OGG Vorbis и XviD. Можно заметить, что обоих объединяет принадлежность к open source, однако присутствующие в этом же подтесте open source LAME и FLAC менее радикальны в своих пристрастиях, так что делать из этого совпадения какие-то далеко идущие выводы вряд ли стоит.

Игры

	Wolfdale	Agena	Преимущество
Call of Duty 4	75	63	19%
Company of Heroes	56	48	17%
Call of Juarez	48	45	7%
Crysis	12,60	10,25	23%
S.T.A.L.K.E.R.	77	63	22%
Unreal Tournament 3	44	38	16%
World in Conflict	25	19	32%
Group Score	65	54	19%

Достаточно стандартная ситуация: проигрыш Agena по всем позициям, начинающийся с утешительных 7% (сильно зависящий от видеокарты Call of Juarez), и заканчивающийся разгромными 32% (как ни странно, не менее 3D-зависимый World in Conflict). Ничего необычного не наблюдается.

Любительская работа с фотографиями

	Wolfdale	Agena	Преимущество
ACDSee	0:12:44	0:21:24	68%
IrfanView	0:18:21	0:22:53	25%
Paint.NET	95473	122396	28%
xat.com Image Optimizer	0:37:35	0:42:22	13%
XnView	0:21:23	0:26:22	23%
Group Score	72	55	30%

Более половины приложений (3 из 5, если быть точным) демонстрируют превосходство ядра Wolfdale над Agena на четверть и более, при этом проигрыш Agena в весьма популярном приложении ACDSee составляет целых 68%! Это третий (и, слава богу, последний) «феномен Phenom», который мы можем наблюдать в данном тестировании. Положительно, автор названия этого процессора продемонстрировал нам весьма своеобразное чувство юмора…

Заключение

	Wolfdale	Agena	Преимущество
PRO SCORE	76	66	14%
HOME SCORE	72	61	18%
OVERALL SCORE	74	64	16%

Картина, скажем прямо, печальная. По состоянию на нынешний момент, даже при прочих практически равных условиях, ядро Agena отстаёт от Wolfdale почти везде, причём в наибольшем количестве случаев отставание заслуживает эпитета «существенное» (более 10%). Впрочем, иногда можно заменить этот эпитет утешающим «незначительное» (SolidWorks/Graphics, Photoshop/Rotate, Mathematica, многие подтесты PHPSpeed), а иногда на навевающий тоску «кошмарное» (MATLAB/LU, Real World PHP & MySQL, ACDSee). Последнее, как ни странно, и служит нам поводом для оптимизма.

Давайте вспомним новейшую историю x86-64 процессоров. Страничка AMD Phenom в ней началась с настолько громкого «прокола», какого не бывало со времён знаменитой ошибки в Intel Pentium. О чём это говорит нам в первую очередь? О том, что выпускался процессор второпях, в авральном режиме, и нормального, дотошного тестирования, скорее всего, не прошёл. Потом мы имели возможность наблюдать более чем странное поведение исправленного Phenom при тестировании c помощью функции Sparse в MATLAB, и сейчас, в однопроцессорном режиме — снова MATLAB, уже с функцией LU, и в придачу PHP+MySQL и ACDSee.

Если быть оптимистом и надеяться на лучшее, то можно предположить, что все эти «феномены Phenom» являются следствием подобных недоработок, пусть и не приводящих к ошибкам, как в случае с пресловутой «ошибкой TLB», но, в частности, существенно снижающих быстродействие. Кстати, с нашей точки зрения, к этой категории «потенциальных странностей» вполне оправданно будет отнести все проигрыши с удельным весом около 25% и более. Исправить эти странности, будем надеяться, можно, что наверняка и попытаются сделать в следующей версии ядра K10. Разумеется, ядром всех времён и народов это его всё равно не сделает (поезд ушёл…), однако сократить «архитектурный» разрыв в производительности до более-менее приличного уровня (скажем, менее 10%) — кто знает, может быть, и удастся.

Модули памяти для тестовых стендов предоставлены Corsair Memory