Границы возможного, или
Всё, что нужно знать о производительности

Часть 1: AMD Athlon II


Каждый раз, когда у какого-нибудь производителя на относительно долгое время стабилизировался модельный ряд, нам всегда приходило в голову, что неплохо бы выпустить такую статью (или серию статей), которая сразу ставила бы все точки над «i». И вот — наконец-таки, случай предоставился: в преддверии выхода Bulldozer, модельные ряды AMD Athlon II и Phenom II застыли в немом ужасе почтении, что дало нам возможность зафиксировать их состояние на данный момент времени максимально информативным образом.

Действительно: ведь зачастую не так уж обязательно знать производительность каждого процессора в линейке. Какое быстродействие будет у, например, Athlon II X3 440? Понятно, что «где-нибудь между Athlon II X3 425 и Athlon II X3 455», т. к. это самая младшая и самая старшая модель Athlon II X3. А так ли уж велика разница между этими старшими и младшими, если разобраться? Вот-вот… Соответственно, если собрать в одной статье все младшие и старшие модели — вот и готов «фамильный портрет в интерьере»! Идея впечатляла, и хотя бы раз её уж точно стоило попытаться воплотить. Что мы и сделали.

Конфигурация тестовых стендов

В первой табличке мы приведём те характеристики тестируемых процессоров, которыми они отличаются друг от друга. Как легко заметить, их всего три (кроме названия) — количество ядер, частота их работы и один раз — объём L2-кэша.

Процессор
AMD Athlon II X2 215 AMD Athlon II X2 265 AMD Athlon II X3 425 AMD Athlon II X3 455 AMD Athlon II X4 620 AMD Athlon II X4 645
Количество ядер
2 2 3 3 4 4
Частота
2700 МГц 3300 МГц 2700 МГц 3300 МГц 2600 МГц 3100 МГц
L2 (на ядро)
512 КБ 1024 КБ 512 КБ 512 КБ 512 КБ 512 КБ

…Ну а для особенно тонких эстетов — полная аппаратная конфигурация тестовых стендов.

Процессор
AMD Athlon II X2 215 AMD Athlon II X2 265 AMD Athlon II X3 425 AMD Athlon II X3 455 AMD Athlon II X4 620 AMD Athlon II X4 645
Память
2×4=8 ГБ DDR3-1333
Системная плата
ASUS M4A78T-E AMD790GX
Видеокарта
NVIDIA GeForce GTX 570 1280 МБ
Жёсткий диск
Intel SSD SA2M160G2GC 160 ГБ
Блок питания
Cooler Master RS-A00-EМБA 1000 Вт

Тестирование

Традиционно, мы разбиваем все тесты на некоторое количество групп, и приводим на диаграммах средний результат по группе тестов/приложений (детально с методикой тестирования вы можете ознакомиться в отдельной статье). Результаты на диаграммах приведены в баллах, за 100 баллов принята производительность референсной тестовой системы iXBT образца 2011 года. Тем, кто интересуется более подробной информацией, опять-таки традиционно предлагается скачать таблицу в формате Microsoft Excel, в которой все результаты приведены как в преобразованном в баллы, так и в «натуральном» виде. Конфигурация референсной тестовой системы iXBT образца 2011 года такова:

Компьютер
iXBT.com Reference System 2011
Процессор
AMD Athlon II X4 620
Системная плата
ASUS M4A78T-E
Память
4×2=8 ГБ DDR3-1333
Жёсткий диск
Intel SSD SA2M160G2GC 160 ГБ
Видеокарта
NVIDIA GeForce GTX 570 1280 МБ
Блок питания
Cooler Master RS-A00-EМБA 1000 Вт
ОС
Windows 7 Ultimate x64 SP1

Интерактивная работа в трёхмерных пакетах

Интерактив в трёхмерных пакетах настолько индифферентен к количеству ядер, что нижние модели X2 и X3 даже обогнали нижний X4 (напомним — у них на 100 МГц больше частота). Однако разброс невелик даже если сравнивать самую быструю и самую медленную систему. Почему? В этой группе тестов слишком велико влияние видеокарты, а она везде была одна и та же.

Но, в целом, это достаточно типичная ситуация, поэтому мы даже дадим ей в рамках данной статьи специальное наименование: «диаграмма первого типа». Основная характерная особенность у неё такая: присутствуют как бы две «вертикальные линейки» производительности — одну составляют младшие модели X2, X3 и X4, вторую — старшие. Диаграмма первого типа свидетельствует о слабой многопоточной оптимизации ПО в группе.

Финальный рендеринг трёхмерных сцен

И совершенно иная ситуация в группе финального рендеринга — здесь с ростом количества ядер производительность масштабируется почти идеально. В результате, даже речи не идёт о том, чтобы процессор с N-1 ядер обогнал N-ядерный, а лучший результат более чем в 2 раза превосходит худший.

И это — классическая «диаграмма второго типа» — «ступенька». Данный тип распределения результатов свидетельствует о хорошей многопоточной оптимизации ПО в тестовой группе, причём чем ступеньки ровнее — тем лучше оптимизация. Также типична для данного тестирования «короткая ступенька» между старшим X3 и младшим X4 — она связана с тем, что у младшего X4 частота на 100 МГц меньше, чем у младших X2 и X3.

Упаковка и распаковка

Диаграмма первого типа с небольшими артефактами у процессоров семейства X2. Напомним нашим читателям, что с 2011 года в данную группу тестов входит не только упаковка, но и распаковка (зашифрованного архива). На практике это неизбежно обернётся меньшей чувствительностью среднего балла группы к количеству ядер в процессорах т. к. распаковка у всех известных нам архиваторов — процесс сугубо однопоточный. Соответственным образом распределились результаты и в сегодняшнем тестировании: нижние и верхние X3 и X4 вообще продемонстрировали одинаковые результаты, да и X2 отстали ненамного.

Кодирование аудио

В нашем случае процесс кодирования аудио является практически идеально распараллеливаемым, поскольку dBpoweramp запускает ровно столько параллельных процессов кодирования, сколько обнаружит ядер. Результат предсказуем: классическая и очень ровная диаграмма второго типа.

Компиляция

Ещё один почти идеально распараллеливаемый процесс, и, соответственно, легко предсказуемая картина на диаграмме. Особенно забавен «отрицательный отрыв» обоих двухъядерников. На первый взгляд он кажется иррациональным, но немного подумав, внимательные читатели с хорошей памятью вспомнят, что частота нижнего 4-ядерника на 100 МГц меньше, чем у нижних X3 и X2, а частота верхнего X4 меньше чем у верхних X3 и X2 даже на 200 МГц. Таким образом, «длинная ступенька» должна была быть и между верхним X3 и нижним X4.

Математические и инженерные расчёты

Диаграмма первого типа: бал правит голая частота, выигрыш от множества ядер совершенно мизерный, и еле-еле помогает 4-ядерному X4 620 обойти на 6 очков 2-ядерный X2 215 (правда, последний, справедливости ради, имеет на 100 МГц бо́льшую частоту). Данная ситуация обусловлена составом тестов: из пяти входящих в данную группу, лишь один (бенчмарк для MATLAB) обладает зачатками многоядерной оптимизации. В методике прошлого года был ещё достаточно неплохо многопоточно оптимизированный пакет Wolfram Mathematica, но из тестового набота 2011 года его пришлось исключить из-за крайне нестабильных результатов, демонстрируемых последней версией пакета.

Растровая графика

Диаграмма, которую мы бы назвали «смешанного типа» — с одной стороны, присутствуют две явно выраженные, разделённые относительно большим промежутком линейки, с другой — сами линейки не ровные, а ступенчатые. Эта картина очень хорошо иллюстрирует разброд и шатания внутри рассматриваемой группы ПО: ACDSee, ImageMagick и Adobe Photoshop имеют относительно неплохую многопоточную оптимизацию, в то время как GIMP и Paintshop её лишены совсем.

Векторная графика

Векторная графика, как совершенно чётко видно по распределению мест на диаграмме, у нас «сугубо одноядерная», без вариантов. Так что если раздумываете над тем, какой процессор брать под работу в Adobe Illustrator или CorelDraw, помните: для этого ПО даже двухъядерник — уже излишество. В данном случае, безусловным чемпионом по соотношению цена:скорость является Athlon II X2 265, а самым худшим вариантом — младший X4.

Кодирование видео

Классическая диаграмма второго типа, только «ступеньки» между старшим X3 и младшим X4 практически нет. Делаем вывод: при кодировании видео преимущество в количестве ядер может не быть решающим, частота тоже значит довольно много.

Офисное ПО

Из всех офисных тестов один только FineReader имеет неплохую многопоточную оптимизацию, но поскольку в общем балле участвуют кроме него 4 браузера, Microsoft Excel, Word и PowerPoint, понятно, что доля его влияния чрезвычайно мала. В результате, имеем совершенно очевидные результаты: у кого больше частота — тот и на коне. Небольшие девиации есть (за счёт вышеупомянутого FineReader), но они настолько малы, что обращать на них внимание бессмысленно.

Java

Вполне характерная для хорошо многопоточно оптимизированного ПО «ступенька», очередная «диаграмма второго типа» с неправильной ступенькой между верхней моделью X3 и нижней X4. Причины её появления мы уже рассматривали раньше.

Игры

Ну вот мы и дожили до времён, когда четырёхъядерник можно без шутки и ёрничества назвать «хорошим игровым процессором». Действительно: даже 3300-мегагерцовому Athlon II X3 455, не удалось обойти в играх 2600-мегагерцовый X4 620 — очевидно, исключительно потому, что у последнего на 1 ядро больше. Но для лучшего понимания ситуации, всё-таки настоятельно рекомендуем скачать XLS-табличку с подробными результатами, ссылка на которую была дана в самом начале тестового раздела, и посмотреть результаты по отдельным играм. Там… есть забавные моменты. ;)

Итоги

Что ж, вот они, перед нами — «границы возможного» для AMD Athlon II: от 77 условных баллов нашей методики до 114, итого 114−77=37 баллов. Или, иначе, относительно — 114/77=48% разницы между самым медленным и самым быстрым процессором в этой серии. Много это или мало? В общем, мы бы сказали: «нормально». Всё-таки, одно название, одна линейка, поэтому было бы странно видеть в ней процессоры, различающиеся по средней производительности, например, в 2 раза. А в полтора — как раз вполне. Какие ещё интересности можно увидеть на финальной диаграмме?

Во-первых, финальная диаграмма явно не относится ни к первому ни ко второму типу. Это, в целом, отражает тенденции современного ПО: многопоточная оптимизация уже много где встречается, но бывают и такие места, куда она «даже в гости не заходила». Соответственная и диаграмма получилась: «смесь дивана с чемоданом», ни то ни сё. Фактически, она отражает одновременно готовность передовых разработчиков ПО к следованию новомодным тенденциям, и нежелание им следовать тех, кто считает, что «у нас и так всё хорошо». Жизненный опыт подсказывает опять-таки дуалистический вариант: понятно, что в конце концов победят первые, но в то же время совсем не понятно, насколько скоро…

Что ещё любопытного? Ну, например, давайте посмотрим, как нижние модели с N ядер соотносятся по скорости с верхними моделями с N-1. Первая пара: верхний X2 vs. нижний X3 — равенство, причём с точностью до балла. Вторая пара: верхний X3 vs. нижний X4 — уже выигрыш X3. Так что старый добрый принцип «каждое следующее ядро снижает общую эффективность» никто пока не отменил (некоторые могут обратить внимание на частоты, но давайте не будем забывать, что нижняя и верхняя частота для конкретной линейки не рождается сама по себе, а является функцией от техпроцесса и количества ядер, ибо TDP никто не отменял).

Можно ещё проанализировать прирост производительности внутри под-линеек. Athlon II X2 — 90/77≈17%, Athlon II X3 — 104/90≈16%, Athlon II X4 — 114/100=14%. Тоже ничего удивительного, правда? И тоже вполне согласуется с принципом, изложенным абзацем выше. Кроме того, можно заметить, что разница в 14% уже вплотную приближается к эмпирически выявленным 8-10% — именно на этом уровне пользователь практически перестаёт ощущать субъективную разницу в скорости. Кстати, тоже вполне информативная табличка:

Процессорная линейка
Разница в частоте между младшей и топовой моделью Разница в производительности между младшей и топовой моделью Соотношение (КПД прироста частоты)
Athlon II X2
22,2% 16,8% 76%
Athlon II X3
22,2% 15,5% 70%
Athlon II X4
19,2% 14% 73%

Впрочем, не будем дальше напрягать вас нашими размышлениями на данную тему — надеемся, у вас возникнет определённое количество своих собственных, ничуть не менее интересных. Ведь всё, что нужно знать о производительности AMD Athlon II, вы уже знаете. :)



В следующей части мы расскажем вам всё, что нужно знать о производительности AMD Phenom II…



Редакция благодарит компанию «Юлмарт»
за процессоры, предоставленные для тестирования
 



Дополнительно

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.