Тестирование процессоров Athlon 64 и Opteron в реальных приложениях

Третий концерт для Opteron с оркестром


«…Я свежий ветер, огонь крылатый,
И наше время на циферблатах…»
А. Градский


Совсем недавно на читателя обрушилась предыдущая статья данного цикла: в ней мы рассматривали некоторые аспекты внутреннего устройства микроархитектуры K8. От продолжения «раскопок» мы не отказываемся, но настало время посмотреть, к чему же привели усовершенствования на практике. Насколько хорошо будет выглядеть эта микроархитектура по сравнению с Pentium 4 и Athlon XP? Увидим ли мы ее всепобеждающую поступь, сравнимую разве что с апокалиптическими шагами Арнольда Шварцнегера в знаменитом «Терминаторе»? Или это будет робкое передвижение на цыпочках, свойственное новичку, которому еще расти и набираться сил — как пресловутому Джону Коннору?

Как Вы, наверное, уже догадались, наступило время «практического» тестирования. Все мы: и читатели, и авторы — долго ждали этих результатов. Одни — потому, что хотели проверить свои предположения. Другие — потому, что надеялись на K8, как надеются на мессию. Третьи, напротив, для того, чтобы позлорадствовать над провалом. Что ж, надеемся, нынешнее тестирование сумеет удовлетворить одновременно всех. Напомним, что в предыдущей части мы разобрали принципы и детали работы контроллера памяти K8, воспользовавшись рядом низкоуровневых тестов, посему к этой теме возвращаться не будем, а при необходимости просто сошлемся на полученные данные. В этот же раз мы приступим к изучению результатов сравнительного тестирования платформ Athlon 64, Opteron, Athlon XP и Pentium 4 в реальных приложениях. Благо, к настоящему моменту у нас накопилось некоторое количество практического материала, который было бы неплохо осмыслить.

Во-первых, мы протестировали Athlon 64 и Opteron в сравнении между собой. Во-вторых, перед предстоящим 23-го сентября официальным анонсом процессора Athlon 64 было бы желательно иметь на руках хоть какие-то цифры производительности — это поможет оценить, чего можно ожидать от новинки. Более того, после официального анонса (напомним, что, по слухам, частота выходящего 23-го сентября процессора будет находиться в районе 2 ГГц) мы сможем проверить масштабируемость этой архитектуры. То есть, как ни крути, измерить производительность образцов необходимо — эти цифры нам не раз пригодятся в дальнейшем. В-третьих, небезынтересно проверить, что изменилось в скорости Athlon 64: ранние образцы имеют Revision B, а в продажу должна поступить Revision C этого процессора. Например, по слухам, AMD обещает увеличить эффективность контроллера памяти… (Куда уж дальше?!)

Словом, тщательно поразмыслив, мы решили это тестирование все же выпустить «в свет», невзирая на то что его уже не назовешь «горячим». Более того, сама концепция вдумчивого изучения архитектуры AMD64 и микроархитектуры K8 как раз предостерегает от «горячих» тестирований «по следам сенсаций»; уж лучше не торопясь, медленно, но верно. К тому же, для того чтобы уяснить себе место Athlon 64 среди конкурирующих решений, мы сравним его результаты с показателями старших процессоров для Socket A и Socket 478 соответственно.

Теперь, когда мы убедили (по крайней мере, себя) в необходимости этой работы, позвольте перейти к перечню тестового оборудования.

Исследование производительности

Платформа K8:

  • Процессор Opteron 240 (1400 МГц), Socket 940
  • Материнская плата ASUS SK8N для Opteron на базе nForce3 Pro
  • Два процессора Athlon 64 с частотами 1400 МГц и 1600 МГц, Socket 754
  • Материнская плата Soltek K8AV-R для Athlon 64 на базе VIA K8M400

Платформа Pentium 4:

  • Процессор Pentium 4 3,2 ГГц (16x200), Socket 478
  • Материнская плата ASUS P4C800 Deluxe на базе i875P

Платформа Athlon XP:

  • Процессор Athlon XP 3200+ (11x200=2200 МГц), Socket 462 (Socket A)
  • Материнская плата ASUS A7N8X rev2.0 на базе NVIDIA nForce2 Ultra 400

Система на процессоре Opteron использовала память 2x512 МБ Samsung PC2700 ECC Registered, для всех остальных платформ применялась память TwinMOS DDR400 (2x256 МБ, 2-2-2-5). Дабы избежать влияния других узких мест, в качестве видеокарты была взята GeForce FX 5800 Ultra.

Мы приведем на диаграммах сравнительную скорость всех этих систем, а кроме того, попытаемся оценить производительность гипотетического пока процессора Athlon 64 2 ГГц, исходя из линейной экстраполяции.

В результате тестирования мы получили данные для двух частот процессора Athlon 64, к которым мы всегда можем прибавить еще одну точку: (0,0). Хотя зависимость производительности от частоты, вообще говоря, не является линейной, в начале частотной линейки процессоров она во многих случаях достаточно близка к ней, чтобы пренебречь ошибкой аппроксимации. Однако на конкретных задачах, где лимитирующим фактором является внешнее оборудование, прямая, проведенная через две точки (соответствующие частотам 1400 и 1600 МГц), не попадет в точку нулевую, и чем выше частота, тем меньше будет относительный прирост (при прочих равных условиях).

Таким образом, более корректно было бы воспользоваться гиперболической экстраполяцией вида:

P = a*F/(1 + b*F),
где P — производительность (попугаи в единицу времени);
F — частота;
a и b — коэффициенты, специфичные для задачи, внешнего оборудования и процессора.

(Гиперболическая зависимость является следствием того, что «константа» скорости «составного» процесса представляет собой среднее геометрическое констант скоростей составляющих последовательных процессов.) Иными словами, линейная экстраполяция применима к зависимостям «время выполнения» — «обратная величина частоты», а не «производительность» — «частота».

Мы, однако, в рамках данной статьи решили ограничиться результатами очевидной и понятной для всех (надеемся) линейной экстраполяции, так как проведенная по указанной выше методике оценка верхнего предела ошибки составила для наших тестов 2%.

Таким образом, для предполагаемого 2-гигагерцового процессора мы должны получить слегка завышенную оценку производительности. Измененная ревизия процессорного ядра может прибавить еще немного, но учитывать эту добавку мы пока, разумеется, не будем, в силу ее гипотетичности. Кроме того, некоторую долю производительности может скрадывать «сырость» драйверов под платформу Athlon 64.

В общем-то, данный расчет, при всей своей условности, призван показать, чего (хотя бы примерно) можно ожидать с появлением процессора Athlon 64 2 ГГц в продаже. Ну а по мере поступления реальных образцов им придется «держать экзамен», в котором мы будем сравнивать их с вычисленными в этот раз цифрами.

Результаты тестов

Итак, сначала взглянем на игровые тесты (обращайте внимание на «звездочку» при частоте гипотетического Athlon 64 2 ГГц). Наиболее показательными здесь будут цифры по низким разрешениям с соответствующей глубиной цвета и сложностью, где влияние видеокарты сведено к минимуму, но кроме того, мы представим и результаты в более высоких разрешениях при «тяжелых» настройках графики, поскольку покупатель топовых процессоров вряд ли играет в разрешении 640х480.

Что ж, Pentium 4 выглядит неплохо — до того момента, пока мы не вспоминаем, что стартует Athlon 64 с частоты в районе 2 ГГц. В таком варианте у Pentium 4 мало шансов выиграть, а мы привели показатели самой старшей модели. Кстати, интересно, что показатели прошлого поколения процессоров AMD фактически соответствуют скорости инженерного образца с частотой 1600 МГц. Другими словами, AMD сделала значительный рывок вперед в производительности по сравнению с K7. Теперь более подробно взглянем на отдельные тесты (при низкой детализации).

Видно, что Athlon 64 на частоте 2 ГГц должен быть либо быстрее, либо вровень с топовым процессором конкурента. В одном из тестов выигрывает Pentium 4, но в целом ситуация вполне благоприятна для AMD. Можно смело считать, что в 3DMark2001 SE дебют нового процессора будет успешным. А что у нас с тестом 3DMark03?



С точки зрения этого теста, Athlon 64 2 ГГц слегка отстает в общем зачете от процессора Pentium 4 3,2 ГГц. Тем не менее, виден прогресс по сравнению с прошлым поколением — разница ожидается вдвое меньше. Занятно также, что система на Opteron у нас везде числится в проигравших. Сказались как более низкая частота и увеличенная латентность регистровой памяти, так и невысокая частота самого процессора. Все эти факторы закономерно приводят к тому, что серверная платформа в играх, основанных на Direct X, блистать явно не будет. Впрочем, невелика потеря :). Мы же перейдем к тесту Return to Castle Wolfenstein.

Здесь мы видим, что и в игре, использующей OpenGL, Opteron опять в отстающих — очевидно, что игровую систему на нем собирать глупо. Два наших фаворита, Pentium 4 3,2 ГГц и Athlon 64 2 ГГц, по-прежнему идут «ноздря в ноздрю», демонстрируя примерное равенство в этом тесте, с небольшим преимуществом первого. Впрочем, учитывая любовь движка RtCW к архитектуре процессоров Intel, подобный результат для нашего новичка следует признать весьма неплохим. Кстати, показательно, что уже в третьем приложении подряд результаты Athlon XP 3200+ весьма близки к показателям Athlon 64 1600 МГц. Хм… Интересно, какой рейтинг присвоит AMD процессору с частотой 2 ГГц?! :) Но продолжим: следующим у нас на очереди тест, который издавна больше любит процессоры AMD — Serious Sam 2. Посмотрим, не изменилась ли ситуация.

Откровенно впечатляет! Athlon 64 1600 МГц выглядит лучше процессора конкурента с вдвое более высокой частотой. Ну а наш «теоретический» Athlon 64 попросту недосягаем для Pentium 4. Что ж, в этом «раунде» — чистая победа. Собственно, даже Athlon XP 3200+ выступает здесь весьма достойно — и по-прежнему на уровне 1,6-гигагерцовой модели следующего поколения.

Что ж, с игровыми тестами на этом, наверное, можно закончить — понятно, что новый процессор выглядит в них весьма достойно, за эту область применения Athlon 64 можно быть спокойным. Перейдем к более «серьезным» тестам, в частности, к пакету профессиональной 3D-графики SPECviewperf 7.1.



Athlon 64 в этом тесте проявил себя неплохо, несильно отставая от Pentium 4 3,2 ГГц, а иногда даже опережая его, но уступая Athlon XP с более высокой тактовой частотой. Но нам в первую очередь бросилось в глаза совсем другое: Opteron проигрывает своему «младшему» брату. Причем проигрывает местами сильно — видимо, профессиональные приложения чувствительны как к пропускной способности, так и к латентности памяти; другого объяснения столь странным результатам у нас нет. Не очень понятно в таком случае, как продавать Opteron для рабочих станций, если его заметно обгоняет куда более дешевый десктопный процессор?! Безусловно, это всего лишь младшая модель Opteron, но работникам маркетинга в AMD есть над чем подумать, дабы правильно позиционировать этот процессор, пока не станет доступна более быстрая регистровая память (DDR400).

Сравним теперь вычислительные возможности Pentium 4 и Athlon 64.

Да, давно уже не было праздника на улице поклонников AMD — после оптимизации 3ds max под SSE2, а также благодаря поддержке Hyper Threading, скорость финального рендеринга в этом приложении была заметно выше на процессорах Pentium 4. Инженерам AMD удалось сократить разрыв, но, в целом, лидером остается все же топовая модель Intel. Тем не менее, отметим значительное улучшение ситуации по сравнению с Athlon XP 3200+: уже Athlon 64 2 ГГц, несмотря на меньшую частоту, должен обогнать этого представителя предыдущего поколения процессоров AMD.

Чтобы проверить, случайный ли это выигрыш или закономерность, воспользуемся CPU RightMark, благо он позволяет измерить скорость при различных методах вычисления.

Итак, AMD удалось заметно увеличить вычислительную мощь ядра, добавив поддержку набора инструкций SSE2 при сохранении прежней скорости работы с x87-инструкциями. Прирост от перехода на оптимизированный для SSE2 код немного меньше, чем у Pentium 4, но все равно 2-гигагерцовая модель Athlon 64 «висит на хвосте» у топовой модели Intel.

А вот в блоке прорисовки сцены того же теста все не так радужно: здесь Athlon 64 отстает от Pentium 4 почти пропорционально разнице в их тактовой частоте, да и Athlon XP он заметно уступает, даже с учетом «лишних» 200 МГц у последнего. Ну а на технологию Hyper Threading ответа у AMD на сегодня просто нет.

Теперь перейдем к тестированию архиваторами. Как мы помним, этот класс приложений более всех других чувствителен к латентности памяти, а также сильно зависит от ее пропускной способности. Можно ожидать, что Athlon 64 опять обгонит своего старшего серверного брата в силу намного меньшей латентности подсистемы памяти. Кроме того, интересно, насколько изменилась ситуация в сравнении с их общим предком — Athlon XP 3200+.



Что ж, мы не обманулись в своих ожиданиях: видно, что Opteron медленнее приблизительно на 10%. Также видно, что скорость Pentium 4 3,2 ГГц почти достигается для обоих архиваторов уже процессором с частотой 1,6 ГГц — особенно этот рывок становится заметен на фоне однозначного проигрыша модели 3200+. Естественно, процессор Athlon 64 2 ГГц станет явным и безоговорочным лидером. Браво!

Теперь посмотрим на бывший «конек» систем на Pentium 4 — кодирование звука и видео.



Ситуация для Athlon 64 тут попросту провальная. По скорости кодирования звука Athlon 64 2 ГГц должен лишь почти догнать топовую модель предшествующего поколения (и примерно с таким же преимуществом выиграть у нее на равной частоте), а топовый CPU конкурента остается далеко впереди. Похоже, для производительности процессоров AMD здесь играет роль только разница частот, а значит, не включается оптимизация под SSE2. А вот с видео ситуация совсем непонятная: это единственное реальное приложение из всех, в котором Pentium 4 демонстрирует значительное превосходство над Athlon 64. Более того, в очень похожей на рендеринг в CPU RightMark картине заметный отрыв (порядка 30%) от 2-гигагерцового наследника показывает система на базе Athlon XP 3200+ (в то время как разница между ними, обусловленная частотой, должна была составлять величину порядка 10%). Этому мы видим два возможных объяснения (или даже их сочетание):

  1. Видеокодек DivX ничего не знает об Athlon 64 и попросту не включает оптимизацию даже под Athlon XP (это нам кажется вполне вероятным, тем более, что аналогичные случаи раньше уже имели место);
  2. Здесь сказывается влияние особой функциональности чипсетов nForce — DASP. Из нашей статьи видно, что на чипсете КТ600 Athlon XP демонстрирует гораздо менее впечатляющие результаты — фактически, как раз на уровне Athlon 64. Можно допустить, что именно в этой задаче технология адаптивной предвыборки от NVIDIA работает особенно эффективно.

Что ж, засчитываем победу в этом тесте процессору Pentium 4, но постараемся еще вернуться к изучению ситуации с видеокодированием.

Ну и, наконец, в качестве «десерта» — результаты в пакете SPEC CPU2000.

Здесь показатели процессора Athlon 64 2 ГГц ожидаются вполне на уровне современных процессоров. Pentium 4 3,2 ГГц все же останется формальным победителем, но разница в SPECint слишком невелика, чтобы серьезно на нее ориентироваться. Фактически, ощутимый перевес продукции Intel наблюдаем только в SPECfp — порядка 20%.

На этой «примиряющей» ноте, пожалуй, позволим себе подвести некоторые итоги.

Выводы

  1. Для начала отметим, что ожидающийся 23-го сентября процессор Athlon 64 с частотой в районе 2 ГГц, похоже, получится вполне конкурентоспособным продуктом. По крайней мере, он выглядит лучше, чем мы того боялись. Но хуже, чем хотелось бы :). Мы надеемся, что наша экстраполяция была не слишком грубой1 — впрочем, осталось не так много времени до момента, когда это станет известно точно. По нашим же расчетам, уже на частоте 2 ГГц Athlon 64 практически во всех проведенных тестах оказывается лидером среди настольных процессоров или, во всяком случае, очень близок к лидерству. Если же AMD сможет достичь частоты 2,2 ГГц в ближайшем будущем, то на полную победу у такого процессора будут действительно прекрасные шансы.
  2. Достаточно неожиданной для нас была разница, которую продемонстрировали Opteron и Athlon 64 на одинаковой частоте. Хотя «два больше, чем один» (если опираться на количество каналов памяти), выяснилось, что быстрый «один» гораздо эффективнее, нежели неторопливых «два». Впрочем, положение систем на Opteron должно заметно улучшиться с выходом ECC Registered DDR400. Пока же необходимо переосмыслить ранние тестирования в интернете, которые оценивали скорость Athlon 64, отталкиваясь от скорости однопроцессорных систем на Opteron, в предположении, что это более дорогой и, следовательно, более быстрый вариант. Это допущение оказалось неверным!
  3. По отрасли циркулируют слухи о том, что AMD объявит 23-го сентября не один вариант процессора Athlon 64 (под Socket 754), а два (!). Причем второй из них будет рассчитан на установку в платы c Socket 940! Другими словами, будет использовать те же платы, что и Opteron. Вопрос, который мы себе задаем, звучит так: а какую же память будет использовать этот процессор? Для десктопной системы использование памяти ECC Registered, во-первых, дорого, а во-вторых, как мы уже показали, практически бессмысленно и даже вредно для производительности! Увеличившаяся латентность съедает все преимущество расширенной пропускной способности памяти. У нас сложилось мнение, что этот вариант Athlon 64 будет уметь работать с обычной памятью DDR400! И тогда все становится на свои места: если низкая латентность, «оружие» процессора Athlon 64, сохранится, то расширение пропускной способности шины памяти можно только приветствовать! Более того, тогда появляется некая логика во всей этой истории — вариант с Socket 754 догоняет платформу конкурента, а вариант Athlon 64 для Socket 940 создает отрыв в производительности, эдакий Hi-End среди десктопов. Впрочем, не будем забывать, что это пока только слухи, и подождем официального объявления.
  4. Можно сказать смело: по сравнению с предыдущими процессорами AMD, производительность нового поколения заметно выросла. Более того, фактически, младшая (первая) модель для Socket 754 демонстрирует производительность на уровне топовых процессоров Pentium 4 и Athlon XP. Таким образом, есть явный смысл переходить на процессоры нового поколения — естественно, не забывая о такой «мелочи», как стоимость подобного перехода.

Ну а мы задачу этой части будем считать выполненной, сравнив между собой три архитектуры и продемонстрировав предполагаемый уровень производительности Athlon 64. Засим откланиваемся до следующей части!


Выражаем благодарность Яну Керученько aka C@t за примечание насчет метода экстраполяции



Дополнительно

iXBT BRAND 2016

«iXBT Brand 2016» — Выбор читателей в номинации «Процессоры (CPU)»:
Подробнее с условиями участия в розыгрыше можно ознакомиться здесь. Текущие результаты опроса доступны тут.

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.