Athlon 64 X2 4800+: самый быстрый двухъядерный x86 из существующих на данный момент



Итак, как мы и обещали в первой части цикла статей о двухъядерных процессорах, сегодня мы рассмотрим второй CPU из этой новой серии: AMD Athlon 64 X2 4800+.

«AMD Athlon 64 X2 Inside»

Как и двухъядерный процессор Intel, Athlon 64 X2 представляет собой, фактически, два почти полноценных процессора, интегрированных на один кристалл. Правда, если в случае с Pentium XE / Pentium D, «сборка» по идее должна получиться чуть большей величины, чем удвоенный оригинал (за счёт необходимости ввести в процессор арбитр общей для двух ядер шины), то в случае с Athlon 64 X2 она должна быть чуть меньше простой суммы двух процессоров, так как контролер памяти и контроллер шины Hyper Transport у двухъядерника от AMD всего один, то есть оба ядра делят их между собой. Соответственно, появился аналог шинного арбитра (привет, Intel!), организующего взаимодействие ядер с разделяемыми шинами. Впрочем, арбитр этот (по терминологии AMD — «Crossbar Switch») вроде бы способен организовывать еще и взаимодействие между самими ядрами (судя по всему, под этим понимается способность одного ядра «залезать» за нужными данными в L2-кэш второго, экономя таким образом на долгих обращениях к основному ОЗУ и снижая нагрузку на контроллер памяти, а также обеспечение когерентности кэшей). Выглядит всё это примерно так:


Блок-схема двухъядерного процессора AMD


…И собственно сам кристалл

Легко заметить, что отличия между концепциями двухъядерников Intel и AMD не очень существенны: так или иначе, у нас есть два вычислительных ядра, каждое из которых снабжено своими собственными кэшами первого и второго уровня. Вот если бы один из процессоров использовал схему с общим для двух ядер L2-кэшем, или, например, с раздельными L2, дополненными общим L3 — тогда можно было бы говорить о разнице в подходах. А так… в общем, всё одинаково. Даже механизм прямого взаимодействия двух ядер (без участия контроллера памяти) AMD полностью скопировала еще с лохматой давности Athlon MP (два таких процессора в SMP-системе тоже умели «общаться напрямую»). В общем, каждая компания просто использовала все свои старые наработки, применимые к данному случаю. Справедливости ради заметим, что у AMD их оказалось чуть больше…

Также весьма выгодным бонусом нового процессора AMD является то, что он, в отличие от Pentium XE и Pentium D, может работать (по заявлениям самой AMD, которым, впрочем, нет оснований не верить) не только на специально рассчитанных на его установку платах, но и на любой плате для Socket 939, которая может выдержать, например, Athlon 64 FX. Правда, BIOS все равно потребуется проапдейтить, так как если он «не понимает» Athlon 64 X2 — то долгожданной многоядерности мы не получим: операционная система увидит лишь одно ядро из двух. Не хотелось бы накаркать, но у некоторых производителей системных плат это может вызвать не очень хорошее желание «продать одну плату два раза», просто отказавшись выпускать для своих старых продуктов обновление BIOS в связи с выходом Athlon 64 X2, и выпустив вместо этого «специальные варианты» под двухъядерник. Впрочем, даже если таковые и найдутся, будем надеяться, они останутся в меньшинстве…

Сравнительные технические характеристики

Здесь мы просто приведём табличку, в которой сосредоточена самая важная информация о характеристиках двухъядерных и топовых одноядерных процессоров от двух компаний. С нашей точки зрения, объяснения в данном разделе излишни: те, кто интересуется техническими подробностями, должны всё понять и без них. Заметим только, что важных и не совсем очевидных изменений (по сравнению с топовыми одноядерниками) у двухъядерников Intel и AMD, соответственно, два и три: Pentium XE 840 обзавёлся технологией уменьшения энергопотребления EIST, но его шина «откатилась назад» с 1066 МГц на 800, Athlon 64 X2 4800+ обзавёлся поддержкой SSE3 и усовершенствованным контроллером памяти, кроме того, он производится уже по 90-нанометровому техпроцессу. Об увеличении размеров ядра, количества транзисторов и энергопотребления, лишний раз напоминать, наверное, не стоит: это очевидно.

Характеристика Athlon 64
FX-55
Pentium 4 XE
3.73 GHz
Athlon 64 X2 4800+ Pentium XE 840
Техпроцесс, нм 130 90 90 90
Количество транзисторов, млн. 106 169 233 230
Площадь ядра, кв. мм 193 135 199 206
Сокет Socket 939 LGA775 Socket 939 LGA775
Частота ядра, МГц 2600 3730 2 x 2400 2 x 3200
Размер L1D, КБ 64 16 2 x 64 2 x 16
Размер L1I 64 KB 12 Kuops 2 x 64 KB 2 x 12 Kuops
Размер L2, КБ 1024 2048 2 x 1024 2 x 1024
ПС процессорной шины (Intel), МГц 1066 (4x266) 800 (4x200)
ПС контроллера памяти (AMD), МГц 800 (2x400) 800 (2x400)
Поддержка расширенных наборов команд MMX, 3DNow!, SSE, SSE2 MMX, SSE, SSE2, SSE3 MMX, 3DNow!, SSE, SSE2, SSE3 MMX, SSE, SSE2, SSE3
Поддержка 64-битных расширений x86 AMD64 EM64T AMD64 EM64T
Поддержка DEP NX XD NX XD
Технология управления энергосбережением и нагревом Cool'n'Quiet Cool'n'Quiet EIST
TDP, Вт 103 115 110 130

Тестирование

Конфигурация тестовых стендов

  • Процессоры
    • Intel Pentium eXtreme Edition 840 (2 x 1 MB L2, 800 MHz FSB, 2 x 3.2 GHz core)
    • Intel Pentium 4 540J (1 MB L2, 800 MHz FSB, 3.2 GHz)
    • AMD Athlon 64 FX-55 (1 MB L2, 2.6 GHz)
    • AMD Athlon 64 4000+ (1 MB L2, 2.4 GHz)
    • AMD Athlon 64 X2 4800+ (2 x 1 MB L2, 2 x 2.4 GHz core)
  • Системные платы
    • Intel D955XBK Desktop Board (чипсет Intel 955X)
    • Albatron K8SLI (чипсет NVIDIA nForce4 SLI)
    • ASUS A8N-SLI Deluxe (чипсет NVIDIA nForce4 SLI)
  • Память
    • 2x512 МБ PC3200 (DDR400) DDR SDRAM DIMM 2-2-2-5 (Corsair TwinX)
    • 2x512 МБ PC5400 (DDR2-533) DDR2 SDRAM DIMM 3-3-3-8 (Corsair)
  • Видеокарта ATI Radeon X800 (256 MB)
  • Жесткий диск Samsung SP1614C (SATA), 7200 об/мин, 8 МБ кэша
  • Блок питания: FSP 550-60PLN (500-550W)
  • Windows XP Professional SP2, DirectX 9.0c
  • ATI CATALYST 5.4 (Display Driver 6.14.10.6525)

Легко заметить, что мы использовали самые «прогрессивные» и (предположительно) быстрые чипсеты, что вполне соответствует статусу тестируемых процессоров. Всё это — топовые решения, поэтому лозунг «Долой экономию!» в данном случае выглядит вполне оправданно.

Отдельно хотелось бы отметить работу блоков интеллектуального управления скоростью вращения вентиляторов на тестовых стендах с многоядерными процессорами: во-первых, «оно действительно работает» в состоянии покоя вентиляторы довольно быстро сбрасывали обороты, и вращались практически бесшумно. А вот «во-вторых» для стенда на базе Pentium XE выглядит менее оптимистично: шум её штатного боксового кулера при максимальных оборотах был намного громче, чем у системы на базе Athlon 64 X2. Кроме того, возникло субъективное впечатление, что на системе с процессором Intel вентилятор «возбуждался» намного быстрее (имея в виду время с момента запуска теста и до увеличения оборотов).

Результаты тестов

Напомним, что диаграммы со всеми результатами тестов (в количестве 65 штук), вынесены на отдельную страницу без комментариев, просто «as is». В статье же приведены только сводные диаграммы, объединяющие результаты целой группы тестов в некий средний балл. Такой подход позволяет с одной стороны удовлетворить любопытство особо пытливых читателей, возражающих против сокращения количества приводимых в статьях результатов тестов, а с другой сделать «основной» материал менее пёстрым и насыщенным графикой. Что касается комментариев, то предполагается, что настоящим профи, интересующимся подробностями, они без надобности.

SPECapc for 3ds max 6 + 3ds max 7.0

Полный набор диаграмм

В данном случае Athlon 64 X2 4800+ выигрывает у двухъядерного Pentium XE уже полностью и везде (желающие могут обратиться к полному набору диаграмм с результатами тестов). В общем-то, это было можно предсказать ещё по результатам сравнения Pentium XE 840 с Athlon 64 FX-55: даже FX-55 уже выиграл у XE 840 в общем зачёте за счёт высокого балла в подтесте Interactive, а сейчас топовый процессор AMD благодаря двухъядерности ещё и существенно «подтянул» рендеринг (общеизвестно, что рендер-движки очень хорошо распараллеливаются, и на них в некоторых случаях второй процессор может дать даже все 100% ускорения).

Показателен также одинаковый результат одноядерного Athlon 64 4000+ и Pentium XE 840. Понятно, что одинаковый общий балл получен за совершенно разные достоинства: в случае с процессором AMD за счёт высокого результата в подтесте Interactive, в случае с процессором Intel за подтест Rendering. Однако всё равно показательно: «младший брат» Athlon 64 X2 4800+ (одноядерный Athlon 64 4000+, у которого единственное ядро работает на той же частоте, на которой у X2 4800+ функционируют два) в общем зачёте идёт вровень с самым быстрым из двухъядерных процессоров Intel…

Maya 6.5

Мы наконец-то устранили основной «прокол» теста SPECapc для Maya отсутствие подтеста на скорость рендеринга, путём введения своего собственного. Так что теперь в разделе, посвящённом Maya, будет две диаграммы: с общим баллом теста от SPEC, и со скоростью рендеринга. Отрендеренная сцена выглядит вот так:






Полный набор диаграмм

Расстановка сил достаточно сложная: в тестах SPEC быстрее всех оказываются одноядерные процессоры, при этом топовые «экстримы» от обоих производителей идут практически вровень. Двуядерник AMD чуть-чуть обгоняет двухъядерник Intel, но скорее не за счёт лучшей реализации двухъядерности, а просто за счёт того, что ядро от AMD, работающее на частоте 2.4 ГГц, быстрее ядра от Intel, работающего на частоте 3.2 ГГц. В рендеринге ситуация сохраняется: экстремальные одноядерники идут вровень, двухъядерный AMD самую малость обгоняет двухъядерный Intel. В целом, можно сказать, что AMD побеждает «по очкам», но с минимальным отрывом.

Lightwave 8.2, рендеринг

Ситуация в целом схожа с Maya, но более сложная: в соревновании одноядерных процессоров побеждает все-таки Intel с её Pentium 4 eXtreme Edition 3.73 GHz, а вот в подгруппе двухъядерных CPU быстрее оказался AMD Athlon 64 X2 4800+. Впрочем, как в первом так и во втором случае преимущество победителя не очень велико.

SPECapc for SolidWorks 2003

Полный набор диаграмм

Здесь правит бал AMD, её процессоры заняли все 3 верхних места. Однако способность SolidWorks 2003 (или теста SPEC для этой программы, если придираться) задействовать второе ядро, находится под вопросом. Разница между Pentium 4 540J и Pentium XE 840 — практически отсутствует. Однако между Athlon 64 4000+ и Athlon 64 X2 4800+ она всё-таки составляет порядка 4%, что вряд ли может вписаться в погрешность измерений! Так всё-таки задействует SolidWorks второе ядро, или нет? Нам кажется, что нет. Об этом свидетельствует почти полное отсутствие различий между результатами одно- и двухъядерных процессоров Intel, а выигрыш двухъядерника от AMD можно объяснить наличием усовершенствованного контроллера памяти и (возможно, если данный набор применяется) наличием поддержки SSE3. Наверное, учитывая всё вышеизложенное, это будет более вероятное объяснение.

Adobe Photoshop CS (8)

Полный набор диаграмм

В нашем тесте для Adobe Photoshop 8 примерно одинаковые по «рангу» процессоры Intel и AMD обычно занимают, соответственно, первое и второе место, то есть преимущество, пусть и небольшое, демонстрирует платформа Intel NetBurst. Однако в случае с двухъядерными CPU, как легко заметить при взгляде на диаграмму с общим балом, это преимущество уже чисто номинальное (1 секунда!), и вполне вписывается в неизбежно присутствующую погрешность измерений (то есть если прогнать тест ещё раз, возможно, на секунду или пару секунд быстрее окажется уже двухъядерник от AMD). Таким образом, мы наблюдаем примерный паритет. Если обратиться к подробным диаграммам, мы увидим, что двухъядерник Intel более-менее существенно выигрывает в таких операциях как преобразование цветов, и Unsharp Mask, в то время как Athlon 64 X2 4800+ оказывается быстрее в эффектах освещения и Resize. А вот Pentium 4 XE 3.73 GHz всё-таки однозначно быстрее Athlon 64 FX-55.

Adobe Acrobat 6.0

Как ни странно, Adobe Acrobat 6 Distiller, видимо, оптимизирован под SMP-архитектуры, так как двухъядерники (как Intel, так и AMD) демонстрируют довольно существенное превосходство над одноядерными собратьями с той же частотой работы ядра. Общее преимущество в данном тесте — за процессорами AMD.

«Универсальное» сжатие данных (архивация)

Полный набор диаграмм

Во всех предыдущих тестах процессоры Intel получали достаточно сильную «компенсацию» своему уже ставшему традиционным проигрышу в подтесте WinRAR, за счёт результатов другого архиватора 7-Zip. Последний умеет задействовать оба процессора, поэтому CPU от Intel с поддержкой Hyper-Threading в нём как правило оказывались лучше. Однако в данном случае у нас в тестах присутствует процессор от AMD с двумя «честными» ядрами, и в 7-Zip все процессоры Intel ему тоже проиграли. В результате, на сводной диаграмме превосходство «группы AMD» стало ещё более явным.

Сжатие мультимедийных данных с потерями (MP3/MPEG2-4)

Полный набор диаграмм

В данном разделе мы всё-таки настоятельно рекомендуем всем обратиться к детальным диаграммам, поскольку проигрыш (пусть и весьма незначительный) двухъядерного процессора AMD представителю Intel в той же подгруппе (Pentium XE 840) объясняется действительно существенным отставанием Athlon 64 X2 4800+, но… только в двух подтестах из шести! Ситуация такова: Athlon 64 X2 4800+ проиграл Pentium XE 840 в кодировании MP3 со средним качеством, очень сильно проиграл в кодировании MP3 с «наивысшим» (параметр Q=0) качеством, и… выиграл во всех остальных подтестах! То есть видео (MPEG2/MPEG4) двухъядерник AMD кодирует всё-таки быстрее, несмотря на номинально чуть более плохой результат на сводной диаграмме.

CPU RightMark 2004B

Полный набор диаграмм

Да, воистину, сегодняшнее тестирование можно назвать (хотя некоторым это может показаться чересчур эмоциональной оценкой) «падением многих последних бастионов Intel». Вот и CPU RightMark… Традиционно, процессоры AMD выигрывали в блоке расчёта (Solver), и проигрывали в модуле рендеринга за счёт того, что он многопоточный. Однако двухъядерный Athlon 64 X2 изменил ситуацию в корне: теперь топовый процессор AMD выигрывает и в модуле рендеринга, и, стало быть… выигрывает и в общем зачёте!

Отдельно остановимся на эффекте «суперприроста производительности» (более 100%!) у двухъядерных процессоров (причём как Intel, так и AMD). На самом деле такая, казалось бы, невозможная вещь вполне возможна, и даже достаточно легко объяснима. Дело в том, что в случае с одним CPU, он некоторое время занимается решением физической задачи (модуль Solver), и некоторое время рендерингом (модуль Render). При этом следует учесть, что производительность Solver'а в десятки раз выше, чем производительность Render'а. Получается, что самый медленный процесс (Render) ещё и прерывается иногда на некоторое количество квантов процессорного времени, чтобы рассчитать очередной кадр в Solver'е.

Что же происходит при добавлении второго ядра? Модуль Solver однопоточный, поэтому для него… ничего не происходит. Модуль Render многопоточный, поэтому все ресурсы второго ядра задействуются именно модулем рендеринга! А учитывая то, что именно он и является основным «бутылочным горлышком» в CPU RightMark, становится понятно, почему появление второго ядра увеличивает общую скорость более чем в 2 раза: второй процессор (второе ядро) уделяет рендерингу всё своё время, в то время как одиночный (первый) CPU тратит время и на переключение с Solver на Render, и на собственно сам Solver.

Трехмерные игры и визуализация графики
в профессиональных пакетах

DOOM 3


Far Cry

Painkiller

Unreal Tournament 2004

Общий балл по играм

Полный набор диаграмм

В данной подгруппе тестов ничего интересного не наблюдается: задействовать второе ядро игры пока не умеют, поэтому результаты одноядерных процессоров практически такие же, как у двухъядерных. Несколько больше вырывается вперёд двухъядерник от AMD (по сравнению с одноядерным CPU с той же частотой), но это вполне объяснимо усовершенствованным контроллером памяти (и, возможно, введением поддержки SSE3). А общее преимущество процессоров AMD в игровых приложениях уже давно не является новостью…

SPEC viewperf

Полный набор диаграмм

Как и раньше, нам остаётся только констатировать, что визуализация трёхмерной графики в профессиональных пакетах не разнится в своих предпочтениях с визуализацией игровой трёхмерной графики: AMD впереди, эффект от второго ядра практически равен нулю. Впрочем, новый контроллер памяти и в этом случае сыграл на руку AMD Athlon 64 X2 4800+.

Падение скорости исполнения основного процесса при различном количестве фоновых

Это несколько усовершенствованная версия того нового теста, который присутствовал в нашей предыдущей статье. Сегодня мы решили «пригрузить по максимуму» все процессоры, которые присутствовали на тестовых стендах, а ведь максимальное их количество (с учётом «виртуальных») равно четырём: двухъядерный Pentium XE 840 с поддержкой Hyper-Threading видится операционной системой именно как 4 CPU. Соответственно, для того чтобы окончательно и бесповоротно «просадить» производительность 4-процессорной системы, нам понадобилось в общей сумме 5 активных процессов (на 1 процесс больше, чем количество CPU). Поэтому тестирование проводилось так:

  1. Сначала, запускался бенчмарк Far Cry (Volcano) в режиме с высоким качеством (1024x768x32, соответствующие установки сложности графики), и замерялась производительность в режиме, когда основному процессу никто не «мешает». Этот результат брался за основу (первую точку на графике).
  2. Потом запускалось кодирование MP3 с помощью LAME, окно процесса сворачивалось (это важно, чтобы ОС «поняла», что данный процесс является фоновой задачей). После чего запускался всё тот же бенчмарк Far Cry (Volcano), и замерялась скорость (в кадрах в секунду). Соответственно, мы видели, насколько сильно активный фоновый процесс, задействующий ресурсы CPU, помешал исполнению основного.
  3. Задача усложнялась: параллельно с бенчмарком Far Cry запускалось не только кодирование MP3 с помощью LAME, но и архивирование файлов с помощью 7-Zip (всё это, по сути, наши стандартные тесты, только в данном случае они исполняли роль фоновых процессов).
  4. К кодированию MP3 с помощью LAME и архиватору 7-Zip добавлялся ещё один фоновый процесс: преобразование PostScript-файов в формат PDF с помощью Adobe Distiller.
  5. Количество фоновых процессов увеличивалось до четырех за счёт добавления ко всему вышеперечисленному кодирования MPEG4 (XviD) с помощью VirtualDub.

Кроме того, чтобы не загромождать график (и не ухудшать его читаемость), мы решили выбросить из данного теста менее интересные и не имеющие прямого отношения к предмету тестирования Athlon 64 FX-55 и Pentium 4 XE 3.73 GHz. Таким образом, у нас остались только двухъядерники, и одноядерники, работающие на одной с двухъядерниками частоте.

Разумеется, никакого отношения к реальной работе данный тест не имеет. Практически невозможно представить себе человека (в здравом уме и трезвой памяти), который будет одновременно архивировать файлы, кодировать MP3 и MPEG4, и «дистиллировать» PostScript. Однако мы не ставили перед собой задачи смоделировать реальную работу пользователя. Задача была из разряда чисто синтетических: посмотреть, как будет падать скорость основного процесса при добавлении всё большего количества фоновых, у разных процессоров. Напомним, что среди участников теста наблюдается достаточно большой «зоопарк» по части реально/виртуальной многопроцессорности:

  1. «Честный» одноядерник Athlon 64 4000+.
  2. «Виртуальный» двухъядерник Pentium 4 540J. Который, впрочем, простым отключением Hyper-Threading превращается в честный одноядерник.
  3. Честный двухъядерник Athlon 64 X2 4800+.
  4. Виртуальный четырехъядерник Pentium XE 840. Который, опять-таки, легко превращается в честный двухъядерник с помощью отключения Hyper-Threading.

А теперь посмотрим на графики. Обратим ваше внимание на то, что с целью увеличения масштаба ось Y начинается не с нуля, а с наиболее низкого значения fps в данном тесте.

Напомним ещё раз, что мы оценивали падение производительности основного процесса в зависимости от количества активных фоновых. То есть скорость исполнения фоновых процессов нас не интересовала, и не оценивалась. Они лишь создавали фоновую нагрузку на CPU. Что же мы видим?

  1. Честные одноядерники (AMD Athlon 64 4000+, тёмно-зелёная линия; Intel Pentium 4 540J с отключенной Hyper-Threading, тёмно-коричневая линия) «проседают» сразу и намного. Фактически, скорость выполнения основного процесса сразу же падает больше чем в 2 раза, в данном конкретном случае (с игрой Far Cry) делая основной процесс «непригодным для использования по назначению»: играть в ЭТО (судя по визуальному наблюдению за прохождением демки) было бы практически невозможно, так как кроме низкой скорости наблюдается характерный эффект «движения рывками», привыкнуть к которому смог бы, наверное, только Терминатор с его железными нервами.
  2. Существенно меньше проседает от единичного фонового процесса Pentium 4 540J при включенной Hyper-Threading (красная линия). Кроме того, визуальное наблюдение за процессом прохождения бенчмарка не выявило рывков: скорость просто стала чуть-чуть меньше.
  3. Но ещё более забавна реакция Pentium 4 + HT на два и три фоновых процесса: при трёх фоновых процессах скорость оказалась… выше, чем при двух! Нам пришло в голову только одно объяснение, которое мы назвали «эффектом прыгающего основного процесса». Суть его (по нашим предположениям) состоит в следующем: два фоновых процесса, будучи запущены раньше основного, «оккупируют» после запуска каждый по одному CPU. В результате чего третий процесс (основной!) оказывается в самой неприятной ситуации: именно он вынужден постоянно «перепрыгивать» с CPU 0 на CPU 1 и обратно, так как ввиду нечётного общего количества активных процессов, «прилепить» его жёстко к одному процессору планировщик задач отказывается.
  4. Честные двухъядерники (AMD Athlon 64 X2 4800+, ярко-зелёная линия; Intel Pentium XE 840 с отключенной Hyper-Threading, тёмно-синяя линия) ведут себя одинаково: добавление одного фонового процесса практически не оказывает влияния на скорость основного, добавление второго фонового существенно просаживает производительность, добавление третьего фонового даже чуть ускоряет основной (судя по всему, мы опять наблюдаем избавление от «эффекта прыгающего основного процесса»).
  5. Наиболее плавную линию падения производительности мы наблюдаем всё-таки у «виртуального четырёхъядерника» (Intel Pentium XE 840 с включенной Hyper-Threading, голубая линия). При добавлении очередного фонового процесса, скорость основного всегда падает, но каждый раз не очень сильно.

Основной вывод из всего вышеописанного будет, пожалуй, таким: всё-таки технология Hyper-Threading, не смотря на то, что она, безусловно, не является заменителем честной многоядерности, имеет смысл. «Виртуальное удвоение» числа процессоров сказывается в основном не на скорости исполнения основной задачи, а на комфортности работы в ней, в том случае, если ее исполнение сопровождается некоторым количеством активно работающих фоновых процессов. Двуядерность без Hyper-Threading, как мы видим, менее гибка в данном отношении: она характеризуется более глубокими и резкими «провалами» при последовательном увеличении количества фоновых процессов. Особенно хорошо видны эти провалы, когда мы наблюдаем переход от чётного (включая основной!) количества процессов к нечётному.

Заключение

Неожиданностью называют то, что случается,
когда люди долгое время упорно не желают
замечать очевидного.
(Выловлено в каком-то форуме)

Итак, до выхода многоядерных процессоров мы все наблюдали определённый паритет: время от времени то Intel, то AMD выпускали очередного «монстра», который был на пару процентов быстрее топового процессора конкурента, за счёт чего получал (на пару-тройку месяцев, а то и меньше) титул «самого быстрого десктопного x86 CPU». И, в общем-то, ситуация всех устраивала. Энергопотребление (и, соответственно, тепловыделение) у процессоров Intel росло в последнее время несколько быстрее, чем у AMD, но до тех пор пока «оно работало» скажем прямо, подавляющее большинство пользователей этот рост не интересовал (тем более что он был достаточно плавным). В конце концов, даже Самые Страшные значения энергопотребления современных CPU вряд ли смогут переплюнуть какую-нибудь многорожковую люстру в большой комнате, а между тем у многих из нас нечто подобное имеется, и как-то ходим мимо и не замечаем даже… Подытоживая: описанная выше тенденция (процессоры Intel потребляют больше и греются сильнее) ни для кого секретом не являлась.

Также не являлась секретом и другая тенденция: количество транзисторов в процессорах Intel, начиная с выхода первых CPU на базе ядра Prescott, стало ощутимо превосходить количество транзисторов в процессорах AMD (сравните достаточно скромные 106 млн. у топового Athlon 64 FX-55 и 125 млн. у относительно рядовой линейки Pentium 4 5xx). И это притом, что по идее у AMD в процессорах на ядре K8 транзисторов должно быть больше: ведь размер кэша и там и там одинаковый (1 МБ), но в Athlon 64 интегрирован ещё и двухканальный контроллер памяти, плюс контроллер шины Hyper Transport. Однако «так вот сложилось»…

А теперь я задам вам провокационный, но банальный вопрос: так у кого же, в свете всего вышеописанного, должен был лучше получиться процессор с двумя ядрами?

Собственно, нам лишь остаётся констатировать: у кого должен был у того и получился. То, что в случае с одноядерными процессорами являлось для процессоров Intel лишь досадной, но в целом не столь существенной помехой при конструировании двухъядерного CPU стало основным камнем преткновения. Сейчас модно вспоминать, что, мол, AMD «давно говорила о многоядерности», и на этом основании делать вывод, что, дескать, её процессоры «специально разрабатывались» с учётом возможности интеграции двух ядер в один CPU. Разумеется, возможно и такое. Как-то не довелось участвовать в их разработке, поэтому возразить ничего не могу. Однако лично я не вижу в конструкции ядра AMD K8 ничего «специфически многоядерного». За исключением главного: если понимать под «проектированием под многоядерность» разработку относительно мало потребляющего процессора с низким (для десктопов) тепловыделением о, тогда да! Тогда «изначальная ориентация на многоядерность», безусловно, видна.

Подводя итог: суть нынешней победы (на сей раз безоговорочной и более чем убедительной) AMD Athlon X2 4800+ над Pentium XE 840, состоит в том, что AMD оказалась готова к воплощению «в кремний» концепции двух ядер на одном кристалле. Intel, увы, к воплощению этой концепции оказалась де-факто не готова: сегодняшнее мейнстримовое ядро на базе архитектуры NetBurst (очередная реинкарнация «базового» Prescott) слишком много потребляет и слишком сильно греется. Для обычных CPU ещё в пределах допустимой нормы (работают ведь топовые Pentium 4!), но для разработки сопоставимого по частоте с топовыми одноядерниками двухъядерного процессора слишком сильно. Чему, собственно, и обязан Pentium eXtreme Edition 840 своей более чем скромной (по сравнению опять-таки с топовыми Pentium 4) частотой. Именно низкая частота двухъядерника Intel не оставила ему шансов на победу: если бы она была равна не 3.2, а, например, 3.8 ГГц всё могло бы сложиться совсем по-другому. А раз уж речь зашла про «могло бы сложиться», то давайте попробуем немного пофантазировать. Итак: что же будут делать два основных конкурента завтра, учитывая то, как сложилось для них сегодня?

AMD

  1. Достигнув примерного паритета (не будем считать единицы процентов) с Intel в производительности одноядерных десктопных CPU и, одержав убедительную победу в секторе двухъядерных решений, компания может некоторое время… вообще ничего не делать. Просто почивать на заслуженных лаврах. Правда, такое действие чревато, так как Intel уж точно стоять на месте не станет, и с текущим положением вещей вряд ли смирится.
  2. Наверное, будет разумно сосредоточить усилия на отладке производства и введении в строй новых производственных мощностей. Ни для кого не секрет, что мощности эти у AMD намного скромнее, чем у Intel, а если люди, прочитавшие, например, этот обзор, захотят Athlon 64 X2 купить, но не смогут этого сделать то впечатление от рекордных скоростных показателей может существенно подпортиться…
  3. Достаточно логично будет неспешно расширять номенклатуру двухъядерных процессоров «вниз» в сторону меньших частот, но и более демократичной цены. В конце концов, ждать скорого выпуска существенно более высокочастотных двухъядерников от Intel, вряд ли стоит, значит, успех на самом верху следует закрепить в средней ценовой категории.
  4. Как ни странно, именно в случае с двухъядерными CPU (которые, по идее, призваны обеспечить не только высокое быстродействие на единичной задаче, но и более комфортную работу при активных фоновых процессах), вполне привлекательно смотрится идея о введении в процессоры AMD поддержки аналога технологии Hyper-Threading. По крайней мере, «плавная кривая» Pentium XE 840 меня, признаться, сильно впечатлила, причём безотносительно его производительности.
  5. Пожалуй, всё. Рост частоты двухъядерных процессоров самой AMD (существенный, подчеркнём, рост) вряд ли следует ожидать: в пользу этого предположения говорит хотя бы то, что топовый одноядерный Athlon 64 FX-55 имеет частоту всего лишь на 200 МГц больше, а FX-57 пока не видно…

Intel

  1. Вариант действий «от противного»: завалить рынок относительно недорогими двухъядерниками, пусть даже с ещё меньшей, чем у топовых Pentium XE 840 / Pentium D 840 частотой и производительностью. В отличие от AMD, Intel явно может более вольготно манипулировать своими производственными мощностями, так что данный вариант выглядит вполне реально. В таком случае, если на двухъядерники будет достаточно большой спрос, сложится парадоксальная ситуация: самыми быстрыми так и останутся Athlon 64 X2, но себе в компьютер большинство пользователей со средним уровнем достатка сможет поставить только Pentium D.
  2. Начать (продолжить?…) кардинальную переработку ядра Prescott (вариант: разработать какое-то другое ядро специально для многоядерных CPU), и с этим новым ядром выпустить процессор, который сможет соперничать в плане чистой скорости с Athlon 64 X2, включая топовый 4800+. Не нужно быть семи пядей во лбу, чтобы понять, что этот вариант так или иначе всё равно будет отрабатываться, потому что в долгосрочной перспективе иного выхода у Intel нет. Вопрос лишь в том, насколько быстро такое ядро удастся создать и отладить.
  3. «Поворот все вдруг» (термин из тактических учебников военно-морского флота: по команде флагманского корабля, весь строй кораблей совершает одновременный поворот на новый курс). В данном случае: отказ от NetBurst (по крайней мере, в многоядерных решениях) и перевод двухъядерников на малогреющееся ядро с малым потреблением. В голову приходит, понятное дело, только одно: Banias/Dothan, Pentium M. Однако несмотря на оптимизм многих пользователей по поводу производительности Pentium M в пересчёте на мегагерц и его низкого потребления, в долговременной перспективе такой шаг выглядит как палка о двух концах: можно допустить (в качестве предположения), что сделав двухъядерник на базе топового Pentium M, Intel удастся догнать Athlon 64 X2 4800+ по производительности прямо сейчас. То есть разрыв будет сокращен в минимальные сроки, все довольны, все смеются… А потом? Нет никаких свидетельств того, что Pentium M будет хорошо масштабироваться по частоте: пока что она у него «застыла». Получится, что перестроив значительную часть производства под новое ядро, Intel упрётся в ту же стенку, что и раньше, получив в качестве весьма сомнительного (относительно затрат) «приза»… то, что она всего лишь догонит основного конкурента в секторе многоядерных решений. Стоит ли овчинка выделки?
  4. Ещё один вариант, как ни странно, звучит так же, как и первый вариант для AMD: просто ничего не предпринимать. По крайней мере, в ближайшее время. Действительно: основные объёмы продаж сейчас делают обычные одноядерные CPU, и эта тенденция сохранится ещё довольно долго. А они у Intel продаются как горячие пирожки, что бы ни говорили. Следовательно, можно просто «забыть» о временной неудаче во всего лишь одном (и отнюдь не самом крупном) секторе рынка x86 CPU, и, например, относительно неспешно разрабатывать и отлаживать какую-то принципиально новую архитектуру (см. п. 2).

Однако независимо от того, как пойдут дела дальше, на сегодняшний день можно с уверенностью утверждать одно: давненько мы не видели такой ситуации, когда Intel было бы действительно практически нечем ответить на вызов AMD в плане производительности топового x86-процессора на самом перспективном направлении их развития (а им обе компании дружно признали именно многоядерность). Пожалуй, не видели мы такого со времен Pentium 4 Willamette. Однако будем надеяться, что у компании всё же найдётся в конечном итоге «второй Northwood»: думаю, даже самые ярые поклонники AMD не хотели бы видеть её в секторе высокопроизводительных многоядерных x86 CPU в гордом одиночестве.




Дополнительно

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.