Процессоры Intel Xeon в конструктиве LGA1366


В прошлой статье мы ознакомились с производительностью всех процессоров линейки Core i7 с разъемом LGA1366. Сделать это было несложно, но достаточно скучно — если не считать возможностей разгона в экстремальных версиях процессоров, то все они очень похожи друг на друга. Фактически, в штатном режиме все эти приборы различаются лишь «базовой» тактовой частотой, да скоростью работы линка QPI. Словом, в незначительной степени, так что, зная результаты двух процессоров семейства, путем несложной экстраполяции можно получить информацию о производительности любого другого его представителя. Попытались ввести небольшую интригу, положившись на то, что де-юре, отвергая возможность использования памяти DDR3 с частотой выше 1066 МГц совместно с Core i7, компания Intel де-факто начала ее «одобрять» в последних версиях BIOS своих материнских плат, но не получилось. Более-менее заметный прирост в реальных приложениях, как оказалось, можно получить разве что, «не трогая» относительные тайминги при повышении частоты, но во всех остальных случаях в некоторых программах наблюдается даже снижение производительности. Все просто и скучно.

Не менее просто и скучно на текущий момент выглядит и семейство процессоров Xeon серии 3500, но линейка 5500 гораздо многограннее. Во-первых, в нее входят кристаллы с самым разным значением TDP. Во-вторых, они различаются и официальной поддержкой разных вариантов памяти, а также гораздо шире диапазон изменения скорости QPI (впрочем, как мы уже убедились, существенного влияния на итоговую производительность на нашей тестовой смеси ни первое, ни второе не оказывает). В-третьих, фирменная особенность Nehalem — возможность не только снижать, но и повышать тактовую частоту (чего в более ранних процессорах не было), в некоторых моделях Xeon развито в большей степени, нежели «в прочих» Xeon и всех Core i7 LGA1366. В противовес чему некоторые модификации Xeon вообще не поддерживают не только Turbo-Boost, но и Hyper-Threading. Но еще более интересно то, что в рамках семейства 5500 прописались процессоры не только с кэш-памятью L3 8 МБ, но и с урезанной вдвое. И даже один двухядерник в нем есть. К сожалению, правда, не для всех материнских плат есть поддержка моделей 550х — наша с ними в принципе «не заводится». Так что вопрос их производительности, равно как и выяснение степени полезности двухсокетных решений, мы оставим для следующего раза. Сегодня у нас на повестке дня четыре «полноценных» Xeon и несколько сопутствующих вопросов. С них мы и начнем.

Turbo-Boost и Xeon 5500

Когда мы тестировали Xeon X5560 даже достоверной информации о данном процессоре не было, а BIOS материнской платы был гораздо более ограничен по возможностям, нежели сейчас, так что метод определения параметров «турбо троттлинга» путем использования процессоров Extreme Edition не был освоен. В итоге, получив более высокие результаты, нежели можно было предположить на основании поведения Core i7, мы пришли к выводу, что они связаны с использованием более высокочастотной памяти. Однако тестируя в прошлый раз процессоры линейки Core i7 мы выяснили, что переход на DDR3-1333 не так и много дает даже старшим моделям процессоров. Сказать по правде, ничего не дает – в некоторых тестах результаты получаются более низкие, чем могли бы. С чем связаны полученные нами ранее более высокие показатели Xeon семейства Х, нежели у Core i7, при одинаковой номинальной частоте?

А ларчик открывается просто. Секрет в очередной раз в тонкостях функционирования «буст-режима». Схему, по которой работают Core i7 и Xeon 3500, формально можно назвать +2-1-1-1, то есть частота каждого ядра повышается на две или одну степень множителя, в зависимости от характера нагрузки: загружено одно ядро, два, три или все. «Формально», поскольку, на самом деле, прирост частоты не относительный: просто для каждого из этих режимов задаются свои множители —  так же, как задан стартовый. В результате, кстати, при включенном Turbo Boost не работает старый «дедовский» способ получения младшего процессора из старшего путем снижения множителя: стартовый мы снизим, однако в «буст-режиме» процессор будет разгоняться все до тех же частот (если, конечно, не рассматривать экстремальные модели, где можно настроить все, что угодно). Но Xeon X55x0 «разгоняются» более агрессивно — для них соответствующей формальной схемой работы будет уже +3-3-2-2. Что из этого следует? При любом количестве потоков Xeon 5500 может работать на большей итоговой тактовой частоте, что и Core i7 той же номинальной частоты. Как минимум, «на ступеньку выше», а в двухпоточных приложениях на все две. То есть, с точки зрения номинальной табличной частоты, Xeon X5570 — это аналог Core i7 940. Но если сравнивать по частоте «буст-режима» — это уже процессор, близкий к Core i7 950.

А что у нас с моделями линеек E и L? А там все еще интереснее. Часть представителей этих подсемейств не поддерживают Turbo-Boost, а остальные функционируют по схеме +2-2-1-1. Из этого следует, что Е5540 вполне может иногда догонять Core i7 920, имея на 133 МГц более низкую частоту. Иногда — только в двухпоточных приложениях. С другой стороны, среди «типичных настольных», которые активно используются в нашей методике таковых очень много. И посмотрим, как это скажется на практике.

Еще больше сравнение частот усложняет то, что Core i7 и Xeon 5500 не только по-разному умеют частоту увеличивать — они еще и снижают ее по-разному, поскольку вписываются в разные тепловые пакеты. Пример мы уже приводили в предыдущей статье: при попытке «прогреть» процессор выше 80 Вт Core i7 будет работать в «буст-режиме», а Xeon Х5500 уже его отключит. При дальнейшем повышении нагрузки, когда энергопотребление дойдет до 95 Вт, у Xeon уже начнет срабатывать троттлинг, а Core i7 будет, по-прежнему, частоту повышать. То есть сейчас управление электропитанием и рабочей частотой дошло уже до того уровня, когда не только нельзя «в лоб» сравнивать процессоры разных архитектур по тактовой частоте — уже и одинаковые ядра начинают вести себя совершенно по-разному. Номинальные 2,93 ГГц Xeon — это совсем не то же , что 2,93 ГГц Core i7 на практике.

Попутно, кстати, можно дать ответ на вопрос — зачем компании Intel после перехода на новый степпинг потребовались Core i7 950 и 975 Extreme Edition вместо 940 и 965 ЕЕ. Для первой ревизии Bloomfield Intel мог гарантировать работоспособность ядра на частоте 3,47 ГГц при тепловом пакете в 110 Вт — это как раз 965 ЕЕ или Xeon W3570 в «буст-режиме». Новый степпинг, как это часто бывает, улучшил способность к достижению более высоких тактовых частот. Не сильно, но дополнительные 133 МГц при том же тепловом пакете компания может гарантировать. Во всяком случае, Xeon W5580 достигает частоты 3,6 ГГц при использовании Turbo Boost. А X5570 в этом плане еще интереснее — 3,33 ГГц, укладываясь в 80 Вт. При переводе на новый степпинг Core i7 под LGA1366 этим «богатством» можно было распорядиться двумя способами: либо ввести для обновленных процессоров ту же схему функционирования Turbo Boost, что свойственна и Xeon, либо остаться в рамках старой, но на те же 133 МГц повысить номинальную тактовую частоту. Первое приводит к путанице, второе — нет, чем и предпочтительнее. Цена новых «ускоренных» моделей, очевидно, остается той же, что была ранее.

И уже можно немного заглянуть вперед — во времена LGA1156. Согласно имеющейся на данный момент времени информации, «дебютный» старший процессор этого семейства будет иметь частоту 2,93 ГГц, в «буст-режиме» начнет поднимать ее до тех же 3,6 ГГц (максимально), что и топовые процессоры для LGA1366, однако довольствуясь тепловым пакетом, аналогичным Х-семейству Xeon 5500. При этом этот процессор будет иметь такую же цену, что и нынешний Core i7 950, с номинальной частотой 3,06 ГГц, но разгоняющийся всего до 3,33 ГГц. Однако способный работать в более «жестком» тепловом режиме и снабженный трехканальным контроллером памяти, а не двухканальным, что тоже не стоит сбрасывать со счетов. В ближайшее время тестеров оборудования (в частности и нас ) ожидают очень веселые и интересные времена. А «табличная» официальная тактовая частота окончательно рискует превратиться в полную абстракцию уже и на массовом рынке.

Конфигурация тестовых стендов

Процессор Xeon L5520 Xeon E5540 Xeon X5560 Xeon X5570
Название ядра Bloomfield Bloomfield Bloomfield Bloomfield
Технология пр-ва 45 нм 45 нм 45 нм 45 нм
Частота ядра (std/max), ГГц (*) 2,26/2,53 2,53/2,8 2,8/3,2 2,93/3,33
Кол-во ядер 4 4 4 4
Кэш L1, I/D, КБ 32/32 32/32 32/32 32/32
Кэш L2, КБ 4 x 256 4 x 256 4 x 256 4 x 256
Кэш L3, КБ 8192 8192 8192 8192
Оперативная память (**) 3 x DDR3-1066 3 x DDR3-1066 3 x DDR3-1333 3 x DDR3-1333
Коэффициент умножения 17 19 21 22
QPI 5,86 ГТ/с 5,86 ГТ/с 6,4 ГТ/с 6,4 ГТ/с
Сокет LGA1366 LGA1366 LGA1366 LGA1366
TDP 60 Вт 80 Вт 95 Вт 95 Вт
Цена $293(6) $867(13) $1181(10) $596(7)

(*) при задействовании функции «авторазгона» Turbo Boost (что и подразумевается по умолчанию), реальная частота отдельных ядер повышается относительно номинала на 133-400 МГц, в зависимости от нагрузки
(**) максимальная частота, официально поддерживаемая контроллером памяти в процессоре

Несмотря на то, что и Xeon 5500, и Core i7 на данный момент выпускаются в одном унифицированном конструктиве LGA1366, на практике говорить о полной их совместимости не выходит. Во-первых, большинство десктопных (да и не только) плат в поддержке 5500 ограничены как сверху, так и снизу — обычно не работают топовый W5580 и, наоборот, самые «урезанные» E550x и примкнувший к ним L5510 c уполовиненным объем кэш-памяти и отключенными технологиями Turbo-Boost и Hyper-Threading. Но относительно «представительный» набор процессоров, позволяющий сделать тестирование более-менее интересным, нам собрать удалось. Во-первых, это старшие представители X-семейства, наиболее интересные на рынке «массовых серверов»: один W5580 смысла использовать не имеет обычно, а два предъявляют слишком серьезные требования к системе охлаждения компьютера, выделяя «в воздух» до 260 Вт тепла на двоих. Во-вторых, E5540 — он ближе всего, с точки зрения номинальной тактовой частоты, к нашему «референсному» представителю предыдущего семейства — Core 2 Quad 9300, результаты которого в рамках текущей методики тестирования процессоров приняты за «масштабную единицу». Кроме того, именно эта модель является самой быстрой из процессоров с TDP 80 Вт, что иногда может оказаться достаточно важным. Аналогично и L5520 — это самый быстрый из низкопотребляющего (TDP 60 Вт) подсемейства Xeon 5500. А его сводный брат E5520 — младший и самый дешевый из «полноценных» Xeon 5500. В принципе, E5520 может оказаться и более производительным устройством, нежели L5520 (не забываем о более высоких порогах троттлинга), и менее (если кристаллы отбираются специальным образом, что компания вполне может себе позволить), но в среднем, эти факторы должны друг друга примерно уравновешивать.

Процессор Core i7 920 Core i7 940 Core i7 950
Название ядра Bloomfield Bloomfield Bloomfield
Технология пр-ва 45 нм 45 нм 45 нм
Частота ядра (std/max), ГГц (*) 2,66/2,93 2,93/3,2 3,06/3,33
Кол-во ядер 4 4 4
Кэш L1, I/D, КБ 32/32 32/32 32/32
Кэш L2, КБ 4 x 256 4 x 256 4 x 256
Кэш L3, КБ 8192 8192 8192
Оперативная память (**) 3 x DDR3-1066 3 x DDR3-1066 3 x DDR3-1066
Коэффициент умножения 20 22 23
QPI 4,8 ГТ/с 4,8 ГТ/с 4,8 ГТ/с
Сокет LGA1366 LGA1366 LGA1366
TDP 130 Вт 130 Вт 130 Вт
Цена Н/Д(2) Н/Д(1) $178(8)

(*) при задействовании функции «авторазгона» Turbo Boost (что и подразумевается по умолчанию), реальная частота отдельных ядер повышается относительно номинала на 133-266 МГц, в зависимости от нагрузки
(**) максимальная частота, официально поддерживаемая контроллером памяти в процессоре

Для сравнения, мы взяли три протестированных в прошлый раз представителя линейки Core i7, причем младших представителя. Экстремальные редакции для сравнения все равно не подходят — они, очевидно, быстрее всех Xeon, за исключением W5580. Но 940 и 950 нам самое то: первый процессор имеет одинаковую номинальную частоту с Xeon X5570, а второй — одинаковую частоту буст-режима с ним же. И посмотрим, как роли распределятся по реальной производительности. И Core i7 920 как очевидная «точка отсчета» так и просится на диаграммы. Кстати, как известно, срок оставшейся жизни этого процессора не так и велик — только до анонса LGA1156, после чего самое дешевое предложение для «настольного» LGA1366 плотно займет позицию 562 доллара. Но среди Xeon 5500 есть и более дешевые, причем не только среди окончательных «обрезков» серии 550х, но и вполне полноценный Е5520. Сейчас не очень интересен для односокетных конфигураций, благо 920 стоит на $100 дешевле, но после исчезновения последнего… Для кого-то эта модель вполне может стать привлекательной, так что вопрос, насколько младший «не урезанный» Xeon медленнее Core i7 920 в штатном режиме рискует перестать быть чисто теоретическим. Особенно, если учесть существенно более низкое тепловыделение этой серии.      

  Системная плата Оперативная память
Core i7, Xeon E/L Intel DX58SO (X58) Kingston KVR1333D3N9K3/6G (1066, 8-8-8-19)
Xeon X Intel DX58SO (X58) Kingston KVR1333D3N9K3/6G (1333, 9-9-9-24)

Тестирование

Методика тестирования производительности (список используемого ПО и условия тестирования) подробно описана в статье. Для удобства восприятия, результаты на диаграммах представлены в процентах (за 100% принят результат Intel Core 2 Quad Q9300 в каждом из тестов). Подробные результаты в абсолютных величинах доступны в виде таблицы в формате Microsoft Excel.

3D-визуализация

Как и ожидалось, X5570 быстрее, нежели i7 940, но медленнее, чем i7 950. Странным было бы обратное — иногда реальная частота Xeon ближе именно ко второму процессору. Но любопытна небольшая разница между Х5560 и Х5570. Хотя объяснение этому есть — младшая модель, по вполне очевидным причинам, трудится в более комфортном энергетическом режиме, так что может более агрессивно использовать Turbo-Boost. Мы часто сталкивались с тем, что по мере роста частоты, «эффективность на мегагерц» у одного и того же ядра снижается, причем это наблюдалось даже до внедрения динамического управления частотой работы, а сейчас просто обязано проявиться еще сильнее. Все-таки, Х5570 старшая модель с тепловым пакетом в 95 Вт, и на ней ограничение уже может начать сказываться.

На другом конце таблицы — представители «младших» линеек. Все-таки, Е5540 не удалось догнать i7 920, хотя он подобрался к нему ближе, чем можно было судить по разнице стартовых частот. А почему так мала разница между L5520 и Е5540? Судя по всему, процессоры L-семейства — совсем не «обычные» с просто жестко опущенными порогами энергопотребления. Это действительно «лучшие зерна». Поэтому уложиться в 60 Вт им удается с меньшими потерями, нежели Е55х0 попасть в свой диапазон «до 80».

Но эта группа тестов — не самое лучшее, что можно «подсунуть» Nehalem. Нагрузка, в основном, двухпоточная (хотя и достаточно серьезная, так что «прогреть» пару ядер работой можно достаточно легко), как мы уже убедились в прошлый раз, быстрая работа с памятью особых дивидендов не дает и т.п. Спасает только активное использование Turbo-Boost, что и позволяет немного оторваться от Core 2 такой же и даже более низкой номинальной тактовой частоты ( напомним, что сто масштабных единиц у нас здесь и всюду — это Core 2 Quad Q9300). Посмотрим, что изменится при другом характере нагрузки.

Рендеринг трёхмерных сцен

Положение усугубляется — при полной загрузке всех ядер Xeon Х-серии может иметь преимущество в 133 МГц перед «равночастотным» Core i7, но «может» — не значит «имеет»: приходится учитывать и энергопотребление. В результате, «лидирующая» группа распределилась по ранжиру, согласно номинальной тактовой частоте, причем весьма точным образом: по 6 «попугаев» на один шаг. В «отстающих» все гораздо менее однозначно, нежели могла бы предсказать теория. Опять радует глаз разве что выступление L5520 — это отличный процессор для низкопотребляющих серверов. Даже для односокетных, где он способен бороться на равных и более того с L3360 (c частотой 2,83 ГГц), не говоря уже о двухсокетных, где старший из низкопотребляющих Xeon на архитектуре Core 2 имел тактовую частоту как раз 2,5 ГГц, как и наш Q9300, разница с которым видна невооруженным глазом.

Научные и инженерные расчёты

Эти приложения более консервативны в плане поддержки многопоточности, зато и потоки здесь « проще», нежели в первой группе тестов. Главным итогом можно считать то, что результаты оказываются крайне близкими к теории. То есть не так она и суха, чтоб там не говорили иногда классики литературы — иногда в точности совпадает с практикой.

Растровая графика

Любопытно, что картинка очень похожа на рендеринг. То есть очередное подтверждение факта, что «мочь» — не значит «делать». Точнее, не всегда — для Х-линейки все верно, а Е5540 почти догнал Core i7 920, и помешало ему разве что наличие некоторых подтестов, способных загрузить работой менее и более двух ядер.

Сжатие данных

Результаты несколько неоднозначные, но легко объяснимые. Во-первых (что уже ни для кого не секрет), пока для архиваторов «многопоточность» означает «двухпоточность». Во-вторых, нагрузка, как таковая, не очень велика — хорошими «грелками» эти программы не являются. В-третьих, зато, они являются одним из лучших примеров программ, критичных к скорости работы подсистемы памяти. Все эти факторы приводят к тому, что Xeon X-серии обгоняют не только «равночастотных» коллег, но и разницу в один шаг множителя отыграть способны. Но у других подсемейств есть только один допинг, да и то в меньших количествах, откуда и результат соответствующий.

Компиляция (VC++)

При сравнении близких по техническим характеристикам и одинаковых по архитектуре процессоров (причем имеющих все как один высокую производительность), начинает сказываться то, что с компиляцией тестового задания все они справляются очень быстро, так что одна-две секунды — то еще значение. Даже усреднение результатов по нескольким прогонам не всегда спасает: все равно, в итоге, плюс-минус один балл может нарисоваться. Слишком уж быстрыми являются новые процессоры, за что их (вместе с разработчиком) вряд ли стоит ругать — программисты наверняка будут придерживаться диаметрально противоположного мнения. Приблизительно, такого результата (если отвлечься от мизерных флуктуаций) и можно было ожидать изначально.

Интерпретация (Java)

Сложно сказать — найдутся ли пользователи, для которых скорость работы Java-машины столь же критична (разумеется, на современных настольных компьютерах, а не на мобильном устройстве), как скорость компиляции кода для программистов, но поведение процессоров в этом тесте практически не изменилось и продолжает радовать глаз любителю скорости. Особенно потому, что последнюю в рамках одного семейства, как мы видим, можно увеличивать не только путем «тупого» увеличения стартовой тактовой частоты, но и ее динамическим управлением, оставаясь в гармонии с энергопотреблением и не только.

Кодирование аудио

В плане практического использования и тут схожая ситуация — давно ушли те времена, когда компьютер приходилось оставлять на ночь, дабы закодировать в МР3 н есколько альбомов: сейчас все уже, в основном, лимитируется скоростью получения исходного материала (по сети ли, с дисков ли). Но поведение этих программ несколько отличается. Как мы видим, задачи аудиокодирования не только до сих пор остаются весьма процессорозависимыми — они еще и нагрузку на процессор немалую дают. Тонкости более или менее агрессивного повышения тактовой частоты тут «не играют рояля»: все в точности по ранжиру стартовой тактовой частоты. Но, конечно, всегда очень быстро.

Кодирование видео

И с видео все аналогично. Правда, тут не поспоришь о практической полезности высоких результатов , поскольку, как и ранее, процедура получения готового материала из исходного остается достаточно длительной.

Игровое 3D

Ситуация с играми логична, пусть и несколько неприятна для сторонников приобретения мощных процессоров для игрового компьютера — в очередной раз видим, что результат-то от ЦПУ зависит, но в достаточно малой степени. И после этого окончательно понимаешь, что недавно нашумевшие рекомендации NVIDIA — не есть пиар в чистом виде. Действительно, игрокам пора задуматься о мульти-GPU, а не о топовых процессорах. Особенно, если речь идет о современных ядрах последних — как видим, даже младшие Nehalem в «неурезанном» исполнении все равно обгоняют середнячков предыдущего семейства, так что… больше и не требуется. Теперь видео и только видео.

Итого

Чем нам нравится усреднение результатов по всем тестам, так это тем, что оно сглаживает все особенности поведения одиночных приложений, приводя (при большом количестве тестов, разумеется) к вполне разумной «средней температуре по больнице». Иначе было бы слишком сложно сравнивать процессоры, слишком по-разному относящиеся к изменению своей частоты. Иногда Xeon повышает ее агрессивнее, иногда вынужден «ограничивать способности» из-за более узкого теплового пакета — в конечном итоге, все приходит на круги своя. Видно, что Х5570 все-таки ближе по итоговой производительности к Core i7 940, нежели к 950, хотя и быстрее его.

О стается еще раз порадоваться за инженеров компании Intel, обеспечивших последней такой гибкий способ варьировать производительность и энергопотребление процессоров. И в очередной раз огорчиться тому, что окончательно ушел в прошлое такой простой и однозначный априорный способ оценки производительности, как сравнение тактовой частоты. Даже в рамках процессоров одной архитектуры, хотя ( как мы в очередной раз видим), при сравнении кристаллов разных семейств, ситуация еще более усугубляется — «эффективность на реальный мегагерц» у ядер Core 2 и Nehalem различается не так сильно, однако все архитектурные усовершенствования способны с легкостью обеспечить до 25-30% производительности при одинаковой заявленной частоте.



Благодарим российское представительство Kingston Technology за помощь в комплектации тестовых стендов



Дополнительно

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.