Процессор Intel Core i7-3970X Extreme Edition

Тех же щей, да погуще влей!


Текущий год был не так уж беден на анонсы: появились и новые микроархитектуры под LGA1155 и AM3+, и целиком новая платформа FM2. В связи с этим как-то забылось, что у Intel существует еще и настольная версия LGA2011. Точнее, многими пользователями это и «не помнилось»: в мейнстрим она вообще никак не вписывается, поскольку самым дешевым предложением из процессоров является Core i7-3820 — в общем-то, относительно бестолковый на фоне Core i7-3770 (те же четыре ядра за те же деньги, но более старой микроахитектуры и без интегрированного видео). Плюс разница в стоимости системных плат: если приличную модель с LGA1155 можно приобрести и за 100 долларов (а приемлемую — всего за 50), то на рынке LGA2011 цены стартуют с 200 долларов. Так что какой-либо смысл в ориентации на нее появляется только с шестиядерного Core i7-3930K, аналогов которому на других платформах просто нет, но он и сам по себе стоит порядка 600 долларов. Т. е. в популярный системник «до 1000 долларов» это решение не особо-то и вписывается.

Однако хотя бы с теоретической точки зрения эта платформа все же представляла собой определенный интерес в момент анонса — именно из-за того, что Core i7-3930K и экстремальный i7-3960X альтернатив на настольном рынке до сих пор не имеют, гордо стоя особняком. Но из-за этого обособленного положения про LGA2011 все как-то и начали забывать: обе модели были анонсированы год назад, всеми тогда протестированы, после чего результаты быстро оказались отложенными на полку — не с кем сравнивать.

Разумеется, такое положение дел Intel не слишком устраивает. Радикальным решением проблемы был бы выпуск процессоров семейства Ivy Bridge-E, что привело бы к всплеску интереса к платформе (пусть и теоретического). Однако их придется подождать — несмотря на то, что год назад некоторые оптимисты всерьез рассуждали о конце этого года, в реальности выход таких моделей ожидается не ранее третьего квартала следующего. Но что-то делать надо :) И этим «чем-то» стал новый экстремал Core i7-3970X, постепенно начавший просачиваться в торговые сети еще до момента официального анонса.

Что в нем нового? Увы, но практически ничего — это все тот же шестиядерный Sandy Bridge-E (базовый дизайн включает в себя восемь ядер, но в настольных моделях два из них вместе с частью кэш-памяти третьего уровня традиционно заблокированы). Компания несколько увеличила лишь тактовые частоты: базовая выросла на 200 МГц (3,5 ГГц против 3,3 ГГц в 3960Х), а максимальная — только на 100, но зато достигла психологической границы 4 ГГц. Первой, надо заметить, эту вершину «взяла» AMD (что и обещала еще во времена Phenom II) — в момент выхода FX-8150, в турбо-режиме разгонявшегося до 4,2 ГГц. А не так давно FX-8350 упрочил положение компании в гонке гигагерц, поскольку там и базовая частота равна максимальной для 3970Х — те же 4 ГГц. Но FX-8350 способен работать на такой частоте и при загрузке всех четырех модулей, а новый Core i7 при полной нагрузке «провалится» ниже. С другой стороны, в его случае «полная нагрузка» — это более серьезно, поскольку потоков вычисления не 8, а 12. Но дается это дорогой ценой, и не только в денежном плане: чтоб новый процессор не страдал от ограничений теплопакета, а «бустился» поактивнее, TDP пришлось повысить (сравнительно с предшественником) со 130 до 150 Вт. Собственно, в данном качестве процессор уникален среди всех настольных моделей Intel, которые таких «высот» в штатном режиме официально не достигали. Единственный его «конкурент» по теплопакету — экстремальный Core 2 Extreme Q9775, но к «настольным» линейкам он относится с большой-пребольшой натяжкой, ибо рассчитан под LGA771 и представляет собой перемаркированный Xeon для двухпроцессорных систем. Впрочем, это замечание применимо и к «настольной» версии LGA2011 (а ранее — к LGA1366), но тут хотя бы речь не об одной уникальной модели, а о каком-никаком семействе процессоров.

Отметим еще, что TDP Core i7-3970X выше, чем даже у Xeon E5-2690 (на том же кристалле) и равен таковому у E5-2687W, где над работой трудятся все восемь ядер. Пусть и скромнее диапазон тактовых частот (2,9—3,8 ГГц у первого и 3,1—3,8 ГГц у второго), но выпуск восьмиядерного экстремала, конечно, произвел бы намного больший фурор, чем достижение 4 ГГц. Однако пока желающим «хряпнуть» 16 потоков вычислений в одном сокете придется либо закатать губы обратно, либо копить 2000 вечнозеленых на одну из упомянутых моделей. 3970Х же ничем новым их побаловать не может. Любителей игр — теоретически может, поскольку, в отличие от «стартовых» моделей Core i7 под LGA2011, его контроллер PCIe уже совершенно официально поддерживает спецификации версии 3.0. Но это очень теоретически: для нынешних GPU разница если и будет где-то обнаружена, то только при использовании трех топовых видеокарт.

В общем, информационный повод у нас достаточно скучный: просто вместо самого быстрого настольного процессора выпустили еще чуть-чуть более самый быстрый. Но какой-никакой, а повод есть, так что новинку надо бы протестировать. Чем мы сегодня, собственно, и займемся.

Конфигурация тестовых стендов

Не нужно обращаться к гадалке, чтобы предположить появление в день выхода процессора обзоров на всех крупных сайтах, где он будет сравниваться в обязательном порядке с Core i7-3960X (поскольку непосредственный предшественник) и Core i7-3770K. Во многих местах также будет использован FX-8350 (как самое быстрое решение AMD) и, возможно, какие-то еще (уже не топовые) модели для LGA1155 и AM3+. Мы решили поступить иначе (как гласит подсмотренная на просторах этих ваших интернетов народная мудрость: «Если здесь все делают это так, это не значит, что так — правильно: это всего лишь значит, что здесь все делают это так!») и 3960Х в данную статью не включать.

Процессор Core i7-3970X Core i7-3770K Core i7-990X Core i7-880
Название ядра Sandy Bridge-E Ivy Bridge QC Gulftown Lynnfield
Технология пр-ва 32 нм 22 нм 32 нм 45 нм
Частота ядра std/max, ГГц 3,5/4,0 3,5/3,9 3,47/3,73 3,06/3,73
Кол-во ядер/потоков вычисления 6/12 4/8 6/12 4/8
Кэш L1 (сумм.), I/D, КБ 192/192 128/128 192/192 128/128
Кэш L2, КБ 6×256 4×256 6×256 4×256
Кэш L3, МиБ 15 8 12 8
Частота UnCore, ГГц 3,5 3,5 2,66 2,4
Оперативная память 4×DDR3-1600 2×DDR3-1600 3×DDR3-1333 2×DDR3-1333
Видеоядро HDG 4000
Сокет LGA2011 LGA1155 LGA1366 LGA1156
TDP 150 Вт 77 Вт 130 Вт 95 Вт
Цена $773(15) $431(7) Н/Д(2) Н/Д(1)
Процессор FX-8350 Phenom II X6 1100T Phenom II X4 940
Название ядра Vishera Thuban Deneb
Технология пр-ва 32 нм 45 нм 45 нм
Частота ядра std/max, ГГц 4,2/4,3 3,3/3,7 3,0
Кол-во ядер/потоков вычисления 8/8 6/6 4/4
Кэш L1 (сумм.), I/D, КБ 256/128 384/384 256/256
Кэш L2, КБ 4×2048 6×512 4×512
Кэш L3, МиБ 8 6 6
Частота UnCore, ГГц 2,2 2,0 1,8
Оперативная память 2×DDR3-1866 2×DDR3-1333 2×DDR2-1066
Видеоядро
Сокет AM3+ AM3 AM2+
TDP 125 Вт 125 Вт 125 Вт
Цена $218(79) Н/Д(0) Н/Д(0)

Список участников мы построили немного другим образом. Без Core i7-3770K и FX-8350 нам, конечно, никак не обойтись — это топовые модели для LGA1155 и AM3+ соответственно, что роднит их с Core i7-3970X (и пусть это намного более дешевые модели — сейчас нам это неважно). Но долгий срок жизни текущей методики тестирования привел к тому, что у нас есть результаты лучшей модели для LGA1366 (Core i7-990X), LGA1156 (Core i7-880), AM3 «без плюса» (Phenom II X6 1100T) и даже… AM2+ (Phenom II X4 940). К огромному сожалению, платформа LGA775 участия в тестах принимать не будет — несмотря на все усилия, год назад удалось разыскать только Core 2 Quad Q9650, но не «настоящий» топ в виде Core 2 Extreme Q9770. А FM1 и FM2 мы сами решили не рассматривать: хоть для этих платформ тоже есть «топовые» модели, но сами платформы изначально не позиционировались в высокопроизводительный сегмент, так что их «топовость» слишком уж номинальная.

  Системная плата Оперативная память
LGA2011 ASUS P9X79 Pro (X79) Corsair Dominator Platinum CMD16GX3M4A2666C10 (4×1333; 9-9-9-24)
LGA1366 Intel DX58SO2 (X58) 12 ГБ 3×1333; 9-9-9-24
LGA1155 Biostar TH67XE (H67) Corsair Vengeance CMZ8GX3M2A1600C9B (2×1333; 9-9-9-24)
LGA1156 ASUS P7H55-M Pro (H55) Corsair Vengeance CMZ8GX3M2A1600C9B (2×1333; 9-9-9-24)
AM3+ ASUS Crosshair V Formula (990FX) G.Skill [RipjawsX] F3-14900CL9D-8GBXL (2×1866; 9-10-9-28)
AM3 ASUS M4A78T-E (790GX) Corsair Vengeance CMZ8GX3M2A1600C9B (2×1333; 9-9-9-24-2T, Unganged Mode)
AM2+ ASUS M3A78-T (790GX) 8 ГБ DDR2 (2×800; 5-5-5-18; Unganged)

Традиционно в основной линейке тестирования совместно с процессорами Intel мы пока используем память типа DDR3-1333, несмотря на поддержку Ivy Bridge и SB-E и частоты 1600 МГц (официально; в разгоне еще выше) — для упрощения сравнений. Уверенным в том, что это сильно сказывается на производительности в реальных приложениях, рекомендуем ознакомиться с полугодовой давности исследованием данного вопроса на примере IB, ну а что касается SB-E в таком разрезе, то это тема одной из ближайших статей (благо, раз уж тестовый стенд пришлось «расчехлять», то самое время и здесь расставить «точки над ё»).

Тестирование

Традиционно, мы разбиваем все тесты на некоторое количество групп и приводим на диаграммах средний результат по группе тестов/приложений (детально с методикой тестирования вы можете ознакомиться в отдельной статье). Результаты на диаграммах приведены в баллах, за 100 баллов принята производительность референсной тестовой системы iXBT.com образца 2011 года. Основывается она на процессоре AMD Athlon II X4 620, ну а объем памяти (8 ГБ) и видеокарта (NVIDIA GeForce GTX 570 1280 МБ в исполнении Palit) являются стандартными для всех тестирований «основной линейки» и могут меняться только в рамках специальных исследований. Тем, кто интересуется более подробной информацией, опять-таки традиционно предлагается скачать таблицу в формате Microsoft Excel, в которой все результаты приведены как в преобразованном в баллы, так и в «натуральном» виде.

Интерактивная работа в трёхмерных пакетах

Ввиду малопоточной нагрузки два новых Core i7 практически равны друг другу, причем 3770К даже чуть быстрее: сравнимая частота, но улучшенная микроархитектура. Остальные отстают от этой пары достаточно заметно, однако изначально очевидно, что такие приложения — вовсе не целевое предназначение для многоядерных процессоров.

Финальный рендеринг трёхмерных сцен

Чего не скажешь о рендернинге, способном утилизировать любое разумное (и даже не совсем разумное) количество ядер. Производительность каждого потока, безусловно, имеет высокое значение, однако количеством «перебить» качество тоже несложно, что приводит к тому, что тут уже 3770К отстает уже и от древнего 990Х. Впрочем, древний он или нет, а очевидно, что вот уже два с половиной года (когда появился Core i7-980X) ничего принципиально нового в топовом сегменте не происходит из-за нежелания Intel «опускать» восьми- и более «ядерные» модели до уровня односокетных систем. Смена Gulftown на SB-E дала буквально 10-15% производительности, да и IB-E в таком исполнении, очень может быть (если верными окажутся прогнозы о шести ядрах как верхней границе) ничего нового не принесет.

AMD же, как видим, работает над повышением производительности своих процессоров ударными темпами. В данной группе, впрочем, в какой-то степени новая архитектура оказалась шагом назад, но мы не удивимся, если доработка и оптимизация ПО это исправят (более активное использование AVX и, в особенности, FMA4 легко способно скомпенсировать уменьшение количества векторных блоков сравнительно со старшими Phenom II X6), но прогресс заметен. И портит впечатление только то, что пока еще результаты ниже, чем даже у старших Core i7 для LGA1156.

Упаковка и распаковка

А при целочисленной нагрузке FX, естественно, не мешает малое количество векторных блоков. Недостатками новой архитектуры можно считать только медленную кэш-память и, в особенности, невысокую однопоточную производительность, что критично при распаковке данных, которую оба архиватора (да и не только они) вообще не распараллеливают. Core i7-3970Xб впрочем, и однопоточность двух подтестов не мешает — 4 ГГц Sandy Bridge, сдобренные 15 МиБ полноскоростной кэш-памяти на лидирующие позиции новичка для LGA2011 выводят легко и не напрягаясь. Но разница с более дешевыми процессорами не столь уж и велика.

Кодирование аудио

Идеальная утилизация любого количества потоков приводит к тому, что оба шестиядерных Core i7 в лидерах, однако стоит обратить внимание и на размер этого самого «лидерства»: как видим, двухлетний старичок 990Х уже лишь номинально опережает «сладкую парочку» из Core i7-3770K и FX-8350, которые в этих тестах держатся на одном уровне. Но, в общем, ничего нового — если не вмешаются иные факторы, пиковая производительность любого процессора равна произведению количества потоков на скорость каждого. А последняя — точно такое же произведение IPC на тактовую частоту. Т. е. в идеальном случае (когда ПО может использовать все потенциальные возможности процессора) имеем три множителя: количество, качество и частота, причем практически равноценных — обращать внимание нужно не все три, не отдавая предпочтение никому. Т. е. сравнение процессоров на одинаковой тактовой частоте интересно для исследований, но не для практики — целевые частоты могут быть совершенно разными. Но, в общем-то, это вещи общеизвестные. Просто выдался очередной повод их вспомнить :)

Компиляция

В компиляторных тестах параллелизм тоже на очень высоком уровне, однако они достаточно требовательны и к подсистеме памяти. В том числе, и к размеру и скорости L3, причем больше к размеру, чем к скорости. В общем и целом это делает шестиядерные Core i7 безоговорочными лидерами, но в очередной раз очень близкими друг к другу. Нет, конечно, 10% — тоже преимущество, но слишком небольшое за два с лишним года. Хотя и причины понятны — а зачем при отсутствии реальной конкуренции «ронять» рынок? Спрос на максимальную производительность был и остается неэластичным, так что решение задачи максимизации прибыли звучит просто: если продавать все равно мало, то лучше продавать дорого.

Математические и инженерные расчёты

Особенно с учетом того, что одно-двухпоточные приложения никуда не исчезают который уже год, а в них единственным экстенсивным средством повышения производительности является тактовая частота. Вот с ее помощью 3970Х здесь вновь вернул номинальное первое место платформе LGA2011, утраченное ей после появления Ivy Bridge.

Растровая графика

Здесь оно и не терялось, хотя и является столь же номинальным. Причина — сильная «разношерстность» ПО в плане поддержки многопоточности: если пакетный режим ACDSee (RAW-конвертация и наложение всяких фильтров) «разбрасывается» по большому количеству ядер отлично, то GIMP принципиально однопоточен. Ну а Photoshop — нечто среднее. С соответствующим общим результатом: до двух-трех сотен долларов прирост производительности возможен, а от экстремалов толку — одно название.

Векторная графика

Но бывает и хуже: как показывают результаты тестов, Core 2 Duo — скорее всего последнее, под что эту пару программ оптимизировали. Соответственно, современные процессоры выглядят тем лучше, чем больше они похожи на эти самые Core 2 Duo :) Что объясняет и проигрыш новой архитектуры AMD старой — старая была более похожа. У Intel таких отступлений не наблюдается (не считая Atom — в плане отсутствия «сходства» с Core 2 являющегося ближайшим коллегой FX: почти ничего общего), но от этого старшим моделям процессоров под LGA2011 легче не становится: это все тот же старый добрый Sandy Bridge, пусть и сильно сдобренный тем, что данным пакетам все равно не требуется.

Кодирование видео

Теоретически идеальная сфера применения для многоядерных процессоров, практически же даже у такого неплохо оптимизированного под многопоточность кодека, как х264 чем дальше, тем слабее прирост производительности (о чем в ближайшем будущем у нас будет отдельный разговор), поэтому в очередной раз приходится констатировать факт, что Core i7-3970X, конечно, самый быстрый настольный процессор в мире, но не настолько он быстрее, чтобы сделать возможной его прямую конкуренцию с более дешевыми решениями как Intel, так и AMD. Вот в отрыве от цены — да, впечатляет. Но не настолько, чтобы бежать платить 1000 долларов только лишь за абсолютные показатели быстродействия, а не за имидж.

Офисное ПО

Очевидно, что для процессоров такого уровня подобная нагрузка — вовсе не нагрузка, но не менее очевидно и то, что особой пользы от них в этой сфере применения нет. Самые быстрые, конечно, однако заметить это без тестов все равно невозможно. Но производительность, как это принято было говорить в нашей стране 30 лет назад, неуклонно повышается с каждым годом, пусть это и является лишь побочным эффектом прогресса на рынке микропроцессоров.

Java

Рост популярности Android давно уже показал даже самым неисправимым оптимистам то, что Java способствует развитию многопоточных навыков у программистов ничуть не в большей степени, чем иные подходы к разработке ПО, однако конкретно в SPECjvm утилизация многоядерности находится на неплохом уровне (пусть и не во всех подтестах). Соответственно, приходим в итоге к тому, что восемь потоков вычисления — хорошо (пусть и по-разному хорошо: Core i7-880 даже от Phenom II X6 1100T отстает), а 12 — лучше. Настолько лучше, что и «старые» 12 лучше новых восьми. А «новые» 12 — еще лучше. Вот если б еще большинство программ были такими…

Игры

Игровые движки, способные использовать множество потоков вычисления появились не вчера и даже не позавчера, но до сих пор темпы их экспансии оставляют желать лучшего. Бывают, конечно, исключения, но они всегда были. Да и до сих пор основная полемика идет в вопросе — всем ли хватит двухъядерного процессора или нужно больше. У нас же сегодня нет не только «классических» двухъядерных моделей, но и их SMT-модификаций (типа Core i3 или FX-4000) со всеми вытекающими: потоков хватает всем, так что разница между испытуемыми может появиться лишь из-за разных частот, архитектурных особенностей или емкости и производительности кэш-памяти. Проще говоря, разница большой быть не может, что мы и наблюдаем.

Многозадачное окружение

А вот в данном случае — может. Что легко объяснимо — три из пяти тестов сами по себе в одиночку способны использовать множество потоков вычислений, так что их одновременное выполнение приводит к практически 100%-ной загрузке всех функциональных блоков современных процессоров. Соответственно, чем этих блоков больше, тем лучше. Правда, вероятность такого сценария использования на обычном персональном компьютере (а не где-нибудь на сервере сети) крайне мала — даже ниже, чем вероятность наличия среди используемого ПО хорошо распараллеливаемых задач. Т. е. компиляция в MSVC — обычное дело для программиста, его использующего, а рендерингом регулярно приходится заниматься всем пользователям Maya (хотя в крупной компании, скорее всего, задача чаще всего будет выполняться на отдельном рендер-сервере), но представить себе человека, который одновременно будет и компилировать крупный проект, и рендерить не менее крупный проект, да еще и запустит в тот же момент времени 7-Zip и видеокодирование… Что называется, не в этой жизни. А ведь так наш тест и работает :)

Итого

Старейшим из участников сегодняшнего обзора является Phenom II X4 940, появившийся примерно четыре года назад и даже во времена своей молодости стоивший менее 300 долларов. Его отставание от нынешнего флагмана отрасли, который продается (как и положено флагману) почти в четыре раза дороже, чем 940 стоил тогда — менее 2,5 раз. Собственно, вот он весь прогресс. Кое-где, конечно, разница доходит и до трехкратной, однако подобных приложений среди используемых массово не так уж и много.

Можно оценить и по-другому. За прошедшие годы AMD сменила техпроцесс и даже архитектуру, что в среднем дало компании 60% прироста быстродействия. В Intel архитектуру процессоров принципиально не меняли давно (запланировано такое только на следующий год). Более того — на LGA2011 пока даже не третье поколение Core, а лишь второе. Первое появилось те же четыре года назад, и самым быстрым в те годы был экстремальный Core i7-965. По текущей версии методики мы его не тестировали, но предыдущая демонстрировала его сходство с 880: 179 баллов против 174 баллов (кстати, неэкстремальный 960, появившийся чуть позже, по итоговому результату был вообще равен 880). Нехитрые арифметические подсчеты позволяют оценить и прогресс Intel за эти четыре года: примерно 39%, или в полтора раза меньше, чем у AMD, что явно должно порадовать фанатов последней компании. У болельщиков «синих» на это, впрочем, может найтись возражение, что AMD было проще — в абсолютных-то цифрах FX-8350 только сейчас достиг уровня экстремалов четырехлетней давности. На что, естественно, мгновенно находится и контраргумент: зато дешевле. FX-8350 по сути (т. е. прямо со старта) — вообще самый дешевый процессор из всех семи участников тестирования, и стоит он в пять раз меньше, чем экстремальные модели Intel, но даже не вдвое медленнее самого нового и быстрого из них. В общем, эта музыка будет вечной. Как и соответствующая тема нашей конференции, готовящаяся отметить свое двенадцатилетие (первая часть началась 28 декабря 2000 года).

Поэтому не будем углубляться в провокации, а просто задумаемся: чем интересен Core i7-3970X? Что это самый быстрый настольный х86-процессор на рынке — понятно было и без тестирования. Фактически, его выпуском Intel убила двух зайцев: во-первых, напомнила всем о существовании платформы LGA2011, во-вторых же, напомнила всем, кто именно делает самые быстрые процессоры. Заодно компания продемонстрировала интересующимся, что ее продукты тоже умеют достигать частоты в 4 ГГц. К сожалению, кроме этого Intel сумела напомнить всем, что тоже умеет делать процессоры с высоким энергопотреблением, причем повысила планку TDP уже до 150 Вт (как мы писали в начале, ранее такое было свойственно только Core 2 Extreme Q9775, лишь формально относившемуся к настольным моделям). Хотя понятно, что с практической точки зрения для основной целевой аудитории экстремальных процессоров это не проблема — 150-160 Вт легко рассеивает и обычный «воздушный» кулер (приличный, разумеется), а при разгоне для любых моделей и пару сотен ватт всегда можно было получить легко и не напрягаясь. Но само по себе подросшее значение TDP — неприятный симптом для любителей разгона: можно сделать вывод, что (в отличие от обычной практики) увеличение тактовых частот было достигнуто вовсе не улучшением процесса производства, т. е. так называемый «разгонный потенциал» 3970Х аналогичен более ранним 3960Х или 3930К. Разницу с последним в производительности в штатном режиме, конечно, увеличили, но нельзя сказать, что новый экстремал в этом сравнении выглядит убедительнее старого с точки зрения покупателя. Да и выход чуть более быстрой модели на смену 3930К тоже вполне возможен — хотя бы для того, чтобы успокоить страждущих добавлением официальной (пусть и малополезной) поддержки PCIe 3.0.

В общем, один имиджевый процессор сменил другой столь же имиджевый. Единственные, кто может получить хоть какую-то практическую пользу от его выхода — те, кто и собирался приобрести экстремальную модель, но по каким-то причинам до сих пор не успел сделать это. Да и то пользу это принесет небольшую: просто стало чуть быстрее за те же деньги. Ни смены микроархитектуры, ни изменения количества ядер, ни даже улучшенного процесса производства — потому и «чуть».



Благодарим компании Corsair, Palit и «Юлмарт»
за помощь в комплектации тестовых стендов



Дополнительно

ВИКТОРИНА TT

Материнские платы какого форм-фактора можно устанавливать в корпус Thermaltake Versa C22 RGB Snow Edition?

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.