Итоги IDF 2005. Часть 1. Многоядерность и 64-битность



Установите себе проигрыватель Flash для отображения графического оформления статьи

В первый же день весеннего Intel Developer Forum 2005 на его посетителей буквально обрушился шквал информации по новым процессорами и платформам Intel. Я отнюдь не преувеличиваю — корпорация обычно не очень охотно и весьма дозировано раскрывает свои планы относительно конкретных будущих продуктов (тех же процессоров и чипсетов), однако в этот раз на сотрудников Intel буквально снизошло вдохновение в этом плане: начиная с руководителей корпорации на ключевых докладах и в кулуарах — Крейга Баретта и Пэта Гелсингера (соответственно, главного исполнительного директора Intel и ее старшего вице-президента и генерального менеджера подразделения Digital Enterprise Group) — и заканчивая «рядовыми» работниками компании на выставочных стендах, где демонстрировались эти самые новинки. За многие годы я не припомню такого высокого уровня корпоративной откровенности Intel относительно своих будущих продуктов… И это не замедлило произвести должный эффект на присутствующих — горящие глаза, громкие разговоры и размахивание руками, деловая суета и толкотня во всех «ключевых» точках… Информация по данной теме лилась мощным потоком с 9 утра, когда IDF стартовал докладом Барретта, до 9 вечера, когда Барретт сотоварищи в непринужденной обстановке играли в местном «подпольном» (буквально — на подземном этаже отеля «Мариотт») казино (это в Калифорнии, где игорные заведения в общем-то запрещены!) вместе с некоторыми из посетителей Форума и охотно отвечали на расспросы «по существу».

По-видимому, доктор Барретт перед своим уходом с нынешнего поста руководителя корпорации решил дать волю свободе и устроить настоящий праздник по всем пунктам повестки дня… :)

Впрочем, я немного отвлекся — день первый на IDF вышел действительно сногсшибательным по обилию информации, буквально (как это говорят по-русски) — ядрёным! И главным лейтмотивом стали множественные анонсы и демонстрации двуядерных процессоров Intel и сопутствующих этому продуктов и технологий.




Крейг Барретт демонстрирует три концепт-системы на будущих двуядерных процессорах Intel


Стивен Павловски рукой «вращает виртуальный мир» видеопочты и различных приложений на большом сенсорном экране (система, для которой предпочтительно использовать многоядерный процессор)


Патрик Гелсингер демонстрирует ноутбук на базе двуядерного мобильного процессора Yonah

Поэтому есть все основания говорить, что этот день получился «много ядрёный». :) А в подтверждение этому — фото, где Патрик Гелсингер демонстрирует пять готовых двуядерных процессоров Intel.

Между тем, «ядрёность» этого IDF продолжилась и в последующие дни — например, технические треки (семинары), посвященные многоядерным процессорам, в буквальном смысле «ломились» от желающих на них попасть — в аудиториях не было ни единого свободного места, а за дверьми выстраивались очереди страстно желающих попасть внутрь. Журналисты же сметали друг друга в стремление «остановить мгновение» и запечатлеть новые процессоры.

И в этом материале мы постараемся собрать воедино те сведения о будущих многоядерных процессорах Intel, которые прозвучали на IDF.

EM64T на коне

На этом «многоядерном» фоне померкли даже «пресловутые» 64-битные расширения 32-битных процессоров, ставшие гвоздем программы прошлого IDF: теперь EM64T уже превращаются в некую рутину и «просто» очередной «зуб» корпорации, которых теперь стало пять: к прошлым четырем «зубьям» («Ts» или ключевым технологиям Intel — HT (Hyper-Threading), VT (Vanderpool), LT (LaGrande) и EM64T) добавился еще один «зубок» — AMT (Active Management Technology), для которого во время IDF появились официальные спецификации. А на горизонте замаячила еще и Intel I/O Acceleration Technology, которая входит в состав серверной платформы Bensley, запланированной на 2006 год, о чем поведал собравшимся Пэт Гелсингер.



И поскольку вице-президент Microsoft Джим Олчин (Jim Allchin, на фото выше) лично заверил аудиторию IDF, что 64-битные версии Windows Server 2003 x64 Edition и Windows XP Professional x64 Edition выйдут в самое ближайшее время (чем сорвал шквал аплодисментов), на Форуме Intel было немало внимания (и демонстраций) уделено также преимуществам 64-битных вычислений для процессоров Intel Xeon и Pentium. Что вкупе с многоядерностью должно… ну вы меня понимаете. :)

Полный переход на 64-битность для Xeon-серверов предполагается завершить к концу этого года, а для корпоративных клиентских машин (на базе Pentium) доля 64-битных систем должна составить больше половины к тому же сроку.

Причем если на прошлом IDF руководители Intel, говоря о перспективах применения EM64T, утверждали, что в обычных пользовательских задачах эти 64-битные расширения будут практически бесполезны и производительности не добавят (а пригодятся они в основном лишь для тех случаев, когда приложению потребуется более 4 Гбайт памяти), то в этот раз картина оценки Intel «полезности» 64 бит «в быту» была гораздо более оптимистичная, и на выставке в рамках IDF было немало стендов (см., например, фото после этого абзаца), где на «обычных» компьютерах с «до-4-гигабайтным» объемом памяти «крутились» вполне потребительские задачи, выполняясь на 20-30% быстрее при наличии EM64T, чем без оной…

Многоядерные процессоры — стратегия или тактика?

Но вернемся к гвоздю программы этого IDF — многоядерным процессорам. Еще пол года назад на Форуме руководители корпорации утверждали, что двуядерность — это не гонка, и Intel не спешила с представлением, например, двуядерного Xeon, предпочитая дождаться, чтобы появилось как можно больше приложений, оптимизированных для многопроцессорной работы.

Однако нынче приоритет многоядерности у Intel повысился до максимально возможного уровня — почти все CPU (пока за исключением, разве что, XScale) корпорация стремится быстро перевести на рельсы параллельных вычислений. И этому есть вполне понятные технологические объяснения. Ведь тактовую частоту интегральных схем со многими миллионами и даже миллиардами транзисторов становится повышать все труднее и труднее даже при продолжающейся миниатюризации транзисторов, поскольку при этом требуется синхронизировать работу блоков, расположенных далеко друг от друга на кристалле (что приводит к росту латентности работы отдельных блоков, удлинению вычислительного конвейера и пр.). Да и по ряду других причин повышать частоту все сложнее: например, из-за роста тепловыделения на единицу площади кристалла при повышении тактовой частоты — локальному теплоотводу тоже есть определенные пределы. С другой стороны, закон Мура, который в этом году празднует сороковую годовщину, пока в силе и, как мы видели ранее, останется, видимо, в силе еще лет 15-20. То есть количество транзисторов на кристалле будет продолжать удваиваться примерно каждые два года. В этих условиях самым простым и выгодным способом наращивания производительности микропроцессоров является организация параллельных вычислений — будь то несколько одинаковых ядер на одном кристалле или несколько кристаллов, упакованных в один корпус. В этом случае не увеличивая тактовую частоту можно получить многократный рост производительности системы простым добавлением ядер. И у Intel на этот счет — вполне конкретные планы:

Безусловно, и такому подходу свойственны определенные ограничения. Во-первых, для того, чтобы производительность от параллельных вычислений могла заметно возрасти, необходимо, чтобы приложения умели использовать эти возможности, то есть были оптимизированы для многопоточной работы и хорошо масштабировались. А с этим далеко не все так просто. И если для 2 или 4 процессоров оптимизировать многие приложения еще не очень сложно, то эффективно распараллелить выполнение задач на 16 или 32 потока (чтобы при этом масштабирование было ощутимо) уже очень непростая задача (не говоря о большем числе потоков). Во-вторых, пока ядер мало, обслуживающая их инфраструктура (системные шины и шины связи, контроллеры периферии и пр.) еще может быть достаточно компактна, но при возрастании количества процессоров эта инфраструктура может стать узким местом, способным погубить всю идею масштабируемости (и эти проблемы хорошо известны, например, при создании вычислительных кластеров). Наконец, 2, 4 или 8 ядер разместить вместе на одном кристалле или в одном корпусе — еще не так сложно, но как быть, если параллельных ядер — 16, 32 и больше?

Таким образом, нынешнее увлечение Intel мультиядерностью — это, на мой взгляд, некий тактический (в глобальном понимании процесса развития IT-отрасти) ход, способный решить проблемы с наращиванием производительности систем на ближайшие лет 10 (в пределах 8-16 ядер на один процессор). Однако до тех пор, пока не будут решены некоторые принципиальные (отмеченные выше) моменты, говорить о том, что мультиядерность станет стратегическим направлением развития всей вычислительной техники в будущем, явно преждевременно. Вместе с тем, по словам Гелсингера, в ближайшие четыре года мультиядерность способна увеличить производительность систем Intel раз в десять, тогда как за предшествующую «четырехлетку» интеловской «гонки за частотой» она лишь утроилась.

Впрочем, Джастин Раттнер (Justin Rattner), почетный сотрудник корпорации Intel и директор подразделения Intel Corporate Technology Group, в своем ключевом докладе последнего дня IDF подчеркнул, что требование использования новых подходов в разработке аппаратного и программного обеспечения вынуждают пересмотреть подход к разработке платформ. В частности, можно использовать высокоскоростные оптические системные шины на кремнии и перейти от multi-core к новой парадигме — many-core:

Для этого развиваются и новые подходы к разработке приложений, оптимизированных под большое число параллельных потоков.

Кроме этого в будущем предполагается увеличить число параллельных вычислительных потоков и ядер процессора до сотен при количестве транзисторов на кристалле в десятки миллиардов и скорости передачи данных между чипами в сотни гигабайт в секунду. А ресурсоемкими (я бы даже сказал — ресурсожадными) приложениями для таких мощных вычислительных систем могут служить системы с человекоподобным поведением, генерация в реальном времени реалистичных трехмерных изображений и голоса, виртуальная реальность. Например, Intel продемонстрировала в работе систему на базе 32 процессоров Itanium с видеокамерой высокого разрешения, которая в реальном времени анализировала лица проходящих мимо (с обычной пешей скоростью) людей и по базе данных из двух миллионов изображений идентифицировала личность (использовалось программное обеспечение от IntelliTrak).



Если сегодня такая систем занимает большую стойку и стоит огромных денег, то с приходом многоядерных процессоров ее можно будет уместить в стандартный системный блок разумной стоимости.

Пока же Intel планирует, что скоро около 80% всех ее микропроцессоров станут двуядерными и мультиядерными, а, например, в 2006 году 85% серверных и 70% клиентских компьютеров (ноутбуков и десктопов) будут иметь двуядерные процессоры.

Многоядерные процессоры — основные положения

Итак, что же, собственно, такое Multi-Core в понимании Intel? Ответ дает простой рисунок:

То есть в зависимости от эффективности и дешевизны производства может быть три варианта многоядерных (или двуядерных) процессоров:

  1. Совершенно независимые процессорные ядра, каждое со своей кэш-памятью, расположены на одном кристалле и просто используют общую системную шину. Таким будет ближайший 90-нанометровый Pentium D на ядре Smithfield.
  2. Похожий вариант — когда несколько одинаковых ядер расположены на разных кристаллах, но объединены вместе с одном корпусе процессора (многочиповый процессор). Таким будет 65-нанометровое поколение процессоров семейств Pentium и Xeon на ядрах Presler и Dempsey.
  3. Наконец, ядра могут быть тесно переплетены между собой на одном кристалле и использовать некоторые общие ресурсы кристалла (скажем, кэш-память). Таким является ближайший Itanium на ядре Montecito.


Кстати, Montecito, изготавливаемый по 90-нм техпроцессу, будет иметь по сравнению с предшественником на 130-нм ядре Madison и ряд других преимуществ: наличие Hyper-Threading (то есть он будет виден в системе как 4 логических процессора), заметно меньшее энергопотребление, более высокую производительность (в 1,5 раза и выше), вчетверо больший размер кэш-памяти (свыше 24 Мбайт: 2×1 Мбайт L2 инструкций, 2×12 Мбайт L3 данных), 1,72 миллиарда транзисторов против 410 миллионов и многое другое. Выйдет этот процессор в четвертом квартале 2005 года.

Но вернемся к вариантам двуядерности. На данный момент в работе у Intel находится несколько таких проектов, которые различаются между собой некоторыми подходами. Например, ближайшие Pentium D и Extreme Edition на ядре Smithfield — это фактически два полностью независимых ядра, просто расположенные рядом на одном куске кристалла кремния.


Ядро Smithfield

То же самое — для будущих настольных Presler, только там каждое ядро будет отдельным куском кремния. То есть фактически в одном корпусе процессора Presler будет объединено два одноядерных кристалла процессора Cedar Mill.


Presler


Cedar Mill

И если у Smithfield на каждое из ядер приходится по 1 Мбайт кэш-памяти второго уровня, то у Presler это будет уже по 2 Мбайт (то есть 4 Мбайт на весь двуядерный процессор). Для наглядности — следующие блок-схемы:


Pentium 4


Smithfield


Presler

У серверных процессоров, предназначенных для работы в многопроцессорных системах, ситуация чуть сложнее — в отличие настольных Smithfield и Presler, а также от серверного Dempsey (который по сути идентичен по кремнию Presler) процессоры на будущем ядре Paxville будут иметь общую системную шину на два процессорных ядра, хотя кэш-память по-прежнему будет своя у каждого из ядер.


Paxville

Это наглядно видно из следующих блок-схем:


Платформа на Dempsey


Платформа на Paxville

Таким образом, более чем двухпроцессорные системы на двуядерных процессорах потребовали заметно иного подхода — просто объединить два независимых ядра в один процессор уже оказалось недостаточно и потребовалось как минимум сделать еще и общую системную шину (отчасти — из-за требований нагрузочной способности, отчасти — по другим причинам).

Многоядерные процессоры — ближайшие планы

Общие планы перехода Intel на двуядерную и многоядерную архитектуру процессоров иллюстрирует следующий рисунок.

Очень скоро (ориентировочно — в конце весны этого года) на рынок поступят двуядерные настольные процессоры Pentium Extreme Edition и Pentium D на ядре Smithfield, которые будут сосуществовать с одноядерными Pentium 4. Процессоры семейства Intel Xeon пока (до конца 2005 года) останутся одноядерными.

Затем в первом квартале 2006 года им на смену придут настольные и серверные процессоры, изготовленные по 65-нанометровой технологии: двуядерный (двухчиповый) Presler (продолжение линейки Pentium D) и одноядерный Cedar Mill (как продолжение линейки Pentium 4), который, по сути, просто будет одним из двух ядер Presler, а также появятся, наконец, двуядерный Xeon DP на 65-нм ядре Dempsey (по сути — аналог Presler) и двуядерный же Xeon MP на 90-нм ядре Paxville, которое, как и настольный Smithfield, будет содержать два ядра на одном кристалле, каждое из которых будет иметь собственную кэш-память, но общую системную шину. Ну а чуть позднее в 2006 году на смену Paxville придет 65-нанометровая Tulsa, которую в 2007 году сменит процессор со звучным именем Whitefield, о котором пока известно мало, кроме того, что это будет многоядерный процессор.

Среди семейства IA-64 (Itanium DP и Itanium MP) текущие одноядерные процессоры на 130-нм ядрах (соответственно) Fanwood и Madison очень скоро заменят 90-нанометровые Millington и двуядерный Montecito, которые в 2006 году уступят место под солнцем более мощному ядру Montvale (в двухпроцессорном и многопроцессорном вариантах), а далее им на смену придут двуядерная Dimona и многоядерная Tukwila. Последняя, видимо, станет в 2007 году первым восьмиядерным процессором Intel. Но за ним уже запланирован новый процессор — Poulson. Вообще, с планами Intel в сегменте серверов и платформ для них имеет смысл ознакомиться по следующему слайду (кликните по нему, чтобы увеличить):

В соответствии с новым стратегическим направлением работы Intel — платформизацией — над большинством из этих серверных систем поставлены имена соответствующих платформ (то есть, как минимум — чипсет и процессор): платформы Truland и Reidland для многопроцессорных Xeon MP с ядрами Paxville и Whiteland, платформа Bensley для Xeon DP (Dempsey) в начале 2006 года (и аналогичная платформа Glidewell для рабочих станций на Xeon) и платформа Richford для IA-64 в будущем.

Ближайшие персональные настольные и мобильные платформы Intel представлены на следующем слайде и в особых комментариях не нуждаются.

Ну а самая близкая платформа — платформа для цифрового офиса под кодовым названием Lyndon — появится чуть позднее в 2005 году и будет построена на чипсетах Intel серии 945/955 Express и процессорах Pentium 4 5xx/6xx, а также новых двуядерных процессорах Pentium D (Smithfield). Как утверждается, платформа Lyndon уже будет поддерживать технологии Intel Active Management Technology и Intel Virtualization Technology, то есть все необходимые для этого блоки в чипсете Lakeport и соответствующих процессорах предусмотрены. Позднее обе эти технологии появятся и в серверной платформе Bensley.

Что же касается мобильной платформы, то тут двуядерные процессоры Yonah появятся, видимо, под конец 2005 года и станут первыми процессорами, изготовленными по технологии 65 нм. Yonah будет существовать как в двуядерном, так и в бюджетном (и более экономичном по энергопотреблению) одноядерном варианте. И ему на смену уже готовится будущий процессор, детали по которому пока не раскрываются.

В связи с грядущим появлением 65-нанометровых процессоров стоит упомянуть и текущее положение дел с освоением этой технологии на фабриках Intel, представление о котором дает такой слайд:

Причем, как утверждает Intel, сэмплы своих будущих 65-нанометровых процессоров она уже разослала своим основным OEM-партнерам — даже раньше, чем первоначально было запланировано.

А вообще, у Intel сейчас в процессе разработки находится как минимум 15 различных многоядерных процессоров, 5 из которых уже были продемонстрированы общественности как в «натуре»,

так и в работе в составе различных компьютеров на прошедшем IDF, чему была, в частности, посвящена отдельная экспозиция.

Например, «в открытую» (на референс-плате) и «в закрытую» (в ноутбуках и концепт-ПК, см. фото в начале статьи и ниже) демонстрировалась работа двуядерного процессора Yonah на плате с будущим чипсетом Calistoga (945GM),

оснащенном, например, шинами PCI Express и новым южным мостом ICH7M (на фото), ноутбучный диск к которому подключается по Serial ATA.

Как вы уже, наверное, слышали, эта новая мобильная платформа, идущая на смену недавно вышедшей платформе Sonoma, носит название Napa — по имени знаменитой своими винами калифорнийской долины (Sonoma, кстати, — это тоже известная винодельческая долина неподалеку от Сан-Франциско, так что имена мобильные платформы Intel получили явно под впечатлением крепких напитков).

Да и более «поздние» процессоры были представлены на IDF вполне законченными решениями. Например, системы на ядре Smithfield (в вариантах Pentium D и более интересном с точки зрения четырех логических процессоров Pentium Extreme Edition) в большом количестве демонстрировались как «в открытую», где, например, был виден новый чипсет Intel 955X Express (Lakeport) с более массивным, чем у предшественником радиатором на северном мосте,

так и «в закрытую» в системах таких известных производителей ПК как Dell,

Alienware и других.

И даже в виде готовой концепт-платформы ПК для развлечений под управлением Windows Media Center Edition 2005 на базе Pentium Extreme Edition.

Более того, рядышком же работала и система на базе будущего 65-нм настольного процессора Presler — также с чипсетом Intel 955X и памятью DDR2-667, из чего можно сделать определенные выводы о совместимости будущих процессоров и текущих (готовящихся к выходу этой весной) настольных платформ/чипсетов Intel.

Не пустовали и серверные стойки — например, можно было лицезреть в работе будущую платформу Bensley — как однопроцессорную с Pentium D и чипсетом Mukilteo, так и двухпроцессорную с процессорами Dempsey-T и чипсетом Blackford под управлением SUSE Linux.

А рядышком расположилась будущая многопроцессорная система на базе двуядерных Xeon MP с двойной независимой системной шиной (втрое более быстрой, чем у текущих Xeon) и чипсетом Intel E8500.

Не были забыты и мобильные процессоры, причем не совсем в стандартных применениях, см. далее.

Pentium M — в десктопы!

С самого появления процессора Pentium M на рынке (когда это был еще Banias и первое поколение Centrino в начале 2003 года) сотрудников Intel постоянно мучили расспросами, не собирается ли корпорация предложить решения для настольных ПК на базе этого процессора? Ведь по сравнению с «жаркими» (и соответственно шумными) Pentium 4 такие системы, потребляющие всего ватт 25-30 в максимуме (а при малой загрузке способные вообще обходиться одним лишь пассивным охлаждением!) и обладающие (как наследники удачной микроархитектуры Pentium III с существенно увеличенным кэшем) очень даже неплохим быстродействием в потребительских задачах, могли бы прийтись по вкусу очень многим пользователям, как корпоративным, так и домашним… И каждый раз с упорством, достойным лучшего применения, интеловцы отвечали, что нет, не собирается, но если кто-то из сторонних производителей компьютеров захочет производить настольные системы на Pentium M, Intel препятствовать вроде бы как не будет. Однако желающих нашлось не много — видимо, ценовые рамки все-таки отпугивали… Гораздо больше желающих использовать Pentium M нашлось среди производителей промышленных контроллеров и встроенных (embedded) компьютеров.

Но нет худа без добра — постоянное давление на Intel со стороны желающих иметь настольный ПК на Pentium M, видимо, дало свои плоды, и на нынешнем IDF корпорация показала собственные концепты настольных ПК на Pentium M, позиционируемые для цифрового офиса и цифрового дома. Если, конечно, язык повернется назвать эти малютки «настольными» — ЖК-монитор, клавиатура и тонюсенький системный блок — размером чуть больше самой клавиатуры!

У концепта для цифрового офиса (на двух фото ниже) спереди, как и полагается, оптический привод (конечно же, slim), сзади — стандартные компьютерные разъемы…

Про шум охлаждающей системы данных нет («отслушать» блок вдали от гама окруживших его журналистов не представилось возможности, но на вскидку — очень тих). Вот интересно, если такие блоки появятся в продаже, кто в первую очередь станет их брать — потенциальные покупатели ноутбуков или десктопов?

Любопытно, что представлен этот «Small Form Factor Concept PC based on Intel's Next Generation Mobile Technology» (как следует из подписи) был на докладе, посвященном именно мобильным компьютерам, и стоял он в одном ряду с будущими концепт-ноутбуками, коммуникаторами и «таблетами». Кстати, блок питания в этот «блэйд»-корпус, как говорится, not included.

Другой новинкой, как ее окрестили журналисты — «убийцей mini-Mac» — стал крохотный концепт-PC на базе Yonah. Ее представил на ключевом докладе Don MacDonald, вице-президент и генеральный менеджер, Intel's Digital Home Group.

Крохотный «ящичек», оснащенный всем необходимым для домашнего ПК и даже стильным ИК-пультом управления, также базируется на будущей мобильной платформе Intel и двуядерном процессоре Yonah и создан для недорогих применений. Впрочем, чуть большие (раза в два по объему) баребончики на базе Pentium 4 некоторые тайваньские производители уже предлагают с прошлого года на рынке.

Готовые двуядерные процессоры и платформы Intel

У Intel уже есть практически готовые новые двуядерные процессоры, изготовленные по технологиям 90 и 65 нм! Говоря «готовые», руководители корпорации отнюдь не кривят душой, но демонстрируют эти процессоры не только в «кремнии», но и в работающих системах (см. выше). Это 90-нм Itanium 2 на ядре Madisson, 90-нм Pentium на ядре Smithfield и три процессора, изготовленных по новейшему 65-нанометровому техпроцессу: мобильный Yonah, настольный Presler и серверный Dempsey (см. также фото выше).

Интересно, что всего за неделю до начала IDF (то есть 21 февраля) Intel анонсировала, ни много, ни мало, — целое новое ядро для своих настольных процессоров линейки Pentium 4 — Prescott-2M с кэш-памятью второго уровня объемом 2 Мбайт. И выпустила на нем сразу 5 топовых процессоров — Pentium 4 660/650/640/630 и Extreme Edition 3,73 ГГц. Поэтому решение совсем скоро (во втором квартале, который уже «на носу») выпустить еще одно — революционное — ядро для линейки Pentium выглядит на первый взгляд, маркетинговым перебором. Впрочем, нам от этого шквала новинок — только радость.

Одна из главных «процессорных» новостей IDF — для новых настольных процессоров Intel решила отказаться, наконец, от раскрученной годами (но впитавшей при этом, что греха таить, немало противоречивых эмоций) марки «Pentium 4» (благо — есть подходящий повод — двуядерность), и теперь настольные процессоры корпорации будут называться просто — Pentium Processor Extreme Edition и Pentium D Processor (последний — видимо, по аналогии с Celeron D и Pentium M/Celeron M, хотя вместо «Desktop» тут напрашивается параллель и с «Dual Core»). (К тому же четверка в китайской культуре — это несчастливая цифра, и она звучит похоже на слово «смерть».)

Как известно, для новых настольных процессоров Pentium D и EE Intel подготовила ядро Smithfield, которое содержит в себе (на едином кристалле, см. фото)

фактически два независимых ядра слегка модифицированного Prescott. Концепция и работа многоядерности в Smithfield базируется, в частности, на предыдущем успехе параллельных вычислений в одном процессоре, оснащенном многопоточной технологий Hyper-Threading (Intel Pentium 4 и Xeon). Однако здесь идея параллельных вычислений в одном ядре получила дальнейшее развитие, причем, если для старшего процессора на ядре Smithfield (а это будет Pentium Extreme Edition 840 с тактовой частотой 3,2 ГГц) оба вычислительных ядра (напомню — по архитектуре аналогичных Prescott) также имеют Hyper-Threading (что в сумме дает 4 логических процессора для одного физического Pentium EE), то для более массового Pentium D технология Hyper-Threading для ядер будет (пока) дезактивирована, то есть в системе он будет виден как два (а не 4) логических процессора.

И, кажется, я даже догадываюсь, почему дезактивирована: если исключить чисто маркетинговые причины (а их, в принципе, уже достаточно, чтобы оправдать этот шаг), то проблема может заключаться в следующем. Для Pentium D, как и для их предшественников Pentium 4 6xx, заявлена поддержка технологии энергосбережения EIST, позволяющая практически моментально менять частоту работы и напряжение питания ядра процессора, так что приложения и пользователь этого практически не замечают. Например, даже когда вы активно «колотите» по клавиатуре, набивая текст, процессор в паузах нажатия на клавиши может переходить в маломощное состояние и обратно. Поддержка EIST, как мы помним, принудительно отключена в самом старшем современном процессоре — P4 Extreme Edition 3,73 — для того, чтобы не терять ни процента производительности самого дорогого на данный момент настольного решения. Очевидно, таким же образом поступят и с Pentium Extreme Edition 840 — он не будет поддерживать EIST. И при этом проблем в совместимости EIST (и более глубоких состояний «сна») с одновременной работой Hyper-Threading на двух ядрах не может быть по определению. В ситуации же с Pentium D накладывается еще и желание понизить тепловой пакет процессора — 4 логических процессора потребляют явно больше при активной работе, чем два ядра без HT.

Благодаря этому удалось уместить тепловой пакет двуядерных Pentium в скромные цифры — 130 ватт для старших моделей и 95 ватт для мейнстрима.

Попутно отмечу еще два отличия новых двуядерных процессора — по организации схемы понижения питания при EIST и при мониторинге температуры. Они наглядно пояснены на соответствующих рисунках.

Оба ядра двуядерных процессоров работают от одного и того же напряжения питания, а динамический VID меняется так, что Vcc понижается только когда оба ядра готовы к этому. Частоты ядер могут меняться независимо друг от друга, но напряжение питания будет следовать за наиболее активно используемым ядром. В плане оптимизации энергопотребления и распределения вычислительных ресурсов с целью экономии потребления между ядрами нет никаких связей. Отсюда, в частности, вытекает и то, что экономия энергопотребления от использования EIST в случае двуядерных процессоров будет в процентном отношении меньше, чем у одноядерных (и это стало одной из причин отключения HT в Pentium D).

В настольных двуядерных процессорах для температурного мониторинга используется термодиод только в одном из ядер на кристалле (видимо, в целях совместимости с решениями для существующих сокетов и платформ), но в серверных двуядерных процессорах каждый чип/ядро имеет собственный мониторинг. А вообще, по мнению Intel, многоядерные технологии — это именно тот путь развития микропроцессоров на современном этапе, который позволяет получить нужную производительность при сохранении энергопотребления в разумных пределах.

Новое ядро Smithfield насчитывает 230 млн. транзисторов, занимает площадь 206 кв. мм, производится по стандартному 90 нм процессу, имеет 2 Мбайт кэш-памяти второго уровня (по 1 Мбайту на ядро) и рассчитано на использование в конструктиве LGA 775. Системная шина Pentium D и Pentium Extreme Edition — пока лишь 800 МГц, поддерживаются технологии EM64T, XD-bit, EIST (для Pentium D) и более ранние. Максимальная тактовая частота — пока 3,2 ГГц.

Работать эти процессоры будут только (!) с будущими чипсетами Intel — на первых порах должны появиться чипсеты линейки Lakeport — 955X Express и 945G/P Express. Они поддерживают системную шину 800 МГц и 1066 МГц, двухканальную память DDR2 с частотой до 667 МГц, наличием или отсутствием ECC и суммарным объемом до 8 Гбайт (!) — впервые для настольных систем. Есть шина PCI Express x16 (при помощи специального моста можно добавить и вторую PCI Express x16). Новый южный мост ICH7 имеет шесть PCI Express x1, 8 портов USB 2.0, 4 порта SATA (и один UATA) с возможностью организации RAID уровней 0, 1, 5 или 10 (и, конечно же, Matrix RAID). Интегрированный в 945G видеоускоритель — более производительный, чем у 915G, но изменения в нем не носят кардинального характера.

Северный мост нового чипсета будет иметь более высокое тепловыделение, чем текущий 915G — его TDP составляет 23,8 ватт против 18,7 ватт у предшественника. Соответственно потребуется более эффективный теплоотвод и для ATX-плат уже спроектирован более массивный радиатор (на фото). Максимально допустимая температура внутри кристалла Lakeport составляет 96 градусов Цельсия.

По технологии 90 нм все двуядерные процессоры Intel производятся как единые кристаллы, однако следующие 65-нм двуядерные процессоры, несмотря на почти вдвое меньшую площадь одного ядра по сравнению с их 90-нм предшественниками Smithfield, будут составляться из двух кристаллов (одно ядро на кристалле), хотя никакой разницы по функционированию при этом не будет. Зато независимые кристаллы, упакованные в один корпус, проще подбирать в пары по характеристикам с одной пластины или даже разных пластин, достигая тем самым более высокого выхода годных, чем когда оба ядра расположены на одном кристалле.

Кроме того, у Intel одновременно будет выпускаться и одноядерный процессор аналогичной архитектуры — Cedar Mill. Поэтому для обоих процессоров выгоднее иметь единый производственный процесс на кремнии. Наконец, при «сборке» двух кристаллов в один корпус, в ряде случаев упрощается решение проблем с тепловыделением, хотя пока непонятно, как при этом будет обстоять дело с температурным мониторингом — ведь эти «двухкристальные» процессоры также предназначены для Socket LGA 775.

Основное архитектурное отличие здесь — 65-нм кристаллы имеют уже по 2 Мбайт кэш-памяти L2 на каждое вычислительное ядро (то есть всего 4 Мбайт в процессоре). Причем для Presler работа Hyper-Threading пока не заявлена, тогда как для его одноядерного аналога Cedar Mill — технология Hyper-Threading присутствует. Есть Hyper-Threading и в аналогичных Presler серверных процессорах Dempsey, предназначенных для Socket LGA 771, а также в многопроцессорных Xeon MP на 65-нм ядре Paxville, которое будет производиться по 90-нм технологии на едином кристалле. Таким образом, если Hyper-Threading в Presler так и не включат, то это будет объясняться почти полностью маркетинговыми соображениями (и в небольшой степени — стремлением снизить энергопотребление).

Первые оценки быстродействия двуядерных процессоров

Для демонстрации производительности нового двуядерного процессора Pentium Extreme Edition сотрудники корпорации на одном из докладов IDF запустили один из хорошо оптимизированных для NetBurst и Hyper-Threading тест Cinebench 2003, который осуществляет рендеринг трехмерных сцен с использованием четырех одновременных потоков в профессиональном пакете трехмерного моделирования Maxon Cinema 4D.

Полученные в реальном времени результаты показали, что скорость рендеринга стандартной сцены на Pentium Extreme Edition 3,2 ГГц составила 696 CB-CPU, тогда как тот же процессор при отключении многопоточности (рендеринг одним потоком) показал лишь 229 CB-CPU, то есть ускорение от многопроцессорности в этом тесте составляет более трех раз!

Чтобы «почувствовать разницу» — у Pentium 4 6xx/5xx ускорение от HT в этом тесте составляет «всего» 20%. Для сравнения приведу собственные данные для самых последних Pentium 4 в этом процессорном тесте (с Hyper-Threading):

Производительность двуядерного процессора по сравнению с предшественниками впечатляет. Но несколько настораживает и другое: на одиночном потоке, равно как и в других подтестах этого бенчмарка новый процессор заметно уступает предшественникам: 1290 и 270 единиц CB-GFX в OGL software и C4D Shading соответственно явно меньше показателей старших Pentium 4.

Для Pentium Extreme Edition 3,2 ГГц с частотой FSB 800 МГц (который, по утверждению производителя, уже представлен серийными, промышленными, а не опытными образцами) здесь использовалась платформа на базе будущего чипсета 955X Express (препродакшн-версии) с 1 Гбайт памяти DDR2-667 под Windows XP Professional SP2 с видеокартой ATI X800 XT (мои результаты для нынешних процессоров, показанные выше, как и данные для P4 EE 3.73, показанные Intel ниже, получены на такой же системе, за исключением типа памяти (DDR2-533) и чипсета — i925XE). Так что влияние графической подсистемы здесь сведено к минимуму. Конечно, окончательные выводы о производительности нового процессора делать еще очень рано, но неужели Intel пошла на дальнейшее удлинение конвейера в Smithfield (это могло бы быть одним из объяснений наблюдаемых результатов)?

С другой стороны, как заявил Stephen Smith, вице-президент Digital Enterprise Group, на фото,

во многих мультимедиа-приложениях скорость нового Extreme Edition возрастает по сравнению с прежним (3,73 ГГц; тестовая конфигурация описана выше) в полтора и более раза, см. слайд.

Впрочем, скорость Pentium D, где HT дезактивирована, может оказаться несколько меньше, и бурной революции производительности в повседневных задачах от первых двуядерных процессоров нам ожидать не стоит. Тем более что они работают на более низких частотах, чем текущие Pentium 4. Впрочем, такой шаг корпорации понять не сложно — незачем внезапно выбрасывать на рынок продукт с вдвое большим быстродействием, если можно наращивать его постепенно, имея в запасе некоторый резерв и снимая за каждый шаг небольшого повышения производительности платформ определенную маржу.

Другую оценку производительности новых двуядерных Pentium можно провести, если воспользоваться текущими данными теста SPEC jbb2000 для нынешних Pentium 4 с частотой 3,6 ГГц и двухпроцессорных систем на Xeon DP с частотой 3,2 ГГц и включенным и отключенным Hyper-Threading (первый будет представлять Pentium Extreme Edition, второй — Pentium D). Результаты для таких систем показаны на слайде и внушают определенный оптимизм.

Впрочем, реальных систем на новых процессорах ждать осталось не так уж долго — тогда и посмотрим, насколько эти данные будут соответствовать реальности.

А напоследок замечу, что большинство современных операционных систем Microsoft уже поддерживают двуядерные процессоры, коль скоро они полностью эквивалентны двухпроцессорным системам. Причем, никакой дополнительной оплаты за многоядерность Microsoft брать не собирается, и система для определения вида лицензии, как и в случае с Hyper-Treading, будет оцениваться по количеству физических процессоров (сокетов), а не логических процессоров.




Дополнительно

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.