Аудитория iXBT.com задаёт вопросы компании Intel


Тема беседы: «Penryn — новые 45-нм процессоры Intel»

 Слушать подкаст

2 ноября сего года компания Intel официально объявила о выпуске продукции нового поколения — процессоров, семейство которых до настоящего времени имело кодовое наименование Penryn и создано на базе передовой 45-нм производственной технологии. Однако, было бы неправильно рассматривать данное событие лишь с точки зрения появления на рынке новых процессоров и обновления производственных технологий согласно закону Мура. Впервые за последние 40 лет в создание полупроводниковых транзисторов привнесены изменения (диэлектрик на основе гафния с высоким коэффициентом диэлектрической проницаемости — hi-k, металлический затвор), которые качественно и существенным образом меняют характеристики продукции, позволяя значительно снизить ее тепловыделение и повысить ценность других потребительских качеств.

Уместно отметить, что случилось это замечательное событие в год, когда мировая научная общественность отмечает 60-летие с момента создания самого первого транзистора американскими физиками и нобелевскими лауреатами У. Шокли, У. Браттейном и Д. Бардином. Сегодня корпорация Intel, продолжая научные традиции и являясь технологическим лидером в области производства интегральных микросхем, предлагает инновации в области полупроводниковых технологий, которые стремительно меняют мир ИТ и способствуют зарождению новой эпохи в компьютерной индустрии.

Ведущий специалист московского офиса Intel по применению продукции Алексей Рогачков


и директор Intel по развитию корпоративных технологий в России Николай Суетин, готовы ответить на ваши вопросы, связанные как с новым семейством продуктов Intel, так и с технологическим процессом, инновациями на уровне полупроводниковых транзисторов и производством.

Чтобы задать вопрос, необходимо было сформулировать его и оставить в виде одной из тем в специальном форуме нашей конференции.



1. Mak: Несоответствие потребления энергии и TDP
nexERR: пара вопросов: стоимость в связи с нововведениями и энергопотребление

Николай Суетин: Практически никак, поскольку стоимость этого технологического процесса составляет малую часть от всех затрат. Интегрально же, стоимость одного транзистора УПАЛА в 2 раза соответствии с законом Мура.

Алексей Рогачков: Во время обсуждения вопроса было совершенно правильно отмечено, что характеристика TDP, указываемая для процессоров Intel не является ни максимальной цифрой тепловыделения, ни максимальной характеристикой энергопотребления. Цифра TDP несет не информативный и не коммерческий, а чисто практический смысл — это рекомендация Intel, какое количество теплоты кулер должен отвести от процессора, чтобы обеспечить нормальное функционирование. Разработчику системы охлаждения все равно, сколько электричества потребляет процессор, его волнуют чисто утилитарные вопросы: какой материал, какого профиля, с каким вентилятором использовать для того, чтобы обеспечить работу процессора в штатном режиме, и сколько все это в конечном итоге будет стоить. Принимая во внимание, что абсолютное большинство пользователей при повседневном использовании не будут ввергать систему в стрессовое состояние, вызывая риск перегрева, можно взять усредненное значение, сэкономив некоторое количество меди или аллюминия. Эта экономия будет малозаметна на примере одного кулера, но при массовом производстве в масштабе компании-производителя экономия может быть весьма существенной. На крайний случай есть методы защиты от перегрева. Похожим образом поступают авиакомпании, продавая чуть большее количество билетов на рейс, чем может вместить самолет, исходя из накопленной статистики неявки пассажиров.

Энергопотребление процессора — величина, изменяющаяся динамически, так как в каждый момент времени процессор загружен неодинаково, и однозначно эту цифру указать возможно только для стабильных состояний. Согласитесь, что с практической точки зрения важно не энергопотребление процессора в отдельности, а энергопотребление системы в целом. Взять хотя бы обсуждение подбора блока питания: процессор, разумеется, важная составляющая, но если используется встроенная графика, мощность блока питания будет одна, а в случае пары дискретных графических карт — совсем другая. Таким образом, энергопотребление процессора имеет практическую пользу в сочетании с остальными компонентами компьютера, поэтому Intel не возьмет на себя смелость рекомендовать мощность блока питания на коробке процессора.

2. Jklwirt: Наследственность x86

Алексей Рогачков: С интересом читая обсуждения в данной ветке, припомнил «Основы информатики» первого курса института. В одной из первых лекций начитывались принципы построения ЭВМ: открытая архитектура, принцип магистральности, модульности, совместимость «сверху-вниз». Обсуждаемый вопрос касается именно последнего.

Можно дискутировать на тему того, что не все элементы архитектуры x86 реализованы изящно и удобно. Но огромное количество программ и популярность процессоров семейства x86 говорит о том, что разработчики могут эти «неудобства» обходить, а для пользователей они прозрачны. Благодаря соответствию принципу совместимости «сверху-вниз», купив сегодня процессор, сделанный на базе 45 нм технологии производства с 820 миллионами транзисторов, можно быть уверенным, что новый процессор будет выполнять программу написанную на Intel 8086 c 29 тысячами транзисторов, созданным по технологии 3000 нм без малого тридцать лет назад. В общем плане, это гарантия производителя в том, что использумые покупателем приложения будут работать на новой модели процессора без необходимости ставить звездочку в описании продукта и перечислять ограничения мелким шрифтом внизу. В том факте, что существуют пользователи, до сих пор использующие реальный режим работы процессора, сомневаться не приходится, хотя бы по собственному опыту.

3. AlexeySob: Когда в магазинах появятся пенрины и будут ли они совместимы с материнскими платами, продающимися сейчас?

Алексей Рогачков: Не секрет, что наш рынок обладает своей спецификой. Увы, тот факт, что новые процессоры начали отгружаться с 12 ноября не означает, что через пару недель новый продукт появится на прилавках российских магазинов. Процессоры Intel ввозятся дистрибуторами, но и от степени отлаженности логистической цепочки дистрибуторов зависит далеко не все. Процессоры, как и любой импортируемый товар, должны пройти через таможню, и на данном этапе сроки могут быть разными. Кроме того, необходимо учитывать и фактор новогодних праздников. Мы ожидаем, что первые процессоры на базе 45 нм технологии производства появятся в начале следующего года.

К части вопроса о совместимости, Intel поддерживает конфигурации процессора Core 2 Extreme QX9650 с чипсетами P35 и X38, но про поддежку конкретной моделью материнской платы правильнее справится у производителя платы.

4. CrashOverride: Маркировка, FSB, получаемая частота.

Алексей Рогачков: Должен поддержать участника обсуждения, который говорил, что за установку правильного коэффициента умножения отвечает BIOS. В одном из модельно-специфических регистров процессора прописан максимальный коэффициент умножения данной модели процессора. BIOS на этапе инициализации считывает значение этого регистра и отвечает за правильную установку текущего значения множителя. Таким образом, процессору не очевидна внешняя частота, подаваемая тактовым генератором материнской платы. Модуль фазовой автоподстройки частоты работает с коэффициентом, заданным BIOS, поэтому результирующая частота зависит от в первую очередь от частоты, подаваемой тактовым генератором. Процессор в данном случае выступает не самоконфигурирующимся, а, скорее, пассивным устройством, которое должно быть правильно настроено BIOS.

5. Ralari: Про соотношение объемов кэшей L1 и L2, минимальный множитель в режиме энергосбережения и взаимное расположение компонентов процессора на кристалле.

Алексей Рогачков: Объем кэш-памяти первого и второго уровня обуславливается идеологией использования.

Кэш-память первого уровня в микроархитектуре Intel Core призвана обеспечить минимальную латентность. Очевидно, что при большем объеме памяти, больше данных можно уместить в кэш, но с другой стороны, увеличивается и время поиска. При запросе данных или выборке инструкций из L1 счет идет на единичные циклы процессора, поэтому при рассмотрении объема кэш-памяти необходимо балансировать между задержками и размером.

Хочу также развить прозвучавшее замечание про инклюзивность кэш-памяти в микроархитектуре Intel. Наличие копии данных L1 в L2 также является фактором, влияющим на величину кэш-памяти первого уровня. Если кэш является эксклюзивным, то при отсутствии данных в L1 необходимо отправляться за строками данных в оперативную память, что для процессора крайне долгая операция, поэтому в случае эксклюзивной организации с целью уменьшения вероятности промаха, объём кэш-памяти первого уровня разумно увеличить. При неизменном увеличении латентности, разумеется.

Задача кэш-памяти второго уровня — держать как можно больше данных наготове, задержки здесь также важны, но менее критичны, чем для L1. Поэтому объём L2 в процессорах Intel во много раз превышает объём L1, но и задержки доступа в L2 в несколько раз больше зедержек доступа в L1.

Переключение пары множитель-рабочее напряжение не дается бесплатно и не происходит моментально. При каждом подобном переходе в течение малого периода времени процессор «закрыт» для выполнения инструкций, обработки прерываний, запросов шины… При большем числе ступеней перехода, время недоступности суммируется. Кроме того, при изменении рабочих точек процессора, энергопотреблением уменьшается отнюдь не по линейной зависимости, так как снижение напряжения работы некоторых блоков (например, буферов ввода/вывода) порождает виток дополнительных сложностей, и эти блоки работают на постоянном напряжении. Таким образом, после определенного уровня снижение рабочего напряжения и коэффициента умножения не оправдано снижением энергопотребления и задержками возврата в рабочее состояние. Данный порог имеет место не только для процессоров на базе Intel Core: для Pentium 4 также существовала подобная точка — то был коэффициент умножения, равный 14.

Бесспорно, разные блоки процессора нагреваются по-разному. При интенсивной нагрузке, как правило, сильнее остальных нагревается блок плавающей арифметики. Именно по этой причине цифровой датчик температуры, появившийся на процессорах семейства Intel Core представляет из себя не один датчик, а несколько датчиков на разных участках кристалла, аналого-цифровой предобразователь и логику, которая сравнивает получаемые значения, и показание самого горячего датчика выдает наружу.

Что же касается размещения кэш-памяти второго уровня, то не следует забывать, что кэш-память второго уровня в текущей линейке процессоров является общей для двух ядер. При большом количестве транзисторов и большой площади кристалла начинает сказываться время распространения сигнала внутри процессора. Реализованное в процессорах Intel расположение ядер и кэш-памяти обеспечивает минимальную разницу во времени доступа, что важно при расчете конвейера. Если же ядра разместить в центре, а кэш-память вокруг, то кэш-память будет удалена от каждого из ядер неодинаково: отдельные участки кэш-памяти будут ближе к одному потребителю, но дальше от другого, что создает дополнительные сложности согласования.

6. allilya: Penryn — шаг назад?
Kpoxa: Penryn 2x2=4

Алексей Рогачков: Присоединяюсь к комментариям тех участников, которые на первый план инноваций семейства процессоров Penryn выводили новый процесс производства.

Действительно, изменение тех. процесса на первый взгляд в глаза не бросается — физически процессор в той же упаковке, цифры характеристик практически не изменились: частоту в 3 ГГц мы уже видели; да, объем кэш-памяти увеличился, цифры TDP остались прежними, а слова про инструкции SSE4 пока звучат абстрактно на фоне среднего прироста в 8% согласно обзору iXBT.com.

Однако для Intel, да и всей индустрии полупроводников появление Penryn — это настоящий прорыв. Почему? Дело в том, что переход на более тонкий процесс производства стал возможен только благодаря фундаментальным изменениям на самом низком уровне — на уровне материалов, из которых сделан транзистор. Достаточно сказать, что на протяжении последних 40 лет изменений сравнимых с тем, что мы наблюдаем сейчас, попросту не происходило, и работающий экземпляр Intel Core 2 Extreme QX9650 — это результат долгой и кропотливой научно-исследовательской работы.

Переход на новый процесс производства дается нелегко, сложностей и ошибок избежать невозможно. Если в этот же момент вводить и микроархитектурные изменения, то трудности производственного характера накладываются на естественные проблемы разработки микроархитектуры, что увеличивает количество ошибок, и как следствие негативно отражается на планах выпуска, производительности, доступности. Стратегия Intel — разнести обоюдное влияние данных факторов друг на друга и вносить изменения независимо на ежегодной основе. Сейчас можно заметить, как это работает: в прошлом году мы увидели значительные изменения микроархитектуры с появлением Intel Core. В этом году Intel вводит новый процесс производства, не подвергая микроархитектуру процессора значительным изменениям. Можно догадаться, что в следующем году, можно ожидать более значимых изменений микроархитектурного уровня, а ещё через год — новый процесс производства.

Хочу подчеркнуть, что Penryn — это в первую очередь новый процесс производства, от которого можно ждать сопуствующих подобному переходу изменений: повышения тактовых частот, увеличения объема кэш-памяти, снижения энергопотребления.

7. morgoved: Множитель на процессорах Penryn

Алексей Рогачков: Процессоры серии Extreme — это не только маркетинг, это лучшие кристаллы с пластины, которые завелись на высокой частоте, которые обладают меньшим энергопотреблением и, как следствие, имеют высокий разгонный потенциал. Кроме того, мы ожидаем, что процессоры этой серии приобретают опытные пользователи, и потому оставляем возможность изменять коэффициент умножения. Разумеется, выход подобных процессоров при производстве довольно мал, поэтому и стоимость этих кристаллов выше. В ближайшее время Intel не намерена менять свой подход к линейке процессоров Extreme.

8. avalonhost: Penryn будет представлять «склейку» двух кристаллов?

Алексей Рогачков: На сегодняшний момент четырехъядерные процессоры Intel представляют из себя два двухъядерных процессора в одном корпусе по ряду причин.

С подобным подходом Intel использует отлаженное производство, что позволяет быстро произвести четырёхъядерные процессоры, в количествах, достаточных для удовлетворения спроса, и по доступной цене. Кроме того, имея возможность подбирать кристаллы оптимальным образом, Intel может предложить широкий выбор четырехъядерных процессоров с разными тактовыми частотами в зависимости от потребностей. И что немаловажно, четырёхъядерный процессор Intel — это полноценные четыре вычислительных ядра, которые дают очевидный прирост производительности по сравнению с двухъядерным процессором. Таким образом, производительность, доступность и цена — те факторы, которые явились ключевыми в данном вопросе.

9. Mak: Холодный процессор это реально?

Николай Суетин: Надо четко понимать с чем сравниваем.

Если попытаться использовать «классический» диэлектрик — SiO2, то при переходе на 45 топологические нормы токи утечки возросли бы в 100 раз!!! Использование диэлектрика на основе гафния позволило не только решить эту проблему, но на >30% уменьшится энергопотребление транзисторов по сравнению с 65 нм тепроцессом.

Пока мы не используем и не планируем использовать выделяемое тепло. Наоборот, мы стараемся уменьшить его количество.

10. nexERR: Будущее не за горами :)

Николай Суетин: Квантовых компьютеров нет в наших рабочих планах на ближайшие 10 лет, поскольку, пока, они находятся в стадии исследований, имеют ограниченную область применений, и не могут быть массовым продуктом.

Над заменой кремния мы думаем и работаем (достаточно посмотреть на наш сайт).

11. Vasizard: Многоядерность и её цена

Николай Суетин: Себестоимость в пересчете на одно ядро будет снижаться, т.к. все будет в «одном пакете», т. е. экономия на сборках и межсоединениях.

Российское подразделение принимает участие в целом ряде проектов имеющих прямое отношение к разработке многоядерных процессоров. Оценить количественно наш вклад затруднительно.

Имена и торговые марки являются собственностью законных владельцев.

Итак, время подводить итоги. Было нелегко определить наиболее интересный вопрос, но наши собеседники и редакция iXBT.com выделили вопрос участника под ником Mak, Несоответствие потребления энергии и TDP.

Поздравляем нашего читателя. Алексею был вручён приз в офисе iXBT.com — современная плата на чипсете Intel P35 ASUSTeK P5K Premium WiFi.




Дополнительно

iXBT BRAND 2016

«iXBT Brand 2016» — Выбор читателей в номинации «Процессоры (CPU)»:
Подробнее с условиями участия в розыгрыше можно ознакомиться здесь. Текущие результаты опроса доступны тут.

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.