Intel Katmai


Следующий процессор, который должна представить публике корпорация Intel — это Katmai. Этот процессор нацелен на применение в компьютерах ценой порядка $2000, а значит, велика вероятность того, что кристалл окажется в нашей домашней или рабочей машине. На прошедшем недавно Microprocessor Forum стали известны некоторые подробности этой новой архитектуры. Сегодня наш рассказ пойдет о ней.

Процессор

Процессор Pentium II, основанный на ядре Katmai будет запущен в производство в начале 1999 года. Будет выпущено сразу две версии, предназначенные для установки в Slot 1, — с частотами 450 и 500 МГц. При производстве этих процессоров будет использован уже применяемый в настоящее время технологический процесс 0.25 мкм. Как и Deschutes, Katmai будет изначально работать со 100-мегагерцовой системной шиной и содержать L2-кэш объемом 512 Кбайт, функционирующий на половинной частоте ядра. Но, в отличие от своего предшественника, объем кэша первого уровня будет удвоен и достигнет 64 Кбайт, благодаря чему ожидается увеличение производительности кристалла на 5-10%.

Performance PC

В дальнейшем, ко второй половине 1999 года ожидается выпуск версии Katmai с частотой 533 МГц, выполненной по технологии 0.18 мкм и использующей новую системную шину 133 МГц. Эта внешняя частота будет поддерживаться в новом чипсете i440JX "Camino", который ориентирован на применение в системе оперативной памяти RAMBUS, поддержку AGP 4x mode и ATA-66. В старших моделях Katmai объем L2-кэша будет достигать 1 или даже 2 Мбайт.

Также Katmai можно будет использовать в уже имеющихся Slot-1 материнских платах на чипсете i440BX, но после перепрошивки BIOS.

Цена младшей 450-мегагерцовой модели на начальном этапе составит порядка $600.

Для более дешевых систем предусматривается создание своего рода Celeron-процессора на ядре Katmai, но с кэш-памятью второго уровня, также работающей на половинной частоте процессора, объемом 192 или 256 Кбайт. Возможно, L2-кэш в этой модели будет интегрирован в ядро, как у Mendocino. Есть мнение, что в этом кэше будет использована SDRAM, однако, есть серьезные сомнения в возможности ее работы на таких частотах.

В процессоре Katmai, Intel, кроме наращивания частот, увеличения объема кэша и применения нового технологического процесса, коснулся и изменения архитектуры. Основными нововведениями в Katmai, помимо уже применяемых в существующих Pentium II-процессорах динамического исполнения, специфичной шины P6 и технологии MMX, будут являться конкурентная архитектра SIMD-FP с набором команд KNI, новые инструкции MMX и поточная архитектура работы с системной памятью. Рассмотрим все по порядку.

KNI

Ключевым новшеством в архитектуре Katmai является добавление 70 новых команд процессора для работы с трехмерной графикой. Как и в 3DNow!, все эти команды предназначены для работы с числами одинарной точности с плавающей точкой (32-битные вещественные). Этот набор команд, названный KNI (Katmai New Instructions), как и MMX, является SIMD-инструкциями (Single Instruction Multiple Data), что наиболее соответствует потребностям 3D-обработки. Это означает, что одной такой операцией процессор может обработать несколько (пар) данных. Идея SIMD уже была использована AMD в процессоре K6-2, однако то, что предлагает Intel, отличается от технологии конкурента.

KNI оперируют с восемью новыми регистрами процессора, представляя собой еще один модуль, типа арифметического сопроцессора, названный SIMD-FP. Регистры SIMD-FP являются 128-битными и позволяют хранить в себе одновременно 4 числа с плавающей точкой одинарной точности. Таким образом, оперируя с двумя такими регистрами, возможно выполнить операцию одновременно над четырьмя парами аргументов. Эта идея позволяет достичь пиковой производительности одного конвейера SIMD-FP до 2 GFLOP/с при частоте ядра 500 МГц. Пока не ясно, сколько параллельных конвейеров будет содержать Katmai — 1 или 2, то есть в последнем случае пиковая производительность сможет достигнуть 4 GFLOP/с. Следует заметить, что пиковая производительность модуля 3DNow!, имеющего два конвейера и 8 64-битных регистров — 2 GFLOP/c.

KNI SIMD architecture for FP data

Для работы с новыми регистрами, названными XMM0-XMM7, Intel ввел в Katmai дополнительный режим процессора (вспомним введенный 10 лет назад protected mode). Этот режим позволяет использовать SIMD-FP одновременно с MMX или арифметическим сопроцессором, так как они используют разные регистры. Как известно, именно по причине общих регистров, MMX одновременно с FP-сопроцессором работать не могут. Кстати, и модуль 3DNow! работает только отдельно от MMX и сопроцессора.

Однако, для использования нового режима, как и для поддержки KNI вообще, требуется поддержка со стороны операционной системы. Например, при переключении задач, система должна сохранять состояния регистров XMM0-XMM7. Хотя DirectX 6.0 и не поддерживает KNI, в отличие от 3DNow!, существует патч ядра Windows 98 для сохранения регистров SIMD-FP, а Windows NT 5.0 поддерживает KNI по умолчанию.

С 128-битными регистрами SIMD-FP оперируют новые инструкции KNI. Сказать что-то об их реализации сейчас нельзя, однако их набор содержит загрузку, запись, сложение, умножение, логические операции, модуль, квадратный корень и.т.п. То есть их набор похож на набор инструкций 3DNow!, но будет ли он быстрее, зависит от его реализации, а это станет понятно позже. Синтаксис инструкций KNI во многом повторяет на инструкции MMX. Также, учитывая то, что Microsoft уже предлагает библиотеки для их поддержки в своих компиляторах, KNI-инструкции быстро получат широкое распространение в среде разработчиков программного обеспечения.

KNI может использоваться не только в приложениях, связанных с 3D-графикой, но и в других задачах, требующих активных вычислений с плавающей точкой и не требующих большой точности. Например, распознавание речи, моделирование, объемный синтез звука, MPEG-кодирование и декодирование и т.д.

Тем не менее, несмотря на все свои преимущества, KNI вскрывает и многие недостатки архитектуры x86. А именно — аппаратное ограничение в 8 регистров приводит к тому, что некоторые приложения цифровой обработки сигналов не смогут быть оптимизированы под эту архитектуру. К тому же все операции в x86 - бинарные, а уже сейчас есть необходимость в вычислении функций типа скалярного произведения векторов, реализуемых в современных и дорогих графических процессорах. То есть, развитие KNI лежит, скорее всего, за пределами x86-архитектуры.

MMX

В стандартный модуль MMX процессора Katmai также внесено несколько дополнительных инструкций. В основном, они нацелены на облегчение задач распознавания речи и кодирования-декодирования видеосигнала. В их числе — сумма абсолютных значений разностей, вычисление среднего значения с округлением в меньшую сторону, нахождение минимума и максимума. Вот только на быструю поддержку этих команд девелоперами рассчитывать не приходится — MMX и так очень медленно двигается в жизнь, да еще и соответствующий инструментарий, использующий новые команды отсутствует.

Работа с памятью

Процессор Katmai также содержит усовершенствования шины P6 для поточного доступа к памяти.

Memory Streaming Benefits

Новый механизм предсказаний позволяет уменьшать задержки при последовательном доступе к памяти и исключает "забивание" кэша данными, которые используются однократно. Кроме того он определяет в какой из кэшей — в L1, во все или во все кроме L1 должны быть записаны данные для увеличения полосы пропускания. Новый мханизм может позволить обработку до восьми одновременных независимых запросов.

Katmai Streaming architecture

По обещаниям Intel, эти усовершенствования позволят поднять производительность еще на 5-20%, особенно при кодировании и декодировании MPEG-2.

Выводы

Intel подготовил достойный ответ AMD 3DNow!. Единственное, на что может уповать AMD в сложившихся условиях, так это на низкую цену своих процессоров. Очевидно, что проблем у Intel как с внедрением MMX уже не будет. Почва для KNI уже подготовлена. Разработчики программного обеспечения уже получили инструментарий для использования KNI и процессоры для тестирования. К моменту выхода Katmai, его возможности будут использоваться многими приложениями. А у AMD проблемы возникнут несколько позднее, когда придется встраивать KNI в свое ядро.

Выпуская 3DNow!, AMD сделал достойный ответ на интеловский MMX. Будем надеяться, что этот шаг Intel - KNI — окажется таким же сильным.




19 октября 1998 Г.

Процессор Intel Katmai

Intel Katmai

Следующий процессор, который должна представить публике корпорация Intel — это Katmai. Этот процессор нацелен на применение в компьютерах ценой порядка $2000, а значит, велика вероятность того, что кристалл окажется в нашей домашней или рабочей машине. На прошедшем недавно Microprocessor Forum стали известны некоторые подробности этой новой архитектуры. Сегодня наш рассказ пойдет о ней.

Процессор

Процессор Pentium II, основанный на ядре Katmai будет запущен в производство в начале 1999 года. Будет выпущено сразу две версии, предназначенные для установки в Slot 1, — с частотами 450 и 500 МГц. При производстве этих процессоров будет использован уже применяемый в настоящее время технологический процесс 0.25 мкм. Как и Deschutes, Katmai будет изначально работать со 100-мегагерцовой системной шиной и содержать L2-кэш объемом 512 Кбайт, функционирующий на половинной частоте ядра. Но, в отличие от своего предшественника, объем кэша первого уровня будет удвоен и достигнет 64 Кбайт, благодаря чему ожидается увеличение производительности кристалла на 5-10%.

Performance PC

В дальнейшем, ко второй половине 1999 года ожидается выпуск версии Katmai с частотой 533 МГц, выполненной по технологии 0.18 мкм и использующей новую системную шину 133 МГц. Эта внешняя частота будет поддерживаться в новом чипсете i440JX "Camino", который ориентирован на применение в системе оперативной памяти RAMBUS, поддержку AGP 4x mode и ATA-66. В старших моделях Katmai объем L2-кэша будет достигать 1 или даже 2 Мбайт.

Также Katmai можно будет использовать в уже имеющихся Slot-1 материнских платах на чипсете i440BX, но после перепрошивки BIOS.

Цена младшей 450-мегагерцовой модели на начальном этапе составит порядка $600.

Для более дешевых систем предусматривается создание своего рода Celeron-процессора на ядре Katmai, но с кэш-памятью второго уровня, также работающей на половинной частоте процессора, объемом 192 или 256 Кбайт. Возможно, L2-кэш в этой модели будет интегрирован в ядро, как у Mendocino. Есть мнение, что в этом кэше будет использована SDRAM, однако, есть серьезные сомнения в возможности ее работы на таких частотах.

В процессоре Katmai, Intel, кроме наращивания частот, увеличения объема кэша и применения нового технологического процесса, коснулся и изменения архитектуры. Основными нововведениями в Katmai, помимо уже применяемых в существующих Pentium II-процессорах динамического исполнения, специфичной шины P6 и технологии MMX, будут являться конкурентная архитектра SIMD-FP с набором команд KNI, новые инструкции MMX и поточная архитектура работы с системной памятью. Рассмотрим все по порядку.

KNI

Ключевым новшеством в архитектуре Katmai является добавление 70 новых команд процессора для работы с трехмерной графикой. Как и в 3DNow!, все эти команды предназначены для работы с числами одинарной точности с плавающей точкой (32-битные вещественные). Этот набор команд, названный KNI (Katmai New Instructions), как и MMX, является SIMD-инструкциями (Single Instruction Multiple Data), что наиболее соответствует потребностям 3D-обработки. Это означает, что одной такой операцией процессор может обработать несколько (пар) данных. Идея SIMD уже была использована AMD в процессоре K6-2, однако то, что предлагает Intel, отличается от технологии конкурента.

KNI оперируют с восемью новыми регистрами процессора, представляя собой еще один модуль, типа арифметического сопроцессора, названный SIMD-FP. Регистры SIMD-FP являются 128-битными и позволяют хранить в себе одновременно 4 числа с плавающей точкой одинарной точности. Таким образом, оперируя с двумя такими регистрами, возможно выполнить операцию одновременно над четырьмя парами аргументов. Эта идея позволяет достичь пиковой производительности одного конвейера SIMD-FP до 2 GFLOP/с при частоте ядра 500 МГц. Пока не ясно, сколько параллельных конвейеров будет содержать Katmai — 1 или 2, то есть в последнем случае пиковая производительность сможет достигнуть 4 GFLOP/с. Следует заметить, что пиковая производительность модуля 3DNow!, имеющего два конвейера и 8 64-битных регистров — 2 GFLOP/c.

KNI SIMD architecture for FP data

Для работы с новыми регистрами, названными XMM0-XMM7, Intel ввел в Katmai дополнительный режим процессора (вспомним введенный 10 лет назад protected mode). Этот режим позволяет использовать SIMD-FP одновременно с MMX или арифметическим сопроцессором, так как они используют разные регистры. Как известно, именно по причине общих регистров, MMX одновременно с FP-сопроцессором работать не могут. Кстати, и модуль 3DNow! работает только отдельно от MMX и сопроцессора.

Однако, для использования нового режима, как и для поддержки KNI вообще, требуется поддержка со стороны операционной системы. Например, при переключении задач, система должна сохранять состояния регистров XMM0-XMM7. Хотя DirectX 6.0 и не поддерживает KNI, в отличие от 3DNow!, существует патч ядра Windows 98 для сохранения регистров SIMD-FP, а Windows NT 5.0 поддерживает KNI по умолчанию.

С 128-битными регистрами SIMD-FP оперируют новые инструкции KNI. Сказать что-то об их реализации сейчас нельзя, однако их набор содержит загрузку, запись, сложение, умножение, логические операции, модуль, квадратный корень и.т.п. То есть их набор похож на набор инструкций 3DNow!, но будет ли он быстрее, зависит от его реализации, а это станет понятно позже. Синтаксис инструкций KNI во многом повторяет на инструкции MMX. Также, учитывая то, что Microsoft уже предлагает библиотеки для их поддержки в своих компиляторах, KNI-инструкции быстро получат широкое распространение в среде разработчиков программного обеспечения.

KNI может использоваться не только в приложениях, связанных с 3D-графикой, но и в других задачах, требующих активных вычислений с плавающей точкой и не требующих большой точности. Например, распознавание речи, моделирование, объемный синтез звука, MPEG-кодирование и декодирование и т.д.

Тем не менее, несмотря на все свои преимущества, KNI вскрывает и многие недостатки архитектуры x86. А именно — аппаратное ограничение в 8 регистров приводит к тому, что некоторые приложения цифровой обработки сигналов не смогут быть оптимизированы под эту архитектуру. К тому же все операции в x86 - бинарные, а уже сейчас есть необходимость в вычислении функций типа скалярного произведения векторов, реализуемых в современных и дорогих графических процессорах. То есть, развитие KNI лежит, скорее всего, за пределами x86-архитектуры.

MMX

В стандартный модуль MMX процессора Katmai также внесено несколько дополнительных инструкций. В основном, они нацелены на облегчение задач распознавания речи и кодирования-декодирования видеосигнала. В их числе — сумма абсолютных значений разностей, вычисление среднего значения с округлением в меньшую сторону, нахождение минимума и максимума. Вот только на быструю поддержку этих команд девелоперами рассчитывать не приходится — MMX и так очень медленно двигается в жизнь, да еще и соответствующий инструментарий, использующий новые команды отсутствует.

Работа с памятью

Процессор Katmai также содержит усовершенствования шины P6 для поточного доступа к памяти.

Memory Streaming Benefits

Новый механизм предсказаний позволяет уменьшать задержки при последовательном доступе к памяти и исключает "забивание" кэша данными, которые используются однократно. Кроме того он определяет в какой из кэшей — в L1, во все или во все кроме L1 должны быть записаны данные для увеличения полосы пропускания. Новый мханизм может позволить обработку до восьми одновременных независимых запросов.

Katmai Streaming architecture

По обещаниям Intel, эти усовершенствования позволят поднять производительность еще на 5-20%, особенно при кодировании и декодировании MPEG-2.

Выводы

Intel подготовил достойный ответ AMD 3DNow!. Единственное, на что может уповать AMD в сложившихся условиях, так это на низкую цену своих процессоров. Очевидно, что проблем у Intel как с внедрением MMX уже не будет. Почва для KNI уже подготовлена. Разработчики программного обеспечения уже получили инструментарий для использования KNI и процессоры для тестирования. К моменту выхода Katmai, его возможности будут использоваться многими приложениями. А у AMD проблемы возникнут несколько позднее, когда придется встраивать KNI в свое ядро.

Выпуская 3DNow!, AMD сделал достойный ответ на интеловский MMX. Будем надеяться, что этот шаг Intel - KNI — окажется таким же сильным.