Celeron в дуальной конфигурации


ПРЕДУПРЕЖДЕНИЕ: Автор и редакция не несут никакой ответственности за любой возможный ущерб в случае следования приведенным в данном материале рекомендациям. Все ваши действия на основании данного материала вы осуществляете на свой страх и риск. Заметим, что внесение в процессор модификаций, описанных в данном материале, автоматически лишает вас каких-либо гарантийных обязательств со стороны продавца и производителя.

Как показали исследования, проведенные японским коллегой Tomohiro Kawada, процессоры Celeron обеих модификаций (как с кэшем L2, так и без него) могут быть доработаны для использования их в дуальных конфигурациях. Изначально поддержка SMP процессорами серии Celeron невозможна и заблокирована производителем. Ниже я описываю последовательность всех необходимых действий по доработке Celeron, а так же отличия примененной мной технологии от используемой г-ном Tomohiro Kawada.

Зачем это нужно?

Все просто. Celeron имеет низкую цену и хорошо разгоняется. Поэтому, если вы ограничены в средствах, но вам для работы очень нужна дуальная система, то это может быть приемлемым решением. Скажем, если вы работаете с видео, звуком или с графикой под NT 4.0 или BeOS 3.Х то за дополнительные $300-400 вы можете получить существенный выигрыш в производительности, а главное во времени выполнения операций. А вообще, список пользовательского ПО и ОС под многопроцессорные конфигурации известен очень давно, получаемый на различных задачах выигрыш — тоже…

Что мешает использовать Celeron в дуальной конфигурации?

Для работы в SMP режиме (в частности — двухпроцессорном), процессоры коласса Pentium II (а Celeron следует относить именно к этом классу) используют ряд дополнительных сигналов и выводов, не задействуемых при работе в однопроцессорной конфигурации. В частности, для такой работы необходим сигнал BR1#, выходящий на контакт B75 разъема Slot1. У процессоров Celeron вход BR1# замкнут прямо с проводниками питания ядра процессора (Vcc core) и необходимая разводка и терминирование проводников на субстрате (субстрат, substrate — так в документации фирмы Intel называется печатная плата, вставляемая в соединитель Slot1, на которую напаивается ядро процессора и необходимые навесные элементы вроде конденсаторов, резисторов и т.п.) не произведена. Таким образом, доработка заключается в разрушении электрического контакта входа BR1# с Vcc core, напайке проводника до контакта B75 и терминировании его в соответствии со спецификацией GTL+ на сигналы/уровни шины процессора.

Заметим, что есть мнение, полученное из пожелавшего остаться неназванным источника, что на самом деле можно обойтись и без физического воздействия на процессор. По непроверенным, пока, данным, достаточно модифицировать только системный БИОС, для того, что бы Celeron'ы можно было использовать в паре. Но, как говорится, мы работаем над этой проблемой…

Теперь рассмотрим окрестности контакта BR1# и соединение с Vcc core (см. рисунок). Здесь черным цветом показаны контакты из припоя между субстратом и микроплатой собственно cpu core.

Обозначения:

  • зеленым — материал субстрата
  • синим — металлизированные сквозные каналы в субстрате и заполняющий их припой
  • красным — интересующий нас канал и его контакт со слоем Vcc core внутри субстрата.

Таким образом, доработка будет заключаться в сверлении субстрата в определенных местах и допайке необходимых соединений.

Для этого нам потребуются:

  • паяльник с необходимыми аксессуарами
  • микродрель с зажимом и два сверла разных диаметров (около 0.5 мм и вдвое тоньше,
    причем диаметр меньшего должен совпадать с диаметром дополнительного проводника — см. ниже)
  • омметр или тестер — для проверки электрического контакта между проводниками
  • кусачки (в худшем случае и при наличии некоторой сноровки вполне можно обойтись ножницами)
  • провод в лаковой изоляции (например, ПЭЛ 0.09)
  • транзистор типа КТ3102 с позолоченными ножками (кусочек ножки будет использован как
    дополнительный проводник, поэтому диаметр ножки должен совпадать или быть чуть больше
    диаметра меньшего используемого сверла)
  • так же желательно наличие лупы для оценки качества проводимых манипуляций

Последовательность действий

Последовательность действий выглядит следующим образом (усиленно рекомендуется предварительное ознакомление с материалами Tomohiro Kawada ;-)

           

Просверливаем большим сверлом сквозное отверствие в субстрате внутри цифры "6" (метка № 1) — это отверстие будет использовано для подвода и подпайки проводника к RP6 (метка № 5). Кусочек облуженного провода используем для замыкания с одной стороны всех контактов RP6 между собой (метка № 4). Омметром контролируем отсутствие замыканий с другими прилежащими контактами.

Далее, рассверливаем и устанавливаем дополнительный контакт (метка № 3, технология описывается ниже), после чего используем зачищенный и облуженный (только в местах пайки, естесственно) лакированый провод для подпайки по следующему маршруту: контакт B75 (метка № 2), дополнительный контакт (метка № 3), выход через отверстие на противоположную сторону субстрата (метка № 1) и подпайка к свободному контакту у RP6 (метка № 5). И все, собственно! 8-)

Технология изготовления дополнительного контакта

С помощью микродрели и большого сверла производим надсверливание контакта BR1# со стороны субстрата (метка № 3).

Контролируем завершени операции по пропаданию электрического контакта между BR1# и Vcc core (например, можно замерять сопротивление между контактом со стороны heatspreader'а процессора и контактом B87 на разъеме). Обращаю внимание, что для этого не надо просверливать субстрат насквозь!

Теперь меняем сверло на более тонкое и надсвеливаем в том же месте.

Снова обращаю внимание — не нужно просверливать субстрат насквозь, лунка нужна только для закрепления отрезка проводника!

Теперь легким вращательным движением устанавливаем в подготовленную лунку ножку от транзистора — она должна входить с некоторым трением и не выпадать из подготовленной для нее лунки.

Обрезаем кусачками (или ножницами) выступающий кусочек ножки транзистора, оставив над поверхностью субстрата излишек порядка 1 мм. (можно меньше — все зависит от ваших способностей к пайке ;-) Проверяем расположение контакта по центру лунки и отсутствие замыканий.

Ну и наконец — припаиваем к полученному контакту провод, зачищенный в этом месте от лаковой изоляции и хорошо облуженный (зачищать и облуживать необходимо около одного миллиметра, провод в этом месте не обрезается).

Трассу прохождения провода потом можно дополнительно защитить сверху куском клейкой ленты или чем-то подобным.

Что я обо всем этом думаю… ;-)

Все вышеописанные манипуляции — штука достаточно тонкая, и если Вы никогда не держали в руках микродрель со сверлом диаметром в 0,2 мм — то Вам вряд ли стоит браться за это дело. У меня есть большой опыт в обращении с паяльником и дрелью, так что я эту операцию проделал с первого раза и без потерь :-)

Далее, самоочевидно, что описанная выше технология — это явно не единственный возможный вариант, я постоянно думаю об ее улучшении/облегчении :-)

С другой стороны, я достаточно слабо представляю — кому могут потребоваться дуальные конфигурации в массовых количествах (хотя бы сопоставимо с общим числом overclocker'ов PII & Celeron ;-) На мой взгляд, для серьезных целей, все же лучше потратиться на хорошую технику. Но из спортивного интереса или, если очень надо, а денег в обрез, то такое решение проблемы можно серьезно рассматривать.

Собственно работу по переделке я оцениваю в пределах $15-20, так что если действительно будет массовый рынок — появится и не менее массовое предложение, ибо наша страна всегда славилась умельцами. ;-)

Что это дает?

Я проверял работу получившейся дуальной конфигурации на системной плате TEKRAM P6B40D-A5, процессоры Celeron стояли в режиме 103x4=412 MHz. Все заработало сразу и без проблем. Однако, признаюсь честно, было лень проводить тестирования в разных приложениях и тем более готовить большие таблицы с результатами :-) Зачем? Когда коллега г-н Tomohiro Kawada уже все это проделал. Причем, как для пары безкэшовых Celeron, так и для пары с кэшом, т.е. Mendocino. Но, на всякий случай, ниже мы приводим несколько таблиц с результатами, полученными Tomohiro Kawada, что бы не утруждать вас серфингом по сети.

Ниже приведен список дуальных системных плат, на которых работали в паре Celeron'ы:

  • TYAN S1696DLUA Thunder 2 ATX
  • Tyan S1832DL
  • ASUS P2B-D
  • ASUS P2B-DS
  • Gigabyte GA-6BXD
  • Microstar MS-6120
  • SuperMicro P6DGE
  • Soltek SL-68A

Если вы решитесь на эксперимент, то присылайте свои результаты с указанием вашей конфигурации.

Производительность при 3D рендеринге на системе с Одним/Двумя 400 MHz процессорами

Light Wave 3D Ver5.5
CPU/Clock Один Celeron 400MHz Два Celeron'а 400MHz
Lgofctry.lws (1 frame) 2m 48s (168 seс) 1m 36s (96 sec)
Dof.lws 1m 47s (107 sec) 1m 11s (71 sec)
Zbufsort.lws 1m 11s (71 sec) 0m 36s (36 sec)

* Все режимы рендеринга: Realistic (Реалистические)

3D Studio MAX Ver1.2J
CPU/Clock Один Celeron 400MHz Два Celeron'а 400MHz
Samurai.max (51 frames) 2m 59s (179 sec) 1m 51s (111 sec)


Результаты тестирования Wintune97 дуальных систем на базе Celeron и Pentium II

  • Dual Celeron 300MHz (75MHz x 4.0)
  • Dual Pentium II 300MHz (66MHz x 4.5)
Темты CPU/FPU
Brand/Model Dual Celeron 300MHz Dual Pentium II 300MHz
CPU type Intel Pentium II with MMX Intel Pentium II with MMX
Clock rate 300 MHz 300 MHz
CPU load 0% 0%
Dhrystone 1263 MIPS 1267 MIPS
Whetstone 385 MFLOPS 377 MFLOPS
CPU class 686im 686im
Total CPUs 2 2
CPUID1 0x0651 0x183FBFF 0x0634 0x80FBFF
CPU bugs - -
WTA version 1.5.12 1.5.12
Tested on 1998/08/12 20:25:27 1998/08/12 11:10:19

Тесты памяти
Brand/Model Dual Celeron 300MHz Dual Pentium II 300MHz
Installed RAM 128 MB 64 MB
Windows RAM 127 MB 63.4 MB
Free RAM 71.2 MB 21.1 MB
Memory used 0 % 0 %
RAM Read avg 545 MB/s 641 MB/s
RAM Write avg 463 MB/s 531 MB/s
RAM Copy avg 385 MB/s 431 MB/s
Page file driver 32-bit 32-bit
Total page file 254 MB 117 MB
Free page file 208 MB 71 MB
Read 4KB 1120 MB/s 1123 MB/s
Read 8KB 1127 MB/s 1130 MB/s
Read 16KB 1008 MB/s 1096 MB/s
Read 32KB 313 MB/s 540 MB/s
Read 64KB 314 MB/s 540 MB/s
Read 128KB 314 MB/s 540 MB/s
Read 256KB 313 MB/s 540 MB/s
Read 512KB 313 MB/s 498 MB/s
Read 1024KB 313 MB/s 204 MB/s
Read 2048KB 313 MB/s 204 MB/s
Write 4KB 1422 MB/s 1425 MB/s
Write 32KB 143 MB/s 269 MB/s
Write 256KB 144 MB/s 269 MB/s
Write 2048KB 144 MB/s 159 MB/s
Copy 4KB 1233 MB/s 1236 MB/s
Copy 32KB 100 MB/s 207 MB/s
Copy 256KB 102 MB/s 193 MB/s
Copy 2048KB 106 MB/s 89 MB/s
WTA Version 1.0.40 1.0.40
Tested on 1998/08/12 20:25:27 1998/08/12 11:10:19

Если у вас есть свои идеи, как использовать Celeron'ы в дуальном режиме — пишите мне.




Дополнительно

Intel Celeron CPUs Dualization (SMP) Guide

Celeron в дуальной конфигурации

ПРЕДУПРЕЖДЕНИЕ: Автор и редакция не несут никакой ответственности за любой возможный ущерб в случае следования приведенным в данном материале рекомендациям. Все ваши действия на основании данного материала вы осуществляете на свой страх и риск. Заметим, что внесение в процессор модификаций, описанных в данном материале, автоматически лишает вас каких-либо гарантийных обязательств со стороны продавца и производителя.

Как показали исследования, проведенные японским коллегой Tomohiro Kawada, процессоры Celeron обеих модификаций (как с кэшем L2, так и без него) могут быть доработаны для использования их в дуальных конфигурациях. Изначально поддержка SMP процессорами серии Celeron невозможна и заблокирована производителем. Ниже я описываю последовательность всех необходимых действий по доработке Celeron, а так же отличия примененной мной технологии от используемой г-ном Tomohiro Kawada.

Зачем это нужно?

Все просто. Celeron имеет низкую цену и хорошо разгоняется. Поэтому, если вы ограничены в средствах, но вам для работы очень нужна дуальная система, то это может быть приемлемым решением. Скажем, если вы работаете с видео, звуком или с графикой под NT 4.0 или BeOS 3.Х то за дополнительные $300-400 вы можете получить существенный выигрыш в производительности, а главное во времени выполнения операций. А вообще, список пользовательского ПО и ОС под многопроцессорные конфигурации известен очень давно, получаемый на различных задачах выигрыш — тоже…

Что мешает использовать Celeron в дуальной конфигурации?

Для работы в SMP режиме (в частности — двухпроцессорном), процессоры коласса Pentium II (а Celeron следует относить именно к этом классу) используют ряд дополнительных сигналов и выводов, не задействуемых при работе в однопроцессорной конфигурации. В частности, для такой работы необходим сигнал BR1#, выходящий на контакт B75 разъема Slot1. У процессоров Celeron вход BR1# замкнут прямо с проводниками питания ядра процессора (Vcc core) и необходимая разводка и терминирование проводников на субстрате (субстрат, substrate — так в документации фирмы Intel называется печатная плата, вставляемая в соединитель Slot1, на которую напаивается ядро процессора и необходимые навесные элементы вроде конденсаторов, резисторов и т.п.) не произведена. Таким образом, доработка заключается в разрушении электрического контакта входа BR1# с Vcc core, напайке проводника до контакта B75 и терминировании его в соответствии со спецификацией GTL+ на сигналы/уровни шины процессора.

Заметим, что есть мнение, полученное из пожелавшего остаться неназванным источника, что на самом деле можно обойтись и без физического воздействия на процессор. По непроверенным, пока, данным, достаточно модифицировать только системный БИОС, для того, что бы Celeron'ы можно было использовать в паре. Но, как говорится, мы работаем над этой проблемой…

Теперь рассмотрим окрестности контакта BR1# и соединение с Vcc core (см. рисунок). Здесь черным цветом показаны контакты из припоя между субстратом и микроплатой собственно cpu core.

Обозначения:

  • зеленым — материал субстрата
  • синим — металлизированные сквозные каналы в субстрате и заполняющий их припой
  • красным — интересующий нас канал и его контакт со слоем Vcc core внутри субстрата.

Таким образом, доработка будет заключаться в сверлении субстрата в определенных местах и допайке необходимых соединений.

Для этого нам потребуются:

  • паяльник с необходимыми аксессуарами
  • микродрель с зажимом и два сверла разных диаметров (около 0.5 мм и вдвое тоньше,
    причем диаметр меньшего должен совпадать с диаметром дополнительного проводника — см. ниже)
  • омметр или тестер — для проверки электрического контакта между проводниками
  • кусачки (в худшем случае и при наличии некоторой сноровки вполне можно обойтись ножницами)
  • провод в лаковой изоляции (например, ПЭЛ 0.09)
  • транзистор типа КТ3102 с позолоченными ножками (кусочек ножки будет использован как
    дополнительный проводник, поэтому диаметр ножки должен совпадать или быть чуть больше
    диаметра меньшего используемого сверла)
  • так же желательно наличие лупы для оценки качества проводимых манипуляций

Последовательность действий

Последовательность действий выглядит следующим образом (усиленно рекомендуется предварительное ознакомление с материалами Tomohiro Kawada ;-)

           

Просверливаем большим сверлом сквозное отверствие в субстрате внутри цифры "6" (метка № 1) — это отверстие будет использовано для подвода и подпайки проводника к RP6 (метка № 5). Кусочек облуженного провода используем для замыкания с одной стороны всех контактов RP6 между собой (метка № 4). Омметром контролируем отсутствие замыканий с другими прилежащими контактами.

Далее, рассверливаем и устанавливаем дополнительный контакт (метка № 3, технология описывается ниже), после чего используем зачищенный и облуженный (только в местах пайки, естесственно) лакированый провод для подпайки по следующему маршруту: контакт B75 (метка № 2), дополнительный контакт (метка № 3), выход через отверстие на противоположную сторону субстрата (метка № 1) и подпайка к свободному контакту у RP6 (метка № 5). И все, собственно! 8-)

Технология изготовления дополнительного контакта

С помощью микродрели и большого сверла производим надсверливание контакта BR1# со стороны субстрата (метка № 3).

Контролируем завершени операции по пропаданию электрического контакта между BR1# и Vcc core (например, можно замерять сопротивление между контактом со стороны heatspreader'а процессора и контактом B87 на разъеме). Обращаю внимание, что для этого не надо просверливать субстрат насквозь!

Теперь меняем сверло на более тонкое и надсвеливаем в том же месте.

Снова обращаю внимание — не нужно просверливать субстрат насквозь, лунка нужна только для закрепления отрезка проводника!

Теперь легким вращательным движением устанавливаем в подготовленную лунку ножку от транзистора — она должна входить с некоторым трением и не выпадать из подготовленной для нее лунки.

Обрезаем кусачками (или ножницами) выступающий кусочек ножки транзистора, оставив над поверхностью субстрата излишек порядка 1 мм. (можно меньше — все зависит от ваших способностей к пайке ;-) Проверяем расположение контакта по центру лунки и отсутствие замыканий.

Ну и наконец — припаиваем к полученному контакту провод, зачищенный в этом месте от лаковой изоляции и хорошо облуженный (зачищать и облуживать необходимо около одного миллиметра, провод в этом месте не обрезается).

Трассу прохождения провода потом можно дополнительно защитить сверху куском клейкой ленты или чем-то подобным.

Что я обо всем этом думаю… ;-)

Все вышеописанные манипуляции — штука достаточно тонкая, и если Вы никогда не держали в руках микродрель со сверлом диаметром в 0,2 мм — то Вам вряд ли стоит браться за это дело. У меня есть большой опыт в обращении с паяльником и дрелью, так что я эту операцию проделал с первого раза и без потерь :-)

Далее, самоочевидно, что описанная выше технология — это явно не единственный возможный вариант, я постоянно думаю об ее улучшении/облегчении :-)

С другой стороны, я достаточно слабо представляю — кому могут потребоваться дуальные конфигурации в массовых количествах (хотя бы сопоставимо с общим числом overclocker'ов PII & Celeron ;-) На мой взгляд, для серьезных целей, все же лучше потратиться на хорошую технику. Но из спортивного интереса или, если очень надо, а денег в обрез, то такое решение проблемы можно серьезно рассматривать.

Собственно работу по переделке я оцениваю в пределах $15-20, так что если действительно будет массовый рынок — появится и не менее массовое предложение, ибо наша страна всегда славилась умельцами. ;-)

Что это дает?

Я проверял работу получившейся дуальной конфигурации на системной плате TEKRAM P6B40D-A5, процессоры Celeron стояли в режиме 103x4=412 MHz. Все заработало сразу и без проблем. Однако, признаюсь честно, было лень проводить тестирования в разных приложениях и тем более готовить большие таблицы с результатами :-) Зачем? Когда коллега г-н Tomohiro Kawada уже все это проделал. Причем, как для пары безкэшовых Celeron, так и для пары с кэшом, т.е. Mendocino. Но, на всякий случай, ниже мы приводим несколько таблиц с результатами, полученными Tomohiro Kawada, что бы не утруждать вас серфингом по сети.

Ниже приведен список дуальных системных плат, на которых работали в паре Celeron'ы:

  • TYAN S1696DLUA Thunder 2 ATX
  • Tyan S1832DL
  • ASUS P2B-D
  • ASUS P2B-DS
  • Gigabyte GA-6BXD
  • Microstar MS-6120
  • SuperMicro P6DGE
  • Soltek SL-68A

Если вы решитесь на эксперимент, то присылайте свои результаты с указанием вашей конфигурации.

Производительность при 3D рендеринге на системе с Одним/Двумя 400 MHz процессорами

Light Wave 3D Ver5.5
CPU/Clock Один Celeron 400MHz Два Celeron'а 400MHz
Lgofctry.lws (1 frame) 2m 48s (168 seс) 1m 36s (96 sec)
Dof.lws 1m 47s (107 sec) 1m 11s (71 sec)
Zbufsort.lws 1m 11s (71 sec) 0m 36s (36 sec)

* Все режимы рендеринга: Realistic (Реалистические)

3D Studio MAX Ver1.2J
CPU/Clock Один Celeron 400MHz Два Celeron'а 400MHz
Samurai.max (51 frames) 2m 59s (179 sec) 1m 51s (111 sec)


Результаты тестирования Wintune97 дуальных систем на базе Celeron и Pentium II

  • Dual Celeron 300MHz (75MHz x 4.0)
  • Dual Pentium II 300MHz (66MHz x 4.5)
Темты CPU/FPU
Brand/Model Dual Celeron 300MHz Dual Pentium II 300MHz
CPU type Intel Pentium II with MMX Intel Pentium II with MMX
Clock rate 300 MHz 300 MHz
CPU load 0% 0%
Dhrystone 1263 MIPS 1267 MIPS
Whetstone 385 MFLOPS 377 MFLOPS
CPU class 686im 686im
Total CPUs 2 2
CPUID1 0x0651 0x183FBFF 0x0634 0x80FBFF
CPU bugs - -
WTA version 1.5.12 1.5.12
Tested on 1998/08/12 20:25:27 1998/08/12 11:10:19

Тесты памяти
Brand/Model Dual Celeron 300MHz Dual Pentium II 300MHz
Installed RAM 128 MB 64 MB
Windows RAM 127 MB 63.4 MB
Free RAM 71.2 MB 21.1 MB
Memory used 0 % 0 %
RAM Read avg 545 MB/s 641 MB/s
RAM Write avg 463 MB/s 531 MB/s
RAM Copy avg 385 MB/s 431 MB/s
Page file driver 32-bit 32-bit
Total page file 254 MB 117 MB
Free page file 208 MB 71 MB
Read 4KB 1120 MB/s 1123 MB/s
Read 8KB 1127 MB/s 1130 MB/s
Read 16KB 1008 MB/s 1096 MB/s
Read 32KB 313 MB/s 540 MB/s
Read 64KB 314 MB/s 540 MB/s
Read 128KB 314 MB/s 540 MB/s
Read 256KB 313 MB/s 540 MB/s
Read 512KB 313 MB/s 498 MB/s
Read 1024KB 313 MB/s 204 MB/s
Read 2048KB 313 MB/s 204 MB/s
Write 4KB 1422 MB/s 1425 MB/s
Write 32KB 143 MB/s 269 MB/s
Write 256KB 144 MB/s 269 MB/s
Write 2048KB 144 MB/s 159 MB/s
Copy 4KB 1233 MB/s 1236 MB/s
Copy 32KB 100 MB/s 207 MB/s
Copy 256KB 102 MB/s 193 MB/s
Copy 2048KB 106 MB/s 89 MB/s
WTA Version 1.0.40 1.0.40
Tested on 1998/08/12 20:25:27 1998/08/12 11:10:19

Если у вас есть свои идеи, как использовать Celeron'ы в дуальном режиме — пишите мне.