Merrimac: последняя надежда специализированных процессоров или несбыточные мечты?

В эпоху повального увлечения кластерами на недорогих и, как правило, общедоступных процессорах, суперкомпьютеры на базе специально разработанных архитектур, казалось бы, должны уйти в тень. Но так считают не все: на прошедшей недавно конференции Supercomputing 2003 разработчиками из Стэнфордского Университета был представлен дизайн процессора Merrimac, разработанный специально для использования в научных расчетах.

Профессор информационных наук Стэнфордского Университета (из стен которого, кстати, вышло немало Нобелевских лауреатов) Вильям Дэлли (William Dally) защищает тезис о том, что процессоры современных массовых компьютеров неэффективны из-за того, что способны совершать огромное количество математических операций в единицу времени и вынуждены слишком долго ждать информации из памяти (то есть, из-за неэффективной организации работы с памятью). В Merrimac используется несколько арифметико-логических-устройств (АЛУ) и расширенный набор инструкций, позволяющий приложениям решать, какое количество АЛУ задействовать в каждый момент и минимизировать количество обращений к памяти. По крайней мере, такой подход позволит решить проблему последовательной обработки данных, при которой результат передается следующему АЛУ, а не записывается в память.

Merrimac: последняя надежда специализированных процессоров или несбыточные мечты?

Merrimac состоит из шестидесяти четырех 64-разрядных арифметических умножающе-складывающих модулей, работающих с числами в представлении с плавающей точкой, дополненных иерархической структурой регистров и управляемых специальным контроллером. По расчетам профессора, процессор, изготовленный по 90-нм нормам, будет иметь размер 10х11 мм и способен развить производительность до 128 Gflops (128 млрд. операций с плавающей точкой). Себестоимость производства по оценке ученого составит около $200, энергопотребление – 31 Вт. На одну плату планируется устанавливать 16 процессоров Merrimac, до 512 процессоров монтируется в одну стойку, связь осуществляется с помощью 96-портового коммутатора.

Таким образом, если оценки профессора Дэлли верны, рабочая станция производительность 2 Tflops будет стоить около $20000, а 2-Pflops (2 квадриллиона операций с плавающей точкой в секунду) суперкомпьютер обойдется, грубо говоря, в $20 млн.

С одной стороны, профессор Дэлли уже имеет внушительный опыт работы: он участвовал в разработке систем Cray T3D и T3E. С другой стороны, налицо отсутствие заинтересованности со стороны ведущих вендоров суперкомпьютеров, да и сама Cray с Sandia National Labs свой последний шедевр, Red Storm (стоимость около $100 млн.), строят на базе процессоров AMD Opteron. По словам Дэлли, на выпуск специализированного процессора ушло бы всего от 10 до 12 миллионов долларов.

Спад интереса к специализированным процессорным архитектурам обусловлен, с одной стороной, уменьшением спроса (на 7,2% в прошлом году), с другой стороны, растущими возможностями процессорами для ПК (и их активным продвижением AMD и Intel с ее Advanced Computing Program). И хотя тот же Merrimac, возможно, пока так и останется на бумаге, Cray, IBM и Sun все же не отказались от мечты построить своими силами петафлоповый суперкомпьютер: Дэлли будет консультировать Cray по поводу их нового проекта, Cascade. Наверное, Merrimac пока слишком сильно опережает планы компании: в Cascade будет уделено внимание проблемам параллельного доступа к данным без обращения к памяти, но не они будут решаться в первую очередь.

IBM, в свою очередь, собирается создать новую микроархитектуру, которая, тем не менее, будет совместима с PowerPC. В новой архитектуре планируется решить амбициозную задачу адаптивной перестройки режимов работы процессора при работе с различными типами задач и вычислений (требующих частого обращения к памяти или большого количества самих вычислений).

26 ноября 2003 в 11:18

Автор:

| Источник: PC Watch

Все новости за сегодня

Календарь

ноябрь
Пн
Вт
Ср
Чт
Пт
Сб
Вс