Merrimac: последняя надежда специализированных процессоров или несбыточные мечты?

1174

В эпоху повального увлечения кластерами на недорогих и, как правило, общедоступных процессорах, суперкомпьютеры на базе специально разработанных архитектур, казалось бы, должны уйти в тень. Но так считают не все: на прошедшей недавно конференции Supercomputing 2003 разработчиками из Стэнфордского Университета был представлен дизайн процессора Merrimac, разработанный специально для использования в научных расчетах.

Профессор информационных наук Стэнфордского Университета (из стен которого, кстати, вышло немало Нобелевских лауреатов) Вильям Дэлли (William Dally) защищает тезис о том, что процессоры современных массовых компьютеров неэффективны из-за того, что способны совершать огромное количество математических операций в единицу времени и вынуждены слишком долго ждать информации из памяти (то есть, из-за неэффективной организации работы с памятью). В Merrimac используется несколько арифметико-логических-устройств (АЛУ) и расширенный набор инструкций, позволяющий приложениям решать, какое количество АЛУ задействовать в каждый момент и минимизировать количество обращений к памяти. По крайней мере, такой подход позволит решить проблему последовательной обработки данных, при которой результат передается следующему АЛУ, а не записывается в память.





Merrimac состоит из шестидесяти четырех 64-разрядных арифметических умножающе-складывающих модулей, работающих с числами в представлении с плавающей точкой, дополненных иерархической структурой регистров и управляемых специальным контроллером. По расчетам профессора, процессор, изготовленный по 90-нм нормам, будет иметь размер 10х11 мм и способен развить производительность до 128 Gflops (128 млрд. операций с плавающей точкой). Себестоимость производства по оценке ученого составит около $200, энергопотребление – 31 Вт. На одну плату планируется устанавливать 16 процессоров Merrimac, до 512 процессоров монтируется в одну стойку, связь осуществляется с помощью 96-портового коммутатора.

Таким образом, если оценки профессора Дэлли верны, рабочая станция производительность 2 Tflops будет стоить около $20000, а 2-Pflops (2 квадриллиона операций с плавающей точкой в секунду) суперкомпьютер обойдется, грубо говоря, в $20 млн.

С одной стороны, профессор Дэлли уже имеет внушительный опыт работы: он участвовал в разработке систем Cray T3D и T3E. С другой стороны, налицо отсутствие заинтересованности со стороны ведущих вендоров суперкомпьютеров, да и сама Cray с Sandia National Labs свой последний шедевр, Red Storm (стоимость около $100 млн.), строят на базе процессоров AMD Opteron. По словам Дэлли, на выпуск специализированного процессора ушло бы всего от 10 до 12 миллионов долларов.

Спад интереса к специализированным процессорным архитектурам обусловлен, с одной стороной, уменьшением спроса (на 7,2% в прошлом году), с другой стороны, растущими возможностями процессорами для ПК (и их активным продвижением AMD и Intel с ее Advanced Computing Program). И хотя тот же Merrimac, возможно, пока так и останется на бумаге, Cray, IBM и Sun все же не отказались от мечты построить своими силами петафлоповый суперкомпьютер: Дэлли будет консультировать Cray по поводу их нового проекта, Cascade. Наверное, Merrimac пока слишком сильно опережает планы компании: в Cascade будет уделено внимание проблемам параллельного доступа к данным без обращения к памяти, но не они будут решаться в первую очередь.

IBM, в свою очередь, собирается создать новую микроархитектуру, которая, тем не менее, будет совместима с PowerPC. В новой архитектуре планируется решить амбициозную задачу адаптивной перестройки режимов работы процессора при работе с различными типами задач и вычислений (требующих частого обращения к памяти или большого количества самих вычислений).

26 ноября 2003

11:18

Ctrl
ПредыдущаяСледующая

Все новости за сегодня

Видеокарта Radeon Vega 64 Liquid Cooled Edition оснащена ЖСО Cooler Master, благодаря которой температура GPU составляет 53 градуса: Radeon Vega 64 Liquid Cooled Edition разобрали и запечатлели внутреннее строение3

Процессоры Ryzen Threadripper 1950X и Core i9-7960X установили несколько рекордов: CPU Core i9-7960X установил два мировых рекорда

3D-карта Asus Radeon RX Vega 64 Strix в сравнении с референсом работает на больших частотах, но с большим потреблением энергии: Появились тесты Asus Radeon RX Vega 64 Strix8

Apple может стать первой компанией, чьи умные часы массово будут использоваться в медицинских целях: Apple ведёт переговоры с Aetna21

Наушники Apple EarPods и AirPods будут лучше держаться в ушной раковине с аксессуаром Dodocool: Цена набора в данный момент составляет 10 долларов9

Смартфон Doogee BL7000 получил три датчика изображения Samsung ISOCELL и аккумулятор емкостью 7060 мА•ч: На стадии предзаказа смартфон предлагается по цене 160 долларов4

Анонс камеры Nikon D850 ожидается 24 августа: Поставки Nikon D850 могут начаться уже в середине сентября5

Смартфон Samsung Galaxy Note8 «засветился» на сайте производителя: Кроме того, опубликовано два видеоролика с участием Samsung Galaxy Note8

Компания Mercedes-Benz показала роскошный электромобиль Vision Mercedes-Maybach 6 Cabriolet : Запас хода Vision Mercedes-Maybach 6 Cabriolet — 500 км30

Apple продолжает активно расширять офисное пространство, еще не закончив штаб-квартиру Apple Park: С 1998 года штат Apple увеличился на 1500%11

Cмартфон Xiaomi Mi Mix 2 сможет распознавать пользователей по лицам: Анонс Xiaomi Mi Mix 2 ожидается в сентябре3

Передняя панель компьютерного корпуса Sharkoon TG5 изготовлена из закаленного стекла: Корпус Sharkoon TG5 рассчитан на системные платы типоразмера ATX

IP-ядро процессора изображения Pinnacle Denali-MC поддерживает HDR: К достоинствам Denali-MC разработчик относит 16-битное представление данных

Ассортимент EK Water Blocks пополнил водоблок EK-FB GA X299 Gaming RGB Monoblock: Водоблок EK-FB GA X299 Gaming RGB Monoblock стоит 120 евро

Точка доступа EnGenius EAP2200 соответствует спецификации 802.11ac Wave 2: Продажи EAP2200 уже начались по цене $2392

ВИКТОРИНА ASUSTOR

Процессор с какой архитектурой установлен в ASUSTOR AS6302T, благодаря которому производительно выросла на 30% по сравнению с прошлым поколением?
1318

iXBT TV

  • Обзор легкой, компактной и дешевой мясорубки Kitfort KT-2101 Carnivora

  • Обзор беззеркальной фотокамеры Fujifilm X-T20

  • Обзор кинотеатрального DLP-проектора BenQ W11000 с эмуляцией разрешения 4К

  • AMD Ryzen Threadripper 1920Х и 1950X — тестирование 12-ядерного и 16-ядерного процессоров

  • Обзор мини-ПК ECS Liva Z на базе процессора Apollo Lake

  • Самый лучший процессор, неудачи Microsoft, гибкие наушники Samsung

  • Обзор цветного МФУ Xerox VersaLink C405 для малых и средних офисов

  • Обзор умного чайника Redmond SkyKettle RK-G200S с подсветкой и нагревом воды до нужной температуры

  • Конфигурируем мини-ПК: изучаем влияние памяти и накопителя на быстродействие системы

  • 3D-карты AMD Radeon RX Vega, цены, спецификации, смартфон Meizu Pro 7

  • Обзор лазерного цветного МФУ Canon imageRunner Advance C3520i, младшего в новой линейке

  • Обзор робота-пылесоса iBoto Aqua V710 с функцией влажной уборки

1212

Календарь

ноябрь
Пн
Вт
Ср
Чт
Пт
Сб
Вс

Рекомендуем почитать