Microsoft объединяет дата-центры в единую систему для ускоренного обучения ИИ
Корпорация Microsoft представила новую инфраструктуру для разработки искусственного интеллекта, объединив два крупных вычислительных комплекса в Висконсине и Атланте. Проект получил название Fairwater и представляет собой распределенную систему центров обработки данных, работающих как единый виртуальный суперкомпьютер.
Объединенные центры обработки данных связаны специализированными каналами передачи информации, что позволяет распределять вычислительные задачи между несколькими площадками одновременно. Данная архитектура сокращает время обучения крупных языковых моделей с нескольких месяцев до нескольких недель.
Вычислительные мощности построены на базе стоечных систем NVIDIA GB200 NVL72 с графическими процессорами поколения Blackwell. Система масштабируется до сотен тысяч графических ускорителей, работающих параллельно над одной задачей. Центры имеют двухуровневую конструкцию, увеличивающую плотность размещения оборудования, и оснащены системой жидкостного охлаждения.
Инфраструктура предназначена для команды Microsoft AI Superintelligence и компании OpenAI. Распределенная архитектура позволяет обучать модели с сотнями триллионов параметров, что превышает возможности отдельно взятого дата-центра.
В планах компании создание дополнительных вычислительных площадок, которые подключат к глобальной сети передачи данных через выделенные оптоволоконные линии связи. На развитие инфраструктуры для искусственного интеллекта Microsoft направила 34 миллиарда долларов капитальных инвестиций.
Источник: Interestingeng Iineering





1 комментарий
Добавить комментарий