Google запускает чип Ironwood и масштабирует гиперкомпьютер для эры ИИ-агентов
Google Cloud представила седьмое поколение своих тензорных процессоров — TPU Ironwood — на открытии конференции Google Cloud Next 2025. Новый чип ориентирован на задачи ИИ-инференса и, по словам компании, обеспечивает в пять раз большую вычислительную мощность по сравнению с предыдущим поколением Trillium. Один модуль Ironwood способен достигать производительности в 42,5 экзафлопс — это в 24 раза выше, чем у суперкомпьютера El Capitan на уровне одного пода.
Ironwood поступит в двух конфигурациях: на 256 и 9216 чипов, каждая из которых имеет жидкостное охлаждение, 192 ГБ памяти и пропускную способность 7,2 Тбит/с. Эти параметры позволяют обрабатывать нагрузку ИИ-агентов, работающих автономно и круглосуточно в корпоративной среде, что требует минимальных задержек и высокой устойчивости инфраструктуры.
В рамках обновления своей облачной архитектуры гиперкомпьютеров, Google Cloud также представила Pathways — систему распределённых вычислений от DeepMind. Она позволяет объединять тысячи чипов Ironwood в единый кластер с масштабируемой инференс-архитектурой. Кроме того, появились инструменты GKE Inference Gateway и GKE Inference Recommendations, обеспечивающие оптимальное распределение ресурсов под конкретные ИИ-модели.
Помимо собственных TPU, Google Cloud расширяет доступ к оборудованию Nvidia. Теперь пользователи смогут использовать чипы Nvidia B200 через A4 VM и GB200 через A4X (в режиме предварительного доступа), что дополняет общую стратегию гибкой и мощной ИИ-инфраструктуры для корпоративных клиентов.
Источник: https://blog.google





0 комментариев
Добавить комментарий