DeepSeek анонсировала языковую модель R2 с 1,2 триллиона параметров

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Китайская компания DeepSeek готовит к запуску новую языковую модель искусственного интеллекта DeepSeek-R2, релиз которой запланирован на конец августа 2025 года. Модель построена на архитектуре Mixed of Experts (MoE) и содержит 1,2 триллиона параметров, что почти в два раза превышает показатели предыдущей версии DeepSeek-R1 с 671 миллиардом параметров.

DeepSeek-R2 полностью обучена на китайских процессорах Huawei Ascend 910B. Аппаратный кластер демонстрирует производительность 512 петафлопс в формате FP16 при коэффициенте использования 82 процента. Данные показатели составляют 91 процент от производительности кластеров на базе американских чипов Nvidia A100.

Автор: DeepSeek Источник: www.teknoburada.net

Компания заявляет о значительном снижении затрат на обучение модели. По предварительным данным, стоимость обучения DeepSeek-R2 на 97 процентов ниже расходов на создание GPT-4 благодаря оптимизации аппаратных и программных решений.

Новая модель использует усовершенствованную систему сетевых шлюзов, что должно повысить эффективность при выполнении задач вывода. DeepSeek планирует предложить доступ к API модели по цене ниже текущих рыночных стандартов, установленных OpenAI и Anthropic.

Разработка DeepSeek-R2 на отечественном оборудовании рассматривается как часть стратегии Китая по снижению зависимости от американских технологий в сфере искусственного интеллекта. Официальный анонс модели ожидается в ближайшие недели.

Источник: Teknoburada.Net

Автор не входит в состав редакции iXBT.com (подробнее »)

Сейчас на главной

Новости

Публикации

ТВ-стик Mecool MEgo1 2K на Realtek RTD1332: только Full HD. Сравнение с 4K-версией

Приветствую читателей IXBT.Ранее я подробно разбирал Mecool MEgo1 4K на базе Realtek RTD1325. Устройство показало себя отлично, и я до сих пор им пользуюсь. Спустя некоторое время ко мне в руки...

Как долго существуют цивилизации? Что радиомолчание Млечного Пути говорит о будущем человечества

Наша галактика, Млечный Путь, состоит из сотен миллиардов звезд. Современные астрономические наблюдения доказывают, что формирование планет — это стандартный космический процесс. Вокруг...

Kefine Klean SV — вариативность звучания — обзор динамических внутриканальных наушников со сменными звуководами

Компания Kefine продолжила свою линейку внутриканальных наушников Klean, обновив звучание и добавив приставку SV. Также существенным отличием от предыдущей модели является наличие уже трех пар...

Почему я считаю iPhone 17e удачным смартфоном: нужно лишь взглянуть на него с другой стороны

Apple — это компания, которая может позволить себе быть наглой. Только она способна выпустить успешный смартфон с устаревшим дизайном, всего одной задней камерой, крохотным аккумулятором и немалым...

Обзор паяльника T65-SP: Бюджетная альтернатива TS101 с питанием на любой вкус

Компактные паяльники с питанием от USB — тема, которая за последние несколько лет выросла из нишевой игрушки в полноценный рабочий инструмент. TS100, Pinecil, TS80P — каждый...