DeepSeek анонсировала языковую модель R2 с 1,2 триллиона параметров

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Китайская компания DeepSeek готовит к запуску новую языковую модель искусственного интеллекта DeepSeek-R2, релиз которой запланирован на конец августа 2025 года. Модель построена на архитектуре Mixed of Experts (MoE) и содержит 1,2 триллиона параметров, что почти в два раза превышает показатели предыдущей версии DeepSeek-R1 с 671 миллиардом параметров.

DeepSeek-R2 полностью обучена на китайских процессорах Huawei Ascend 910B. Аппаратный кластер демонстрирует производительность 512 петафлопс в формате FP16 при коэффициенте использования 82 процента. Данные показатели составляют 91 процент от производительности кластеров на базе американских чипов Nvidia A100.

Автор: DeepSeek Источник: www.teknoburada.net

Компания заявляет о значительном снижении затрат на обучение модели. По предварительным данным, стоимость обучения DeepSeek-R2 на 97 процентов ниже расходов на создание GPT-4 благодаря оптимизации аппаратных и программных решений.

Новая модель использует усовершенствованную систему сетевых шлюзов, что должно повысить эффективность при выполнении задач вывода. DeepSeek планирует предложить доступ к API модели по цене ниже текущих рыночных стандартов, установленных OpenAI и Anthropic.

Разработка DeepSeek-R2 на отечественном оборудовании рассматривается как часть стратегии Китая по снижению зависимости от американских технологий в сфере искусственного интеллекта. Официальный анонс модели ожидается в ближайшие недели.

Источник: Teknoburada.Net

Автор не входит в состав редакции iXBT.com (подробнее »)

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Всемирное хранилище семян: почему «Ноев ковчег» для растений построили именно в вечной мерзлоте и что там скрыто

На архипелаге Шпицберген, далеко за Полярным кругом, в толще горы из песчаника, скрыто одно из важнейших сооружений современности. Это Всемирное хранилище семян. Его часто называют «хранилищем...

Физика поющих дюн: как на самом деле устроен песчаный акустический генератор

Пустыня — сложная среда для акустики. Разогретый воздух и рыхлая поверхность обычно глушат и рассеивают любые колебания. Кварцевый песок, как классическая сыпучая среда с высоким...

Откуда красный помпон на французской бескозырке: практические причины, а не легенда про императрицу

Красный помпон на бескозырке — символ пролитой крови за монархию? Забудьте эту сказку. Реальная история этого аксессуара куда прозаичнее: это был «бампер» для головы и способ спасения жизни в море.

Ёрш: враг рыбаков и альфа российских водоёмов

Ёрша принято называть сорной рыбой. Но ёрш — не просто маленькая рыба размером с ладонь, которая завоевала водоёмы от Сибири до Великих озёр. Это вид, который разработал идеальную стратегию выживания.

Какую видеокарту купить в 2026 году для игр без переплаты

Выбрать видеокарту сегодня сложнее, чем кажется: рынок завален вариантами, цены скачут, а продавцы на маркетплейсах пишут «отличное состояние» про карту, которая три года майнила. Так что реально...