DeepSeek анонсировала языковую модель R2 с 1,2 триллиона параметров

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Китайская компания DeepSeek готовит к запуску новую языковую модель искусственного интеллекта DeepSeek-R2, релиз которой запланирован на конец августа 2025 года. Модель построена на архитектуре Mixed of Experts (MoE) и содержит 1,2 триллиона параметров, что почти в два раза превышает показатели предыдущей версии DeepSeek-R1 с 671 миллиардом параметров.

DeepSeek-R2 полностью обучена на китайских процессорах Huawei Ascend 910B. Аппаратный кластер демонстрирует производительность 512 петафлопс в формате FP16 при коэффициенте использования 82 процента. Данные показатели составляют 91 процент от производительности кластеров на базе американских чипов Nvidia A100.

Автор: DeepSeek Источник: www.teknoburada.net

Компания заявляет о значительном снижении затрат на обучение модели. По предварительным данным, стоимость обучения DeepSeek-R2 на 97 процентов ниже расходов на создание GPT-4 благодаря оптимизации аппаратных и программных решений.

Новая модель использует усовершенствованную систему сетевых шлюзов, что должно повысить эффективность при выполнении задач вывода. DeepSeek планирует предложить доступ к API модели по цене ниже текущих рыночных стандартов, установленных OpenAI и Anthropic.

Разработка DeepSeek-R2 на отечественном оборудовании рассматривается как часть стратегии Китая по снижению зависимости от американских технологий в сфере искусственного интеллекта. Официальный анонс модели ожидается в ближайшие недели.

Источник: Teknoburada.Net

Автор не входит в состав редакции iXBT.com (подробнее »)

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Почему йод добавляют именно в соль: всё дело в ионах хлора, на место которых встает галоген

Никакого заговора здесь нет. Решение спрятать йод исключительно в поваренной соли, продиктовано законами химии и физиологии. Обогащать им хлеб, молоко или мясо оказалось не просто неэффективно, а...

Почему волки нападают на собак — и почему это не всегда связано с голодом

Иногда это выглядит странно. Собаку находят после встречи с волками, следы есть, но тело почти не тронуто. И первая мысль возникает автоматически, не были голодны. Значит, это произошло «просто...

Обзор робота пылесоса Roborock Saros 10R: корпус высотой менее 80 мм, навигация по камерам и станция с подключением к водопроводу

В России представлена новая модель робота пылесоса от компании Roborock, которая претендует на звание флагмана среди роботов-пылесосов. Saros 10R предназначен для полностью автоматической уборки с...

Это планшет или ноутбук? Разбираемся с новым Ninkear S13 на Windows 11

Ninkear S13 — это планшет или ноутбук? Давайте выясним вместе, ведь это реально интересное устройство, еще и с активным стилусом. То есть это еще и графический планшет на windows. Итого...

Под Большим Соленым озером нашли огромный пресноводный резервуар: парадокс гидрогеологии Юты

Большое Соленое озеро, расположенное в штате Юта, это крупнейший бессточный соленый водоем Западного полушария, уровень воды и соленость которого полностью зависят от баланса осадков, испарения и...