DeepSeek анонсировала языковую модель R2 с 1,2 триллиона параметров

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Китайская компания DeepSeek готовит к запуску новую языковую модель искусственного интеллекта DeepSeek-R2, релиз которой запланирован на конец августа 2025 года. Модель построена на архитектуре Mixed of Experts (MoE) и содержит 1,2 триллиона параметров, что почти в два раза превышает показатели предыдущей версии DeepSeek-R1 с 671 миллиардом параметров.

DeepSeek-R2 полностью обучена на китайских процессорах Huawei Ascend 910B. Аппаратный кластер демонстрирует производительность 512 петафлопс в формате FP16 при коэффициенте использования 82 процента. Данные показатели составляют 91 процент от производительности кластеров на базе американских чипов Nvidia A100.

Автор: DeepSeek Источник: www.teknoburada.net

Компания заявляет о значительном снижении затрат на обучение модели. По предварительным данным, стоимость обучения DeepSeek-R2 на 97 процентов ниже расходов на создание GPT-4 благодаря оптимизации аппаратных и программных решений.

Новая модель использует усовершенствованную систему сетевых шлюзов, что должно повысить эффективность при выполнении задач вывода. DeepSeek планирует предложить доступ к API модели по цене ниже текущих рыночных стандартов, установленных OpenAI и Anthropic.

Разработка DeepSeek-R2 на отечественном оборудовании рассматривается как часть стратегии Китая по снижению зависимости от американских технологий в сфере искусственного интеллекта. Официальный анонс модели ожидается в ближайшие недели.

Источник: Teknoburada.Net

Автор не входит в состав редакции iXBT.com (подробнее »)

Сейчас на главной

Новости

Публикации

Что не так с USB-тестером FNIRSI FNAC-28?! Обзор и расследование

USB-тестер — полезный гаджет, который может показаться сложным только на первый взгляд. На самом деле это универсальный ключ к пониманию того, как работает смартфон, повербанк и любая...

Кошмар Микеланджело: как физики решили проблему капающей краски, мешавшую «Сотворению Адама»

В 1511 году, создавая фреску «Сотворение Адама» на своде Сикстинской капеллы, Микеланджело Буонарроти столкнулся с физической проблемой. Работая на лесах, художник был вынужден наносить пигмент на...

Мир отмечает День числа Пи: как константа 3,14 вышла за пределы геометрии и стала управлять аппаратами «Вояджер»

В школьной программе математики число Пи часто сводится к короткой и удобной дроби 3,14. Учителя объясняют, что это постоянная величина, которая обозначает отношение длины любой окружности к ее...

Страна, которая строит крылья для Boeing: почему Япония так и не смогла создать собственный пассажирский авиалайнер

Япония — одна из ведущих технологических держав мира, страна, которая производит высокоточные компоненты для практически всех современных пассажирских самолётов Boeing и Airbus. Однако,...

Обзор TWS наушников Realme Buds Air7 Pro: аудиофильский кодек, встроенный ИИ-переводчик и 10 часов на одном заряде

Realme давно научилась делать устройства, которые выглядят и ощущаются дороже своей цены. Buds Air7 Pro — наглядное тому подтверждение. Это не бюджетная «затычка для звонков» и не...

Как мошенники берут кредиты через старые SIM-карты и забытые счета — и почему это опасно

В последние годы все чаще появляются истории, когда человек неожиданно узнает о кредите, который он никогда не оформлял. Иногда это происходит спустя месяцы или даже годы после того, как был утерян...