DeepSeek анонсировала языковую модель R2 с 1,2 триллиона параметров

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Китайская компания DeepSeek готовит к запуску новую языковую модель искусственного интеллекта DeepSeek-R2, релиз которой запланирован на конец августа 2025 года. Модель построена на архитектуре Mixed of Experts (MoE) и содержит 1,2 триллиона параметров, что почти в два раза превышает показатели предыдущей версии DeepSeek-R1 с 671 миллиардом параметров.

DeepSeek-R2 полностью обучена на китайских процессорах Huawei Ascend 910B. Аппаратный кластер демонстрирует производительность 512 петафлопс в формате FP16 при коэффициенте использования 82 процента. Данные показатели составляют 91 процент от производительности кластеров на базе американских чипов Nvidia A100.

Автор: DeepSeek Источник: www.teknoburada.net

Компания заявляет о значительном снижении затрат на обучение модели. По предварительным данным, стоимость обучения DeepSeek-R2 на 97 процентов ниже расходов на создание GPT-4 благодаря оптимизации аппаратных и программных решений.

Новая модель использует усовершенствованную систему сетевых шлюзов, что должно повысить эффективность при выполнении задач вывода. DeepSeek планирует предложить доступ к API модели по цене ниже текущих рыночных стандартов, установленных OpenAI и Anthropic.

Разработка DeepSeek-R2 на отечественном оборудовании рассматривается как часть стратегии Китая по снижению зависимости от американских технологий в сфере искусственного интеллекта. Официальный анонс модели ожидается в ближайшие недели.

Источник: Teknoburada.Net

Автор не входит в состав редакции iXBT.com (подробнее »)

Сейчас на главной

Новости

Публикации

Зачем пилоты малой авиации сбрасывают якорь, пролетая над землёй

В интернете легко можно найти видеоролики, где пилот малой авиации летит на минимальной высоте вблизи аэродрома, и сбрасывает вниз нечто, напоминающее якорь небольшой лодки. Это может вызвать некое...

Наконец-то появился маленький и доступный защищенный смартфон: обзор Cubot KingKong mini 4

Обычно если представляем себе защищенный смартфон, в голову приходят эти огромные и неудобные резиновые кирпичи. Но вот чтобы действительно был защищенный смартфон и в компактном корпусе, такое...

Как закрутить саморез в древесину, чтобы она не растрескалась?

При креплении досок саморезами нередко возникает неприятная ситуация, когда древесина трескается в самый последний момент. Чаще всего это происходит при вкручивании крепежа вблизи края или в...

Информация на «закрученных» атомах: ферроаксиальные материалы как будущее сверхплотной памяти

Современные способы хранения цифровой информации — от жёстких дисков до твердотельных накопителей — опираются на два фундаментальных принципа: ориентацию магнитных доменов и...

Обзор беспроводной компьютерной мышки RAPOO VT2MAX Lava Red

У компании RAPOO появилась модель компьютерной мышки, сочетающая в себе яркий дизайн, легкий вес и отличные технические характеристики. Высокая точность сенсора, регулировка его разрешения от 10 до...

Toocki 200W: миф или реальность? Тест-обзор зарядного устройства в прикуриватель автомобиля

Главной особенностью автомобильного зарядного устройства в прикуриватель автомобиля Toocki 200W является не его габариты, не количество портов, не наличие протоколов быстрой зарядки и даже не...