DeepSeek представила гибридную модель V3.1 с улучшенными возможностями кодирования

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com

Китайская компания DeepSeek анонсировала выпуск модели искусственного интеллекта DeepSeek-V3.1, которая объединяет архитектуры предыдущих версий V3 и R1. Новая разработка представляет собой гибридную систему, сочетающую быструю модель для стандартных задач и медленную модель для сложных вычислений.


Модель DeepSeek-V3.1 содержит 671 миллиард параметров и требует минимум 720 ГБ дискового пространства для полной версии. Квантованная однобитная версия занимает 170 ГБ, а для запуска минимальной конфигурации необходим графический процессор с памятью от 24 ГБ.

Автор: Неизвестный автор Источник: commons.wikimedia.org

Тестирование показало превосходство V3.1 над предшественниками в области программирования согласно бенчмарку SWE. Модель также продемонстрировала улучшенные результаты в тестах xbench-DeepSearch, SimpleQA и FRAMES AI по сравнению с предыдущей версией R1.

Техническими характеристиками V3.1 являются контекстное окно размером 128 тысяч токенов и доступность через API. Компания планирует упростить ценовую политику API после 5 сентября 2025 года с учетом гибридной природы модели.

DeepSeek распространяет V3.1 под лицензией MIT с открытым исходным кодом, обеспечивая бесплатный доступ для разработчиков и исследователей. Пользователи могут взаимодействовать с моделью через веб-интерфейс чата без ограничений.

Читайте также

Новости

Публикации