DeepSeek представила гибридную модель V3.1 с улучшенными возможностями кодирования

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Китайская компания DeepSeek анонсировала выпуск модели искусственного интеллекта DeepSeek-V3.1, которая объединяет архитектуры предыдущих версий V3 и R1. Новая разработка представляет собой гибридную систему, сочетающую быструю модель для стандартных задач и медленную модель для сложных вычислений.

Модель DeepSeek-V3.1 содержит 671 миллиард параметров и требует минимум 720 ГБ дискового пространства для полной версии. Квантованная однобитная версия занимает 170 ГБ, а для запуска минимальной конфигурации необходим графический процессор с памятью от 24 ГБ.

Автор: Неизвестный автор Источник: commons.wikimedia.org

Тестирование показало превосходство V3.1 над предшественниками в области программирования согласно бенчмарку SWE. Модель также продемонстрировала улучшенные результаты в тестах xbench-DeepSearch, SimpleQA и FRAMES AI по сравнению с предыдущей версией R1.

Техническими характеристиками V3.1 являются контекстное окно размером 128 тысяч токенов и доступность через API. Компания планирует упростить ценовую политику API после 5 сентября 2025 года с учетом гибридной природы модели.

DeepSeek распространяет V3.1 под лицензией MIT с открытым исходным кодом, обеспечивая бесплатный доступ для разработчиков и исследователей. Пользователи могут взаимодействовать с моделью через веб-интерфейс чата без ограничений.

Источник: Notebookcheck

Автор не входит в состав редакции iXBT.com (подробнее »)

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Туринская плащаница Дани Рязанова: как молодой художник из Петербурга рисует огнем

Раньше, наблюдая за современным художественным процессом, казалось, что молодые художники стремятся как можно дальше уйти от «навязанных» канонов, отказаться от всего, чем пользовались мастера...

Детальное изучение мозга чемпиона по памяти раскрыло нейробиологию его трюков

Рабочая память человека имеет свои физиологические ограничения. Исторически в когнитивной психологии этот предел описывался формулой «семь плюс-минус два элемента». Вы можете легко удержать в...

Эффект странника: как навыки ориентации в пространстве породили у человека геометрическое мышление

Со времен Платона геометрия считалась высшим проявлением абстрактного мышления. В диалоге «Менон» философ просит необразованного мальчика-раба удвоить площадь квадрата — и тот, опираясь...

Каньон Антилопы: почему он самый извилистый и фотогеничный в мире

В Аризоне, на землях индейцев навахо, находится место, любимое фотографами со всего мира. Каньон Антилопы вы наверняка хоть раз видели на заставке своего компьютера. Microsoft вносила его виды в...

Почему кофе и чай бодрят: взгляд с точки зрения науки

Вы когда-нибудь замечали, что после чашки кофе фокусировка внимания резко обостряется, но уже через полчаса ясность мысли начинает неумолимо угасать? Эти «американские горки» связаны с конкретными...