DeepSeek представила гибридную модель V3.1 с улучшенными возможностями кодирования
Китайская компания DeepSeek анонсировала выпуск модели искусственного интеллекта DeepSeek-V3.1, которая объединяет архитектуры предыдущих версий V3 и R1. Новая разработка представляет собой гибридную систему, сочетающую быструю модель для стандартных задач и медленную модель для сложных вычислений.
Модель DeepSeek-V3.1 содержит 671 миллиард параметров и требует минимум 720 ГБ дискового пространства для полной версии. Квантованная однобитная версия занимает 170 ГБ, а для запуска минимальной конфигурации необходим графический процессор с памятью от 24 ГБ.
Тестирование показало превосходство V3.1 над предшественниками в области программирования согласно бенчмарку SWE. Модель также продемонстрировала улучшенные результаты в тестах xbench-DeepSearch, SimpleQA и FRAMES AI по сравнению с предыдущей версией R1.
Техническими характеристиками V3.1 являются контекстное окно размером 128 тысяч токенов и доступность через API. Компания планирует упростить ценовую политику API после 5 сентября 2025 года с учетом гибридной природы модели.
DeepSeek распространяет V3.1 под лицензией MIT с открытым исходным кодом, обеспечивая бесплатный доступ для разработчиков и исследователей. Пользователи могут взаимодействовать с моделью через веб-интерфейс чата без ограничений.
Источник: Notebookcheck





0 комментариев
Добавить комментарий
Добавить комментарий