OpenAI выпускает первые за пять лет модели с открытым исходным кодом для локального использования

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

OpenAI представила две новые модели искусственного интеллекта с открытым исходным кодом — gpt-oss-120b и gpt-oss-20b. Это первый релиз открытых моделей компании с момента выпуска GPT-2 в 2019 году. Главная особенность новинок заключается в возможности их локального запуска на пользовательском оборудовании, а не через облачные серверы.

Модель gpt-oss-20b содержит 21 миллиард параметров, которые благодаря технологии объединения экспертов (MoE) сокращаются до 3,6 миллиарда на токен. Для её работы требуется компьютер с 16 ГБ оперативной памяти, что делает её доступной для большинства пользователей. Более мощная gpt-oss-120b насчитывает 117 миллиардов параметров (5,1 миллиарда на токен при использовании MoE) и требует 80 ГБ памяти, что соответствует возможностям одного графического ускорителя Nvidia H100. Обе модели поддерживают контекстное окно размером 128 000 токенов.

Автор: OpenAI Источник: arstechnica.com

Новые модели представляют собой трансформеры с настраиваемой цепочкой мысли (CoT), позволяющей выбирать между низкими, средними и высокими настройками. При низких настройках работа выполняется быстрее с меньшим потреблением ресурсов, а высокие настройки обеспечивают лучшие результаты. Уровень CoT можно задать одной строкой в системном приглашении.

По производительности gpt-oss-120b сопоставима с проприетарными моделями OpenAI o3 и o4-mini. Меньшая модель немного отстаёт, но показывает близкие результаты в задачах по математике и программированию. На экзамене человечества, основанном на знаниях, gpt-oss-120b достигает показателя 19%, в то время как o3 с инструментами — 24,9%.

Автор: OpenAI Источник: arstechnica.com

В отличие от облачных решений OpenAI, новые модели работают только с текстом без поддержки мультимодальности. Однако они обеспечивают меньшую задержку, больше возможностей для настройки и повышенную безопасность конфиденциальных данных благодаря локальной обработке.

Модели распространяются по лицензии Apache 2.0, что позволяет разработчикам настраивать их для конкретных задач. OpenAI провела тестирование безопасности, включая попытки настройки моделей на злонамеренную работу, и утверждает, что встроенные средства контроля эффективно ограничивают вредоносное поведение.

Обе модели уже доступны для скачивания на HuggingFace, а репозитории GitHub открыты для ознакомления. OpenAI также разместила общедоступные версии моделей в своей инфраструктуре для тестирования.

Источник: Ars Technica

Автор не входит в состав редакции iXBT.com (подробнее »)

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Есть ли срок годности у поваренной соли и как её хранить

Мы привыкли видеть даты производства и сроки годности буквально на всём: от пакета молока, который скиснет через неделю, до рыбных консервов, способных, казалось бы, пережить ядерную зиму....

Обзор моющего пылесоса Redkey W11: Компактный помощник для комплексной уборки без лишних хлопот

Современные квартиры нуждаются не просто в сухой чистке полов, но и в регулярном влажном уходе. Традиционная швабра с ведром — устаревшее решение, которое лишь размазывает грязь,...

✦ ИИ  Рыба-луна: что происходит с 300 миллионами икринок и как выживают единицы

Цифра в сотни миллионов икринок сначала звучит как перебор. Кажется, будто природа просто перестраховывается, как будто «на всякий случай». Но если чуть притормозить и посмотреть внимательнее,...

Предложен новый алгоритм поиска жизни в космосе, не опирающийся на биосигнатуры: жизнь выдает статистика

Поиск внеземной жизни десятилетиями строится на попытке обнаружить биосигнатуры — специфические химические маркеры в атмосферах далеких планет. Мы ищем кислород, метан или фосфин,...

Что за странный выступ на территории Афганистана на востоке

Глядя на политическую карту мира, у многих стран замечаешь странные геометрические «узоры» линии границы, не всегда они определяются географическими особенностями местности. Есть свой необычный...