OpenAI выпускает первые за пять лет модели с открытым исходным кодом для локального использования

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

OpenAI представила две новые модели искусственного интеллекта с открытым исходным кодом — gpt-oss-120b и gpt-oss-20b. Это первый релиз открытых моделей компании с момента выпуска GPT-2 в 2019 году. Главная особенность новинок заключается в возможности их локального запуска на пользовательском оборудовании, а не через облачные серверы.

Модель gpt-oss-20b содержит 21 миллиард параметров, которые благодаря технологии объединения экспертов (MoE) сокращаются до 3,6 миллиарда на токен. Для её работы требуется компьютер с 16 ГБ оперативной памяти, что делает её доступной для большинства пользователей. Более мощная gpt-oss-120b насчитывает 117 миллиардов параметров (5,1 миллиарда на токен при использовании MoE) и требует 80 ГБ памяти, что соответствует возможностям одного графического ускорителя Nvidia H100. Обе модели поддерживают контекстное окно размером 128 000 токенов.

Автор: OpenAI Источник: arstechnica.com

Новые модели представляют собой трансформеры с настраиваемой цепочкой мысли (CoT), позволяющей выбирать между низкими, средними и высокими настройками. При низких настройках работа выполняется быстрее с меньшим потреблением ресурсов, а высокие настройки обеспечивают лучшие результаты. Уровень CoT можно задать одной строкой в системном приглашении.

По производительности gpt-oss-120b сопоставима с проприетарными моделями OpenAI o3 и o4-mini. Меньшая модель немного отстаёт, но показывает близкие результаты в задачах по математике и программированию. На экзамене человечества, основанном на знаниях, gpt-oss-120b достигает показателя 19%, в то время как o3 с инструментами — 24,9%.

Автор: OpenAI Источник: arstechnica.com

В отличие от облачных решений OpenAI, новые модели работают только с текстом без поддержки мультимодальности. Однако они обеспечивают меньшую задержку, больше возможностей для настройки и повышенную безопасность конфиденциальных данных благодаря локальной обработке.

Модели распространяются по лицензии Apache 2.0, что позволяет разработчикам настраивать их для конкретных задач. OpenAI провела тестирование безопасности, включая попытки настройки моделей на злонамеренную работу, и утверждает, что встроенные средства контроля эффективно ограничивают вредоносное поведение.

Обе модели уже доступны для скачивания на HuggingFace, а репозитории GitHub открыты для ознакомления. OpenAI также разместила общедоступные версии моделей в своей инфраструктуре для тестирования.

Источник: Ars Technica

Автор не входит в состав редакции iXBT.com (подробнее »)

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Почему Солнце «уснуло» на 70 лет: как случайный набросок Кеплера приблизил понимание самой долгой звездной аномалии

28 мая 1607 года в Праге математик и астроном Иоганн Кеплер проводил наблюдения за Солнцем. В тот день он зафиксировал на солнечном диске небольшое темное пятно. Кеплер был уверен, что...

«Синдром Наполеона»: зачем на старых фото элита прятала одну руку в сюртук

Когда мы смотрим на портрет Наполеона Бонапарта, в голове мгновенно возникает знакомый образ: невысокий человек в треуголке, рука которого спрятана за отворот сюртука. Заглянув в старые семейные...

Обзор автомагнитолы DIGMA MCP-515: популярная магнитола за недорого

Не во всех автомобилях присутствует место под 2 din головное устройство с сенсорным экраном и другими наворотами, в основном мы можем встретить посадочное место под 1 din магнитолу, которая...

Как люди попали в Южную Америку: новое исследование ставит под сомнение ключевой памятник континента

На протяжении почти пятидесяти лет археология Нового Света опиралась на один памятник. Стоянка Монте-Верде на юге Чили считалась главным и самым надежным доказательством того, что люди оказались в...

Как заставить звук проходить сквозь стены: новый материал направляет сигнал изнутри, оставаясь невидимым для внешних волн

Управление звуком всегда опиралось на создание физических преград. Звук это механическая волна, чередование зон высокого и низкого давления, которое распространяется в пространстве. Чтобы направить...