OpenAI выпускает первые за пять лет модели с открытым исходным кодом для локального использования

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

OpenAI представила две новые модели искусственного интеллекта с открытым исходным кодом — gpt-oss-120b и gpt-oss-20b. Это первый релиз открытых моделей компании с момента выпуска GPT-2 в 2019 году. Главная особенность новинок заключается в возможности их локального запуска на пользовательском оборудовании, а не через облачные серверы.

Модель gpt-oss-20b содержит 21 миллиард параметров, которые благодаря технологии объединения экспертов (MoE) сокращаются до 3,6 миллиарда на токен. Для её работы требуется компьютер с 16 ГБ оперативной памяти, что делает её доступной для большинства пользователей. Более мощная gpt-oss-120b насчитывает 117 миллиардов параметров (5,1 миллиарда на токен при использовании MoE) и требует 80 ГБ памяти, что соответствует возможностям одного графического ускорителя Nvidia H100. Обе модели поддерживают контекстное окно размером 128 000 токенов.

Автор: OpenAI Источник: arstechnica.com

Новые модели представляют собой трансформеры с настраиваемой цепочкой мысли (CoT), позволяющей выбирать между низкими, средними и высокими настройками. При низких настройках работа выполняется быстрее с меньшим потреблением ресурсов, а высокие настройки обеспечивают лучшие результаты. Уровень CoT можно задать одной строкой в системном приглашении.

По производительности gpt-oss-120b сопоставима с проприетарными моделями OpenAI o3 и o4-mini. Меньшая модель немного отстаёт, но показывает близкие результаты в задачах по математике и программированию. На экзамене человечества, основанном на знаниях, gpt-oss-120b достигает показателя 19%, в то время как o3 с инструментами — 24,9%.

Автор: OpenAI Источник: arstechnica.com

В отличие от облачных решений OpenAI, новые модели работают только с текстом без поддержки мультимодальности. Однако они обеспечивают меньшую задержку, больше возможностей для настройки и повышенную безопасность конфиденциальных данных благодаря локальной обработке.

Модели распространяются по лицензии Apache 2.0, что позволяет разработчикам настраивать их для конкретных задач. OpenAI провела тестирование безопасности, включая попытки настройки моделей на злонамеренную работу, и утверждает, что встроенные средства контроля эффективно ограничивают вредоносное поведение.

Обе модели уже доступны для скачивания на HuggingFace, а репозитории GitHub открыты для ознакомления. OpenAI также разместила общедоступные версии моделей в своей инфраструктуре для тестирования.

Источник: Ars Technica

Автор не входит в состав редакции iXBT.com (подробнее »)

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Чтобы рисовать, как ребенок, надо повзрослеть, или прогулка по «Бумажному саду» Сергея Макарова

Примерно раз в месяц галереи Винзавода обновляют экспозиции, и до 24 мая Totibadze Gallery будет демонстрировать серию работ «Бумажный сад» современного художника Сергея Макарова.

Для чего в горлышке бутылки подсолнечного масла есть прорези

Если внимательно посмотреть внутрь бутылки с подсолнечным маслом, можно заметить странные пластиковые «лепестки» или прорези в горлышке. Многие воспринимают их как элемент дизайна или думают, что...

Откуда берутся звездопады: как Солнце разрушает астероиды и формирует новые метеорные потоки на пути Земли

Наблюдая за ночным небом, люди часто видят метеоры — яркие вспышки, возникающие при сгорании космических частиц в атмосфере Земли. Астрономия связывает происхождение большинства...

Почему на некоторых зарядных кабелях есть утолщение

Если посмотреть на кабели разных зарядных устройств, часто, почти у самого штекера, можно заметить небольшое утолщение. Многие воспринимают его как элемент дизайна или просто не обращают внимания....

Вулкан, который работает как насос: как Этна выкачивает магму с 80-километровой глубины

Вулкан Этна, расположенный на восточном побережье Сицилии, остается одним из самых сложных объектов для геологического моделирования. Будучи самым активным вулканом Европы, он демонстрирует...

Шондонг: как нашли целую экосистему в сводах самой большой пещеры мира

В научной фантастике любят придумывать подземные миры, но один такой имеется в реальности на нашей Земле. Ниже я расскажу, как существует экосистема в сводах самой большой пещеры мира, как так...