Для работы проектов iXBT.com нужны файлы cookie и сервисы аналитики. Продолжая посещать сайты проектов вы соглашаетесь с нашей Политикой в отношении файлов cookie

OpenAI представила обновленную модель GPT-RealTime с улучшенными возможностями и сниженной стоимостью

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com

29 августа 2025, 10:00 | Новость | ИИ, сервисы и приложения

29 августа 2025 года компания OpenAI официально запустила новую модель синтеза речи GPT-RealTime, которая позиционируется как самая мощная модель речи в реальном времени на сегодняшний день. Одновременно с запуском компания обновила ряд функций API, включая поддержку удаленного сервера MCP, ввод изображений и поддержку телефонных звонков SIP.

Новая модель GPT-RealTime теперь доступна всем разработчикам по сниженной на 20% цене по сравнению с предыдущей версией GPT-4O-RealTime-Preview. Стоимость ввода звука составляет 32 доллара США за миллион токенов, ввод кэша — 0,4 доллара за миллион токенов, а вывод аудио — 64 доллара за миллион токенов.

Автор: Focal Foto Источник: commons.wikimedia.org

GPT-RealTime демонстрирует значительные улучшения в качестве распознавания речи и понимании инструкций. Модель способна улавливать невербальные сигналы, такие как смех, плавно переключаться между несколькими языками в рамках одного предложения и регулировать тон в режиме реального времени.

По внутренней оценке OpenAI, новая модель показывает повышенную точность распознавания буквенно-цифровых последовательностей на различных языках, включая китайский, испанский, японский и французский. В тесте Big Bench Audio модель достигла уровня точности 82,8%, что превосходит показатели предыдущей версии. В аудиотесте MultiChallenge, измеряющем соответствие инструкциям, GPT-RealTime набрал 30,5% против 20,6% у предшественника.

Компания также улучшила производительность модели при вызове функций в трех ключевых аспектах: вызове связанных функций, выборе времени и сопоставлении параметров. В оценке аудио ComplexFuncBench новая модель показала результат 66,5%, что значительно превышает 49,7% у предыдущей версии.

OpenAI внедрила улучшенный контроль над контекстом разговоров, позволяя разработчикам устанавливать лимиты смарт-токенов и поддерживать усечение нескольких раундов разговоров одновременно, что существенно снижает стоимость длительных сеансов. Кроме того, GPT-RealTime изначально поддерживает асинхронные вызовы функций, которые сохраняют естественность разговоров без прерывания потока сеанса при длительном выполнении функций.

Источник: CNMO

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Sony запатентовала контроллер для PlayStation с гибким корпусом, который можно сжимать, скручивать и деформировать

Bluetti представила FridgePower: ультратонкую электростанцию на 2016 Вт·ч с расширением до 8 кВт·ч

Роботы на дорогах возят за деньги. Южная Корея одобрила поставки грузовиков без водителя для коммерческих перевозок

Galaxy S27 Ultra может стать первым смартфоном Samsung с UFS 5.0, что ускорит запуск приложений и обработку больших файлов на устройстве

Смартфоны и телефоны
6 часов назад
0

В Quick Share на Galaxy выявлена проблема при передаче фото на iPhone

Смартфоны и телефоны
7 часов назад
0

Публикации

Как бактерии стали многоклеточными: система разделения ДНК эволюционировала во внутриклеточный каркас

Статья
6 часов назад
Наука и космос

Биологическая эволюция редко создает принципиально новые механизмы с нуля. В подавляющем большинстве случаев природа модифицирует уже существующие структуры, адаптируя их под совершенно новые...

Компьютерные расчеты термоядерных реакций оказались ошибочными: как эксперимент с испаренной медью переписывает законы физики плазмы

Статья
7 часов назад
Наука и космос

Воздействие сверхмощного оптического лазера на металл разрушает межатомные связи за квадриллионные доли секунды. В точке удара материал мгновенно переходит в состояние горячей сверхплотной плазмы,...

Самые крупные карповые в мире и в России: история семейства, размеры и что из них готовят

Мнение
10 часов назад
Флора и фауна

Когда слышишь слово «карповые», в голове обычно возникает что-то очень земное и понятное: карась в деревенском пруду, карп на рынке, сазан в рассказах рыбаков. Но у этого семейства есть и совсем...

✦ ИИ 5 сервисов для создания презентаций с опросами: для учителей, маркетологов и бизнеса

Тематическая подборка
10 часов назад
ИИ, сервисы и приложения

Нужно собрать обратную связь, проверить гипотезу или просто узнать, что думают люди? Рассказываем, где создать опрос за 5 минут, какие сервисы работают в РФ, как проводить голосования в реальном...

Где можно увидеть Стоунхендж, не выезжая за границы России

Статья
10 часов назад
Путешествия и туризм

Мысль о том, чтобы увидеть чудо света или загадку истории нужно выезжать за тридевять земель, настолько укрепилась в сознании, что интересных мест поближе как будто и нет вовсе.Итак, для всех...

Обзор бесщеточной аккумуляторной пилы ProCraft PKA45 (PKA46): 2 аккумулятора, 2 шины и 2 цепи

Обзор
Вчера в 16:31
Инструменты и запчасти

Во время работы в саду или на приусадебном участке приходится срезать деревья и кустарники. Порой они достаточно толстые, чтобы справиться с ними вручную, и приходится доставать электрические или...