18 апреля 2026 года компания xAI официально сделала общедоступным свой API Grok Speech to Text (STT). Новый сервис предлагает транскрипцию речи с поддержкой 25 языков, среди которых есть и русский.
Среди ключевых возможностей — пословные временные метки, работа с многоканальным аудио и точное разделение реплик нескольких участников разговора.
По заявлению xAI, сервис предоставляет высочайший уровень качества по самой низкой цене на рынке:
- Файловая транскрипция: $0,1 за час аудио;
- Стриминг/в реальном времени: $0,2 за час аудио
Это позволяет разработчикам легко интегрировать продвинутую транскрипцию в свои продукты. Запуск подчёркивает стратегию компании по расширению возможностей Grok.
Тот же технологический стек уже активно используется в Grok Voice, автомобилях Tesla и службе поддержки Starlink. Теперь эта передовая инфраструктура впервые становится доступна сторонним разработчикам.
Ранее xAI Илона Маска представила новый Text-to-Speech API — инструмент, который превращает обычный текст в живую, выразительную речь.
