Resemble AI представила открытую модель синтеза речи с функцией клонирования голоса

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Канадский стартап Resemble AI опубликовал в открытом доступе модель преобразования текста в речь под названием Chatterbox Turbo. Ключевой особенностью разработки является способность воспроизводить голос конкретного человека на основе аудиозаписи длительностью всего пять секунд.

Техническая документация проекта указывает на то, что время генерации первого фрагмента речи составляет менее 150 миллисекунд. Такие показатели задержки критичны для использования в системах реального времени — голосовых помощниках, телефонных службах поддержки, интерактивных игровых персонажах и цифровых аватарах.

Автор: freepik Источник: ru.freepik.com

Компания Resemble AI, основанная в 2019 году в Торонто, интегрировала в свою модель собственную технологию аудиоводяных знаков PerTh. Этот механизм встраивает в сгенерированную речь невидимую маркировку, которая впоследствии позволяет идентифицировать контент как созданный искусственным интеллектом. Эта функция предназначена для организаций из регулируемых отраслей, где требуется прозрачность происхождения медиаматериалов.

Проект распространяется по лицензии MIT, которая допускает бесплатное использование, модификацию и распространение в коммерческих целях без ограничений. Исходный код размещён на GitHub. Тестирование модели доступно на платформах HuggingFace, RunPod, Modal, Replicate и Fal. Параллельно компания развивает собственную облачную инфраструктуру для корпоративных клиентов и анонсировала подготовку версии с ещё более низкой задержкой отклика.

Источник: Habr

нет
Автор не входит в состав редакции iXBT.com (подробнее »)

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Как бактерии стали многоклеточными: система разделения ДНК эволюционировала во внутриклеточный каркас

Биологическая эволюция редко создает принципиально новые механизмы с нуля. В подавляющем большинстве случаев природа модифицирует уже существующие структуры, адаптируя их под совершенно новые...

Компьютерные расчеты термоядерных реакций оказались ошибочными: как эксперимент с испаренной медью переписывает законы физики плазмы

Воздействие сверхмощного оптического лазера на металл разрушает межатомные связи за квадриллионные доли секунды. В точке удара материал мгновенно переходит в состояние горячей сверхплотной плазмы,...

Самые крупные карповые в мире и в России: история семейства, размеры и что из них готовят

Когда слышишь слово «карповые», в голове обычно возникает что-то очень земное и понятное: карась в деревенском пруду, карп на рынке, сазан в рассказах рыбаков. Но у этого семейства есть и совсем...

✦ ИИ  5 сервисов для создания презентаций с опросами: для учителей, маркетологов и бизнеса

Нужно собрать обратную связь, проверить гипотезу или просто узнать, что думают люди? Рассказываем, где создать опрос за 5 минут, какие сервисы работают в РФ, как проводить голосования в реальном...

Где можно увидеть Стоунхендж, не выезжая за границы России

Мысль о том, чтобы увидеть чудо света или загадку истории нужно выезжать за тридевять земель, настолько укрепилась в сознании, что интересных мест поближе как будто и нет вовсе.Итак, для всех...

Обзор бесщеточной аккумуляторной пилы ProCraft PKA45 (PKA46): 2 аккумулятора, 2 шины и 2 цепи

Во время работы в саду или на приусадебном участке приходится срезать деревья и кустарники. Порой они достаточно толстые, чтобы справиться с ними вручную, и приходится доставать электрические или...