Resemble AI представила открытую модель синтеза речи с функцией клонирования голоса

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Канадский стартап Resemble AI опубликовал в открытом доступе модель преобразования текста в речь под названием Chatterbox Turbo. Ключевой особенностью разработки является способность воспроизводить голос конкретного человека на основе аудиозаписи длительностью всего пять секунд.

Техническая документация проекта указывает на то, что время генерации первого фрагмента речи составляет менее 150 миллисекунд. Такие показатели задержки критичны для использования в системах реального времени — голосовых помощниках, телефонных службах поддержки, интерактивных игровых персонажах и цифровых аватарах.

Автор: freepik Источник: ru.freepik.com

Компания Resemble AI, основанная в 2019 году в Торонто, интегрировала в свою модель собственную технологию аудиоводяных знаков PerTh. Этот механизм встраивает в сгенерированную речь невидимую маркировку, которая впоследствии позволяет идентифицировать контент как созданный искусственным интеллектом. Эта функция предназначена для организаций из регулируемых отраслей, где требуется прозрачность происхождения медиаматериалов.

Проект распространяется по лицензии MIT, которая допускает бесплатное использование, модификацию и распространение в коммерческих целях без ограничений. Исходный код размещён на GitHub. Тестирование модели доступно на платформах HuggingFace, RunPod, Modal, Replicate и Fal. Параллельно компания развивает собственную облачную инфраструктуру для корпоративных клиентов и анонсировала подготовку версии с ещё более низкой задержкой отклика.

Источник: Habr

нет
Автор не входит в состав редакции iXBT.com (подробнее »)

Сейчас на главной

Новости

Публикации

Чем провинилась боярыня Морозова и куда ее везут

Государственная Третьяковская галерея содержит огромное количество картин известных русских художников. Среди них выделяются и произведения Василия Сурикова. Одной из самых значительных картин на...

Breguet, который в 100 раз дешевле: обзор часов Seagull Moon Phase

Поначалу казалось, что модель вызовет если не негативные, то противоречивые эмоции, однако, поносив ее несколько месяцев, понимаю, что даже дизайн, который является прямой цитатой великой...

Обзор-сравнение POCO M8 с прошлогодним POCO M7: слишком хорошие для бюджеток. Но так ли это?

С момента выхода POCO M7 прошло полгода, и появилось достойное продолжение в лице M8, который перевели на современный чипсет Snapdragon 6 Gen 3 (850 тысяч очков в AnTuTu) с поддержкой сетей 5G....

Прототип человеческого тела возник в океане 600 миллионов лет назад: что на самом деле управляет развитием организма

Для человека, насекомого или рыбы характерна билатеральная (двусторонняя) симметрия: у нас есть передняя и задняя части, спинная и брюшная стороны. Долгое время считалось, что эта сложная...

Самостоятельное посещение Бату-Кейвс: как выглядит храм в скале на окраине Куала-Лумпура

Есть места, которые выглядят как декорации к фильму, но при этом остаются абсолютно реальными. Бату-Кейвс как раз из таких. Огромная известняковая гора, изъеденная пещерами. Внизу город, шум машин,...

Турбулентность похожа на желе: почему даже самая сильная тряска физически не может уронить самолет

Есть простой физический эксперимент, который наглядно объясняет принципы аэродинамики. Возьмите прозрачный стакан, до краев наполненный плотным фруктовым желе. Погрузите в центр этой упругой массы...