Resemble AI представила открытую модель синтеза речи с функцией клонирования голоса

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Канадский стартап Resemble AI опубликовал в открытом доступе модель преобразования текста в речь под названием Chatterbox Turbo. Ключевой особенностью разработки является способность воспроизводить голос конкретного человека на основе аудиозаписи длительностью всего пять секунд.

Техническая документация проекта указывает на то, что время генерации первого фрагмента речи составляет менее 150 миллисекунд. Такие показатели задержки критичны для использования в системах реального времени — голосовых помощниках, телефонных службах поддержки, интерактивных игровых персонажах и цифровых аватарах.

Автор: freepik Источник: ru.freepik.com

Компания Resemble AI, основанная в 2019 году в Торонто, интегрировала в свою модель собственную технологию аудиоводяных знаков PerTh. Этот механизм встраивает в сгенерированную речь невидимую маркировку, которая впоследствии позволяет идентифицировать контент как созданный искусственным интеллектом. Эта функция предназначена для организаций из регулируемых отраслей, где требуется прозрачность происхождения медиаматериалов.

Проект распространяется по лицензии MIT, которая допускает бесплатное использование, модификацию и распространение в коммерческих целях без ограничений. Исходный код размещён на GitHub. Тестирование модели доступно на платформах HuggingFace, RunPod, Modal, Replicate и Fal. Параллельно компания развивает собственную облачную инфраструктуру для корпоративных клиентов и анонсировала подготовку версии с ещё более низкой задержкой отклика.

Источник: Habr

нет
Автор не входит в состав редакции iXBT.com (подробнее »)

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Как люди попали в Южную Америку: новое исследование ставит под сомнение ключевой памятник континента

На протяжении почти пятидесяти лет археология Нового Света опиралась на один памятник. Стоянка Монте-Верде на юге Чили считалась главным и самым надежным доказательством того, что люди оказались в...

Как заставить звук проходить сквозь стены: новый материал направляет сигнал изнутри, оставаясь невидимым для внешних волн

Управление звуком всегда опиралось на создание физических преград. Звук это механическая волна, чередование зон высокого и низкого давления, которое распространяется в пространстве. Чтобы направить...

Ежегодное ТО газового котла. Разбираемся, за что «газовщики» берут деньги?

На днях с моими родителями случилась неприятная история — начал «скрежетать» газовый котел. Вызвали мастера, который определил, что данная проблема требует замены насоса, причем сумма за...

✦ ИИ  Между забвением и «понтами»: почему наручные часы отказываются умирать

Наручным часам уже лет тридцать безапелляционно пророчат неминуемую смерть. Начались подобные «упаднические» разговоры с появления массовых карманных компьютеров вроде легендарных Palm, грозивших...

Десять лет назад вышел смартфон, который мог спасти HTC от краха — HTC 10: почему у него ничего не получилось

Один из пионеров рынка Android, компания HTC, очень быстро растеряла свои позиции. Сначала люди недооценили аппарат One M8, который мало отличался от предыдущего M7, а затем стали ругать...

Победа «лопаты»: как Galaxy Note заставил Apple переделать iPhone, а Samsung научила мир любить большие телефоны

Если бы вы оказались в начале 2010-х и спросили любого техногика, каким должен быть идеальный смартфон, ответ был бы почти единогласным. Правила игры казались высеченными в граните, а...