Google добавила в Gemini Live функцию распознавания тона голоса пользователя

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com

Компания Google внедрила в свой голосовой ИИ-ассистент Gemini Live технологию анализа тона голоса собеседника. Нововведение позволяет системе распознавать не только слова пользователя, но и особенности их произношения — ритм речи, интонацию и тональность.


Обновление базируется на Gemini 2.5 Flash Live API. Система получила название «нативный звук» и меняет принцип взаимодействия ассистента с человеком. Gemini Live анализирует голосовые характеристики запроса и формирует ответы с учетом эмоционального состояния пользователя и контекста разговора.

Автор: KamranAydinov Источник: ru.freepik.com

Функция распространяется на устройства под управлением Android — смартфоны и планшеты различных производителей. Развертывание происходит поэтапно, охватывая не только линейку Pixel 10, но и другие Android-устройства. Сроки появления обновления для платформы iOS пока не раскрываются, но запуск может произойти в ближайшие недели.

Параллельно Google расширила настройки голосового вывода Gemini. Пользователи получили возможность регулировать скорость речи ассистента, выбирать различные акценты для английского языка. Все параметры настраиваются через специальный раздел в меню приложения.

Разработчики позиционируют технологию как шаг к более естественному диалогу между человеком и искусственным интеллектом. Система адаптирует манеру общения в зависимости от того, как именно пользователь формулирует свои запросы голосом.

Читайте также

Новости

Публикации