Google добавила в Gemini Live функцию распознавания тона голоса пользователя
Компания Google внедрила в свой голосовой ИИ-ассистент Gemini Live технологию анализа тона голоса собеседника. Нововведение позволяет системе распознавать не только слова пользователя, но и особенности их произношения — ритм речи, интонацию и тональность.
Обновление базируется на Gemini 2.5 Flash Live API. Система получила название «нативный звук» и меняет принцип взаимодействия ассистента с человеком. Gemini Live анализирует голосовые характеристики запроса и формирует ответы с учетом эмоционального состояния пользователя и контекста разговора.
Функция распространяется на устройства под управлением Android — смартфоны и планшеты различных производителей. Развертывание происходит поэтапно, охватывая не только линейку Pixel 10, но и другие Android-устройства. Сроки появления обновления для платформы iOS пока не раскрываются, но запуск может произойти в ближайшие недели.
Параллельно Google расширила настройки голосового вывода Gemini. Пользователи получили возможность регулировать скорость речи ассистента, выбирать различные акценты для английского языка. Все параметры настраиваются через специальный раздел в меню приложения.
Разработчики позиционируют технологию как шаг к более естественному диалогу между человеком и искусственным интеллектом. Система адаптирует манеру общения в зависимости от того, как именно пользователь формулирует свои запросы голосом.
Источник: Hardware Upgrade





0 комментариев
Добавить комментарий