Компания Sensory, специализирующаяся на встраиваемых решениях в области речевого интерфейса, выпустила еще одну интегральную схему (ИС), принадлежащую к семейству приборов, выполняющих распознавание речи. Новинка получила обозначение RSC-4192O, а ее основной особенностью является наличие однократно программируемой (one time programmable, OTP) памяти.
Приоритетной областью применения изделия названа потребительская электроника – этому способствует небольшая стоимость и высокое качество работы ИС.
В конфигурацию ИС входит 8-разрядный микроконтроллер общего назначения и 192 Кб OTP-памяти. Применение OTP-памяти в RSC-4192O (кстати, RSC-4192O является прямым потомком показанной на снимке, хорошо зарекомендовавшей себя и наиболее массово применяемой в отрасли микросхемы распознавания речи RSC-4128) обеспечивает новинке большую гибкость в применении. Интеграция блоков цифровой и аналоговой обработки сигнала, по утверждению производителя, положительно сказалась на стоимости решения и помогла повысить точность распознавания речи. По сути дела, RSC-4192O представляет собой полностью законченную подсистему голосового ввода-вывода, включающую ЦАП, АЦП и усилители.
Кроме того, Sensory выпустила улучшенную версию встроенного ПО - FluentChip 3.0, характеризующуюся повышенными показателями помехоусточивости, улучшенным синтезатором речи и музыки, и более качественными алгоритмами распознавания многоязычной речи. Это ПО предназначено для всех микросхем семейства RSC-4x и помогает строить на их основе более совершенные голосовые интерфейсы. В частности, в нем реализована функция Real-time LipSync, позволяющая в реальном времени сопоставлять анимацию или мимику робота с синтезируемой речью. Применение в FluentChip 3.0 новой акустической модели, по оценке компании, позволило уменьшить на 50% объем кода, высвободив часть памяти RSC-4x для нужд конкретных приложений.
Упростить освоение ИС Sensory разработчиками призван набор RSC-4x Demo/Evaluation Toolkit V2, доступный для заказа на сайте компании.
Источник: Sensory