Microsoft выпустила три собственные ИИ-модели для речи и изображений

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Microsoft представила три собственные модели искусственного интеллекта для работы с речью и изображениями. Системы MAI-Transcribe-1, MAI-Voice-1 и MAI-Image-2 доступны через сервис Microsoft Foundry и площадку MAI Playground.

Модель преобразования речи в текст MAI-Transcribe-1 показала средний уровень ошибок 3,8% при тестировании на 25 языках по методике FLEURS. Алгоритм обрабатывает файлы форматов MP3, WAV и FLAC объемом до 200 МБ. Скорость пакетной транскрипции превышает показатели существующих предложений Azure в 2,5 раза. Технология применяется в режимах голосового управления Copilot и для расшифровки разговоров в Teams.

Автор: qwen. ai Источник: chat.qwen.ai

Генератор голоса MAI-Voice-1 создает 60 секунд аудио за одну секунду реального времени и поддерживает клонирование голоса по коротким образцам. Стоимость услуги составляет 22 доллара за миллион символов. Система создания изображений MAI-Image-2 размещена в тройке лидеров рейтинга Arena. ai и работает вдвое быстрее предыдущей версии. Тарифы установлены на уровне 5 долларов за миллион входных токенов и 33 доллара за миллион выходных токенов.

Разработка моделей велась командами численностью менее десяти человек. Требования к вычислительным ресурсам снизились вдвое по сравнению с показателями конкурентов. Запуск состоялся после пересмотра соглашения с OpenAI в сентябре 2024 года, который снял ограничения на самостоятельные исследования в области общего искусственного интеллекта. Партнерство с OpenAI сохраняется до 2032 года.

Руководитель направления суперинтеллекта Мустафа Сулейман сообщил о планах обеспечить независимость компании в создании моделей всех типов. Стратегия ценообразования направлена на снижение себестоимости внутренних продуктов.

Источник: venturebeat

Автор не входит в состав редакции iXBT.com (подробнее »)
Об авторе
Интересуюсь технологиями и рассказываю о них вам.

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Секрет «человейника»: почему пригород Парижа превратился в гетто, а постсоветские панельки процветают

На протяжении последних тридцати лет каждый уважающий себя урбанист, бросая взгляд на сперва советские, а потом и российские панельные микрорайоны, изрекал одно и то же мрачное пророчество:...

Ядовитые растения на даче: какие основные цветы и кустарники опасны для кошек и собак

Проблема не в том, что животные специально ищут ядовитые растения, а в том, что они не различают опасность. Что из растительного мира на дачном участке представляет угрозу, и как защитить питомца?

Томат, капуста, огурцы: когда высаживать рассаду в грунт и что класть в лунку

Вырастить рассаду — это полдела. Именно при высадке в грунт большинство огородников совершают ошибки, которые сводят на нет все предыдущие усилия. Интернет полон советов, но многие из них бесполезны.

Какой процессор выбрать для SFF-сборки Мини-ПК в 2026 году

В корпусе мини-ПК на 4,2-4,9 литра процессор выбирают не по старшинству в линейке, а по тому, насколько спокойно он работает в тесном корпусе. Здесь важны энергоэффективность, высота кулера, цена...

Интернет через электрическую розетку: как расширить домашнюю сеть без проводов

Роутер стоит в прихожей, потому что именно туда заходит кабель провайдера. В гостиной интернет летает отлично, а вот в спальне за парой бетонных стен сигнал не достает. Видео в высоком качестве...

Обзор компактного блока питания DeepCool GameStorm SFX PS1000P с сертификатом Platinum

Компания DeepCool представила новую линейку PS-P компактных блоков питания в формате SFX мощностью 750/850/1000 Вт. Младшие модели получили узнаваемую платформу и начинку, а вот старшая версия...