Новая нейросеть Mandarin от xAI бросила вызов Google

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Разработчики и тестировщики нейросетей обсуждают новую модель для генерации изображений Mandarin, которую связывают с компанией Илона Маска xAI. Первые тесты проходят на платформе LMArena, где пользователи отмечают, что система стабильно генерирует текст на изображениях — то, с чем у большинства моделей до сих пор проблемы.

Инженеры, знакомые с тестами, поясняют, что Mandarin обучали на новых датасетах, где особое внимание уделено взаимосвязи текста и визуальных объектов. По словам специалиста по машинному зрению Ивана Климова, «xAI явно пошла по пути точного позиционирования элементов. Mandarin неплохо понимает, где на картинке должно находиться слово и как связать его с объектом — это шаг к более реалистичным визуальным сценам».

Автор: DC Studio Источник: ru.freepik.com

При этом эксперты напоминают, что LMArena не раскрывает подробностей об архитектуре Mandarin, а доступ к самой модели ограничен. Судя по изображениям, опубликованным участниками, система уверенно работает с надписями на английском, но пока не тестировалась на других языках.

На фоне этих новостей специалисты вновь вспомнили о nano banana 2 — свежем проекте Google на базе Gemini 3.0 Pro, который недавно попал в сеть. По словам аналитика по ИИ Александра Ефремова, обе разработки идут примерно в одном направлении: «Google делает ставку на пространственное восприятие, xAI — на языковую точность. В результате мы можем получить два конкурирующих подхода к созданию визуального контента».

Пока обе модели доступны только для ограниченного круга тестировщиков, но исследователи уверены, что именно с этого противостояния начнётся новый этап в развитии генеративных систем. «Промышленность подошла к точке, где рисовалки перестают быть игрушкой. Mandarin и nano banana 2 — первые модели, претендующие на полноценное применение в дизайне и визуализации», — говорит эксперт по искусственному интеллекту Сергей Селиванов.

Источник: https://habr.com

Автор не входит в состав редакции iXBT.com (подробнее »)

Сейчас на главной

Новости

Публикации

Мы никогда не узнаем, что было в момент Большого взрыва: почему квантовое состояние мира навсегда скрыто от науки

Физика традиционно строится на концепции обратимости и предсказуемости: если мы знаем фундаментальные законы динамики и имеем точные данные о начальном состоянии системы, мы можем восстановить её...

Как бесплатный Wi-Fi в кафе может дорого обойтись?

Представьте ситуацию: вы заказали кофе, подключились к бесплатному Wi-Fi и через пару минут листаете новости или отвечаете в мессенджере. Всё выглядит обыденно — ровно до того момента,...

Невидимый объект летит на скорости 1000 км/с: «Уэбб» доказал существование блуждающих черных дыр

В современной астрофизике существует предсказание, сформулированное более пятидесяти лет назад: сверхмассивные черные дыры не являются статичными объектами, жестко закрепленными в центрах галактик....

Два дисплея, 10000 мАч, IP68, ночная ИК камера: обзор защищенного смартфона Blackview XPLORE X1

Обычно защищенные смартфоны — это про большой корпус, так себе камеры, минимум производительности и плохие дисплеи. Blackview XPLORE X1 готов с этим поспорить, тут вполне боевой...

Главные требования при подключении аккумуляторов к ИБП

Правильное подключение аккумуляторов к ИБП определяет безопасность, ресурс и фактическую автономность системы. В статье мы детально разберем, как выполнять подключение аккумуляторов к ИБП так,...

Стационарный ноутбук! Обзор 18.5" ноутбука Blackview AceBook 10

Blackview AceBook 10 — не просто ноутбук, а НОУТБУК, а все потому, что диагональ у него 18.5″! Зачем такой здоровый? А почему бы и нет, многие видели, что в разного рода...