Новая нейросеть Mandarin от xAI бросила вызов Google

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Разработчики и тестировщики нейросетей обсуждают новую модель для генерации изображений Mandarin, которую связывают с компанией Илона Маска xAI. Первые тесты проходят на платформе LMArena, где пользователи отмечают, что система стабильно генерирует текст на изображениях — то, с чем у большинства моделей до сих пор проблемы.

Инженеры, знакомые с тестами, поясняют, что Mandarin обучали на новых датасетах, где особое внимание уделено взаимосвязи текста и визуальных объектов. По словам специалиста по машинному зрению Ивана Климова, «xAI явно пошла по пути точного позиционирования элементов. Mandarin неплохо понимает, где на картинке должно находиться слово и как связать его с объектом — это шаг к более реалистичным визуальным сценам».

Автор: DC Studio Источник: ru.freepik.com

При этом эксперты напоминают, что LMArena не раскрывает подробностей об архитектуре Mandarin, а доступ к самой модели ограничен. Судя по изображениям, опубликованным участниками, система уверенно работает с надписями на английском, но пока не тестировалась на других языках.

На фоне этих новостей специалисты вновь вспомнили о nano banana 2 — свежем проекте Google на базе Gemini 3.0 Pro, который недавно попал в сеть. По словам аналитика по ИИ Александра Ефремова, обе разработки идут примерно в одном направлении: «Google делает ставку на пространственное восприятие, xAI — на языковую точность. В результате мы можем получить два конкурирующих подхода к созданию визуального контента».

Пока обе модели доступны только для ограниченного круга тестировщиков, но исследователи уверены, что именно с этого противостояния начнётся новый этап в развитии генеративных систем. «Промышленность подошла к точке, где рисовалки перестают быть игрушкой. Mandarin и nano banana 2 — первые модели, претендующие на полноценное применение в дизайне и визуализации», — говорит эксперт по искусственному интеллекту Сергей Селиванов.

Источник: https://habr.com

Автор не входит в состав редакции iXBT.com (подробнее »)

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Плитвицкие озера: почему в их кристальных водах нельзя искупаться

К созданию озер в Хорватии природа подошла креативно. Ландшафт здесь играет так, что 16 озер располагаются своеобразной лесенкой, где прозрачная бирюзовая вода, как после фильтров в фотошопе,...

Британский Hi-Fi сэндвич с аэрокосмической начинкой: LEAK выпустила колонки Sandwich 100

Есть что-то почти провокационное в том, как LEAK называет свои колонки. Sandwich 100 — это не маркетинговый каприз, а прямая отсылка к инженерному решению 65-летней давности, которое в...

Налобный фонарик, который смог? Держит высокую яркость и пробивает вдаль. Обзор Wurkkos HD17

200м реальной дальнобойности, 2500люм яркости, удобное для ремонта быстросъёмное оголовное крепление, магнит в торце, исключительно яркий красный свет, ступенчатая и плавная настройка яркости с...

Обзор башенного кулера Ocypus Delta A62 BK ARGB: тише человеческого шёпота!

Когда собираешь компьютер, всегда ищешь тот самый золотой баланс: чтобы и процессор не задыхался от жары, и кошелёк не опустел, и в ушах не свербело от гула вентиляторов. С виду обычная башня, а по...

Белорусские мотивы на заставке китайских часов: обзор Haylou Solar Lite 2

Классика или современные гаджеты? Вопрос простой, но ответ не такой очевидный. Обычные часы — это про внешний вид и привычку, умные — про удобство и повседневные функции. При...

✦ ИИ  Боль — это не сигнал тела, а галлюцинация мозга: новая теория деконструирует 400 лет медицины

400 лет назад французский философ Рене Декарт предложил модель, которая определила отношение западной медицины к боли на столетия вперед. Он представлял нервную систему как систему трубок:...