Новая нейросеть Mandarin от xAI бросила вызов Google

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Разработчики и тестировщики нейросетей обсуждают новую модель для генерации изображений Mandarin, которую связывают с компанией Илона Маска xAI. Первые тесты проходят на платформе LMArena, где пользователи отмечают, что система стабильно генерирует текст на изображениях — то, с чем у большинства моделей до сих пор проблемы.

Инженеры, знакомые с тестами, поясняют, что Mandarin обучали на новых датасетах, где особое внимание уделено взаимосвязи текста и визуальных объектов. По словам специалиста по машинному зрению Ивана Климова, «xAI явно пошла по пути точного позиционирования элементов. Mandarin неплохо понимает, где на картинке должно находиться слово и как связать его с объектом — это шаг к более реалистичным визуальным сценам».

Автор: DC Studio Источник: ru.freepik.com

При этом эксперты напоминают, что LMArena не раскрывает подробностей об архитектуре Mandarin, а доступ к самой модели ограничен. Судя по изображениям, опубликованным участниками, система уверенно работает с надписями на английском, но пока не тестировалась на других языках.

На фоне этих новостей специалисты вновь вспомнили о nano banana 2 — свежем проекте Google на базе Gemini 3.0 Pro, который недавно попал в сеть. По словам аналитика по ИИ Александра Ефремова, обе разработки идут примерно в одном направлении: «Google делает ставку на пространственное восприятие, xAI — на языковую точность. В результате мы можем получить два конкурирующих подхода к созданию визуального контента».

Пока обе модели доступны только для ограниченного круга тестировщиков, но исследователи уверены, что именно с этого противостояния начнётся новый этап в развитии генеративных систем. «Промышленность подошла к точке, где рисовалки перестают быть игрушкой. Mandarin и nano banana 2 — первые модели, претендующие на полноценное применение в дизайне и визуализации», — говорит эксперт по искусственному интеллекту Сергей Селиванов.

Источник: https://habr.com

Автор не входит в состав редакции iXBT.com (подробнее »)

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Зачем природа оставила рыжий цвет волос и почему он преобладает на севере Европы

Рыжий цвет волос — один из самых редких и ярких человеческих признаков. Им обладают всего 1-2 % людей населения Земли, при этом подавляющее большинство рыжеволосых живёт в Северной и...

Древнейшие горы России: почему Урал уступает Карелии

В путеводителях и массовой культуре Уральские горы часто называют старейшими на планете. Этот географический штамп во многом обязан их внешнему виду: они невысокие, пологие и сильно сглаженные....

Универсальная выручалочка автомобилиста: обзор TrendVision Start Compressor 6000

Мелкие неприятности, которые возникают в процессе эксплуатации автомобиля могут серьезно испортить настроение, если не получается их оперативно устранить (а ехать нужно!). Это и не вовремя...

Из остатков «Аполлонов»: как лунная программа дала жизнь станции Skylab

Четырнадцатого мая 1973 года ракета-носитель Сатурн-5 вывела на околоземную орбиту первую американскую станцию Skylab. Этот пуск стал последним для ракет данного семейства. Проект разрабатывался в...

Маленький рюкзак для больших прогулок: обзор сумки-трансформера от Mark Ryden

Лет десять тому назад, во время учебы в университете, я ходил с обычной плечевой сумкой. Так продолжалось до первой поездки к друзьям в Нижнекамск: после долгой прогулки по городу у меня сильно...

Как рубиновая палочка и фотографическая вспышка изменили мир: история первого лазера Маймана

Шестнадцатого мая 1960 года в лаборатории компании Hughes Aircraft произошло событие, последствия которого мы ощущаем буквально каждый день. В тот день физик Теодор Майман запустил первый в истории...