Автор не входит в состав редакции iXBT.com (подробнее »)
avatar
Это вы сейчас про реализованную практически фичу, или просто теоретизируете? Я просто обычный юзер, подобные разговоры у меня вызывают панику.
avatar
Насколько я понимаю принцип работы, у MJ задействовано сразу множество взаимодействующих моделей, а объединяются они все через некий интерпретатор, который анализирует промт, дополняет его до полноценного сюжета, и модели выбирает-привлекает для отрисовки. В SD же промт сразу едет в модель. Лично мне немного не хватает этой «самодеятельности», которую проявляет MJ.
avatar
MJ это самоиграйка, которая помимо самого изображения, генерирует недостающие части промта, которые человек не указал — например ракурс, сюжет, цвет глаз, обстановку, и т.д.
SD ничего этого не делает. Ей вообще пофиг на контекст. Нельзя написать «карлики из Челябинска воруют уголь» и наблюдать, как она сама придумает историю, из которой тебе предоставит стоп-кадры. Ей нужно точно объяснить, как должно выглядеть изображение, и что на нём: «карлик с бородой, одетый в робу, несёт мешок, ночь» и т.д.
avatar
По дефолту, SD явно проигрывает даже BlueWillow. Я уж не знаю, как её нужно дообучать, или как заставить её понимать то, чего от неё хотят, но 99% генераций у меня — кривые и косые. По настоящему удачными, близкими к миджорни, получались лишь некоторые портреты знаменитостей по текстовому описанию, типа «natalie portman portrait» — нейронка сразу отрабатывает на 10 голов лучше, чем обычно. В остальном — нет, проигрыш даже BlueWillow. Про обработку фото я вообще молчу. Грузишь мужика с лопатой, пишешь — «мужик с лопатой», а оно выдаёт тебе психоделический сон грибника-киборга. Просто загрузить фотку без описания и добавить модификатор, чтобы стилизовать изображение, скажем, под акварель, вообще нельзя — нейронка не понимает, что нужно взять за основу фотку и переработать её в акварель, она рисует какую-то рандомную х**ню вместо фотки, причём тоже криво-косо. Я так понимаю, люди, которые часами сидят и играются в неё, а потом пишут в интернетах про её крутость — это такие скромняги, которые в условиях трудностей с оплатой, да и в целом дороговизны Midjourney, довольствуются малым, к тому же, стоящем на своём родном железе. Но по факту, это игрушка, которой далеко до того, чтобы быть нормальным инструментом.
avatar
Поигрался несколько дней, делюсь впечатлениями.
1. Генерация на низком уровне, примерно как ru_DALL-E от Сбербанка (нейронка встроена в их приложение Салют). На телах, предметах, иногда пейзажах, бывают артефакты, вроде горы, висящей в воздухе (потому что на предыдущей картинке в этом месте было облако). Кривые глаза — в 90% генераций с лицами. Иногда по самому обычному запросу вроде «девушка стоит у окна» выдаёт таких некроморфов, с вывернутыми руками, тремя ногами, вытянутой фигурой, ещё одним туловищем вместо шеи (!), что мама не горюй. То есть, нейросетка ещё не понимает анатомию человеческого тела. Будет ли она развиваться — совершенно не ясно, инфа на сайте даже о создателях говорит, что они предпочли остаться неизвестными. Из-за генерации низкого уровня, даже на самых идеальных результатах всё равно видны артефакты, выдающие нейросеть, и картинки эти использовать где-либо на полном серьёзе — не очень перспективно.
2. Неплохо рисует портреты знаменитостей по текстовому запросу, с поправкой на п.1.
3. Неплохо рисует всякое аниме. Я бы даже сказал, что аниме — это лучшее, что у неё получается. Но тоже с поправкой на п.1.
4. Отлично рисует эмблемы, если правильно подобрать промт. Например «slavic god Swarog shadow logo llustration, logo vector, 2d, clear line, black and white simple art» — попробуйте. Думаю. приятно удивитесь.
5. Защита от генерации NSFW-контента реализована только на уровне фильтра, который не пропускает слова, вроде «ж*па» и «бикини» в генератор. Но и это не спасает, т.к. женщины на сгенерированных картинках имеют свойство иногда оголяться, и едва заметив это, тебе нужно немедленно прекратить раскрутку, т.к. иначе придёт модератор и без предупреждения выпишет бан, и будь здоров.
P.S. После даже небольшого опыта с Midjourney, с этой возиться — совсем грустно. И наоборот, после этой от Midjourney можно шокироваться. Но за свои деньги — топ, так что сервер всегда битком.