Бесплатные нейросети для создания изображений: пробую популярные ИИ

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Мнение | ИИ, сервисы и приложения

Существует множество популярных моделей для генерации изображений. Можно создавать картинки в разных стилях: реалистичные, в стиле аниме, высококачественные, фото в старом стиле и многие другие. Некоторые из этих моделей бесплатны, а за некоторые нужно заплатить.

В этой статье я протестирую самые популярные с лучшими отзывами. Все они бесплатны для использования, но с некоторыми ограничениями. Давайте приступим к обзору.

Обложка была сгенерирована с помощью нейросети
Автор: FluxDev, Stable Diffusion, RealVisXL

Как ИИ генерирует картинки

Искусственный интеллект использует методы глубокого обучения для создания изображений. Модели обучаются на больших наборах данных, анализируя закономерности и статистические взаимосвязи между пикселями и их окружением. Основываясь на этой информации, модель может создавать новые изображения из входных данных, например, текстового описания.

Другими словами, ИИ натренирован на миллионах картинок. Когда вы пишите ему промт (например, «собака с гитарой»), ИИ сравнивает этот текст с множеством фотографий, которые он видел до этого, и создает нечто совершенно новое.

Я протестирую 3 популярных модели с 2 промтами: простым и сложным. Запросы будут на английском языке для лучшей генерации. Их всегда можно перевести через переводчик.

Простой запрос

Для короткого и простого промта я буду использовать следующий: «bustling market» (оживленный рынок).

Начнем с FluxDev, который был разработан Black Forest Labs. Эта модель была разработана для генерации картинок высокого качества из текстового описания. Она известна своей эффективностью и возможностью обрабатывать сложные запросы. Можно использовать модель по некоммерческой лицензии, что делает ее доступным для широкого круга творческих и технических специалистов.

Я буду использовать сайт Segmind. Зарегистрируйтесь и затем спуститесь немного ниже. Здесь можно вставить ваш промт и сгенерировать картинку.

Обратите внимание на расширенные настройки. Я изменил соотношение сторон и формат изображения. Генерация заняла 11 секунд.

Следующая модель — Stable DIffusion. Она создана Stability AI и представляет собой мощную модель преобразования текста в изображение. StableDIffusion широко используется в различных приложениях, включая искусство, дизайн, исследования и другие. Модель имеет открытый исходный код, поэтому доступна как для коммерческого, так и для некоммерческого использования.

Я буду тестировать модель на бесплатном сайте Perhance. Перейдите на него и вставьте свой промт. Тут можно выбрать стиль и количество генерируемых изображений. Нажмите на кнопку «Generate» (сгенерировать).

Генерация трех фотографий заняла около минуты. Для скачивания картинки нажмите на значок сердца и затем на «save to your device» (сохранить на ваше устройство).

Последняя модель — RealVisXL V5.0. Это усовершенствованная модель искусственного интеллекта, предназначенная для создания высококачественных реалистичных изображений из текста. Она также известна своей эффективностью. Особенность в том, что она подходит как для быстрых, так и для медленных компьютеров и настоятельно рекомендуется для создания искусства с помощью ИИ.

Перейдите на сайт Civitai, где модель можно использовать бесплатно. Интерфейс сайта немного перегружен. Для начала нажмите на кнопку «Sign in» (зарегистрироваться) и выберите удобный для вас способ.

После этого нажмите на кнопку «Create» (создать). В левой части сайта появится дополнительное окно, где вы можете настроить все для генерации. Напишите промт и нажмите на кнопку «Generate» (сгенерировать). Это будет стоить вам немного внутренней энергии.

Разверните окно для просмотра генерации изображений.

Создание изображений заняло 2-3 минуты. Я получил две фотографии. Выберите необходимую и нажмите на нее.

Затем нажмите на три точки и «Open in New Tab» (открыть в новом окне). Теперь можно скачать изображение с помощью браузера.

Давайте сравним все три фотографии.

Первая модель дала мне самое атмосферное и реалистичное изображение людей. Это напомнило мне зимний вечер в европейском стиле. Само изображение немного тусклое, но, думаю, это придает ему больше очарования.

Вторая модель более яркая и сглаженная. Люди на картинке не так детализированы и выглядят немного ненастоящими. В то же время атмосфера рынка оживленная: фрукты и овощи выглядят действительно аппетитно.

Третья модель дала наиболее подходящее изображение для этого промта. Переполненный рынок с множеством небольших палаток с едой и людьми с тележками. На первый взгляд изображение выглядит как настоящая фотография. Однако в некоторых местах люди плохо сгенерированы: странные лица и конечности.

Детализированный промт

Следующий промт более детализированный, я сгенерировал его с помощью другого ИИ чатбота: «A peaceful Japanese garden, with a koi pond, a wooden bridge, cherry blossoms in full bloom, and a traditional tea house in the background, all set against a backdrop of serenity, captured during the golden hour» (тихий японский сад с прудом, в котором плавают карпы, деревянным мостиком, цветущей сакурой и традиционным чайным домиком на заднем плане — все это на фоне безмятежности, запечатленной в золотой час).

FluxDev снова создал изображение за 11 секунд.

Stable DIffusion сгенерировал три фотографии примерно за минуту.

RealVisXL V5.0 создавал два изображения около двух минут.

Сравнивая результаты, я могу сказать, что более подробный промт позволяет получить более качественную картинку в каждой модели. FluxDev меня удивил: изображение выглядит как настоящая фотография высокого качества. Достаточно яркое изображение с деталями в каждом углу.

Stable Diffusion показаль себя лучше, чем в предыдущий раз. Однако картинка все равно получается немного тускловатой и сглаженной — могу сказать, что она сгенерирована на все сто процентов. Если не обращать на это внимания, то детали проработаны очень хорошо: например, отражение чайного домика в воде очень реалистично

RealVisXL V5.0 дает очень похожий результат с FluxDev. Множество маленьких деревьев в японском стиле придают изображению особую атмосферу. Могу только сказать, что изображение совсем немного сглаженное.

Сравнение

Я попробовал все модели в разных ситуациях и сгенерировал большое количество изображений. Теперь давайте сравним их.

Можете выбрать модель для генерации изображений на основе моего тестирования. Для своих проектов я безусловно выберу FluxDev, потому что он довольно универсальный для генерации реалистичных фотографий.

Скоро Новый год, поэтому кто ищет подарок, советую посмотреть эти подборки товаров:

Изображение в превью:
Автор: FluxDev, Stable Diffusion, RealVisXL
Источник: www.ixbt.com

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Как 1280 человек породили все население Земли: история изоляции гоминин, которую приняли за вымирание

Сегодня численность нашего вида превышает восемь миллиардов особей. Мы занимаем все доступные экологические ниши, контролируем ресурсы планеты и физически меняем ее ландшафт. С точки зрения...

А что, если у темной материи два состояния? Как новая гипотеза объясняет гамма-аномалию Млечного Пути

Астрофизические наблюдения показывают, что эта темная материя составляет около 85% всей материи во Вселенной. Она не излучает свет, не отражает его и не участвует в электромагнитном взаимодействии,...

Обзор проектора FlixTone D9W Ultra: справится даже днем!

Мир мультимедийных проекторов постоянно пополняется новыми моделями и относительно недавно небольшой китайский бренд FlixTone представил 3 модели: D9W Mini, D9W Ultra и D10s. Все они отличаются...

Плавающие города Филиппин: почему народ Баджо веками живет на воде и боится только пиратов

Города на воде раньше казались лишь элементом научной фантастики на страницах книг и сценариев блокбастеров. Но сейчас, со скачком технологий и поднятием уровня моря, Южная Корея официально...

Мощный, со складной трубкой и циклоном: обзор аккумуляторного пылесоса Redkey F11

На рынке устройств для уборки уже много проверенных решений. Например, для самой качественной уборки без потери мощности, должна быть реализована система циклонной фильтрации, для уборки под...

Выбираем смартфон за 10-20 тысяч рублей весной 2026 года: каждому по потребности

В сегодняшней подборке я покажу вам несколько смартфонов в ценовом диапазоне «10-20 тысяч рублей». Эти модели призваны опровергнуть стереотип о том, что в бюджетном классе сложно смартфон с...