Бесплатные нейросети для создания изображений: пробую популярные ИИ

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Мнение | ИИ, сервисы и приложения

Существует множество популярных моделей для генерации изображений. Можно создавать картинки в разных стилях: реалистичные, в стиле аниме, высококачественные, фото в старом стиле и многие другие. Некоторые из этих моделей бесплатны, а за некоторые нужно заплатить.

В этой статье я протестирую самые популярные с лучшими отзывами. Все они бесплатны для использования, но с некоторыми ограничениями. Давайте приступим к обзору.

Обложка была сгенерирована с помощью нейросети
Автор: FluxDev, Stable Diffusion, RealVisXL

Как ИИ генерирует картинки

Искусственный интеллект использует методы глубокого обучения для создания изображений. Модели обучаются на больших наборах данных, анализируя закономерности и статистические взаимосвязи между пикселями и их окружением. Основываясь на этой информации, модель может создавать новые изображения из входных данных, например, текстового описания.

Другими словами, ИИ натренирован на миллионах картинок. Когда вы пишите ему промт (например, «собака с гитарой»), ИИ сравнивает этот текст с множеством фотографий, которые он видел до этого, и создает нечто совершенно новое.

Я протестирую 3 популярных модели с 2 промтами: простым и сложным. Запросы будут на английском языке для лучшей генерации. Их всегда можно перевести через переводчик.

Простой запрос

Для короткого и простого промта я буду использовать следующий: «bustling market» (оживленный рынок).

Начнем с FluxDev, который был разработан Black Forest Labs. Эта модель была разработана для генерации картинок высокого качества из текстового описания. Она известна своей эффективностью и возможностью обрабатывать сложные запросы. Можно использовать модель по некоммерческой лицензии, что делает ее доступным для широкого круга творческих и технических специалистов.

Я буду использовать сайт Segmind. Зарегистрируйтесь и затем спуститесь немного ниже. Здесь можно вставить ваш промт и сгенерировать картинку.

Обратите внимание на расширенные настройки. Я изменил соотношение сторон и формат изображения. Генерация заняла 11 секунд.

Следующая модель — Stable DIffusion. Она создана Stability AI и представляет собой мощную модель преобразования текста в изображение. StableDIffusion широко используется в различных приложениях, включая искусство, дизайн, исследования и другие. Модель имеет открытый исходный код, поэтому доступна как для коммерческого, так и для некоммерческого использования.

Я буду тестировать модель на бесплатном сайте Perhance. Перейдите на него и вставьте свой промт. Тут можно выбрать стиль и количество генерируемых изображений. Нажмите на кнопку «Generate» (сгенерировать).

Генерация трех фотографий заняла около минуты. Для скачивания картинки нажмите на значок сердца и затем на «save to your device» (сохранить на ваше устройство).

Последняя модель — RealVisXL V5.0. Это усовершенствованная модель искусственного интеллекта, предназначенная для создания высококачественных реалистичных изображений из текста. Она также известна своей эффективностью. Особенность в том, что она подходит как для быстрых, так и для медленных компьютеров и настоятельно рекомендуется для создания искусства с помощью ИИ.

Перейдите на сайт Civitai, где модель можно использовать бесплатно. Интерфейс сайта немного перегружен. Для начала нажмите на кнопку «Sign in» (зарегистрироваться) и выберите удобный для вас способ.

После этого нажмите на кнопку «Create» (создать). В левой части сайта появится дополнительное окно, где вы можете настроить все для генерации. Напишите промт и нажмите на кнопку «Generate» (сгенерировать). Это будет стоить вам немного внутренней энергии.

Разверните окно для просмотра генерации изображений.

Создание изображений заняло 2-3 минуты. Я получил две фотографии. Выберите необходимую и нажмите на нее.

Затем нажмите на три точки и «Open in New Tab» (открыть в новом окне). Теперь можно скачать изображение с помощью браузера.

Давайте сравним все три фотографии.

Первая модель дала мне самое атмосферное и реалистичное изображение людей. Это напомнило мне зимний вечер в европейском стиле. Само изображение немного тусклое, но, думаю, это придает ему больше очарования.

Вторая модель более яркая и сглаженная. Люди на картинке не так детализированы и выглядят немного ненастоящими. В то же время атмосфера рынка оживленная: фрукты и овощи выглядят действительно аппетитно.

Третья модель дала наиболее подходящее изображение для этого промта. Переполненный рынок с множеством небольших палаток с едой и людьми с тележками. На первый взгляд изображение выглядит как настоящая фотография. Однако в некоторых местах люди плохо сгенерированы: странные лица и конечности.

Детализированный промт

Следующий промт более детализированный, я сгенерировал его с помощью другого ИИ чатбота: «A peaceful Japanese garden, with a koi pond, a wooden bridge, cherry blossoms in full bloom, and a traditional tea house in the background, all set against a backdrop of serenity, captured during the golden hour» (тихий японский сад с прудом, в котором плавают карпы, деревянным мостиком, цветущей сакурой и традиционным чайным домиком на заднем плане — все это на фоне безмятежности, запечатленной в золотой час).

FluxDev снова создал изображение за 11 секунд.

Stable DIffusion сгенерировал три фотографии примерно за минуту.

RealVisXL V5.0 создавал два изображения около двух минут.

Сравнивая результаты, я могу сказать, что более подробный промт позволяет получить более качественную картинку в каждой модели. FluxDev меня удивил: изображение выглядит как настоящая фотография высокого качества. Достаточно яркое изображение с деталями в каждом углу.

Stable Diffusion показаль себя лучше, чем в предыдущий раз. Однако картинка все равно получается немного тускловатой и сглаженной — могу сказать, что она сгенерирована на все сто процентов. Если не обращать на это внимания, то детали проработаны очень хорошо: например, отражение чайного домика в воде очень реалистично

RealVisXL V5.0 дает очень похожий результат с FluxDev. Множество маленьких деревьев в японском стиле придают изображению особую атмосферу. Могу только сказать, что изображение совсем немного сглаженное.

Сравнение

Я попробовал все модели в разных ситуациях и сгенерировал большое количество изображений. Теперь давайте сравним их.

Можете выбрать модель для генерации изображений на основе моего тестирования. Для своих проектов я безусловно выберу FluxDev, потому что он довольно универсальный для генерации реалистичных фотографий.

Скоро Новый год, поэтому кто ищет подарок, советую посмотреть эти подборки товаров:

Изображение в превью:
Автор: FluxDev, Stable Diffusion, RealVisXL
Источник: www.ixbt.com

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Высокие концентрации никеля в породах Марса указывают на возможные следы жизни: как это проверят?

В процессе формирования планет земной группы происходит разделение химических элементов по их массе. Когда молодая планета находится в расплавленном состоянии, наиболее тяжелые...

Блики от неизвестных объектов на орбите найдены на фото докосмической эры: что это может быть?

До 4 октября 1957 года, когда на околоземную орбиту был выведен первый искусственный аппарат «Спутник-1», космическое пространство вокруг нашей планеты должно было оставаться абсолютно пустым....

Самое большое природное зеркало в мире: солончак Уюни

Мечтали пройтись по облакам? В таком случае самое время собирать чемоданы и строить маршрут в Боливию. Ведь именно здесь раскинулось огромное зеркало, сотворенное самой природой. В сезон дождей...

С каждым годом мы произносим на 120 000 слов меньше: как автоматизация быта лишает нас живого общения

Современная жизнь в крупных городах выстроена так, чтобы свести к минимуму необходимость общения с посторонними людьми. Технологии избавили нас от множества мелких бытовых разговоров. Чтобы...

Обзор бюджетного лазерного дальномера MiLESEEY S2

При проведении ремонта или заказе мебели приходится делать множество замеров, включая труднодоступные места. Сегодня рассмотрим компактный лазерный дальномер MiLESEEY S2. Это недорогой и лёгкий...