Бесплатные нейросети для создания изображений: пробую популярные ИИ

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Мнение | ИИ, сервисы и приложения

Существует множество популярных моделей для генерации изображений. Можно создавать картинки в разных стилях: реалистичные, в стиле аниме, высококачественные, фото в старом стиле и многие другие. Некоторые из этих моделей бесплатны, а за некоторые нужно заплатить.

В этой статье я протестирую самые популярные с лучшими отзывами. Все они бесплатны для использования, но с некоторыми ограничениями. Давайте приступим к обзору.

Обложка была сгенерирована с помощью нейросети
Автор: FluxDev, Stable Diffusion, RealVisXL

Как ИИ генерирует картинки

Искусственный интеллект использует методы глубокого обучения для создания изображений. Модели обучаются на больших наборах данных, анализируя закономерности и статистические взаимосвязи между пикселями и их окружением. Основываясь на этой информации, модель может создавать новые изображения из входных данных, например, текстового описания.

Другими словами, ИИ натренирован на миллионах картинок. Когда вы пишите ему промт (например, «собака с гитарой»), ИИ сравнивает этот текст с множеством фотографий, которые он видел до этого, и создает нечто совершенно новое.

Я протестирую 3 популярных модели с 2 промтами: простым и сложным. Запросы будут на английском языке для лучшей генерации. Их всегда можно перевести через переводчик.

Простой запрос

Для короткого и простого промта я буду использовать следующий: «bustling market» (оживленный рынок).

Начнем с FluxDev, который был разработан Black Forest Labs. Эта модель была разработана для генерации картинок высокого качества из текстового описания. Она известна своей эффективностью и возможностью обрабатывать сложные запросы. Можно использовать модель по некоммерческой лицензии, что делает ее доступным для широкого круга творческих и технических специалистов.

Я буду использовать сайт Segmind. Зарегистрируйтесь и затем спуститесь немного ниже. Здесь можно вставить ваш промт и сгенерировать картинку.

Обратите внимание на расширенные настройки. Я изменил соотношение сторон и формат изображения. Генерация заняла 11 секунд.

Следующая модель — Stable DIffusion. Она создана Stability AI и представляет собой мощную модель преобразования текста в изображение. StableDIffusion широко используется в различных приложениях, включая искусство, дизайн, исследования и другие. Модель имеет открытый исходный код, поэтому доступна как для коммерческого, так и для некоммерческого использования.

Я буду тестировать модель на бесплатном сайте Perhance. Перейдите на него и вставьте свой промт. Тут можно выбрать стиль и количество генерируемых изображений. Нажмите на кнопку «Generate» (сгенерировать).

Генерация трех фотографий заняла около минуты. Для скачивания картинки нажмите на значок сердца и затем на «save to your device» (сохранить на ваше устройство).

Последняя модель — RealVisXL V5.0. Это усовершенствованная модель искусственного интеллекта, предназначенная для создания высококачественных реалистичных изображений из текста. Она также известна своей эффективностью. Особенность в том, что она подходит как для быстрых, так и для медленных компьютеров и настоятельно рекомендуется для создания искусства с помощью ИИ.

Перейдите на сайт Civitai, где модель можно использовать бесплатно. Интерфейс сайта немного перегружен. Для начала нажмите на кнопку «Sign in» (зарегистрироваться) и выберите удобный для вас способ.

После этого нажмите на кнопку «Create» (создать). В левой части сайта появится дополнительное окно, где вы можете настроить все для генерации. Напишите промт и нажмите на кнопку «Generate» (сгенерировать). Это будет стоить вам немного внутренней энергии.

Разверните окно для просмотра генерации изображений.

Создание изображений заняло 2-3 минуты. Я получил две фотографии. Выберите необходимую и нажмите на нее.

Затем нажмите на три точки и «Open in New Tab» (открыть в новом окне). Теперь можно скачать изображение с помощью браузера.

Давайте сравним все три фотографии.

Первая модель дала мне самое атмосферное и реалистичное изображение людей. Это напомнило мне зимний вечер в европейском стиле. Само изображение немного тусклое, но, думаю, это придает ему больше очарования.

Вторая модель более яркая и сглаженная. Люди на картинке не так детализированы и выглядят немного ненастоящими. В то же время атмосфера рынка оживленная: фрукты и овощи выглядят действительно аппетитно.

Третья модель дала наиболее подходящее изображение для этого промта. Переполненный рынок с множеством небольших палаток с едой и людьми с тележками. На первый взгляд изображение выглядит как настоящая фотография. Однако в некоторых местах люди плохо сгенерированы: странные лица и конечности.

Детализированный промт

Следующий промт более детализированный, я сгенерировал его с помощью другого ИИ чатбота: «A peaceful Japanese garden, with a koi pond, a wooden bridge, cherry blossoms in full bloom, and a traditional tea house in the background, all set against a backdrop of serenity, captured during the golden hour» (тихий японский сад с прудом, в котором плавают карпы, деревянным мостиком, цветущей сакурой и традиционным чайным домиком на заднем плане — все это на фоне безмятежности, запечатленной в золотой час).

FluxDev снова создал изображение за 11 секунд.

Stable DIffusion сгенерировал три фотографии примерно за минуту.

RealVisXL V5.0 создавал два изображения около двух минут.

Сравнивая результаты, я могу сказать, что более подробный промт позволяет получить более качественную картинку в каждой модели. FluxDev меня удивил: изображение выглядит как настоящая фотография высокого качества. Достаточно яркое изображение с деталями в каждом углу.

Stable Diffusion показаль себя лучше, чем в предыдущий раз. Однако картинка все равно получается немного тускловатой и сглаженной — могу сказать, что она сгенерирована на все сто процентов. Если не обращать на это внимания, то детали проработаны очень хорошо: например, отражение чайного домика в воде очень реалистично

RealVisXL V5.0 дает очень похожий результат с FluxDev. Множество маленьких деревьев в японском стиле придают изображению особую атмосферу. Могу только сказать, что изображение совсем немного сглаженное.

Сравнение

Я попробовал все модели в разных ситуациях и сгенерировал большое количество изображений. Теперь давайте сравним их.

Можете выбрать модель для генерации изображений на основе моего тестирования. Для своих проектов я безусловно выберу FluxDev, потому что он довольно универсальный для генерации реалистичных фотографий.

Скоро Новый год, поэтому кто ищет подарок, советую посмотреть эти подборки товаров:

Изображение в превью:
Автор: FluxDev, Stable Diffusion, RealVisXL
Источник: www.ixbt.com

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Каньон Антилопы: почему он самый извилистый и фотогеничный в мире

В Аризоне, на землях индейцев навахо, находится место, любимое фотографами со всего мира. Каньон Антилопы вы наверняка хоть раз видели на заставке своего компьютера. Microsoft вносила его виды в...

Почему кофе и чай бодрят: взгляд с точки зрения науки

Вы когда-нибудь замечали, что после чашки кофе фокусировка внимания резко обостряется, но уже через полчаса ясность мысли начинает неумолимо угасать? Эти «американские горки» связаны с конкретными...

Как гора выше Эвереста остаётся невидимой: 75% высоты Мауна-Кеа скрыто океаном

Говоря о горных вершинах, достигающих наибольших высот, невозможно не вспомнить об Эвересте. Эта гора возносится в небо на 8848 метров над уровнем моря, и этот рекорд закреплён в школьных учебниках...

Почему на Кубе так мало машин новых моделей, хотя страна в Карибском бассейне с развитым туристическим потоком

Улицы Гаваны и других кубинских городов напоминают живой музей на колесах. Яркие американские автомобили 1950-х годов соседствуют с советскими «Жигулями», «Москвичами» и редкими современными...

Быстро заряжает смартфоны Xiaomi. Обзор пауэрбанка Ugreen 55W PB727

Пауэрбанк Ugreen модели PB727 — компактный внешний аккумулятор с ёмкостью встроенного аккумулятора 10 000 мА·ч. Устройство поддерживает популярные протоколы быстрой зарядки, в том числе...