Бесплатные нейросети для создания изображений: пробую популярные ИИ

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com

12 декабря 2024, 12:38 | Мнение | ИИ, сервисы и приложения

Существует множество популярных моделей для генерации изображений. Можно создавать картинки в разных стилях: реалистичные, в стиле аниме, высококачественные, фото в старом стиле и многие другие. Некоторые из этих моделей бесплатны, а за некоторые нужно заплатить.

В этой статье я протестирую самые популярные с лучшими отзывами. Все они бесплатны для использования, но с некоторыми ограничениями. Давайте приступим к обзору.

Обложка была сгенерирована с помощью нейросети
Автор: FluxDev, Stable Diffusion, RealVisXL

Как ИИ генерирует картинки

Искусственный интеллект использует методы глубокого обучения для создания изображений. Модели обучаются на больших наборах данных, анализируя закономерности и статистические взаимосвязи между пикселями и их окружением. Основываясь на этой информации, модель может создавать новые изображения из входных данных, например, текстового описания.

Другими словами, ИИ натренирован на миллионах картинок. Когда вы пишите ему промт (например, «собака с гитарой»), ИИ сравнивает этот текст с множеством фотографий, которые он видел до этого, и создает нечто совершенно новое.

Я протестирую 3 популярных модели с 2 промтами: простым и сложным. Запросы будут на английском языке для лучшей генерации. Их всегда можно перевести через переводчик.

Простой запрос

Для короткого и простого промта я буду использовать следующий: «bustling market» (оживленный рынок).

Начнем с FluxDev, который был разработан Black Forest Labs. Эта модель была разработана для генерации картинок высокого качества из текстового описания. Она известна своей эффективностью и возможностью обрабатывать сложные запросы. Можно использовать модель по некоммерческой лицензии, что делает ее доступным для широкого круга творческих и технических специалистов.

Я буду использовать сайт Segmind. Зарегистрируйтесь и затем спуститесь немного ниже. Здесь можно вставить ваш промт и сгенерировать картинку.

Обратите внимание на расширенные настройки. Я изменил соотношение сторон и формат изображения. Генерация заняла 11 секунд.

Следующая модель — Stable DIffusion. Она создана Stability AI и представляет собой мощную модель преобразования текста в изображение. StableDIffusion широко используется в различных приложениях, включая искусство, дизайн, исследования и другие. Модель имеет открытый исходный код, поэтому доступна как для коммерческого, так и для некоммерческого использования.

Я буду тестировать модель на бесплатном сайте Perhance. Перейдите на него и вставьте свой промт. Тут можно выбрать стиль и количество генерируемых изображений. Нажмите на кнопку «Generate» (сгенерировать).

Генерация трех фотографий заняла около минуты. Для скачивания картинки нажмите на значок сердца и затем на «save to your device» (сохранить на ваше устройство).

Последняя модель — RealVisXL V5.0. Это усовершенствованная модель искусственного интеллекта, предназначенная для создания высококачественных реалистичных изображений из текста. Она также известна своей эффективностью. Особенность в том, что она подходит как для быстрых, так и для медленных компьютеров и настоятельно рекомендуется для создания искусства с помощью ИИ.

Перейдите на сайт Civitai, где модель можно использовать бесплатно. Интерфейс сайта немного перегружен. Для начала нажмите на кнопку «Sign in» (зарегистрироваться) и выберите удобный для вас способ.

После этого нажмите на кнопку «Create» (создать). В левой части сайта появится дополнительное окно, где вы можете настроить все для генерации. Напишите промт и нажмите на кнопку «Generate» (сгенерировать). Это будет стоить вам немного внутренней энергии.

Разверните окно для просмотра генерации изображений.

Создание изображений заняло 2-3 минуты. Я получил две фотографии. Выберите необходимую и нажмите на нее.

Затем нажмите на три точки и «Open in New Tab» (открыть в новом окне). Теперь можно скачать изображение с помощью браузера.

Давайте сравним все три фотографии.

Первая модель дала мне самое атмосферное и реалистичное изображение людей. Это напомнило мне зимний вечер в европейском стиле. Само изображение немного тусклое, но, думаю, это придает ему больше очарования.

Вторая модель более яркая и сглаженная. Люди на картинке не так детализированы и выглядят немного ненастоящими. В то же время атмосфера рынка оживленная: фрукты и овощи выглядят действительно аппетитно.

Третья модель дала наиболее подходящее изображение для этого промта. Переполненный рынок с множеством небольших палаток с едой и людьми с тележками. На первый взгляд изображение выглядит как настоящая фотография. Однако в некоторых местах люди плохо сгенерированы: странные лица и конечности.

Детализированный промт

Следующий промт более детализированный, я сгенерировал его с помощью другого ИИ чатбота: «A peaceful Japanese garden, with a koi pond, a wooden bridge, cherry blossoms in full bloom, and a traditional tea house in the background, all set against a backdrop of serenity, captured during the golden hour» (тихий японский сад с прудом, в котором плавают карпы, деревянным мостиком, цветущей сакурой и традиционным чайным домиком на заднем плане — все это на фоне безмятежности, запечатленной в золотой час).

FluxDev снова создал изображение за 11 секунд.

Stable DIffusion сгенерировал три фотографии примерно за минуту.

RealVisXL V5.0 создавал два изображения около двух минут.

Сравнивая результаты, я могу сказать, что более подробный промт позволяет получить более качественную картинку в каждой модели. FluxDev меня удивил: изображение выглядит как настоящая фотография высокого качества. Достаточно яркое изображение с деталями в каждом углу.

Stable Diffusion показаль себя лучше, чем в предыдущий раз. Однако картинка все равно получается немного тускловатой и сглаженной — могу сказать, что она сгенерирована на все сто процентов. Если не обращать на это внимания, то детали проработаны очень хорошо: например, отражение чайного домика в воде очень реалистично

RealVisXL V5.0 дает очень похожий результат с FluxDev. Множество маленьких деревьев в японском стиле придают изображению особую атмосферу. Могу только сказать, что изображение совсем немного сглаженное.

Сравнение

Я попробовал все модели в разных ситуациях и сгенерировал большое количество изображений. Теперь давайте сравним их.

Можете выбрать модель для генерации изображений на основе моего тестирования. Для своих проектов я безусловно выберу FluxDev, потому что он довольно универсальный для генерации реалистичных фотографий.

Скоро Новый год, поэтому кто ищет подарок, советую посмотреть эти подборки товаров:

У кого есть машина — 10 регистраторов с радар-детектором.
Кто хочет автоматизировать уборку — 10 роботов-пылесосов со станцией самоочистки.
Недорогой подарок найти можно тут — 5 недорогих брелков.

Изображение в превью:

Автор: FluxDev, Stable Diffusion, RealVisXL
Источник: www.ixbt.com

Бесплатные нейросети для создания изображений: пробую популярные ИИ

Содержание

Как ИИ генерирует картинки

Простой запрос

Детализированный промт

Сравнение

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Разработан браслет для беспроводного управления роботами с помощью жестов

Xiaomi 18 Pro Max получит аккумулятор на 8500 мАч

Россия переносит запуск «Спектр-М» на 2036 год: проект усилили — что изменилось

Хлебные отходы превратили в источник водородного топлива

Австралийские ученые воссоздали условия зарождения жизни на древней Земле

Публикации

Обзор TWS наушников HAYLOU Flowbuds N55 с адаптивным шумоподавлением и автономностью до 40 часов

Б-44 «Жучок»: фонарик из советского прошлого, которому не нужны ни батарейки, ни аккумулятор, ни зарядка

Что поразило Леонардо да Винчи: невероятный язык дятла, скрытый вокруг черепа

Экспедиция Polarstern открыла новый остров в Антарктике: почему его до сих пор не было на морских картах?

Можно ли занять заброшенный дом или дачу

Как 1280 человек породили все население Земли: история изоляции гоминин, которую приняли за вымирание