Бесплатные нейросети для создания изображений: пробую популярные ИИ

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Мнение | ИИ, сервисы и приложения

Существует множество популярных моделей для генерации изображений. Можно создавать картинки в разных стилях: реалистичные, в стиле аниме, высококачественные, фото в старом стиле и многие другие. Некоторые из этих моделей бесплатны, а за некоторые нужно заплатить.

В этой статье я протестирую самые популярные с лучшими отзывами. Все они бесплатны для использования, но с некоторыми ограничениями. Давайте приступим к обзору.

Обложка была сгенерирована с помощью нейросети
Автор: FluxDev, Stable Diffusion, RealVisXL

Как ИИ генерирует картинки

Искусственный интеллект использует методы глубокого обучения для создания изображений. Модели обучаются на больших наборах данных, анализируя закономерности и статистические взаимосвязи между пикселями и их окружением. Основываясь на этой информации, модель может создавать новые изображения из входных данных, например, текстового описания.

Другими словами, ИИ натренирован на миллионах картинок. Когда вы пишите ему промт (например, «собака с гитарой»), ИИ сравнивает этот текст с множеством фотографий, которые он видел до этого, и создает нечто совершенно новое.

Я протестирую 3 популярных модели с 2 промтами: простым и сложным. Запросы будут на английском языке для лучшей генерации. Их всегда можно перевести через переводчик.

Простой запрос

Для короткого и простого промта я буду использовать следующий: «bustling market» (оживленный рынок).

Начнем с FluxDev, который был разработан Black Forest Labs. Эта модель была разработана для генерации картинок высокого качества из текстового описания. Она известна своей эффективностью и возможностью обрабатывать сложные запросы. Можно использовать модель по некоммерческой лицензии, что делает ее доступным для широкого круга творческих и технических специалистов.

Я буду использовать сайт Segmind. Зарегистрируйтесь и затем спуститесь немного ниже. Здесь можно вставить ваш промт и сгенерировать картинку.

Обратите внимание на расширенные настройки. Я изменил соотношение сторон и формат изображения. Генерация заняла 11 секунд.

Следующая модель — Stable DIffusion. Она создана Stability AI и представляет собой мощную модель преобразования текста в изображение. StableDIffusion широко используется в различных приложениях, включая искусство, дизайн, исследования и другие. Модель имеет открытый исходный код, поэтому доступна как для коммерческого, так и для некоммерческого использования.

Я буду тестировать модель на бесплатном сайте Perhance. Перейдите на него и вставьте свой промт. Тут можно выбрать стиль и количество генерируемых изображений. Нажмите на кнопку «Generate» (сгенерировать).

Генерация трех фотографий заняла около минуты. Для скачивания картинки нажмите на значок сердца и затем на «save to your device» (сохранить на ваше устройство).

Последняя модель — RealVisXL V5.0. Это усовершенствованная модель искусственного интеллекта, предназначенная для создания высококачественных реалистичных изображений из текста. Она также известна своей эффективностью. Особенность в том, что она подходит как для быстрых, так и для медленных компьютеров и настоятельно рекомендуется для создания искусства с помощью ИИ.

Перейдите на сайт Civitai, где модель можно использовать бесплатно. Интерфейс сайта немного перегружен. Для начала нажмите на кнопку «Sign in» (зарегистрироваться) и выберите удобный для вас способ.

После этого нажмите на кнопку «Create» (создать). В левой части сайта появится дополнительное окно, где вы можете настроить все для генерации. Напишите промт и нажмите на кнопку «Generate» (сгенерировать). Это будет стоить вам немного внутренней энергии.

Разверните окно для просмотра генерации изображений.

Создание изображений заняло 2-3 минуты. Я получил две фотографии. Выберите необходимую и нажмите на нее.

Затем нажмите на три точки и «Open in New Tab» (открыть в новом окне). Теперь можно скачать изображение с помощью браузера.

Давайте сравним все три фотографии.

Первая модель дала мне самое атмосферное и реалистичное изображение людей. Это напомнило мне зимний вечер в европейском стиле. Само изображение немного тусклое, но, думаю, это придает ему больше очарования.

Вторая модель более яркая и сглаженная. Люди на картинке не так детализированы и выглядят немного ненастоящими. В то же время атмосфера рынка оживленная: фрукты и овощи выглядят действительно аппетитно.

Третья модель дала наиболее подходящее изображение для этого промта. Переполненный рынок с множеством небольших палаток с едой и людьми с тележками. На первый взгляд изображение выглядит как настоящая фотография. Однако в некоторых местах люди плохо сгенерированы: странные лица и конечности.

Детализированный промт

Следующий промт более детализированный, я сгенерировал его с помощью другого ИИ чатбота: «A peaceful Japanese garden, with a koi pond, a wooden bridge, cherry blossoms in full bloom, and a traditional tea house in the background, all set against a backdrop of serenity, captured during the golden hour» (тихий японский сад с прудом, в котором плавают карпы, деревянным мостиком, цветущей сакурой и традиционным чайным домиком на заднем плане — все это на фоне безмятежности, запечатленной в золотой час).

FluxDev снова создал изображение за 11 секунд.

Stable DIffusion сгенерировал три фотографии примерно за минуту.

RealVisXL V5.0 создавал два изображения около двух минут.

Сравнивая результаты, я могу сказать, что более подробный промт позволяет получить более качественную картинку в каждой модели. FluxDev меня удивил: изображение выглядит как настоящая фотография высокого качества. Достаточно яркое изображение с деталями в каждом углу.

Stable Diffusion показаль себя лучше, чем в предыдущий раз. Однако картинка все равно получается немного тускловатой и сглаженной — могу сказать, что она сгенерирована на все сто процентов. Если не обращать на это внимания, то детали проработаны очень хорошо: например, отражение чайного домика в воде очень реалистично

RealVisXL V5.0 дает очень похожий результат с FluxDev. Множество маленьких деревьев в японском стиле придают изображению особую атмосферу. Могу только сказать, что изображение совсем немного сглаженное.

Сравнение

Я попробовал все модели в разных ситуациях и сгенерировал большое количество изображений. Теперь давайте сравним их.

Можете выбрать модель для генерации изображений на основе моего тестирования. Для своих проектов я безусловно выберу FluxDev, потому что он довольно универсальный для генерации реалистичных фотографий.

Скоро Новый год, поэтому кто ищет подарок, советую посмотреть эти подборки товаров:

Изображение в превью:
Автор: FluxDev, Stable Diffusion, RealVisXL
Источник: www.ixbt.com

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Обзор белоснежной клавиатуры A4Tech Fstyler FK20

Дорогие клавиатуры не всем по карману, но есть клавиатуры, которые стоят недорого и обладают хорошим качеством сборки, а также имеют стильный внешний вид. В данном обзоре мы рассмотрим бюджетную...

Независимые эксперименты окончательно опровергли утверждение об обнаружении тёмной материи на Земле

Около 27 процентов всей массы и энергии во Вселенной приходится на темную материю. Она не испускает света, не отражает его и не участвует в электромагнитном взаимодействии. Единственный способ,...

Закон Вурхиза: физики объяснили, почему обгонять медленные машины в городе абсолютно бессмысленно

Вы нажимаете на газ, резко перестраиваетесь и с чувством глубокого удовлетворения оставляете тихохода позади. Всего пара рискованных маневров — и вы выигрываете драгоценные секунды. Но...

Пещера Вайтомо: почему в ней запрещено использовать фонари и другие источники света

В изучении пещер фонарик: лучший друг, главный помощник и штатный спасатель от сотрясений мозга, вызванных падениями в темноте. Короче, без него в пещеру лучше не соваться, если вы не видите в...

Пять лет назад мы потеряли смартфоны LG: история падения главного конкурента Samsung

Когда-то давно эти смартфоны вовсю конкурировали с Samsung и занимали своё место в списке А-брендов. Именно они первыми предложили 2 ГБ оперативной памяти, вытянутый экран и ультраширик в качестве...