Бесплатные нейросети для создания изображений: пробую популярные ИИ
Существует множество популярных моделей для генерации изображений. Можно создавать картинки в разных стилях: реалистичные, в стиле аниме, высококачественные, фото в старом стиле и многие другие. Некоторые из этих моделей бесплатны, а за некоторые нужно заплатить.
В этой статье я протестирую самые популярные с лучшими отзывами. Все они бесплатны для использования, но с некоторыми ограничениями. Давайте приступим к обзору.
Как ИИ генерирует картинки
Искусственный интеллект использует методы глубокого обучения для создания изображений. Модели обучаются на больших наборах данных, анализируя закономерности и статистические взаимосвязи между пикселями и их окружением. Основываясь на этой информации, модель может создавать новые изображения из входных данных, например, текстового описания.
Другими словами, ИИ натренирован на миллионах картинок. Когда вы пишите ему промт (например, «собака с гитарой»), ИИ сравнивает этот текст с множеством фотографий, которые он видел до этого, и создает нечто совершенно новое.
Я протестирую 3 популярных модели с 2 промтами: простым и сложным. Запросы будут на английском языке для лучшей генерации. Их всегда можно перевести через переводчик.
Простой запрос
Для короткого и простого промта я буду использовать следующий: «bustling market» (оживленный рынок).
Начнем с FluxDev, который был разработан Black Forest Labs. Эта модель была разработана для генерации картинок высокого качества из текстового описания. Она известна своей эффективностью и возможностью обрабатывать сложные запросы. Можно использовать модель по некоммерческой лицензии, что делает ее доступным для широкого круга творческих и технических специалистов.
Я буду использовать сайт Segmind. Зарегистрируйтесь и затем спуститесь немного ниже. Здесь можно вставить ваш промт и сгенерировать картинку.
Обратите внимание на расширенные настройки. Я изменил соотношение сторон и формат изображения. Генерация заняла 11 секунд.
Следующая модель — Stable DIffusion. Она создана Stability AI и представляет собой мощную модель преобразования текста в изображение. StableDIffusion широко используется в различных приложениях, включая искусство, дизайн, исследования и другие. Модель имеет открытый исходный код, поэтому доступна как для коммерческого, так и для некоммерческого использования.
Я буду тестировать модель на бесплатном сайте Perhance. Перейдите на него и вставьте свой промт. Тут можно выбрать стиль и количество генерируемых изображений. Нажмите на кнопку «Generate» (сгенерировать).
Генерация трех фотографий заняла около минуты. Для скачивания картинки нажмите на значок сердца и затем на «save to your device» (сохранить на ваше устройство).
Последняя модель — RealVisXL V5.0. Это усовершенствованная модель искусственного интеллекта, предназначенная для создания высококачественных реалистичных изображений из текста. Она также известна своей эффективностью. Особенность в том, что она подходит как для быстрых, так и для медленных компьютеров и настоятельно рекомендуется для создания искусства с помощью ИИ.
Перейдите на сайт Civitai, где модель можно использовать бесплатно. Интерфейс сайта немного перегружен. Для начала нажмите на кнопку «Sign in» (зарегистрироваться) и выберите удобный для вас способ.
После этого нажмите на кнопку «Create» (создать). В левой части сайта появится дополнительное окно, где вы можете настроить все для генерации. Напишите промт и нажмите на кнопку «Generate» (сгенерировать). Это будет стоить вам немного внутренней энергии.
Разверните окно для просмотра генерации изображений.
Создание изображений заняло 2-3 минуты. Я получил две фотографии. Выберите необходимую и нажмите на нее.
Затем нажмите на три точки и «Open in New Tab» (открыть в новом окне). Теперь можно скачать изображение с помощью браузера.
Давайте сравним все три фотографии.
Первая модель дала мне самое атмосферное и реалистичное изображение людей. Это напомнило мне зимний вечер в европейском стиле. Само изображение немного тусклое, но, думаю, это придает ему больше очарования.
Вторая модель более яркая и сглаженная. Люди на картинке не так детализированы и выглядят немного ненастоящими. В то же время атмосфера рынка оживленная: фрукты и овощи выглядят действительно аппетитно.
Третья модель дала наиболее подходящее изображение для этого промта. Переполненный рынок с множеством небольших палаток с едой и людьми с тележками. На первый взгляд изображение выглядит как настоящая фотография. Однако в некоторых местах люди плохо сгенерированы: странные лица и конечности.
Детализированный промт
Следующий промт более детализированный, я сгенерировал его с помощью другого ИИ чатбота: «A peaceful Japanese garden, with a koi pond, a wooden bridge, cherry blossoms in full bloom, and a traditional tea house in the background, all set against a backdrop of serenity, captured during the golden hour» (тихий японский сад с прудом, в котором плавают карпы, деревянным мостиком, цветущей сакурой и традиционным чайным домиком на заднем плане — все это на фоне безмятежности, запечатленной в золотой час).
FluxDev снова создал изображение за 11 секунд.
Stable DIffusion сгенерировал три фотографии примерно за минуту.
RealVisXL V5.0 создавал два изображения около двух минут.
Сравнивая результаты, я могу сказать, что более подробный промт позволяет получить более качественную картинку в каждой модели. FluxDev меня удивил: изображение выглядит как настоящая фотография высокого качества. Достаточно яркое изображение с деталями в каждом углу.
Stable Diffusion показаль себя лучше, чем в предыдущий раз. Однако картинка все равно получается немного тускловатой и сглаженной — могу сказать, что она сгенерирована на все сто процентов. Если не обращать на это внимания, то детали проработаны очень хорошо: например, отражение чайного домика в воде очень реалистично
RealVisXL V5.0 дает очень похожий результат с FluxDev. Множество маленьких деревьев в японском стиле придают изображению особую атмосферу. Могу только сказать, что изображение совсем немного сглаженное.
Сравнение
Я попробовал все модели в разных ситуациях и сгенерировал большое количество изображений. Теперь давайте сравним их.
Можете выбрать модель для генерации изображений на основе моего тестирования. Для своих проектов я безусловно выберу FluxDev, потому что он довольно универсальный для генерации реалистичных фотографий.
Скоро Новый год, поэтому кто ищет подарок, советую посмотреть эти подборки товаров:
- У кого есть машина — 10 регистраторов с радар-детектором.
- Кто хочет автоматизировать уборку — 10 роботов-пылесосов со станцией самоочистки.
- Недорогой подарок найти можно тут — 5 недорогих брелков.
Источник: www.ixbt.com





0 комментариев
Добавить комментарий