Нейросеть Dall-E рисует за меня и помогает экономить на художнике-иллюстраторе

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Обзор | ИИ, сервисы и приложения

Dall-E — нейросеть, как и ChatGPT. У них один создатель, но разные функции. Если ChatGPT про контент, редактуру и текст, то Dall-E — про иллюстрации. Она рисует в 3D, мультяшках, реализме, умеет копировать стили художников, выдавать трэш и сочетать то, что не сочетается. 

Все титульники к моим статьям на iXBT, включая этот, нарисовала Dall-E. А среди неопубликованных есть и шедевры, и полный отстой. Сейчас покажу.

Сгенерировано Dall-E. Запрос: «фото астронавта на луне, с холстом и в кепке художника, с космосом на фоне». Где моя кепка художника, Dall-E?!

Матчасть: запросы, ссылки и лимиты

Dall-E работает по запросам, на том же аккаунте, что ChatGPT, и у неё есть лимиты.  

Запросы. Запрос (по-английски 'promt') — это всё, что мы пишем в поле перед кнопкой «сгенерировать». Запрос — самое важное в работе с нейросетями. Проще запрос — точнее выдача.

Запросы можно писать на русском, но результаты выходят не очень. Если вбить ту же фразу в «Дипл», копировать английский перевод и скормить нейросети, получится сильно лучше. Работает и с Dall-E, и c ChatGPT.

Аккаунт и доступ. Заходите на сайт Dall-E и развлекайтесь, если регистрировались в ChatGPT, — у них общий аккаунт. Если ещё нет, вот подробный гайд с картинками, как зарегистрироваться из России.

Лимиты. Dall-E — «условно бесплатная» нейросеть. За регистрацию выдадут 50 кредитов и будут начислять по 15 каждый месяц. За каждое нажатие на кнопку «сгенерировать» сеть выдаст 4 изображения, но сожрёт 1 кредит. 

Когда кредиты закончатся, их придётся купить. 15 баксов — 115 кредитов. Больше купить можно, меньше нельзя.

Экономия: где можно, а где нет

Художники стоят по-разному: за одну иллюстрацию на «Кворке» берут от 500 (за что-то простенькое) до 30 000 рублей (за что-то большое, крутое и файлы в psd вышлют). Не смотрел все профили, но уверен: есть и дороже. 

В 2023 я не пойду к иллюстратору ради титульника в блог. С этим прекрасно справляется нейросеть. Но для профессиональных задач редактора Dall-E пока не годится. Сеть не задаёт уточняющие вопросы, не пытается понять цель и контекст, не разбирается в задаче детально и не предлагает решение лучше, чем написано в ТЗ, если ТЗ — дрянь.

И не ругается матом на «небо недостаточно синее». А надо бы. 

Клиент находит вас даже в космосе, чтобы завалить правочками

Картинки

Дед с костылём

Задумка к гайду, как запустить ChatGPT из России, была такая: раз способ костыльный, должен быть человек с костылём.

При первой генерации получилась фигня. Так я понял, что за стилем картинок нужно следить: просишь абстракцию — получи абстракцией в лицо.

Потом я решил: почему бы не сделать из абстрактного человечка кибер-деда с костылём. И на деда должен светить неон, киберпанк же.

Точные координаты зелёного оставил, и это снова смутило нейросеть. Зелёный она выдала. Но не тот.

У меня уже получился идеальный дед с костылём, но захотелось поиграться со стилями. В подсказке увидел: хотите высокое качество, пишите в запросе «диджитал арт». Написал.

Космонавт на лошади

В обзоре, где нейросеть написала за нас отклик в «Лайфхакер», титульник нашёлся быстро, но не сразу. Сначала я проверил, может ли Dall-E сделать картинку «до-после». Типа был плохой отклик, стал хороший. 

Получилось прикольно, но скучно по сравнению с кибер-дедом. А что не скучно почти всегда? Космонавты! 

Dall-E всегда создаёт квадраты 1024 на 1024, даже если запросить другой размер. Артём Горбунов учил: квадратные картинки — плохо. К счастью, если кликнуть на картинку, зайти в редактор на сайте и нажать F, Dall-E сможет нарисовать второй квадратик на основе первого.

Так получилось два космонавта: один принёс отклик, а второй этому очень рад.

3 правила dall-eшника

Я сделаю отдельную статью про функционал Dall-E, как всё попробую. Пока для себя записал 3 правила.

Автор не входит в состав редакции iXBT.com (подробнее »)
Об авторе

Меня зовут Ник. Рассказываю, как нейросети могут освободить от 90% рутины редакторов, копирайтеров, верстальщиков, блогеров и вообще всех, кто пишет по работе. 

В «Телеграме» — о том же, но короче, веселее и с матом: https://t.me/neuroredactor

8 комментариев

Добавить комментарий

For the Horde!
Вот это тоже интересно, и интересно, можно ли такие картинки в будущем позиционировать как NFT.
NikVorontsov
По идее, их и сейчас можно в NFT превратить
112313598258362415270@google
Как же dall-e плох. Почему не пользуешься нормальными нейросеть нейронками?
NikVorontsov
Потому что Dall-e был под рукой, а остальные пока не изучил. Но все впереди) кстати, можешь посоветовать какие-нибудь, кроме стейбла и midjourney?
248447271624@odnoklassniki
Зачем кроме? Их и надо использовать! Midjourney если надо концепт, но замарачиваться как установить где установить и тд не надо и сойдёт вариант который надо вручную доделать, если надо хороший результат с доработкой и на выходе иметь картинку, которую можно сразу использовать, то stable diffusion.
112313598258362415270@google
Пока ничего лучше их двух нет.
561109281@vkontakte
Интересно. А в сторону stable diffusion смотрели?
Плюс в том что можно локально на своем компе запускать (правда нужна мощная видюха). А так же есть много пользовательских моделей под разные задачи и возможность самому дорабатывать эти модели (обучать новые, объединять имеющиеся, обучать гиперсети и текстовые инверсии)
Ну и опенсорс всегда веселее какого-то закрытого онлайн-сервиса.
Сам вот развлекаюсь с ними. На RTX 4090 генерация 1 картинки 512x512 занимает одну секунду.
NikVorontsov
Смотрел. только руки пока не дошли поставить. Но дойдут обязательно)

Добавить комментарий

Сейчас на главной

Новости

Публикации

Как гигантское бетонное НЛО появилось на балканской горе

Если человек на полном серьезе рассуждает о существовании летающих тарелок, не спешите записывать его в сумасшедшие. Возможно, он просто когда-то входил в болгарскую коммунистическую партию и в...

20-полосные магистрали, по которым никто не ездит: где они находятся и для чего их построили

В наши дни пробки и перегруженные дороги уже стали обыденностью для большинства мегаполисов. Но в мире существуют и удивительные исключения. Огромные многополосные магистрали, рассчитанные на...

Гул трибун, голос комментатора и 100 Вт мощности: обзор саундбара SVEN SB-2065

Для того, чтобы просматривать матчи в прямом эфире с глубоким рокотом трибун, поддерживающих игроков, с понятным и четким голосом комментатора, объемным звучанием для поддержки особого настроя был...

Мытищинский чай и горькая правда: что скрывается за картиной Перова «Чаепитие в Мытищах, близ Москвы»

Картина «Чаепитие в Мытищах», созданная Василием Григорьевичем Перовым в 1862 году, является ярким примером критического реализма в русском искусстве XIX века. Перов, известный своим умением...

Сверхширокоугольные камеры в недорогих смартфонах: почему их ухудшают или убирают вообще

Ещё несколько лет назад сверхширокоугольные камеры были трендом в среднем ценовом сегменте смартфонов. Сейчас же производители как минимум урезают их характеристики, как максимум —...