Нейросеть, создающая реалистичные пейзажи по наброскам: Nvidia Canvas

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Инструкция | ИИ, сервисы и приложения

Сейчас нейросетями пользоваться стало гораздо проще, иногда необходимо просто загрузить фотографию и с помощью одной кнопки получить результат. В Canva достаточно сделать пару мазков кистью на уровне трехлетнего ребенка, чтобы получить фотореалистичное место, которого не существует. На скриншоте ниже не фотошоп, а реальный результат обработки набросков

Есть два варианта работы с данным движком:

1. Использование приложения

2. Использование сайта

Я начну с первого как с самого удобного, ведь тут результат получается "на лету", можно использовать слои, сохранять и открывать проекты, а так же экспортировать результат в PSD формате для обработки в более продвинутых редакторах. Единственная проблема с которой можно столкнуться, это отказ программы запускаться если используется видеокарта без RTX.  Переходим на официальный сайт и скачиваем последнюю бета версию

Инсталлятор такой же, как у драйверов от нвидиа, установка в пару кликов, дополнительных пунктов в настройках нет

Интерфейс на английском языке, но интуитивно понятен. Слева инструменты, рисовать можно кистью либо линиями если нужны прямые участки, так же имеется заливка для быстрой смены одного материала другим, еще есть ластик и пипетка для клонирования цвета(материала). Справа выбор материала, для каждого имеется свой цвет, со временем запоминаешь какая иконка что значит, но есть и всплывающие подсказки если подержать курсор неподвижно на интересующем. Программа постоянно обновляется и количество материалов выросло до 20 штук, среди них есть: небо, облака, холмы, скалы, вода, грязь, туман, снег, река, море, цветы(луг), мелкая трава, сухая трава, кусты, деревья, камни, песок, гравий, земля и каменная стена, которая в отличие от камней чаще преобразуется в отвесные скалы. 

Выбираем кисть, мазюкаем нужный материал на холсте и моментально получаем результат, для которого можно выбрать до 10 вариаций в 9 стилях, после чего сохранить для дальнейшего редактирования или экспортировать результат в pdf либо в png

Максимум что требуется от пользователя это представить что он хочет увидеть и сделать наброски, правки можно вносить как на основном холсте, так и на финальном, в этом случае трансформация происходит в реальном времени. Выглядит слишком хорошо чтобы быть правдой? Я записал видео с тремя набросками, на каждый из которых потратил максимум несколько минут

Стили позволяют изменить время года и суток, вариации заметно меняют внешний вид пейзажа. Вот результат изменения стилей с использованием одного варианта

Но если для каждого стиля выбрать свой вариант, можно подобрать максимально реалистичное изображение

Ну и еще несколько примеров, сложно было выбирать из 90 вариантов, оставил по минимуму

И последний, чтобы не затягивать публикацию

Второй вариант: использование сервиса GauGAN2 Beta

Если у Вас не работает программа, переходите на этот сайт. Интерфейс очень похож, но тут разработчики в тестовом режиме добавили более 30 материалов, часть из который дают не особо реалистичные, но местами интересные результаты

Если же использовать аналогичные Canvas получается очень похоже, вот попытался повторить скетч, правда линии местами получились толще, так что устье реки вышло другое. Единственный минус, это время обработки. Для старта нужно нажать кнопку компиляции и ожидать секунд 10, при применении фильтров немного дольше. По этой же причине нельзя править готовое изображение в режиме реального времени

В прошлой моей публикации, посвященной нейросети Meitu Ai Art, несколько пользователей возмутились тем, как легко люди сливают свои фотографии непонятно куда попало, так что думаю это неплохая альтернатива для знакомства с миром машинного обучения, главное не пытаться восстанавливать по памяти секретные объекты )

12 комментариев

Добавить комментарий

i
Отлично для блога о туризме ) Копирайтеры — не благодарите
ResSet
Я тоже об этом думал, при чем по памяти виды получаются иногда довольно похожи, но картинка при этом уникальна )
Mercoff
отказ программы запускаться если используется старая видеокарта

Вот сейчас было обидно. Моя GTX 1660 — старая? Не, ну за вами не угонишься.
А требования ломовые: только RTX.
ResSet
Хм, я помню как запускал её еще на 1050 ti, похоже требования изменились. А какая версия драйвера у Вас стоит? В требованиях пишут, что нужна не ниже 471.68, может в этом дело?
Почитал, действительно только на RTX картах работает, добавлю в обзор. Похоже я онлайн генератор мучил тогда. Ну второй вариант всем доступен точно, только на моем мониторе пришлось масштаб страницы чуть уменьшить для удобства. Ну и главное не пытаться его строения принудительно создавать, пока н очень получается )
ResSet
Почему же, сервис GauGan работает на этом же движке, просто картинка перестраивается не постоянно, а после нажатия кнопки, чтобы не нагружать сервер постоянными запросами. При использовании аналогичных инструментов и материалов получается очень похоже, сайт указывал в конце публикации, могу продублировать сюда
http://gaugan.org/gaugan2
108401496269942511458@google
«несколько пользователей возмутились тем, как легко люди сливают свои фотографии непонятно куда попало»
Ой насмешили, у людей фотки вывалены в социальные сети в свободном доступе, кто угодно, когда угодно и куда угодно может их перезалить
ResSet
Почитайте комментарии в моей предыдущей публикации по нейросети Ai Art )
H
Выглядит крайне круто. Нейросети прям в реальном времени создают такие картинки. Сейчас это выглядит как бесполезная игрушка, но в будущем разрабы думаю смогут по такой же аналогии создавать игровые миры, и будет это занимать намного меньше времени. Здесь ведь даже детально можно что угодно настроить. Представьте чтоб нарисовать игровой мир, даже особо в движке капаться не придётся, сидишь просто в каком то паинте рисуешь, никакого образования не надо, главное фантазия, насколько дизайнеров за месяц смогут собрать полностью большой игровой мир. Если ещё ИИ научить писать реплики и подобное, то в будущем для разработки игры будут тратить условный год, а не 3-5 как сейчас
ResSet
Так сейчас же во многих играх используются процедурно генерируемое окружение. Принцип очень похож, алгоритму скормил несколько миллионов картинок, чтобы он понял какие элементы чаще сочетаются друг с другом, а какие нет и он дальше уже сам может предлагать варианты не похожие друг на друга, но при этом правдоподобные )
По поводу реплик — есть нейросети, которые пишут рассказы. Зачастую факты в кашу намешаны, но нет ощущения, что это рандомные слова )
H
Сейчас только открытый мир легко сделать из набросков движка. А что насчёт закрытых локаций? Их вручную все делают. Ну условно делают стены и там уже руками все раскидывают, а тут ИИ в зависимости от твоих прихотей будет заполнять локацию, если это склеп, то добавит пыли, факелов, черепа и все в том духе. Nvidia уже показали такую штуку, которая позволяет ремейкнуть любую игру, знатно так дорисовывая полигоны и украшая мир (скорее всего в след году выкатят для игроков).
Диалоги пока что для ИИ крайне тяжёлые, но когда нибудь это случится и мы сможем общаться с любым нпс с помощью войса, и он будет нам отвечать (хотя это совсем в далёком будущем), пока что хотя бы сделали бы генерацию реплик, условно ты задаёшь тему диалога, ИИ её прописывает, а далее сценаристы правят (хотя бы для побочек, для основной сюжетки трудно будет такое реализовать), сэкономит тонну времени на ручную пропись
ResSet
По поводу общения голосом, будет слишком много вариаций и игрок не сможет понять, все что нужно он спросил или нет. Разве что усреднять всё до «да», «нет» и не «знаю» в зависимости от реплики игрока, но тогда вариативность упадет. Это как с голосовыми ассистентами, я могу попросить включить музыку, рассказать новости, о погоде и ещё пару вещей по мелочи, а племянник может часами с Алисой общаться
H
Дак, а зачем убирать квестхэлпер. Подойди, поговорим с нпс, задай какие то вопросы, хочешь пообщайся, не хочешь не общайся. А там уже в интерфейсе ориентируйся.
Есть ведь уже отличный пример ИИ в игре мидл ерт, немезис прекрасен, каждый орк ощущается уникальным (не считая рядовых солдат, и даже если такой тебя убьёт, его повысят в должности). Этот ИИ запоминает тебя, если ты убежишь его, при следующей встречи он тебе об этом напомнит и куча подобного.
Чтоб не путаться в разговоре, запретить перебивать НПС, он тебе расскажет все необходимое, а ты уточняешь детали, да если убрать навигацию, это усложнит игру, зато реализма прибавится, представь что ты можешь подойти к любому прохожему и уточнить как тебе дойти, или взять врага в плен и требовать с него информацию)) Я думаю когда нибудь игры дойдут до такого, просто это явно будет не через один десяток лет. И пока такой системы не будет, нет никакого смысла в полноценном вр с полным погружением как в фильмах

Добавить комментарий

Сейчас на главной

Новости

Публикации

Обзор отвертки UGREEN UT106 – компактный инструмент с двумя наконечниками для повседневной работы

Иногда нужна простая отвертка, без наборов бит и лишней возни. Взял, и работаешь. Здесь как раз такой вариант. Компактная, с двусторонним стержнем, без лишних деталей. На первый взгляд все...

Обзор Fnirsi 2d15p: осциллограф, генератор сигналов и мультиметр с удобным управлением

Новая модель сочетает в себе как сенсорное, так и привычное управление с помощью физических кнопок и энкодеров, что сильно упрощает подстройку параметров. Он обеспечивает частоту дискретизации 500...

Теперь суперконденсатор. Обзор 4K HDR регистратора 70mai A810S: наблюдение 24/7, датчик движения, ADAS

Бренд 70mai не нуждается в представлении — это уже давно хорошо зарекомендовавший себя производитель современных, многофункциональных автомобильных видеорегистраторов с оптимальным...

✦ ИИ  Камера V380 Pro вдруг просит логин и пароль. Где их взять и как вернуть доступ

Камера V380 Pro просит логин и пароль? Разбираемся, где найти данные устройства, почему появляется запрос авторизации и как быстро вернуть доступ к камере.

Как в Древней Персии создавали лёд посреди пустыни

В раскалённых песках иранских пустынь Деште-Лут и Деште-Кевир, где дневная температура летом легко превышает 40-45 °C, а влажность крайне низкая, древние персы сумели создать технологию, которая...

Обзор NAS TerraMaster F4-425 Plus – как работает гибридная система хранения HDD и NVMe

TerraMaster F4-425 Plus — сетевое хранилище с четырьмя отсеками для жестких дисков и тремя слотами M.2 для NVMe-накопителей. Устройство построено на процессоре Intel N150 и оснащено 16...