Используем серверы Google для работы нейронной сети

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Инструкция | ИИ, сервисы и приложения

Несмотря на то, что ранее мне уже доводилось весьма подробно описывать способ установки и запуска нейронной сети на домашний ПК. Многие пользователи столкнулись с тем неприятным фактом, что для качественной работы со Stable Diffusion требовалось наличие весьма мощного ПК с видеокартой, принудительно от компании Nvidia. В этой небольшой инструкции мы в пару кликов обойдём эти глупые ограничения и заставим сервера Google совершенно бесплатно генерировать нам любые желаемые картинки!

Как это работает

Google Colaboratory — бесплатное облако с веб-интерфейсом в стиле консоли Linux, где пользователю совершенно бесплатно предоставляется доступ на 12 часов к мощному CPU и GPU с возможностью запуска любого кода. Как вы могли уже догадаться, код Stable Diffusion не стал исключением.

Установка и запуск

1. Регистрируем новый e-mail на сервисе Gmail.

2. Переходим в панель управления настройки запуска Stable Diffusion.

3. Если вам не требуется установка сторонних модулей и личное обучение нейронной сети, то нажимаем на выделенную стрелочкой галочку и дожидаемся окончания загрузки всех необходимых компонентов.

4. Если всё прошло успешно, то по окончанию загрузки в логах вашей веб-консоли появится веб-адрес на панель управления готовой к работе Stable Diffusion.  

5. Переходим по ссылке в консоли, вводим желаемые настройки и наслаждаемся сумасшедшей скоростью генерации желаемых картинок.   

Вот, собственно, и всё! Генерация даже такого требовательного нативного разрешения, как 512x768 c 80 прогонами происходит почти мгновенно! Настоящая магия.

  • Запрос: Albert Wesker, beautiful face, beautiful light, TXAA, HD.
  • Модель: Deliberate.
  • Количество проходов: 80 (GPU).
  • Сэмплер: Euler a.
  • Фильтры и стили: Нет.
  • Исправление лица: Активно.

Заключение

Как вы видите, генерация весьма проста, когда тебе доступны ресурсы многомиллиардной IT-компании. Дополнительные параметры для генерации, сторонние модели, а также обозначения параметров Stable Diffusion вы всегда можете найти в прошлой теме. Пользуйтесь.

Автор не входит в состав редакции iXBT.com (подробнее »)
Об авторе
Связь: https://t.me/Pavel_Priluckiy

17 комментариев

Добавить комментарий

Pavel_Priluckiy
Всё, можно считать, что я закончил со Stable Diffusion. Поправил косяки.
M
Можно еще рассказать о dreambooth прикрученной к stable diffusion — это чтоб дообучить модель фотками реального человека, например, и генерировать эльфиек с нужным лицом.
Pavel_Priluckiy
Эльфийки говорите)
Pavel_Priluckiy
Вы уже придираетесь.
Y
Представьте себе, дает. Для обучения и подобных всякоразных вещей. Просто над каждым не поставишь надзирателя, что бы он определял для каких целей используются ресурсы(ибо попробуйте доказать что вы генерите картинки не для отладки, к примеру).
А ограничения, конечно, есть:
Если запускать на видиках — там есть ограничение по времени, хотя его можно частично обойти созданием нескольких аккаунтов гугла.
Если запускать на ускорителях гугла(TPU очень быстра штука с большим количеством памяти) — с временными ограничениями не сталкивался, но ресурсы не всегда доступны. Т.е. то бы урвать TPU(когда он недоступен), приходится раз в 15-30-60 минут пробовать запускать скрипт заново, пока не выделяться ресурсы.
Ну, и гугол вас забанить может или ограничения ввести. =)
З.ы. Ну а к ошибкам нейронки прикапываться, которая не понимает что рисует — то такое. Это при том что если сильно захотеть и есть опыт с подобными рисовалками — это можно многое исправит + рисует оно по лучше и быстрее чем 99% населения. Последнее предложение вообще непонятно к чему написано т.к. у нас мозги по похожему принципу работают. Плюс, не так то и сложно дополнительно обучить модельку на нужных картинках.
M
Вопрос не к ошибкам нейронки, а к тому, что просто дается пошаговая инструкция уровня хабра для запуска нейронки «мама мама я настроил генератор анимешных девочек», без понимания, что же внутри конкретно работает.
Согласен. И хоть бы кто при этом писал нормальные инструкции по составлению ЗАПРОСОВ, а это ведь самое главное.
M
Тем, кто предъявляет претензии к качеству картинок, создаваемых нейросетями, не мешало бы вспомнить, как они рисовали хотя бы год назад. А в 2015 все были в восторге от разукрашивания фотографий фрактальными собачьими носами.
К хорошему быстро привыкаешь и начинаешь требовать всё большего и большего.
Pavel_Priluckiy
Такова природа человечества.
M
Что так резко? Вы же понимаете, что под восторгом подразумевается то, что тогда это было круто и интересно, хотя и понятно было, что это первые шажки. Потом пошла стилизация фото и прочее.
Ну а насчёт содержания это да, у народа какая-то нездоровая тяга к онемэ. Мне вот понравилось, например, такое https://rg.ru/2022/11/30/drevnij-egipet-v-settinge-kiberpanka-interesnyj-koncept-ot-nejroseti.html
M
Ну элиза-боты это такое. У мен товарищ с антиспам-ботом миранды (вроде «говорун») общался в течение получаса, прежде чем понял, что что-то не то. Обиделся жестоко.
Pavel_Priluckiy
Все GPU уже разобрали х0
Pavel_Priluckiy
Уйди от меня зомби х0. Не для тебя моя плоть!

Добавить комментарий

Сейчас на главной

Новости

Публикации

Ученые годами находили микропластик повсюду, загрязняя образцы своими же перчатками: найдена слепая зона современной экологии

Глобальная проблема загрязнения окружающей среды микропластиком требует от научного сообщества максимально точных методов оценки. Исследователи находят полимерные фрагменты в водоемах, почве,...

Копать вслепую больше не нужно: как ученые нашли египетский храм на глубине 7 метров с помощью спутников

Дельта Нила — это один из самых сложных регионов для проведения археологических исследований. В отличие от засушливых пустынных зон Египта, где исторические памятники сохраняются в сухом...

Почему курсор мыши наклонен: инженерные ограничения и решения эпохи Xerox Alto

Привычный интерфейс современного компьютера часто воспринимается как результат работы дизайнеров. Однако форма и наклон курсора мыши во многом обусловлены техническими ограничениями электроники...

Камеры будто бы стали хуже, но изменилось другое: почему Vivo X300 Ultra — это лучший камерофон на рынке

Долгое время смартфоны Vivo X100 и X200 Ultra считались эталонами в мире мобильной фотографии. Они предлагали самые передовые наборы камер и грамотную цифровую обработку. Со второго поколения они...

Обзор умного робота-пылесоса ILIFE A20 для сухой и влажной уборки с зарядной станцией

Робот-пылесос ILIFE A20. Сухая и влажная уборка. Время работы до 120 минут на одном заряде, максимальная мощность всасывания 3000Па. Мощность 35Вт, аккумулятор 3200 мАч, полное время зарядки 6 часов

Почему в школах окна располагают слева от учеников

В школьных кабинетах ученики, как правило, сидят за партами лицом к доске, и окна почти всегда расположены слева от учеников. Эта особенность заметна в большинстве учебных заведений, особенно в...