Программисты не будут нужны? Новая нейросеть Google Gemini создаёт 2D-игры по описанию или рисунку
Сможет ли не умеющий программировать человек создать игру? Судя по тому, что известно о новой нейросети Google Gemini — да. В официальном блоге Google появился рассказ о работе этой новой генеративной нейросети с примерами её работы. Стоит ли кому-то из индустрии разработки игр начинать волноваться?
Сначала нейросети создавали текст и программный код, потом изображения, потом видео, а теперь и игры. Команда Google DeepMind представила Genie, новую модель на базе искусственного интеллекта, способную создавать целые игры всего из одной подсказки с изображением. Простейшие, самые короткие и примитивные 2D-платформеры. Но ведь это только первый шаг, первые изображения, созданные нейросетями крайне далеки от того, что пользователь получает сейчас, спустя буквально 2-3 года после запуска этой технологии в массы.
Обученная на большом наборе общедоступных интернет-видео нейросеть Genie может превратить любое изображение, будь то реальная фотография, эскиз, сгенерированное искусственным интеллектом изображение или картина в примитивный 2D-платформер.
Команда создателей при этом обращает внимание на универсальность и применимость такого подхода в различных областях. Более того, разработчики подчеркивают, что эта новая модель открывает двери будущим разновидностям и формам искусственного интеллекта для обучения «по нескончаемой учебной программе в новых, сгенерированных мирах». Судя по всему, за этими словами скрывается то, что нейросети будут учиться по созданному нейросетями!
Искусственный интеллект (разумеется, это нейросеть — тут термин взят для удобства восприятия широким кругом читающих) Genie от Google DeepMind — это сравнительно небольшая модель с 11 миллиардами параметров, обученная на более чем 200 000 часах видеозаписей людей, играющих в 2D-платформерные игры.
Эти игры, в силу своей простоты, достаточно шаблонны, поэтому, возможно, неудивительно, что Genie удалось быстро разобраться в механике и физике действий- даже несмотря на то, что видеопотоки не содержали информации о том, когда была нажата кнопка или элемент управления.
«При 11 миллиардах параметрах обучения Genie можно считать базовой моделью мира», — комментирует команда. «Он состоит из пространственно-временного токенизатора видео, авторегрессионной динамической модели и простой и масштабируемой модели скрытых действий. Genie позволяет пользователям действовать в сгенерированных средах покадрово, несмотря на обучение, без каких-либо меток действий или других требований, специфичных для конкретной предметной области, которые обычно встречаются в литературе по мировым моделям. Кроме того, полученное в результате изученное пространство скрытых действий облегчает обучение агентов имитации поведения».
Как итог, уже сейчас Genie способна обработать одно-единственное изображение (фото, набросок от руки или изображение, созданное нейросетью) и создать на его основе что-то играбельное, и реагирующее на действия пользователя.
Модель была натренирована по видео сверхнизкого разрешения с крошечным разрешением 160 x 90 пикселей и всего 10fps, сейчас Gemini создаёт игры подобного же качества, которые работают всего 16 секунд со частотой всего лишь один кадр в секунду. Сейчас это не более чем забавный пример того, на что способны нейросети. Но, если посмотреть назад, то можно увидеть, что-то же самое было с созданием текста, кода и изображения.
Сейчас у всех на слуху Sora от AI, которая создаёт видео по запросу — наверняка вы уже видели примеры работ этой нейросети. Лично я убеждён, что всё это приведёт к какому-то полноценному интерфейсу (или, скорее, более выгодному для производителю облачному сервису с подпиской), где пользователь будет прописывать строчку за строчкой сценария, править получающиеся куски видео и сшивать из этого какой-то полноценный ролик.
Так что и короткие 2d платформеры уже через 2-3 года могут превратиться во что-то существенно более полноценное и играбельное.
Тот же Chat GPT помогает изрядному числу программистов экономить время на создании и проверки кода. Дизайнеры экономят время (впрочем, некоторые заказчики уже экономят на дизайнерах), так может быть скоро создание фильмов, мультиков и игр будет гораздо более доступно? Скорее всего речь не пойдёт об отдельных энтузиастах, но небольшие студии смогут осилить проекты, которые раньше были бы по плечу студиям с совершенно иными бюджетами.
Такая возможность создавать что-то «из головы» без умения рисовать, снимать и кодировать не может не радовать. Но она же не может и не волновать. Ведь если человек не умеет ничего из вышеперечисленного и при этом может получить коммерчески приемлемое изображение, видео или игру, то… можно ли назвать программистом того, кто не умеет писать код, и художником того, кто не умеет рисовать?
Вопрос этот философский может и не так важен, как вопрос другой — как нейросети повлияет на рынок труда? В своё время закованный в броню, тренировавшийся всю жизнь профессионал-рыцарь был вершиной пищевой цепочки на поле битвы. Равно как и искусство стрельбы из лука требовало годы занятий. А появление арбалетов и аркебуз в руках сыновей пекарей и каменщиков за кратчайшее время расставило всех этих Ланселотов вдоль коридоров замков.
Пишите своё мнение в комментариях, стоит ли профессионалам опасаться нейросетей и\или приведенных ими любителей. В конце-концов, музыкальные редакторы не уничтожили музыкантов, а стали удобным инструментов в их руках.
Источник: официальный блог Google
6 комментариев
Добавить комментарий
Да и остальным, по-серьезному тоже, покуда сетки не будут пилить по-настоящему оптимизированный код, а не «и так сойдёт»
В нейросети же вврдишь параметры необходимого продукта. Добавление прослойки в виде нейросети никак не повлияет на существование программистов, просто программисты будут писать промпты для нейросети.
Просто, облегчает задачу не больше. Рисовать, писать стихи, текст песен, сказки, анекдоты, рассказы, мифы, оды, сюжеты, и т д. Оно не вдохновляет, просто обычное баловство.
Я по прежнему считаю что художники гораздо лучше рисуют как и писатели пишут. С человеком не сравниться не одна ИИ технология.
Добавить комментарий