Программисты не будут нужны? Новая нейросеть Google Gemini создаёт 2D-игры по описанию или рисунку

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com

27 февраля 2024, 11:30 | Мнение | Игры

Сможет ли не умеющий программировать человек создать игру? Судя по тому, что известно о новой нейросети Google Gemini — да. В официальном блоге Google появился рассказ о работе этой новой генеративной нейросети с примерами её работы. Стоит ли кому-то из индустрии разработки игр начинать волноваться?

Сначала нейросети создавали текст и программный код, потом изображения, потом видео, а теперь и игры. Команда Google DeepMind представила Genie, новую модель на базе искусственного интеллекта, способную создавать целые игры всего из одной подсказки с изображением. Простейшие, самые короткие и примитивные 2D-платформеры. Но ведь это только первый шаг, первые изображения, созданные нейросетями крайне далеки от того, что пользователь получает сейчас, спустя буквально 2-3 года после запуска этой технологии в массы.

Обученная на большом наборе общедоступных интернет-видео нейросеть Genie может превратить любое изображение, будь то реальная фотография, эскиз, сгенерированное искусственным интеллектом изображение или картина в примитивный 2D-платформер.

Команда создателей при этом обращает внимание на универсальность и применимость такого подхода в различных областях. Более того, разработчики подчеркивают, что эта новая модель открывает двери будущим разновидностям и формам искусственного интеллекта для обучения «по нескончаемой учебной программе в новых, сгенерированных мирах». Судя по всему, за этими словами скрывается то, что нейросети будут учиться по созданному нейросетями!

Искусственный интеллект (разумеется, это нейросеть — тут термин взят для удобства восприятия широким кругом читающих) Genie от Google DeepMind — это сравнительно небольшая модель с 11 миллиардами параметров, обученная на более чем 200 000 часах видеозаписей людей, играющих в 2D-платформерные игры.

Эти игры, в силу своей простоты, достаточно шаблонны, поэтому, возможно, неудивительно, что Genie удалось быстро разобраться в механике и физике действий- даже несмотря на то, что видеопотоки не содержали информации о том, когда была нажата кнопка или элемент управления.

Автор: Команда Genie Источник: sites.google.com

«При 11 миллиардах параметрах обучения Genie можно считать базовой моделью мира», — комментирует команда. «Он состоит из пространственно-временного токенизатора видео, авторегрессионной динамической модели и простой и масштабируемой модели скрытых действий. Genie позволяет пользователям действовать в сгенерированных средах покадрово, несмотря на обучение, без каких-либо меток действий или других требований, специфичных для конкретной предметной области, которые обычно встречаются в литературе по мировым моделям. Кроме того, полученное в результате изученное пространство скрытых действий облегчает обучение агентов имитации поведения».

Как итог, уже сейчас Genie способна обработать одно-единственное изображение (фото, набросок от руки или изображение, созданное нейросетью) и создать на его основе что-то играбельное, и реагирующее на действия пользователя.

Модель была натренирована по видео сверхнизкого разрешения с крошечным разрешением 160 x 90 пикселей и всего 10fps, сейчас Gemini создаёт игры подобного же качества, которые работают всего 16 секунд со частотой всего лишь один кадр в секунду. Сейчас это не более чем забавный пример того, на что способны нейросети. Но, если посмотреть назад, то можно увидеть, что-то же самое было с созданием текста, кода и изображения.

Сейчас у всех на слуху Sora от AI, которая создаёт видео по запросу — наверняка вы уже видели примеры работ этой нейросети. Лично я убеждён, что всё это приведёт к какому-то полноценному интерфейсу (или, скорее, более выгодному для производителю облачному сервису с подпиской), где пользователь будет прописывать строчку за строчкой сценария, править получающиеся куски видео и сшивать из этого какой-то полноценный ролик.

Так что и короткие 2d платформеры уже через 2-3 года могут превратиться во что-то существенно более полноценное и играбельное.

Тот же Chat GPT помогает изрядному числу программистов экономить время на создании и проверки кода. Дизайнеры экономят время (впрочем, некоторые заказчики уже экономят на дизайнерах), так может быть скоро создание фильмов, мультиков и игр будет гораздо более доступно? Скорее всего речь не пойдёт об отдельных энтузиастах, но небольшие студии смогут осилить проекты, которые раньше были бы по плечу студиям с совершенно иными бюджетами.

создано по детскому рисунку!
Автор: Команда Genie Источник: sites.google.com

Такая возможность создавать что-то «из головы» без умения рисовать, снимать и кодировать не может не радовать. Но она же не может и не волновать. Ведь если человек не умеет ничего из вышеперечисленного и при этом может получить коммерчески приемлемое изображение, видео или игру, то… можно ли назвать программистом того, кто не умеет писать код, и художником того, кто не умеет рисовать?

Вопрос этот философский может и не так важен, как вопрос другой — как нейросети повлияет на рынок труда? В своё время закованный в броню, тренировавшийся всю жизнь профессионал-рыцарь был вершиной пищевой цепочки на поле битвы. Равно как и искусство стрельбы из лука требовало годы занятий. А появление арбалетов и аркебуз в руках сыновей пекарей и каменщиков за кратчайшее время расставило всех этих Ланселотов вдоль коридоров замков.

Пишите своё мнение в комментариях, стоит ли профессионалам опасаться нейросетей и\или приведенных ими любителей. В конце-концов, музыкальные редакторы не уничтожили музыкантов, а стали удобным инструментов в их руках.

Источник: официальный блог Google

5 комментариев

Добавить комментарий

Смешно получается, что программисты создают нейросеть Google Gemini, из за которой потом их всех и сократят))

Ответить

Сомневаюсь что ЭТИМ программистам стоит о чем-то волноваться
Да и остальным, по-серьезному тоже, покуда сетки не будут пилить по-настоящему оптимизированный код, а не «и так сойдёт»

Если нейронки отберут у большинства работу, то с каких грошей люди будут оплачивать подписку на нейронки)

Не заменят, потому что программа по сути это инструкция по выполнению действий.
В нейросети же вврдишь параметры необходимого продукта. Добавление прослойки в виде нейросети никак не повлияет на существование программистов, просто программисты будут писать промпты для нейросети.

Не повлияет, как и не повлиял на всё что человек создал для удобства.
Просто, облегчает задачу не больше. Рисовать, писать стихи, текст песен, сказки, анекдоты, рассказы, мифы, оды, сюжеты, и т д. Оно не вдохновляет, просто обычное баловство.
Я по прежнему считаю что художники гораздо лучше рисуют как и писатели пишут. С человеком не сравниться не одна ИИ технология.

Программисты не будут нужны? Новая нейросеть Google Gemini создаёт 2D-игры по описанию или рисунку

5 комментариев

Добавить комментарий

Добавить комментарий

Сейчас на главной

Новости

Размером с мизинец, а света 100 люмен: представлен наключный фонарь Ysmart BULLET3

Опрос показал: смартфон Sony Xperia 1 VIII пользуется популярностью несмотря на высокую цену

Компания OnePlus планирует выпустить на глобальный рынок компактный планшет с OLED-дисплеем

Грибы могут преобразовать марсианский реголит в плодородную почву

Sony a7R VI обошла топовые Canon и Nikon в тестах DPReview

Публикации

Конец квантового превосходства? Как обычный ноутбук решил задачу, объявленную неразрешимой для ПК

Хойан без фильтров: обратная сторона вьетнамской Венеции

Сука или кобель ротвейлера: хватит слушать мифы о «покладистости», всё решает ваша дисциплина

Обзор Oukitel WP66: защищенный смартфон с двумя дисплеями + видеообзор

5 недорогих роутеров под OpenWrt, актуальных в первой половине 2026 года

Почему 9 этажей стали стандартом в СССР: экономия, безопасность и строительные нормы