Программисты не будут нужны? Новая нейросеть Google Gemini создаёт 2D-игры по описанию или рисунку

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Мнение | Игры

Сможет ли не умеющий программировать человек создать игру? Судя по тому, что известно о новой нейросети Google Gemini — да. В официальном блоге Google появился рассказ о работе этой новой генеративной нейросети с примерами её работы. Стоит ли кому-то из индустрии разработки игр начинать волноваться?

Автор: нейросеть kandinsky

Сначала нейросети создавали текст и программный код, потом изображения, потом видео, а теперь и игры. Команда Google DeepMind представила Genie, новую модель на базе искусственного интеллекта, способную создавать целые игры всего из одной подсказки с изображением. Простейшие, самые короткие и примитивные 2D-платформеры. Но ведь это только первый шаг, первые изображения, созданные нейросетями крайне далеки от того, что пользователь получает сейчас, спустя буквально 2-3 года после запуска этой технологии в массы.

Обученная на большом наборе общедоступных интернет-видео нейросеть Genie может превратить любое изображение, будь то реальная фотография, эскиз, сгенерированное искусственным интеллектом изображение или картина в примитивный 2D-платформер.

Команда создателей при этом обращает внимание на универсальность и применимость такого подхода в различных областях. Более того, разработчики подчеркивают, что эта новая модель открывает двери будущим разновидностям и формам искусственного интеллекта для обучения «по нескончаемой учебной программе в новых, сгенерированных мирах». Судя по всему, за этими словами скрывается то, что нейросети будут учиться по созданному нейросетями!

Искусственный интеллект (разумеется, это нейросеть — тут термин взят для удобства восприятия широким кругом читающих) Genie от Google DeepMind — это сравнительно небольшая модель с 11 миллиардами параметров, обученная на более чем 200 000 часах видеозаписей людей, играющих в 2D-платформерные игры.

Эти игры, в силу своей простоты, достаточно шаблонны, поэтому, возможно, неудивительно, что Genie удалось быстро разобраться в механике и физике действий- даже несмотря на то, что видеопотоки не содержали информации о том, когда была нажата кнопка или элемент управления.

Автор: Команда Genie Источник: sites.google.com

«При 11 миллиардах параметрах обучения Genie можно считать базовой моделью мира», — комментирует команда. «Он состоит из пространственно-временного токенизатора видео, авторегрессионной динамической модели и простой и масштабируемой модели скрытых действий. Genie позволяет пользователям действовать в сгенерированных средах покадрово, несмотря на обучение, без каких-либо меток действий или других требований, специфичных для конкретной предметной области, которые обычно встречаются в литературе по мировым моделям. Кроме того, полученное в результате изученное пространство скрытых действий облегчает обучение агентов имитации поведения».

Как итог, уже сейчас Genie способна обработать одно-единственное изображение (фото, набросок от руки или изображение, созданное нейросетью) и создать на его основе что-то играбельное, и реагирующее на действия пользователя.

Модель была натренирована по видео сверхнизкого разрешения с крошечным разрешением 160 x 90 пикселей и всего 10fps, сейчас Gemini создаёт игры подобного же качества, которые работают всего 16 секунд со частотой всего лишь один кадр в секунду. Сейчас это не более чем забавный пример того, на что способны нейросети. Но, если посмотреть назад, то можно увидеть, что-то же самое было с созданием текста, кода и изображения.

Сейчас у всех на слуху Sora от AI, которая создаёт видео по запросу — наверняка вы уже видели примеры работ этой нейросети. Лично я убеждён, что всё это приведёт к какому-то полноценному интерфейсу (или, скорее, более выгодному для производителю облачному сервису с подпиской), где пользователь будет прописывать строчку за строчкой сценария, править получающиеся куски видео и сшивать из этого какой-то полноценный ролик.

Автор: Команда Genie Источник: sites.google.com

Так что и короткие 2d платформеры уже через 2-3 года могут превратиться во что-то существенно более полноценное и играбельное.

Тот же Chat GPT помогает изрядному числу программистов экономить время на создании и проверки кода. Дизайнеры экономят время (впрочем, некоторые заказчики уже экономят на дизайнерах), так может быть скоро создание фильмов, мультиков и игр будет гораздо более доступно? Скорее всего речь не пойдёт об отдельных энтузиастах, но небольшие студии смогут осилить проекты, которые раньше были бы по плечу студиям с совершенно иными бюджетами.

создано по детскому рисунку!
Автор: Команда Genie Источник: sites.google.com

Такая возможность создавать что-то «из головы» без умения рисовать, снимать и кодировать не может не радовать. Но она же не может и не волновать. Ведь если человек не умеет ничего из вышеперечисленного и при этом может получить коммерчески приемлемое изображение, видео или игру, то… можно ли назвать программистом того, кто не умеет писать код, и художником того, кто не умеет рисовать?

Вопрос этот философский может и не так важен, как вопрос другой — как нейросети повлияет на рынок труда? В своё время закованный в броню, тренировавшийся всю жизнь профессионал-рыцарь был вершиной пищевой цепочки на поле битвы. Равно как и искусство стрельбы из лука требовало годы занятий. А появление арбалетов и аркебуз в руках сыновей пекарей и каменщиков за кратчайшее время расставило всех этих Ланселотов вдоль коридоров замков.

Пишите своё мнение в комментариях, стоит ли профессионалам опасаться нейросетей и\или приведенных ими любителей. В конце-концов, музыкальные редакторы не уничтожили музыкантов, а стали удобным инструментов в их руках.

Источник: официальный блог Google

5 комментариев

Добавить комментарий

SedayaNoch
Смешно получается, что программисты создают нейросеть Google Gemini, из за которой потом их всех и сократят))
narmattaru
Сомневаюсь что ЭТИМ программистам стоит о чем-то волноваться
Да и остальным, по-серьезному тоже, покуда сетки не будут пилить по-настоящему оптимизированный код, а не «и так сойдёт»
100311586127062614407@google
Если нейронки отберут у большинства работу, то с каких грошей люди будут оплачивать подписку на нейронки)
1
Не заменят, потому что программа по сути это инструкция по выполнению действий.
В нейросети же вврдишь параметры необходимого продукта. Добавление прослойки в виде нейросети никак не повлияет на существование программистов, просто программисты будут писать промпты для нейросети.
386973530@vkontakte
Не повлияет, как и не повлиял на всё что человек создал для удобства.
Просто, облегчает задачу не больше. Рисовать, писать стихи, текст песен, сказки, анекдоты, рассказы, мифы, оды, сюжеты, и т д. Оно не вдохновляет, просто обычное баловство.
Я по прежнему считаю что художники гораздо лучше рисуют как и писатели пишут. С человеком не сравниться не одна ИИ технология.

Добавить комментарий

Сейчас на главной

Новости

Публикации

Обзор наушников Anker Soundcore Liberty Buds с LDAC и активным шумоподавлением

Anker Soundcore Liberty Buds — новые беспроводные наушники с рядом интересных функций: адаптивный режим шумоподавления, встроенный ИИ-ассистент и переводчик, поддержка высокого качества...

Толпы туристов и жесткие правила: как живет самый священный остров Японии

В каждом туристической листовке, связанной с Японией, обычно можно увидеть два объекта: гору Фудзияма и насыщенного алого цвета врата тории, словно парящие над водой. Именно о вторых и пойдет речь,...

Устаревшая идея или недопонятая реальность? Спор об эфире в физике и его ирония

Представим себе открытый космос. Пусть расстояния от планет будут такими, чтобы количества овеществленной материи явно не хватало для того, чтобы любая магнитная волна передавалась через...

Малахит, Лазурит, Тигровый глаз, два авантюрина: российский часовой бренд представляет новые механические часы

Продолжение «каменной коллекции» выпустила компания Briller, и на этот раз часы получили механизм с ручным заводом. Уточнение это имеет значение, так как коллекция - скорее продолжение...

«Волна» 1954 года: магнитофон, у которого не было ни двигателя, ни блока питания

У этого магнитофона-приставки не было собственного двигателя, чтобы вращать катушки, и блока питания тоже не было. Чтобы работать, он «паразитировал» на других устройствах, причем сразу двух....

Заложники гигантомании: почему мировая логистика больше не справляется с мегасудами

Морская контейнерная перевозка давно стала артерией глобальной торговли. Более 80% мировой торговли по объёму перемещается по морю, и в последние десятилетия отрасль пережила настоящую революцию...