Игры, в которых победил искусственный интеллект

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com (подробнее »)
| Обзор | Компьютерные и мобильные игры

Перевод статьи с сайта https://towardsdatascience.com/

Некоторые вещи, которые выполняет искусственный интеллект, кажутся нам совсем не впечатляющими. Подумайте о том, как ваша камера распознает и автоматически фокусируется на лицах на фотографиях. Эта технология существует с 2001 года, и она, как правило, уже не впечатляет людей. Почему же? Ну, поскольку ты тоже можешь это сделать, ты можешь сосредоточить свой взгляд на чьем-то лице очень легко. На самом деле, это так просто, что ты даже не знаешь, как это сделать. Если ИИ тоже может это сделать, тогда кому важно, как это работает? Хотя мы можем не понимать, как работает этот ИИ, лежащие в его основе механизмы не делают ничего, что мы не можем. По крайней мере, как я считаю, так думает большинство людей.

В играх все как раз наоборот. В отличие от врожденных способностей (как фокусировка зрения) которые у нас есть, во время игры у вас есть понимание того, как и почему вы принимаете решения. Поэтому, когда ИИ принимает решения о том, как играется игра, они гораздо интереснее, потому что вы могли бы оказаться в той же ситуации, что и ИИ, принимая точно такие же решения. ИИ в народе считается чем-то, что заменяет человеческую работу. Когда ИИ играет в игру, чувствуется близость к позиции, занимаемой человеком в окружающем нас мире, так как игры — это вещи над которыми мы должны думать сознательно. Игры, которые сыграл ИИ, таким образом захватили интерес новостей, вот самые важные победы, которые он одержал.

1996–1997 Каспаров vs Deep Blue

10-го февраля 1996 IBM’s Deep Blue столкнулся лицом к лицу с Гарри Каспаровым и стала первой компьютерной программой, которая победила действующего чемпиона мира по шахматам в нормальных условиях (то есть с часами на месте). К сожалению для Deep Blue, за оставшиеся пять игр в матче, она проиграла три матча и дважды сыграла в ничью.

На следующий год был назначен второй матч, и команда Deep Blue сделала обновления своего программного обеспечения. 3-го мая Deep Blue открыла матч поражением. Во второй игре у Deep Blue возникли проблемы с расчётом что делать, и чтобы не позволить себе тратить слишком много времени, она сделала случайный ход. Ход был ужасным, но это отбросило Каспарова, который предположил, что Deep Blue может расчитывать ходы наперед игры больше, чем он. Вместо того чтобы прийти к поражению на глазах у миллионов людей, он подал в отставку во второй игре (распространенная практика в шахматах). В реальности Каспаров мог выиграть вторую игру, если бы доиграл её до завершения, что было для него небольшим смущением, что привело к тому, что в следующих играх он играл более безрассудно, кульминацией чего стала победа Deep Blue в 2-х играх против 1-й у Каспарова.

Как заявил журналист ESPN Джереми Шаап, «люди следили за этим во всем мире, люди, которые не интересовались шахматами, люди, которые только имели интерес к этой истории — человек против машины». Интерес к этой игре питался утверждением Каспарова в конце второй игры о том, что IBM обманывает, которое он основывал на разнице в качестве игры Deep Blue между первой и второй игрой. Шахматы были барометром интеллекта с момента его изобретения в VI веке. Думать, что люди могут быть побиты компьютерами, было обидно, поскольку все еще было много способов, по которым компьютеры уступают людям. Конечно, IBM не обманывала и изменение качества Deep Blue объясняла своим случайным ходом.

Команда IBM по связям с общественностью раскачало это событие, и акции компании значительно выросли. С победой в кармане, IBM отклонила реванш, затем демонтировала Deep Blue и сделала ее последним местом отдыха музей компьютерной истории в Mountain View.

Каспаров больше не считает, что Deep Blue обманывала, и признает, что не только Deep Blue может его обыграть, но и саму Deep Blue можно обыграть новыми программами, работающими на более мелких компьютерах. Эта игра была большим шагом в повествовании искусственного против человеческого интеллекта и она утвердила игры как метод сравнения.

2011 IBM Watson побеждает шоу Jeopardy!

Во время совместного обеда два руководителя IBM начали комментировать успех Кена Дженнингса на Jeopardy! Который до сих пор удерживает рекорд в большинстве выигранных игр подряд. Возможно, в стремлении к успеху после победы Deep Blue они создали Watson — систему ответов на вопросы, которая должна была обыграть Кена Дженнингса.

Watson, названный в честь основателя IBM Томаса Дж. Уотсона, был создан в 2005 году, но начал своё знаменитое появление лишь в 2011 году. Watson был направлен против Брэда Руттера, вместе с Кеном Дженнингсом, которые считались двумя лучшими в Jeopardy!, в то время. Кен был программистом, который окончил несколько курсов по ИИ и принял вызов частично, потому что он думал, что нет никаких способов, чтобы система ИИ могла победить его.

Watson выиграл два матча, которые он сыграл против Брэда и Кена, заработав $77 147 к их $24 000 и $21 600 соответственно. Затем Watson нанёс поражение двум членам конгресса, Раш Д. Холд-младшему (бывший участник Jeopardy!) И Билл Кэссиди, добившись друго двухпартийного поражения.

В отличие от Deep Blue, компания IBM перевела Watson на многие коммерческие продукты, включая Watson Text to Speech, Watson Speech to Text, Watson Natural Language Classifier, Watson Natural Language Understanding, Watson Assistant, Watson Health и др.

2013 DeepMind побеждает Atari

В то время как Watson был разработан для конкретной цели, DeepMind Technologies хотела создать систему ИИ, которую не нужно обучать на узком поле, приблизив нас к определению общего ИИ. Цель, которую они поставили перед собой, была победить многие игры Atari только с одной моделью, которая не была переработана для какой-либо конкретной игры.

p.s. после 600-й попытки обучаемый агент находит и использует наилучшую стратегию тунеллирования, затем выбивает мяч за стенку.

Используя только данные того, что было на экране и, по указанию максимизировать счет, DeepMind смог не только обыграть каждую игру, но и получить лучшие оценки, чем даже лучшие человеческие игроки. Доклад 2013 года — Atari играя с усиленным обучением, привел к тому Google приобрели их в 2014 году.

2016 AlphaGo vs Lee Sedol

Преимуществом Deep Blue была его способность обрабатывать большое количество ходов сразу и умный способ оценки, который был лучшим. Для азиатской настольной игры Go это было просто невозможно. Правила игры довольно просты, но было приблизительно 2 * 10 ¹ ⁷⁰ количество состояний, в которых могла быть игра в любой момент.

В качестве ссылки это число больше, чем число атомов во Вселенной. Таким образом, стратегию в игре Go трудно определить, так как для каждого состояния существует много решений, чтобы оценить, каждое приводит к еще большему количеству состояний для оценки. Без грубого силового подхода, AlphaGo компании DeepMind научилась придавать ценность до нескольких периодов в будущем, а затем научилась принимать решения на основе этой ценности.

После победы над чемпионом Европы по Go Фан Хуэй, AlphaGo была поставлена задача сыграть с Ли Седола, игрока одного из самых высоких рейтингов за всю историю. Победа над Ли побудила его уйти в отставку, сказав «Даже если я снова стану номером один, есть сущность, которую нельзя победить».

2017 AlphaZero Masters Chess, Go, and Shogi

AlphaZero был обобщенной версией AlphaGo, построенной с намерением выиграть Chess, Go и Shogi (японская версия шахмат). Мало того, что AlphaZero обыграл AlphaGo, это было сделано, только играя в имитированные игры против себя, не имея примеров экспертных игр, на которые можно было бы посмотреть. В начале этих имитаций она абсолютно ничего не знала. Он освоил Chess после 9 часов обучения, Shogi после 2, и Go после 34.

В то время как это было здорово для Google в привлечении талантов, профессор ИИ Джоанна Брюсон отметила, что кредит, который Google получила за эти достижения, может дать массовое переговорное преимущество с правительствами, стремящимися регулировать ИИ.

2019 AlphaStar

Затем AlphaZero был переведен в AlphaStar с намерением победить в стратегии реального времени игре Starcraft. В 2019 AlphaStar достиг рейтинга в топ-0,2 процентов человеческих игроков. Это был первый случай, когда ИИ когда-либо возглавлял электронный спорт. AlphaStar не идеально подходит для Starcraft, но по-прежнему рассматривается как масштабная веха для ИИ, так как работает в режиме реального времени, с частичной информацией, по сложным правилам. В то время как Go был относительно сложным в количестве решений, с которыми сталкиваешься, правила к Go достаточно просты по сравнению с Starcraft. Эта более сложная среда, в которой работает AlphaStar, являясь хорошим показателем того, что ИИ готова к более широкому коммерческому использованию, как в самоуправляемых транспортных средствах, робототехнике и цепочках поставок.

продолжение следует...

9 комментариев

L
Впечатление, что перевод сделан в основном искусственным интеллектом…
A
ЕГЭ считать переводом естественного в искусственный? :)
E
И после этого автор даже не перечитывал статью!
Последний раз редактировалось
A
5 октября 1996 г. вышли первые (вообще в мире?) боты (на основе скриптового ИИ) The Reaper Bot для Quake. Спокойно побеждают в боях большинство игроков в Quake. ;))
f
В основном, потому что реакция быстрая и точность выстрелов. Нарисовал для него карту и он бегает, есть алгоритмы, но это не ИИ, он не обучается самостоятельно.
A
А кто и где сказал, что ИИ должен учиться постоянно, а не быть наученным 1 раз для выполнения конкретной задачи? ;)
T
В Старкрафте он нифига не победил. Обыграл пару хороших игроков пользуясь читами. Зато потом на выставке его с издёвкой обыгрывал игрок из даймонд лиги. Середнячок то есть. А как половину читов убрали, то вообще стало скучно и больше АльфаСтар в игре не появлялся.
1
В реальности Каспаров мог выиграть вторую игру, если бы доиграл её до завершения, что было для него небольшим смущением, что привело к тому, что в следующих играх он играл более безрассудно, кульминацией чего стала победа Deep Blue в 2-х играх против 1-й у Каспарова.

Видимо, задача у Каспарова была иной… подогреть интерес мирового сообщества и людей к ИИ и его возможностям.
1
Да и " алгоритмы " игры компа были прописаны в программу… т.е. была вбита база данных по ПРАВИЛАМ игры и по играм уже проведённых и она была не столь большой, да и алгоритмы принятия того или иного хода уже зараннее были однозначно прописаны ( с корректировкой гроссмейстеров )… вот и всё о " початках " ИИ. НО САМ КОМП НЕ МОГ СМОДЕЛИРОВАТЬ ОПИРАЯСЬ НА «свой интеллект» тогда ещё.

Добавить комментарий