Для работы проектов iXBT.com нужны файлы cookie и сервисы аналитики. Продолжая посещать сайты проектов вы соглашаетесь с нашей Политикой в отношении файлов cookie

Игры, в которых победил искусственный интеллект

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com

15 апреля 2020, 12:30 | Обзор | Игры

Перевод статьи с сайта https://towardsdatascience.com/

Некоторые вещи, которые выполняет искусственный интеллект, кажутся нам совсем не впечатляющими. Подумайте о том, как ваша камера распознает и автоматически фокусируется на лицах на фотографиях. Эта технология существует с 2001 года, и она, как правило, уже не впечатляет людей. Почему же? Ну, поскольку ты тоже можешь это сделать, ты можешь сосредоточить свой взгляд на чьем-то лице очень легко. На самом деле, это так просто, что ты даже не знаешь, как это сделать. Если ИИ тоже может это сделать, тогда кому важно, как это работает? Хотя мы можем не понимать, как работает этот ИИ, лежащие в его основе механизмы не делают ничего, что мы не можем. По крайней мере, как я считаю, так думает большинство людей.

В играх все как раз наоборот. В отличие от врожденных способностей (как фокусировка зрения) которые у нас есть, во время игры у вас есть понимание того, как и почему вы принимаете решения. Поэтому, когда ИИ принимает решения о том, как играется игра, они гораздо интереснее, потому что вы могли бы оказаться в той же ситуации, что и ИИ, принимая точно такие же решения. ИИ в народе считается чем-то, что заменяет человеческую работу. Когда ИИ играет в игру, чувствуется близость к позиции, занимаемой человеком в окружающем нас мире, так как игры — это вещи над которыми мы должны думать сознательно. Игры, которые сыграл ИИ, таким образом захватили интерес новостей, вот самые важные победы, которые он одержал.

1996–1997 Каспаров vs Deep Blue

10-го февраля 1996 IBM’s Deep Blue столкнулся лицом к лицу с Гарри Каспаровым*** и стала первой компьютерной программой, которая победила действующего чемпиона мира по шахматам в нормальных условиях (то есть с часами на месте). К сожалению для Deep Blue, за оставшиеся пять игр в матче, она проиграла три матча и дважды сыграла в ничью.

На следующий год был назначен второй матч, и команда Deep Blue сделала обновления своего программного обеспечения. 3-го мая Deep Blue открыла матч поражением. Во второй игре у Deep Blue возникли проблемы с расчётом что делать, и чтобы не позволить себе тратить слишком много времени, она сделала случайный ход. Ход был ужасным, но это отбросило Каспарова, который предположил, что Deep Blue может расчитывать ходы наперед игры больше, чем он. Вместо того чтобы прийти к поражению на глазах у миллионов людей, он подал в отставку во второй игре (распространенная практика в шахматах). В реальности Каспаров мог выиграть вторую игру, если бы доиграл её до завершения, что было для него небольшим смущением, что привело к тому, что в следующих играх он играл более безрассудно, кульминацией чего стала победа Deep Blue в 2-х играх против 1-й у Каспарова.

Как заявил журналист ESPN Джереми Шаап, «люди следили за этим во всем мире, люди, которые не интересовались шахматами, люди, которые только имели интерес к этой истории — человек против машины». Интерес к этой игре питался утверждением Каспарова в конце второй игры о том, что IBM обманывает, которое он основывал на разнице в качестве игры Deep Blue между первой и второй игрой. Шахматы были барометром интеллекта с момента его изобретения в VI веке. Думать, что люди могут быть побиты компьютерами, было обидно, поскольку все еще было много способов, по которым компьютеры уступают людям. Конечно, IBM не обманывала и изменение качества Deep Blue объясняла своим случайным ходом.

Команда IBM по связям с общественностью раскачало это событие, и акции компании значительно выросли. С победой в кармане, IBM отклонила реванш, затем демонтировала Deep Blue и сделала ее последним местом отдыха музей компьютерной истории в Mountain View.

Каспаров больше не считает, что Deep Blue обманывала, и признает, что не только Deep Blue может его обыграть, но и саму Deep Blue можно обыграть новыми программами, работающими на более мелких компьютерах. Эта игра была большим шагом в повествовании искусственного против человеческого интеллекта и она утвердила игры как метод сравнения.

2011 IBM Watson побеждает шоу Jeopardy!

Во время совместного обеда два руководителя IBM начали комментировать успех Кена Дженнингса на Jeopardy! Который до сих пор удерживает рекорд в большинстве выигранных игр подряд. Возможно, в стремлении к успеху после победы Deep Blue они создали Watson — систему ответов на вопросы, которая должна была обыграть Кена Дженнингса.

Watson, названный в честь основателя IBM Томаса Дж. Уотсона, был создан в 2005 году, но начал своё знаменитое появление лишь в 2011 году. Watson был направлен против Брэда Руттера, вместе с Кеном Дженнингсом, которые считались двумя лучшими в Jeopardy!, в то время. Кен был программистом, который окончил несколько курсов по ИИ и принял вызов частично, потому что он думал, что нет никаких способов, чтобы система ИИ могла победить его.

Watson выиграл два матча, которые он сыграл против Брэда и Кена, заработав $77 147 к их $24 000 и $21 600 соответственно. Затем Watson нанёс поражение двум членам конгресса, Раш Д. Холд-младшему (бывший участник Jeopardy!) И Билл Кэссиди, добившись друго двухпартийного поражения.

В отличие от Deep Blue, компания IBM перевела Watson на многие коммерческие продукты, включая Watson Text to Speech, Watson Speech to Text, Watson Natural Language Classifier, Watson Natural Language Understanding, Watson Assistant, Watson Health и др.

2013 DeepMind побеждает Atari

В то время как Watson был разработан для конкретной цели, DeepMind Technologies хотела создать систему ИИ, которую не нужно обучать на узком поле, приблизив нас к определению общего ИИ. Цель, которую они поставили перед собой, была победить многие игры Atari только с одной моделью, которая не была переработана для какой-либо конкретной игры.

p.s. после 600-й попытки обучаемый агент находит и использует наилучшую стратегию тунеллирования, затем выбивает мяч за стенку.

Используя только данные того, что было на экране и, по указанию максимизировать счет, DeepMind смог не только обыграть каждую игру, но и получить лучшие оценки, чем даже лучшие человеческие игроки. Доклад 2013 года — Atari играя с усиленным обучением, привел к тому Google приобрели их в 2014 году.

2016 AlphaGo vs Lee Sedol

Преимуществом Deep Blue была его способность обрабатывать большое количество ходов сразу и умный способ оценки, который был лучшим. Для азиатской настольной игры Go это было просто невозможно. Правила игры довольно просты, но было приблизительно 2 * 10 ¹ ⁷⁰ количество состояний, в которых могла быть игра в любой момент.

В качестве ссылки это число больше, чем число атомов во Вселенной. Таким образом, стратегию в игре Go трудно определить, так как для каждого состояния существует много решений, чтобы оценить, каждое приводит к еще большему количеству состояний для оценки. Без грубого силового подхода, AlphaGo компании DeepMind научилась придавать ценность до нескольких периодов в будущем, а затем научилась принимать решения на основе этой ценности.

После победы над чемпионом Европы по Go Фан Хуэй, AlphaGo была поставлена задача сыграть с Ли Седола, игрока одного из самых высоких рейтингов за всю историю. Победа над Ли побудила его уйти в отставку, сказав «Даже если я снова стану номером один, есть сущность, которую нельзя победить».

2017 AlphaZero Masters Chess, Go, and Shogi

AlphaZero был обобщенной версией AlphaGo, построенной с намерением выиграть Chess, Go и Shogi (японская версия шахмат). Мало того, что AlphaZero обыграл AlphaGo, это было сделано, только играя в имитированные игры против себя, не имея примеров экспертных игр, на которые можно было бы посмотреть. В начале этих имитаций она абсолютно ничего не знала. Он освоил Chess после 9 часов обучения, Shogi после 2, и Go после 34.

В то время как это было здорово для Google в привлечении талантов, профессор ИИ Джоанна Брюсон отметила, что кредит, который Google получила за эти достижения, может дать массовое переговорное преимущество с правительствами, стремящимися регулировать ИИ.

2019 AlphaStar

Затем AlphaZero был переведен в AlphaStar с намерением победить в стратегии реального времени игре Starcraft. В 2019 AlphaStar достиг рейтинга в топ-0,2 процентов человеческих игроков. Это был первый случай, когда ИИ когда-либо возглавлял электронный спорт. AlphaStar не идеально подходит для Starcraft, но по-прежнему рассматривается как масштабная веха для ИИ, так как работает в режиме реального времени, с частичной информацией, по сложным правилам. В то время как Go был относительно сложным в количестве решений, с которыми сталкиваешься, правила к Go достаточно просты по сравнению с Starcraft. Эта более сложная среда, в которой работает AlphaStar, являясь хорошим показателем того, что ИИ готова к более широкому коммерческому использованию, как в самоуправляемых транспортных средствах, робототехнике и цепочках поставок.

продолжение следует...

* — Каспаров Гарри Кимович — признан(а) иностранным агентом

** — Каспаров Гарри Кимович — включен в Перечень физических лиц, в отношении которых имеются сведения об их причастности к экстремистской деятельности или терроризму

9 комментариев

Добавить комментарий

Впечатление, что перевод сделан в основном искусственным интеллектом…

Ответить

ЕГЭ считать переводом естественного в искусственный? :)

Ответить

И после этого автор даже не перечитывал статью!

Ответить

5 октября 1996 г. вышли первые (вообще в мире?) боты (на основе скриптового ИИ) The Reaper Bot для Quake. Спокойно побеждают в боях большинство игроков в Quake. ;))

Ответить

В основном, потому что реакция быстрая и точность выстрелов. Нарисовал для него карту и он бегает, есть алгоритмы, но это не ИИ, он не обучается самостоятельно.

Ответить

А кто и где сказал, что ИИ должен учиться постоянно, а не быть наученным 1 раз для выполнения конкретной задачи? ;)

Ответить

В Старкрафте он нифига не победил. Обыграл пару хороших игроков пользуясь читами. Зато потом на выставке его с издёвкой обыгрывал игрок из даймонд лиги. Середнячок то есть. А как половину читов убрали, то вообще стало скучно и больше АльфаСтар в игре не появлялся.

Ответить

В реальности Каспаров мог выиграть вторую игру, если бы доиграл её до завершения, что было для него небольшим смущением, что привело к тому, что в следующих играх он играл более безрассудно, кульминацией чего стала победа Deep Blue в 2-х играх против 1-й у Каспарова.

Видимо, задача у Каспарова была иной… подогреть интерес мирового сообщества и людей к ИИ и его возможностям.

Ответить

Да и " алгоритмы " игры компа были прописаны в программу… т.е. была вбита база данных по ПРАВИЛАМ игры и по играм уже проведённых и она была не столь большой, да и алгоритмы принятия того или иного хода уже зараннее были однозначно прописаны ( с корректировкой гроссмейстеров )… вот и всё о " початках " ИИ. НО САМ КОМП НЕ МОГ СМОДЕЛИРОВАТЬ ОПИРАЯСЬ НА «свой интеллект» тогда ещё.

Ответить

Добавить комментарий

Сейчас на главной

Новости

Google хочет выпустить в небо миллионы комаров

Оффтопик
2 часа назад
0

Три пары часов из экопластика с прозрачным синим дизайном выпустила Casio

Одежда и аксессуары
3 часа назад
0

Стал известен график релиза бета-версий и финального патча iOS 27

Первая вакцина разработанная с помощью ИИ открывает колоссальные возможности противостоять пандемии

Наука и космос
4 часа назад
0

T‑Mobile устанавливает лимиты на скорость 5G

Публикации

Мем, который парализовал университеты: почему простая задача «3x+1» уже век крадет время у лучших умов планеты

Статья
1 час назад
Наука и космос

Математика полна сложных формул и теорем, для понимания которых требуются годы специального обучения. Однако существуют задачи, правила которых можно объяснить за минуту, но на их решение уходят...

Как работает естественный отбор на самом деле: ученые объяснили, почему полезные мутации не всегда закрепляются

Статья
4 часа назад
Наука и космос

Более полувека в науке о жизни доминировала концепция, которая на первый взгляд кажется парадоксальной. Согласно нейтральной теории молекулярной эволюции, созданной японским генетиком Мотоо Кимурой...

Полгода с iPhone 17 pro после Android: о чем никто не предупреждает перед переходом

Мнение
6 часов назад
Смартфоны и телефоны

Последние двадцать лет я был убежденным пользователем Android. За это время через мои руки прошли практически все знаковые флагманы: Samsung Galaxy S-серии, Xiaomi Ultra, OnePlus, Oppo, Vivo и...

Почему медузы пережили пять массовых вымираний, включая то, что уничтожило динозавров

Статья
6 часов назад
Флора и фауна

66 миллионов лет назад астероид диаметром около 10 километров врезался в район современного полуострова Юкатан. Ударная волна, кислотные дожди и многолетняя «ядерная зима» из пыли и сажи разрушили...

Пять звезд за решеткой: как из самой мрачной тюрьмы Стамбула сделали отель

Статья
7 часов назад
Путешествия и туризм

В самом сердце исторического центра, рядом с Айя-София, открывает свои двери для туристов роскошный отель Four Seasons. Здесь безупречный сервис, мраморные полы, неоклассическая архитектура и...

Обзор графического планшета XpPen Artist 16 3Rd: лучший подарок для дочки

Обзор
9 часов назад
Платформа ПК

Иногда хорошие оценки, это повод не просто купить подарок, а вложиться в увлечение ребёнка. После успешного окончания 7 класса я решил подарить дочке не очередной гаджет, который через неделю...