Шахматный ИИ не смог освоить игру Ним из-за неспособности освоить математическую логику

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Специалисты Бэй Чжоу и Сорен Риис опубликовали в журнале Machine Learning результаты исследования, демонстрирующие неэффективность технологии обучения AlphaZero в беспристрастных играх. Метод самообучения, успешно применявшийся в шахматах и го, оказался непригодным для игры Ним и аналогичных задач.

В эксперименте ИИ обучали игре Ним по методике AlphaGo — через многократные партии с самим собой. На доске с пятью рядами спичек система показала прогресс после 500 итераций. При добавлении шестого ряда улучшение замедлилось. На семирядной доске обученная версия не отличалась по результатам от версии с полностью случайными ходами.

Проблема связана с неспособностью ИИ распознать математическую функцию четности, которая позволяет определить выигрышную позицию в Ним. Исследователи установили, что обученная система оценивала все три выигрышных хода начальной позиции как приблизительно равные, не различая их истинную ценность.

Автор: freepik Источник: ru.freepik.com

Согласно теореме о беспристрастных играх, любая позиция в таких играх представима через конфигурацию Ним. Это распространяет выявленную проблему на целую категорию игровых задач, где оба игрока используют идентичные фигуры и правила.

Авторы обнаружили признаки аналогичных слабостей в шахматных ИИ. Системы пропускали определённые маты и допускали ошибки в эндшпиле, которые удавалось избежать только при расчёте на несколько ходов вперёд. Исследователи связывают это с редкостью подобных конфигураций в шахматах по сравнению с Ним.

Результаты указывают на ограничения обучения через ассоциации при задачах, требующих символического мышления. Выводы актуальны для разработки ИИ-систем решения математических проблем.

Источник: Ars Technica

Автор не входит в состав редакции iXBT.com (подробнее »)

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Ученые научились выключать «гормон любви»: почему точечная блокировка окситоцина поможет в изучении мозга

Окситоцин и вазопрессин — это нейропептиды, которые выполняют ключевые функции в организме млекопитающих. Их эволюционная история насчитывает около 600 миллионов лет, и за это время они...

Призраков не существует: новая математическая структура объяснила эффект темной материи без невидимых частиц

Галактики вращаются слишком быстро. Окраины спиральных структур движутся с такой скоростью, что гравитация видимого вещества — всех существующих там звезд, планет и газовых...

Почему Трухильо называют городом вечной весны и стоит ли его посетить

Погода не устает мучить людей своими перепадами: летом становится невыносимо жарко, зимой заваливает снегом, и вообще хочется вечной весны с ее умеренными температурами, но это лишь мечты…...

Борода: 5 причин, почему на Руси берегли растительность на лице (от штрафов до Шнобелевки)

  • Тематическая подборка
  • Оффтопик
Почему борода на Руси стоила дороже пальца и как она помогала выжить в драке? 5 причин: от пропуска в Рай до бунта против бритвы. Как обычная растительность на лице стала символом свободы и веры.

FiiO опять взялись за старое: представлен автоматический виниловый проигрыватель TT11

Индустрия воспроизведения звука с виниловых пластинок пока еще на подъеме, выпускают новые музыкальные релизы на пластинках, производят проигрыватели в разных ценовых диапазонах. Это даже модно....

Группа «БиС» воссоединилась спустя 17 лет на концерте Влада Соколовского: как это было

Девятого апреля во время сольного концерта российского певца Влада Соколовского было объявлено о воссоединении группы «БиС», распавшейся 17 лет назад. На сцене появился Дмитрий Бикбаев, второй...