Шахматный ИИ не смог освоить игру Ним из-за неспособности освоить математическую логику
Специалисты Бэй Чжоу и Сорен Риис опубликовали в журнале Machine Learning результаты исследования, демонстрирующие неэффективность технологии обучения AlphaZero в беспристрастных играх. Метод самообучения, успешно применявшийся в шахматах и го, оказался непригодным для игры Ним и аналогичных задач.
В эксперименте ИИ обучали игре Ним по методике AlphaGo — через многократные партии с самим собой. На доске с пятью рядами спичек система показала прогресс после 500 итераций. При добавлении шестого ряда улучшение замедлилось. На семирядной доске обученная версия не отличалась по результатам от версии с полностью случайными ходами.
Проблема связана с неспособностью ИИ распознать математическую функцию четности, которая позволяет определить выигрышную позицию в Ним. Исследователи установили, что обученная система оценивала все три выигрышных хода начальной позиции как приблизительно равные, не различая их истинную ценность.
Согласно теореме о беспристрастных играх, любая позиция в таких играх представима через конфигурацию Ним. Это распространяет выявленную проблему на целую категорию игровых задач, где оба игрока используют идентичные фигуры и правила.
Авторы обнаружили признаки аналогичных слабостей в шахматных ИИ. Системы пропускали определённые маты и допускали ошибки в эндшпиле, которые удавалось избежать только при расчёте на несколько ходов вперёд. Исследователи связывают это с редкостью подобных конфигураций в шахматах по сравнению с Ним.
Результаты указывают на ограничения обучения через ассоциации при задачах, требующих символического мышления. Выводы актуальны для разработки ИИ-систем решения математических проблем.
Источник: Ars Technica





0 комментариев
Добавить комментарий