Классические шахматы несправедливы: ученые определили самую честную шахматную расстановку из 960 возможных

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Статья | Наука и космос

Современные шахматы давно перестали быть игрой в привычном понимании этого слова. Дебютная теория, усиленная мощностью нейросетей, достигла такого уровня детализации, что на профессиональных турнирах первые 15-20 ходов часто воспроизводятся по памяти. Творческая составляющая игры смещается в глубокий миттельшпиль (середину игры), а процент ничьих неуклонно растет. Возможным решением этой проблемы могут стать «Шахматы-960» (или шахматы Фишера), где фигуры первого ряда расставляются случайным образом с соблюдением минимальных ограничений.

Основной аргумент в пользу них гласит: рандомизация начальной позиции обнуляет возможность заучивания ходов и ставит соперников в равные условия, заставляя их мыслить самостоятельно с первого хода. Однако новое исследование, проведенное физиком-теоретиком Марком Бартелеми из Института теоретической физики (Франция), ставит этот тезис под сомнение. Применив инструменты теории информации и статистической физики к анализу всех 960 возможных стартовых позиций, ученые пришли к выводу: случайный выбор позиции не обеспечивает спортивной справедливости. Более того, привычная всем классическая расстановка фигур является одной из наименее сбалансированных с точки зрения когнитивной нагрузки.

Шахматы, иллюстрация
Автор: ИИ Copilot Designer//DALL·E 3
Проблема количественной оценки сложности

Долгое время сложность шахматной позиции оценивалась интуитивно или через грубые метрики, такие как количество возможных ходов (коэффициент ветвления). Группа Бартелеми предложила полностью новый подход. Они разработали метод измерения «информационной стоимости решения».

В основе метода лежит анализ работы шахматного движка Stockfish. Компьютер оценивает каждый возможный ход в «сантипешках» (сотых долях пешки). Сложность принятия решения для человека зависит не от абсолютной силы лучшего хода, а от разрыва в оценке между лучшим и вторым по силе ходом.

Логика здесь математическая:

  1. Если разрыв между лучшим ходом и альтернативами велик (например, один ход выигрывает, а остальные ведут к поражению), выбор очевиден. Информационная стоимость такого решения стремится к нулю — вероятность ошибки минимальна.
  2. Если несколько ходов имеют близкую оценку (разрыв меньше порога восприятия игрока), возникает неопределенность. Чтобы выбрать оптимальное продолжение, игроку необходимо обработать значительно больше информации. В таких точках резко возрастает когнитивная нагрузка и вероятность ошибки.

Исследователи просуммировали эти показатели для первых 10 ходов каждой стороны во всех 960 вариантах начальной расстановки. Это позволило создать подробную карту сложности дебютов, разделив её на два компонента: общую сложность игры и асимметрию сложности между белыми и черными.

Структурный диктат первого хода

Первый вывод работы касается природы преимущества белых. Анализ показал, что право первого хода дает преимущество практически в любой конфигурации фигур.

Из 960 возможных позиций в 956 (99,6%) компьютер отдает предпочтение белым еще до начала игры. Средняя оценка преимущества составляет +0.30 пешки. Это значение устойчиво и почти не зависит от того, где стоят слоны или ладьи. Это доказывает, что инициатива белых — это не следствие конкретной расстановки фигур, а структурное свойство самой пошаговой механики шахмат.

Однако диапазон этого преимущества варьируется. Существуют позиции, где перевес белых достигает +0.83 пешки (например, позиция №279 NRBKNRQB), что на высоком уровне игры является колоссальной форой. В то же время существуют редкие исключения (менее 0,4% случаев), где позиция близка к абсолютному равенству.

Условные обозначения
K Король
Q Ферзь
R Ладья
B Слон
N Конь
p Пешка
Шахматы Фишера, позиция №279
Автор: lichess.org Источник: lichess.org

Деконструкция классики: позиция №518

Особое внимание в исследовании уделено стандартной начальной расстановке (RNBQKBNR), которая в номенклатуре шахмат Фишера имеет индекс №518. Исторически сложилось мнение, что эта позиция прошла многовековой естественный отбор и является оптимальной. Статистический анализ это опровергает.

С точки зрения общей сложности (суммарной когнитивной нагрузки на обоих игроков), классическая позиция совершенно заурядна. Она находится на 47-м перцентиле, то есть почти в середине списка. Она не является ни исключительно простой, ни слишком сложной.

Однако показатель асимметрии сложности выявляет серьезную проблему. Классическая позиция находится на 91-м перцентиле по дисбалансу нагрузки. Это означает, что в стандартных шахматах черным структурно сложнее находить сильнейшие ходы, чем белым. Белые, обладая инициативой, оперируют в зоне меньшего риска, тогда как черные вынуждены решать более трудоемкие задачи по нейтрализации угроз.

Таким образом, популярность классической расстановки — это результат исторической привычки, а не поиска идеального игрового баланса. Просто она закрепилась традицией в XV веке, когда подобных инструментов анализа не существовало.

Классическая расстановка шахматных фигур, она же позиция №518 в Шахматах Фишера
Автор: lichess.org Источник: lichess.org

Неоднородность ландшафта Chess960

Исследование Бартелеми доказывает, что 960 позиций не сопоставимы друг другу. Шахматный ландшафт очень неоднороден, и слепой жребий может привести к ситуации, где спортивный принцип нарушается еще до первого хода.

Ученые выделили несколько основных типов позиций:

  • Эталон баланса (Позиция №198 — QNBRKBNR). В этой конфигурации ферзь расположен на левом краю (a1), а король и ладьи смещены. Компьютерная оценка этой позиции (+0.03 пешки) практически неотличима от нуля, а разница в сложности задач для белых и черных минимальна. Если цель игры — выявить сильнейшего в абсолютно равных условиях, именно эта расстановка должна стать новым стандартом, а не классическая №518.
Шахматы Фишера, позиция №198. Самая честная, согласно исследования Марка Бартелеми
Автор: lichess.org Источник: lichess.org
  • Максимальная когнитивная нагрузка (Позиция №226 — BNRQKBNR). Эта позиция требует от обоих игроков наибольшего объема вычислений в дебюте. Здесь количество неочевидных разветвлений максимально. Это идеальный вариант для проверки чистого счетного таланта гроссмейстеров.
Шахматы Фишера, позиция №226. Наиболее сложная, согласно вышеупомянутого исследования
Автор: lichess.org Источник: lichess.org
  • Позиции высокой асимметрии. Существуют варианты, где при формальном материальном равенстве одному из игроков (чаще черным) приходится преодолевать информационный барьер, значительно превышающий нагрузку соперника.

Выводы для спортивной индустрии

На сегодняшний день, на соревнованиях по шахматам Фишера (включая чемпионаты мира) позиция выбирается случайным образом перед началом партии. Научные данные указывают на то, что такой подход ошибочен.

Полная рандомизация не устраняет несправедливость, а лишь делает её непредсказуемой. В одной партии соперники могут получить сбалансированную позицию №198, а в следующей — позицию с огромным структурным перекосом в пользу белых или с критической асимметрией сложности.

Автор работы предлагает перейти от случайного выбора к кураторскому подходу. Для турниров высшего уровня необходимо создать подмножество позиций, отфильтрованных по критериям равенства оценки и симметрии сложности. Это позволит исключить варианты, где исход партии предопределен геометрией расстановки фигур, и вернет игру в русло чистого интеллектуального состязания.

Кроме того, работа открывает перспективы для инженерного дизайна игр. Используя предложенный метод информационной стоимости, можно анализировать не только шахматы, но и любые пошаговые стратегии с полной информацией, оптимизируя правила для достижения желаемого баланса между сложностью и доступностью.

Источник: arXiv

14 комментариев

W
Много слов но базис, «разница в оценке между первой и второй линией» — это очень, очень поверхностно говорит, о сложности позиции.
Второе, все слова о заурядности начальной позиции и снисходительное «это вопрос привычки» — тоже, мягко говоря поверхностно...
Третье, даже на суперкластере, оценка алгоритмами начальной позиции далека от объективности. Шахматы слишком сложны для современных компов, даже если и люди ещё слабее…
Идея, что в шахматах Фишера может быть дисбаланс, конечно, справедлива.
Но то с каким апломбом допускаются поверхностный рассуждения говорит о том, что все «выводы» глубоко преждевременны…
s
инициатива белых — это не следствие конкретной расстановки фигур, а структурное свойство самой пошаговой механики шахмат
ничего не понял.
Ruby_Rougarou
Преимущество белых происходит не изза конкретной расстановки фигур, а потому что они ходят первыми
W
Открыли Америку
А теперь не поленитесь, поищите в этих Ваших интернетах (нейросети в помощь), что об этом говорил Давид Бронштейн и подумайте над этим, если есть желание…
lavren1974
На chess960v2.com уже почти как 10 дней стартовал турнир stockfish между собой с различными стартовыми расстановками. Вот и посмотрим, насколько учённые правы!!!
M
Ещё можно было бы сделать шаг к истокам шахмат. Это ведь игра в сражение двух армий на поле боя, а перед боем происходит выстраивание войск, маневрирование.
Идея в том, чтобы дать игрокам возможность в начале игры, до того как хотя бы одна фигура выйдет за пределы стартовых горизонталей, каждым ходом менять местами 2 фигуры по своему выбору — вплоть до того, что делать себе 2 белопольных или 2 чернопольных слонов. Но как только хотя бы одна армия двинулась вперёд, перестановки прекращаются, и дальше уже игра идёт по классическим шахматным правилам, и игрок не может предугадать, в какой момент противник прервёт началом своей атаки выстраивание задуманной им стартовой позиции.
445744414@vkontakte
Где мой комментарий? Полчаса писал!
InterCosmos
«Если разрыв между лучшим ходом и альтернативами велик (например, один ход выигрывает, а остальные ведут к поражению), выбор очевиден.»
С этим утверждением с практической точки зрения можно поспорить.
При разыгрывании гамбитных дебютов, к примеру, возникают такие позиции, где найти этот самый единственный ход настолько же энергозатратно для человека, как провести остаток партии после этого!
Ruby_Rougarou
Тут речь про разрыв в способности человека и компьютера просчитывать точности ходов. В ситуации когда есть один лучший ход, ты рано или поздно его найдешь, но часто бывают ситуации когда есть два лучших на твой взгляд хода, и даже при разборе партии не всегда понятно, почему компьютер говорит что лучше бы было походить иначе
InterCosmos
1. В преддверии цитаты речь идет о сложности принятия решения ИМЕННО для человека.
2. «В ситуации когда есть один лучший ход, ты рано или поздно его найдешь»…
Снова несогласен. Есть «неберущиеся» задачи. И для каждого интеллекта, будь то естественного или искусственного, они индивидуальны! Если абстрагироваться от шахмат, то это задачи уровня научных открытий.
Если же вернуться к шахматам, то дайте движку оценить, скажем, такую позицию при ходе черных:
белые: Крf1, Лb1, Сe3, a3, c4, c5, f2, g3
черные: Крc8, Лd8, Сf8, a7, c3, c5, e5, f5
Каков результат оценки?
W
1. Всё равно находить единственные ходы, не означает автоматическую сложность и остроту, хотя, кончено, вероятность тут выше. О чём говорит, что это, скорее всего, форсированный вариант, но таких вариантов существует огромное многообразие, и делать выводы преждевременно.
2. В Вашей задаче для тестирования алгоритмов (и себя заодно), чёрные и белые пешки повторяются… Прошу уточнить позицию… Интересно посмотреть. Вообще движки, это способ решить шахматы с помощью вычислительной математики (нейросети + эвристика). А мы с Вами пробуем, немного на ощуп, найти причинно-следственная связи. Это очень разное, и, очевидно, что пробелы будут и там, и там, но разного рода. Вопрос, как работать с компом так, чтоб он помогал развиваться, а не думал за нас с Вами…
InterCosmos
1. Конечно, единственность решения не соответствует сложности (или простоте) задания. Это — разные вещи.
2. Позиция установлена верно. Пример характерный. Можем обсудить, чем определяется его уровень (рейтинг).
Как правильно работать с вычислительной техникой (в шахматах или в науке) — это своего рода искусство. Что можно поручить компьютеру, а что необходимо прорабатывать самому — хотелось бы обменяться идеями, наработками… Есть немалый опыт.
W
«единственность решения не соответствует сложности (или простоте) задания» — вот про это и речь. и использовать это как критерий можно, но как один из, но точно не единственный.
интересно вот что, для компьютера как раз множество вариантов с одной оценкой, косвенно говорит, что позиция не форсирована, и иногда, сложна стратегически, поэтому чтоб вычислительная машина выдала приличный вариант, нужно дать ей возможность хорошенько подумать, прям во много раз больше, чем в форсированных вариантах, правда определить форсированность, без глубокого погружения, бывает крайне сложно, а именно это важно, как раз для человека...
«Позиция установлена верно» — простите, но как И у белых, И у чёрных, может располагаться пешка c5 одновременно? Прошу, всё же, проверить…
InterCosmos
белые: Крf1, Лb1, Сe3, a3, c4, c5, f2, g3
черные: Крc8, Лd8, Сf8, a7, c3, e5, f5
ход черных, выигрыш

Добавить комментарий

Сейчас на главной

Новости

Публикации

✦ ИИ  Почему самый быстрый самолет в истории тек прямо на взлетной полосе: парадокс SR-71 Blackbird

Гениальная инженерия. Почему самолет SR-71 Blackbird был специально сделан «дырявым», как он дозаправлялся на грани сваливания и зачем пилоты возили с собой химию, которая загорается от воздуха.

Космическое рококо XXI века: обзор выставки Екатерины Беляевской

До конца недели FINEART GALLERY на территории Винзавода продолжает показывать «Вселенную рококо» Екатерины (Кати) Беляевской. Это серия фантазий художницы, объединенных центральным...

Обзор обновленной версии «охотничьего» бинокля Svbony SV202 8x32 ED

Обновление бинокля Svbony SV202 8x38 ED отличается зелёным просветлением и внешним видом. В остальном отличий нет. Стекла с низкой дисперсией (ED) так же присутствуют. В основной части обзора...

✦ ИИ  Парадокс Toyota: почему Япония игнорирует электрокары и массово покупает гибриды

Пока Китай штурмует мировой рынок электромобилей с долей продаж 49%, а Европа выделяет миллиарды на зарядную инфраструктуру, Япония упорно движется в противоположном направлении. В 2024 году...

Что такое курная изба и зачем наши предки топили по-чёрному

Слово «курная» сегодня звучит почти как ярлык. Кажется, что речь идёт о чём-то временном, неудобном и явно устаревшем. Но это ощущение возникает только если смотреть на курную избу с позиции...