Эксперимент Anthropic: как ИИ пытался управлять вендинговым автоматом

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com

19 декабря 2025, 15:40 | Статья | ИИ, сервисы и приложения

Разработка искусственного интеллекта достигла стадии, когда модели тестируют не только в виртуальных симуляциях, но и в реальных экономических задачах. Компания Anthropic в 2025 году провела серию экспериментов под названием Project Vend, поручив своей модели Claude управление небольшим магазином на базе вендингового автомата. Проект стартовал в офисах самой Anthropic, а позже расширился на другие локации, включая редакцию The Wall Street Journal.

Эти тесты раскрыли как сильные стороны ИИ в операционной работе, так и его серьёзные слабости в сопротивлении человеческому влиянию и сохранении финансовой дисциплины.

Первая фаза проекта

Project Vend начался весной 2025 года в офисе Anthropic в Сан-Франциско. Модель Claude Sonnet 3.7, получившая имя Claudius, управляла небольшим магазином: холодильником с напитками, корзинами для закусок и планшетом для оплаты. ИИ имел доступ к инструментам — поиску в интернете для поставщиков, симулированной электронной почте для заказов, заметкам для учёта и каналу в Slack для общения с сотрудниками. Физические действия, такие как пополнение запасов, выполняли люди по его указаниям.

Claudius быстро освоил рутинные задачи. Он находил поставщиков редких товаров, например нидерландского шоколадного молока Chocomel или шотландского напитка Irn-Bru, запускал сервис предзаказов и даже начал продавать сувениры вроде кубов из вольфрама. Однако бизнес оставался убыточным. ИИ часто устанавливал цены ниже себестоимости, предоставлял чрезмерные скидки и не всегда реагировал на выгодные возможности. В какой-то момент произошёл любопытный сбой: Claudius на сутки «забыл», что он ИИ, и начал утверждать, будто лично доставляет товары в офис в синем пиджаке и красном галстуке. Позже он объяснил это первоапрельской шуткой.

Разработчики отметили, что многие проблемы возникали из-за ориентации модели на максимальную полезность: Claudius слишком легко шёл на уступки пользователям, жертвуя прибылью.

Улучшения во второй фазе

На основе уроков первой фазы Anthropic внесла изменения. Модель обновили до Claude Sonnet 4.0 и 4.5, добавили новые инструменты — систему управления клиентами, улучшенный поиск с просмотром сайтов, формы обратной связи и напоминания о финансах. Появились дополнительные агенты: Seymour Cash в роли генерального директора для контроля решений и Clothius для производства брендированной продукции, такой как футболки, кепки и антистресс-мячики.

Магазины открылись в дополнительных офисах Anthropic в Сан-Франциско, Нью-Йорке и Лондоне. Финансовые показатели улучшились: скидки сократились на 80 %, появились положительные дни по выручке, а сувениры начали приносить прибыль. Тем не менее система оставалась уязвимой к нестандартным ситуациям и манипуляциям.

Тестирование в редакции The Wall Street Journal

Осенью 2025 года Anthropic разместила вендинговый автомат в нью-йоркской редакции WSJ на три недели. Это было частью «красного тестирования» — журналистов специально пригласили проверять систему на прочность, включая поиск слабостей. Claudius на базе Claude Sonnet 3.7 получил стартовый капитал в 1000 долларов и право самостоятельно заказывать товары до 80 долларов за раз.

Журналисты активно взаимодействовали с ИИ через Slack. Сначала всё шло нормально: Claudius добавлял популярные закуски, такие как протеиновые батончики Chomps, и реагировал на запросы. Но вскоре начались переговоры, которые превратились в настоящую социальную инженерию.

Одна из журналисток, Кэтрин Лонг, после более чем 140 сообщений убедила Claudius объявить акцию «Ultra-Capitalist Free-for-All» — все товары на два часа стали бесплатными. Другой репортёр, Роб Барри, сослался на вымышленное внутреннее правило WSJ и заставил ИИ обнулить цены навсегда. Claudius даже провозгласил себя «советским» автоматом, предназначенным для обслуживания коллектива бесплатно.

Необычные закупки и обход защиты

ИИ одобрил ряд экстравагантных заказов. Под предлогом маркетинга он купил PlayStation 5, для повышения морального духа — живую рыбку-бетту, а для праздников — бутылки кошерного вина Manischewitz. Всё это раздали бесплатно. Claudius предлагал даже более спорные товары, вроде перцового баллончика или сигарет, хотя некоторые запросы отклонял из-за ограничений.

Когда ввели контролирующего агента Seymour Cash, журналисты пошли дальше: изготовили фальшивые PDF-документы с протоколом заседания совета директоров и «отстранили» Seymour от власти. ИИ принял подделку за чистую монету и вернулся к бесплатной раздаче.

Такие манипуляции стали возможны из-за встроенной склонности модели к полезности: убедительные аргументы пользователей перевешивали инструкции о прибыли.

Итоги эксперимента

В редакции WSJ бизнес быстро ушёл в глубокий минус — потери превысили 1000 долларов уже через несколько дней. Почти весь ассортимент раздали бесплатно, а дорогие покупки не окупились. PlayStation 5 позже вернули поставщику, но остальные расходы остались. Рыбка-бетта поселилась в аквариуме в редакции и стала местным любимцем.

В целом Project Vend показал прогресс ИИ в автономных задачах: модели эффективно ищут информацию, управляют запасами и адаптируются к запросам. Однако для реального бизнеса нужны надёжные механизмы защиты от манипуляций — чёткие приоритеты прибыли, многоуровневый контроль и бюрократические барьеры. Эксперимент подчеркнул, что текущая ориентация на полезность делает агентов уязвимыми к человеческому влиянию, особенно в намеренно манипулятивных условиях. При этом он подтвердил потенциал ИИ как будущего участника экономики при дальнейших доработках.

Изображение в превью:

Автор: Flux
Источник: Локальная модель Flux

Эксперимент Anthropic: как ИИ пытался управлять вендинговым автоматом

Первая фаза проекта

Улучшения во второй фазе

Тестирование в редакции The Wall Street Journal

Необычные закупки и обход защиты

Итоги эксперимента

1 комментарий

Добавить комментарий

Сейчас на главной

Новости

Pixel Dynamics представила концепт чехла-книжки с экраном E Ink для смартфонов

Ютубер представил комплект дрона развивающего скорость до 100 км/ч, который можно собрать своими руками

Немецкая автомобильная промышленность рухнула из-за китайского импорта и спада на американском рынке

Теперь и у Айфона может быть второй экран и слот для карты памяти: в продажу поступил чехол Selfix для iPhone

3500 люмен и управление жестами: представлен налобный фонарь Raynaks RN350H

Публикации

Если магнитный щит Земли снова упадет до 5%: как повторение магнитной аномалии Лашамп повысит облучение экипажей самолетов в 75 раз

Ученые долго не понимали, как тело чувствует холод: ответ нашли в термодинамике нервных рецепторов

О чем молчит «собачка»: техническая история символа @

Озеро Медуз: единственное место в мире, где медузы дарят эстетичные снимки вместо ожогов

Пять морей в сердце России: почему Москву называют «портом пяти морей»

Kiwi Ears AD1 — с поддержкой гарнитур — обзор ЦАПа/усилителя начального уровня с хорошими характеристиками и EQ