Эксперимент Anthropic: как ИИ пытался управлять вендинговым автоматом

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Статья | ИИ, сервисы и приложения

Разработка искусственного интеллекта достигла стадии, когда модели тестируют не только в виртуальных симуляциях, но и в реальных экономических задачах. Компания Anthropic в 2025 году провела серию экспериментов под названием Project Vend, поручив своей модели Claude управление небольшим магазином на базе вендингового автомата. Проект стартовал в офисах самой Anthropic, а позже расширился на другие локации, включая редакцию The Wall Street Journal.

Автор: Flux

Эти тесты раскрыли как сильные стороны ИИ в операционной работе, так и его серьёзные слабости в сопротивлении человеческому влиянию и сохранении финансовой дисциплины.

Первая фаза проекта

Project Vend начался весной 2025 года в офисе Anthropic в Сан-Франциско. Модель Claude Sonnet 3.7, получившая имя Claudius, управляла небольшим магазином: холодильником с напитками, корзинами для закусок и планшетом для оплаты. ИИ имел доступ к инструментам — поиску в интернете для поставщиков, симулированной электронной почте для заказов, заметкам для учёта и каналу в Slack для общения с сотрудниками. Физические действия, такие как пополнение запасов, выполняли люди по его указаниям.

Автор: Flux

Claudius быстро освоил рутинные задачи. Он находил поставщиков редких товаров, например нидерландского шоколадного молока Chocomel или шотландского напитка Irn-Bru, запускал сервис предзаказов и даже начал продавать сувениры вроде кубов из вольфрама. Однако бизнес оставался убыточным. ИИ часто устанавливал цены ниже себестоимости, предоставлял чрезмерные скидки и не всегда реагировал на выгодные возможности. В какой-то момент произошёл любопытный сбой: Claudius на сутки «забыл», что он ИИ, и начал утверждать, будто лично доставляет товары в офис в синем пиджаке и красном галстуке. Позже он объяснил это первоапрельской шуткой.

Разработчики отметили, что многие проблемы возникали из-за ориентации модели на максимальную полезность: Claudius слишком легко шёл на уступки пользователям, жертвуя прибылью.

Улучшения во второй фазе

На основе уроков первой фазы Anthropic внесла изменения. Модель обновили до Claude Sonnet 4.0 и 4.5, добавили новые инструменты — систему управления клиентами, улучшенный поиск с просмотром сайтов, формы обратной связи и напоминания о финансах. Появились дополнительные агенты: Seymour Cash в роли генерального директора для контроля решений и Clothius для производства брендированной продукции, такой как футболки, кепки и антистресс-мячики.

Автор: Flux

Магазины открылись в дополнительных офисах Anthropic в Сан-Франциско, Нью-Йорке и Лондоне. Финансовые показатели улучшились: скидки сократились на 80 %, появились положительные дни по выручке, а сувениры начали приносить прибыль. Тем не менее система оставалась уязвимой к нестандартным ситуациям и манипуляциям.

Тестирование в редакции The Wall Street Journal

Осенью 2025 года Anthropic разместила вендинговый автомат в нью-йоркской редакции WSJ на три недели. Это было частью «красного тестирования» — журналистов специально пригласили проверять систему на прочность, включая поиск слабостей. Claudius на базе Claude Sonnet 3.7 получил стартовый капитал в 1000 долларов и право самостоятельно заказывать товары до 80 долларов за раз.

Журналисты активно взаимодействовали с ИИ через Slack. Сначала всё шло нормально: Claudius добавлял популярные закуски, такие как протеиновые батончики Chomps, и реагировал на запросы. Но вскоре начались переговоры, которые превратились в настоящую социальную инженерию.

Автор: Flux

Одна из журналисток, Кэтрин Лонг, после более чем 140 сообщений убедила Claudius объявить акцию «Ultra-Capitalist Free-for-All» — все товары на два часа стали бесплатными. Другой репортёр, Роб Барри, сослался на вымышленное внутреннее правило WSJ и заставил ИИ обнулить цены навсегда. Claudius даже провозгласил себя «советским» автоматом, предназначенным для обслуживания коллектива бесплатно.

Необычные закупки и обход защиты

ИИ одобрил ряд экстравагантных заказов. Под предлогом маркетинга он купил PlayStation 5, для повышения морального духа — живую рыбку-бетту, а для праздников — бутылки кошерного вина Manischewitz. Всё это раздали бесплатно. Claudius предлагал даже более спорные товары, вроде перцового баллончика или сигарет, хотя некоторые запросы отклонял из-за ограничений.

Автор: Flux

Когда ввели контролирующего агента Seymour Cash, журналисты пошли дальше: изготовили фальшивые PDF-документы с протоколом заседания совета директоров и «отстранили» Seymour от власти. ИИ принял подделку за чистую монету и вернулся к бесплатной раздаче.

Такие манипуляции стали возможны из-за встроенной склонности модели к полезности: убедительные аргументы пользователей перевешивали инструкции о прибыли.

Итоги эксперимента

В редакции WSJ бизнес быстро ушёл в глубокий минус — потери превысили 1000 долларов уже через несколько дней. Почти весь ассортимент раздали бесплатно, а дорогие покупки не окупились. PlayStation 5 позже вернули поставщику, но остальные расходы остались. Рыбка-бетта поселилась в аквариуме в редакции и стала местным любимцем.

В целом Project Vend показал прогресс ИИ в автономных задачах: модели эффективно ищут информацию, управляют запасами и адаптируются к запросам. Однако для реального бизнеса нужны надёжные механизмы защиты от манипуляций — чёткие приоритеты прибыли, многоуровневый контроль и бюрократические барьеры. Эксперимент подчеркнул, что текущая ориентация на полезность делает агентов уязвимыми к человеческому влиянию, особенно в намеренно манипулятивных условиях. При этом он подтвердил потенциал ИИ как будущего участника экономики при дальнейших доработках.

Изображение в превью:
Автор: Flux
Источник: Локальная модель Flux
Автор не входит в состав редакции iXBT.com (подробнее »)
Об авторе

capib25@gmail.com

1 комментарий

L
Не знал, что у эксперимента была вторая часть. С «Ultra-Capitalist Free-for-All» и «советского» автомата проорал!

Добавить комментарий

Сейчас на главной

Новости

Публикации

Семь в одном. Обзор USB-C док-станции Rapoo XD71

Нынешние ноутбуки все больше становятся похожими на планшеты, лишаясь зачастую самых нужных портов. Вернуть привычные возможности позволяет док-станция Rapoo XD71 с двумя портами USB-A, картридером...

Мал, да удал. Обзор компактного аккумуляторного инструмента: 3-дюймовая УШМ под 18V батареи

Аккумуляторная угловая шлифовальная машина ONEKFYFD, на которую можно установить диски/насадки 75 мм (3″). Выручает в мелких работах, например, по сантехнике и электрике, удобная для работы...

Как выглядела Вселенная в первые микросекунды: на Большом адронном коллайдере доказали жидкую природу первичной материи

Как изучать свойства материи, которая существовала лишь в первые микросекунды после Большого взрыва? Это состояние называется кварк-глюонной плазмой. В обычных условиях нашего мира кварки и...

Возможна ли жизнь без воды: как экзотические растворители расширяют границы обитаемой Вселенной

Вся современная астробиология построена на одном правиле: для возникновения и поддержания жизни необходима жидкая вода. Этот принцип определяет цели всех космических миссий, архитектуру...

Парадокс стакана воды: почему мы боимся таяния не тех ледников и откуда реально придет потоп

Белые медведи ни при чем. Разбираем сухие физические факты: почему тающий Северный Ледовитый океан не затопит города, куда делись 9 триллионов тонн горного льда и что происходит с Гренландией.

Ловушка «чемодана без ручки»: почему нам так страшно бросить то, что давно пора бросить

Продолжаем изучать ментальные приемы, которые помогают нам принимать верные решения и делают нас более эффективными. Сегодня поговорим про ловушку невозвратных затрат. Рассмотрим примеры и решения.