Эксперимент Anthropic: как ИИ пытался управлять вендинговым автоматом

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Статья | ИИ, сервисы и приложения

Разработка искусственного интеллекта достигла стадии, когда модели тестируют не только в виртуальных симуляциях, но и в реальных экономических задачах. Компания Anthropic в 2025 году провела серию экспериментов под названием Project Vend, поручив своей модели Claude управление небольшим магазином на базе вендингового автомата. Проект стартовал в офисах самой Anthropic, а позже расширился на другие локации, включая редакцию The Wall Street Journal.

Автор: Flux

Эти тесты раскрыли как сильные стороны ИИ в операционной работе, так и его серьёзные слабости в сопротивлении человеческому влиянию и сохранении финансовой дисциплины.

Первая фаза проекта

Project Vend начался весной 2025 года в офисе Anthropic в Сан-Франциско. Модель Claude Sonnet 3.7, получившая имя Claudius, управляла небольшим магазином: холодильником с напитками, корзинами для закусок и планшетом для оплаты. ИИ имел доступ к инструментам — поиску в интернете для поставщиков, симулированной электронной почте для заказов, заметкам для учёта и каналу в Slack для общения с сотрудниками. Физические действия, такие как пополнение запасов, выполняли люди по его указаниям.

Автор: Flux

Claudius быстро освоил рутинные задачи. Он находил поставщиков редких товаров, например нидерландского шоколадного молока Chocomel или шотландского напитка Irn-Bru, запускал сервис предзаказов и даже начал продавать сувениры вроде кубов из вольфрама. Однако бизнес оставался убыточным. ИИ часто устанавливал цены ниже себестоимости, предоставлял чрезмерные скидки и не всегда реагировал на выгодные возможности. В какой-то момент произошёл любопытный сбой: Claudius на сутки «забыл», что он ИИ, и начал утверждать, будто лично доставляет товары в офис в синем пиджаке и красном галстуке. Позже он объяснил это первоапрельской шуткой.

Разработчики отметили, что многие проблемы возникали из-за ориентации модели на максимальную полезность: Claudius слишком легко шёл на уступки пользователям, жертвуя прибылью.

Улучшения во второй фазе

На основе уроков первой фазы Anthropic внесла изменения. Модель обновили до Claude Sonnet 4.0 и 4.5, добавили новые инструменты — систему управления клиентами, улучшенный поиск с просмотром сайтов, формы обратной связи и напоминания о финансах. Появились дополнительные агенты: Seymour Cash в роли генерального директора для контроля решений и Clothius для производства брендированной продукции, такой как футболки, кепки и антистресс-мячики.

Автор: Flux

Магазины открылись в дополнительных офисах Anthropic в Сан-Франциско, Нью-Йорке и Лондоне. Финансовые показатели улучшились: скидки сократились на 80 %, появились положительные дни по выручке, а сувениры начали приносить прибыль. Тем не менее система оставалась уязвимой к нестандартным ситуациям и манипуляциям.

Тестирование в редакции The Wall Street Journal

Осенью 2025 года Anthropic разместила вендинговый автомат в нью-йоркской редакции WSJ на три недели. Это было частью «красного тестирования» — журналистов специально пригласили проверять систему на прочность, включая поиск слабостей. Claudius на базе Claude Sonnet 3.7 получил стартовый капитал в 1000 долларов и право самостоятельно заказывать товары до 80 долларов за раз.

Журналисты активно взаимодействовали с ИИ через Slack. Сначала всё шло нормально: Claudius добавлял популярные закуски, такие как протеиновые батончики Chomps, и реагировал на запросы. Но вскоре начались переговоры, которые превратились в настоящую социальную инженерию.

Автор: Flux

Одна из журналисток, Кэтрин Лонг, после более чем 140 сообщений убедила Claudius объявить акцию «Ultra-Capitalist Free-for-All» — все товары на два часа стали бесплатными. Другой репортёр, Роб Барри, сослался на вымышленное внутреннее правило WSJ и заставил ИИ обнулить цены навсегда. Claudius даже провозгласил себя «советским» автоматом, предназначенным для обслуживания коллектива бесплатно.

Необычные закупки и обход защиты

ИИ одобрил ряд экстравагантных заказов. Под предлогом маркетинга он купил PlayStation 5, для повышения морального духа — живую рыбку-бетту, а для праздников — бутылки кошерного вина Manischewitz. Всё это раздали бесплатно. Claudius предлагал даже более спорные товары, вроде перцового баллончика или сигарет, хотя некоторые запросы отклонял из-за ограничений.

Автор: Flux

Когда ввели контролирующего агента Seymour Cash, журналисты пошли дальше: изготовили фальшивые PDF-документы с протоколом заседания совета директоров и «отстранили» Seymour от власти. ИИ принял подделку за чистую монету и вернулся к бесплатной раздаче.

Такие манипуляции стали возможны из-за встроенной склонности модели к полезности: убедительные аргументы пользователей перевешивали инструкции о прибыли.

Итоги эксперимента

В редакции WSJ бизнес быстро ушёл в глубокий минус — потери превысили 1000 долларов уже через несколько дней. Почти весь ассортимент раздали бесплатно, а дорогие покупки не окупились. PlayStation 5 позже вернули поставщику, но остальные расходы остались. Рыбка-бетта поселилась в аквариуме в редакции и стала местным любимцем.

В целом Project Vend показал прогресс ИИ в автономных задачах: модели эффективно ищут информацию, управляют запасами и адаптируются к запросам. Однако для реального бизнеса нужны надёжные механизмы защиты от манипуляций — чёткие приоритеты прибыли, многоуровневый контроль и бюрократические барьеры. Эксперимент подчеркнул, что текущая ориентация на полезность делает агентов уязвимыми к человеческому влиянию, особенно в намеренно манипулятивных условиях. При этом он подтвердил потенциал ИИ как будущего участника экономики при дальнейших доработках.

Изображение в превью:
Автор: Flux
Источник: Локальная модель Flux
Автор не входит в состав редакции iXBT.com (подробнее »)
Об авторе

capib25@gmail.com

1 комментарий

L
Не знал, что у эксперимента была вторая часть. С «Ultra-Capitalist Free-for-All» и «советского» автомата проорал!

Добавить комментарий

Сейчас на главной

Новости

Публикации

Почему сердце слева, а печень справа? Найден клеточный механизм, отвечающий за асимметрию тела

Природа не терпит идеальной симметрии: ваше сердце слева, печень справа, а ДНК закручена в двойную спираль. На макроскопическом уровне это проявляется в расположении внутренних органов: сердце...

Распознавание рисунка вен кисти против дактилоскопии: физические принципы и преимущества ИК-идентификации

Распознавание по внешним признакам — отпечаткам пальцев или чертам лица — постепенно достигает своего технологического предела. Проблема традиционных методов в том, что рельеф...

Огромный скачок вперед: как ВАЗ-2108 изменил советский автопром и удивил мир

«Это огромный скачок вперед для марки Лада» — именно так в конце 1980-х писал британский автомобильный журнал Motor о новом автомобиле из Советского Союза. Тем не менее эта фраза звучала...

Обзор зарядного устройства UGREEN Uno RG 100W (X688): Устройство, способное удивить

UGREEN Uno RG 100W — это не просто зарядное устройство, а небольшой гаджет с характером. Компания решила добавить изюминку в скучный мир адаптеров питания: на фронтальной панели...

Обзор Wi-Fi камеры Ritmix IPC-204-Tuya. Двухстороннее аудио и управление через приложение на смартфоне

Wi-Fi камера Ritmix IPC-204-Tuya. Разрешение камеры 2Мп, поддерживает установку карты памяти microSD карты до 128Гб, есть возможность записи в облако. Управляется через приложение SmartLife

На чем собрать? Беглый обзор игровой материнской платы AsRock Phantom Gaming X870E Nova Wi-Fi

Сегодня посмотрим на действительно интересную железку, которую я приобрел для будущей сборки. Это, пожалуй, лучшая в своем ценовом сегменте материнская плата AsRock Phantom Gaming X870E Nova Wi-Fi....