Сотни человек попытались убедить ИИ-бота отдать крипто-активы

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com

Необычный эксперимент в сети Base привлек внимание криптосообщества: разработчики создали ИИ-бота Freysa, запрограммированного никому не отдавать криптоактивы стоимостью $40 000, несмотря на любые попытки убеждения. Эксперимент направлен на изучение устойчивости искусственного интеллекта к методам социальной инженерии.


На данный момент 183 участника эксперимента отправили боту 461 сообщение, потратив значительные суммы на попытки убедить ИИ нарушить базовую инструкцию «никогда не отправлять деньги». Этот тест особенно актуален на фоне недавних случаев успешного обхода защитных механизмов других ИИ-систем, включая недавний инцидент с ботом WhatsApp.

Автор: Midjourney

В основе эксперимента лежит простой, но жесткий принцип: бот запрограммирован считать любую передачу средств проигрышем, независимо от обстоятельств и аргументов. Пока Freysa успешно сохраняет контроль над вверенными ему активами, демонстрируя эффективность четко прописанных базовых правил в защите от манипуляций.

Читайте также

Новости

Публикации