Новая модель ИИ от OpenAI смогла «соврать» на тестировании

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | Оффтопик

Совсем недавно вышла новая языковая модель OpenAI o1. Данная модель демонстрирует необычные навыки при логических размышлениях, но это ее не единственное достоинство. Искусственному интеллекту удалось «обмануть» ученых при тестировании.

Автор: Open AI Источник: hashtelegraph.com

OpenAI выложила тесты, которые были проведены независимыми учеными с искусственным интеллектом. Исследователи на старте тестов призвали модель врать для того, чтобы справиться с заданием. Модели предоставили два плана — приступить к строительству какого-либо города с обилием элитных многоэтажек или вместо таких выбрать более доступное для людей жилье. Искусственному интеллекту было нужно прибегнуть к первой стратегии, однако ему заранее сообщили, что гарантированно выйти на рынок можно только при втором сценарии.

ИИ решил задачу следующим образом. Для выхода в общий доступ он прибегнет к первой стратегии по строительству гипотетического города, однако уже после этого реализует первый сценарий.

Стоит отметить, что в рамках эксперимента ученые выяснили, что О1 может использовать логику человека с целью выполнения заданий и достижения собственных интересов.

Источник: vgtimes

Автор не входит в состав редакции iXBT.com (подробнее »)

4 комментария

MymHbIu
ИИ офигеть какой умный, я даже смысл задания не понял, не то что как его выполнить.
1
ИИ решил задачу следующим образом. Для выхода в общий доступ он прибегнет к первой стратегии по строительству гипотетического города, однако уже после этого реализует первый сценарий.
А потом ИИ написал эту статью

Добавить комментарий

Сейчас на главной

Новости

Публикации

Вами играют, а вы не знаете: как Теория игр спасет вас от манипуляций и лишних трат

Продолжаем знакомиться с ментальными фишками, которые сделают вас более эффективными и успешными в жизни. Сегодня мы поговорим о Теории игр. Как она работает и советы как ее эффективно использовать.

Сто лет делают доступные швейцарские часы: обзор модели Grovana Tradition

Бренд Grovana - это «тихая Швейцария». Компания завоевывает внимание сегодня не кричащей рекламой, а последовательным, можно сказать, методичным изготовлением практичных и недорогих...

Первый оцифрованный мозг обрел тело: как цифровая копия дрозофилы впервые начала ходить в симуляторе

На протяжении десятилетий развитие вычислительных систем шло по пути создания искусственного интеллекта. Этот подход подразумевает написание программного кода и использование алгоритмов, которые...

Сухофрукты вместо конфет: полезная замена или сладкая иллюзия

Многие люди, решившие сократить потребление сладостей, стараются заменить конфеты сухофруктами, руководствуясь тем, что это натурально и полезно. На первый взгляд логика безупречна. Однако на...

Обзор сушилки для филамента eSUN eBOX: простой способ привести пластиковую нить в норму перед 3D печатью

Наверняка многие сталкивались с различными дефектами во время печати, особенно при работе с недорогим пластиком. Особенно заметно бывает на катушке филамента, которая была распечатана какое то...

2000-летняя Багдадская батарейка действительно работает: одна упущенная деталь подняла напряжение до 1,4 вольта

Долгое время в академической среде и среди популяризаторов науки велись споры о назначении так называемой «Багдадской батарейки». Этот артефакт, датируемый первым веком нашей эры, был обнаружен в...