ИИ в очередной раз провалил тест на «человечность», но уже совсем скоро ChatGPT может заменить живого собеседника

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | Оффтопик

В Калифорнийском университете города Сан-Диего провели тестирование нескольких популярных чат-ботов на способности выдавать ИИ за живого человека. А для тестирования использовался уже проверенный годами эмпирический тест Тьюринга, показывающий способность чат-бота выдавать себя за человека, поддержать любой разговор. Суть теста заключается в определении искусственного интеллекта мыслить как живой человек. По правилам теста живой человек общается с живым человеком и «компьютером», который должен выдавать себя за человека.

Источник: evercare.ru

Новый эксперимент охватил более 650 добровольцев, с которыми провели более 1800 опросов. При опросах использовались три виртуальных чата выдающих себя за реального собеседника. Но, чтобы действительно показать разницу в способностях мыслить и давать правильные ответы использовались различные языковые модели. Так, ChatGPT использовал бесплатную версию GPT-3.5 и GPT-4 с доступом по подписке, а также устаревшую версию виртуального собеседника ELIZA, которая появилась еще в 1966 году.

Для правдоподобности работы ИИ стоял запрет на работу бота, что он является человеком. Это усложняло задачу ChatGPT и собеседникам. Во время опроса задавались вопросы, согласно которым, отвечающему следовало доказать, что он живой человек, а не бот. В таком разговоре бот всегда являлся ответчиком.

Источник: twitter.com

По полученным результатам опроса устаревший виртуальный собеседник ELIZA смогла убедить менее 30% опрошенных, что она человек. ChatGPT с бесплатной языковой моделью GPT-3.5 показал плохие результаты и смог убедить менее 15% опрошенных, что он человек. А вот бот с GPT-4 смог «обмануть» более 40% опрошенных, что он человек. Но для успешного прохождения теста требуется не менее 50%, поэтому все чат-боты провалили тест считаться живым собеседником.

Во время теста исследователи заметили, что среди опрошенных менее 65% смогли правильно идентифицировать живого собеседника, поэтому результат ChatGPT GPT-4 на довольно неплохом уровне.

Источник: https://twitter.com

Сейчас на главной

Новости

Публикации

В Антарктиде обнаружен горячий источник энергии... и жизни: Как метан из недр питает микробов и намекает на иные миры

Антарктида. Бескрайнее ледяное плато, сковывающее целый континент. На поверхности — царство экстремального холода, ветра и, казалось бы, почти полного отсутствия жизни. Но что...

5 самых больших ящериц: длина, вес и реальные фото

В мире живёт около 40 семейств ящериц. Но большинство из них — это небольшие и юркие существа длиной до метра. А вот среди варанов есть настоящие гиганты. В этой подборке рассмотрим пять...

Объективной реальности нет? Что квантовая теория действительно говорит о реальности?

Знаете, что самое странное в квантовой механике? Не то, что она описывает мир атомов и частиц как нечто совершенно непохожее на наши будничные столы, стулья и чашки кофе. К этому мы, в общем-то,...

Как отличить ястреба от сокола: анатомия, охотничьи повадки и эволюционные адаптации

Ястребы и соколы — великолепные хищные птицы, чья мощь и ловкость вызывают восхищение у любителей природы. На первый взгляд их можно спутать из-за общих черт, таких как острые когти и...

Ужасный запах в стиральной машине: причины и как избавиться

Если из стиральной машины пахнет сыростью — это не норма. Такой запах означает, что внутри скапливаются влага, грязь и плесень. Они портят бельё, разъедают резину и могут вызвать...

Кто живёт дольше всех? 7 самых долгоживущих организмов на планете

Когда вы думаете о долгой жизни среди живых существ, на ум, возможно, приходят черепахи или киты. И правда, они живут около сотни лет или даже больше. Но в природе есть создания, для которых...