ИИ в очередной раз провалил тест на «человечность», но уже совсем скоро ChatGPT может заменить живого собеседника

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | Оффтопик

В Калифорнийском университете города Сан-Диего провели тестирование нескольких популярных чат-ботов на способности выдавать ИИ за живого человека. А для тестирования использовался уже проверенный годами эмпирический тест Тьюринга, показывающий способность чат-бота выдавать себя за человека, поддержать любой разговор. Суть теста заключается в определении искусственного интеллекта мыслить как живой человек. По правилам теста живой человек общается с живым человеком и «компьютером», который должен выдавать себя за человека.

Источник: evercare.ru

Новый эксперимент охватил более 650 добровольцев, с которыми провели более 1800 опросов. При опросах использовались три виртуальных чата выдающих себя за реального собеседника. Но, чтобы действительно показать разницу в способностях мыслить и давать правильные ответы использовались различные языковые модели. Так, ChatGPT использовал бесплатную версию GPT-3.5 и GPT-4 с доступом по подписке, а также устаревшую версию виртуального собеседника ELIZA, которая появилась еще в 1966 году.

Для правдоподобности работы ИИ стоял запрет на работу бота, что он является человеком. Это усложняло задачу ChatGPT и собеседникам. Во время опроса задавались вопросы, согласно которым, отвечающему следовало доказать, что он живой человек, а не бот. В таком разговоре бот всегда являлся ответчиком.

Источник: twitter.com

По полученным результатам опроса устаревший виртуальный собеседник ELIZA смогла убедить менее 30% опрошенных, что она человек. ChatGPT с бесплатной языковой моделью GPT-3.5 показал плохие результаты и смог убедить менее 15% опрошенных, что он человек. А вот бот с GPT-4 смог «обмануть» более 40% опрошенных, что он человек. Но для успешного прохождения теста требуется не менее 50%, поэтому все чат-боты провалили тест считаться живым собеседником.

Во время теста исследователи заметили, что среди опрошенных менее 65% смогли правильно идентифицировать живого собеседника, поэтому результат ChatGPT GPT-4 на довольно неплохом уровне.

Источник: https://twitter.com

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Серфинг без капли воды: как оазис Уакачина стал курортом для тех, кто боится утонуть

Хочется ловить волну, но вот проблема: только оказавшись в водоёме глубже пары метров, вам даётся исключительно стиль топориком ко дну? В таком случае вам стоит узнать про самое необычное место для...

Астрономы доказали существование трех популяций сливающихся черных дыр: неразлучные пары, случайные встречи и «каннибалы»

Астрофизики получают информацию о слияниях черных дыр благодаря детекторам гравитационных волн. Когда два сверхплотных объекта сталкиваются, они вызывают возмущение пространства, которое...

Туер «Енисей»— один из последних в мире: почему он до сих пор работает на Казачинском пороге, хотя на всех остальных реках России и Европы такие суда давно исчезли

На реке Енисей есть участок, который веками оставался серьёзным препятствием для судоходства. Это Казачинский порог — природная «плотина» из скальных выступов и каменистых гряд,...

Наши предки вылуплялись из яиц: окаменелость возрастом 250 млн лет подтвердила спорную гипотезу палеонтологов

Эволюционная история млекопитающих неразрывно связана с процессом размножения. Долгое время биологи опирались на устоявшееся положение: древние предки современных млекопитающих, известные как...

Фильм «Белое солнце пустыни»: как он стал негласным талисманом космонавтов

У советских и российских космонавтов сложилась необычная, но неизменная традиция: перед стартом обязательно смотреть фильм «Белое солнце пустыни» — начало ритуала существует ещё с...

Обзор USB-тестера FNIRSI FNB-C2: с поддержкой PD 3.1 и мощностью 240 Вт

Новая модель USB-тестера FNIRSI FNB-C2 — это не просто компактный измерительный прибор, а полноценный инструмент для диагностики современных устройств питания. Он предназначен для...