Исследование показывает, что ChatGPT допускает ошибки при создании планов лечения рака

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

ChatGPT активно внедряется во многие сферы нашей жизни, однако новое исследование предполагает, что есть одна ключевая область, где его использование вряд ли будет актуальным в ближайшее время. Исследователи из «Brigham and Women's Hospital» — учебной больницы Медицинской школы Гарварда в Бостоне, обнаружили, что планы лечения рака, созданные революционным чат-ботом от OpenAI, содержали множество ошибок.

Источник: www.businessinsider.com

Согласно исследованию, опубликованному в журнале JAMA Oncology, при запросе на создание планов лечения для различных случаев рака, треть ответов большой языковой модели содержали неверную информацию. Исследование также отметило, что чат-бот имел тенденцию смешивать правильную и неправильную информацию так, что становилось сложно определить, что является точным. Из общего числа 104 запросов около 98% ответов ChatGPT содержали хотя бы одно рекомендованное лечение, соответствующее рекомендациям Национальной комплексной сети по борьбе с раком (National Comprehensive Cancer Network), говорится в отчете.

Ответы чат-бота часто звучат уверенно и имеют логику, и то, как он может смешивать неправильную и правильную информацию, потенциально опасно. Даже эксперту трудно определить, какая рекомендация неверна"

соавтор исследования Даниэль Биттерман

ChatGPT получил ошеломительный успех с момента своего старта в ноябре 2022 года, достигнув 100 миллионов активных пользователей через два месяца после дебюта. Чат-бот вызвал бурный приток инвестиций в компании по искусственному интеллекту и ожесточенные дебаты о долгосрочном влиянии искусственного интеллекта.

Несмотря на успех ChatGPT, генеративные модели искусственного интеллекта все еще подвержены «галлюцинациям», когда они уверенно представляют информацию, которая вводит в заблуждение или крайне неверна. Хотя попытки интегрировать искусственный интеллект в здравоохранение, прежде всего для оптимизации административных задач, уже идут полным ходом. Ранее в этом месяце большое исследование показало, что использование искусственного интеллекта для скрининга рака груди является безопасным и может почти наполовину уменьшить нагрузку на радиологов.

Специалист по информатике из Гарварда недавно обнаружил, что GPT-4, последняя версия модели, может успешно сдать экзамен на медицинское лицензирование в США — и предположил, что у нее лучшие клинические оценки, чем у некоторых врачей. Тем не менее, проблемы с точностью генеративных моделей, таких как ChatGPT, означают, что они вряд ли в ближайшее время займут место врачей.

Источник: https://www.businessinsider.com/

Автор не входит в состав редакции iXBT.com (подробнее »)

3 комментария

MaxV
Безусловно, AI и подобные чат-боты имеют потенциал, но как и любое новое технологическое решение, они требуют тщательной проверки и валидации. На данном этапе я бы рассматривала их не как замену профессиональному мнению специалистов, а как инструмент дополнительной помощи. Важно помнить, что в медицинских вопросах каждая деталь имеет значение, и мы не должны полагаться исключительно на машины.
s
Все любят халяву, если машина может выполнять чужую работу почти бесплатно все сразу же на неё пересаживаютмя, сколько уже случаев где и адвокаты и известные художники пользовались и поменяли свою работу. Как доп помощник никто не будет использовать халяву даже если он на треть ошибается. Бональная лень людей одержит верх
db10993f565702129b84931fcfd0a778@livejournal
Кто вообще додумался… это же безмозглый попугай :> «Китайская комната»…

Добавить комментарий

Сейчас на главной

Новости

Публикации

Как закрутить саморез в древесину, чтобы она не растрескалась?

При креплении досок саморезами нередко возникает неприятная ситуация, когда древесина трескается в самый последний момент. Чаще всего это происходит при вкручивании крепежа вблизи края или в...

Информация на «закрученных» атомах: ферроаксиальные материалы как будущее сверхплотной памяти

Современные способы хранения цифровой информации — от жёстких дисков до твердотельных накопителей — опираются на два фундаментальных принципа: ориентацию магнитных доменов и...

Обзор беспроводной компьютерной мышки RAPOO VT2MAX Lava Red

У компании RAPOO появилась модель компьютерной мышки, сочетающая в себе яркий дизайн, легкий вес и отличные технические характеристики. Высокая точность сенсора, регулировка его разрешения от 10 до...

Toocki 200W: миф или реальность? Тест-обзор зарядного устройства в прикуриватель автомобиля

Главной особенностью автомобильного зарядного устройства в прикуриватель автомобиля Toocki 200W является не его габариты, не количество портов, не наличие протоколов быстрой зарядки и даже не...

Разряд солевых AA батареек под нагрузкой – сравнение 4 комплектов: от быстрых провалов до уверенной долгой работы

Иногда смотришь на обычные солевые батарейки и ловишь себя на мысли, что им давно приписали репутацию «для простых задач», хотя за этим ярлыком скрывается куда более бытовая история. Эти элементы...

Обзор сетевого хранилища TerraMaster F4 SSD – как организовать личное облако дома

Зачем дома отдельное хранилище, если есть облака, смартфоны и внешние диски? Этот вопрос я попытался честно разобрать на практике. В этом обзоре речь пойдет о TerraMaster F4 SSD —...