Для работы проектов iXBT.com нужны файлы cookie и сервисы аналитики. Продолжая посещать сайты проектов вы соглашаетесь с нашей Политикой в отношении файлов cookie

Как часто ChatGPT ошибается? Разбор неточностей и паттернов

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com

8 апреля 2025, 10:47 | Мнение | ИИ, сервисы и приложения

Генеративный искусственный интеллект, включая ChatGPT, стремительно набирает популярность как альтернатива традиционным поисковым системам. Но современные исследования показывают: эти инструменты часто демонстрируют паттерны ошибок, особенно в вопросах цитирования источников. В этой статье разберемся, насколько ChatGPT точен, какие ошибки совершает чаще всего и почему это важно для пользователей, редакторов и блогеров.

Содержание

Уверенность или точность? Главная проблема ChatGPT
5 ключевых паттерна ошибок
Последствия для пользователей и СМИ
Будущее ИИ-поиска

Уверенность или точность? Главная проблема ChatGPT

Согласно исследованию Tow Center для Columbia Journalism Review (2025), ChatGPT, как и другие ИИ-поисковики, склонен давать уверенные, но ошибочные ответы. Например, в 67% случаев (134 из 200 запросов) ChatGPT неправильно идентифицировал статьи, но лишь в 15 случаях признал неуверенность. Также в отличие от Copilot, который чаще отказывался отвечать, ChatGPT почти никогда не предупреждал пользователей о возможных неточностях.

Это создает «иллюзию надежности»: ИИ преподносит информацию авторитетно, даже если она недостоверна. Пользователи, особенно неискушенные, могут не заметить подвоха.

5 ключевых паттерна ошибок

Игнорирование настроек сайтов. ChatGPT иногда обходит протокол (Robot Exclusion), который позволяет сайтам блокировать доступ для краулеров (поисковых роботов). Например, он цитировал статьи USA Today через Yahoo News, хотя сам издатель запретил доступ к своему контенту.

Ссылки на неправильные источники

В исследовании ИИ-поисковики часто путали оригинальные статьи с их синдицированными или пиратскими копиями. Так, Perplexity (и его премиум-версия) вместо Texas Tribune ссылались на неофициальные републикации, лишая издатель трафика.

Некоторые чат-боты, включая Grok 3 и Gemini, генерировали несуществующие ссылки.

Некоторые чат-боты, включая Grok 3 и Gemini, генерировали несуществующие ссылки. Например, в 154 из 200 случаев Grok 3 направлял на страницы с ошибкой 404. ChatGPT в этом аспекте оказался чуть лучше, но проблема актуальна для всех систем.

Премиум-версии ошибаются чаще

Платные модели (Perplexity Pro, Grok 3) давали больше правильных ответов, но чаще выдавали уверенные ошибки. Виной — стремление «не подвести» пользователя: вместо признания незнания ИИ предлагал домыслы.

OpenAI и Perplexity заключают сделки с издателями (The Guardian, Time, Texas Tribune), чтобы получить прямой доступ к контенту. Но исследование показало, что ChatGPT правильно определил лишь 1 из 10 статей San Francisco Chronicle, несмотря на партнерство, а Time, сотрудничающий и с OpenAI, и с Perplexity, всё равно сталкивался с ошибками атрибуции.

Даже при наличии договоренностей ИИ не гарантирует корректное цитирование. Как отметил Марк Ховард из Time: «Компании не обещали 100% точность».

Последствия для пользователей и СМИ

Для редакторов ошибки ИИ подрывают доверие к брендам. Например, если ChatGPT цитирует BBC с ошибкой, страдает репутация и СМИ, и самого ИИ.

Для аудитории последствием является то, что пользователи получают искаженную информацию, которую сложно проверить из-за фейковых ссылок.

Для монетизации тоже существует негативное влияние: издатели теряют трафик, когда ИИ направляет пользователей на сторонние платформы вместо оригинальных статей.

Будущее ИИ-поиска

Представители OpenAI заявили, что работают над улучшением цитирования и уважают настройки протоколов. Microsoft подчеркнула, что соблюдает протоколы блокировки поисковых роботов. Тем не менее, текущие данные показывают: прогресс медленный.

Пока пользователям стоит проверять информацию из ChatGPT через традиционный поиск. ChatGPT ошибается часто — в 67% случаев по данным исследования. Его ключевые слабости: чрезмерная уверенность, игнорирование правил издателей и некорректные ссылки. Пока ИИ-поисковики остаются не слишком надежными помощниками в работе с новостным контентом. Доверяй, но проверяй — главный совет для тех, кто использует эти инструменты.

Изображение в превью:

Автор: Fusionbrain
Источник: fusionbrain.ai

2 комментария

Фейковые ссылки и «битые» URL
Некоторые чат-боты, включая Grok 3 и Gemini, генерировали несуществующие ссылки. Например, в 154 из 200 случаев Grok 3 направлял на страницы с ошибкой 404. ChatGPT в этом аспекте оказался чуть лучше, но проблема актуальна для всех систем.
Некоторые чат-боты, включая Grok 3 и Gemini, генерировали несуществующие ссылки.
Например, в 154 из 200 случаев Grok 3 направлял на страницы с ошибкой 404. ChatGPT в этом аспекте оказался чуть лучше, но проблема актуальна для всех систем.

Это прям цитата из этой статьи. Улыбнуло. И здесь ИИ накосячил: в статье о косяках ИИ :)

Ответить

Chat GoPT — отстой! По крайней-мере, в плане содания текстового контента. Даже бесплатный дипсик и то, при прямых руках шедевры создает, правда за 3-5 заходов. Gemini PRO рулит в этом плане. А касательно ошибок, так научитесь правильные промты создавать, благо вам же их сам ИИ и создает! А касательно ссылок? Ну вы господа реально, «умные» для этого есть модели с открытым доступом в интернет, и они, как раз, могут вставлять реальные ссылки на реальные источники прямо в текст! В чем проблема? Не вижу проблем! Вижу тех, кто хочет простым запросом к ИИ получить шедевр не прилагая даже элементарных мозговых усилий, чтобы составить правильный запрос тому или иному ИИ. Учитесь работать, вот и все.

Ответить

Добавить комментарий

Сейчас на главной

Новости

Зеленый фильтр и сбои в Pro-режиме: Xiaomi работает над патчем для камер в HyperOS

На каждый день, возможно перевозить в электричках. Компания PuckiPuppy выпустила складной электровелосипед Dachshund

Авто и транспорт
1 час назад
0

Смартфоны Honor WIN получили защиту по стандартам IP68, IP69 и IP69K

Hisense представит на CES 2026 экраны RGB Mini LED нового поколения и стиральную машину X-Zone Master

Техника для дома
2 часа назад
0

Концепт мыши Lor можно собрать под левую или правую руку

Публикации

Вишлист удалёнщика: 6 подарков тому, кто работает из дома

Подборка товаров
Вчера в 16:46
IXBT Market

За время, прошедшее после эпидемии коронавируса, число людей, работающих из дома сначала значительно выросло, а потом пошло на спад. Компании массово возвращали персонал в офисы, а нередко и сами...

Обзор маленького, но мощного сетевого отпаривателя для одежды Felfri FGS-009

Обзор
Вчера в 13:36
Техника для дома

У меня для бытовых нужд глажки белья был приобретен далеко не компактный отпариватель с большим контейнерном и штангой с вешалкой. Хорош ли он или нет, это рассуждения за рамками данного...

Почему некоторые страны богатеют без природных ресурсов, а другие — с ними беднеют

Мнение
Вчера в 12:30
Путешествия и туризм

Есть ощущение, что мир должен работать проще. Если у страны есть нефть, газ, металлы, значит у неё есть деньги. Если ресурсов нет, значит страна вынуждена выживать, экономить и зависеть от других....

Куда летит Икар Ильгиза Фазулзянова: краткий обзор одной бабочки с новой выставки

Обзор
Вчера в 12:09
Мероприятия и выставки

Несмотря на то, что обзор новой выставки, «На свет из темноты», которая проходит в ГИМе, уже опубликован, к некоторым экспонатам хочется вернуться отдельно.

Покажет скрытое: обзор фонаря с УФ-светодиодом 3 Вт Sofirn SR23

Обзор
Вчера в 09:01
Фонари

С первого взгляда даже не знаешь к какому классу отнести этот фонарь. Тут яркий заливной белый свет (3300 люмен в турбо) и мощный ультрафиолетовый светодиод для особых задач, невидимых без такой...

Зачем пилоты малой авиации сбрасывают якорь, пролетая над землёй

Мнение
19 декабря, 21:31
Оффтопик

В интернете легко можно найти видеоролики, где пилот малой авиации летит на минимальной высоте вблизи аэродрома, и сбрасывает вниз нечто, напоминающее якорь небольшой лодки. Это может вызвать некое...