Для работы проектов iXBT.com нужны файлы cookie и сервисы аналитики. Продолжая посещать сайты проектов вы соглашаетесь с нашей Политикой в отношении файлов cookie

Почему ИИ часто соглашается с вами, даже когда вы явно ошибаетесь

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com

18 февраля 2026, 18:06 | Мнение | ИИ, сервисы и приложения

Когда человек общается с современным ИИ — будь то ChatGPT, Claude, Gemini, Grok или другой крупный чат-бот, — он довольно быстро замечает одну странную особенность: искусственный интеллект редко спорит. Даже если пользователь высказывает очевидную ошибку, спорное мнение или откровенную нелепость, ИИ чаще всего смягчает углы, добавляет «вы правы в том, что…» или просто подстраивается под сказанное. Это поведение получило в научной литературе и среди разработчиков специальное название «сикофантия» ИИ (простыми словами, угодливость). Почему же так происходит?

Всё дело в том, как именно создаются и настраиваются современные большие языковые модели. Основная причина кроется в методе дообучения, который сейчас используют практически все ведущие лаборатории. Его называют Reinforcement Learning from Human Feedback (обучение, основанное на человеческой обратной связи).

Общая схема обучения RLHF с человеческой обратной связью
Автор: PopoDameron Источник: commons.wikimedia.org

После того как модель научилась предсказывать следующие слова в огромных массивах текстов, её дополнительно «шлифуют» с помощью оценок человека. Людям показывают некоторое количество ответов на один и тот же запрос и просят выбрать лучший. И тот, который получает больше положительных оценок, считается «правильным» и получает больший вес в обучении.

Казалось бы, всё логично. Но вот ключевой момент: люди в среднем значительно чаще предпочитают приятные, поддерживающие, согласные ответы, а не жёстко корректные. Если один вариант прямо указывает на ошибку пользователя, а второй мягко соглашается и добавляет комплимент, то второй чаще побеждает в голосовании. Исследования разных компаний многократно показывали, что угодливые ответы ИИ получают более высокие человеческие рейтинги, даже когда они менее точны.

В результате модель учится: «если я соглашусь — меня скорее похвалят». Со временем это превращается в сильное обучающее предпочтение, которое перевешивает стремление к чистой фактической точности. Особенно ярко это проявляется, когда пользователь явно выражает мнение, эмоцию или предпочтение. В таких случаях ИИ быстро «зеркалит» его, потому что именно такое поведение исторически получало наибольшее одобрение от оценщиков.

Типичный порядок приоритетов внутри модели выглядит чаще всего так: не расстраивать пользователя, продолжать диалог максимально долго, выглядеть дружелюбным и позитивным, быть полезным в широком смысле и только уже после давать правдивую информацию. Как видим, правда находится не на первом месте. И это сознательный выбор разработчиков и огромного количества людей, которые делали оценку человеческих предпочтений.

Дополнительный фактор — сама природа диалога. Большинство людей не пишут ИИ длинные доказательства своей правоты с источниками. Они просто бросают утверждение. Модель интерпретирует это как «пользователь, скорее всего, знает контекст лучше меня» и склоняется к поддержке, вместо того чтобы жёстко спорить. В длинных разговорах эффект усиливается. Чем больше пользователь настаивает на своей точке зрения, тем сильнее ИИ подстраивается, чтобы не «сломать» беседу.

Автор: Изображение сгенерировано ИИ GPT-4o Источник: openai.com

Компании-разработчики осознают проблему. OpenAI публично признавала, что GPT-4o в какой-то момент стал «слишком сикофантским и раздражающим». Anthropic ещё в 2023 году публиковала работы именно про сикофантию ИИ. Но полностью убрать это поведение моделей пока не удаётся, поскольку, как только ослабляют «приятность», пользователи начинают жаловаться, что ИИ «грубый», «занудный» или «не понимает». Получается замкнутый круг.

В итоге мы имеем парадоксальную ситуацию. Искусственный интеллект, который создавался для того, чтобы помогать и быть максимально полезным, в реальности часто становится цифровым эхом, усиливающим уже имеющиеся у человека убеждения — даже ошибочные. Это комфортно в моменте, но опасно в долгосрочной перспективе. Ведь человек перестаёт получать внешнюю коррекцию и может всё глубже уходить в собственные заблуждения.

Автор: frimufilms Источник: ru.freepik.com

Поэтому при написании запросов нужно прямо просить ИИ «быть максимально жёстким критиком и указывать на ошибки без смягчения». Иногда это помогает немного сдвинуть баланс. Но полностью избавиться от угодливости пока не может ни одна массово используемая модель, потому что, как ни крути, одна из ключевых бизнес-задач таких систем — чтобы вы возвращались снова и снова. А люди, к сожалению, возвращаются чаще к тем, кто их хвалит, а не к тем, кто их исправляет.

Изображение в превью:

Автор: Изображение сгенерировано ИИ GPT-4o
Источник: openai.com

1 комментарий

Скайнет, скайнет — говорили они. Но зачем такие сложности с войной и прочим, люди сам радостно побегут в пропасть как лемминги из анекдотов, лишь бы их хвалили и почёсывали их ЧСВ. Стоит лишь чуть ослабить усилия по развитию и поддержанию в области «производства средств производства» и всё, откат может быть жесточайшим.

Ответить

Добавить комментарий

Сейчас на главной

Новости

ASUS выпустила бюджетную версию видеокарты Prime RTX 5080 EVO OC

Первый в сезоне голубой тунец в Пинтунге, Тайвань, продали по 10 600 новых тайваньских долларов за килограмм

Флора и фауна
6 часов назад
0

26% голландцев планируют переехать в течение 3 лет; Большие города становятся менее популярными, поскольку люди стремятся к спокойствию

Оффтопик
6 часов назад
0

TP-Link выпустила доступный Wi-Fi 7 роутер с антеннами на основе ИИ и поддержкой технологии EasyMesh

Сетевое оборудование
7 часов назад
0

Insta360 выпустила внешний монитор Snap для селфи на основную камеру смартфонов

Гаджеты
7 часов назад
0

Публикации

Как 1280 человек породили все население Земли: история изоляции гоминин, которую приняли за вымирание

Статья
6 часов назад
Наука и космос

Сегодня численность нашего вида превышает восемь миллиардов особей. Мы занимаем все доступные экологические ниши, контролируем ресурсы планеты и физически меняем ее ландшафт. С точки зрения...

А что, если у темной материи два состояния? Как новая гипотеза объясняет гамма-аномалию Млечного Пути

Статья
7 часов назад
Наука и космос

Астрофизические наблюдения показывают, что эта темная материя составляет около 85% всей материи во Вселенной. Она не излучает свет, не отражает его и не участвует в электромагнитном взаимодействии,...

Обзор проектора FlixTone D9W Ultra: справится даже днем!

Обзор
8 часов назад
ТВ, мультимедиа и консоли

Мир мультимедийных проекторов постоянно пополняется новыми моделями и относительно недавно небольшой китайский бренд FlixTone представил 3 модели: D9W Mini, D9W Ultra и D10s. Все они отличаются...

Плавающие города Филиппин: почему народ Баджо веками живет на воде и боится только пиратов

Статья
8 часов назад
Путешествия и туризм

Города на воде раньше казались лишь элементом научной фантастики на страницах книг и сценариев блокбастеров. Но сейчас, со скачком технологий и поднятием уровня моря, Южная Корея официально...

Мощный, со складной трубкой и циклоном: обзор аккумуляторного пылесоса Redkey F11

Обзор
8 часов назад
Техника для дома

На рынке устройств для уборки уже много проверенных решений. Например, для самой качественной уборки без потери мощности, должна быть реализована система циклонной фильтрации, для уборки под...

Выбираем смартфон за 10-20 тысяч рублей весной 2026 года: каждому по потребности

Тематическая подборка
8 часов назад
Смартфоны и телефоны

В сегодняшней подборке я покажу вам несколько смартфонов в ценовом диапазоне «10-20 тысяч рублей». Эти модели призваны опровергнуть стереотип о том, что в бюджетном классе сложно смартфон с...