Исследование: ИИ-ассистенты замедляют работу опытных программистов, даже если кажется наоборот

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

НКО Model Evaluation & Threat Research (METR) провела масштабное исследование влияния ИИ-инструментов на производительность программистов. В течение нескольких месяцев в начале 2025 года 16 опытных open source-разработчиков ПО выполняли 246 реальных задач — от устранения багов до внедрения новых функций — в знакомых им крупных базах кода. Задачи случайным образом распределялись с разрешением или запретом на использование ИИ. В большинстве случаев разработчики выбирали Cursor Pro в паре с Claude 3.5 или 3.7 Sonnet.

Автор: Grok Источник: grok.com

Перед началом эксперимента участники обычно заявляли, что ИИ поможет выполнить их работу на 24 % быстрее. Даже после завершения эксперимента они продолжали считать, что стали работать быстрее на 20 %. Тем не менее, настоящие данные показали совсем противоположное. Использование ИИ даже увеличивало время выполнения задач в среднем на 19 %.

Авторы исследования назвали несколько причин замедления. Во-первых, завышенные ожидания от использования ИИ. Часто они не оправдывались. Кроме того, участники хорошо знали свои проекты и без ИИ работали довольно эффективно, а ИИ редко предлагал действительно полезные усовершенствоания. Проекты зачастую превышали миллион строк кода, и ИИ с трудом справлялся с такими задачами. Кроме того, ИИ предлагал не особенно надёжный код — разработчики принимали лишь 44 % его предложений, тратя значительное время на проверку и исправление. Наконец, ИИ не всегда понимал «скрытый контекст» проектов, что приводило к рекомендациям со слабой релевантностью.

Каждый разработчик заранее оценивал, сколько времени потребуется с ИИ и без помощника, записывал скринкаст во время работы и сам отмечал затраченное время. Участникам платили $150 в час, чтобы те отнеслись к эксперименту серьёзно. Результаты оказались стабильными и не зависели от способов анализа данных.

Впрочем, исследователи предупреждают, что не стоит обобщать выводы на всех программистов. Эксперимент касался высококвалифицированных специалистов, работающих с хорошо знакомыми и сложными проектами. Для новичков или при работе с меньшими базами кода ИИ может стать хорошим подспорьем (а может и нет). Кроме того, технологии продолжают стремительно развиваться, и будущие версии ИИ могут дать улучшенные результаты.

Несмотря на снижение скорости, многие участники и даже сами исследователи продолжают использовать ИИ-инструменты. Они отмечают, что даже если ИИ и не ускоряет работу, зато снижает «когнитивную нагрузку», из-за чего процесс программирования становится не таким утомительным.

Источник: Techspot

Автор не входит в состав редакции iXBT.com (подробнее »)
Об авторе
2016-kv@rambler.ru

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Redkey W11 для комплексной уборки без лишних хлопот: обзор моющего вертикального пылесоса с самоочисткой

Моющий пылесос Redkey W11 — это удобный вариант для комплексной уборки в доме или квартире без лишних хлопот. Его главное преимущество — это возможность одновременной сухой и...

Вечность из дефицита: как экономика СССР породила «неубиваемую» технику (и почему мы так больше не делаем)

Готов поспорить, у многих из вас где-то на даче, в гараже или на балконе стоит он — старый советский холодильник. «ЗиЛ», «Минск», «Саратов». Он может быть поцарапан, эмаль местами...

Почему в самолёте ремень безопасности проходит через пояс, а в автомобиле — через плечо

Каждый, кто хоть раз в жизни слышал команду «Пристегните ремни» в салоне самолёта, наверняка ловил себя на мысли: а что не так с этим ремнём? С самого детства, садясь в машину, мы усвоили правило:...

✦ ИИ  7 самых высоких зданий: сколько этажей, высота и как они выглядят

  • Тематическая подборка
  • Оффтопик
В подборке только настоящие здания, а не любые высокие сооружения подряд. То есть здесь именно небоскрёбы с этажами, лифтами, офисами, отелями и людьми внутри. Телебашни, мачты и трубы я сюда не...

Обзор TCOMAS WA300 360 White — СЖО достойное шоу «Тачка на прокачку»

Если вы застали эпоху MTV и помните легендарное шоу «Тачка на прокачку» (Pimp My Ride), то наверняка в вашу душу запала их коронная фишка — установка мониторов и игровых приставок в...

Спорный вариант, но если привыкнуть... Обзор игрового QD-OLED монитора MSI MAG 321UPX и все что нужно знать + видеообзоры

QD-OLED-мониторы давно перестали быть экзотикой, но всё ещё остаются нишевым и спорным решением. MSI MAG 321UPX — как раз из таких устройств. Это 31,5-дюймовый игровой монитор на Samsung...