Новая ИИ-модель из Сингапура обошла ChatGPT в сложном тесте

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Исследователи из сингапурского стартапа Sapient разработали новую архитектуру искусственного интеллекта под названием «иерархическая модель рассуждений» (HRM), которая достигла значительных результатов при минимальных вычислительных ресурсах. Согласно препринту, опубликованному на arXiv, модель HRM показала точность 40,3% на тесте абстракции и корпуса рассуждений (ARC-AGI), превзойдя такие модели как o3-mini-high от OpenAI (34,5%), Claude 3.7 (21,2%) и Deepseek R1 (15,8%).

Ключевая особенность HRM заключается в её компактности — модель содержит всего 27 миллионов параметров, что примерно в 1000 раз меньше, чем у традиционных крупных языковых моделей. Обучение проводилось на ограниченном наборе данных из 1000 выборок без предварительного обучения, обучения с подкреплением или тонкой настройки на больших массивах интернет-данных.

Автор: Freepik Источник: ru.freepik.com

Архитектура HRM состоит из двух модулей: высокоуровневого контроллера, планирующего абстрактные стратегии, и низкоуровневого исполнителя, обрабатывающего детальные вычисления. Эта структура имитирует способность человеческого мозга обрабатывать информацию в различных временных масштабах. В отличие от метода цепочки мыслей (CoT), используемого большинством современных языковых моделей, HRM выполняет задачи за один прямой проход.

Модель продемонстрировала высокую эффективность в решении сложных логических задач, таких как судоку и навигация в лабиринтах. Однако независимые исследователи отмечают, что успех модели может быть связан не столько с иерархической структурой, сколько с новым методом обучения — циклом уточнения, который был лишь кратко упомянут в оригинальной статье.

Статья Sapient пока не прошла полное рецензирование, и версия HRM с открытым исходным кодом для независимого тестирования в настоящее время недоступна.

Источник: Daily Galaxy

Автор не входит в состав редакции iXBT.com (подробнее »)

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Как обрабатывать и заготавливать грибы: от лесной корзины до банки на зиму

Собранные грибы портятся за несколько часов. Расскажу, как перебрать, почистить и засушить или засолить правильно. Почему маслятам снимают кожицу, а грузди вымачивают дни. Только проверенные способы.

✦ ИИ  Самые маленькие жабы в мире не умеют нормально приземляться: их вестибулярный аппарат работает на пределе возможного

Эти крошечные жабки не умеют приземляться — падают на спину в трети прыжков. Причина — вестибулярный аппарат на грани миниатюризации. Почему они не слышат, светятся и ядовиты.

OpenWrt для новичков: зачем ставить альтернативную прошивку на роутер

OpenWrt выбирают не только для экспериментов со старым оборудованием. Эту систему нередко устанавливают на новый роутер сразу после покупки, чтобы получить гибкую настройку сети, нормальный цикл...

120+ Ватт в формате маркера: обзор и тепловизионный тест портативного паяльника Alientek T90C

Alientek — китайская компания, известная прежде всего платами разработчика на STM32. Паяльник T90 — их попытка зайти в нишу умных портативных инструментов. Версия T90C...

Обзор внешнего аккумулятора Basеus EnеrGeek GR11 145Вт, 20000мАч: Когда забрали больше, чем дали

Рынок павербанков давно поделён между двумя лагерями: одни делают упор на ёмкость, другие — на скорость зарядки. Baseus с моделью EnerGeek GR11 попытался усидеть на обоих стульях...

Что можно купить в Турции на 1000 лир в 2026 году: собираю обычную продуктовую корзину

1000 лир в Турции звучит вроде бы нормально. Это примерно 1600 рублей, если считать по простому курсу: 1 лира — около 1,6 рубля. Не так, чтобы устроить большую закупку, но и не...