Новая ИИ-модель из Сингапура обошла ChatGPT в сложном тесте

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Исследователи из сингапурского стартапа Sapient разработали новую архитектуру искусственного интеллекта под названием «иерархическая модель рассуждений» (HRM), которая достигла значительных результатов при минимальных вычислительных ресурсах. Согласно препринту, опубликованному на arXiv, модель HRM показала точность 40,3% на тесте абстракции и корпуса рассуждений (ARC-AGI), превзойдя такие модели как o3-mini-high от OpenAI (34,5%), Claude 3.7 (21,2%) и Deepseek R1 (15,8%).

Ключевая особенность HRM заключается в её компактности — модель содержит всего 27 миллионов параметров, что примерно в 1000 раз меньше, чем у традиционных крупных языковых моделей. Обучение проводилось на ограниченном наборе данных из 1000 выборок без предварительного обучения, обучения с подкреплением или тонкой настройки на больших массивах интернет-данных.

Автор: Freepik Источник: ru.freepik.com

Архитектура HRM состоит из двух модулей: высокоуровневого контроллера, планирующего абстрактные стратегии, и низкоуровневого исполнителя, обрабатывающего детальные вычисления. Эта структура имитирует способность человеческого мозга обрабатывать информацию в различных временных масштабах. В отличие от метода цепочки мыслей (CoT), используемого большинством современных языковых моделей, HRM выполняет задачи за один прямой проход.

Модель продемонстрировала высокую эффективность в решении сложных логических задач, таких как судоку и навигация в лабиринтах. Однако независимые исследователи отмечают, что успех модели может быть связан не столько с иерархической структурой, сколько с новым методом обучения — циклом уточнения, который был лишь кратко упомянут в оригинальной статье.

Статья Sapient пока не прошла полное рецензирование, и версия HRM с открытым исходным кодом для независимого тестирования в настоящее время недоступна.

Источник: Daily Galaxy

Автор не входит в состав редакции iXBT.com (подробнее »)

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Что мы знаем о метеоритах: от удара по дому до египетских бус

Метеорит ударил Энн рикошетом, самый тяжёлый камень весит 66 тонн, а египетские бусы сделаны из космического никеля. Разобрала невыдуманные истории — с цифрами и без пафоса.

✦ ИИ  Самолёт, который летает быстрее звука, но не шумит: история NASA X-59 и будущее сверхзвуковых полётов

Жители, проживающие вблизи аэродромов, отлично осведомлены о том, насколько сильный дискомфорт создают самолеты при взлете. Именно по этой причине полеты над жилыми зонами строго запрещены,...

«Маяк-001-стерео»: что умел первый и очень дорогой советский магнитофон класса Hi-Fi

Магнитофон-приставка «Маяк-001-стерео» открыл серию советских катушечных аппаратов высшего класса сложности. Ряд инженерных решений в нём применили впервые для серийной отечественной аудиотехники....

Какую систему резервного питания дачи выбрать

На основе личного опыта расскажу о разных вариантах решения проблемы временных отключений электричества от самого бюджетного до умеренно дорогого. Дам ссылки на свои статьи о конкретных системах....

Обзор компактного электронного уровня-угломера TECHNICOM TC-LA65C с магнитным креплением и пузырьковым уровнем

При проведении строительно-монтажных работ или контрольной проверки уровней наклона конструкций не обойтись без специального инструмента. Универсальный цифровой уровень-угломер TECHNICOM TC-LA65C,...

Обзор механической беспроводной клавиатуры в ретро-стиле Epomaker RT100 PRO

Помните свой первый компьютер, а первую пройденную игру, а какая была периферия? Я вот лично помню пузатый монитор, колонки Sven, мышь A4Tech и клавиатуру Microsoft. То время уже ушло, но помнится...