Новая ИИ-модель из Сингапура обошла ChatGPT в сложном тесте

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Исследователи из сингапурского стартапа Sapient разработали новую архитектуру искусственного интеллекта под названием «иерархическая модель рассуждений» (HRM), которая достигла значительных результатов при минимальных вычислительных ресурсах. Согласно препринту, опубликованному на arXiv, модель HRM показала точность 40,3% на тесте абстракции и корпуса рассуждений (ARC-AGI), превзойдя такие модели как o3-mini-high от OpenAI (34,5%), Claude 3.7 (21,2%) и Deepseek R1 (15,8%).

Ключевая особенность HRM заключается в её компактности — модель содержит всего 27 миллионов параметров, что примерно в 1000 раз меньше, чем у традиционных крупных языковых моделей. Обучение проводилось на ограниченном наборе данных из 1000 выборок без предварительного обучения, обучения с подкреплением или тонкой настройки на больших массивах интернет-данных.

Автор: Freepik Источник: ru.freepik.com

Архитектура HRM состоит из двух модулей: высокоуровневого контроллера, планирующего абстрактные стратегии, и низкоуровневого исполнителя, обрабатывающего детальные вычисления. Эта структура имитирует способность человеческого мозга обрабатывать информацию в различных временных масштабах. В отличие от метода цепочки мыслей (CoT), используемого большинством современных языковых моделей, HRM выполняет задачи за один прямой проход.

Модель продемонстрировала высокую эффективность в решении сложных логических задач, таких как судоку и навигация в лабиринтах. Однако независимые исследователи отмечают, что успех модели может быть связан не столько с иерархической структурой, сколько с новым методом обучения — циклом уточнения, который был лишь кратко упомянут в оригинальной статье.

Статья Sapient пока не прошла полное рецензирование, и версия HRM с открытым исходным кодом для независимого тестирования в настоящее время недоступна.

Источник: Daily Galaxy

Автор не входит в состав редакции iXBT.com (подробнее »)

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Декоративный камин с эффектом живого пламени: ожидание и реальность

Жители шумных мегаполисов с однотипными многоэтажными человейниками часто мечтают о том, как в конце дня они могли бы отдыхать в своем доме, сидя в удобном кресле с чашкой горячего чая и...

Угольный фильтр в холодильнике: нужен ли он и стоит ли за него платить

Современный холодильник представляет сложную система, где воздух постоянно циркулирует для равномерного охлаждения всех продуктов. При хранении разнообразной еды в камере могут появляться...

Гидропонная ферма своими руками: создаём установку для свежей зелени на подоконнике с 3D‑принтером QIDI Max4

Свежая зелень круглый год: как собрать гидропонную систему с помощью 3D‑печати на примере QIDI Max4. Свежая зелень в доме круглый год — об этом, пожалуй, мечтают многие, и не имеет...

Роботы научились «плавать» в пространстве-времени, используя формулы Эйнштейна

Благодаря научно-фантастическим фильмам мы уже привыкли, что на основе Общей теории относительности Эйнштейна мы когда-то в далёком будущем сможем покорять пространство-время. А сейчас эту теорию...

Обзор комбо-устройства Inspector Mike S Pro – возможности комбо-устройства без лишних ожиданий

Inspector Mike S Pro это комбайн, вобравший в себя функции видеорегистратора, радар-детектора и GPS-информера в одном корпусе. Модель получила рупорную антенну с LNA-усилителем, распознавание...

Мы десятилетиями недооценивали Вселенную: астрономы обнаружили водородный туман, скрывающий настоящие размеры галактик

На протяжении многих десятилетий астрономические наблюдения строились вокруг изучения звезд. Когда исследователи направляли телескопы в космос, они фиксировали свет светящихся объектов и на основе...