Новая ИИ-модель из Сингапура обошла ChatGPT в сложном тесте

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Исследователи из сингапурского стартапа Sapient разработали новую архитектуру искусственного интеллекта под названием «иерархическая модель рассуждений» (HRM), которая достигла значительных результатов при минимальных вычислительных ресурсах. Согласно препринту, опубликованному на arXiv, модель HRM показала точность 40,3% на тесте абстракции и корпуса рассуждений (ARC-AGI), превзойдя такие модели как o3-mini-high от OpenAI (34,5%), Claude 3.7 (21,2%) и Deepseek R1 (15,8%).

Ключевая особенность HRM заключается в её компактности — модель содержит всего 27 миллионов параметров, что примерно в 1000 раз меньше, чем у традиционных крупных языковых моделей. Обучение проводилось на ограниченном наборе данных из 1000 выборок без предварительного обучения, обучения с подкреплением или тонкой настройки на больших массивах интернет-данных.

Автор: Freepik Источник: ru.freepik.com

Архитектура HRM состоит из двух модулей: высокоуровневого контроллера, планирующего абстрактные стратегии, и низкоуровневого исполнителя, обрабатывающего детальные вычисления. Эта структура имитирует способность человеческого мозга обрабатывать информацию в различных временных масштабах. В отличие от метода цепочки мыслей (CoT), используемого большинством современных языковых моделей, HRM выполняет задачи за один прямой проход.

Модель продемонстрировала высокую эффективность в решении сложных логических задач, таких как судоку и навигация в лабиринтах. Однако независимые исследователи отмечают, что успех модели может быть связан не столько с иерархической структурой, сколько с новым методом обучения — циклом уточнения, который был лишь кратко упомянут в оригинальной статье.

Статья Sapient пока не прошла полное рецензирование, и версия HRM с открытым исходным кодом для независимого тестирования в настоящее время недоступна.

Источник: Daily Galaxy

Автор не входит в состав редакции iXBT.com (подробнее »)

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Велофонарь, который удивил «умом»: обзор Igpsport VS1800S

Живем в эпоху умных технологий. Коснулись они и аксессуаров для велосипеда. Сегодня рассмотрим флагманский передний велосипедный свет от китайского бренда Igpsport. У фонаря VS1800S максимальный...

Почему чернеют пионы: серая гниль, дожди и кислая почва — как спасти цветник

Бутоны пионов чернеют и не распускаются? Это серая гниль. Рассказываю, как распознать ботритис, чем обработать кусты, зачем раскислять почву и какие биопрепараты работают без химии.

CMR или SMR: как не ошибиться с выбором дисков для NAS

При покупке HDD для сетевого хранилища важно выяснить не только объём, скорость вращения шпинделя и гарантийный срок. Способ магнитной записи влияет на то, как накопитель переносит многочасовую...

Что произойдет, если звезда проглотит черную дыру: ученые смоделировали финал «хокинговских звезд»

Одной из главных нерешенных задач современной физики остается природа темной материи. На ее долю приходится около четверти массы Вселенной, однако мы до сих пор не знаем, из чего она состоит. Среди...

Что могут самые дешевые электронные весы SF-400 за 200 рублей c AliExpress? Обзор и стоит ли их брать?

Недавно приобрел одни из самых дешёвых кухонных весов, которые можно найти в продаже — модель SF-400. Стоимость устройства составляет около 190-200 рублей, поэтому стало интересно,...

Конкурент нефти за $1: как новая технология получает авиационное топливо из полимерных отходов

Авиационный транспорт играет ключевую роль в мировой экономике, обеспечивая быстрое перемещение пассажиров и грузов между континентами. Однако эта отрасль наносит существенный вред окружающей...