Новая ИИ-модель из Сингапура обошла ChatGPT в сложном тесте

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Исследователи из сингапурского стартапа Sapient разработали новую архитектуру искусственного интеллекта под названием «иерархическая модель рассуждений» (HRM), которая достигла значительных результатов при минимальных вычислительных ресурсах. Согласно препринту, опубликованному на arXiv, модель HRM показала точность 40,3% на тесте абстракции и корпуса рассуждений (ARC-AGI), превзойдя такие модели как o3-mini-high от OpenAI (34,5%), Claude 3.7 (21,2%) и Deepseek R1 (15,8%).

Ключевая особенность HRM заключается в её компактности — модель содержит всего 27 миллионов параметров, что примерно в 1000 раз меньше, чем у традиционных крупных языковых моделей. Обучение проводилось на ограниченном наборе данных из 1000 выборок без предварительного обучения, обучения с подкреплением или тонкой настройки на больших массивах интернет-данных.

Автор: Freepik Источник: ru.freepik.com

Архитектура HRM состоит из двух модулей: высокоуровневого контроллера, планирующего абстрактные стратегии, и низкоуровневого исполнителя, обрабатывающего детальные вычисления. Эта структура имитирует способность человеческого мозга обрабатывать информацию в различных временных масштабах. В отличие от метода цепочки мыслей (CoT), используемого большинством современных языковых моделей, HRM выполняет задачи за один прямой проход.

Модель продемонстрировала высокую эффективность в решении сложных логических задач, таких как судоку и навигация в лабиринтах. Однако независимые исследователи отмечают, что успех модели может быть связан не столько с иерархической структурой, сколько с новым методом обучения — циклом уточнения, который был лишь кратко упомянут в оригинальной статье.

Статья Sapient пока не прошла полное рецензирование, и версия HRM с открытым исходным кодом для независимого тестирования в настоящее время недоступна.

Источник: Daily Galaxy

Автор не входит в состав редакции iXBT.com (подробнее »)

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Кембрийского взрыва не было: почему внезапное появление сложных животных оказалось ошибкой геологической летописи

Если вы посмотрите на палеонтологическую летопись 550 миллионов лет назад, вы увидите Эдиакарский период — странный, тихий мир. Дно океанов покрыто бактериальными матами, на которых...

Часовой букет Чайкина: как механические цветы превращаются в символ времени

Апрель в этом году начался очень художественно: сразу несколько выставок-ярмарок современного искусства проходят в Москве, и на одной из них, «Арт России» можно видеть замысловатые художественные...

Обзор наушников ZiiGaat Arete II: буря эмоций и мощный драйв

Наушники Arete II, производства компании компании ZiiGaat, интересны в первую очередь своей преемственностью, прошлая версия стала относительно успешной, ну и в разработке опять участвовал...

В атмосфере Венеры может существовать жизнь: химики синтезировали аналоги ДНК, устойчивые к серной кислоте

Поверхность Венеры абсолютно непригодна для любых известных науке сложных химических процессов. Температура там достигает 470 градусов Цельсия, а атмосферное давление в девяносто раз превышает...

Какие великаны создали Тропу гигантов в Ирландии

Ирландия это поистине страна, которая всем своим видом пытается доказать, что волшебство существует. Изумрудные луга простираются на многие километры, над головой нависают скалы, а о берега бьются...

Необычный фонарик. Светит ярко, наклоняет голову и помогает при ремонте. Полный обзор Sofirn ST2

3000люм яркости, голова с изменяемым углом наклона, питание от двух 18650 аккумуляторов и дополнительные УФ и красный свет. Фонарик получился явно необычный. Но удачный ли? Обзор Sofirn...