Для работы проектов iXBT.com нужны файлы cookie и сервисы аналитики. Продолжая посещать сайты проектов вы соглашаетесь с нашей Политикой в отношении файлов cookie

Новая ИИ-модель из Сингапура обошла ChatGPT в сложном тесте

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com

21 сентября 2025, 10:33 | Новость | ИИ, сервисы и приложения

Исследователи из сингапурского стартапа Sapient разработали новую архитектуру искусственного интеллекта под названием «иерархическая модель рассуждений» (HRM), которая достигла значительных результатов при минимальных вычислительных ресурсах. Согласно препринту, опубликованному на arXiv, модель HRM показала точность 40,3% на тесте абстракции и корпуса рассуждений (ARC-AGI), превзойдя такие модели как o3-mini-high от OpenAI (34,5%), Claude 3.7 (21,2%) и Deepseek R1 (15,8%).

Ключевая особенность HRM заключается в её компактности — модель содержит всего 27 миллионов параметров, что примерно в 1000 раз меньше, чем у традиционных крупных языковых моделей. Обучение проводилось на ограниченном наборе данных из 1000 выборок без предварительного обучения, обучения с подкреплением или тонкой настройки на больших массивах интернет-данных.

Архитектура HRM состоит из двух модулей: высокоуровневого контроллера, планирующего абстрактные стратегии, и низкоуровневого исполнителя, обрабатывающего детальные вычисления. Эта структура имитирует способность человеческого мозга обрабатывать информацию в различных временных масштабах. В отличие от метода цепочки мыслей (CoT), используемого большинством современных языковых моделей, HRM выполняет задачи за один прямой проход.

Модель продемонстрировала высокую эффективность в решении сложных логических задач, таких как судоку и навигация в лабиринтах. Однако независимые исследователи отмечают, что успех модели может быть связан не столько с иерархической структурой, сколько с новым методом обучения — циклом уточнения, который был лишь кратко упомянут в оригинальной статье.

Статья Sapient пока не прошла полное рецензирование, и версия HRM с открытым исходным кодом для независимого тестирования в настоящее время недоступна.

Источник: Daily Galaxy

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Outlander объединяет шлем, гарнитуру и систему связи: Sena представила мотошлем со встроенным Mesh-интеркомом

Авто и транспорт
2 часа назад
0

В священном лесу на востоке Непала обнаружен находящийся под угрозой исчезновения китайский панголин

Флора и фауна
2 часа назад
0

AirPods впервые позволят настраивать звук под себя: Apple добавит в наушники долгожданный эквалайзер

Аудио и звук
2 часа назад
0

Samsung добавит в серию Galaxy S26 новую функцию управления питанием от батареи для производительности и длительного времени автономной работы

OnePlus готовит к выпуску сверхдоступную линейку телефонов

Публикации

«Сапсан» на резиновом ходу: почему автобусы не мчатся по шоссе со скоростью поезда (и что нужно, чтобы это исправить)

Статья
4 часа назад
Наука и космос

Междугородные автобусы считаются доступным, но медленным способом передвижения. Их скорость на трассах обычно ограничена установленными правилами и возможностями техники — в большинстве...

Haylou Solar Lite 2 — обзор бюджетных смарт-часов, от которых ждешь меньше, чем получаешь

Обзор
4 часа назад
Гаджеты

Вы удивитесь, что смарт-часы Haylou Solar Lite 2 за цену обычного фитнес-браслета способны предложить AMOLED-экран, звонки и автономность до 10 дней. Я протестировал новинку и выяснил, где она...

5 лет без еды: как гигантские глубоководные изоподы выживают на дне океана

Статья
5 часов назад
Наука и космос

Глубоководные зоны океана это одна из самых неблагоприятных сред для жизни на Земле. На глубине от нескольких сотен метров до нескольких километров полностью отсутствует солнечный свет, температура...

Обзор Blackview AceBook 8 Pro — неожиданно удачный ноутбук для учебы и офисных задач

Компания Blackview, известная своими решениями в смартфонах, выпустила новинку на рынке ноутбуков для работы, который получил все необходимые решения: правильная диагональ экрана 16″,...

Что мы знаем о метеоритах: от удара по дому до египетских бус

Тематическая подборка
7 часов назад
Наука и космос

Метеорит ударил Энн рикошетом, самый тяжёлый камень весит 66 тонн, а египетские бусы сделаны из космического никеля. Разобрала невыдуманные истории — с цифрами и без пафоса.

✦ ИИ Самолёт, который летает быстрее звука, но не шумит: история NASA X-59 и будущее сверхзвуковых полётов

Статья
7 часов назад
Авто и транспорт

Жители, проживающие вблизи аэродромов, отлично осведомлены о том, насколько сильный дискомфорт создают самолеты при взлете. Именно по этой причине полеты над жилыми зонами строго запрещены,...