Для работы проектов iXBT.com нужны файлы cookie и сервисы аналитики. Продолжая посещать сайты проектов вы соглашаетесь с нашей Политикой в отношении файлов cookie

Новая ИИ-модель из Сингапура обошла ChatGPT в сложном тесте

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com

21 сентября 2025, 10:33 | Новость | ИИ, сервисы и приложения

Исследователи из сингапурского стартапа Sapient разработали новую архитектуру искусственного интеллекта под названием «иерархическая модель рассуждений» (HRM), которая достигла значительных результатов при минимальных вычислительных ресурсах. Согласно препринту, опубликованному на arXiv, модель HRM показала точность 40,3% на тесте абстракции и корпуса рассуждений (ARC-AGI), превзойдя такие модели как o3-mini-high от OpenAI (34,5%), Claude 3.7 (21,2%) и Deepseek R1 (15,8%).

Ключевая особенность HRM заключается в её компактности — модель содержит всего 27 миллионов параметров, что примерно в 1000 раз меньше, чем у традиционных крупных языковых моделей. Обучение проводилось на ограниченном наборе данных из 1000 выборок без предварительного обучения, обучения с подкреплением или тонкой настройки на больших массивах интернет-данных.

Архитектура HRM состоит из двух модулей: высокоуровневого контроллера, планирующего абстрактные стратегии, и низкоуровневого исполнителя, обрабатывающего детальные вычисления. Эта структура имитирует способность человеческого мозга обрабатывать информацию в различных временных масштабах. В отличие от метода цепочки мыслей (CoT), используемого большинством современных языковых моделей, HRM выполняет задачи за один прямой проход.

Модель продемонстрировала высокую эффективность в решении сложных логических задач, таких как судоку и навигация в лабиринтах. Однако независимые исследователи отмечают, что успех модели может быть связан не столько с иерархической структурой, сколько с новым методом обучения — циклом уточнения, который был лишь кратко упомянут в оригинальной статье.

Статья Sapient пока не прошла полное рецензирование, и версия HRM с открытым исходным кодом для независимого тестирования в настоящее время недоступна.

Источник: Daily Galaxy

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Microsoft выпустила три собственные ИИ-модели для речи и изображений

Verge запускает производство электромотоцикла TS Pro Gen 2 с твердотельной батареей

Авто и транспорт
1 час назад
0

Это первый смартфон на базе Mediatek Dimensity 6500: Honor X80i представлен официально

Samsung меняет стратегию закупок компонентов для смартфонов и начинает активнее переходить на китайские компоненты

ИИ разгадал правила древнеримской игры, над которыми ученые бились 40 лет

Наука и космос
1 час назад
0

Публикации

Tronsmart Halo 100: обзор беспроводной колонки для дома и дачи (60Вт, до 18 часов работы, IPX6)

Обзор
1 минута назад
Аудио и звук

Ну что, друзья, давайте я вам расскажу про свою новую игрушку, колонку Tronsmart Halo 100. Искал я что-то мощное, чтобы и на даче шашлыки жарить под музыку, и дома, если захочется устроить...

Фонарик в смартфоне больше не включаю: обзор мини-фонаря Sofirn SC13

Обзор
7 минут назад
Фонари

Сколько раз видел как люди ночью светили себе на темных тропинках чахлым фонариком, встроенным в смартфон. Эффективности от этого совсем не много, еще смартфон садится и есть риск его уронить в...

Почему российское образование работает именно так: системный анализ главных проблем

Мнение
25 минут назад
Оффтопик

Российское образование работает так, как от него требуется государству. Бюрократия, устаревшие методики, слабые учителя — это не ошибки, а согласованный механизм социализации и отбора.

Обзор механической клавиатуры с котиками YUNZII B98 PRO

Обзор
26 минут назад
Клавиатуры, мыши и периферия

Современные механические клавиатуры давно перестали быть просто инструментом для набора текста — они превратились в полноценный элемент рабочего пространства, отражение индивидуального...

Обзор цепной аккумуляторной пилы PROCRAFT PKA32Li 20В: две шины на 6« и 8», 2 цепи, АКБ 4Ач и автоподача масла

Обзор
3 часа назад
Инструменты и запчасти

Многие дачники уже начали весеннюю обрезку кустарников и деревьев на своих участках. Использовать ручные секаторы и пилы крайне не удобно, что было проверенно лично. Поэтому для себя прикупил...

Один «крылатый» фонарик для всех нужд. Дальнобойность, яркость и УФ-свет. Обзор Wurkkos HD05

Обзор
6 часов назад
Фонари

Поворотное светодиодное «крыло» заливного свет для ремонта и кемпинга, 3100 люменов яркости с хорошей дальнобойностью, красный и УФ-свет для высвечивания невидимого. Всё это логичное развитие...