Китайский стартап представил Kimi-K2 Thinking — открытую ИИ-модель с многошаговым мышлением

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

В Китае запущена новая нейросетевая модель Kimi-K2 Thinking, разработанная компанией Moonshot AI. В отличие от большинства закрытых систем, она доступна бесплатно и обладает способностью к многоступенчатому рассуждению — то есть самостоятельно выполняет длинные логические цепочки и сложные вычисления.

Как пояснили в Moonshot AI, K2 Thinking не ограничивается генерацией текста. Модель способна анализировать запрос, разрабатывать стратегию решения, обращаться к внешним базам знаний, писать и запускать код, а затем проверять результат. Такой подход позволяет ей решать задачи, требующие глубокого анализа, — от научных вычислений до написания приложений.

Автор: Логотип Kimi: Moonshot AI Источник: hi-tech.mail.ru

По данным разработчиков, K2 Thinking выдержала серию тестов, в которых показала высокие результаты. На экзамене Humanity's Last Exam (с тысячами экспертных вопросов по сотне дисциплин) модель набрала 44,9%, на BrowseComp — 60,2%, что почти вдвое превышает средний уровень человека. При проверке на SWE-Bench, тесте для систем кодирования, K2 Thinking успешно справилась с 71,3% заданий.

В одном из демонстрационных примеров ИИ решил задачу уровня аспирантуры по гиперболической геометрии. Для этого он выполнил более двадцати итераций рассуждений, искал научные публикации, запускал Python-код для расчётов и сверял промежуточные данные. Специалисты отмечают, что это один из первых случаев, когда нейросеть демонстрирует способность самостоятельно планировать и адаптировать ход рассуждений без участия человека.

По оценке экспертов отрасли, появление открытых моделей такого уровня может изменить баланс сил в сфере искусственного интеллекта. Доступность технологии даёт исследователям и разработчикам возможность использовать вычислительные возможности, ранее доступные только крупным корпорациям.

Источник: https://hi-tech.mail.ru

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Анатомия фастфуда: почему куриные стрипсы стоят вдвое дороже наггетсов

Представьте эту до боли знакомую сцену. Вы стоите у светящегося меню в ресторане быстрого питания или задумчиво разглядываете морозильный ларь в супермаркете. Перед вами два, казалось бы,...

Эта рыба умеет ходить по суше: 5 видов, которые выглядят как баг в реальности

Принято считать, что жизнь рыб строго ограничена водной средой. Однако эволюция сформировала виды, способные не только выживать на открытом воздухе, но и целенаправленно передвигаться по суше. Они...

✦ ИИ  Почему современным оптическим мышкам больше не нужна красная подсветка

Каждый, кто застал компьютерный бум нулевых, помнит символ прогресса в устройствах ввода — красный огонёк, бьющий из-под новой оптической мышки. Он пришёл на смену вечно забивающимся...

Обзор детектора FNIRSI WD-02: проводка и арматура не скроется

Ремонт в доме, в квартире или в гараже чаще всего подразумевает сверление или штробление стен и потолков, но как не попасть в проводку или арматуру? Конечно есть множество разнообразных приборов...

Обзор беговых смарт-часов Amazfit Active 3 Premium: теперь ты знаешь свой порог лактата

Решил заняться бегом, а выбор программ в фитнес-часах ограничен? На помощь пришли Amazfit с беговыми смарт-часами Active 3 Premium, в которых есть 10 видов беговых тренировок и оценка порога лактата.

Как пополнить российской картой баланс любого мобильного оператора Египта и других стран

Недавно в приложении Сбера появилась возможность оплаты мобильной связи многих стран, в том числе Египта. Опробовал, действительно работает.