Система Gemini от Google DeepMind получила золотую оценку на Международной математической олимпиаде 2025

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Искусственный интеллект впервые достиг результатов высшего уровня на престижном математическом состязании, традиционно предназначенном для одаренных школьников со всего мира.

В рамках 66-й Международной математической олимпиады (ММО), состоявшейся в Австралии, интеллектуальная система Gemini «Deep Think», разработанная лабораторией Google DeepMind, продемонстрировала беспрецедентный результат. Алгоритм справился с пятью из шести предложенных олимпиадных заданий, заработав 35 баллов из максимально возможных 42, что соответствует критериям золотого уровня, определенным экспертной комиссией соревнования.

Достижение отражает значительный технологический скачок в сравнении с показателями прошлогодних разработок. В 2024 году инструменты AlphaProof и AlphaGeometry 2 от того же разработчика смогли преодолеть только серебряный рубеж, справившись с четырьмя задачами и набрав 28 баллов. Существенным ограничением предшествующих инструментов являлась необходимость конвертации между обычной речью и специализированными формальными нотациями, а процесс вычисления требовал многодневных расчетов.

Автор: Google Источник: www.notebookcheck.net

Принципиальное новшество нынешней разработки заключается в способности обрабатывать информацию исключительно на естественном языке на всех этапах решения. Интеллектуальная система представила исчерпывающие и математически строгие доказательства в рамках стандартного временного регламента олимпиады — 4,5 часа, основываясь исключительно на официальных формулировках задач.

Члены жюри олимпиады, привыкшие оценивать работы учащихся, охарактеризовали представленные Gemini решения как «четкие» и «математически безупречные». Представители DeepMind связывают данное достижение с комплексом инноваций: внедрением усовершенствованных методик обучения с подкреплением, формированием специализированного корпуса математических примеров и разработкой техник многопоточного анализа, позволяющих одновременно исследовать различные стратегии поиска решения.

По сведениям из индустриальных источников, аналогичные технологические платформы, включая разработки OpenAI, также показывают сопоставимые результаты при неофициальном тестировании. Однако именно показатели Gemini стали первым случаем, когда автоматизированная математическая система получила официальную сертификацию организационным комитетом олимпиады.

Руководство Google DeepMind анонсировало поэтапное внедрение технологии Deep Think, начиная с предоставления доступа ограниченному кругу профессиональных математиков перед масштабным распространением. Исследовательская группа продолжает совершенствовать как методы обработки естественного языка, так и формализованные подходы к математическому моделированию для расширения возможностей научных изысканий.

Источник: Notebookcheck

Автор не входит в состав редакции iXBT.com (подробнее »)

Сейчас на главной

Новости

Публикации

Почему исчезли в городах стационарные посты ДПС

В последние десятилетия городской ландшафт России претерпел значительные изменения, и одним из заметных явлений (особенно водителям) стало исчезновение стационарных постов ДПС. Уже 10-15 лет...

MP3 наносит ответный удар: почему сжатый звук снова в моде

После десятилетия господства Hi-Res Audio, винилового ренессанса и тотальной гегемонии стриминговых сервисов люди вдруг начали с какой-то вызывающей гордостью признаваться: «А я слушаю MP3»...

✦ ИИ  Почему 50MP и 12MP камеры смартфона дают одинаковое качество фото? Подробно о камерах в смартфонах

Когда производители смартфонов анонсируют новые флагманы, они часто с гордостью выставляют цифры мегапиксельности — 50MP, 100MP, 200MP. На первый взгляд эти числа должны гарантировать...

Возрождение UMPC: представлен карманный мини-ПК OmniOne Pocket PC за $359

На платформе Kickstarter стартовала кампания по сбору средств на OmniOne — компактный мини-ПК со встроенным 5.7-дюймовым сенсорным экраном, аккумулятором и полноценной физической...

Обзор мультимодульной системы Интерскол МультиМАКС 36 — универсальный инструмент с одним приводом

Можно ли одним инструментом заменить целую мастерскую, без потери мощности и удобства? Этим вопросом я задался, когда взял на тест систему ИНТЕРСКОЛ МультиМАКС 36, в которую входят...