Система Gemini от Google DeepMind получила золотую оценку на Международной математической олимпиаде 2025
Искусственный интеллект впервые достиг результатов высшего уровня на престижном математическом состязании, традиционно предназначенном для одаренных школьников со всего мира.
В рамках 66-й Международной математической олимпиады (ММО), состоявшейся в Австралии, интеллектуальная система Gemini «Deep Think», разработанная лабораторией Google DeepMind, продемонстрировала беспрецедентный результат. Алгоритм справился с пятью из шести предложенных олимпиадных заданий, заработав 35 баллов из максимально возможных 42, что соответствует критериям золотого уровня, определенным экспертной комиссией соревнования.
Достижение отражает значительный технологический скачок в сравнении с показателями прошлогодних разработок. В 2024 году инструменты AlphaProof и AlphaGeometry 2 от того же разработчика смогли преодолеть только серебряный рубеж, справившись с четырьмя задачами и набрав 28 баллов. Существенным ограничением предшествующих инструментов являлась необходимость конвертации между обычной речью и специализированными формальными нотациями, а процесс вычисления требовал многодневных расчетов.
Принципиальное новшество нынешней разработки заключается в способности обрабатывать информацию исключительно на естественном языке на всех этапах решения. Интеллектуальная система представила исчерпывающие и математически строгие доказательства в рамках стандартного временного регламента олимпиады — 4,5 часа, основываясь исключительно на официальных формулировках задач.
Члены жюри олимпиады, привыкшие оценивать работы учащихся, охарактеризовали представленные Gemini решения как «четкие» и «математически безупречные». Представители DeepMind связывают данное достижение с комплексом инноваций: внедрением усовершенствованных методик обучения с подкреплением, формированием специализированного корпуса математических примеров и разработкой техник многопоточного анализа, позволяющих одновременно исследовать различные стратегии поиска решения.
По сведениям из индустриальных источников, аналогичные технологические платформы, включая разработки OpenAI, также показывают сопоставимые результаты при неофициальном тестировании. Однако именно показатели Gemini стали первым случаем, когда автоматизированная математическая система получила официальную сертификацию организационным комитетом олимпиады.
Руководство Google DeepMind анонсировало поэтапное внедрение технологии Deep Think, начиная с предоставления доступа ограниченному кругу профессиональных математиков перед масштабным распространением. Исследовательская группа продолжает совершенствовать как методы обработки естественного языка, так и формализованные подходы к математическому моделированию для расширения возможностей научных изысканий.
Источник: Notebookcheck





0 комментариев
Добавить комментарий
Добавить комментарий