Система Gemini от Google DeepMind получила золотую оценку на Международной математической олимпиаде 2025

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Искусственный интеллект впервые достиг результатов высшего уровня на престижном математическом состязании, традиционно предназначенном для одаренных школьников со всего мира.

В рамках 66-й Международной математической олимпиады (ММО), состоявшейся в Австралии, интеллектуальная система Gemini «Deep Think», разработанная лабораторией Google DeepMind, продемонстрировала беспрецедентный результат. Алгоритм справился с пятью из шести предложенных олимпиадных заданий, заработав 35 баллов из максимально возможных 42, что соответствует критериям золотого уровня, определенным экспертной комиссией соревнования.

Достижение отражает значительный технологический скачок в сравнении с показателями прошлогодних разработок. В 2024 году инструменты AlphaProof и AlphaGeometry 2 от того же разработчика смогли преодолеть только серебряный рубеж, справившись с четырьмя задачами и набрав 28 баллов. Существенным ограничением предшествующих инструментов являлась необходимость конвертации между обычной речью и специализированными формальными нотациями, а процесс вычисления требовал многодневных расчетов.

Автор: Google Источник: www.notebookcheck.net

Принципиальное новшество нынешней разработки заключается в способности обрабатывать информацию исключительно на естественном языке на всех этапах решения. Интеллектуальная система представила исчерпывающие и математически строгие доказательства в рамках стандартного временного регламента олимпиады — 4,5 часа, основываясь исключительно на официальных формулировках задач.

Члены жюри олимпиады, привыкшие оценивать работы учащихся, охарактеризовали представленные Gemini решения как «четкие» и «математически безупречные». Представители DeepMind связывают данное достижение с комплексом инноваций: внедрением усовершенствованных методик обучения с подкреплением, формированием специализированного корпуса математических примеров и разработкой техник многопоточного анализа, позволяющих одновременно исследовать различные стратегии поиска решения.

По сведениям из индустриальных источников, аналогичные технологические платформы, включая разработки OpenAI, также показывают сопоставимые результаты при неофициальном тестировании. Однако именно показатели Gemini стали первым случаем, когда автоматизированная математическая система получила официальную сертификацию организационным комитетом олимпиады.

Руководство Google DeepMind анонсировало поэтапное внедрение технологии Deep Think, начиная с предоставления доступа ограниченному кругу профессиональных математиков перед масштабным распространением. Исследовательская группа продолжает совершенствовать как методы обработки естественного языка, так и формализованные подходы к математическому моделированию для расширения возможностей научных изысканий.

Источник: Notebookcheck

Автор не входит в состав редакции iXBT.com (подробнее »)

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Как бактерии стали многоклеточными: система разделения ДНК эволюционировала во внутриклеточный каркас

Биологическая эволюция редко создает принципиально новые механизмы с нуля. В подавляющем большинстве случаев природа модифицирует уже существующие структуры, адаптируя их под совершенно новые...

Компьютерные расчеты термоядерных реакций оказались ошибочными: как эксперимент с испаренной медью переписывает законы физики плазмы

Воздействие сверхмощного оптического лазера на металл разрушает межатомные связи за квадриллионные доли секунды. В точке удара материал мгновенно переходит в состояние горячей сверхплотной плазмы,...

Самые крупные карповые в мире и в России: история семейства, размеры и что из них готовят

Когда слышишь слово «карповые», в голове обычно возникает что-то очень земное и понятное: карась в деревенском пруду, карп на рынке, сазан в рассказах рыбаков. Но у этого семейства есть и совсем...

✦ ИИ  5 сервисов для создания презентаций с опросами: для учителей, маркетологов и бизнеса

Нужно собрать обратную связь, проверить гипотезу или просто узнать, что думают люди? Рассказываем, где создать опрос за 5 минут, какие сервисы работают в РФ, как проводить голосования в реальном...

Где можно увидеть Стоунхендж, не выезжая за границы России

Мысль о том, чтобы увидеть чудо света или загадку истории нужно выезжать за тридевять земель, настолько укрепилась в сознании, что интересных мест поближе как будто и нет вовсе.Итак, для всех...

Обзор бесщеточной аккумуляторной пилы ProCraft PKA45 (PKA46): 2 аккумулятора, 2 шины и 2 цепи

Во время работы в саду или на приусадебном участке приходится срезать деревья и кустарники. Порой они достаточно толстые, чтобы справиться с ними вручную, и приходится доставать электрические или...