Google Gemini 3 набрал 48,4% на сложнейшем тесте для ИИ «Последний экзамен человечества»

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com

3 марта 2026, 15:37

Исследователи из Центра безопасности и масштабируемости ИИ опубликовали результаты тестирования современных моделей искусственного интеллекта на экзамене «Последний экзамен человечества» (Humanity's Last Exam, HLE). По состоянию на 12 февраля 2026 года модель Google Gemini 3 Deep Think показала наивысший результат — 48,4%.

Тест был запущен в январе 2025 года и описан в исследовании, опубликованном 28 января в журнале Nature. Экзамен содержит 2500 вопросов по более чем 100 темам уровня докторантуры. В разработке участвовали свыше 1000 экспертов из 500 учреждений в 50 странах.

При создании теста из 70 000 присланных вопросов отобрали только те, на которые модели ИИ не смогли ответить правильно. Вопросы проверялись на невозможность быстрого поиска ответа в интернете и отсутствие в обучающих данных моделей.

Автор: pressfoto Источник: ru.freepik.com

На старте тестирования в 2025 году лучший результат показала система OpenAI o1 — всего 8,3%. Также тестировались GPT-4o, Google Gemini 1.5 Pro, Anthropic Claude 3.5 Sonnet и DeepSeek R1. Эксперты-люди набирают около 90% в своих областях знаний.

Авторы исследования подчёркивают, что высокий балл на HLE не свидетельствует о появлении искусственного общего интеллекта. Нейробиолог Мануэль Шоттдорф из Делавэрского университета, участвовавший в создании теста, заявил, что успешное прохождение HLE является необходимым, но недостаточным критерием для утверждения о достижении машинами истинного интеллекта.

Google Gemini 3 набрал 48,4% на сложнейшем тесте для ИИ «Последний экзамен человечества»

Читайте также

Новости

Зарядит, подсветит и подует: представлен модульный пауэрбанк HaloDesign F01

Тейлор Свифт лидирует по количеству номинаций на American Music Awards

GAC анонсировал старт продаж электрической модели Aion UT в Европе

Bumpboxx BB-777: представлена современная версия магнитофона Sharp GF-777

Швейцарские геологи нашли объяснение частым извержениям вулкана Этна и его аномальному расположению

Публикации

Бюджетная 4К-съемка: обзор видеорегистратора DIGMA FreeDrive 950DW

Обзор электрической мясорубки FELFRI FF-MG-10

Какими были смартфоны 20 лет назад: обзор ASUS P525 на базе Windows Mobile 5

Новости по банковской карте Egypt Post Visa Easy Pay

Самый одинокий дом в мире: кто и для чего его построил на острове Эллидаэй в Исландии

Обзор TWS наушников Haylou Flowbuds N55 – что дают ANC и LDAC в бюджетном сегменте