Для работы проектов iXBT.com нужны файлы cookie и сервисы аналитики. Продолжая посещать сайты проектов вы соглашаетесь с нашей Политикой в отношении файлов cookie

Google Gemini 3 набрал 48,4% на сложнейшем тесте для ИИ «Последний экзамен человечества»

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com

3 марта 2026, 15:37 | Новость | ИИ, сервисы и приложения

Исследователи из Центра безопасности и масштабируемости ИИ опубликовали результаты тестирования современных моделей искусственного интеллекта на экзамене «Последний экзамен человечества» (Humanity's Last Exam, HLE). По состоянию на 12 февраля 2026 года модель Google Gemini 3 Deep Think показала наивысший результат — 48,4%.

Тест был запущен в январе 2025 года и описан в исследовании, опубликованном 28 января в журнале Nature. Экзамен содержит 2500 вопросов по более чем 100 темам уровня докторантуры. В разработке участвовали свыше 1000 экспертов из 500 учреждений в 50 странах.

При создании теста из 70 000 присланных вопросов отобрали только те, на которые модели ИИ не смогли ответить правильно. Вопросы проверялись на невозможность быстрого поиска ответа в интернете и отсутствие в обучающих данных моделей.

Автор: pressfoto Источник: ru.freepik.com

На старте тестирования в 2025 году лучший результат показала система OpenAI o1 — всего 8,3%. Также тестировались GPT-4o, Google Gemini 1.5 Pro, Anthropic Claude 3.5 Sonnet и DeepSeek R1. Эксперты-люди набирают около 90% в своих областях знаний.

Авторы исследования подчёркивают, что высокий балл на HLE не свидетельствует о появлении искусственного общего интеллекта. Нейробиолог Мануэль Шоттдорф из Делавэрского университета, участвовавший в создании теста, заявил, что успешное прохождение HLE является необходимым, но недостаточным критерием для утверждения о достижении машинами истинного интеллекта.

Источник: Live Science

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Нанотираннус признан отдельным видом: это не молодой T. rex

Наука и космос
6 минут назад
0

Естественный отбор ускорился: за последние 10 тысяч лет эволюция способствовала к увеличению числа рыжеволосых и устойчивых к опасным инфекциям

Наука и космос
10 минут назад
0

Разработаны гибкие искусственные нейроны, способные активировать живые клетки мозга

Наука и космос
16 минут назад
0

Ученые обнаружили скрытый источник океанического метана, который может ускорить глобальное потепление

Наука и космос
22 минуты назад
0

Представлен POCO X8 Pro Max в новом оранжевом цвете

Смартфоны и телефоны
29 минут назад
0

Публикации

Обзор блока питания PCCooler YS1200 – что происходит с напряжением и пульсациями

Обзор
15 минут назад
Платформа ПК

PCCooler YS1200 — блок питания на 1200 Вт под мощные сборки. Есть поддержка ATX 3.1 и отдельный кабель 12V-2x6 для видеокарт. По характеристикам все выглядит как нужно, но такие вещи...

Кто такие битуронги и почему эти зверьки пахнут попкорном

Мнение
29 минут назад
Флора и фауна

В мире существует множество удивительных созданий, но один милый зверёк, обитающий в густых кронах тропических лесов Юго-Восточной Азии, занимает в нём особое место...

Как Huawei показала, что может быть альтернативой Samsung и Apple: смартфону Huawei P9 — десять лет

Мнение
46 минут назад
Смартфоны и телефоны

В наши дни между крупными китайскими компаниями и «выжившими» A-брендами (Apple и Samsung) уже давно нет чёткой грани, однако десять лет назад ситуация воспринималась по-другому. Рынок делился на...

Большой поту: птица, которая видит с закрытыми глазами

Статья
56 минут назад
Флора и фауна

В густых тропиках Центральной и Южной Америки обитает птица большой поту (исполинский козодой). Эту пернатую часто называют «птицей-пнём» за её невероятную способность сливаться с природной средой....

Есть ли срок годности у поваренной соли и как её хранить

Статья
3 часа назад
Оффтопик

Мы привыкли видеть даты производства и сроки годности буквально на всём: от пакета молока, который скиснет через неделю, до рыбных консервов, способных, казалось бы, пережить ядерную зиму....

Обзор моющего пылесоса Redkey W11: Компактный помощник для комплексной уборки без лишних хлопот

Обзор
3 часа назад
Техника для дома

Современные квартиры нуждаются не просто в сухой чистке полов, но и в регулярном влажном уходе. Традиционная швабра с ведром — устаревшее решение, которое лишь размазывает грязь,...