Битва искусственных интеллектов. ИИ от Google превзошел OpenAI и других конкурентов
Экспериментальная модель Gemini 1.5 Pro от Google превзошла GPT-4o от OpenAI в тестах на создание искусственного интеллекта.
В прошлом году на рынке доминировали OpenAI GPT-4o и Anthropic Claude-3. Однако последняя версия Gemini 1.5 Pro, похоже, вышла в лидеры.
Одним из наиболее широко признанных критериев в сообществе искусственного интеллекта является чат-бот LMSYS Arena, который оценивает модели в различных задачах и присваивает общий балл компетентности. В этой таблице лидеров GPT-4o набрал 1286 баллов, в то время как Claude-3 набрал похвальные 1271. Предыдущая версия Gemini 1.5 Pro набрала 1261 балл.
Экспериментальная версия Gemini 1.5 Pro (обозначенная как Gemini 1.5 Pro 0801) превзошла своих ближайших конкурентов, набрав впечатляющий результат в 1300 баллов. Это значительное улучшение позволяет предположить, что последняя модель Google может обладать более широкими возможностями, чем ее конкуренты.
Стоит отметить, что, хотя тесты дают ценную информацию о производительности модели искусственного интеллекта, они не всегда могут точно отражать весь спектр его возможностей или ограничений в реальных приложениях. Несмотря на текущую доступность Gemini 1.5 Pro, тот факт, что она обозначена как ранняя версия или находится на стадии тестирования, говорит о том, что Google все еще может вносить коррективы или даже отозвать модель по соображениям безопасности или согласования. Эта разработка знаменует собой важную веху в продолжающейся гонке за превосходство в области искусственного интеллекта среди технологических гигантов. Способность Google превзойти OpenAI и Anthropic в тестовых показателях свидетельствует о быстром развитии инноваций в этой области и острой конкуренции, стимулирующей эти достижения.
Поскольку сфера искусственного интеллекта продолжает развиваться, будет интересно посмотреть, как OpenAI и Anthropic отреагируют на этот вызов Google. Смогут ли они вернуть свои позиции на вершине таблицы лидеров, или Google уже установил новый стандарт производительности генеративного ИИ.