Пару дней назад компания Anthropic представила размышляющую модель Claude 3.7 Sonnet, а позже она провела стрим, где показала, как эта модель проходит видеоигру.
ИИ играл в весьма старую и простую игру: Pokemon Red, которая вышла для Game Boy в 1996 году. Прелесть процесса была в том, что авторы показывали игровой процесс и отдельно окно с рассуждениями ИИ об этом процессе. При этом модель никто не учил играть в игры, и это впечатляет больше всего.
Хорошо видно, что ИИ в ряде задач мыслит примерно как и человек, только люди обычно такие простые мысли не осознают и не проговаривают. Некоторые действия занимали у ИИ невероятно много времени. Там, где человек справился бы за секунды, ИИ затратил минуты. Однако искусственный интеллект всё же справлялся с задачами и в итоге прошёл игру. К слову, этого не смогла сделать предыдущая версия Claude.
