ChatGPT теперь может определять место съемки фотографий с поразительной точностью

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

OpenAI обновила свои мультимодальные модели искусственного интеллекта, значительно улучшив их способность определять местоположение по фотографии. Следует отметить, что ИИ-инструменты для определения геолокации существуют не первый год, однако новая версия GPT-4o демонстрирует повышенную точность и доступность этой функции.

Автор: Adobe Stock Источник: www.forbes.com

Принцип работы и возможности

Новые модели анализируют визуальный контент изображения, выявляя контекстные подсказки — от архитектурных стилей и ландшафта до мелких деталей вроде текста на этикетках или автомобильных номеров. На основе этого анализа ИИ определяет место съемки и предоставляет объяснение своего вывода, описывая логическую цепочку рассуждений.

Эксперты уже протестировали новую функцию и поделились следующими результатами:

  • Модель смогла определить Мельбурнский университет по коду на этикетке библиотечной книги.
  • ИИ успешно идентифицировал Суринам (небольшую южноамериканскую страну) по снимку дома, предположительно взятому из Google Earth.

Нынешние возможности GPT-4o сравнивают с популярной игрой GeoGuessr, где игроки угадывают локацию по панорамам улиц.

Сравнение производительности

В ходе тестов сравнивались возможности флагманской модели o3 и стандартной версии GPT-4o. При анализе фотографии с Нью-Йоркского автосалона 2025 года с электромобилем Subaru:

  • GPT-4o (стандартная версия): Выявила общую локацию («вероятно, Нью-Йорк, Чикаго или Лос-Анджелес»), основываясь на общих признаках автосалона (пол, таблички, люди), но неверно указала название модели автомобиля («Trailspeed» вместо «Trailseeker»).
  • Флагманская модель о3: После анализа (занявшего около 1 минуты 40 секунд) точно определила: «Это Subaru Trailseeker 2026 года, впервые показанный на стенде Нью-Йоркского международного автосалона 2025 года в Jacob K. Javits Convention Center». Модель сопоставила детали на фото (освещение, ковровое покрытие) с информацией с официального сайта Subaru для подтверждения вывода.
Автор: ChatGPT Источник: www.pcmag.com

Кроме геолокации, модель продемонстрировала и другие способности анализа изображений: она смогла правильно распознать перевернутый текст на фото блокнота, виртуально повернула его и прочитала содержимое.

Ограничения, риски и потенциал

OpenAI признает, что модели все еще могут допускать ошибки, особенно при наличии визуальных артефактов на изображении.

Существуют опасения относительно потенциального злоупотребления подобными технологиями для нарушения приватности, на что ранее указывали некоторые СМИ (например, 404 Media в контексте сервиса Geospy).

В то же время OpenAI подчеркивает положительные сценарии использования:

  • Помощь людям с нарушениями зрения.
  • Применение в научных исследованиях.
  • Поддержка экстренных служб.

Компания заявила о внедрении защитных мер: модели обучены отказывать в обработке запросов, касающихся идентификации частных лиц, и компания отслеживает случаи неправомерного использования.

OpenAI честно предупреждает: «Мы всё ещё можем допускать базовые ошибки восприятия». Иногда даже правильная «цепочка рассуждений» даёт неверный финал из‑за визуальных артефактов.

Источник: indiatimes

Изображение в превью:
Автор: Adobe Stock
Источник: www.forbes.com
Автор не входит в состав редакции iXBT.com (подробнее »)

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Ученые научились выключать «гормон любви»: почему точечная блокировка окситоцина поможет в изучении мозга

Окситоцин и вазопрессин — это нейропептиды, которые выполняют ключевые функции в организме млекопитающих. Их эволюционная история насчитывает около 600 миллионов лет, и за это время они...

Призраков не существует: новая математическая структура объяснила эффект темной материи без невидимых частиц

Галактики вращаются слишком быстро. Окраины спиральных структур движутся с такой скоростью, что гравитация видимого вещества — всех существующих там звезд, планет и газовых...

Почему Трухильо называют городом вечной весны и стоит ли его посетить

Погода не устает мучить людей своими перепадами: летом становится невыносимо жарко, зимой заваливает снегом, и вообще хочется вечной весны с ее умеренными температурами, но это лишь мечты…...

Борода: 5 причин, почему на Руси берегли растительность на лице (от штрафов до Шнобелевки)

  • Тематическая подборка
  • Оффтопик
Почему борода на Руси стоила дороже пальца и как она помогала выжить в драке? 5 причин: от пропуска в Рай до бунта против бритвы. Как обычная растительность на лице стала символом свободы и веры.

FiiO опять взялись за старое: представлен автоматический виниловый проигрыватель TT11

Индустрия воспроизведения звука с виниловых пластинок пока еще на подъеме, выпускают новые музыкальные релизы на пластинках, производят проигрыватели в разных ценовых диапазонах. Это даже модно....

Группа «БиС» воссоединилась спустя 17 лет на концерте Влада Соколовского: как это было

Девятого апреля во время сольного концерта российского певца Влада Соколовского было объявлено о воссоединении группы «БиС», распавшейся 17 лет назад. На сцене появился Дмитрий Бикбаев, второй...