Для работы проектов iXBT.com нужны файлы cookie и сервисы аналитики. Продолжая посещать сайты проектов вы соглашаетесь с нашей Политикой в отношении файлов cookie

Конец эпохи анонимности: нейросети научились вычислять пользователей интернета с точностью 90%

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com

5 марта 2026, 17:07 | Новость | ИИ, сервисы и приложения

Специалисты в области кибербезопасности и компьютерной лингвистики из Швейцарской высшей технической школы Цюриха (ETH Zurich), MATS Research и компании Anthropic опубликовали на сервере препринтов arXiv отчет под названием «Large-scale online deanonymization with LLMs», демонстрирующий критическую уязвимость концепции сетевой анонимности. Согласно представленным данным, большие языковые модели способны деанонимизировать пользователей интернета в промышленных масштабах, достигая точности до 90% при охвате десятков тысяч профилей.

Автор: Vincent Diamante Источник: commons.wikimedia.org

В основе метода лежит четырехэтапный конвейер ESRC (Extract, Search, Reason, Calibrate). На первом этапе LLM анализирует массив неструктурированного текста (публикации, комментарии) и извлекает косвенные идентификационные маркеры: стиль письма, демографические характеристики, случайные упоминания локаций и профессиональные термины. Далее система переводит эти данные в семантические векторы (эмбеддинги), ищет совпадения в пуле кандидатов, проводит логическую верификацию найденных связей и выполняет калибровку для контроля процента ложных срабатываний.

В ходе эксперимента алгоритм сопоставлял обезличенные профили пользователей Hacker News с их реальными аккаунтами в LinkedIn. ИИ-агент успешно идентифицировал 67% пользователей при уровне точности 90%. В наборе данных из 89 000 кандидатов алгоритм показал 45,1% совпадений при пороге точности 99%. Классические методы автоматического сопоставления при аналогичных условиях демонстрировали результат на уровне 0,1%.

Стоимость деанонимизации одной цели с использованием коммерческих API составила от 1,00 до 4,00 долларов США.

Как происходит деанонимизация: 1) Извлечение персональных данных из сообщений при помощи ИИ. 2) Поиск совпадений в базах по смысловому значению (семантике). 3) Отбор лучших вариантов с помощью рассуждений нейросети. 4) Оценка точности результата для принятия окончательного решения.
Автор: Даниэль Палека Источник: techxplore.com

Авторы исследования указывают, что применение LLM нивелирует концепцию «практической неочевидности» (practical obscurity) — состояния, при котором анонимность обеспечивалась высокой стоимостью и технической сложностью ручного сбора разрозненных данных. Тестирование коммерческих фильтров безопасности показало, что ИИ-агенты обходят базовые ограничения с помощью модификации промптов. Разделение процесса на четыре этапа делает запросы похожими на стандартную эксплуатацию алгоритмов, что препятствует выявлению атак на стороне провайдеров ИИ.

В качестве мер противодействия исследователи рекомендуют интернет-платформам внедрять ограничения скорости доступа к данным (rate limits), системы обнаружения скрейпинга и блокировки массового экспорта информации. Исходный код конвейера ESRC и наборы данных не были опубликованы в открытом доступе по соображениям безопасности.

Источник: Techxplore

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Из категории тех моделей, которые покупают большинство обычных людей. Компания VTUVIA выпустила электровелосипед Zeal XT8

Авто и транспорт
5 часов назад
0

В Европе выявлены случаи распространения нерабочих подделок SSD-накопителей Samsung 990 Pro

Платформа ПК
6 часов назад
0

В Galaxy S27 компания Samsung планирует увеличить долю собственных Exynos, снижая зависимость от Qualcomm

Смартфоны и телефоны
6 часов назад
0

В Перу обнаружены первые вещественные доказательства существования бесшерстных собак в империи Вари

Наука и космос
6 часов назад
0

Samsung вернула функцию двойной записи на Galaxy S25 FE, но теперь она доступна через отдельное приложение

Смартфоны и телефоны
7 часов назад
0

Публикации

Ученые научились выключать «гормон любви»: почему точечная блокировка окситоцина поможет в изучении мозга

Статья
2 часа назад
Наука и космос

Окситоцин и вазопрессин — это нейропептиды, которые выполняют ключевые функции в организме млекопитающих. Их эволюционная история насчитывает около 600 миллионов лет, и за это время они...

Призраков не существует: новая математическая структура объяснила эффект темной материи без невидимых частиц

Статья
3 часа назад
Наука и космос

Галактики вращаются слишком быстро. Окраины спиральных структур движутся с такой скоростью, что гравитация видимого вещества — всех существующих там звезд, планет и газовых...

Почему Трухильо называют городом вечной весны и стоит ли его посетить

Статья
5 часов назад
Путешествия и туризм

Погода не устает мучить людей своими перепадами: летом становится невыносимо жарко, зимой заваливает снегом, и вообще хочется вечной весны с ее умеренными температурами, но это лишь мечты…...

Борода: 5 причин, почему на Руси берегли растительность на лице (от штрафов до Шнобелевки)

Тематическая подборка
7 часов назад
Оффтопик

Почему борода на Руси стоила дороже пальца и как она помогала выжить в драке? 5 причин: от пропуска в Рай до бунта против бритвы. Как обычная растительность на лице стала символом свободы и веры.

FiiO опять взялись за старое: представлен автоматический виниловый проигрыватель TT11

Статья
7 часов назад
Аудио и звук

Индустрия воспроизведения звука с виниловых пластинок пока еще на подъеме, выпускают новые музыкальные релизы на пластинках, производят проигрыватели в разных ценовых диапазонах. Это даже модно....

Группа «БиС» воссоединилась спустя 17 лет на концерте Влада Соколовского: как это было

Мнение
8 часов назад
Оффтопик

Девятого апреля во время сольного концерта российского певца Влада Соколовского было объявлено о воссоединении группы «БиС», распавшейся 17 лет назад. На сцене появился Дмитрий Бикбаев, второй...