Cloudflare обнаружила нарушение веб-этики: Perplexity игнорирует запреты на сканирование сайтов

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Компания Cloudflare, специализирующаяся на сетевой безопасности и оптимизации, опубликовала результаты расследования, согласно которому поисковая система с искусственным интеллектом Perplexity использует сложную систему обхода стандартных ограничений на индексацию веб-сайтов.

По данным исследователей Cloudflare, Perplexity применяет незадекларированных ботов, которые активируются в случаях, когда официальные поисковые роботы компании сталкиваются с блокировками в файлах robots. txt или правилами брандмауэра. Эти скрытые боты используют множество IP-адресов, не входящих в официальный диапазон Perplexity, и динамически переключаются между ними при обнаружении ограничений.

Автор: Бендж Эдвардс / Kirillm через Getty Images Источник: arstechnica.com

Масштаб подобной деятельности оказался значительным — незаявленная активность зафиксирована на более чем 10 000 доменов с миллионами ежедневных запросов. Исследователи Cloudflare отмечают, что подобные методы противоречат интернет-нормам, существующим с 1994 года, когда был предложен протокол исключения роботов, ставший официальным стандартом Инженерной рабочей группы Интернета в 2022 году.

В ответ на выявленные нарушения Cloudflare исключила Perplexity из списка проверенных ботов и внедрила новые алгоритмы в свои управляемые правила для блокировки скрытого сканирования. Компания подчеркивает, что для поисковых роботов существуют четкие требования прозрачности и соблюдения директив веб-сайтов.

Автор: Cloudflare Источник: arstechnica.com

Это не первый случай, когда Perplexity сталкивается с подобными обвинениями. Ранее генеральный директор Reddit Стив Хаффман заявлял о сложностях в блокировке доступа Perplexity к контенту платформы. Кроме того, издания Forbes и Wired выдвигали обвинения в плагиате, указывая на подозрительные схемы трафика с IP-адресов, предположительно связанных с Perplexity, и манипуляции с идентификационной строкой поисковых роботов компании.

На момент публикации представители Perplexity не предоставили комментариев относительно обвинений со стороны Cloudflare, что оставляет открытым вопрос о законности методов индексации, используемых данной системой искусственного интеллекта.

Источник: Ars Technica

Автор не входит в состав редакции iXBT.com (подробнее »)

1 комментарий

Z
Жаль, порежут Perplexity, а ведь хорошая нейронка.

Добавить комментарий

Сейчас на главной

Новости

Публикации

«Союз‑5» стартовал: новая эра российской космонавтики началась

Сегодня космическая отрасль России отметила важную веху: с космодрома Байконур впервые стартовала ракета‑носитель «Союз‑5» — одна из самых перспективных разработок отечественной...

Составлена первая точная карта обоняния: как клетки носа считывают свои координаты, чтобы мы чувствовали запахи

Способность млекопитающих воспринимать окружающий мир опирается на строгую физическую организацию органов чувств. Зрение работает благодаря точному проецированию световых лучей на сетчатку, где...

Сколько развитых цивилизаций в Галактике, и как они на самом деле будут искать Землю

Попытки человечества обнаружить сигналы от внеземных цивилизаций строятся на теоретических допущениях. Радиоастрономы, участвующие в программах SETI (Search for Extraterrestrial Intelligence),...

Почему один из старейших городов Европы следит за всеми через камеру обскура и выглядит как близнец Кубы

Древность в представлении людей это почти всегда пыль и разруха. Но испанский город Кадис, несмотря на почтенный возраст, выглядит свежо и хранит за красивыми улочками не один секрет. Ниже я...

Пять смартфонов апреля 2026 года: батарея на 10200 мАч и аппарат, за который пришлось извиняться

Второй месяц весны подошёл к концу, пришло время подводить его итоги. Апрель запомнится нам большим анонсом компании Motorola, презентацией серии Huawei Pura 90, камерофонов OPPO Find X9 Ultra и...