Cloudflare обнаружила нарушение веб-этики: Perplexity игнорирует запреты на сканирование сайтов

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Компания Cloudflare, специализирующаяся на сетевой безопасности и оптимизации, опубликовала результаты расследования, согласно которому поисковая система с искусственным интеллектом Perplexity использует сложную систему обхода стандартных ограничений на индексацию веб-сайтов.

По данным исследователей Cloudflare, Perplexity применяет незадекларированных ботов, которые активируются в случаях, когда официальные поисковые роботы компании сталкиваются с блокировками в файлах robots. txt или правилами брандмауэра. Эти скрытые боты используют множество IP-адресов, не входящих в официальный диапазон Perplexity, и динамически переключаются между ними при обнаружении ограничений.

Автор: Бендж Эдвардс / Kirillm через Getty Images Источник: arstechnica.com

Масштаб подобной деятельности оказался значительным — незаявленная активность зафиксирована на более чем 10 000 доменов с миллионами ежедневных запросов. Исследователи Cloudflare отмечают, что подобные методы противоречат интернет-нормам, существующим с 1994 года, когда был предложен протокол исключения роботов, ставший официальным стандартом Инженерной рабочей группы Интернета в 2022 году.

В ответ на выявленные нарушения Cloudflare исключила Perplexity из списка проверенных ботов и внедрила новые алгоритмы в свои управляемые правила для блокировки скрытого сканирования. Компания подчеркивает, что для поисковых роботов существуют четкие требования прозрачности и соблюдения директив веб-сайтов.

Автор: Cloudflare Источник: arstechnica.com

Это не первый случай, когда Perplexity сталкивается с подобными обвинениями. Ранее генеральный директор Reddit Стив Хаффман заявлял о сложностях в блокировке доступа Perplexity к контенту платформы. Кроме того, издания Forbes и Wired выдвигали обвинения в плагиате, указывая на подозрительные схемы трафика с IP-адресов, предположительно связанных с Perplexity, и манипуляции с идентификационной строкой поисковых роботов компании.

На момент публикации представители Perplexity не предоставили комментариев относительно обвинений со стороны Cloudflare, что оставляет открытым вопрос о законности методов индексации, используемых данной системой искусственного интеллекта.

Источник: Ars Technica

Автор не входит в состав редакции iXBT.com (подробнее »)

1 комментарий

Z
Жаль, порежут Perplexity, а ведь хорошая нейронка.

Добавить комментарий

Сейчас на главной

Новости

Публикации

6 причин почему кофе из кофемашины дома получается хуже, чем в кофейне — и как это исправить

  • Тематическая подборка
  • Оффтопик
Вы потратили приличную сумму на современную кофемашину, выбираете дорогое зерно, но утренний эспрессо всё равно получается плоским, горчит или подозрительно напоминает напиток из вокзального...

Паводок и половодье: основные различия и причины возникновения

Весна время большой воды. Понятия «паводок» и «половодье» часто путают, хотя это разные гидрологические явления. Разберём их суть, отличия и особенности ниже. Автор: Heavylift Источник:...

Обзор блока питания PCCooler YS1200 – что происходит с напряжением и пульсациями

PCCooler YS1200 — блок питания на 1200 Вт под мощные сборки. Есть поддержка ATX 3.1 и отдельный кабель 12V-2x6 для видеокарт. По характеристикам все выглядит как нужно, но такие вещи...

Как Huawei показала, что может быть альтернативой Samsung и Apple: смартфону Huawei P9 — десять лет

В наши дни между крупными китайскими компаниями и «выжившими» A-брендами (Apple и Samsung) уже давно нет чёткой грани, однако десять лет назад ситуация воспринималась по-другому. Рынок делился на...

Большой поту: птица, которая видит с закрытыми глазами

В густых тропиках Центральной и Южной Америки обитает птица большой поту (исполинский козодой). Эту пернатую часто называют «птицей-пнём» за её невероятную способность сливаться с природной средой....