Интернет исчезает: четверть всех веб-страниц с 2013 по 2023 год становятся недоступны

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Исследование из Pew Research Center (Исследовательский центр Пью) под названием «Когда онлайн-контент исчезает» показывает, что наш любимый Интернет вполне может исчезнуть — четверть всех веб-страниц, существовавших в период с 2013 по 2023 год, оказались больше недоступны.

Автор: alengo via Getty Images Источник: www.pcgamer.com

Вопреки распространенному мнению, что всему, что находится в сети, суждено существовать вечно, исследование показало, что 38% веб-страниц, существовавших только в 2013 году, теперь потеряны, по данным The Independent. Похоже, что даже относительно новые веб-страницы начинают исчезать: 8% веб-страниц, существовавших в 2023 году, также оказались недоступными.

В исследовании использовался Common Crawl, открытый репозиторий данных веб-сканирования, который архивирует миллиарды веб-страниц и предоставляет архивы и наборы данных для публичного использования. Исследователи случайным образом выбрали более миллиона веб-страниц, прежде чем проверить ссылки, чтобы определить, какие из них все еще активны, а какие ушли в огромный архив потерянной информации в облаке.

Результаты исследования оказались следующими: по крайней мере по одной неработающей ссылке было у 21% правительственных веб-сайтов и 23% новостных страниц, а также целых 54% веб-страниц Википедии содержали ссылку, которая больше не существует. Данные основаны на основе взятого объема веб-страниц для исследования.

Учитывая неотъемлемую роль Интернета в современном обществе (к лучшему или к худшему) с точки зрения проверки информации, эти результаты вызывают тревогу. В связи с растущим распространением вводящего в заблуждение контента сформированного искусственным интеллектом, потеря ценных источников информации созданных до эпохи искусственного интеллекта точно пойдет не на пользу.

В добавок к этому недавнее исследование показало, что 46,9% всего интернет-трафика может быть приписано ботам, многие из которых могут предоставлять всевозможную вымышленную информацию, чтобы еще больше запутать. Это заставляет смотреть в будущее, где новая информация становится все более сомнительной, а старую становится все труднее найти.

Источник: PCGAMER

8 комментариев

SedayaNoch
Ну в связи с санкциями многие страницы заблокированы.
А с Википедией совсем другой случай, что они там просто чистят свою Википедию. Удаляют то, что им не нравится. К примеру Коммунизм, соц.страны ну и тому подобное.
117193583801184085629@google
Сразу видно что ты никогда в вики не писал.
Чувствительные страницы, там модерируются очень тщательно и любая попытка удаления будет откачена назад, а пользователь-заблокирован.
Не сравнивай вики с совком, это там начальство делало все что хотело.
Korzh
Тоже мне проблемы: 38% страниц, существовавших в 2013 году, исчезло – новых накреативили 3800% в ценах 2013 года
А что попало в интернет, то там действительно остаётся навсегда — потому что каждый год блогеры пишут очередной десяток статей о том, где у вагона перед, а где зад, почему самолёты оставляют за собой белые полосы… ну и вот что сайты исчезают бьют тревогу по нескольку раз в год ;)
А википедию пишут википедики — которые за написанное никак не отвечают, да и насчёт ссылок, соответственно, не парятся
Alex_Bes
Плохо когда это касается официальных или авторитетных сайтов, где их ссылки уже неактуальны, а исправлять это вряд ли кто будет, в остальном же да, просто всегда нужно уметь фильтровать информацию.
Korzh
Тогда педивикия вообще плохой пример — поскольку и не официальная, и не авторитетная ;)
Популярная — да. Но херни там в ассортименте всегда было порядком. И не только на общественно-политические темы, кстати
Это не Британика какая ни разу
А официальные… Ну да — плохо. Проблема в том, что они сами регулярно дорабатываются-перерабатываются. И не редкость, когда на одном официальном сайте структуру поменяли, а другие не менее официальные в итоге ссылки потеряли. Хотя вручную всё находится — просто уже на других местах. Но это, опять же общая, проблема. И изначальный недостаток любых внешних ссылок. Если они куда-то ведут на момент публикации, нельзя быть уверенным, что приземление одинаковым будет всегда. Так что олинван желателен. С точки зрения поисковиков — тоже. Они за внешние ссылки пессимизируют часто. А поисковики — основной источник трафика давно уже
Что на самом деле для поиска информации (такой вот грустный каламбур) куда большая проблема, чем заброшенные разделегированные сайты
117193583801184085629@google
Оказывается в вики нет ссылок, еще один дилетант рассуждает о википедии понаслышке.
C
«Интернет помнит всё» — говорили они…
Pavel_Priluckiy
Веб-архив в помощь.

Добавить комментарий

Сейчас на главной

Новости

Публикации

Как пользоваться «Визуальным поис­ком» на Айфоне в iOS 26

«Визуальный поиск» это быстрый способ понять, что изображено на экране iPhone. Сделайте снимок экрана и обведите нужный предмет. Система подскажет, что это, модель, где купить или как настроить. В...

Обзор Hi-Fi плеера Digma Pro XT7: премиальная внешность и достойный звук

Бренд Digma Pro представил свой дебют в аудиозвуке. Это достойный Hi-Fi плеер по внешнему виду и начинке, который на данный момент стоит вполне бюджетно. Тут и адаптивное декодирование звука...

10 полезных фишек Safari, которые стоит попробовать

Safari умеет больше, чем кажется. В статье постарался собрать все фишки, которые экономят время и делают серфинг удобнее на iPhone и Mac. Автор: Dall-e Источник: openai.com Лок на «Частный доступ»...