Интернет исчезает: четверть всех веб-страниц с 2013 по 2023 год становятся недоступны

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Исследование из Pew Research Center (Исследовательский центр Пью) под названием «Когда онлайн-контент исчезает» показывает, что наш любимый Интернет вполне может исчезнуть — четверть всех веб-страниц, существовавших в период с 2013 по 2023 год, оказались больше недоступны.

Автор: alengo via Getty Images Источник: www.pcgamer.com

Вопреки распространенному мнению, что всему, что находится в сети, суждено существовать вечно, исследование показало, что 38% веб-страниц, существовавших только в 2013 году, теперь потеряны, по данным The Independent. Похоже, что даже относительно новые веб-страницы начинают исчезать: 8% веб-страниц, существовавших в 2023 году, также оказались недоступными.

В исследовании использовался Common Crawl, открытый репозиторий данных веб-сканирования, который архивирует миллиарды веб-страниц и предоставляет архивы и наборы данных для публичного использования. Исследователи случайным образом выбрали более миллиона веб-страниц, прежде чем проверить ссылки, чтобы определить, какие из них все еще активны, а какие ушли в огромный архив потерянной информации в облаке.

Результаты исследования оказались следующими: по крайней мере по одной неработающей ссылке было у 21% правительственных веб-сайтов и 23% новостных страниц, а также целых 54% веб-страниц Википедии содержали ссылку, которая больше не существует. Данные основаны на основе взятого объема веб-страниц для исследования.

Учитывая неотъемлемую роль Интернета в современном обществе (к лучшему или к худшему) с точки зрения проверки информации, эти результаты вызывают тревогу. В связи с растущим распространением вводящего в заблуждение контента сформированного искусственным интеллектом, потеря ценных источников информации созданных до эпохи искусственного интеллекта точно пойдет не на пользу.

В добавок к этому недавнее исследование показало, что 46,9% всего интернет-трафика может быть приписано ботам, многие из которых могут предоставлять всевозможную вымышленную информацию, чтобы еще больше запутать. Это заставляет смотреть в будущее, где новая информация становится все более сомнительной, а старую становится все труднее найти.

Источник: PCGAMER

8 комментариев

Добавить комментарий

SedayaNoch
Ну в связи с санкциями многие страницы заблокированы.
А с Википедией совсем другой случай, что они там просто чистят свою Википедию. Удаляют то, что им не нравится. К примеру Коммунизм, соц.страны ну и тому подобное.
117193583801184085629@google
Сразу видно что ты никогда в вики не писал.
Чувствительные страницы, там модерируются очень тщательно и любая попытка удаления будет откачена назад, а пользователь-заблокирован.
Не сравнивай вики с совком, это там начальство делало все что хотело.
Korzh
Тоже мне проблемы: 38% страниц, существовавших в 2013 году, исчезло – новых накреативили 3800% в ценах 2013 года
А что попало в интернет, то там действительно остаётся навсегда — потому что каждый год блогеры пишут очередной десяток статей о том, где у вагона перед, а где зад, почему самолёты оставляют за собой белые полосы… ну и вот что сайты исчезают бьют тревогу по нескольку раз в год ;)
А википедию пишут википедики — которые за написанное никак не отвечают, да и насчёт ссылок, соответственно, не парятся
Alex_Bes
Плохо когда это касается официальных или авторитетных сайтов, где их ссылки уже неактуальны, а исправлять это вряд ли кто будет, в остальном же да, просто всегда нужно уметь фильтровать информацию.
Korzh
Тогда педивикия вообще плохой пример — поскольку и не официальная, и не авторитетная ;)
Популярная — да. Но херни там в ассортименте всегда было порядком. И не только на общественно-политические темы, кстати
Это не Британика какая ни разу
А официальные… Ну да — плохо. Проблема в том, что они сами регулярно дорабатываются-перерабатываются. И не редкость, когда на одном официальном сайте структуру поменяли, а другие не менее официальные в итоге ссылки потеряли. Хотя вручную всё находится — просто уже на других местах. Но это, опять же общая, проблема. И изначальный недостаток любых внешних ссылок. Если они куда-то ведут на момент публикации, нельзя быть уверенным, что приземление одинаковым будет всегда. Так что олинван желателен. С точки зрения поисковиков — тоже. Они за внешние ссылки пессимизируют часто. А поисковики — основной источник трафика давно уже
Что на самом деле для поиска информации (такой вот грустный каламбур) куда большая проблема, чем заброшенные разделегированные сайты
117193583801184085629@google
Оказывается в вики нет ссылок, еще один дилетант рассуждает о википедии понаслышке.
C
«Интернет помнит всё» — говорили они…
Pavel_Priluckiy
Веб-архив в помощь.

Добавить комментарий

Сейчас на главной

Новости

Публикации

Парадокс Raspberry Pi: как один мини-компьютер заменил дорогие лаборатории и стал основой для стартапов

Мини-компьютер Raspberry Pi делает невозможное реальным: школьники создают роботов, инженеры прототипы, а стартапы запускают продукты, которые ещё десять лет назад требовали лабораторий.

Обзор спортивных часов Suunto Run

Suunto Run отличаются от моделей смарт-часов своей спортивной направленностью. Всё очень просто: хотите бегать по правильным зонам пульса без нагрудного датчика Polar H10, бегайте с Suunto Run.

Обзор комплекта вентиляторов Ocypus Sigma F36 ARGB: слитно или раздельно?

Задумывались ли вы о том, сколько же всего различных версий вентиляторов для ПК существует и на какие стоит более пристально обратить внимание? Скажу больше, что и производители...

✦ ИИ  Swatch: пластиковые часы, которые пережили умные гаджеты и остались символом эпохи

Почему Swatch не просто часы? Потому что эти яркие пластиковые модели пережили кризисы, модные тренды и умные гаджеты, став символом эпохи, культовым аксессуаром и даже частью истории поп-культуры.

Радиоактивные кабаны в Германии: почему уровень загрязнения не снижается со временем

Проблема, известная в научной среде как «парадокс дикого кабана», десятилетиями ставила экологов и физиков в тупик. В то время как уровень радиации у большинства лесных животных, таких как косули...

Сборка Мини-ПК в корпусе 4,2 литра до 90 тысяч рублей: компактная игровая сборка на весну 2026

Эта сборка появилась из простой идеи: собрать компактный игровой ПК, который не выглядит как компромиссный неттоп и не занимает место большого системника. Корпус SKTC A07 объёмом около 4,2 литра...