Интернет исчезает: четверть всех веб-страниц с 2013 по 2023 год становятся недоступны

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Исследование из Pew Research Center (Исследовательский центр Пью) под названием «Когда онлайн-контент исчезает» показывает, что наш любимый Интернет вполне может исчезнуть — четверть всех веб-страниц, существовавших в период с 2013 по 2023 год, оказались больше недоступны.

Автор: alengo via Getty Images Источник: www.pcgamer.com

Вопреки распространенному мнению, что всему, что находится в сети, суждено существовать вечно, исследование показало, что 38% веб-страниц, существовавших только в 2013 году, теперь потеряны, по данным The Independent. Похоже, что даже относительно новые веб-страницы начинают исчезать: 8% веб-страниц, существовавших в 2023 году, также оказались недоступными.

В исследовании использовался Common Crawl, открытый репозиторий данных веб-сканирования, который архивирует миллиарды веб-страниц и предоставляет архивы и наборы данных для публичного использования. Исследователи случайным образом выбрали более миллиона веб-страниц, прежде чем проверить ссылки, чтобы определить, какие из них все еще активны, а какие ушли в огромный архив потерянной информации в облаке.

Результаты исследования оказались следующими: по крайней мере по одной неработающей ссылке было у 21% правительственных веб-сайтов и 23% новостных страниц, а также целых 54% веб-страниц Википедии содержали ссылку, которая больше не существует. Данные основаны на основе взятого объема веб-страниц для исследования.

Учитывая неотъемлемую роль Интернета в современном обществе (к лучшему или к худшему) с точки зрения проверки информации, эти результаты вызывают тревогу. В связи с растущим распространением вводящего в заблуждение контента сформированного искусственным интеллектом, потеря ценных источников информации созданных до эпохи искусственного интеллекта точно пойдет не на пользу.

В добавок к этому недавнее исследование показало, что 46,9% всего интернет-трафика может быть приписано ботам, многие из которых могут предоставлять всевозможную вымышленную информацию, чтобы еще больше запутать. Это заставляет смотреть в будущее, где новая информация становится все более сомнительной, а старую становится все труднее найти.

Источник: PCGAMER

8 комментариев

Добавить комментарий

SedayaNoch
Ну в связи с санкциями многие страницы заблокированы.
А с Википедией совсем другой случай, что они там просто чистят свою Википедию. Удаляют то, что им не нравится. К примеру Коммунизм, соц.страны ну и тому подобное.
117193583801184085629@google
Сразу видно что ты никогда в вики не писал.
Чувствительные страницы, там модерируются очень тщательно и любая попытка удаления будет откачена назад, а пользователь-заблокирован.
Не сравнивай вики с совком, это там начальство делало все что хотело.
Korzh
Тоже мне проблемы: 38% страниц, существовавших в 2013 году, исчезло – новых накреативили 3800% в ценах 2013 года
А что попало в интернет, то там действительно остаётся навсегда — потому что каждый год блогеры пишут очередной десяток статей о том, где у вагона перед, а где зад, почему самолёты оставляют за собой белые полосы… ну и вот что сайты исчезают бьют тревогу по нескольку раз в год ;)
А википедию пишут википедики — которые за написанное никак не отвечают, да и насчёт ссылок, соответственно, не парятся
Alex_Bes
Плохо когда это касается официальных или авторитетных сайтов, где их ссылки уже неактуальны, а исправлять это вряд ли кто будет, в остальном же да, просто всегда нужно уметь фильтровать информацию.
Korzh
Тогда педивикия вообще плохой пример — поскольку и не официальная, и не авторитетная ;)
Популярная — да. Но херни там в ассортименте всегда было порядком. И не только на общественно-политические темы, кстати
Это не Британика какая ни разу
А официальные… Ну да — плохо. Проблема в том, что они сами регулярно дорабатываются-перерабатываются. И не редкость, когда на одном официальном сайте структуру поменяли, а другие не менее официальные в итоге ссылки потеряли. Хотя вручную всё находится — просто уже на других местах. Но это, опять же общая, проблема. И изначальный недостаток любых внешних ссылок. Если они куда-то ведут на момент публикации, нельзя быть уверенным, что приземление одинаковым будет всегда. Так что олинван желателен. С точки зрения поисковиков — тоже. Они за внешние ссылки пессимизируют часто. А поисковики — основной источник трафика давно уже
Что на самом деле для поиска информации (такой вот грустный каламбур) куда большая проблема, чем заброшенные разделегированные сайты
117193583801184085629@google
Оказывается в вики нет ссылок, еще один дилетант рассуждает о википедии понаслышке.
C
«Интернет помнит всё» — говорили они…
Pavel_Priluckiy
Веб-архив в помощь.

Добавить комментарий

Сейчас на главной

Новости

Публикации

✦ ИИ  Почему мониторы раньше были квадратные, а теперь прямоугольные: история смены формата от ЭЛТ-мониторов до широких панелей

Когда я только начинал собирать свои первые компьютеры, на столе у каждого стоял большой тяжелый ящик. Экран у него был почти квадратный с соотношением сторон четыре к трем, и никого это не...

Совпадение или слежка: почему реклама в телефоне так часто совпадает с нашими разговорами

Бывало у вас такое: сидите с друзьями на кухне, обсуждаете отпуск в Турции, спорите, какой отель выбрать. Через полчаса открываете ленту и видите рекламу горящих туров именно в ту самую Анталию....

Почему монтировку называют жаргонным термином «фомка»

Монтировка — универсальный ручной инструмент, применяемый в строительстве, авторемонте. Этот многофункциональное приспособление сочетает в себе свойства ударного и рычажного инструмента,...

Обзор планшета Ninkear TB10A: теперь они делают планшеты и на android

Попытка Ninkear зайти в планшеты на android на примере недорогого планшета. Хороший ход, потому что такие планшеты хорошо покупают. Ну, а мне просто стало интересно смогут ли Ninkear также...

Как отказаться от онлайн курса, и где оставить отзыв если что-то пошло не так

Меня зовут Влад, Я прошёл три онлайн-курса за последние два года. Только один из них стоил своих денег. Когда второй раз попал на курс, который не соответствовал описанию, решил разобраться...