Интернет исчезает: четверть всех веб-страниц с 2013 по 2023 год становятся недоступны

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Исследование из Pew Research Center (Исследовательский центр Пью) под названием «Когда онлайн-контент исчезает» показывает, что наш любимый Интернет вполне может исчезнуть — четверть всех веб-страниц, существовавших в период с 2013 по 2023 год, оказались больше недоступны.

Автор: alengo via Getty Images Источник: www.pcgamer.com

Вопреки распространенному мнению, что всему, что находится в сети, суждено существовать вечно, исследование показало, что 38% веб-страниц, существовавших только в 2013 году, теперь потеряны, по данным The Independent. Похоже, что даже относительно новые веб-страницы начинают исчезать: 8% веб-страниц, существовавших в 2023 году, также оказались недоступными.

В исследовании использовался Common Crawl, открытый репозиторий данных веб-сканирования, который архивирует миллиарды веб-страниц и предоставляет архивы и наборы данных для публичного использования. Исследователи случайным образом выбрали более миллиона веб-страниц, прежде чем проверить ссылки, чтобы определить, какие из них все еще активны, а какие ушли в огромный архив потерянной информации в облаке.

Результаты исследования оказались следующими: по крайней мере по одной неработающей ссылке было у 21% правительственных веб-сайтов и 23% новостных страниц, а также целых 54% веб-страниц Википедии содержали ссылку, которая больше не существует. Данные основаны на основе взятого объема веб-страниц для исследования.

Учитывая неотъемлемую роль Интернета в современном обществе (к лучшему или к худшему) с точки зрения проверки информации, эти результаты вызывают тревогу. В связи с растущим распространением вводящего в заблуждение контента сформированного искусственным интеллектом, потеря ценных источников информации созданных до эпохи искусственного интеллекта точно пойдет не на пользу.

В добавок к этому недавнее исследование показало, что 46,9% всего интернет-трафика может быть приписано ботам, многие из которых могут предоставлять всевозможную вымышленную информацию, чтобы еще больше запутать. Это заставляет смотреть в будущее, где новая информация становится все более сомнительной, а старую становится все труднее найти.

Источник: PCGAMER

8 комментариев

Добавить комментарий

SedayaNoch
Ну в связи с санкциями многие страницы заблокированы.
А с Википедией совсем другой случай, что они там просто чистят свою Википедию. Удаляют то, что им не нравится. К примеру Коммунизм, соц.страны ну и тому подобное.
117193583801184085629@google
Сразу видно что ты никогда в вики не писал.
Чувствительные страницы, там модерируются очень тщательно и любая попытка удаления будет откачена назад, а пользователь-заблокирован.
Не сравнивай вики с совком, это там начальство делало все что хотело.
Korzh
Тоже мне проблемы: 38% страниц, существовавших в 2013 году, исчезло – новых накреативили 3800% в ценах 2013 года
А что попало в интернет, то там действительно остаётся навсегда — потому что каждый год блогеры пишут очередной десяток статей о том, где у вагона перед, а где зад, почему самолёты оставляют за собой белые полосы… ну и вот что сайты исчезают бьют тревогу по нескольку раз в год ;)
А википедию пишут википедики — которые за написанное никак не отвечают, да и насчёт ссылок, соответственно, не парятся
Alex_Bes
Плохо когда это касается официальных или авторитетных сайтов, где их ссылки уже неактуальны, а исправлять это вряд ли кто будет, в остальном же да, просто всегда нужно уметь фильтровать информацию.
Korzh
Тогда педивикия вообще плохой пример — поскольку и не официальная, и не авторитетная ;)
Популярная — да. Но херни там в ассортименте всегда было порядком. И не только на общественно-политические темы, кстати
Это не Британика какая ни разу
А официальные… Ну да — плохо. Проблема в том, что они сами регулярно дорабатываются-перерабатываются. И не редкость, когда на одном официальном сайте структуру поменяли, а другие не менее официальные в итоге ссылки потеряли. Хотя вручную всё находится — просто уже на других местах. Но это, опять же общая, проблема. И изначальный недостаток любых внешних ссылок. Если они куда-то ведут на момент публикации, нельзя быть уверенным, что приземление одинаковым будет всегда. Так что олинван желателен. С точки зрения поисковиков — тоже. Они за внешние ссылки пессимизируют часто. А поисковики — основной источник трафика давно уже
Что на самом деле для поиска информации (такой вот грустный каламбур) куда большая проблема, чем заброшенные разделегированные сайты
117193583801184085629@google
Оказывается в вики нет ссылок, еще один дилетант рассуждает о википедии понаслышке.
C
«Интернет помнит всё» — говорили они…
Pavel_Priluckiy
Веб-архив в помощь.

Добавить комментарий

Сейчас на главной

Новости

Публикации

Весенняя активность гадюк: почему змеи становятся опаснее после спячки

Весна — время активного пробуждения природы, но вместе с первыми тёплыми днями возрастает и риск встречи со змеями, иногда с ядовитыми. Почему именно весной эти пресмыкающиеся становятся...

Антикризисная сборка игрового ПК за 30 000 рублей в 2026 году

Рынок компьютерного железа продолжает лихорадить. Если ещё полгода назад сборка бюджетного игрового компьютера с видеокартой уровня RTX 2070/3060 обходилась в 45–60 тысяч рублей, то теперь, из-за повс

Как рассчитать, что выгоднее: банковский кэшбэк или кредитка с беспроцентным периодом

Разберём вопрос: что принесёт больше выгоды при крупной покупке — привычный кэшбэк по дебетовой карте или хитрый манёвр с кредиткой и её беспроцентным периодом?Всё, что действительно...

✦ ИИ  Как программисты из России создали JetBrains — компанию, чьи инструменты используют крупнейшие IT-компании США

Речь пойдёт о компании JetBrains, известной средой разработки Intellij IDEA, которая была создана российскими программистами Сергеем Дмитриевом, Евгением Беляевом и Валентином Кипятковым

Такого нет ни в одном музее мира: в Кусково стартует выставка-блокбастер, посвященная тростям

Новый проект «Хрупкая спутница» представляет, пожалуй, самую подробную коллекцию тростей с фарфоровыми рукоятями, и, несомненно, уникален в первую очередь в виду безупречной сохранности...

Почему в автобусах «Икарусах-гармошках» двигатель находился посередине под полом салона

Сочленённые автобусы, прозванные в народе «гармошками» (от характерного изгиба соединительной секции), стали визитной карточкой венгерского автобусного завода Ikarus, они завоевали популярность в...