Интернет исчезает: четверть всех веб-страниц с 2013 по 2023 год становятся недоступны

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Исследование из Pew Research Center (Исследовательский центр Пью) под названием «Когда онлайн-контент исчезает» показывает, что наш любимый Интернет вполне может исчезнуть — четверть всех веб-страниц, существовавших в период с 2013 по 2023 год, оказались больше недоступны.

Автор: alengo via Getty Images Источник: www.pcgamer.com

Вопреки распространенному мнению, что всему, что находится в сети, суждено существовать вечно, исследование показало, что 38% веб-страниц, существовавших только в 2013 году, теперь потеряны, по данным The Independent. Похоже, что даже относительно новые веб-страницы начинают исчезать: 8% веб-страниц, существовавших в 2023 году, также оказались недоступными.

В исследовании использовался Common Crawl, открытый репозиторий данных веб-сканирования, который архивирует миллиарды веб-страниц и предоставляет архивы и наборы данных для публичного использования. Исследователи случайным образом выбрали более миллиона веб-страниц, прежде чем проверить ссылки, чтобы определить, какие из них все еще активны, а какие ушли в огромный архив потерянной информации в облаке.

Результаты исследования оказались следующими: по крайней мере по одной неработающей ссылке было у 21% правительственных веб-сайтов и 23% новостных страниц, а также целых 54% веб-страниц Википедии содержали ссылку, которая больше не существует. Данные основаны на основе взятого объема веб-страниц для исследования.

Учитывая неотъемлемую роль Интернета в современном обществе (к лучшему или к худшему) с точки зрения проверки информации, эти результаты вызывают тревогу. В связи с растущим распространением вводящего в заблуждение контента сформированного искусственным интеллектом, потеря ценных источников информации созданных до эпохи искусственного интеллекта точно пойдет не на пользу.

В добавок к этому недавнее исследование показало, что 46,9% всего интернет-трафика может быть приписано ботам, многие из которых могут предоставлять всевозможную вымышленную информацию, чтобы еще больше запутать. Это заставляет смотреть в будущее, где новая информация становится все более сомнительной, а старую становится все труднее найти.

Источник: PCGAMER

8 комментариев

Добавить комментарий

SedayaNoch
Ну в связи с санкциями многие страницы заблокированы.
А с Википедией совсем другой случай, что они там просто чистят свою Википедию. Удаляют то, что им не нравится. К примеру Коммунизм, соц.страны ну и тому подобное.
117193583801184085629@google
Сразу видно что ты никогда в вики не писал.
Чувствительные страницы, там модерируются очень тщательно и любая попытка удаления будет откачена назад, а пользователь-заблокирован.
Не сравнивай вики с совком, это там начальство делало все что хотело.
Korzh
Тоже мне проблемы: 38% страниц, существовавших в 2013 году, исчезло – новых накреативили 3800% в ценах 2013 года
А что попало в интернет, то там действительно остаётся навсегда — потому что каждый год блогеры пишут очередной десяток статей о том, где у вагона перед, а где зад, почему самолёты оставляют за собой белые полосы… ну и вот что сайты исчезают бьют тревогу по нескольку раз в год ;)
А википедию пишут википедики — которые за написанное никак не отвечают, да и насчёт ссылок, соответственно, не парятся
Alex_Bes
Плохо когда это касается официальных или авторитетных сайтов, где их ссылки уже неактуальны, а исправлять это вряд ли кто будет, в остальном же да, просто всегда нужно уметь фильтровать информацию.
Korzh
Тогда педивикия вообще плохой пример — поскольку и не официальная, и не авторитетная ;)
Популярная — да. Но херни там в ассортименте всегда было порядком. И не только на общественно-политические темы, кстати
Это не Британика какая ни разу
А официальные… Ну да — плохо. Проблема в том, что они сами регулярно дорабатываются-перерабатываются. И не редкость, когда на одном официальном сайте структуру поменяли, а другие не менее официальные в итоге ссылки потеряли. Хотя вручную всё находится — просто уже на других местах. Но это, опять же общая, проблема. И изначальный недостаток любых внешних ссылок. Если они куда-то ведут на момент публикации, нельзя быть уверенным, что приземление одинаковым будет всегда. Так что олинван желателен. С точки зрения поисковиков — тоже. Они за внешние ссылки пессимизируют часто. А поисковики — основной источник трафика давно уже
Что на самом деле для поиска информации (такой вот грустный каламбур) куда большая проблема, чем заброшенные разделегированные сайты
117193583801184085629@google
Оказывается в вики нет ссылок, еще один дилетант рассуждает о википедии понаслышке.
C
«Интернет помнит всё» — говорили они…
Pavel_Priluckiy
Веб-архив в помощь.

Добавить комментарий

Сейчас на главной

Новости

Публикации

Я спросил 5 разных нейросетей про холодильник — и получил 5 разных ответов

Я спросил 5 ИИ, какой холодильник купить до 60 тысяч. ChatGPT, Gemini, Claude, Perplexity и Copilot ответили по-разному. Рассказываю, где сошлись, где разошлись и кому из них стоит верить.

Обзор видеокарты Gigabyte GeForce RTX 5060 Windforce MAX OC: где хватает 8 ГБ, а где спасает только апскейл

8 ГБ видеопамяти сегодня уже не выглядят большим запасом, особенно если речь заходит о 2K, максимальных текстурах и трассировке. Gigabyte GeForce RTX 5060 Windforce MAX OC 8G как раз из таких...

Десять лет назад вышел революционный смартфон Motorola Moto Z: краткая история линейки

В наше время модульные смартфоны стали игрушкой для энтузиастов, но ещё 10 лет назад компании считали, что за ними стоит будущее. Чего стоит один только Google Ara — концепт смартфона-конструктора...

300°C за 10 секунд от USB-C: Обзор паяльника Pinecil с прошивкой IronOS

Есть категория инструментов, которые за последние лет пятнадцать принципиально не менялись. Сетевой паяльник на 40 Вт с регулятором на диммере — он и в 2010-м был таким, и сейчас стоит...

Обзор проводных наушников Sivga SM100: металлические корпуса и приятный звук

Когда я смотрю на эти наушники, то меня не покидает чувство, что их дизайн слизан с клюшки для гольфа. Но к счастью звучат они гораздо лучше! И при этом стоят адекватных денег. Послушаем?

Обзор моющего пылесоса Dreame G12S Pro с сушкой горячим воздухом: пролезет туда, куда другие не смогут!

Каждый раз, глядя на то, как мой ребёнок оставляет после себя разлитую еду по всему полу (сейчас как раз тот возраст, когда он хочет быть самостоятельным), я всё чаще задумываюсь о моющем пылесосе...