Триллион страниц в истории: Internet Archive отметил важное достижение

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Некоммерческий проект Internet Archive сообщил о сохранении триллионной веб-страницы, зафиксировав важнейший этап в истории цифрового архивирования интернета.

Автор: Sinem Görücü Источник: betterimagesofai.org

На это ушло почти 30 лет непрерывной работы. Событие стало знаковым для всей глобальной сети интернет. В отличие от печатных архивов, цифровой контент крайне недолговечен и существует лишь до тех пор, пока кто-то готов его поддерживать.

С момента основания в 1996 году организация ставит перед собой цель создать «постоянную летопись эволюции интернета». Для этого используются специализированные поисковые роботы, автоматически сохраняющие общедоступные сайты, а также загрузки обычных пользователей — от редких книг до аудиозаписей. На сегодняшний день архив насчитывает свыше 866 млрд веб-страниц, около 41 млн текстов и огромное количество других материалов. Каждый день в систему загружается около полумиллиарда страниц, а общий объём данных уже превысил 100 тысяч терабайт.

Стоит отметить, что сейчас этот проект сталкивается с некоторыми проблемами. На данный момент крупные медиа всё чаще ограничивают доступ к свежему контенту. Связано это с тем, что они опасаются использования их материалов в генеративных системах ИИ. Тем не менее в Internet Archive надеются, что эта проблема будет решена, и проект сможет пережить не только первый, но и второй триллион сохранённых страниц.

Источник: Popular Science

Автор не входит в состав редакции iXBT.com (подробнее »)
Об авторе
Делюсь опытом и своими знаниями на различные темы.

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

«Мёртвая дорога» Салехард — Игарка: как строили трансполярную магистраль и почему бросили

Трансполярная магистраль — недостроенная железная дорога, которую возводили в 1947-1953 годах около 80-100 тысяч заключенных ГУЛАГа. Путь длиной 1300-1480 км должен был пройти от станции...

Флот без моря: почему Боливия единственная страна Южной Америки, лишённая выхода к океану

Боливия — одна из двух стран южноамериканского континента (наряду с Парагваем), не имеющих прямого выхода к морю. На карте это хорошо видно, ~120 км полоска суши отделяет страну от моря....

Большое кольцо в Осаке: зачем строили гигантское деревянное сооружение диаметром 700 метров и что с ним стало

На искусственном острове Юмешима в Осакском заливе во время подготовки к Всемирной выставке Expo 2025 появилось впечатляющее сооружение Большое кольцо. Гигантская деревянная конструкция с...

✦ ИИ  Почему речные мидии не лежат рядом с креветками: они съедобны, но в магазинах их почти нет

Речные ракушки я помню ещё с детства. Не потому что тогда знала слова «перловица» или «беззубка», конечно. Просто у берега в иле попадались эти тёмные тяжёлые штуки. Достаёшь такую: она холодная,...

✦ ИИ  Летал как белка-летяга, но приходился родственником велоцираптору: кем был новый крылатый динозавр из Чанма

Бассейн Чанма, расположенный на северо-западе Китая в провинции Ганьсу, в течение сорока лет оставался одной из самых необычных палеонтологических точек на карте мира. С начала 1980-х годов здесь...