Триллион страниц в истории: Internet Archive отметил важное достижение

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Некоммерческий проект Internet Archive сообщил о сохранении триллионной веб-страницы, зафиксировав важнейший этап в истории цифрового архивирования интернета.

Автор: Sinem Görücü Источник: betterimagesofai.org

На это ушло почти 30 лет непрерывной работы. Событие стало знаковым для всей глобальной сети интернет. В отличие от печатных архивов, цифровой контент крайне недолговечен и существует лишь до тех пор, пока кто-то готов его поддерживать.

С момента основания в 1996 году организация ставит перед собой цель создать «постоянную летопись эволюции интернета». Для этого используются специализированные поисковые роботы, автоматически сохраняющие общедоступные сайты, а также загрузки обычных пользователей — от редких книг до аудиозаписей. На сегодняшний день архив насчитывает свыше 866 млрд веб-страниц, около 41 млн текстов и огромное количество других материалов. Каждый день в систему загружается около полумиллиарда страниц, а общий объём данных уже превысил 100 тысяч терабайт.

Стоит отметить, что сейчас этот проект сталкивается с некоторыми проблемами. На данный момент крупные медиа всё чаще ограничивают доступ к свежему контенту. Связано это с тем, что они опасаются использования их материалов в генеративных системах ИИ. Тем не менее в Internet Archive надеются, что эта проблема будет решена, и проект сможет пережить не только первый, но и второй триллион сохранённых страниц.

Источник: Popular Science

Автор не входит в состав редакции iXBT.com (подробнее »)
Об авторе
Делюсь опытом и своими знаниями на различные темы.

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

✦ ИИ  Летал как белка-летяга, но приходился родственником велоцираптору: кем был новый крылатый динозавр из Чанма

Бассейн Чанма, расположенный на северо-западе Китая в провинции Ганьсу, в течение сорока лет оставался одной из самых необычных палеонтологических точек на карте мира. С начала 1980-х годов здесь...

Обзор сетевого фильтра СТАРТ С/УД-Ф SP 6x1 ZDVT 2USB – нагрузка выше паспорта и срабатывание защиты

3500 Вт для бытового сетевого фильтра звучат серьезно: это уже нагрузка уровня мощной кухонной техники, а не просто зарядок, роутера и монитора. Поэтому Старт С/УД-Ф SP 6x1 ZDVT 2USB интересен...

8 легковесных дистрибутивов Linux для старого ноутбука

Старый ноутбук можно использовать не только как печатную машинку или устройство для экспериментов. Даже слабый нетбук способен справляться с документами, музыкой, работай с файлами и открытием...

✦ ИИ  Что нельзя мыть в посудомойке: дерево, чугун, ножи, хрусталь и другие материалы

Дерево, чугун, ножи, алюминий и хрусталь не выдерживают машинной мойки. Объясняю, почему посудомойка их разрушает и как правильно ухаживать, чтобы вещи служили годами.

Кто придумал советский майонез «Провансаль» и почему его нельзя было экспортировать

В истории советской кухни есть продукты, которые стали настоящими символами эпохи. Один из самых ярких примеров является майонез «Провансаль». Густой, насыщенный соус в небольших стеклянных...

Обзор внешнего аккумулятора Baseus Blade H1 100W 20000 mAh: Утонченный корпус требует жертв

Рынок повербанков давно перестал удивлять — большинство устройств либо толстые «кирпичи» с кучей ёмкости, либо тонкие «плашки» с урезанной мощностью. Baseus Blade H1 пытается усидеть на...