Триллион страниц в истории: Internet Archive отметил важное достижение

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Некоммерческий проект Internet Archive сообщил о сохранении триллионной веб-страницы, зафиксировав важнейший этап в истории цифрового архивирования интернета.

Автор: Sinem Görücü Источник: betterimagesofai.org

На это ушло почти 30 лет непрерывной работы. Событие стало знаковым для всей глобальной сети интернет. В отличие от печатных архивов, цифровой контент крайне недолговечен и существует лишь до тех пор, пока кто-то готов его поддерживать.

С момента основания в 1996 году организация ставит перед собой цель создать «постоянную летопись эволюции интернета». Для этого используются специализированные поисковые роботы, автоматически сохраняющие общедоступные сайты, а также загрузки обычных пользователей — от редких книг до аудиозаписей. На сегодняшний день архив насчитывает свыше 866 млрд веб-страниц, около 41 млн текстов и огромное количество других материалов. Каждый день в систему загружается около полумиллиарда страниц, а общий объём данных уже превысил 100 тысяч терабайт.

Стоит отметить, что сейчас этот проект сталкивается с некоторыми проблемами. На данный момент крупные медиа всё чаще ограничивают доступ к свежему контенту. Связано это с тем, что они опасаются использования их материалов в генеративных системах ИИ. Тем не менее в Internet Archive надеются, что эта проблема будет решена, и проект сможет пережить не только первый, но и второй триллион сохранённых страниц.

Источник: Popular Science

Автор не входит в состав редакции iXBT.com (подробнее »)
Об авторе
Делюсь опытом и своими знаниями на различные темы.

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Мост Мийо во Франции: почему он выше Эйфелевой башни и как изменил дорогу через долину Тарн

Во Франции есть сооружение, которое легко принять за кадр из фантастического фильма: тонкая линия дороги проходит над огромной долиной, а её опоры уходят вниз так глубоко, что машины на мосту...

Феномен 27-го меридиана: почему Земля отражает солнечный свет строго поровну между Востоком и Западом

Энергетический баланс нашей планеты зависит от простого физического показателя — количества солнечного света, которое она поглощает и отражает. Земля отражает обратно в космос около 29%...

Протоколы без пакетов: почему архитектура советской сети ОГАС принципиально отличалась от интернета

В массовой культуре принято считать, что проект Общегосударственной автоматизированной системы (ОГАС), разрабатывавшийся под руководством академика Виктора Глушкова, был «советским интернетом». Это...

Как на самом деле пчелы выращивают матку: почему одного маточного молочка оказалось недостаточно

В основе устройства пчелиной семьи лежит разделение ролей. Управляет всеми процессами матка — единственная самка с развитой репродуктивной системой. Она крупнее остальных пчел, живет в...

Рай под замком: как самый роскошный курорт Средиземноморья превратился в город-призрак

На восточном побережье Кипра можно найти уникальное явление. Роскошный курорт с безупречными золотыми пляжами, высотными зданиями, бутиками, заполненными модными брендами первой величины… И...

Ищем шпатлёвку при выборе автомобиля. Обзор толщиномера iCarTool IC-T400 с определением цинкового слоя

При подборе автомобиля остро возникла проблема проверки лакокрасочного покрытия. Автомобиль не из салона, но хотелось бы живое ЛКП. Можно обратиться к профессиональным автоподборщикам, которые...