Триллион страниц в истории: Internet Archive отметил важное достижение

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Некоммерческий проект Internet Archive сообщил о сохранении триллионной веб-страницы, зафиксировав важнейший этап в истории цифрового архивирования интернета.

Автор: Sinem Görücü Источник: betterimagesofai.org

На это ушло почти 30 лет непрерывной работы. Событие стало знаковым для всей глобальной сети интернет. В отличие от печатных архивов, цифровой контент крайне недолговечен и существует лишь до тех пор, пока кто-то готов его поддерживать.

С момента основания в 1996 году организация ставит перед собой цель создать «постоянную летопись эволюции интернета». Для этого используются специализированные поисковые роботы, автоматически сохраняющие общедоступные сайты, а также загрузки обычных пользователей — от редких книг до аудиозаписей. На сегодняшний день архив насчитывает свыше 866 млрд веб-страниц, около 41 млн текстов и огромное количество других материалов. Каждый день в систему загружается около полумиллиарда страниц, а общий объём данных уже превысил 100 тысяч терабайт.

Стоит отметить, что сейчас этот проект сталкивается с некоторыми проблемами. На данный момент крупные медиа всё чаще ограничивают доступ к свежему контенту. Связано это с тем, что они опасаются использования их материалов в генеративных системах ИИ. Тем не менее в Internet Archive надеются, что эта проблема будет решена, и проект сможет пережить не только первый, но и второй триллион сохранённых страниц.

Источник: Popular Science

Автор не входит в состав редакции iXBT.com (подробнее »)
Об авторе
Делюсь опытом и своими знаниями на различные темы.

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Кому на самом деле принадлежат Indesit, Grundig, Hotpoint и ещё 19 популярных брендов бытовой техники из наших магазинов

В магазинах, видя знакомые названия холодильников, стиральных машин или духовкок, мы редко задумываемся, кто стоит за этими брендами. Beko, Hotpoint, Indesit, Grundig кажутся совершенно разными...

Домашний кондиционер для белья за 5 минут: пошаговый рецепт и проверка в деле

В последнее время заметил, что магазинные кондиционеры для белья в бюджетном ценовом сегменте за свои деньги стали не такими уж и хорошими и результативными. Поэтому решил проверить старый добрый...

✦ ИИ  Анатомия «Электроники МС 1504»: как в СССР пересобранный ноутбук Toshiba опередил закат эпохи

В начале 1990-х годов советская электронная промышленность находилась в глубочайшем кризисе, но именно в этот переломный момент на Минском научно-производственном объединении «Интеграл» начался...

Первая волна белых, маслят и опят: 7 июньских грибов и как отличить их от несъедобных двойников

Белые, маслята и опята уже в лесу! Где искать июньские грибы и как не перепутать их с ядовитыми двойниками, способными вызвать тяжелое отравление.

Часто совершаемые ошибки, которыми вы сами «убиваете» свой холодильник

Холодильник может долгое время работать в режиме перегрузки и источником этой проблемы может быть сам владелец. Какие наши ошибки и привычки могут вывести холодильник из строя раньше времени?

Не только Ubuntu: 8 Linux-систем для перехода с Windows без лишней работы в терминале

Выбор системы Linux для новичка часто сводят к одному совету: поставить известный дистрибутив и не бояться терминала. Но это слишком плоский взгляд. За пределами Mint и Ubuntu есть системы с...