Архив Эпштейна с миллионами документов сделали доступным для поиска
После публикации огромного массива материалов по делу Джеффри Эпштейна в открытом доступе появилась поисковая платформа, которая позволяет анализировать переписку и документы в структурированном виде. Проект получил название Jmail и построен на базе современных инструментов обработки данных и генерации кода.
Речь идёт о миллионах страниц — письмах, вложениях и сопутствующих материалах, опубликованных официальными источниками. Вместо разрозненных PDF-файлов команда разработчиков превратила архив в индексируемую базу, где можно искать по датам, адресатам, ключевым словам и связям между участниками переписки.
Платформа использует автоматическое распознавание текста и алгоритмы структурирования данных. Это позволяет извлекать метаданные, объединять фрагменты переписки и формировать перекрёстные ссылки между документами. Интерфейс выполнен в знакомом формате почтового сервиса, что упрощает навигацию по архиву.
Над проектом работает группа примерно из 15 инженеров. По словам участников, современные инструменты ИИ позволили сократить время разработки и обработки данных по сравнению с традиционными методами. Платформа ориентирована на журналистов, исследователей и всех, кто анализирует опубликованные материалы.
Разработчики подчёркивают, что используют только официально обнародованные документы. Проект не добавляет новых данных, а систематизирует уже опубликованные материалы для удобства поиска и анализа.
Источник: https://www.fastcompany.com





0 комментариев
Добавить комментарий