Обзор DVYGUN Smart Search - персональной поисковой системы


Чем больше у вас винчестер, тем сложнее найти на нем именно ту информацию, которая нужна вам в данный момент. И не когда-то в будущем, а сейчас, немедленно. Как бы вы хорошо ни структурировали вашу информацию, со временем ее скапливается так много, что уже и структурирование не помогает. Безусловно, выход есть и в этой ситуации, и каждый его находит по-своему. Одно из решений - установка на свой компьютер специальных поисковых систем, которые существенно сократят время и сложность поиска. Решений достаточно - о многих из них уже здесь писалось. Но они появляются вновь и вновь. Вот и теперь: в каталоге Softkey - новое решение от компании DVYGUN.

Вообще-то, у компании не одно, а три решения под одним названием. Первое предназначено для персонального использования - DVYGUN Smart Search, второе - для корпоративной сети (DVYGUN Smart Search Enterprise Edition) и третье - серверное решение для локальной или распределенной сети предприятия (DVYGUN Smart Server). Принцип действия у них одинаков, отличаются они лишь дополнительными возможностями. Поэтому вначале рассмотрим базовую программу, предназначенную для персонального использования.

Персональная версия устанавливается на локальном компьютере и буквально через считаные секунды после установки готова приступить к работе. Поэтому на первом этапе следует поторопиться, чтобы не делать лишней работы. По умолчанию программа начнет индексировать все файлы на всех ваших локальных дисках, и если вам нужно проиндексировать лишь отдельные разделы - после старта перейдите в настройки и выполните индексацию лишь тех разделов, которые вам необходимы. Но не торопитесь сразу выходить из настроек - здесь есть еще и другие параметры, которые вам потребуются.

Нужно отметить, что индексные файлы получаются большого объема. Так, для папки, где у меня находились файлы самых различных типов - и документы, и картинки, и архивы, - при исходном объеме в 40 Мб размер индексных файлов составил почти половину. Поэтому вам нужно определиться с тем, где, на каком диске и в каком разделе эти индексы будут у вас храниться. На той же закладке, где выбирается расположение индексных файлов, можно указать периодичность проверки исходных разделов на наличие новых или обновленных файлов с целью обновления индекса. Период может настраиваться от нескольких секунд (но это редко когда кому может потребоваться) до нескольких дней. Впрочем, для разделов с небольшим объемом изменяемых файлов эту опцию можно отключить и использовать другую - полную перестройку индексов с определенной периодичностью.

Процесс индексации может выполняться как во время вашей работы, так и в минуты, когда компьютер находится в покое, - эти опции вы выбираете сами. Если ваши разделы обновляются часто, рекомендуется запускать программу при старте компьютера. Если разделы статичны, достаточно использовать программу по прямому назначению - для поиска информации, и запускать ее по мере необходимости.

Теперь рассмотрим, что же может индексировать программа. Конечно, любые документы - все, что относится к офисным документам (Word, Excel, текстовые), все разновидности HTML-страниц, файлы в форматах RTF и PDF, музыкальные и видеофайлы, картинки. Выполняется индексация и архивов (перечень поддерживаемых типов архиваторов очень велик, практически могут быть проиндексированы все типы архивных файлов). Единственный недостаток - при больших размерах архивов индекс будет превышать их объем. Поэтому с архивами нужно быть очень аккуратными, иначе вам может попросту не хватить свободного места. Зато потом искать заархивированную информацию можно будет просто и быстро.

Но это еще не все возможности программы. DVYGUN позволяет выполнить индексацию и почтовых сообщений, если вы работаете с почтовыми клиентами Outlook, Outlook Express, Thunderbird (и кроме того - ваши контакты из адресных книг). Не забудьте заглянуть и на закладку, где выполняется настройка индексации посещенных вами интернет-страниц (здесь можно отдельно выбрать индексацию страниц, просмотренных через браузер MS IE или Firefox). Идея хорошая, но как быстро растет индекс! Поэтому будьте осмотрительны, когда выбираете типы индексируемых файлов.

Что показалось неудобным - можно создать только один набор разделов, которые будут индексироваться. Этот набор нельзя сохранить под каким-нибудь именем (например, как это делается в "Ищейке") и нельзя создать следующий. Неудобно, когда вам не хотелось бы смешивать в один индекс информацию по различным темам и направлениям либо когда для разных пользователей (а в домашних условиях одним компьютером пользуется обычно не один человек) хотелось бы создать свои наборы индексируемых разделов.

Но вот настройки сделаны, можно приступить к индексированию. Как оно будет происходить, когда - зависит от ваших настроек. Но вы можете с панели главного окна программы в любой момент остановить индексацию либо запустить обновление или перестройку индекса. Но, конечно, главное окно предназначено в первую очередь не для этого, а для поиска и отображения найденной информации. Поиск может выполняться как в обычном режиме, так и в расширенном. В расширенном режиме можно в качестве дополнительных параметров указать даты разыскиваемых файлов, их тип, папку, где они могут находиться, приблизительный размер или его пределы, а также имя файла или его часть. Но если вы выполняете поиск среди вашей почты, то расширенный поиск предоставляет другие возможности - здесь, как и в почтовом клиенте, можно в качестве дополнительных параметров задать поиск по теме письма, адресу отправителя, адресату. А для музыкальный файлов - по исполнителю, жанру, альбому, названию.

Что действительно соответствует заявлению разработчиков - поиск выполняется очень быстро. Секунды - и перед вами список всех файлов, которые соответствуют вашему запросу. Программа производит поиск с учетом морфологии. Например, по введенному слову "информация" будут найдены все документы со словами "информации", "информацией", "информации" и т. п. (Поддерживается морфологический поиск в текстах на русском, английском и украинском языках.) В поисковом запросе могут быть использованы логические операторы и скобки. С помощью панели инструментов вы можете выбрать из найденного файлы определенного типа (например, посещенные вами веб-страницы, видео- или музыкальные файлы, картинки, документы) или получить весь список полностью. На панели результатов поиска слова из поискового запроса будут выделены разными цветами, а найденные картинки и видеофайлы будут отображаться со своими скриншотами. По умолчанию результаты поиска отсортированы по релевантности (колонка %), то есть степени соответствия смысла найденного элемента вашему поисковому запросу. Для сортировки результатов по другим параметрам (например, по имени, дате, размеру, папке и т. п.) нужно кликнуть на заголовок нужной колонки.

Окно результатов поиска разделено на две части. В одной из них - список найденных файлов, при этом возможно отображение как собственно списка, так и списка, в котором к каждому файлу будет прицеплена небольшая цитата, содержащая искомое слово или выражение. Во второй части окна - окно быстрого предпросмотра. Некоторые файлы (особенно веб-страницы, текстовые файлы) будут в нем отображаться очень хорошо, другие типы могут оказаться недоступными для предпросмотра. Но у вас всегда есть возможность открыть выбранный файл во внешней программе, связанной с типом файла, либо перейти в папку, где он находится. А еще имеется возможность отправить найденный файл по почте, для чего будет использоваться ваш почтовый клиент. Опять же, что показалось неудобным, нельзя проводить уточняющий поиск среди найденных документов. И еще одно. Нельзя получить информацию о том, сколько на данный момент проиндексировано документов. Этой информации нет в программе, как и нет лог-файлов, где можно было бы эту информацию увидеть.

Чем же отличаются корпоративная и серверная версии программы от рассмотренной? Если программа для индивидуального поиска может вести поиск только на локальном компьютере, то корпоративная выполняет его на любых доступных компьютерах локальной сети. В отличие от персональной версии корпоративная и серверная версии - платные. Эти версии в дополнение к уже перечисленным возможностям программы обеспечивают поиск почтовых сообщений и в программе The Bat!.

Еще более мощной системой является серверное решение. Оно состоит из нескольких частей - индексирующего сервера, паука, поискового и веб-сервера. Паук обходит источники данных (они описываются в настройках системы) и передает собранную информацию индексирующему серверу, который ее обрабатывает. Веб-сервер выполняет функцию первичной обработки запросов пользователей и передачу их поисковому серверу. И далее - обрабатывает полученные от поискового сервера результаты и формирует их для выдачи в удобном для пользователя виде. Для доступа к возможностям системы пользователю достаточно иметь обычный веб-браузер.

Помимо уже описанных выше типов документов и файлов серверное решение может быть использовано для индексации серверов баз данных (OLEDB/ODBC) и почтовых систем типа Microsoft Exchange Server. Система обладает настраиваемой системой безопасности, с помощью которой определяются области видимости данных для ее пользователей. Система может быть интегрирована со средствами безопасности Windows (NTFS Access Control Lists, Windows Active Directory).

Судя по документации, серверное решение обладает более широкими возможностями создания поисковых запросов, управления правами доступа к информации, настройки механизма индексации. И при этом скорость обработки запросов остается такой же высокой даже при огромном (на несколько миллионов документов) объеме информации.





Дополнительно

iXBT BRAND 2016

«iXBT Brand 2016» — Выбор читателей в номинации «Процессоры (CPU)»:
Подробнее с условиями участия в розыгрыше можно ознакомиться здесь. Текущие результаты опроса доступны тут.

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.