Обзор ABBYY PDF Transformer - пакета для создания и работы с документами в формате PDF


Сегодня существует довольно много отличающихся друг от друга форматов электронных документов. Некоторые из них менее распространены, другие являются стандартом де-факто. Это можно сказать, например, про формат документов Microsoft Word и Excel, обычный текст, RTF и т. д. Однако не лишены они и некоторых минусов, самыми серьезными из которых являются недостаток возможностей оформления и то, что на различных компьютерах один и тот же документ может выглядеть по-разному. Между тем во многих случаях требуется сохранить идентичность файла при просмотре на любом ПК. Описанных недостатков лишен специально созданный формат PDF (Portable Document Format). В файлах этого стандарта содержится подробнейшая информация о конфигурации текста, таблице кодов символов и графике, благодаря чему они всегда и везде выглядят одинаково. Формат PDF получил сегодня довольно широкое распространение. Чаще всего он используется в полиграфии, для распространения инструкций к различному оборудованию, в маркетинге и т. д.

Однако если говорить откровенно, есть у PDF-документов и недостатки. Самым серьезным из них является сложность или даже невозможность их редактирования. Казалось бы, это никому не мешает. Ну зачем, например, вносить какие-то изменения в инструкцию к принтеру? И это действительно так, если пользователь будет только просматривать файл на своем компьютере. Ну а если он, допустим, захочет распечатать его, убрав оттуда ради экономии картинки, изменив форматирование или уменьшив шрифт? Можно привести и другой пример. Допустим, у нас есть PDF-документ с результатами какого-то исследования. И нам необходимо взять оттуда статистические данные и обработать их, например, в Excel. Неужели кто-то захочет вручную набирать сотни цифр, рискуя ошибиться и исказить исходную информацию? Кроме того, нельзя забывать, что чем распространеннее становится формат PDF, тем чаще перед пользователями возникает потребность в создании таких файлов. Таким образом, для полноценной работы с электронными документами рассматриваемого стандарта необходимо специальное программное обеспечение, которое, с одной стороны, должно уметь создавать такие документа, а с другой - извлекать из них пригодную для обработки информацию. Именно таким продуктом и является новая, вторая, версия утилиты ABBYY PDF Transformer, о которой мы с вами, уважаемые читатели, и будем сегодня говорить. Эта программа фактически состоит из двух частей. Первая отвечает за создание PDF-документов, а вторая - за извлечение информации из них. Давайте рассмотрим каждую из них подробно.

Создание PDF-документов

В программе ABBYY PDF Transformer реализовано сразу же два инструмента для создания PDF-документов. Первый из них - специальный модуль. Работа с ним осуществляется следующим образом. Сразу же после запуска перед пользователем появляется окно с настройками процесса преобразования. В нем необходимо установить четыре параметра. Первый - это наименование и местоположение создаваемого PDF-документа. По умолчанию он будет сохранен в ту папку, где находится исходный файл. Второй параметр определяет размер файла. Здесь есть три варианта: небольшой, средний и максимальный. Разница в размерах между ними достигается за счет различного качества графики в документе. Поэтому чем меньше файл, тем хуже его качество. Таким образом, первый вариант оптимален для размещения PDF-документов в Интернете или при пересылке их по электронной почте, второй подходит для использования на компьютере или для обычной распечатки, третий оптимален для полиграфического производства.

Конвертирование PDF-документа
Конвертирование PDF-документа

Следующий параметр называется "Защита документа". О нем стоит рассказать подробнее. Дело в том, что формат PDF позволяет устанавливать парольную защиту на файлы. При этом автор может определить отдельные ключевые слова для открытия документа и для его правки или печати. Это очень удобно, поскольку позволяет закрыть данные, разрешив одним людям только их чтение, а другим - печать и редактирование. Для осуществления этого в нашем случае необходимо отметить один или оба чекбокса в разделе "Параметры защиты". Кстати, при установке ограничения на правку автор может выбрать конкретные действия пользователя, выполнение которых будет невозможно без знания пароля: печать, редактирование, извлечение картинок и текста и добавление комментариев и PDF-форм. Ну и, наконец, последним пунктом параметров процесса создания PDF-документа является совместимость. Здесь автор может указать, под какую версию Adobe Acrobat Reader стоит "затачивать" файл: 4.0, 5.0 или 6.0. При этом стоит учитывать, что созданный документ не сможет быть прочитан версией программы с номером меньше выбранной. Все, на этом настройка может считаться законченной, а автору остается только нажать на одну кнопку, чтобы получить желаемый документ.

Запускаться рассмотренный модуль может тремя способами. Первый - через специальную панель, которая появляется в приложениях Micrpsoft Office: Word, Excel, PowerPoint и т. д. Другой вариант запуска - через контекстное меню, вызываемое нажатием правой кнопки мыши на исходном файле в "Проводнике" Windows. Последний способ - через стандартное меню "Пуск" операционной системы. Кстати, в последнем случае перед открытием окна настроек автору придется выбрать исходный документ, который он хочет преобразовать в формат PDF.

Вторым инструментом для создания PDF-документов в программе ABBYY PDF Transformer является виртуальный принтер. Что это такое? После установки утилиты в операционной системе появляется еще один принтер - PDF-XChange for ABBYY PDF Transformer 2.0. Пользователь может выбирать его в любых приложениях, как самое обычное устройство. Только в отличие от реальных принтеров документ будет распечатан не на листе бумаги, а в указанном PDF-документе.

Конвертирование PDF-документов

Создание PDF-документа
Создание PDF-документа

Конвертирование PDF-документов в другие форматы осуществляется с помощью технологий OCR (Optical Character Recognition - оптическое распознавание символов), обычно использующихся для распознавания сканируемых с бумажных носителей текстов. Именно они позволяют превращать PDF-документ в текст, таблицы и отдельные иллюстрации. Схема процесса конвертирования очень проста. Сначала пользователь открывает файл в формате PDF, затем устанавливает параметры процесса и запускает его. В случае если результат его не удовлетворил, два последних пункта повторяются (настройки изменяются на более качественные).

Осуществляет процесс конвертирования специальный модуль с очень простым интерфейсом. В первой части единственного окна ABBYY PDF Transformer отображается открытый в данный момент файл. А во второй - список доступных настроек. На верхнее место среди них вынесен, конечно же, список доступных форматов (документы Microft Word, Excel, HTML, обычный текст, RTF, PDF с возможностью полнотекстового поиска). На второе - имя конечного файла и папка, в которой он будет сохраняться. Далее пользователю необходимо указать страницы PDF-документа, которые ему нужны (все, список номеров, интервалы). Следующим идет раздел "Сохранение оформления". Для каждого формата конечного файла он свой. Например, при сохранении информации в стандарте Microsoft Word пользователь может включить или отключить запись графики, а также выбрать идентичное исходному оформление текста или же просто его размещение в одну колонку. Ну а для текстовых документов настройки проще. Здесь есть только две опции: разделение страниц символом конца страницы и разделение абзацев пустыми строками.

Следующим пунктом идет список языков документа. При этом пользователь должен помнить, что разработчики не рекомендуют использовать одновременно более двух или трех языков. Если же в файле их больше, то лучше процесс конвертирования проводить поэтапно. Далее пользователю предлагается выбрать режим работы программы: "Обычный" или "Как изображение". Первый из них обеспечивают большую скорость, но не позволяет распознавать некоторые специальные символы и символы нестандартных шрифтов: вместо них будут выводиться различные значки. Второй режим позволяет обрабатывать PDF-документ как картинку с применением технологий OCR. Это, конечно, замедляет процесс конвертирования, но зато делает его более качественным.

После установки всех необходимых параметров пользователю остается только запустить процесс преобразования. В течение его программа ABBYY PDF Transformer самостоятельно разобьет PDF-документ на разные области (текст, графика, таблица) и обработает каждую из них в зависимости от установленного типа. Впрочем, пользователям не всегда нравится автоматическая разбивка. В таких случаях у них есть возможность самостоятельно вручную указать программе все области и их типы.

Запускаться рассмотренный модуль может по-разному. Первый вариант - из стандартного меню "Пуск" Windows. Второй - с помощью дополнительной панели в различных приложениях Microsoft Office. При этом выбор формата конечного файла ограничивается той программой, откуда был произведен запуск ABBYY PDF Transformer. Есть и еще один вариант - контекстное меню, вызываемое нажатием правой клавиши мыши на PDF-документе в "Проводнике".

Программа ABBYY PDF Transformer 2.0 интегрирована в офисные приложения
Программа ABBYY PDF Transformer 2.0 интегрирована в офисные приложения

Подводим итоги

Сегодня мы с вами, уважаемые читатели, довольно подробно рассмотрели программу ABBYY PDF Transformer и выяснили, что она обладает как минимум двумя достоинствами: мощностью и простотой. И действительно, ее возможностей вполне достаточно как для создания PDF-документов, так и для извлечения из них информации для дальнейшей обработки. При этом программа обладает интуитивно понятным многоязычным интерфейсом, с которым не возникнет никаких сложностей даже у начинающих пользователей ПК. Также стоит отметить наличие краткой, но весьма информативной справочной системы на русском языке. Все это позволяет буквально сразу же после установки продукта ABBYY PDF Transformer начать полноценную работу с ним.





Дополнительно

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.