Хлебные крошки



02.26. Работа с форматом PDF. Solid Converter PDF 7

Назначение программы

Коммерческая профессиональная программа для:

  • Преобразования файлов PDF в форматы Microsoft Word, Excel, PowerPoint (поддерживаются форматы всех версий), а также HTML и простой текст (TXT), извлечение графики из исходных файлов PDF;
  • Преобразования файлов любого формата в формат PDF;
  • Редактирования файлов PDF, в том числе добавления водяных знаков, сведений о документе, создания защищенных документов, для создания текстового слоя, для копирования, удаления, поворота страниц и объектов, преобразования выделенных областей документа PDF в другие форматы.

Скачать пробную версию программы или купить ее можно по адресу http://www.soliddocuments.com. Незарегистрированная программа работает до 15 дней.

Преобразование файлов из PDF в Microsoft Word, Excel, PowerPoint, HTML, TXT

После запуска программы поверх главного рабочего окна программы загружается Стартовая страница (Рис. 224). Не торопитесь закрывать ее, так как с ее помощью удобно запускать многие операции из данной программы. Отсюда возможен запуск всех 3-х возможностей программы: преобразования, изменения, создания файлов PDF.

Стартовая страница программы 

Рис. 224. Стартовая страница программы

На панели Преобразовать выберите формат, в который нужно преобразовать исходный файл PDF. Для примера мы выбрали самый популярный способ преобразования: из PDF в документ Microsoft Word (Рис. 225). Как только на панели Преобразовать был выполнен щелчок по ссылке Word немедленно открывается окно Конвертировать в Word. Выберите исходный файл в формате PDF и нажмите на кнопку Открыть. Сразу же после этого ссылка на выбранный файл PDF открывается на вкладке Конвертировать PDF в Word (Рис. 225) в списке Выбранные файлы. Одновременно можно открывать любое число файлов, но, учитывая значительное время, которое может занимать преобразование даже одного файла PDF, лучше конвертировать по одному файлу.

Настройка параметров преобразования PDF->DOC 

Рис. 225. Настройка параметров преобразования PDF->DOC

Открыть вкладки можно также командами из раздела Просмотр Панели.

Добавить файл PDF в список исходных файлов для конвертирования можно также выполнив команду ФайлОткрыть PDF из меню рабочего окна программы. После этого файл PDF открывается для чтения, а на вкладке Конвертировать PDF в Word становится доступной кнопка Добавить открытые файлы. Щелчок по данной кнопке добавляет открытый файл PDF в список исходных файлов для конвертирования. Вкладка Стартовая страница так и остается в рабочем окне программы.

Если файл был включен в список конвертирования случайно, то выделите его в списке Выбранные файлы и нажмите на кнопку Удалить. Удаляется только метка на данный файл, а не сам файл с физического носителя.

Кнопка Просмотр… открывает папку, в которой находится выбранный файл.

Установка флажка в опцию Настроить параметры конвертирования предписывает перед началом конвертирования выполнить настройку параметров этого конвертирования. То есть после нажатия на кнопку Запустить будет предварительно открыто окно для настройки параметров конвертирования и только потом будет выполнено само конвертирование. Если флажок с данной опции сброшен, то после нажатия на кнопку Запустить будет выполняться конвертирование.

Опция Определять таблицы предписывает распознавать таблицы в исходном файле и переносить их в выходной файл как таблицы, а не как текст.

В списке Режим преобразования выбирается метод распознавания текстовых, табличных и графических объектов и перенос их в выходной файл:

  • Достоверный — восстанавливает страницы и колонки текста, форматированный текст и графику;
  • Последовательный — восстанавливает форматированный текст и графику;
  • Реалистичный — восстанавливает текст, используя средство «Надписи» Microsoft Word.

В списке Параметры сохранения выбирается, что нужно выполнить с выходными файлами:

  • Сохранить — выходной файл будет сохранен, но не будет открыт автоматически;
  • Сохранить и открыть — выходной файл будет сохранен, после чего он будет открыт в программе, ассоциированной с выбранным выходным форматом. Форматы DOC и DOCX можно ассоциировать не только с родной программой Microsoft Word, но, например, с OpenOffice.org Writer 3 или другими аналогичными текстовыми редакторами.

В поле Сохранить в предлагается папка, в которой будет сохранен выходной конвертированный файл. По умолчанию предлагается сохранять выходной файл в той же папке, что и исходный файл PDF. Если это не так, то нажмите на кнопку с многоточием и выберите нужную папку.

Примечание: если некоторые элементы управления не видны в окне Конвертировать PDF в Word, то увеличьте ширину этого окна — растяните размеры этого окна.

В списке Формат выходного документа выберите подходящий формат для конвертирования выходного документа. Например, если на данном ПК не установлено приложение Microsoft Office 2007-2010, а установлены более ранние версии (1997-2003), то следует выбирать не формат DOCX, а формат DOC.

Примечание: приложение OpenOffice.org Writer 3 может открывать файлы с форматом DOCX, но файлы большого размера открывает очень медленно. Если установлена эта программа, то удобнее создавать файлы в формате DOC, а не в DOCX. Для работы с файлами DOCX лучше использовать программу LibreOffice.

Опция Запрос при перезаписи требует запрашивать пользователя в том случае, если в папке уже есть файл с таким же именем.

Для начала конвертирования нажмите на кнопку Запустить. Если флажок Настроить параметры конвертирования не установлен, то конвертирование выполняется немедленно. Если флажок установлен, то предварительно можно настроить дополнительные параметры конвертирования и после этого нажать на кнопку ОК.

На рисунке (Рис. 226) показана готовая страница документа в формате DOCX: текст изначально читаемый, без всяких «арказябриков» (нечитаемых символов), строки одного абзаца практически не разбиты по строкам, размер страницы взят из размеров исходного файла PDF. Мы говорим, что разбивка «Практически» не встречается, но все-таки иногда и здесь программа ошибается и вставляет символ конца абзаца (¶) внутри абзаца. Но разве можно сравнивать незначительное число ошибочных разрывов с массовыми разрывами строк абзаца в других аналогичных программах! (кроме программы ABBYY Transformer 3). Единственное неудобство — не распознаны символы переноса и некоторые символы дефиса (-) из исходного файла. Здесь они показаны как звездочки (*). Но этот вопрос легко можно решить заменой символов (Ctrl + H в Microsoft Word или Ctrl + F в OpenOffice.org Writer).

 Внешний вид страницы DOC в OpenOffice.org Writer 3.3

Рис. 226. Внешний вид страницы DOC в OpenOffice.org Writer 3.3

Создание файлов PDF

При инсталляции программы создается виртуальный принтер Solid Converter PDF, с помощью которого можно создать файл в формате PDF из любой программы, в которой есть команда Печать.

В самой программе предлагаются дополнительные средства для создания файла в формате PDF. Для начала создания файла PDF на вкладке Стартовая страница щелкните по ссылке [Создать] PDF документы. После этого открывается окно Выбрать файл для создания PDF, в котором выберите исходные файлы и нажмите на кнопку Открыть. Все исходные файлы попадают в список Использовать файл(ы). В качестве исходных можно использовать не один, а любое число файлов. Здесь предлагается возможность объединить несколько исходных файлов и создать из них 1 выходной файл PDF. В качестве исходных можно даже использовать другие файлы PDF, например, для их объединения. Например, множество отдельных рассказов можно объединить в один сборник. Настройка параметров создания файла PDF находится на вкладке Создать PDF (Рис. 227).

Настройка параметров создания файлов PDF 

Рис. 227. Настройка параметров создания файлов PDF

В данном примере мы пытаемся объединить 2 исходных файла в формате PDF в 1 файл формата PDF. Для объединения выбранных файлов установите флажок в опцию Объединить. Если флажок сброшен, то будет создано столько файлов PDF, сколько исходных файлов было выбрано. Если исходные файлы объединяются, то выходной файл PDF получает имя одного из этих исходных файлов, но без расширения. После создания готового файла PDF его можно переименовать (например, команда Переименовать из контекстного меню этого файла).

Опция Использовать PDF/A-1b создает документ PDF в соответствии со стандартом долгосрочного хранения.

Опция Занести информацию о документе открывает окно, в котором можно настроить параметры защиты документа, сжатия графических изображений и т. д.

В списке Параметры сохранения выбираются действия, которые нужно выполнить с выбранными документами:

  • Открыть — выходной файл создается и открывается в главном рабочем окне программы. Если необходимо сохранить этот файл, то такая операция выполняется отдельно;
  • Сохранить — выходной файл сохраняется, но не открывается в главном рабочем окне программы. Открыть готовый файл можно в любой программе, открывающей файлы PDF;
  • Сохранить и открыть — программа создает файл PDF, а после завершения создания и объединения открывает готовый файл в главном рабочем окне программы.

Файлы PDF создаются во временных или рабочих папках. Поэтому пользователь не может увидеть и немедленно открыть готовые файлы PDF. Например, Вы создаете объединенный файл PDF на основе 2-х исходных файлов формата DOC: сначала будет создан каждый отдельный файл PDF на основе исходных файлов. Затем будет запущена операция слияния 2-х файлов PDF в один. Только после этого программа разрешит дальнейшую работу с этим объединенным файлом PDF.

В поле Сохранить в указывается папка, в которой нужно сохранить выходной файл PDF. Обратите внимание — на рисунке (Рис. 227) это поле недоступно, так как в списке Параметры сохранения выбрано значение по умолчанию — Открыть. Этот вариант не предусматривает автоматического сохранения создаваемого файла PDF и поэтому поле Сохранить в недоступно. По умолчанию готовый файл сохраняется в той же папке, что и исходный файл. Если исходные файлы из разных папок, то сохранение будет выполняться в ту папку, из которой файл будет запущен для обработки первым. Так как это может быть неудобно, так как трудно определить, из какой папки будет первым запущен файл на обработку, то намного проще указать местоположение готового файла PDF. Для этого нажмите на кнопку с многоточием и укажите нужную папку.

Опция Запрос при перезаписи доступна только в том случае, если в списке Параметры сохранения выбраны значения Сохранить или Сохранить и открыть. Если флажок в этой опции установлен, то программа выдаст запрос в том случае, если в папке уже есть файл с таким же именем, что и создаваемый.

Для начала создания файла PDF нажмите на кнопку Создать. Процесс создания файла PDF очень длительный, в отличие от других аналогичных программ. Но возможность объединить несколько разных файлов в один того стоит.

В нижнем колонтитуле созданного выходного файла выводится информация о данной программе.

Редактирование файлов PDF

Программа позволяет редактировать файл PDF. Для этого на вкладке Стартовая страница щелкните по ссылке Изменить [содержимое PDF документа]. После этого открывается окно Выбрать файлы, в котором выберите файл PDF для редактирования. Выбранный файл загружается в главное рабочее окно программы в режиме редактирования (Рис. 228).

Редактирование документа PDF 

Рис. 228. Редактирование документа PDF

Для редактирования документа PDF предлагаются инструменты:

Выбрать текст () — выделяет фрагмент текста, если указатель мыши принимает вид (). Выделяет текстовый объект, если указатель мыши принимает вид (). Выделенный текст можно скопировать или вырезать в буферную память. Выделенный объект можно переместить по странице, изменить его размеры или повернуть под заданным углом;

Выбрать объект () — выделяет объект любого типа: текстовый, графический, таблицы. Указатель мыши всегда имеет вид ();

Изменить текст () — в текстовом объекте после щелчка по нему начинает мигать курсор, приглашая выполнить изменения. Указатель мыши всегда ();

Выбрать область () — выделяет фрагмент страницы (Рис. 229), который можно конвертировать в форматы Microsoft Word, Excel, HTML, TXT или извлечь из выделенного фрагмента изображения. Указатель мыши всегда принимает вид (). Выделять можно области произвольной формы. По умолчанию создается одна область, но с нажатой клавишей Ctrl можно создавать выделение сложной формы. На пересекающиеся области белого фона на голубом не обращайте внимания. При конвертировании в любой формат, например, в Word, в незарегистрированной версии под текстом создается подложка, сообщающая о необходимости регистрации. Избавиться от этой подложки элементарно, например, скопировать текст в Блокнот (или другой редактор, не создающий фон), а оттуда обратно в Word.

Выделенный фрагмент страницы 

Рис. 229. Выделенный фрагмент страницы

Для поворота страниц на угол, кратный 90°, предлагаются кнопки Повернуть страницы по часовой стрелке () и Повернуть страницы против часовой стрелки ().

Кнопка Выбрать водяной знак () позволяет создать в документах PDF водяные знаки. Водяные знаки создаются для дополнительной защиты документа. После нажатия на кнопку открывается окно с перечнем водяных знаков.

Если ни один из предлагаемых водяных знаков не устраивает, то выделите один из предлагаемых водяных знаков и нажмите на кнопку Изменить или Новый. После этого открывается окно Изменить водяной знак (Рис. 230). Проще всего создать текстовый знак. Для этого установите переключатель Тип в положение Текст. В многострочном поле Текст водяного знака введите нужный текст. Отформатируйте текст: выберите начертание, гарнитуру и другие параметры шрифта. В списке Местонахождение выберите место на странице, где должен создаваться водяной знак. Если текст нужно повернуть под некоторым углом, то установите это значение с помощью счетчика Поворот. Положительные значения угла поворачивают текст против часовой стрелки. Отрицательные значения поворачивают текст по часовой стрелке. Для фиксации изменений нажмите на кнопку ОК.

Редактирование водяного знака 

Рис. 230. Редактирование водяного знака

В списке водяных знаков выделите один из них и нажмите на кнопку Применить. После этого открывается окно Добавить водяной знак на страницу. По умолчанию водяной знак предлагается установить на все страницы книги — выбрано положение переключателя Страницы — Все. Можно выбрать четные, нечетные страницы или только текущую страницу. Положение переключателя Интервал позволяет указать страницы, на которых нужно установить водяной знак. В списке Ориентация можно выбрать страницы по их ориентации — Книжная или Альбомная. Если ориентация страницы не имеет значения, то выберите значение Любая. Для установки водяных знаков на выбранные страницы нажмите на кнопку ОК.

После редактирования документа нажмите на кнопку Сохранить ().

Оптическое распознавание сканированных изображений

Страницы книги можно сканировать на любом сканере. Но результат сканирования представляет собой только графические изображения, а не текст. Сканированные изображения можно использовать для создания, например, файлов в формате DjVu. Сканированные изображения можно использовать и для создания файлов в формате PDF (и таких файлов немало предлагается в Интернете), но обычно так не делают, так как такие книги требуют очень много дискового пространства. Поэтому обычно сканированные изображения распознаются специальными программами, называемыми OCR, то программами для оптического распознавания текста. Команда Просмотр ПанелиСканировать в Word открывает окно Сканировать в Word на вкладке Сканируется (Рис. 231).

 Настройка параметров OCR. Вкладка Сканируется

Рис. 231. Настройка параметров OCR. Вкладка Сканируется

В списке Сканер предлагается драйвер для сканера, установленного на данном ПК, если он установлен. Если сканера нет или драйвер не установлен, то использовать возможность OCR нельзя.

Переключатель Сканировать как предлагает цветовое решение для сканируемых изображений. Если изображения создаются в полутоновой шкале, то выберите значение Оттенки серого или монохромный.

В списке Качество определяется разрешение для создаваемых сканируемых изображений в точках на английский дюйм. Значение 300 dpi является приемлемым для сканируемых страниц. Значение 600 dpi создает качественные изображения с высоким разрешением.

В списке Размер области сканирования выбирается размер страниц в Word, на которые будет выводиться распознанный текст.

На вкладке Выходной документ (Рис. 232) определяются параметры выходного документа.

Вкладка Выходной документ 

Рис. 232. Вкладка Выходной документ

В списке Параметры сохранения предлагаются значения:

  • Сохранить — файл сохраняется в формате DOCX, но после этого автоматически не открывается;
  • Сохранить и открыть — файл сохраняется, а после этого автоматически открывается в программе, ассоциированной с форматом DOCX.

В поле Сохранить в определяется папка, в которую будет выполняться сохранение создаваемого файла. По умолчанию файл сохраняется в папке Мои документы (для Windows XP или ниже) или Документы (для Windows Vista или 7). Если это не так, то нажмите на кнопку с многоточием и укажите нужную папку.

В списке Названия определяется способ нумерации создаваемых файлов. Значение Автонумерация предлагает нумеровать файлы, начиная с 0001. Значение Автоматическая установка даты в качестве номера предлагает дату создания файла. В поле Префикс определяется текст, создаваемый в начале каждого файла. Полное имя создаваемого файла будет, например, таким:

Scanned_001.docx

После определения всех параметров установите книгу в сканер и нажмите на кнопку Запустить, после чего открывается окно Сканирование многостраничного документа (Рис. 233) — автоматически выполняется сканирование книги на развороте. Сканирование будет выполнено даже в том случае, если в сканер ничего не установлено.

Выполняется сканирование страниц 

Рис. 233. Выполняется сканирование страниц

После сканирования первой страницы можно выполнить следующие команды:

  • Добавить и продолжить — сканировать очередной разворот страниц;
  • Отменить результат сканирования — отменить результат сканирования предыдущей страницы, если сканирование оказалось неудачным (черные полосы, одна из страниц сканирована криво и т. д.);
  • Завершить сканирование — сканирование завершается и выполняется оптическое распознавание сканированных страниц;
  • Отменить все — все результаты сканирования аннулируются и игнорируются. Окно автоматически закрывается.

Кнопки () и () поворачивают сканированную страницу на угол, кратный 90° — по часовой и против часовой стрелки.

С помощью маркеров на сканированной странице можно отсечь ненужные области на странице, например, уменьшить поля или пустые области.

Примечание: незарегистрированная версия ограничивает возможности OCR.


Hilliger Media Shop
Template "butterflymeadowfree" designed by Hilliger Media (Copyright © 2011)