Создание и слияние файлов PDF

Категория: Главная
Опубликовано 03.10.2012 08:52
Автор: Шитов В.Н.
Просмотров: 11591

Создание файлов PDF

Сегодня мы поговорим о создании и объединении файлов в формате PDF. Казалось бы, нет ничего проще создавать электронные документы в формате PDF. Но неожиданно мне стали задавать вопросы по созданию и слиянию файлов в этом формате, да и я сам в последнее время встречаю множество топорно изготовленных файлов PDF. Например, на известном пиратском сайте Либрусек, не менее 2/3 электронных книг в формате PDF (с распознанным текстом) свободно читаются на ПК, но не читаются на ридерах: вместо кириллического текста выводятся непонятные символы или вообще чистые страницы.

 

Другая проблема: создатель файла PDF задает размеры страницы, чтобы страница поместилась в окне ридера (например, 6-дюймового), но в готовом файле страница по-прежнему формата А4, а на странице А4 помещен блочок текста с заданными создателем размерами. Читать такой текст на небольшом экране ридера крайне неудобно. У меня ридер Explay, в котором предлагается возможность вывода плавающего текста, размер которого задает сам читатель и таких проблем нет, но на многих ридерах такой возможности нет и читать книги PDF сложно. Единственное неудобство так называемого форматирования на моем ридере: переносы оказываются в середине строки, а текст переносится не по слогам, а по буквам, поэтому на другую строку может быть перенесена даже одна буква. Читать текст можно, но неудобно. Поэтому наиболее оптимальными являются книги, созданные именно под размер экрана своего ридера.

Наконец, проблема слияния нескольких небольших или близких по теме файлов PDF. При изучении электронных книг уже рассматривалась программа MergeFB2, сваривающая небольшие файлы в формате FB2, поэтому понятен интерес к такой же проблеме для книг PDF.

В разделе создания и чтения электронных книг уже говорилось, что, на мой взгляд, единственной профессиональной программой для создания файлов PDF является Adobe Distiller, правильно воспроизводящей все типы шрифтов. Особенно это касается шрифтов Type 1, с помощью которых я создаю электронные книги. Если открыть список шрифтов, установленных на ПК, то такие шрифты помечены строчной красной буквой «а» (все обозначения иконок шрифтов даны для всех версий ОС Windows, кроме 7. Чтобы узнать тип шрифта в версии 7 выполните по шрифту двойной щелчок и в верхней части окна будет указан тип, кроме растровых шрифтов). Имена таких шрифтов обычно заканчиваются на прописную букву «С». Например, BalticaC, AcademyC, PragmaticaC и т. д. Шрифты типа Open Type (с зеленой буковкой «О» в списке шрифтов) также можно использовать для создания книг PDF, но лично я никогда их не использовал, так как не было ни необходимости, ни желания. Шрифты TrueType, помеченные синим значком TT, для книг PDF вообще не используются. Возможно, некоторые читатели возразят на это: мы использовали и все читалось. Напоминаю, что вопрос сейчас рассматривается так: как создать книгу, которая бы читалась на всех технических устройствах, а не только на ПК. Если у читателей возникнут предложения и замечания, желание поделиться своим опытом, то они могут выложить их на форуме, предварительно зарегистрировавшись на сайте.

Программу Adobe Distiller для создания книг PDF можно установить как отдельно, так и в составе какого-нибудь комплекса, например, Adobe Acrobat 3D, как у меня.

Создание книг PDF возможен двумя способами: профессиональным и любительским. Профессиональный способ выполняется в одной из программ верстки. Любительский способ выполняется в виде виртуальной печати и является наиболее простым. Поэтому мы будем рассматривать именно этот способ создания книг PDF. Виртуальную печать можно выполнить из любого текстового редактора: виртуальный принтер находится в списке принтеров. А вот тут есть особенности: опыт показывает, что виртуальная печать в программе Microsoft Word выполняется на порядок быстрее, чем, например, в программе OpenOffice.org Writer или LibreOffice Writer. Поэтому всю предварительную работу по подготовке текстового файла мы будем выполнять именно в Microsoft Word (на примере версии 2003). По умолчанию мы будем исходить из того, что книга создается для 6-дюймового ридера.

Многие спрашивают, а какую программу лучше устанавливать: OpenOffice.org Writer или LibreOffice Writer. Они обе примерно одного качества, также обе склонны к падению, но если OpenOffice.org Writer только открывает файлы в формате DOCX, то LibreOffice Writer не только открывает, но и сохраняет в этом формате. Ранние версии (до 3.4, то есть до Apache) программы OpenOffice.org Writer могли также экспортировать в формат XHTML, что многими программами является основой для создания файлов EPUB.

Откройте исходный текст в программе Microsoft Word. Выделите весь текст, выполнив комбинацию клавиш Ctrl+A. Откройте список шрифтов и выберите один из шрифтов типа Type 1. Я для этого использую шрифт с засечками AcademyC (для профессиональной верстки я обычно использую шрифт BalticaC для обычного текста и шрифты PragmaticaC и JornalC для заголовков разных уровней, примечаний, табличных и подрисуночных подписей). Для любительского варианта книги я обычно выбираю 11 размер шрифта. Если есть желание форматировать заголовки, например, названия глав, то для этого обычно используются рубленые шрифты (например, PragmaticaC). Размер заголовков я выбираю обычно 12, полужирный. Для заголовков, разумеется, необходимо использовать стили заголовков (в 2003 версии список стилей находится перед списком шрифтов, а полный список стилей открывается кнопкой , находящейся перед списком стилей).

Маленькое лирическое отступление. Здесь есть одна особенность: шрифты типа Type 1 в версиях Word 2007-2010 в списке шрифтов не выводятся. Поэтому можно предложить 2 способа выбора шрифтов типа Type 1:

1) Использовать программы OpenOffice.org или LibreOffice, которые такие шрифты поддерживают;

2) Сохранить файл DOC или DOCX в формат RTF и в программе WordPad выбрать шрифты типа Type 1, а затем снова открыть этот файл в Word.

Казалось бы, здесь несостыковка: я только что говорил, что Word 2007-2010 не поддерживает шрифты типа Type 1 и не выводит их в списке шрифтов, а теперь снова после форматирования открыть в Word 2007-2010. На самом деле никакого противоречия здесь нет: Word 2007-2010 всего лишь не предлагает шрифты типа Type 1 в списке шрифтов для новых текстов, но если текст форматирован шрифтами типа Type 1, то имя этого шрифта выводится в списке шрифтов, но только для форматированных фрагментов текста (в нашем случае весь текст форматирован такими шрифтами). Например, если бы в документе один абзац был форматирован шрифтом AcademyC (Type 1), а другой — шрифтом Time New Roman (OpenType), то при выделении первого абзаца в списке шрифтов был бы выведен шрифт AcademyC, а при попытке форматировать второй абзац шрифтом AcademyC его бы просто не было бы в списке шрифтов. Пользователь также может использовать шрифты типа OpenType (теоретически никаких ошибок быть не должно, но практически я никогда такие шрифты для PDF не использовал). Конец маленькому лирическому отступлению.

Если текст не выделен, то снова выделите его (Ctrl+A). Выполните команду ФорматАбзац. Определите параметры так, как показано на рисунках (Рис. 1 и Рис. 2). В поле На установлен абзацный отступ 2 мм. Если Вы считаете, что размер абзацного отступа нужен другой, то установите свой размер. Обычно оптимальный абзацный отступ не превышает 5 мм.

 Окно Абзац. Вкладка Отступы и интервалы

Рис. 1. Окно Абзац. Вкладка Отступы и интервалы

На вкладке Положение на странице разрешаются висячие строки. По умолчанию в Word висячие строки запрещены. Что такое висячие строки? Например, в абзаце 3 строки. Из них 2 строки остаются на предыдущей странице, а 1 строка переходит на следующую страницу. Если висячие строки запрещены, то все 3 строки перейдут на следующую страницу, а на предыдущей странице в нижней части будет пустое место. На большой странице это не очень заметно, а на маленькой странице будет очень заметно. Поэтому мы и разрешаем висяки.

 Окно Абзац. Вкладка Положение на странице

Рис. 2. Окно Абзац. Вкладка Положение на странице

Нажмите на кнопку ОК. Текст по-прежнему остается выделенным. Выполните команду ФорматШрифт и в окне Шрифт перейдите на вкладку Интервал. Установите параметры так, как показано на рисунке (Рис. 3). Не обращайте внимания на поле Образец, в котором может находиться другой текст.

 Окно Шрифт. Вкладка Интервал

Рис. 3. Окно Шрифт. Вкладка Интервал

Если в документе есть колонтитулы, то откройте один из них двойным щелчком по тексту в колонтитуле и удалите текст в обоих колонтитулах. Двойным щелчком по основному тексту вернитесь в обычный режим просмотра документа.

Для следующей команды безразлично, выделен текст или нет. Выполните команду ФайлПараметры страницы. На вкладке Поля я выбираю следующие размеры полей: для верхнего и нижнего 0,2, а для правого и левого 0,1 см. Убедитесь, что выбрана книжная ориентация страницы. На вкладке Размер бумаги установите ширину 8 см, а высоту 11 см. На вкладке Источник бумаги установите значения От края до верхнего (и нижнего) колонтитула 0. Нажмите на кнопку ОК. После этого может открыться окно примерно следующего вида (Рис. 4). Если бы мы готовили печать на бумагу, то нужно было бы нажать на кнопку Исправить. Так как мы готовим документ для виртуальной печати, то нажмите на кнопку Пропустить.

 Нажмите на кнопку Пропустить

Рис. 4. Нажмите на кнопку Пропустить

Размер страниц получил заданные значения. Убедитесь, что нижнее и верхнее поля действительно равны заданному значению. Если Вы удаляли текст из колонтитулов, то этого, скорее всего не будет. Убедитесь, что у Вас на панели инструментов нажата кнопка Непечатаемые символы (), иначе в колонтитулах ничего не будет видно. Двойным щелчком снова войдите в один из колонтитулов: выберите тот же шрифт, что и для основного текста. Размер шрифта выберите меньше размера основного текста: если в нашем примере размер шрифта 11, то выберите, например, размер 5 или 6. Для этого выделите значение текущего шрифта, установите нужный размер, нажмите на клавишу Enter. Так же измените параметры шрифта в другом колонтитуле, если нужно.

Второе лирическое отступление. В списке размеров шрифтов предлагаются готовые шаблонные размеры шрифтов. Но мы только что использовали такие размеры шрифтов, которых в списке размеров шрифтов не было и наши размеры шрифта были приняты. Пользователь может сам задавать свои собственные размеры шрифтов с точностью до 0,5 пункта, например, можно задать размер шрифта 13,5 пунктов, которого в списке размеров шрифтов нет. Диапазон размеров шрифтов в Word находится в диапазоне от 1 до 1638 пунктов. Конец второму лирическому отступлению.

Так как размеры страниц небольшие, то могут встретиться длинные слова, которые без переносов по слогам будут смотреться некрасиво, к тому же увеличивая число страниц документа. Поэтому выполните команду СервисЯзыкРасстановка переносов. В открывшемся окне Расстановка переносов установите флажок в опции Автоматическая расстановка переносов и нажмите на кнопку ОК.

Убедитесь, что основной текст выровнен по ширине.

Если в книге есть рисунки, то измените их размеры так, чтобы они не выходили за пределы страниц. Так как находить картинки в документе вручную трудно, то выполните комбинацию клавиш Ctrl+G. В списке Объект перехода выберите значение Рисунок (Рис. 5). Для поиска очередного рисунка нажимайте на кнопку Далее.

 Поиск рисунков

Рис. 5. Поиск рисунков

Самым оптимальным вариантом было бы обработать документ в программе OpenOffice или LibreOffice с помощью дополнения OOoFBTools (команда Text Corrector). Тем не менее, и у этой команды имеются некоторые недостатки по профессиональному редактированию текста (например, не удаляет разрывы разделов), а при использовании новейшей версии OpenOffice 3.4.1, выпущенной уже под знаком корпорации Apache, к тому не удаляются мягкие переносы (приходится удалять их через стандартную команду Заменить), а кавычки-елочки устанавливаются не русские (направленные друг на друга), а немецкие (направленные в одну сторону). Поэтому обработку текста можно выполнить и в программе Word. Для этого ничего выделять не нужно. Выполните комбинацию клавиш Ctrl+H. Нажмите на кнопку Больше, чтобы окно приняло следующий вид (Рис. 6). Убедитесь, что курсор мигает в поле Найти. Нажмите на кнопку Специальный и по очереди выберите значения: Разрыв раздела, Разрыв страницы, Разрыв колонки, Мягкий перенос. Нажимайте каждый раз на кнопку Заменить все.

Следующие замены парные (сначала указываю, что вводить в поле Найти, затем в скобках в поле Заменить на), в паре все вводится строго в заданной последовательности, каждая пара замен независима от другой пары:

пробел знак абзаца (знак абзаца)

знак абзаца знак абзаца (знак абзаца)

неразрывный пробел (пробел)

неразрывный дефис (дефис)

разрыв строки (знак абзаца)

пробел пробел (пробел)

Кнопка Заменить на нажимается до тех пор (для первого, второго и последнего вариантов), пока число замен не станет равным 0.

Редактирование специальных символов 

Рис. 6. Редактирование специальных символов

Иногда номер страницы указывается прямо в тексте. Для удаления номера в поле Найти установите следующие специальные символы:

знак абзаца любая цифра любая цифра любая цифра знак абзаца

В поле Заменить на ничего не указывается. В данном примере подразумевается, что номер страницы состоит из 3 цифр. Если в строке с номером страницы имеются другие символы, то их так же нужно указать, например, символ пробела после номера, если он есть и т. д. Если номер страницы в тексте состоит из двух цифр, то набор символов, скорее всего, будет такой:

знак абзаца любая цифра любая цифра знак абзаца

Если строки абзаца разорваны, то без программы OpenOffice или LibreOffice (дополнение OOoFBTools) не обойтись. Если кто-то знает другие средства объединения разорванных строк в абзаце, то выложите этот технологический процесс на форуме.

После форматирования текста сохраните все изменения и можно приступать к виртуальной печати. Для этого выполните команду ФайлПечать. В списке принтеров выбирается имя виртуального принтера. В моем примере это Adobe PDF (Рис. 7), хотя в этом же списке находится другой виртуальный принтер: FreePDF.

Выбор виртуального принтера 

Рис. 7. Выбор виртуального принтера

Нажмите на кнопку Свойства, иначе, независимо от заданных размеров страницы (в нашем примере это 8 на 11 см) размер страницы все равно будет формата А4. Перейдите на вкладку Adobe PDF Settings (Параметры PDF) (Рис. 8). Нажмите на кнопку Add (Добавить).

 Выбор параметров страницы виртуальной печати

Рис. 8. Выбор параметров страницы виртуальной печати

После этого открывается окно Add Custom Paper Size (Добавить заказной размер страницы) (Рис. 9). На панели Unit (Единицы) выберите единицу измерения, в которой будут указываться параметры виртуальной страницы при печати. В полях Width (Ширина) и Height (Высота) указываются размеры страницы. В поле Paper Names (Имена бумаги) вводится имя заказного размера. Имя может быть любое и на любом языке. Нажмите на кнопку Add/Modify (Добавить/Изменить). Создавать заказной размер нужно всего один раз. При следующих сеансах печати в окне (Рис. 8) нужно всего лишь открыть список Adobe PDF Page Size (Размер бумаги PDF) и выбрать имя размера бумаги, в нашем случае Заказной.

Определение параметров страницы 

Рис. 9. Определение параметров страницы

После этого нажимайте на кнопки ОК, укажите имя выходного файла и папку расположения. После завершения виртуальной печати автоматически открывается программа, принятая по умолчанию для чтения файлов в формате PDF.

Объединение файлов PDF с помощью программы Adolix Split and Merge PDF 2.1

Бесплатная программа для некоммерческого использования, которую можно скачать по адресу http://www.adolix.com/split-merge-pdf.

Для выбора объединяемых файлов нажмите на кнопку в виде плюса (). Если файлы находятся в одной папке, то их можно открыть сразу, а не по одному. Если файл был открыт случайно, то его можно удалить из списка объединяемых файлов. Для этого выделите этот файл и нажмите на кнопку в виде минуса (). Последовательность исходных книг можно определить с помощью кнопок  и .

Для указания папки, в которую нужно сохранять выходной файл, нажмите на кнопку Выберите файл. По умолчанию имя выходного файла output. Переименовать файл можно и потом. После выбора исходных файлов и указания пути сохранения, нажмите на кнопку Объединить! (Рис. 10). Объединение файлов выполняется не просто быстро, а очень быстро.

 Выбор объединяемых файлов

Рис. 10. Выбор объединяемых файлов

Объединение файлов PDF с помощью программы Adobe Acrobat 3D

После установки программы Adobe Acrobat 3D в контекстном меню появляется команда Combine in Adobe Acrobat, которая предлагается только для файлов PDF.

Выделите исходные файлы. Если файлы находятся в разных папках, то их можно собрать в одну временную папку, но не обязательно. Объединяться будут только выделенные файлы PDF. Выделите все объединяемые файлы или хотя бы один. Из контекстного меню выполните команду Combine in Adobe Acrobat. После этого загружается программа Adobe Acrobat 3D с открытым окном, в котором перечислены выбранные файлы (Рис. 11). Если в список объединяемых файлов нужно добавить другие, например, из других папок, то нажмите на кнопку Browse (Обзор) и выберите нужные файлы. Если файл был добавлен в список случайно, то выберите его в списке Files to Combine (Файлы для объединения) и нажмите на кнопку Remove (Очистить). Если файлы находятся в списке не в нужной последовательности, то выделите его в списке и нажимайте на кнопки Move Up (Вверх) или Move Down (Вниз). Нажмите на кнопку ОК.

Список объединяемых файлов 

Рис. 11. Список объединяемых файлов

После этого выполняется анализ: возможно ли объединение файлов. Например, зашифрованные файлы или файлы с защитой объединить нельзя. После этого открывается окно, в котором необходимо указать папку, в которой нужно сохранить объединенный файл и имя этого объединенного файла. Нажмите на кнопку Сохранить. После этого объединенный файл загружается в программу Adobe Acrobat 3D.