Хлебные крошки



02.15. Создание файлов DjVu. DjVu Solo 3.1

Назначение формата DjVu

Бесплатная программа для создания и чтения файлов в формате DjVu. Скачать программу можно по адресу http://www.lizardtech.com.

Формат DjVu появился довольно давно, но популярность получил в последнее время. Формат был создан компанией AT&T и продан компании LizardTech, создавшей несколько программ для работы с этим форматом. Программа DjVu Solo была первой пробной программой для создания файлов в формате DjVu, после чего компания LizardTech создала коммерческую программу Document Express, профессиональная шестая версия которой вышла не так давно. Программа DjVuSolo 3.1 в данный момент дальше не развивается. Многие связывают медленное распространение формата DjVu с тем, что за программу Document Express Pro 6 сейчас запрашивают просто немыслимые деньги. Вместе с тем, программа DjVu Solo 3.1 позволяет создавать файлы в формате DjVu, хотя и не понимает русские тексты, то есть не распознает текст и не выделяет его в отдельный слой, трактуя его как элементы изображения. Но это не имеет большого значения.

Итак, что же представляет собой формат DjVu и для чего он нужен.

Представьте себе следующий пример: у Вас имеется редкая техническая книга, и Вы хотите перевести ее в цифровой вид, проще говоря, отсканировать ее. Со сканированием никаких проблем не возникает. А вот дальше могут возникнуть трудности. Что представляют собой сканированные файлы? Это самые обычные изображения, как правило, в формате JPG. Что представляет собой любая техническая книга: текст, рисунки, формулы. Про таблицы говорить не будем, так как они ближе всего находятся к тексту. Для распознавания текста предназначены программы ABBYY FineReader 10.0, ABBYY ScanToOffice 2.0, CuneiForm 12 Master и многие другие. Рисунки эти программы также распознать могут и импортировать в текстовый документ. А вот здесь имеются несколько «но». Во-первых, текст распознается, но импортируется в текстовый документ он обычно в виде не того шрифта, которым он набран в документе, а который выбран для импорта. Если в книге много шрифтов, то они могут потерять свои исходные параметры. Во-вторых, многие символы все-таки распознаются с большими ошибками или вообще не распознаются. В основном это относится к греческому шрифту, верхним и нижним индексам и т. д. А ведь мы в самом начале предупредили, что мы собираемся переводить в цифровой вид техническую книгу, то есть книгу, обычно нашпигованную разными формулами. Ну и, в-третьих, с декоративным оформлением книги, скорее всего, также придется распроститься при распознавании текста. Все это придется восстанавливать в текстовом документе уже после распознавания вручную, то есть долго. Для этого Вам нужно иметь на ПК точно такие же шрифты, терять свое время и в результате все-таки не получить того стиля оформления, который был в книге.

То есть, мы убедились, что распознавание сложного технического документа ведет, скорее всего, к тупику. Какие бы мощные программы распознавания сейчас не были, они все-таки имеют ограничения.

Итак, мы снова вернулись к исходным сканированным файлам, которые хранятся в виде изображений. Другой путь — создать книгу из этих изображений. Но изображения занимают огромный объем на диске. Хранить книгу в 800 страниц по 2 страницы в одном файле — 400 файлов. Если каждый файл будет занимать примерно 200 КБ, то общий объем будет примерно 80 МБ.

Формат DjVu как раз и позволяет обойти все недостатки и распознавания текста, и создания книги из изображений. Этот формат занимает промежуточное положение между распознаванием текста и хранением изображений. Сканированные страницы хранятся в виде изображений, но занимают объемы примерно в 10 раз меньше, чем самые экономные графические форматы. Для примера: мы сканировали книгу на развороте (2 страницы). В формате JPG объем файла занимал примерно 200 КБ. При преобразовании этого изображения в формат DjVu объем становился более чем в 10 раз меньше: от 16 до 21 КБ. При этом качество страниц не ухудшалось. Страницы будут выглядеть так, как они выглядели на сканированной странице, то есть с тенями на изгибе. Кроме того, программа DjVu Solo 3.1 позволяет компоновать книгу по страницам. То есть книга становится единым целым и не нужно вспоминать, какие страницы хранятся в каком файле.

Примечание: кстати о тенях на развороте страниц. Исследования последних лет показали, что человеку легче читать электронные книги, имитирующие реальную книгу.

Программа DjVu Solo 3.1 разбивает изображение на три слоя: передний план, фон и черно-белую маску. В маске сохраняется в первую очередь текст. Делается это следующим образом: символы одинакового шрифта сортируются, и запоминается всего один каждый символ, а на месте всех других этих же символов запоминаются адреса их расположения на странице книги. Тем самым памяти нужно намного меньше, чем для сохранения всего текста. Если в тексте используются несколько шрифтов, то запоминание выполняется по каждому шрифту отдельно. На фоне сохраняются иллюстрации, текстура бумаги. Поэтому те символы, которые не распознаются как символы, запоминаются на фоне. Объем многостраничной книги во много раз меньше, чем сумма объемов отдельных страниц, если бы они хранились по отдельным страницам. Этот эффект достигается за счет хранения только одной коллекции символов каждого шрифта.

Все слои находятся друг над другом и визуально при просмотре страницы книги невозможно различить их друг от друга.

Ну, если мы Вас убедили в том, что этот формат Вам жизненно нужен, и с ним Вы станете большим специалистом, то вперед, к знаниям.

Получение первой страницы книги

После запуска программы открывается рабочее окно программы (Рис. 156).

Рабочее окно программы DjVu Solo 3.1 

Рис. 156. Рабочее окно программы DjVu Solo 3.1

Рабочее окно открывается пустое, так как изображения страниц еще нужно получить. Вы можете получить исходные изображения не обязательно с помощью этой программы, но сканировать их в любой программе, которая позволяет выполнять сканирование. Если сканирование было выполнено предварительно, то Вы должны нажать на кнопку Open (Открыть) () и выбрать стартовый графический файл. Программа DjVu Solo 3.1 понимает несколько популярных графических форматов: JPG, GIF, TIFF, BMP, PICT, PNM.

Если Вы хотите сканировать исходные страницы из программы DjVu Solo 3.1, то нажмите на кнопку Scan (Сканировать) (). После этого запускается стандартная программа для сканирования, то есть, в DjVu Solo 3.1 встроенного драйвера для сканера нет. После завершения сканирования изображение загружается в рабочее окно программы DjVuSolo 3.1. Обращаю Ваше внимание, что загружается изображение, которое еще предстоит преобразовать в формат DjVu.

Примечание: если у Вас к ПК подключено несколько сканеров, то выполните команду File → Select Source (Файл Выбрать источник) и выберите один из сканеров.

Для преобразования полученного (или открытого) изображения в формат DjVu нужно выполнить команду File Encode As DjVu (Файл Преобразовать в DjVu). Сохраните полученный файл.

Получение следующих страниц книги

Для сканирования следующего изображения снова нажмите на кнопку Scan (Сканировать) (). Каждое сканированное изображение помещается в отдельном окне. Поэтому после каждого сканирования, нужно полученные изображения преобразовать в формат DjVu, сохранять и окно с таким изображением после сохранения закрывать. Как только Вы попытаетесь сохранить полученное изображение, то программа предложит преобразовать это изображение в формат DjVu при сохранении. То есть у Вас должна оставаться открытой книга с преобразованными в DjVu страницами. Для продолжения книги выполните одну из команд раздела меню Edit (Правка):

  • Append Page(s) — вставить страницы в конец книги. При этом безразлично, какая страница выделена в окне предварительного просмотра;
  • Insert Page(s) Before — вставить страницы перед выбранной страницей на панели предварительного просмотра;
  • Insert Page(s) After — вставить страницы после выбранной страницы на панели предварительного просмотра.

Примечание: панель предварительного просмотра находится в левой части рабочего окна. Страницы представлены в виде пиктограмм. Для отключения или повторного включения панели предварительного просмотра выполните команду Thumbnails Show Thumbnails (Пиктограммы Показать пиктограммы). Панель со страничками видна в том случае, если в команде Show Thumbnails установлен флажок. Для изменения границ между панелью предварительного просмотра и открытой страницей, поместите мышь на разделяющую эти панели вертикальную линию так, чтобы появилась двунаправленная стрелка. Нажмите на мышь и, не отпуская ее, перетащите влево или право.

После выполнения любой из этих команд открывается окно Открыть, в котором нужно выбрать один или несколько файлов в формате DjVu и нажать на кнопку Открыть. После включения отдельных страниц в книгу исходные файлы DjVu становятся не нужны и их можно удалить. Если к книге подключаются сразу несколько страниц, то исходные файлы для них выделяются с помощью клавиши Ctrl: выбрать первый файл, затем нажать на клавишу Ctrl и, не отпуская ее, по очереди пощелкать по всем открываемым файлам. Отпустите клавишу Ctrl.

Если некоторые страницы были включены в набор ошибочно, то их можно удалить из книги. Выделите такие страницы в перечне страниц и щелкните по ним правой клавишей мыши. Из появившегося контекстного меню выполните команду Delete Page(s).

Навигация по страницам книги

Для перемещения по страницам книги можно использовать кнопки инструментальной панели или команды раздела меню Navigate (Навигация). В разделе меню предоставляется весь перечень команд по навигации (в скобках указаны комбинации клавиш) (кнопка на инструментальной панели):

  • Next Page (Ctrl + N) () — перейти на следующую страницу;
  • Previous Page (Ctrl + R) () — вернуться на одну страницу назад;
  • +10 Page () — перейти на 10 страниц вперед;
  • –10 Page () — 10 страниц назад;
  • First Page (Ctrl + F) () — перейти к первой странице книги;
  • Last Page (Ctrl + L) () — перейти к последней странице книги;
  • Go to Page (Ctrl + G) — перейти на указанную страницу. После выполнения команды открывается окно, в котором нужно указать номер страницы, на которую нужно перейти. В нашем примере страницы расположены на развороте, то есть по 2. По этому чтобы перейти на страницу 500 (в реальной бумажной книге), нужно перейти на страницу 250 электронной книги.

Режимы просмотра страниц книги

Для просмотра страниц по слоям на инструментальной панели и в разделе меню View Display (Вид Дисплей) предлагаются следующие режимы:

  • Color Mode () — видны все слои. Этот режим предлагается по умолчанию;
  • Black & White Mode () — на страницах отображаются только черный и белый слои;
  • Foreground Mode () — отображается только слой переднего плана;
  • Background Mode () — отображается только слой заднего плана.

Если некоторых слоев нет, то на странице этот слой будет выглядеть как пустой. Например, в режиме Color Mode видны тени на развороте страниц. Если они Вам не нужны, то включите режим Black & White Mode и тень на развороте не будет видна.

Чтение книги или просмотр слайд-шоу

Перед чтением книги щелкните по области страницы (в правой части рабочего окна). Если Вы этого не сделаете, то команда для чтения книги может быть недоступной. После этого выполняется команда Slide Show Begin slideshow (Слайд-шоу Начать слайд-шоу) или нажмите на клавишу F2 на клавиатуре ПК. Просмотр страниц книги выполняется во весь экран монитора. Листание страниц выполняется щелчками мыши. После пролистывания последней страницы книги программа возвращается в рабочее окно программы. Для принудительного возвращения в рабочее окно программы нажмите на клавишу Esc на клавиатуре ПК. Просмотр страниц книги выполняется в том режиме, который был выбран предварительно в рабочем окне до запуска чтения. Тем не менее, режим просмотра можно изменить во время чтения книги. Для этого нужно вызвать контекстное меню страниц и установить мышь на раздел Display (Дисплей) и выбрать нужный режим чтения или масштаб страницы (Zoom (Масштаб)). В контекстном меню в режиме чтения можно также изменять масштаб просмотра.

Гиперссылки

Начнем мы не с самих гиперссылок, но тематически примыкающих к ним — это подсвеченные области. Подсвеченные области, это области, которые необходимо как-то выделить, чтобы читатель обратил на них внимание. Выделение выполняется цветом, по умолчанию желтым. Для создания подсветки предназначена кнопка Highlight Area (Область подсветки) () на инструментальной панели. Создайте на странице прямоугольную область, которой нужно выделить какой-нибудь фрагмент страницы. Создавать точно эту прямоугольную область не нужно, так как ее потом намного проще корректировать с помощью инструмента Edit mode (Режим редактирования) (). Как только Вы закончите создавать подсвеченную область, немедленно откроется окно Highlight Area Properties (Свойства области подсветки). Параметры этого окна мы рассмотрим чуть позже, а пока просто нажмите на кнопку ОК. Выберите инструмент Edit mode (Режим редактирования) (). После этого поместите указатель мыши на один из угловых или средних маркеров, находящихся по периметру подсвеченной области. После этого должна появиться двунаправленная стрелка (Рис. 157). Нажмите и потяните мышь в нужную сторону. Для удаления области подсветки щелкните по ней правой клавишей мыши и из появившегося контекстного меню выполните команду HyperLinks Delete (Гиперссылки Удалить). Для редактирования параметров области подсветки вызовите контекстное меню этой области и выполните команду HyperLinks Edit (Гиперссылки Редактировать).

 Редактирование подсвеченной области

Рис. 157. Редактирование подсвеченной области

Гиперссылки позволяют создавать в книге дополнительную информацию без увеличения размера файла, в котором хранится книга. Для создания гиперссылок предназначены три инструмента: Rectangular Hyperlink (Прямоугольная гиперссылка) (), Oval Hyperlink (Овальная гиперссылка) (), Polygon Hyperlink (Многоугольная гиперссылка) (). Прямоугольная и овальная области создаются по диагонали из одного угла в другой. Многоугольная область гиперссылки создается щелчками, показывающими углы многоугольника. Завершение создания выполняется двойным щелчком мыши. После создания гиперссылки открывается окно Hyperlink Properties (Свойства гиперссылки), параметры которого мы пока пропускаем. Нажмите на кнопку ОК.

После создания гиперссылки ее границы легко корректировать с помощью инструмента Edit mode (Режим редактирования) (). Просмотр гиперссылок можно организовать только в режиме предварительного просмотра книги. Для этого нажмите на кнопку Preview mode (Режим предварительного просмотра) (). При наведении на область гиперссылки указателя мыши всплывает подсказка (Рис. 158). Для завершения просмотра подсказки щелкните мышью, иначе подсказка так и будет находиться на экране, причем не только на той странице, на которой находится область этой гиперссылки, но и на любой странице в книге. Пока не будет выполнен щелчок мышью, то есть пока предыдущая гиперссылка не будет закрыта, могут возникнуть проблемы с просмотром следующей ссылки.

 Всплывающая подсказка

Рис. 158. Всплывающая подсказка

Настройка параметров гиперссылок и областей подсветок

После создания гиперссылок или областей подсветок открывается окно Hyperlink Properties (Свойства гиперссылки) или Highlight Area Properties (Свойства области подсветки). До сих пор мы не настраивали параметры в этих окнах, а сразу нажимали на кнопку ОК. Рассмотрим эти параметры в таблице (Таблица 4).

Таблица 4. Параметры настройки гиперссылок и областей подсветки

Опция

Назначение

Don’t Display

Спрятать границу, чтобы ее было не видно. Если опция Always Visible включена, то граница в режиме предварительного просмотра все равно видна

XOR

Линия толщиной в 1пиксель. Это самая быстрая настройка

Plain border

Линия толщиной в 1 пиксель выбранного цвета

Shadow In

Гиперссылка выглядит притопленной

Shadow Out

Гиперссылка выглядит приподнятой

Shadow Etched In

Граница выглядит притопленной

Shadow Etched Out

Граница выглядит приподнятой

Shadow Width

Определяет ширину тени при выборе вариантов Shadow In, Shadow Out, Shadow Etched In или Shadow Etched Out

Color

Появляется при выборе значения Plain Border и делает доступной кнопку Choose Color, которая нужна для выбора цвета гиперссылки или выделения границы подсветки

Always visible

Когда опция включена, то гиперссылки или подсвеченные области становятся видимыми все время. Когда опция отключена, то граница становится видимой только при перемещении указателя мыши над этими областями

Highlight Area

Включенная опция активизирует кнопку Choose Color

Choose Color

Щелкните по кнопке, чтобы открыть цветовую палитру и выбрать цвет наполнителя для гиперссылки или области подсветки

Link to

Определяет, должна ли гиперссылка указывать на другую страницу того же самого документа или на URL

Page Number или Page Name

Определяет номер страницы или имя, когда Вы создаете связь с другой страницей того же самого документа

URL

Определяет полный адрес (включая http:// префикс), когда Вы создаете связь с URL

Target

Определяет, где должна быть отображена страница, когда Вы создаете связь с URL (тот же фрейм или окно, новое окно или другое расположение)

В многострочном поле Description укажите текст подсказки, которая будет появляться при наведении на область гиперссылки или области подсветки.

Печать документа

Для печати документа в формате DjVu выполните одно из следующих действий:

Выполните команду File Print (Файл Печать) из основного меню;

  • Выполните комбинацию клавиш Ctrl + P;
  • Нажмите на кнопку Print (Печать) () на инструментальной панели рабочего окна;
  • Выполните команду Print (Печать) из контекстного меню открытой страницы (щелкните правой клавишей мыши по области открытой страницы).

После выполнения любого из этих действий открывается окно Печать (Рис. 159).

Определение параметров печати документа 

Рис. 159. Определение параметров печати документа

В списке Имя выбирается принтер. Обращаем внимание на то, что принтером может являться не только реальный принтер, но и виртуальный. Можно с помощью виртуального принтера конвертировать файл из формата DjVu в формат PDF. Например, может потребоваться конвертировать файл из формата DjVu в формат Microsoft Word. Напрямую конвертировать нельзя, а вот сначала конвертировать файл в формат PDF, а потом из формата PDF конвертировать в формат Microsoft Word, можно. Например, это можно сделать с помощью программы ABBYY Transformer 3.0.

На панели Диапазон печати укажите печатаемые страницы. Для начала печати нажмите на кнопку ОК.


Hilliger Media Shop
Template "butterflymeadowfree" designed by Hilliger Media (Copyright © 2011)