01.01. Форматы файлов

Категория: Создание элек. книг
Опубликовано 06.11.2011 16:40
Автор: Шитов В.Н.
Просмотров: 18557

Основные форматы файлов

Формат ABW — файловый формат, используемый AbiWord. Сжатый файл имеет формат ZABW.

Формат ACCDB— база данных программы Access из комплекта Microsoft Office 2007-2010.

Формат ACSM — используется для обеспечения технологии DRM в книгах AdobePDF и EPUB.

Формат AEH — файловый формат, используемый программой eBooks Writer.

Формат AFM (Adobe Font Metric) является текстовым файлом с информацией о метриках и парах кернинга (для работы со шрифтами).

Формат AI (Adobe Illustrator) — формат приложения Adobe Illustrator.

Формат ANI — хранит всякую графическую «мелочевку»: курсоры, указатели мыши в ОС Windows и т. д.

Формат ANNOT— ссылка на книгу в форматах PDF или EPUB в программе Adobe Digital Editions. Находятся в папке C:\Users\Имя_Пользователя\Documents\My Digital Editions\Annotations.

Формат ARJ — один из первых наиболее популярных архивов. Просматривать архивы можно с помощью любой специализированной программы–архиватора (WinZIP, WinRAR, IZArc, 7-ZIP), а создавать — с помощью архиватора WinARJ или старого DOS–архиватора arj.exe. С помощью этого архиватора можно было создавать многотомные архивы, сохраняемые сразу на несколько дискет. Отдельные части архива имели расширения: arj, a00, а01 и т. д. Считается морально устаревшим, так как на дискеты уже почти никто информацию не записывает.

Формат ASF (Active Streaming Format) — потоковый формат аудио и видео, хранящейся в сети Интернет. Формат позволяет воспроизводить информацию сразу после поступления на ПК. Воспроизводить поток можно с помощью проигрывателя Windows Media Player, включенного в состав Windows.

Формат ASP — динамические веб-страницы. Динамические страницы создаются в результате запроса пользователя к хранящимся в Интернете базам данных.

Формат AVI — один из самых распространенных видео форматов.

Формат AZW — проприетарный формат электронной книги корпорации Amazon. Очень близким к этому формату является формат MOBI, но без защиты DRM.

Формат AZW1 — проприетарный формат электронной книги корпорации Amazon.

Формат BAK — копии различных файлов. Например, CorelDRAW создает их постоянно. Копии создаются на тот случай, если основной файл разрушится. Некоторые программы используют свои проприетарные форматы для хранения копий. Любая программа очистки считает их файловым мусором и предлагает удалить. Можно оставить лишь копии настроек — большинство программ очистки выводят список «приговоренных» файлов и предлагают оставить те из них, которые пометит пользователь.

Формат BAT — морально устаревший формат, оставшийся от MS-DOS. Практически не применяется, кроме важного autoexec.bat, входящего в ОС Windows и установленного на диске C в корневой папке (файл системный, поэтому увидеть его можно, например, с помощью файловых менеджеров). Если обнаружите такой файл на флеш-дисках, то, скорее всего, это вредоносный объект. Открыть можно с помощью Блокнота (файл autoexec.bat не открывайте и, тем более, не вносите туда изменений).

Формат BBeB— проприетарный формат корпорации Sony. Тем не менее, такого формата в виде расширения Вы не найдете: так часто называется формат LRF. Но в Интернете эта аббревиатура (BBeB) часто используется.

Формат BIN — бинарный или двоичный файл. Двоичные файлы можно создавать даже в текстовых редакторах. Файл BIN считается образом и такой файл можно открыть с помощью практически любой программы для чтения образов. Некоторые современные архиваторы (IZArc) также могут открывать такие образы как архив.

Формат BMP (Windows Bitmap) является графическим форматом Microsoft. Он используется для программы Microsoft Paint (входящей в пакет Windows). Этот формат применяется во многих приложениях, но с практической точки зрения он малоприменим, а в Adobe Photoshop он вообще практически непригоден для профессиональной работы. К тому же он занимает слишком много дисковой памяти в отличие от других форматов.

Формат BON— ссылки на книги книжной полки в программе BookSeer.

Формат BR5 (DAZ Bryce 5.5) — формат приложения DAZ Bryce 5.5 (объемные ландшафтные изображения фотографического качества).

Формат BSF (Book Source File) — переходный формат для создания файлов CHM.

Формат C — файл языка C.

Формат CAB — архив под именем Cabinet, используемый Windows. Обычно применяется для установки программ. Открыть и просмотреть архив можно с помощью любого современного архиватора (IZArc).

Формат CBR или CBZ — формат комиксов, то есть книги с множеством изображений и минимумом текста. Создает сжатый контейнер для изображений примерно точно так же, как изображение сжимает архиватор. Последняя буква в расширении показывает уровень компрессии.

Формат CDR — формат приложения CorelDRAW. Данный формат, как правило, обладает особенностью: более поздние версии данного приложения могут читать изображения, созданные в более ранних версиях. Но изображения, созданные в более поздних версиях этого приложения, не могут читаться в более ранних версиях. Позволяет создавать многостраничные изображения и даже верстать. Некоторые программы могут читать файлы CDR, но, как правило, только первую страницу такого файла.

Формат CFG — файл конфигурации, хранящий в себе настройки различных программ. Представляет собой простейший текстовый файл и может быть открыт с помощью Блокнота. Вносить изменения может только опытный пользователь.

Формат CHK — восстановленные фрагменты файлов, создаваемые при проверке диска. Считается файловым мусором и такие файлы можно без сожаления удалить.

Формат CHM — компилированный, то есть сжатый гипертекстовый файл. Представляет собой компрессированный или сжатый файл на основе веб-страниц. Позволяет объединить множество веб-страниц в один файл с оглавлением. Очень удобен для объединения мелких веб-страниц в один файл. Часто используется в виде файла справки. Пришел на замену морально устаревшему формату HLP.

Формат CIF— образ диска, создаваемый программой Easy CD Creator.

Формат COM — исполняемый программный файл небольшого размера. Считается морально устаревшим. Наличие таких файлов на флеш-диске подозрительно, это, скорее всего, вредоносные объекты.

Формат CPH (Corel Print House File) — формат приложения Corel Print House 6.

Формат CPP — файл языка C++.

Формат CSS (Cascade Style Sheet) — каскадные стилевые таблицы. Являются составной частью языка HTML. Предназначены для разработки, в первую очередь, дизайна веб-страницы. Созданные стили можно сохранять в отдельном файле и импортировать в веб-документ. Стили можно создавать и в самом HTML-документе, а затем просто копировать их через буферную память в другие HTML-документы.

Формат CUE — файл оглавления.

Формат DAT — многофункциональный формат. Часто используется для хранения видео в формате VideoCD. Может использоваться как база данных, а также может использоваться для хранения различных настроек.

Формат DataPlkr— открытый формат Plucker для просмотра веб–документов на устройствах Palm. Корректно отображает рисунки, гиперссылки, разные шрифты.

Формат DBF — базы данных. Открывать файл можно с помощью программ для работы с БД: Microsoft OfficeAccess.

Формат DBOOK — формат программы Display Reader. Текст сжимает на уровне формата FB2. Графика не поддерживается.

Формат DIZ — текстовое описание какой–либо программы или документа. Просматривать такие файлы можно с помощью Блокнота. При скачивании электронных книг с некоторых сайтов в архив часто входят и такие файлы. Так как они все имеют одинаковые имена, то при распаковке архивов выводится предупреждение о конфликте имен — без сожаления удаляйте или заменяйте файлы с расширением DIZ, так как ничего ценного в них нет.

Формат DjVu (дежа-вю от фран. déjà vu— виденное ранее) — формат компании Lizardtech. Технология сжатия изображений, разработанную специально для распространения сканированных документов — книг, прежде всего математических, технических, журналов, имеющих большое число графики, особенно мелкой, а также множество отдельных символов. Файл DjVu может содержать текстовый слой, позволяющий осуществлять полнотекстовый поиск по файлу. Файл DjVu может создавать оглавление и активные области — ссылки, подсветки, что позволяет реализовывать удобную навигацию в книгах DjVu.

Формат DLL — динамические библиотеки, выполняющие определенные стандартные функции. В файлах DLL могут храниться иконки программ, некоторые компоненты для программирования, например, на языке VBA и т. д. Часто DLL, как и формат DAT, представляет собой коробку с сюрпризом — пока не откроешь, не узнаешь, что внутри. Большинство библиотек могут использоваться несколькими программами. Многие пиратские игры не открываются, например, так как нет соответствующих DLL, а скопировать их на установочный диск пираты догадаться не могут.

Формат DOC — проприетарный формат корпорации Microsoft. Файлы могут содержать текст, а также параметры его форматирования, таблицы, графику. Формат DOC понимают многие офлайн текстовые редакторы (Microsoft Word, OpenOffice.org Writer, AbiWord), а также онлайн редакторы, например, редактор на сервисе ZOHO.COM. (Офлайн — установленные на ПК, в том числе вариант Portable; онлайн — интерактивно в Интернете).

Формат DOCX — формат, используемый начиная с версии Microsoft Word 2007 и выше. В предыдущих версиях Word для поддержки этого формата нужно установить дополнительные драйверы. Программа OpenOffice.org Writer понимает этот формат, но большие файлы может открывать долго (ну очень, очень долго). Имеются сведения, что большие файлы в формате DOCX могут открываться программой OpenOffice.org Writer некорректно, но лично мы с этим не сталкивались. Онлайн-сервисы (ZOHO.COM) позволяют работать с таким форматом: читать, редактировать и сохранять. Программа LibreOffice.org Writer может как открывать, так и сохранять файлы в формате DOCX.

Формат DOT — шаблон документа Microsoft Office. С программой поставляется значительное число шаблонов для разных документов: от пустого документа до резюме, диссертаций, писем, факсов и т. д. В шаблоне уже готовы некоторые настройки: шрифт и его параметры, стили, размеры страницы, полей и т. д.

Формат DRV — драйверы для различных технических устройств: монитора, клавиатуры, мыши, дисководов, сканеров, принтеров и т. д. Считается морально устаревшим.

Формат DWG — стандартный формат файла приложения AutoCAD 2011. В этом формате можно сохранять векторные объекты. Многие приложения (в основном векторные, например, CorelDRAW) могут импортировать этот формат. В приложении AutoCAD можно создавать таблицы очень хорошего качества (о чертежах мы уже не говорим), а затем импортировать их в векторные приложения. Правила создания таблиц похожи на правила в Microsoft Word или Excel.

Формат DXF — файл рисунка приложения AutoCAD 2011 в текстовом или двоичном формате.

Формат EBA — проприетарный формат электронных книг. Используется в технических устройствах китайского производства.

Формат EBAML — проприетарный формат электронных книг. Используется в технических устройствах китайского производства.

Формат EBO— ссылка на книгу в формате LIT, открывавшуюся в программе Microsoft Reader. Находятся в папке C:\Users\Имя_Пользователя\Documents\My Library\Annotations.

Формат EML — файл почтового сообщения при сохранении на магнитный носитель.

Формат EPS с высокой точностью описывает элементы изображения на основе стандарта Encapsulated PostScript фирмы Adobe Systems Incorporated. Формат позволяет сохранять в одном файле сразу несколько слоев: текст, а также растровую и/или векторную графику. Файлы с таким форматом могут читать практически все, хотя бы сколько-нибудь, профессиональные графические программы. Часто используется в профессиональных издательских системах. Не все приложения одинаково корректно работают с данным популярным форматом. Поэтому необходимо точно знать, как работает с данным форматом конкретное приложение.

Формат EPUB— открытый формат, основанный на технологиях XHTML и XML. Очень капризный формат. Корпорация Adobe создает защиту DRM для этого формата. В электронную книгу встраиваются используемые шрифты, точно так же, как и в PDF. В последнее время становится одним из самых популярных, так как занимает намного меньше дискового пространства, чем FB2 без ухудшения качества книги.

Формат ER.PDB — формат для ридера Palme Reader.

Формат EXE — исполняемый командный файл. Для чтения электронных книг в этом формате не нужно никаких специальных программ. Электронная книга может содержать текст, рисунки, анимацию, гиперссылки, поиск, апплеты и скрипты. Книгу EXE можно защитить паролем как целиком, так и отдельные страницы, запретить печать, копирование. Это позволяет использовать именно этот формат при коммерческом распространении книг. Книги EXE воспроизводятся только в ОС Windows. Ридеры такие электронные книги не воспроизводят, что ограничивает область применения этого формата.

Формат ExeBook — разработан Яковом Судейкиным для создания электронных книг в формате EXE. Предназначен для создания коммерческих изданий. Имеет надежную защиту от копирования. Считается самым перспективным для коммерческого использования, но обнаружены и недостатки.

Формат FB2 — открытый формат FictionBook, основанный на языке XML. В настоящее время это наиболее популярный формат электронных книг, воспроизводимый на многих технических устройствах. Поддерживается графика и несложные таблицы. Используются стили. Файл FB2 имеет значительно меньший размер, чем DOC и уж тем более RTF, но значительно больший размер, чем форматы EPUB или MOBI. Формат FB2 может использоваться не только для чтения, но и как промежуточный формат для конвертирования в другие форматы.

Формат FBD — это формат хранения описаний книг.

Формат FBR — защищенный формат данных, доступных для чтения программой Franklin Reader.

Формат FH? — формат приложения Macromedia FreeHand, создающего векторные изображения. Вместо символа (?) подставляется номер версии данной программы.

Формат FON — растровый шрифт. Считается морально устаревшим, но в ОС Windows даже последних версий входит в обязательный набор шрифтов для чтения документов, оставшихся от прошлых лет, в которых могли использоваться растровые шрифты.

Формат FUB — формат электронной книги Франклин.

Формат GID — служебные файлы, создаваемые при чтении файла справки. Хранят разделы, открываемые пользователем и другую навигационную информацию. Программы для очистки ПК от файлового мусора удаляют такие файлы. С этим можно согласиться, так как, прочитав раздел справки, пользователь вряд ли будет читать этот раздел снова.

Формат GIF (Graphics Interchange Format) был разработан в качестве средства сжатия файлов. Работает не более чем с 256 цветами. Поэтому этот формат не рекомендуется использовать для передачи цветных фотографий. Так как этот формат занимает не очень большой объем дисковой памяти, его можно использовать для передачи изображений в серых тонах. Может использоваться для несложной мультипликации.

Формат GPF — формат публикации Ganaxa.

Формат GPX — защищенный документ Ganaxa.

Формат H — файл языков C и C++.

Формат HA — архив. Использовался всего несколько лет назад. Хотя считается морально устаревшим, но прекрасно сжимает текст, то есть при работе с электронными книгами может пережить второе рождение. Некоторые программы для чтения позволяют читать книги непосредственно из этого архива (Display Reader). В формате HA созданы библиотеки книг, которые достаточно распространены на различных носителях (в основном CD или DVD), а это значит, что их нужно как то открывать. Многие архиваторы открывают такие архивы (IZArc). Для чтения архивов в некоторых программах нужно использовать родную программу HA.exe.

Формат HLP— морально устаревший файл справки. Использовался до ОС Vista. По умолчанию, начиная с ОС Vista, уже не поддерживается, то есть не открывается. Вместо формата HLP используется формат CHM. И тот и другой файл справки вызывается нажатием клавиши F1 на клавиатуре ПК.

Формат HTML (Hyper Text Markup Language) (или HTM) — язык разметки гипертекстовых веб-страниц. Большинство веб–страниц созданы с помощью формата HTML. Веб-страницы могут содержать гиперссылки на другие веб-страницы или объекты, например, графику. Формат HTM является просто вариантом HTML: раньше расширение файла не могло быть более 3 символов. Сейчас расширение HTM применяется теми, кому лень писать букву «L» в расширении файла. Открывается не только любыми браузерами, но и любыми текстовыми редакторами (щелчок правой клавишей мыши. Раздел Открыть с помощью и выберите программу, с помощью которой нужно открыть этот файл).

Формат HTXT — зашифрованный файл TXT. Ранее формат назывался MTXT.

Формат ICO — файл иконок, то есть миниатюр. В таких файлах может храниться всякая мелкая графика: иконки программ, указатели мыши, изображения кнопок и т. д. В основном речь идет о заказных или пользовательских миниатюрах — в ОС Windows и профессиональных программах обычно такие мелкие изображения хранятся в файлах DLL.

Формат IMG — образ диска, создаваемый программой CloneCD. Открывается с помощью программ, работающих с образами дисков или профессиональными архиваторами (например, IZArc).

Формат IMP — как и формат DAT имеет множество назначений: от электронной книги до аудио файла. В данной книге мы говорим только о создании электронных книг. Аналог DjVu и WOLF: также речь идет о фотографиях страниц в книгах. Только формат DjVu создает книгу на основе сканированных страниц, а формат IMP переводит страницы готовой электронной книги в фотографии. В формате IMP можно распространять сложные технические книги, а также книги на национальных языках, если техническое устройство не поддерживает кодовые страницы данных языков. Имеются сведения, что несколько лет назад в данном формате было выпущено множество дисков CD и DVD с электронными книгами.

Формат INF — вспомогательный файл, содержащий информацию о параметрах установки какой–либо программы или оборудования. Формат INF используется также некоторыми программами для идентификации файла шрифта. В таких файлах содержатся сведения об установке файла.

Формат INI — морально устаревший файл инициализации, хранящий настройки той или иной программы. Файлы можно просматривать и изменять с помощью Блокнота.

Формат iSilo (Palm Os Platform/pdbPalm Pilot Database format) — формат Palm для ридера ISilo, расширение называется PDB. Предназначен в первую очередь для технических устройств Palm. Обеспечивает высокий уровень компрессии текста.

Формат ISO — самый распространенный файл образа диска. Под диском обычно понимается диск CD или DVD. Образ диска считается обычным архивом и многие современные архиваторы (IZArc) позволяют открывать такие файлы. Во многих наших учебниках подробно изложена работа с этим популярным образом: от создания и копирования на диски CD или DVD, до чтения и восстановления сбойных дисков.

Формат ISU — установочные файлы программ, содержащие список устанавливаемых файлов данной программы. Этот список будет необходим для корректного удаления программы. Удалять файлы такого формата не рекомендуется.

Формат JPEG (Joint Photographic Experts Group) широко используется для передачи сложной растровой графики и фотографий. При сохранении графики в этом формате занимается очень мало дисковой памяти, так как это компрессионный формат, то есть сжимаемый или архивируемый. Это метод сжатия с потерей некоторых данных о цвете. Распаковка jpg–файла происходит автоматически во время его открытия. Потеря данных происходит следующим образом: при чтении файла изображение распаковывается, а при закрытии обратно упаковывается. Отдельные пиксели на изображении при этом усредняются. Не следует понимать потерю данных о цвете как быстрое обесцвечивание изображения — это происходит очень медленно и незаметно для человеческого глаза, но со временем такие потери будут заметны.

Формат JS — скрипт, написанный на языке JavaScript. Большинство скриптов совершенно безопасно. Тем не менее, многие браузеры предоставляют возможность отключать исполнение скриптов ввиду их потенциальной опасности — некоторые скрипты созданы для нанесения вреда ПК и информации на нем. Если исполнение скриптов на веб-странице обязательно, то такие страницы даже не будут запускаться. Скрипты, написанные на языке JavaScript, открываются на любом браузере, если только это не специально запрещено. Скрипты, написанные на других языках (Vision BasicScript, PerlScript, TCL и т. д.), обычно корректно запускаются только в браузере Internet Explorer. С помощью скриптов можно, например, отфильтровать и отбросить пустые сообщения.

Формат KML — формат электронной книги HieBook.

Формат LIT — проприетарный формат корпорации Microsoft для программы Microsoft Reader (сейчас формат воспроизводят и другие программы). Формат разрешает создание закладок, аннотаций, выполнять масштабирование. Уровень компрессии текста — 50–60%.

Формат LNK — ярлык на программу или документ. Ярлыки на программы обычно расположены на Рабочем столе. Ярлыки отличаются от значков ОС Windows стрелочкой в нижнем левом углу иконки программы. Программы очистки (Perfect Utilities, например) не удаляют ярлыки программ, но предлагают удалить ярлыки на открываемые ранее документы. Это позволяет обеспечить конфиденциальность пользователя: никто не узнает, что он читал и уж тем более что он посещал. При посещении сайтов создаются так называемые куки, которые позволяют идентифицировать пользователя как постоянного клиента, а вот это часто и нежелательно.

Формат LOG — логический файл или файл отчета, в котором записывается последовательность работы той или иной программы, а главное — сообщения об ошибках этой программы, которые потом можно будет прочитать и устранить эти ошибки. Файл LOG можно открыть с помощью Блокнота. Такие файлы считаются файловым мусором и при сканировании дисков программами-чистильщиками такие файлы предлагается удалить. Удалять такие файлы можно совершенно безболезненно, даже те, которые пользователями не прочитаны, так как неопытные пользователи все равно ничего там не поймут.

Формат LRS — зашифрованный вариант формата LRF.

Формат LRX— зашифрованный подвид формата *.LRF.

Формат M3U — плейлист, то есть список воспроизведения аудио файлов в формате MР3.

Формат MDB — база данных программы Access из комплекта Microsoft Office 1997-2003.

Формат MID — файл аудио. Стандартный MIDI-файл (SMF — Standard MIDI File) — это специально разработанный формат файлов, предназначенный для хранения данных, записываемых и/или исполняемых секвенсором, секвенсор может быть как программой для компьютера, так и аппаратно выполненным модулем (материал из Википедии).

Формат MMM (Multiple Master Metrics) является эквивалентом файла AFM. Файл *.PSS (PostScriptPrinterStub) в этом случае эквивалентен файлу *.PFB. Может использоваться при работе со шрифтами.

Формат MOBI — используется для устройств MobiPocket, смартфонов или КПК. Очень похож на проприетарный формат AZW и в большинстве случаев может без проблем читаться на устройствах, предназначенных для этого формата. При создании электронных книг MOBI нужно внимательно выбирать кодировку: обычно предлагается кодовая страница 1252, замените ее на 1251. В противном случае книга может не открыться на девайсах. На ПК книга с неправильной кодировкой может открыться или в нечитаемых символах (после Calibre) или открыться с русскими буквами (после fb2mobi.exe).

Формат MOD — аудио файл. Файл MOD состоит из трех частей: заголовка, паттернов (партитур музыкального произведения) и сэмплов (инструментов). Песня — это модуль без сэмплов. Длина заголовка может быть 600 или 1084 байта, в зависимости от числа сэмплов. Число сэмплов в файле MOD может быть 15 или 31. Файлы MOD могут быть 2-х видов: в модулях с 15 сэмплами заголовок имеет длину 600 байтов, а в модулях с 31 сэмплом — 1084 байта.

Формат MOV — видео для Apple QuickTime. Программа Apple QuickTime считается потенциально опасной, так как содержит множество дыр в своей защите, через которые можно нанести вред ПК и информации на нем (не нужно путать потенциально опасные программы с вредоносными. Антивирус Kaspersky Internet Security Pro 2011 (или CRYSTAL), например, считает потенциально опасными даже некоторые операции программы OpenOffice.org).

Формат MPEG (MPG) — файл видео, сжатый по алгоритму MPEG–1.

Формат MSI — популярный установочный образ программы. Неизвестную программу желательно запускать на виртуальной машине (например, Sunx VM VirtualBox) или изолированном безопасном рабочем столе (Kaspersky Internet Security Pro 2011).

Формат MР3 (MPEGILayerIII) — компрессированный или сжатый аудио файл. В результате компрессии исходный размер аудио файла сжимается в 5–10 раз с минимальной потерей качества. Предыдущий аналогичный формат назывался MР2.

Формат NP — формат газеты News Paper Direct для своего продукта Press Display при скачивании на магнитный носитель.

Формат NRG — образ диска, созданный программой Nero.

Формат ODF (Open Document Format) — общее название открытого формата файлов документов. Разработан корпорацией OASIS на основе формата XML специально для программного комплекса OpenOffice.org.

Формат ODT — открытый стандарт текстового документа, используемый в OpenOffice.org Writer, LibreOffice и многих других свободных текстовых редакторах.

Формат OEB — открытый формат, основанный на технологиях XHTML и XML. Представляет собой архив графических файлов и файла с информацией о документе в целом. Встречается редко, но предлагаются идеи сделать этот формат популярным. Формат используется в EBookwise–1150, MobiPocket и Microsoft Reader.

Формат OPF— файл проекта программы MobipocketCreator.

Формат OSIS — специализированный формат XML для Библии и других библейских текстов.

Формат OTF — шрифты OpenType.

Формат P65 — файлы, сверстанные в программе Adobe PageMaker. Последние 2 цифры — номер версии и подверсии программы (Adobe PageMaker 6.5).

Формат PalmDOC— популярный формат для устройств Palm для iSilo.PDB. В качестве расширения используется аббревиатура PDB. Его воспринимает большинство программ для чтения электронных книг. При этом степень сжатия ниже, чем у iSilo.PDB, графика не поддерживается, поэтому похож на формат TXT.

Формат PAS — исходные тексты программ, написанные на языке Pascal.

Формат PCPIMAGE (Corel Paint Shop Pro) — формат приложения Corel Paint Shop Pro.

Формат PCT (PICT) — является собственным (проприетарным) графическим форматом системы Macintosh. Этот многослойный формат основан на языке QuickDraw, с помощью которого система выводит изображения на экран. Формат PICT — один из немногих форматов, которые обрабатывают как векторные, так и растровые изображения. Этот формат поддерживает любую цветовую глубину, размер и разрешение.

Формат PCX был создан и применялся ранее для графического редактора PC Paintbrush. В дальнейшем некоторые другие графические редакторы использовали этот формат для собственных изображений. Например, графический редактор PaintShopPro использует этот формат в качестве одного из основных. Этот формат имеет некоторые ограничения в передаче цвета, не поддерживает многоканальной организации изображений. В основном применяется для изображений в монохромной графике, градациях серого цвета. Но, тем не менее, это один из самых популярных в мире форматов. Например, все фотографии для своих книг мы создаем именно с помощью этого формата.

Формат PDF (Portable Document Format) — формат AdobeReader, одного из международных стандартов передачи информации. Может устанавливать защиту, но не очень надежную. Существует ряд программ (Advanced PDF Password Recovery Pro) и онлайн-сервисов (http://itpride.net/useful/kak-snyat-zashhitu-s-pdf-fajla.html), предлагающих взлом таких файлов, если пользователь забыл к файлу пароль.

Формат PFM (Printer Font Metrics) и PFB (Printer Font Binary) — шрифты Type 1.

Формат PHP — веб-страницы, написанные на языке программирования РНР. Используется для работы с серверными сценариями.

Формат PIF — морально устаревший файл, использовавшийся в MS-DOS. В файле записывались сведения о ходе работы программ.

Формат PKG — используется на AppleNewton.

Формат PLS — плейлист для аудио файлов.

Формат PNG (CompuServePNG) позволяет сохранять изображения с 16 миллионами цветов без сжатия для использования в Web. Этот формат похож на *.gif, но сохраняет файл меньшего размера (примерно на 25%). Три байта используются для сохранения информации о цветах R, G, В, а четвертый байт — для сохранения информации о самом изображении.

Формат PNPd— формат, используемый программой eReader. Имеет расширение PML.

Формат PPF — формат приложения CorelPhotobook 10.

Формат PRC — Palm–формат. Поддерживается программой MobiPocket. Электронная книга для устройств Palm.

Формат PS (PostScript) файл на языке PostScript фирмы Adobe Systems Incorporated. Может открываться в Adobe Reader, который преобразовывает такой формат в PDF. Много таких файлов осталось от периода (примерно лет 15 назад), когда файлы PDF создавались в 2 этапа: сначала PS, а потом PDF — не хватало памяти ПК для создания PDF в один этап.

Формат PSD — формат Adobe Photoshop. Он поддерживает все виды графики и большинство цветовых моделей, многоканальность передачи цвета, и пользовательские альфа–каналы.

Формат QT — кросс-платформенный формат, записанный в формате Apple QuickTime. Предназначен для воспроизведения в ОС Windows и Macintosh.

Формат QXD — файлы, сверстанные в программе QuarkXPress.

Формат RA — потоковое аудио и видео в сети Интернет. Воспроизведение выполняется программой RealPlayer, редактирование программой Real Producer.

Формат RAR — архив. Формат читается практически всеми существующими архиваторами.

Формат RB — разработан для чтения электронных книг на ридерах Rockete Book и REB 1100 Rocket Book.

Формат REG — дополнительные записи для добавления в системный реестр. Часто используются пиратами для регистрации чего-либо в реестре. Для добавления записей из файла необходимо выполнить по нему двойной щелчок.

Формат RIF формат приложения Corel Painter 12. Этот формат очень близок к формату *.PSD (Adobe Photoshop), но имеются и некоторые ограничения: при открытии изображений в приложении Corel Painter 12, ранее сохраненных в формате *.PSD, игнорируется такое понятие, как стиль заливки, который позволяет создавать в Adobe Photoshop очень красивые изображения, как правило, с объемным эффектом. Стили располагаются на слоях. Эти слои отражаются в CorelPainter как плоские без стиля заливки. Кроме этого игнорируются и разрушаются макетные группы.

Формат RMI — аудио файл.

Формат RTF (Rich Text Format) — формат обогащенного текста, текстовый формат, используемый в программе WordPad. Во многих ридерах формат RTF может читаться неправильно (или вообще не читаться) из-за ошибок в кодировке. Кроме того, файлы RTF занимают неприлично много дисковой памяти. Формат может использоваться как промежуточный при конвертировании данных из одного формата в другой или при передачи данных в другую операционную систему, например, из ОС Windows в Apple Macintosh. Небогатые возможности форматирования могут привести к потере функциональности.

Формат SCR — скринсейверы или хранители экрана, то есть анимированные заставки, которые выводятся на монитор при заданном времени простоя ПК.

Формат SGF — внутренний формат программы Sigil. Может использоваться как промежуточный формат для создания файла EPUB.

Формат SMF (Single Master Font) похож на файл MMM, но может изменять только один из стилей шрифта, например, из прямого стиля может создавать жирный или курсивный.

Формат STK — проприетарный формат STAR eBook.

Формат SVGt (Scalable Vector Graphics Tiny) — формат приложения Adobe Illustrator для вывода информации на мобильные устройства.

Формат SWP — файл свопинга или файл подкачки, в который во время работы сбрасываются данные из ОЗУ при ее переполнении. Виртуальная память — комбинация памяти ОЗУ и временного хранилища на жестком диске. Когда оперативной памяти не хватает, то данные из оперативной памяти помещаются в специальное хранилище под названием файл подкачки. Размеры файла могут занимать гигабайты.

Формат SYS — системный файл. Может содержать любую информацию: от драйверов и картинок до целых программ.

Формат TCR — книга для EPOC.

Формат TeBR (Tiny Ebook Reader) — используется для Fictionwise.

Формат TGA (TARGA) поддерживается многими графическими программами и программами верстки. Для передачи цветного изображения TGA использует дополнительные альфа–каналы. В TGA кроме трех стандартных каналов имеется информационный альфа–канал, что увеличивает качество изображение в формате TGA по сравнению с другими форматами.

Формат TIFF (Tagged Image File Format) — один из самых универсальных форматов. Он применяется для создания графических приложений. Он имеет многоканальную систему передачи цвета и многослойную систему передачи информации и сохраняет все параметры растрового изображения. При сохранении изображения в этом формате существенно уменьшается размер файла без потери его качества.

Формат TMP — временные или рабочие файлы. Создаются автоматически при открытии и редактировании любых файлов. После корректного завершения работы такие файлы удаляются автоматически. При некорректном завершении работы (отключении электроэнергии, жесткой перезагрузке ПК) такие файлы остаются на магнитном носителе. В этом случае их нужно удалить, чтобы они не «забивали» диск. Самый оптимальный способ их удаления — использовать программы очистки. Временные и рабочие файлы создаются в нескольких папках: в папке, в которой находится исходный открытый файл, а также в папке TEMP. Папка TEMP создается в разных ОС в разных местах. Мы обычно удаляем такие «мусорные» файлы вручную перед завершением сеанса работы ПК: файловый менеджер уже заранее открыт для папки TEMP и для папки с исходными файлами.

Формат TOC — оглавление книги в формате CHM.

Формат TPZ — используется в устройствах Amazon.

Формат TR? — файл для Tom Reader. Используется для создания справочников, словарей, энциклопедий. Вместо символа ? подставляется номер версии, например, TR3. Отличается высоким уровнем сжатия. Данный формат можно использовать при создании каталогов электронных книг.

Формат TTC — коллекции шрифтов TrueType. В одном файле может быть несколько шрифтов сразу.

Формат TTF — шрифты TrueType.

Формат TXT — текстовый файл без форматирования. Открывается программой Блокнот. Часто используется для создания веб-страниц. Формат TXT используется многими электронными библиотеками для изготовления электронных книг (Библиотека Мошкова, в том числе). Так как данный формат не поддерживает форматирования, то приходится форматировать самому или читать так «как есть».

Формат URL — ссылки на веб-страницы.

Формат VBK — электронная книга для Vital Source, поддерживает графику.

Формат VBS — скрипт, написанный на языке Visual BasicScript.

Формат VXD — драйвер устройств или резидентных модулей программ.

Формат WAB — адресная книга ОС Windows и Outlook Express.

Формат WAV — аудио файл.

Формат WBK — временные файлы для программы Microsoft Word. При очередном запуске программы из таких файлов предлагается восстановить информацию до сбоя. В OpenOffice.org Writer существует аналогичная система для восстановления файлов после сбоя.

Формат WMA — аудио файлы, использующие компрессию или сжатие с использованием алгоритмов корпорации Microsoft.

Формат WMF (Windows MetaFile) — векторные рисунки в составе Microsoft Office. Может воспроизводиться большинством графических программ и вьюеров (программ для просмотра изображений).

Формат WOLF — очень похож на формат DjVu: основан на сканированных изображениях, может иметь распознанный текстовый слой. Расширение называется WOL.

Формат WPD — тестовый документ, созданный в программе Corel WordPerfect, аналоге программ Microsoft Office и OpenOffice.org Writer.

Формат WRI — текстовый документ, созданный в программе Write, входящей в ранние версии ОС Windows.

Формат XEB — формат, используемый в электронных книгах китайского производства.

Формат XHTML — специализированная версия HTML в соответствии с правилами XML. Это стандартный формат для электронных книг EPUB. XHTML. Различие между HTML и XHTML заключается в том, что в XHTML применяется синтаксис XML. Файл XHTML можно сохранять в программе OpenOffice.org Writer.

Формат XLS — электронные таблицы Microsoft Excel. Формат понимается всеми электронными таблицами (Microsoft Excel, OpenOffice.org Calc, Corel WordPerfect, GNumeric). Онлайн-редакторы также понимают этот формат (например, сервис на ZOHO.COM).

Формат XML — гипертекстовый документ, написанный на языке XML.

Формат XPS (XML Paper Specification) — новый кросс-платформенный стандарт для языков разметки. Встраивает используемые шрифты, запрещает редактирование файла. Начиная с ОС Windows Vista входит в число виртуальных принтеров. Может открываться на любом ПК точно в том виде, как документ задуман автором.

Формат ZIP — архив. Открывается любыми архиваторами, так как считается «де факто» международным стандартом архива. Архив можно защитить паролем, но как показал опыт, это не очень хорошо помогает от взлома. Хорошей программой взлома является программа Advanced Archive Password Recovery.

Формат ZnO — проприетарный формат для электронных журналов Zinio. Журнал включает мультимедийные объекты, видео, графику.

Формат ZTXT— проприетарный формат, похожий на PalmDOC, но с большим уровнем компрессии (до 45%). Предоставляет возможность вставки в книгу закладок, поддерживает гиперссылки. Применяется в Weasel Reader для PalmOS. Имеет расширение PDB.

В настоящее время разрабатываются следующие новые форматы электронных книг:

Формат XMDF следующего поколения обеспечивает удобный просмотр цифрового контента, включая видео и аудио файлы, и автоматическую адаптацию макета в соответствии со стандартами издательств. Формат XMDF позволяет пользователям просматривать один и тот же контент с различных пользовательских терминалов, включая смартфоны, ПК и телевизоры. Кроме того, этот формат способствует рационализации производства электронных книг для издательских домов. Создаваемая платформа позволит усовершенствовать технологию пользовательского интерфейса и, тем самым, способствовать развитию рынка цифровых изданий (на основе информации http://www.ichip.ru).

На смену популярному формату FB2 идет формат FB3. Формат FB3 разрабатывается для удовлетворения возросших требований к форматированию текста книг и возможностям их каталогизации. Современное состояние стандартов и технологий позволяет, помимо простого расширения набора тегов, привести формат к совместимости с наиболее удачными и перспективными наработками. В частности, в основу FB3 положен стандарт OpenPackagingConvention. Помимо этого в качестве картинок можно использовать SVG-файлы (и GIF-файлы, патент на которые закончился). Файл FB3 будет представлять собой стандартный ZIP-архив, допустимые методы сжатия — STORE (без компрессии) и DEFLATE (совместимый с ZLIB). В качестве графических форматов будет поддерживаться GIF/PNG/JPG/SVG (на основе информации русского раздела Википедии).

Примечание: проприета́рное программное обеспечение (англ. proprietary software; от proprietary— частное, патентованное, в составе собственности и software— программное обеспечение) — программное обеспечение, являющееся частной собственностью авторов или правообладателей и не удовлетворяющее критериям свободного ПО (наличия открытого программного кода недостаточно). Правообладатель проприетарного ПО сохраняет за собой монополию на его использование, копирование и модификацию, полностью или в существенных моментах. Обычно проприетарным называют любое несвободное ПО, включая полусвободное. Рассматриваемое понятие не связано с понятием коммерческого программного обеспечения (материал из Википедии).

Примечание: защита DRM (Digital rights management) затрудняет создание копий защищаемых произведений (распространяемых в электронной форме), либо позволяет отследить создание таких копий. Используя технологию DRM производитель может дистанционно удалить информацию с устройств пользователей при наличии нарушений. Такие прецеденты уже были: по сообщению Lenta.ru (20 июля 2009) магазин Amazon удаленно стер книги Дж. Оруэлла с Kindle (на основе материалов из Википедии). Удаление может быть выполнено в том случае, если эти файлы доступны при выходе в Интернет, например, на жестком диске ПК. Поэтому выходом может быть хранение данных на носителях, отключаемых перед выходом в Интернет, например, переносном винчестере.

Сравнение форматов FB2, EPUB, MOBI

Самый простой способ создания электронных книг — создать их в формате FB2. Форматы EPUB и MOBI более капризные и создать их для неопытного пользователя — целое искусство. Тем не менее, практика использования этих трех основных форматов электронных книг показывает, что созданные книги FB2 НЕОБХОДИМО конвертировать в форматы EPUB или MOBI. Конечно, если техническое устройство не позволяет читать такие форматы, то использовать нужно формат FB2, который сейчас является самым популярным. Последние форматы (EPUB и MOBI) позволяют создавать файлы меньшего размера, чем файлы FB2. Разница достигает от 1,5 до 2,5-3 раз. Качество книг при этом нисколько не ухудшается. Это позволяет разместить на карте памяти электронных книг в формате EPUB или MOBI намного больше, чем в формате FB2.

Экономия возникает только на файлах большого размера — от 250 КБ и выше. Чем больше размер исходного файла FB2, тем больше уровень сжатия. Что касается файлов небольшого размера, то при конвертировании их в форматы EPUBили MOBI размеры конечных файлов могут быть даже больше исходных файлов FB2.

Мы создаем файлы FB2 с помощью дополнения OOoFB2 Tools, встроенного в приложение OpenOffice.org Writer. Конвертор в файлы EPUB — EPUBGEN 0.5. Конверторы в файлы MOBIFB2MOBI 2.0.2 или Calibre E-book management.

Авторские права на произведения

При скачивании электронных книг из Интернета нужно помнить об авторских правах, охраняемых законом. Обещание бесплатности скачивания или возможности чтения электронных книг на самом деле может оказаться обманчивым. В каждой стране существуют разные сроки действия авторских прав. В России авторские права действуют 50 лет после смерти автора. Если автор участвовал в Великой Отечественной войне, то срок авторских прав продлевается еще на 20 лет. После этого книга становится всеобщим достоянием и ее можно скачивать беспрепятственно. Например, А. П. Гайдар погиб в октябре 1941 года. Значит, в октябре 2011 года его произведения стали всеобщим достоянием.

К сожалению, закон слишком несовершенен: читатель может быть обвинен, даже не имея корыстного умысла. При выходе в Интернет происходит регистрация пользователя и с этого момента все его шаги в Интернете могут быть отслежены по его IP, если только он не использует анонимайзеры. Подробное описание работы с анонимайзерами см. Шитов В. Н., Шитова Е. В., Уланов О. А. Новейший самоучитель работы в Интернете. М.: Дом Славянской книги, 2010.