Формат DjVu.

Вы скачали файл и удивление .Файл имет расширение  DjVu.Что такое дежа вю? Нет, это не только психологическое состояние, когда вам кажется, что вы что-то подобное уже видели, или были в подобной ситуации. Это так же формат файлов DjVu – графический формат, который используется преимущественно для сохранения и сжатия отсканированных книг, содержащих цветные изображения и текст. В последние несколько лет в Интернете произошел бум, когда везде стали появляться книги и журналы в этом необычном формате, открывались целые библиотеки. Что же это за формат? В чем его преимущества или недостатки, например, перед форматом PDF? И как просматривать такие файлы? Обо всем этом вам расскажет данная статья.

Что такое DjVu

12 лет назад компания AT&T Labs впервые объявила о создании нового формата графических изображений, который получил название DjVu. Первоначальной целью его создания было ведение электронного документооборота. Несмотря на то, что уже существовал формат PDF, он не устраивал прежде всего размерами готовых файлов. Компаниям для ведения внутреннего документооборота был необходим формат, который бы имел небольшой размер и при этом очень хорошее качество, особенно хорошую читаемость текста и мог передавать все детали документа (его текстуру, потертости, повреждения и т.д.).
Однако постепенно новый формат стал проникать в интернет, где постепенно стал занимать свою нишу, отодвигая в сторону гиганта PDF. Для пользователей интернета с небольшим каналом, лимитированным трафиком – это был идеальный вариант.
Что же представляет собой Дежа Вю? Это способ сжатия графических изображений с потерей данных, который поддерживает многостраничность документов. Его особенность заключается в том, что изображение перед сжатием разбивается на два или три слоя, отдельно текст и картинки. Затем эти слои проходят первоначальное сжатие, картинки сжимаются больше, так как потеря их качества не сильно влияет на конечный результат, текст практически не сжимается для обеспечения максимального качества. Далее полученный результат пережимается с использованием новых кодеков – IW44 и JB2. В кодеке IW44 используются вейлветы (волны), благодаря чему он обеспечивает соотношение размер/качество в два и более раз лучше, чем формат JPEG, используемый в PDF.

В итоге обычная полноцветная страница с текстом с разрешением 300 точек на дюйм (dpi) в среднем имеет размер 50 кб, что позволяет использовать документы в формате DjVu во внутреннем документообороте компаний и в Интернете.

Отдельно о тексте в документах DjVu. Данный формат поддерживает возможность добавления слоя с распознанным текстом (OCR). Несмотря на определенные трудности и затраты труда на его создание, а также тот факт, что наличие этого слоя увеличивает размер файла, он несет в себе дополнительные удобства для пользователей. Так, при наличии OCR слоя текст можно выделять, копировать и вставлять в текстовый редактор, можно экспортировать текст в отдельный файл. При этом текст не имеет форматирования, то есть при вставке его, например, в Word, вы получите кусок неоднородного текста, часто с различными лишними элементами (различные значки, нечитаемые символы). Также при наличии распознанного текста есть возможность поиска по тексту документа.

Подведем небольшой итог, подсчитаем достоинства и недостатки формата DjVu и посмотрим, что у нас получится.

Плюсы:

  • главный плюс – это, безусловно, небольшой размер;
  • при небольшом размере файла сохраняется хорошее качество изображений и особенно текста;
  • обрабатывается только видимое изображение, что снижает нагрузку на потребление ресурсов компьютера, что особо актуально для файлов большого размера и для владельцев слабых машин;
  • возможность использования формата для отображения литературы и документов, содержащих формулы, диаграммы, таблицы, а также исторических документов, с сохранением фактуры отсканированного документа;
  • текст остается четким даже при сильном увеличении.

Минусы:

  • DjVu – это сжатие изображения с потерями. То есть часть информации неизбежно теряется. В основном, это касается картинок.

DjVu сейчас

Изначально этот формат имел открытый код, благодаря чему существует огромное количество бесплатного программного обеспечения для работы с ним. Но в 2000 году компания AT&T Labs передала права на формат компании LizardTech, которая продолжила путь по продвижению и развитию DjVu, при этом уже опираясь на коммерческие рельсы, предлагая свои продукты за деньги.

В 2005 году используя технологию DjVu, в электронный вид было переведено более 4000 выпусков журнала The New Yorker за 80 лет его существования. Они уместились на 8 DVD дисках.

В последнее время DjVu распространяется по Интернету очень быстрыми темпами. В первую очередь за счет выигрышного размера файла. Но при этом многие пользователи еще не научились в достаточной мере работать с этим типом сжатия. Как следствие – DjVu в большинстве случаев значительно проигрывает PDF.
Серьезным препятствием на пути развития DjVu является и тот факт, что PDF уже на протяжении многих лет используют в различных сферах, и этот формат стал эталоном документооборота. Различные руководства пользователей, документы распространяются в формате PDF. Тем не менее, новая технология прогрессирует и постепенно завоевывает свое место на рынке и в сердцах пользователей Интернета.
Поставщик программных решений для хранения, просмотра и распространения мультимедийных материалов, а также материнская компания, отделением которой является компания LizardTech, анонсировала создание нового центра по продажам и управлению DjVu, который разместился в Сиэтле, штат Вашингтон (США). Соответственно теперь в Интернете поддержка формата осуществляется не с сайта компании LizardTech (http://www.lizardtech.com), а с сайта Celartem Technology Inc. ).

Известный мировой проект создания недорогого компьютера для детей Африки – «One Laptop per Child» – так же избрал для использования формат DjVu, который оптимально отвечает требованиям концепции проекта своими небольшими размерами.

Возможности работы с форматом DjVu

Что же мы можем делать, работая с документом в формате DjVu? Конечно, все зависит от конкретно выбранной программы, но есть какие-то общие особенности.
При работе с форматом DjVu можно:

  • увеличивать/уменьшать страницы, выставлять по ширине/высоте страницы. Их можно переворачивать, размешать по две или четыре на экране, перелистывать или прокручивать, используя скроллинг;
  • работать с текстом, если файл содержит слой с распознанным текстом (OCR). В этом случае текст можно выделять, копировать и вставлять в текстовом редакторе, также в этом случае можно пользоваться поиском по тексту документа;
  • выделять отдельные части страницы и копировать в буфер;
  • документ или отдельные страницы выводить на печать;
  • делать закладки, использовать гиперссылки, что приводит к хорошей навигации по книге;
  • просматривать страницу в разных режимах (цветной, черно-белый, задний план, передний план).Иногда (для лучшего отображения текста)нужно переходить с цветного режима в черно-белый. Текст при этом становится более четким и ярким, но не отображаются цветные картинки.

[note]P.P.S. Если у Вас есть вопросы, желание прокомментировать или поделиться опытом, напишите, пожалуйста, в комментариях ниже.[/note]

4 комментария

  1. Александр

    ваша ссылка не работает,сервис пишет что файл не найден.и ещё не всегда на разных сервисах проверяется наличие русского языка,даже в тех программах где в названии указан русский язык. а как у вас?

    • Ссылку заменил можете скачивать,программа действительно на русском .Сам установил и работаю с ней.

Оставить комментарий

Ваш email нигде не будет показанОбязательные для заполнения поля помечены *

*