DjVu | это... Что такое DjVu? (original) (raw)

Эта статья — о технологии компьютерного сжатия изображений. О психологическом феномене см. дежавю; о других значениях термина см. дежавю (значения).

DjVu

DjVu-logo.svg
Расширение .djvu, .djv
MIME image/vnd.djvu, image/x-djvu
Разработан AT&T Research
Опубликован 1998
Последний выпуск 27[1] / июль 2006
Тип формата графические форматы
Открытый формат? да
Сайт djvu.org

DjVu (от фр. déjà vu — «уже виденное») — технология сжатия изображений с потерями, разработанная специально для хранения сканированных документов — книг, журналов, рукописей и прочее, где обилие формул, схем, рисунков и рукописных символов делает чрезвычайно трудоёмким их полноценное распознавание. Также является эффективным решением, если необходимо передать все нюансы оформления, например, исторических документов, где важное значение имеет не только содержание, но и цвет и фактура бумаги; дефекты пергамента: трещинки, следы от складывания; исправления, кляксы, отпечатки пальцев; следы, оставленные другими предметами и т. д.

DjVu стал основой для нескольких библиотек научных книг. Он довольно популярен, и в нём делается большое количество разных документов.

Формат оптимизирован для передачи по сети таким образом, что страницу можно просматривать ещё до завершения загрузки файла. DjVu-файл может содержать текстовый (OCR) слой, что позволяет осуществлять полнотекстовый поиск по файлу. Кроме того, DjVu-файл может содержать встроенное интерактивное оглавление и активные области — ссылки, что позволяет реализовать удобную навигацию в DjVu-книгах.

Содержание

Используемые технологии

Для сжатия цветных изображений в DjVu применяется специальная технология, разделяющая исходное изображение на три слоя: передний план, задний план и чёрно-белую (однобитовую) маску. Маска сохраняется с разрешением исходного файла; именно она содержит изображение текста и прочие чёткие детали. Разрешение заднего плана, в котором остаются иллюстрации и текстура страницы, по умолчанию понижается для экономии места. Передний план содержит цветовую информацию о маске; его разрешение обычно понижается ещё сильнее. Затем задний и передний планы сжимаются с помощью вейвлет-преобразования, а маска — алгоритмом JB2.

Особенностью алгоритма JB2 является то, что он ищет на странице повторяющиеся символы и сохраняет их изображение только один раз. В многостраничных документах каждые несколько подряд идущих страниц пользуются общим «словарём» изображений.

Для сжатия большинства книг можно обойтись только двумя цветами. В этом случае используется всего один слой, что позволяет достичь рекордной степени сжатия. В типичной книге с чёрно-белыми иллюстрациями, отсканированной с разрешением 600 dpi, средний размер страницы составляет около 15 Кб, то есть приблизительно в 100 раз меньше, чем исходный файл. В присутствии сложного заднего плана выигрыш объёма составляет обычно 4—10 раз. Однако при стандартных настройках в DjVu используется сжатие данных с потерями, поэтому для особо важных документов обычно используются форматы сжатия без потерь: PNG, JPEG 2000, TIFF и т. п. В DjVu также можно использовать и сжатие данных без потерь. Так например утилита CJB2 из пакета DjVuLibre предоставляет сжатие без потерь.

В основе формата DjVu лежат несколько технологий, разработанных в AT&T Labs:

Текстовое представление изображений DjVu

Формат DjVu предусматривает наличие текстового слоя, который содержит текст со страницы. (Используется для поиска и лёгкого копирования текста при работе с ним). В случае, если текстовый слой недоступен, единственный метод получения текста — выполнение оптического распознавания в сторонних программах.

Лицензионная информация

AT&T продали технологию компании LizardTech, которая пыталась использовать её в своих коммерческих интересах, но благодаря открытости формата[2] для создания и просмотра документов DjVu существует свободное программное обеспечение, доступное для различных платформ. 1 июля 2008 года LizardTech передал менеджмент DjVu родительской компании Celartem[3], а 10 июня 2009 года Celartem передал права на технологию DjVu компании Caminova[4].

Существует открытая публикуемая под лицензией GNU GPL библиотека DjVuLibre и программы-кодировщики и просмотрщики на ней.

Программы для работы с DjVu

Просмотр

Для Windows:

Для Linux:

Для Android:

Для iOS:

Для BlackBerry_OS:

Редактирование

См. также

Примечания

  1. DjVu File Format Versions. Разработчики DjVu (июль 2006). Проверено 16 января 2010.
  2. Лицензия
  3. Пресс-релиз LizardTech
  4. Пресс-релиз LizardTech

Ссылки

commons: DjVu на Викискладе?
Просмотр этого шаблона Медиаконтейнеры
Видео/аудио 3GPASFAVIBink • DMF • DPX • EVO • FLVMatroska (MKV) • WebM • MPEG-PS • MPEG-TSMP4MXF • NUT • OggOgg MediaQuickTimeRealMediaSmackerRIFFVOBсравнениесжатие
Аудио AIFFAPE • AU • DSDDXDMLPMP3FLAC • SHN (англ.) WAVWMAсравнениесжатие
Графические форматы (сжатие)
Растровые Без потерь: BMPFPXGIFICOILBMJBIGPCXPNGPNMPSDRAWTGAWBMPXCFВключая сжатие с потерями: EXRICERJBIG2JPEG / JP2 / JPEG-LSJPEG XR (HD Photo) • PGF (англ.) • TIFFWebPАнимационные: APNGGIFMNG
Векторные AICDREMFEPSPSSVGWMFXPSАнимационные: SVGSWF3D: 3DSVRMLX3D
Комплексные CGMDjVuPDF
Просмотр этого шаблона Электронные книги (устройства и документы)
Устройства Amazon KindleNookECTACO jetBookFR bookLBookM-Book MiniMAGIC E701Onext Touch&ReadOnyx BooxPAGEonePocketBook ReaderREB 1100Rocket eBookSony ReaderАзбукасписок…
Форматы файлов DjVuDOCePubFBODFPDFTXT
Каталогизаторы All My BooksCalibreMyHomeLibMyRuLib
Библиотеки Бесплатные: FictionBook.ruАльдебаранАрхив ИнтернетаБиблиотека МошковаВикитекаПроект «Гутенберг»Флибуста Платные: Amazon.comBarnes & NobleGoogle BooksOzon.ruЛибрусекЛитРес
См. также Электронная бумага