Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Формат DjVu и программы для работы с ним

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29

Открыть новую тему     Написать ответ в эту тему

73



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору


Формат DjVu и программы для работы с ним


Программы для печати (виртуальные принтеры в djvu):
Caminova DjVu Virtual Printer 6.5
Two Pilots DjVu Printer Pilot (freeware)
Распечатка в djvu под Suse Linux через Kprinter
Программы для просмотра и редактирования:
Саminova Document Express with DjVu - пакет приложений для создания и просмотра файлов в формате DjVu. Включает DjVu Plugin, DjVu Editor (Pro) и виртуальный принтер. Document Express Еnterprise - для пакетной обработки файлов.
Текущий официальный сайт: Cuminas & Старый офсайт & Бывший владелец
LizardTech DocumentExpress Enterprise 5.1.0.946
Качать по линку с японского сайта http://www.lizardtech.co.jp/download/djvu/modules/windows/enterprise/5.1/
DocumentExpressEnterprise_5.1.0.zip
(201 метр, пароль на архив: enteval). В дистрибутив входят плагин для браузера, виртуал-принтер, IFilter, GhostScript.
 
LizardTech DjVu Editor DocumentExpress Professional 5.0.0.16
Вариант максимум - качать по линку с японского сайта http://www.lizardtech.co.jp/download/djvu/modules/windows/editor/5.0/ProfessionalEditor.zip (55 метров, пароль на архив: editoreval). Ни плагин, ни виртуал-принтер в этот дистрибутив не входят.
 
Если надо, для русификации Эдитора положите файл DjVuEditorRes_0419.dll от Arcand (берем здесь: http://clubrus.kulichki.com/rus/d/Document%20Express%20Editor%205.0.0.16%20.zip <-Качать даунлоадером!) в папку \Program Files\LizardTech\Lizardtech Document Express Editor 5.0\bin.  
По ссылкам на японский сайт LizardTech идет переадресация на японский же филиал Celartem; ссылки на обе версии DocumentExpress с японских серверов не работают.
 
Вариант минимум - неинсталлируемый рип без Iris-OCR и help, русифицированный Arcand, берем здесь (около 2 метров, bmp->rar).
http://www.djvu-soft.narod.ru/DocExpress50016.rar
 
Если нужно только смотреть дежавю, то плагин к браузеру устанавливается без проблем с англоязычного сайта: http://www.lizardtech.com/download/dl_download.php?detail=doc_djvu_plugin&platform=win  
(иногда на сайте плагин обновляется с запаздыванием, последняя доступная версия 6.0.1, Released: 11.2005, Size: 900 Kb to 7.4 Mb)
Если надо, для русификации положите файл djvu0419.dll от Arcand (берем здесь: http://abab.front.ru/LizardTech_DjVu_Browser_Plug-in_6.0.1_rus.zip <-Качать даунлоадером!) в папку с плагином (\Program Files\LizardTech\Lizardtech DjVu Control\).

 
LizardTech DocumentExpress Pro 4.0.1.235 (30 MB) есть здесь: http://arhiv.org.ru/frikzona/programs/djvu/DocExpressPro4.0.exe RuIPs only. Включает в себя плагин и виртуал-принтер.  
 
Русский 4.1.0.333 без справки, слайд-шоу и распознавания, не требующий инсталляции, есть здесь (2.4 MB): http://hamradio.online.ru/ftp3/dw.php?DjVuEditor_Pro.zip
К нему еще бывают запускалки, брать здесь, bmp->rar.
 
Document Express Editor 6.0.1.1394
Document Express Editor 6.5.0.22420
LizardTech Virtual Printer Pro 4.1.7.1394 из Document Express with DjVu Professional Edition 6.0.1.1394 -- виртуальный принтер для создания DjVu-файлов из любого приложения имеющего функцию печати. Скачать. Serial от Document Express with DjVu Professional Edition 6.0 здесь.
PDF2DJVU 5.1 - конвертер из PDF в DjVu.   Читать обязательно!
DjVuToy -- очень полезная DjVu утилита, включающая в себя DjVuMaker, Merger, Splitter, Bookmarker и т.д.
Сайт автора Jian Ma (китайский) - наиболее интересные софты: ComicEnhancer Pro, DjVuToy, FreePic2Pdf, PdgCntEditor, TiffToy Скачать
Для конвертирования DjVu в PDF служит связка из последних версий DjVuToy + PDG Cnt Editor - неплохие результаты, выходной файл pdf сравнительно небольшого размера. Новое место хранения дистрибутивов
DjVuLibre -- open source реализация DjVu, включающая программу просмотра DjView, плагин для броузеров и утилиты.
WinDjView -- программа для просмотра DjVu-файлов на основе библиотек DjVu Libre.  
Обсуждение здесь, автор Андрей Жежерун (AndyZ)
Evince -- программа для просмотра файлов, в т.ч. DjVu. Часть проекта Gnome. Доступна под Windows.
Обсуждение здесь.
WinDjView c Sub Pixel Rendering  (Заметно улучшает отображение текста. Только для LCD мониторов) added by AciN
DjVuOCR -- программа для добавление текстового слоя в djvu-книги с помощью программы распознавания текста ABBYY FineReader версий 7-9.
Тема в Программах
ScanKromsator -- программа для нарезки страниц и обработки отсканированных изображений, изготовления PDF и DjVu.
Тема в Программах
ScanTailor -- программа для нарезки страниц и обработки отсканированных изображений.
Тема в Программах
DjVu Small -- компактная программа для создания DjVu-файлов (Версия 0.4.4).  
DjVu Small Mod -- программа для создания и декодирования DjVu-файлов. Обсуждение здесь
Sumatra Тема в Программах - бесплатная программа для просмотра разных типов файлов с открытым исходным кодом, в том числе и DjVu. Может использоваться как отдельно, так и плагином, например, к Total Commander.  
pdf2djvu -- польская (от Jakub Wilk) программа для конвертирования PDF-файлов. Проект на гитхабе переведён в read-only с ноября 2022г. анонсирован OCR и поддержка конвертирования аннотаций/гиперссылок.
 • Скрипт правки съехавших гиперссылок -- на Python и DjvuLibre  (Ссылка на ЯД).
 
Инструкции по сборке, для новичков
 
Прочее
 
Примечание
Топик был создан из варезного с аналогичным названием, поскольку там сплошной офтоп. Шапка скопирована с зачисткой всех варезных аспектов, которые остались в Варезнике. Здесь можно обсуждать любые темы DjVu, кроме варезных.  Для сканирования, обработки и всего прочего есть топик в eBookz и не только.

Всего записей: 1543 | Зарегистр. 18-08-2012 | Отправлено: 15:33 01-11-2022 | Исправлено: TelecomUral, 09:55 08-05-2024
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
hooddy say:

Цитата:
 
как мне сохранить книгу, содержащую разные типы страниц?
 

Вариантов множество. И многое зависит от софта. В том же самом DjVuLibre можно закодировать страницы по разному: обложки утилитой c44, монохром - cjb2, страницы с иллюстрациями - комбинацией cjb2 и djvumake. После этого сшить отдельные страницы с помощью djvm. Правда не будет межстраничного сжатия (словарей).
 
Доступные чанки страницы: Sjbz, FGbz, FG44, BG44, BGjp, TXTz. Плюс к этому добавляются межстраничные словари через INCL.

Всего записей: 983 | Зарегистр. 18-05-2023 | Отправлено: 11:33 05-08-2023
hooddy

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot
я не шарю по теме, потому и спросил. смотрю на Document Express Editor. Версия 6.5 при попытке сохранить весь сет станиц вываливается на первой же. Подозреваю, потому что она цветная или еще что-то. Версии выше 7 и 8 слишком заморочные. Я протрахался с пдф неделю и меня результат не устроил конечный. Хотя в нем можно как раз таки выборочно страницы распознавать и разные форматы вставлять. Вы мне сейчас про совсем тонкие материи пишете, я не вкурю такое(

Всего записей: 2261 | Зарегистр. 08-12-2006 | Отправлено: 11:40 05-08-2023
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
hooddy

Цитата:
 
я не вкурю такое(
 

Так и не к чему. Есть же depress. Да и в "шапке" DjvuToy представлен.

Всего записей: 983 | Зарегистр. 18-05-2023 | Отправлено: 11:44 05-08-2023
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
hooddy

Цитата:
Пока что не вижу, что можно.

можно. Плюс можно удалить уже распознанный текст из любой страницы или из всего документа.

Всего записей: 7962 | Зарегистр. 08-09-2001 | Отправлено: 11:47 05-08-2023
hooddy

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Ну при страницах порядка 400 мне вот такое вываливается из Desktop Editor
   
сразу же при попытке первую обработать. Если одну страницу или несколько добавить, а не все сразу, то работает

Всего записей: 2261 | Зарегистр. 08-12-2006 | Отправлено: 12:04 05-08-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
hooddy
вы не очень корректно ставите свои вопросы.
Если отвечать на первый, можно ли в одном документе сохранить несколько типов компрессии (из-за разной оригинальной цветности), то ответ "можно".
Последующие вопросы пошли намного более технические с одновременной утратой каких-либо технических подробностей. "У меня ничего не выходит!" - а поподробнее можно?! 400 страниц это не баран чихнул.
 
Если вы пользуетесь старым экспрессом, версий от 5 до 6.5, то наиболее просто ваша задача объединения разнородных страниц решается в несколько последовательных кодирований. Сначала одним профилем страницы одного вида в один файл. Потом страницы другого вида другим профилем в другой файл. Затем открываете оба файла и копируете страницы из второго в первый и сохраняете как третий файл, там уже профили применяться (предлагаться) не будут. Всё будет работать, но размерчик подраспухнет, ибо - как было написано выше - словарь станет НЕ многостраничный. Ну и если страницы надо копировать вперемешку, то это медленно.
Плюс в экспрессе не шибко хорошее распознавание.
 
Есть более замудрёные способы через fsd или СканКромсатор. Или Djvu Imager. Они применяются для создания оптимально закодированных сложных книг, типа таких:  
http://publ.lib.ru/ARCHIVES/M/''Malaya_istoriya_iskusstv''_(seriya)/_MII.html

Всего записей: 3608 | Зарегистр. 15-07-2010 | Отправлено: 17:59 05-08-2023
hooddy

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
да, некорректно, я не разбираюсь, простите. у меня скан книги. две полноцветные обложки (перед и зад), и грейскал текст с картинками - часть графика, часть фото. и я не понимаю, как сохранить в одном файле так, чтобы было разделение на цветное и нецветное. получается, что все утилиты с интерфейсом позволяют только в каком-то одном режиме пережать. и это так себе история. а хотлеось бы, чтобы как вы пишете "можно" обложки в цвете, а основной массив в грейскале смешанном режиме, который я из скантейлора получил (супер приложения на самом деле, я их и искал). т.е. мне надо получить минимальный по размеру файл, но также с минимумом артефактов. и я не могу подобрать удовлетворяющий меня сценарий. хоть в djvu, хоть в pdf. даже если текст перевести в моно, плюнув на качество картинок, то из-за обложек все равно приходится выбирать режим фото или clean и т.п. и неикакого смысла делать текст моно нет. помогите разобраться.
 
Перечитал ваш пост. Чуть яснее стало. Не понял про словарь, как и не понял, что дает распознавание применительно к размеру файла и качества текста. Исходя из пдф, должен шрифты внедрять (да?), но на деле при улучшении шрифта ухудшается картинка и замыленный фон получается. Делать текст моно не хочу - хуже вомпринимается, чем грейскал.

Всего записей: 2261 | Зарегистр. 08-12-2006 | Отправлено: 20:01 05-08-2023 | Исправлено: hooddy, 20:33 05-08-2023
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
hooddy

Цитата:
я не могу подобрать удовлетворяющий меня сценарий. хоть в djvu, хоть в pdf.  

Если вы осилили "супер приложение Скантейлор", то советую осилить еще и Сканкромсатор, тем более в вашем случае нужно понять не все в нем, а очень маленькую его часть: как в нем делать дежавю или пдф, имея уже обработанные сканы.
Никто вам это не объяснит с ходу, нужно приложить небольшое усилие в этом направлении, зато потом не будет проблем, описанных вами.

Всего записей: 7279 | Зарегистр. 14-01-2005 | Отправлено: 23:11 05-08-2023 | Исправлено: shch_vg, 00:05 06-08-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
hooddy
думаю, вам надо прочесть старую статью и освоить этот инструмент:
http://djvu-soft.narod.ru/scan/djvu_imager.htm
На уровень выше есть масса таких же полезных статеек про базовые вещи. Очень устарелые, но они базовые. Эта база без изменений была использована в более современных прогах. Читается там всё легко, час-полтора и ваши знания про кодирование возрастут раз в десять.
 
Статья даёт принципиальное понимание, как вам надо работать. Современные обработчики, по-моему, пользуются fsd (можно взять на том же сайте).
Увы, более новых материалов про МПФ (метод подклейки фона) мне неизвестно, хотя они вероятно есть. Я сам сижу на СканКромсаторе, там всё автоматически получается, и джву и пдф. Но его не так-то просто освоить даже для вашего варианта.
 
А обложки подклеите в последний момент, через экспресс эдитор. Профилем photo.
 
Насчёт видео. Покопайте на ютьюбе материалы от Славы Мацко, kamenkapenza. Он конечно балбес балбесом, с точки зрения методологической строгости и педагогического искусства. Но зато для новичков разжёвывает так, что не понять невозможно. Что-то у него вроде бы было пару лет назад, как после смешанного режима скантейлора закодить в МПФ.
Только они очень длинные Там из каждых трех часов запросто можно сжать информацию в 20 минут, да вот никто так и не сжал.
 
Добавлено:
Просмотрел шапку в теме http://forum.ru-board.com/topic.cgi?forum=93&topic=3514&&glp#lt
Там есть десятилетней давности, но вполне актуальный текст "Сборка djvu и pdf" от Дмитрия Алёшина.
https://disk.yandex.ru/d/0mouSqjK5SCQx
Раздел 4 - про FSD - как раз то, что вам надо.
 
Добавлено:

Цитата:
hooddy
что дает распознавание применительно к размеру файла и качества текста

Размер файла чуть увеличится от невидимого слоя распознанных букв. На качество видимого (графического) текста и рисунков ocr-слой не влияет.

Всего записей: 3608 | Зарегистр. 15-07-2010 | Отправлено: 04:57 06-08-2023
hooddy

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
спасибо парни. база и нужна была.

Всего записей: 2261 | Зарегистр. 08-12-2006 | Отправлено: 09:44 06-08-2023
pressF



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Существует программа по типу diffpdf чтобы можно было сравнить рядом друг с другом 2 файла и визуально отличия подсветить?

Всего записей: 1589 | Зарегистр. 29-03-2023 | Отправлено: 08:38 14-08-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
можно было сравнить рядом друг с другом 2 файла

специально для дежавю по-моему ничего подобного нет. Ищите универсальную сравнивалку, которая этот формат всосёт как графику.

Всего записей: 3608 | Зарегистр. 15-07-2010 | Отправлено: 08:55 14-08-2023
pressF



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Ищите универсальную сравнивалку, которая этот формат всосёт как графику.

ежели кто будет искать то WinMerge сразу мимо, не получится
 
ищу дальше

Всего записей: 1589 | Зарегистр. 29-03-2023 | Отправлено: 13:06 14-08-2023
Andrea



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Насчёт оптимизации DJVU: считаю, что тема эта достаточно актуальна. Т.к в сети немало djvu-книг, в которых некоторые страницы, в сущности не содержащие полезной информации, занимают немало места в файле. Особенно это касается технической литературы (обложки, фотографии или рисунки корпусов и т.п). И таких страниц в книге может быть приличное количество. Поэтому иногда полезно "оптимизировать" только отдельные страницы, чтобы не ухудшилось качество остальных. Пересобирать "вручную" для этого DJVU - не все правильно умеют - нюансов тут много. В общем, попробовал следующий простой способ: В DjVuToy разбиваю djvu-файл на страницы, и сразу становится видно, какие из них занимают неоправданно много места. Допустим, это страница "xxx". В DjVuToy конвертирую её в формат PDF, после чего PDF преобразовываю в DJVU в программе Djvu-Spec Pdf 2 Djvu Converter (Djvu-Spec Pdf 2 Djvu Converter позволяет выставить оптимальные настройки - разрешение и прочее). В результате, размер той же страницы уменьшается в несколько раз визуально практически без потери качества. В DjVuToy из оригинального исходного DJVU удаляю страницу, и в нём же подменяю её на полученную

Всего записей: 1395 | Зарегистр. 24-12-2015 | Отправлено: 13:57 22-08-2023 | Исправлено: Andrea, 14:15 22-08-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Andrea
В результате, размер той же страницы уменьшается в несколько раз визуально практически без потери качества

да ладно без потери?

Всего записей: 3608 | Зарегистр. 15-07-2010 | Отправлено: 14:15 22-08-2023
Andrea



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral, главное - не повредить реально полезный контент в книге, и не ухудшить её читаемость. В каждом случае - всё индивидуально. К примеру, в выпусках "В помощь радиолюбителю" (ДОСААФ) иногда попадаются страницы, в которых только одно едва различимое фото агрегата занимает 2/3 места от размера всей книги. Нормально ли это? Если знаете другой лёгкий и всем доступный способ оптимизации DJVU - предложите. То, о чём я написал выше - идея, которая мне пришла в голову, и решил её проверить на практике (в сети не встречал даже намёков про такой вариант)

Всего записей: 1395 | Зарегистр. 24-12-2015 | Отправлено: 14:35 22-08-2023 | Исправлено: Andrea, 14:54 22-08-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Andrea
Если знаете другой безгеморойный способ оптимизации DJVU

знаю. удаляете файл, это наилучшая оптимизация по критерию "размер".
 
Выпуски ВПР делались в основном по моим сканам (что у Ершова лежит). И размер там как правило и сделан таким большим, чтобы по максимуму оставить фотку неповреждённой, она и так плохоразличима была на бумаге. Я ведь не зря отметил ехидно "без потери?". В примере вы уничтожаете даже то, что есть.
Насколько помню, как раз на ВПР мы на форуме Ершова и учились сохранять мерзкоотпечатанные технические брошюрки 50-60 годов.
 

Цитата:
Нормально ли это?

нормально. Качественный текст с графической растрированной картинкой несопоставим по размерам на несколько порядков. Пример - экспортированный ocr слой 400 страничной книги это 6-7 мегабайт. А одна качественная репродукция легко занимает 1-3Мб в джву. И думать в предложенном направлении - прямого сопоставления буквы и пикселя - вредно.
 
Ну а сам метод - вполне приемлем, я не слыхал чтоб так делали.

Всего записей: 3608 | Зарегистр. 15-07-2010 | Отправлено: 15:00 22-08-2023
Andrea



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral, для примера, загрузил 2 страницы (оригинальную и обработанную вышеописанным способом) с фото из выпуска ВРЛ 003. Велика ли на глаз разница в читаемости?

Всего записей: 1395 | Зарегистр. 24-12-2015 | Отправлено: 15:21 22-08-2023 | Исправлено: Andrea, 15:22 22-08-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Велика ли на глаз разница в читаемости?

сами проверяйте, я не госкомиссия. Своим текстом я обращал внимание читающих, что какая-то "оптимизация" - штука всегда нетривиальная.

Всего записей: 3608 | Зарегистр. 15-07-2010 | Отправлено: 15:24 22-08-2023
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Andrea say:

Цитата:
 
разбиваю djvu-файл на страницы
 

А с межстраничными  словарями как быть? Работа с ними как то предусмотрена? Или они в ходе работы сливаются в страницы?

Всего записей: 983 | Зарегистр. 18-05-2023 | Отправлено: 15:32 22-08-2023
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29

Компьютерный форум Ru.Board » Компьютеры » Программы » Формат DjVu и программы для работы с ним


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2025

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru