Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Формат DjVu и программы для работы с ним

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26

Открыть новую тему     Написать ответ в эту тему

73



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору


Формат DjVu и программы для работы с ним


Программы для печати (виртуальные принтеры в djvu):
Caminova DjVu Virtual Printer 6.5
Two Pilots DjVu Printer Pilot (freeware)
Распечатка в djvu под Suse Linux через Kprinter
Программы для просмотра и редактирования:
Саminova Document Express with DjVu - пакет приложений для создания и просмотра файлов в формате DjVu. Включает DjVu Plugin, DjVu Editor (Pro) и виртуальный принтер. Document Express Еnterprise - для пакетной обработки файлов.
Текущий официальный сайт: Cuminas & Старый офсайт & Бывший владелец
LizardTech DocumentExpress Enterprise 5.1.0.946
Качать по линку с японского сайта http://www.lizardtech.co.jp/download/djvu/modules/windows/enterprise/5.1/
DocumentExpressEnterprise_5.1.0.zip
(201 метр, пароль на архив: enteval). В дистрибутив входят плагин для браузера, виртуал-принтер, IFilter, GhostScript.
 
LizardTech DjVu Editor DocumentExpress Professional 5.0.0.16
Вариант максимум - качать по линку с японского сайта http://www.lizardtech.co.jp/download/djvu/modules/windows/editor/5.0/ProfessionalEditor.zip (55 метров, пароль на архив: editoreval). Ни плагин, ни виртуал-принтер в этот дистрибутив не входят.
 
Если надо, для русификации Эдитора положите файл DjVuEditorRes_0419.dll от Arcand (берем здесь: http://clubrus.kulichki.com/rus/d/Document%20Express%20Editor%205.0.0.16%20.zip <-Качать даунлоадером!) в папку \Program Files\LizardTech\Lizardtech Document Express Editor 5.0\bin.  
По ссылкам на японский сайт LizardTech идет переадресация на японский же филиал Celartem; ссылки на обе версии DocumentExpress с японских серверов не работают.
 
Вариант минимум - неинсталлируемый рип без Iris-OCR и help, русифицированный Arcand, берем здесь (около 2 метров, bmp->rar).
http://www.djvu-soft.narod.ru/DocExpress50016.rar
 
Если нужно только смотреть дежавю, то плагин к браузеру устанавливается без проблем с англоязычного сайта: http://www.lizardtech.com/download/dl_download.php?detail=doc_djvu_plugin&platform=win  
(иногда на сайте плагин обновляется с запаздыванием, последняя доступная версия 6.0.1, Released: 11.2005, Size: 900 Kb to 7.4 Mb)
Если надо, для русификации положите файл djvu0419.dll от Arcand (берем здесь: http://abab.front.ru/LizardTech_DjVu_Browser_Plug-in_6.0.1_rus.zip <-Качать даунлоадером!) в папку с плагином (\Program Files\LizardTech\Lizardtech DjVu Control\).

 
LizardTech DocumentExpress Pro 4.0.1.235 (30 MB) есть здесь: http://arhiv.org.ru/frikzona/programs/djvu/DocExpressPro4.0.exe RuIPs only. Включает в себя плагин и виртуал-принтер.  
 
Русский 4.1.0.333 без справки, слайд-шоу и распознавания, не требующий инсталляции, есть здесь (2.4 MB): http://hamradio.online.ru/ftp3/dw.php?DjVuEditor_Pro.zip
К нему еще бывают запускалки, брать здесь, bmp->rar.
 
Document Express Editor 6.0.1.1394
Document Express Editor 6.5.0.22420
LizardTech Virtual Printer Pro 4.1.7.1394 из Document Express with DjVu Professional Edition 6.0.1.1394 -- виртуальный принтер для создания DjVu-файлов из любого приложения имеющего функцию печати. Скачать. Serial от Document Express with DjVu Professional Edition 6.0 здесь.
PDF2DJVU 5.1 - конвертер из PDF в DjVu.   Читать обязательно!
DjVuToy -- очень полезная DjVu утилита, включающая в себя DjVuMaker, Merger, Splitter, Bookmarker и т.д.
Сайт автора Jian Ma (китайский) - наиболее интересные софты: ComicEnhancer Pro, DjVuToy, FreePic2Pdf, PdgCntEditor, TiffToy Скачать
Для конвертирования DjVu в PDF служит связка из последних версий DjVuToy + PDG Cnt Editor - неплохие результаты, выходной файл pdf сравнительно небольшого размера. Новое место хранения дистрибутивов
DjVuLibre -- open source реализация DjVu, включающая программу просмотра DjView, плагин для броузеров и утилиты.
WinDjView -- программа для просмотра DjVu-файлов на основе библиотек DjVu Libre.  
Обсуждение здесь, автор Андрей Жежерун (AndyZ)
Evince -- программа для просмотра файлов, в т.ч. DjVu. Часть проекта Gnome. Доступна под Windows.
Обсуждение здесь.
WinDjView c Sub Pixel Rendering  (Заметно улучшает отображение текста. Только для LCD мониторов) added by AciN
DjVuOCR -- программа для добавление текстового слоя в djvu-книги с помощью программы распознавания текста ABBYY FineReader версий 7-9.
Тема в Программах
ScanKromsator -- программа для нарезки страниц и обработки отсканированных изображений, изготовления PDF и DjVu.
Тема в Программах
ScanTailor -- программа для нарезки страниц и обработки отсканированных изображений.
Тема в Программах
DjVu Small -- компактная программа для создания DjVu-файлов (Версия 0.4.4).  
DjVu Small Mod -- программа для создания и декодирования DjVu-файлов. Обсуждение здесь
Sumatra Тема в Программах - бесплатная программа для просмотра разных типов файлов с открытым исходным кодом, в том числе и DjVu. Может использоваться как отдельно, так и плагином, например, к Total Commander.  
pdf2djvu -- польская (от Jakub Wilk) программа для конвертирования PDF-файлов. Проект на гитхабе переведён в read-only с ноября 2022г. анонсирован OCR и поддержка конвертирования аннотаций/гиперссылок.
 • Скрипт правки съехавших гиперссылок -- на Python и DjvuLibre  (Ссылка на ЯД).
 
Инструкции по сборке, для новичков
 
Прочее
 
Примечание
Топик был создан из варезного с аналогичным названием, поскольку там сплошной офтоп. Шапка скопирована с зачисткой всех варезных аспектов, которые остались в Варезнике. Здесь можно обсуждать любые темы DjVu, кроме варезных.  Для сканирования, обработки и всего прочего есть топик в eBookz и не только.

Всего записей: 1160 | Зарегистр. 18-08-2012 | Отправлено: 15:33 01-11-2022 | Исправлено: TelecomUral, 09:55 08-05-2024
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral say:

Цитата:
Что меня всегда прям вштыривало

 
Как раз ничего интересного. Такое даже STEX умеет:
   
 
оффтоп

Всего записей: 599 | Зарегистр. 18-05-2023 | Отправлено: 22:13 17-10-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
zvezdochiot
Как раз ничего интересного

приглядитесь к пересечениям букв. На скриншоте хорошо заметно
 


Всего записей: 3148 | Зарегистр. 15-07-2010 | Отправлено: 22:26 17-10-2023
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral say:

Цитата:
приглядитесь к...

Покажи своё? Ну? Что взамен то? Ты всё осуждаешь, но взамен то ничего  не даёшь. Только оффтопишь.
 
PS: Тупое применение noteshrink к тому же материалу:
   

Всего записей: 599 | Зарегистр. 18-05-2023 | Отправлено: 22:29 17-10-2023 | Исправлено: zvezdochiot, 22:44 17-10-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
hooddy

Цитата:
поясните, почему гифы в джпеги не перековертировать на этапе ресайзинга?

Мой пост - это не догма, а руководство к действию.
Также мой пост имел некоторые учебные и научные цели. Например, показать, что можно одновременно загружать в djvu-конвертер графические файлы разных типов, а также обратить внимание на необходимость выпрямления dpi.
Я не вижу ничего страшного в переконвертации gif в jpg одновременно с их апскейлингом (ресайзингом). Тем более, что тогда можно задать dpi непосредственно во всех jpg, что может сильно облегчить дальнейшую работу.
 
Конечно, кто-то обязательно скажет, что каждая переконвертация ухудшает качество графики. И будет прав. Нюанс в том, заметим ли мы это. Как вы уже догадались, я не теоретизировал, а сравнил  заресайзанный gif и jpg заресайсанный и конвертированный из оригинального gif. Да, разница есть - характерные jpg-овские артефакты сжатия - серые облачка вокруг букв. Но заметны они при 500% масштабе - это когда на экране помещаются только 2 буквы по вертикали.
 
И ещё. Посмотрев на данные gif при сильном увеличении, у меня закралось подозрение, что сделаны они из jpg-ов.

Всего записей: 768 | Зарегистр. 04-11-2019 | Отправлено: 22:29 17-10-2023
hooddy



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager
все же текст заметно хуже оригинала, а вот к графическим страницам претензий на этот раз нет вообще. придется выбирать из двух зол. спасибо за мануал. и вы скорее всего правы, только это не скриншотер, а типа пдф принтер на стороне литреса видимо отдает в пикчи и автоматом выбирает джпг или гиф (думаю так, потому что он эти две страницы мог ошибочно принять за грейскейл по пороговому какому-нить значению, да даже если и человек это делает, то глаз замылился), но сути не меняет конечно.

Всего записей: 2113 | Зарегистр. 08-12-2006 | Отправлено: 22:34 17-10-2023 | Исправлено: hooddy, 22:39 17-10-2023
VadimirTT



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Да, разница есть - характерные jpg-овские артефакты сжатия - серые облачка вокруг букв.

А зачем ресайзить гифы в джипег? Есть же png и tif.

Всего записей: 3032 | Зарегистр. 22-03-2005 | Отправлено: 22:34 17-10-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
zvezdochiot
Тупое применение noteshrink к тому же материалу:

даже после обрезки полей 5 уникальных цветов вместо трёх оригинальных. То есть алгоритм создаёт градации, плавность. При кодировании будет резко завышенный размер.
 

Цитата:
zvezdochiot
Ты всё осуждаешь, но взамен то ничего  не даёшь.

так вроде и не должен.  
Я показал достаточно хитровы...й пример. Умный утащит его себе в копилочку и будет колдовать, увеличивая свой опыт.

Всего записей: 3148 | Зарегистр. 15-07-2010 | Отправлено: 22:52 17-10-2023
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot

Цитата:
Как раз ничего интересного. Такое даже STEX умеет:

после такой обработки текст ocr программами распознается очень неплохо.
 
VadimirTT

Цитата:
А зачем ресайзить гифы в джипег? Есть же png и tif.

А зачем png и tif в данном случае? Есть же pbm/ppm/pgm.

Всего записей: 7470 | Зарегистр. 08-09-2001 | Отправлено: 22:52 17-10-2023
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral say:

Цитата:
будет резко завышенный размер.

Опять флудим? У выложенных мной изображений вообще то размер есть. Что там завышено? Цифры давай.
 

Цитата:
так вроде и не должен.

Ну вот и цена всем твоим словам и твоей "копилки". Полный ноль. Дырка от бублика.
 
 





Самовольное моделирование, оскорбления

Всего записей: 599 | Зарегистр. 18-05-2023 | Отправлено: 22:57 17-10-2023 | Исправлено: Maz, 00:01 19-10-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
А вот для сегментации набор не подходит. "Идеальный случай" вреден для разработки.

Кажется, я написал слишком кратко.
- если программа ошибается на "идеальном" материале, значит такая программа непригодна к использованию
- если программа ошибается на "идеальном" материале, значит можно ткнуть разработчика носом в его недоработки
Проблема в том, что такой "идеальный" материал должен иметь характерные особенности, на которых будет повторяющийся и воспроизводимый отрицательный результат, который можно логически объяснить. Или наоборот - какого лешего программа отрабатывает именно так, хотя это никакой логике не поддаётся.
 

Цитата:
Ну и нахрен тогда автоматика

Я сейчас напишу не сильно точно (лень фактчекить, сорян), но думаю, что смысл поймёте.
10-15 лет назад, чтобы выделить объект в Фотошопе, надо было 100 раз кликнуть мышкой, чтобы обвести сложный контур для выделения объекта. Тупая монотонная неквалифицированная работа. Сейчас надо один раз кликнуть мышкой на объекте, и он будет выделен автоматически.
 

Цитата:
Что меня всегда прям вштыривало

А как вам такое ЕМНИП позаимствовал из темы про FR
 
 
 
Добавлено:
VadimirTT

Цитата:
А зачем ресайзить гифы в джипег? Есть же png и tif.

Чтобы все файлы были одного типа, т.к. цветные страницы изначально в jpg.
Можно, конечно, и в png и в tiff. Но вместо jpg размером 1 МБ мы получим png 5 МБ или tiff 11 МБ. Говорю сразу, я сначала проверил, а потом написал. Некоторые программы не любят загружать сразу 3-5 гигабайт графики. Тяжело им.
 
Также встречный вопрос(ы).
Вы можете выбрать значения параметров и объяснить почему именно так, и ещё с пруфами? Я могу 2-3 и то с трудом. Вы забываете, что мой пост был как бы учебный для любопытного новичка. а не инструкция для прошаренного профи.
Для перекодирования в png необходимо указать:
checkbox - Interlaced
checkbox - Set the transparency value to palette entry 0-9999
Compression level 0-9
Для перекодирования в tiff необходимо указать:
Color compression: None, Packbits, LZW, LZW+Predict, ZIP, JPEG
Binary compression: None, Packbits, LZW, ZIP, CCITT G3, CCITT G3-2D, CCITT G4
JPEG quality 0-100 (default 85)
checkbox - Only one strip
 
Кроме того. jpg - это более универсальный формат. Попробуйте сделать pdf из 3 гигабайт тиффов.
 
Добавлю, чтобы было понятнее. "Новичок любопытный", т.е. когда я написал, что в DjVuToy чекбокс OCR нельзя включать, потому что любопытные новички обязательно его включат, то я сразу получил вопрос "А почему?" На который раньше меня успел ответить TelecomUral. И если бы я начал рассказывать про все варианты кодирования со всеми их опциями - вы бы в простынях запутались бы, а я от встречных вопросов бы утонул.
 
Вы лучше скажите, чем djvu кодировали?

Всего записей: 768 | Зарегистр. 04-11-2019 | Отправлено: 23:16 17-10-2023 | Исправлено: jourmager, 23:55 17-10-2023
hooddy



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
когда я написал, что в DjVuToy чекбокс OCR нельзя включать

ну красная кнопка все равно не сработала, у меня офис 2013, а она хочет максимум 2007. тем не менее, разве распознавание не уменьшает размер и не улучшает начертание, подставляя шрифты?нафига оно тогда вообще, чтобы можно было текст в буфер копипастить?

Всего записей: 2113 | Зарегистр. 08-12-2006 | Отправлено: 00:07 18-10-2023
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager say:

Цитата:
Попробуйте сделать pdf из 3 гигабайт тиффов.

Что значит "попробуйте"? Так и делаем. Получается 10-20Mb pdf с помощью SK или ST + jbig2enc.
 
hooddy say:

Цитата:
разве распознавание не уменьшает размер и не улучшает начертание, подставляя шрифты?нафига оно тогда вообще, чтобы можно было текст в буфер копипастить?

Что то там Adobe пыталось намутить, но по факту все OCR до сих пор работают только в одном направлении и изображений текста не правят.

Всего записей: 599 | Зарегистр. 18-05-2023 | Отправлено: 00:08 18-10-2023 | Исправлено: zvezdochiot, 00:12 18-10-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
zvezdochiot
Что там завышено? Цифры давай.

на:
мой 121к 600дпи
https://disk.yandex.ru/d/E-vJyNdY6AaOAg
твой 137к 300дпи
https://disk.yandex.ru/d/GiwzQP4f5di1cQ
 
 
Добавлено:

Цитата:
jourmager
А как вам такое ЕМНИП позаимствовал из темы про FR

тоже неплохо

Всего записей: 3148 | Зарегистр. 15-07-2010 | Отправлено: 00:20 18-10-2023
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral say:

Цитата:
мой 121к 600дпи vs твой 137к 300дпи

А хде мой 600dpi? И "разница" меня так "поразила", что я аж "обомлел". Колоссальная величина, однако. Не флуди больше.

Всего записей: 599 | Зарегистр. 18-05-2023 | Отправлено: 00:25 18-10-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
jourmager
Кажется, я написал слишком кратко.
- если программа ошибается на "идеальном" материале, значит такая программа непригодна к использованию
- если программа ошибается на "идеальном" материале, значит можно ткнуть разработчика носом в его недоработки
Проблема в том, что такой "идеальный" материал должен иметь характерные особенности, на которых будет повторяющийся и воспроизводимый отрицательный результат, который можно логически объяснить. Или наоборот - какого лешего программа отрабатывает именно так, хотя это никакой логике не поддаётся.  

Это лишний шаг в тестировании сегментера. Для внешнего тестировщика лишний, у него свои наборы из жизни. А для разраба - ему самому видней на чём тестить. Вон как лихо звездочёт ответил про неуниверсальную универсальность.

Всего записей: 3148 | Зарегистр. 15-07-2010 | Отправлено: 00:25 18-10-2023
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Не понимаю, зачем нужно бинаризовать текст.
Можно сделать и так: https://cloud.mail.ru/public/DHAR/behDF4ioi
Фоновый цвет можно при желании сделать любой в ирфане.

Всего записей: 7003 | Зарегистр. 14-01-2005 | Отправлено: 02:27 18-10-2023
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg say:

Цитата:
Не понимаю, зачем нужно бинаризовать текст.

Очень "смешно":

Код:
 
djvudump step2.djvu  
  FORM:DJVU [82189]  
    INFO [10]         DjVu 3104x5638, v25, 600 dpi, gamma=2.2
    Sjbz [21234]      JB2 bilevel data
    FG44 [9974]       IW4 data #1, 100 slices, v1.2 (color), 259x470
    BG44 [5556]       IW4 data #1, 74 slices, v1.2 (color), 1035x1880
    BG44 [7422]       IW4 data #2, 10 slices
    BG44 [2084]       IW4 data #3, 4 slices
    BG44 [35849]      IW4 data #4, 9 slices
 

Угадай, что такое Sjbz, aka JB2 bilevel data. Действительно зачем? А размер BG44 и FG44 в твоём случае очень даже избыточный. По сути вместо FG44 вообще должен быть FGbz. И при этом автосегментация не справилась на наложении чёрной буквы "ш" и белой буквы "И".
 

Всего записей: 599 | Зарегистр. 18-05-2023 | Отправлено: 02:53 18-10-2023 | Исправлено: zvezdochiot, 03:03 18-10-2023
LonerD



Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
TelecomUral

Цитата:
а вот страницу (например) 243 бумажную - это так ST определил, что на ней рисунок ЧБ ? Всё ж пропало.

Никак не определил. Он вообще gifы не прожёвывает.
Это я их не глядя в чёрно-белое конвертировал и засунул в Djvu Small в битонал.
Там на многих страничках вертикальные финтифлюшки потерялись.
Подправил. https://disk.yandex.ru/d/XYvXz3a9iJkfBg
Не проверял правильность, может ещё косяки есть. Цель в данном случае была - восстановить в памяти и записать алгоритм, а полученный файл - это тестовый набросок "по-быстрому".

Всего записей: 880 | Зарегистр. 27-06-2006 | Отправлено: 04:13 18-10-2023 | Исправлено: LonerD, 04:19 18-10-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
оффтоп

Цитата:
shch_vg
Не понимаю, зачем нужно бинаризовать текст.

действительно, "очень смешно".
 
upd
можно и так книги делать
https://disk.yandex.ru/i/0yWWeMJYEvk2fQ
(md5=E618AAFF6926C92B815ACC49B0F10AA8)

Всего записей: 3148 | Зарегистр. 15-07-2010 | Отправлено: 06:52 18-10-2023 | Исправлено: TelecomUral, 07:30 18-10-2023
hooddy



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
хм, прикольно, что мейлру дает джву читать в онлайне

Всего записей: 2113 | Зарегистр. 08-12-2006 | Отправлено: 09:26 18-10-2023 | Исправлено: hooddy, 09:26 18-10-2023
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26

Компьютерный форум Ru.Board » Компьютеры » Программы » Формат DjVu и программы для работы с ним


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru