Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Формат DjVu и программы для работы с ним

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26

Открыть новую тему     Написать ответ в эту тему

73



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору


Формат DjVu и программы для работы с ним


Программы для печати (виртуальные принтеры в djvu):
Caminova DjVu Virtual Printer 6.5
Two Pilots DjVu Printer Pilot (freeware)
Распечатка в djvu под Suse Linux через Kprinter
Программы для просмотра и редактирования:
Саminova Document Express with DjVu - пакет приложений для создания и просмотра файлов в формате DjVu. Включает DjVu Plugin, DjVu Editor (Pro) и виртуальный принтер. Document Express Еnterprise - для пакетной обработки файлов.
Текущий официальный сайт: Cuminas & Старый офсайт & Бывший владелец
LizardTech DocumentExpress Enterprise 5.1.0.946
Качать по линку с японского сайта http://www.lizardtech.co.jp/download/djvu/modules/windows/enterprise/5.1/
DocumentExpressEnterprise_5.1.0.zip
(201 метр, пароль на архив: enteval). В дистрибутив входят плагин для браузера, виртуал-принтер, IFilter, GhostScript.
 
LizardTech DjVu Editor DocumentExpress Professional 5.0.0.16
Вариант максимум - качать по линку с японского сайта http://www.lizardtech.co.jp/download/djvu/modules/windows/editor/5.0/ProfessionalEditor.zip (55 метров, пароль на архив: editoreval). Ни плагин, ни виртуал-принтер в этот дистрибутив не входят.
 
Если надо, для русификации Эдитора положите файл DjVuEditorRes_0419.dll от Arcand (берем здесь: http://clubrus.kulichki.com/rus/d/Document%20Express%20Editor%205.0.0.16%20.zip <-Качать даунлоадером!) в папку \Program Files\LizardTech\Lizardtech Document Express Editor 5.0\bin.  
По ссылкам на японский сайт LizardTech идет переадресация на японский же филиал Celartem; ссылки на обе версии DocumentExpress с японских серверов не работают.
 
Вариант минимум - неинсталлируемый рип без Iris-OCR и help, русифицированный Arcand, берем здесь (около 2 метров, bmp->rar).
http://www.djvu-soft.narod.ru/DocExpress50016.rar
 
Если нужно только смотреть дежавю, то плагин к браузеру устанавливается без проблем с англоязычного сайта: http://www.lizardtech.com/download/dl_download.php?detail=doc_djvu_plugin&platform=win  
(иногда на сайте плагин обновляется с запаздыванием, последняя доступная версия 6.0.1, Released: 11.2005, Size: 900 Kb to 7.4 Mb)
Если надо, для русификации положите файл djvu0419.dll от Arcand (берем здесь: http://abab.front.ru/LizardTech_DjVu_Browser_Plug-in_6.0.1_rus.zip <-Качать даунлоадером!) в папку с плагином (\Program Files\LizardTech\Lizardtech DjVu Control\).

 
LizardTech DocumentExpress Pro 4.0.1.235 (30 MB) есть здесь: http://arhiv.org.ru/frikzona/programs/djvu/DocExpressPro4.0.exe RuIPs only. Включает в себя плагин и виртуал-принтер.  
 
Русский 4.1.0.333 без справки, слайд-шоу и распознавания, не требующий инсталляции, есть здесь (2.4 MB): http://hamradio.online.ru/ftp3/dw.php?DjVuEditor_Pro.zip
К нему еще бывают запускалки, брать здесь, bmp->rar.
 
Document Express Editor 6.0.1.1394
Document Express Editor 6.5.0.22420
LizardTech Virtual Printer Pro 4.1.7.1394 из Document Express with DjVu Professional Edition 6.0.1.1394 -- виртуальный принтер для создания DjVu-файлов из любого приложения имеющего функцию печати. Скачать. Serial от Document Express with DjVu Professional Edition 6.0 здесь.
PDF2DJVU 5.1 - конвертер из PDF в DjVu.   Читать обязательно!
DjVuToy -- очень полезная DjVu утилита, включающая в себя DjVuMaker, Merger, Splitter, Bookmarker и т.д.
Сайт автора Jian Ma (китайский) - наиболее интересные софты: ComicEnhancer Pro, DjVuToy, FreePic2Pdf, PdgCntEditor, TiffToy Скачать
Для конвертирования DjVu в PDF служит связка из последних версий DjVuToy + PDG Cnt Editor - неплохие результаты, выходной файл pdf сравнительно небольшого размера. Новое место хранения дистрибутивов
DjVuLibre -- open source реализация DjVu, включающая программу просмотра DjView, плагин для броузеров и утилиты.
WinDjView -- программа для просмотра DjVu-файлов на основе библиотек DjVu Libre.  
Обсуждение здесь, автор Андрей Жежерун (AndyZ)
Evince -- программа для просмотра файлов, в т.ч. DjVu. Часть проекта Gnome. Доступна под Windows.
Обсуждение здесь.
WinDjView c Sub Pixel Rendering  (Заметно улучшает отображение текста. Только для LCD мониторов) added by AciN
DjVuOCR -- программа для добавление текстового слоя в djvu-книги с помощью программы распознавания текста ABBYY FineReader версий 7-9.
Тема в Программах
ScanKromsator -- программа для нарезки страниц и обработки отсканированных изображений, изготовления PDF и DjVu.
Тема в Программах
ScanTailor -- программа для нарезки страниц и обработки отсканированных изображений.
Тема в Программах
DjVu Small -- компактная программа для создания DjVu-файлов (Версия 0.4.4).  
DjVu Small Mod -- программа для создания и декодирования DjVu-файлов. Обсуждение здесь
Sumatra Тема в Программах - бесплатная программа для просмотра разных типов файлов с открытым исходным кодом, в том числе и DjVu. Может использоваться как отдельно, так и плагином, например, к Total Commander.  
pdf2djvu -- польская (от Jakub Wilk) программа для конвертирования PDF-файлов. Проект на гитхабе переведён в read-only с ноября 2022г. анонсирован OCR и поддержка конвертирования аннотаций/гиперссылок.
 • Скрипт правки съехавших гиперссылок -- на Python и DjvuLibre  (Ссылка на ЯД).
 
Инструкции по сборке, для новичков
 
Прочее
 
Примечание
Топик был создан из варезного с аналогичным названием, поскольку там сплошной офтоп. Шапка скопирована с зачисткой всех варезных аспектов, которые остались в Варезнике. Здесь можно обсуждать любые темы DjVu, кроме варезных.  Для сканирования, обработки и всего прочего есть топик в eBookz и не только.

Всего записей: 1159 | Зарегистр. 18-08-2012 | Отправлено: 15:33 01-11-2022 | Исправлено: TelecomUral, 09:55 08-05-2024
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral say:

Цитата:
тут нет разработчиков алгоритмов автосегментации.

За всех не говори, говори только за себя.
Алгоритм DjVuL threshold - stb-image-djvul. Универсальный. Но подходит ли он к данному материалу? Совсем нет, ибо универсальный. А в данном случае нужна блочная сегментация, что то на базе OpenCV или алгоритмов OCR по разделению изображения на текстовые и нетекстовые блоки.
 

Всего записей: 599 | Зарегистр. 18-05-2023 | Отправлено: 21:26 17-10-2023 | Исправлено: zvezdochiot, 21:27 17-10-2023
hooddy



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager
все прекрасно. разве что два гифа цветные. можно выбрать цветной режим. но поясните, почему гифы в джпеги не перековертировать на этапе ресайзинга?

Всего записей: 2113 | Зарегистр. 08-12-2006 | Отправлено: 21:32 17-10-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
zvezdochiot
Алгоритм DjVuL - stb-image-djvul. Универсальный. Но подходит ли он к данному материалу? Совсем нет

хорошо сказано
 

Цитата:
За всех не говори, говори только за себя.  

Согласен. Тут и молчаливые читатели есть.
Тем не менее, пока что я прав - разработчиков автосегментации тут нет. Фактически. Потому мой контрвопрос в силе. Зачем эти кони в вакууме, если реальные сканы в 99,999% совсем-совсем не такие.

Всего записей: 3144 | Зарегистр. 15-07-2010 | Отправлено: 21:34 17-10-2023
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
оффтоп
 
hooddy say:

Цитата:
почему гифы в джпеги не перековертировать на этапе ресайзинга?

А зачем? Это же промежуточный рабочий материал. Зачем его подвергать деградации? Для чего?

Всего записей: 599 | Зарегистр. 18-05-2023 | Отправлено: 21:39 17-10-2023 | Исправлено: zvezdochiot, 21:44 17-10-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Что меня всегда прям вштыривало среди особенных сканов и для обработки и для распознавания, так это вот:
https://disk.yandex.ru/d/nNtbk3Av2dbEAQ
Из книги Мархасева про рок.
превьюшка

Всего записей: 3144 | Зарегистр. 15-07-2010 | Отправлено: 21:44 17-10-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
а с какой целью интересуетесь?? Я это к чему: тут нет разработчиков алгоритмов автосегментации.  

Как это нет? А bolega ? Он же потенциальный разработчик автосегментации для своего СканКомсатора
 
Лично у меня 2 цели:
- выработать свои личные критерии для оценки программ, которые я отбираю для личного использования
- выработать критерии оценки программ, с помощью которых можно направлять разработчиков в нужное русло
 
Почему спрашиваю у вас:
- вообще-то, т.к. вопрос задан не в личке, а в открытом посте на открытом форуме, то каждый прочитавший может на него ответить, и каждый ответ будет принят во внимание
- если коротко, то доверяю вашему мнению
 
ИМХО тут очень интересный набор сканов:
графика: штрихи, чёрно-белая, в градациях серого, малоцветная, полноцветная
элементы графического оформления: птички, серые широкие линии, чёрные тонкие линии, иконки
рукописный шрифт, текст на цветном фоне, текст с тенями вокруг букв

Всего записей: 768 | Зарегистр. 04-11-2019 | Отправлено: 21:46 17-10-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager
понял.
 
Ну, по мне так набор этих сканов про живопись интересен сугубо для обучения обработке книг. Прямоугольники выделений (что легко), и при этом действительно сложные в кодировании страницы.
А вот для сегментации набор не подходит. "Идеальный случай" вреден для разработки. Я не спец, но кое-что читал, как это работает, еще для систем зрения роботов в 1970х годах придуманное. Так вот в жизни всё совсем не как в идеальном мире. То есть на практике юзер НЕ получит адекватную автосегментацию своего материала, если разраб будет тренироваться/шлифовать код на подобных наборах. Я вообще считаю, что закодить мыслимые человеком варианты оформления принципиально невозможно (философски мы богаче чем компьютерное "да/нет") - значит, результат сегментера должен проконтролировать человек. Ну и нахрен тогда автоматика. Исключительно для простых вариантов? Так кто определит какой вариант прост, а какой сложен? Что мы, не знаем, как тупой новичок берёт инструкцию для кодирования, тупо её исполняет, а потом приходит с вопросом "я всё сделал как написано, а результат мне не нравится!! почему так?!" И ему невозможно объяснить, что неверно было написано в инструкции, потому что неверно написано в его голове.

Всего записей: 3144 | Зарегистр. 15-07-2010 | Отправлено: 22:07 17-10-2023
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral say:

Цитата:
Что меня всегда прям вштыривало

 
Как раз ничего интересного. Такое даже STEX умеет:
   
 
оффтоп

Всего записей: 599 | Зарегистр. 18-05-2023 | Отправлено: 22:13 17-10-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
zvezdochiot
Как раз ничего интересного

приглядитесь к пересечениям букв. На скриншоте хорошо заметно
 


Всего записей: 3144 | Зарегистр. 15-07-2010 | Отправлено: 22:26 17-10-2023
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral say:

Цитата:
приглядитесь к...

Покажи своё? Ну? Что взамен то? Ты всё осуждаешь, но взамен то ничего  не даёшь. Только оффтопишь.
 
PS: Тупое применение noteshrink к тому же материалу:
   

Всего записей: 599 | Зарегистр. 18-05-2023 | Отправлено: 22:29 17-10-2023 | Исправлено: zvezdochiot, 22:44 17-10-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
hooddy

Цитата:
поясните, почему гифы в джпеги не перековертировать на этапе ресайзинга?

Мой пост - это не догма, а руководство к действию.
Также мой пост имел некоторые учебные и научные цели. Например, показать, что можно одновременно загружать в djvu-конвертер графические файлы разных типов, а также обратить внимание на необходимость выпрямления dpi.
Я не вижу ничего страшного в переконвертации gif в jpg одновременно с их апскейлингом (ресайзингом). Тем более, что тогда можно задать dpi непосредственно во всех jpg, что может сильно облегчить дальнейшую работу.
 
Конечно, кто-то обязательно скажет, что каждая переконвертация ухудшает качество графики. И будет прав. Нюанс в том, заметим ли мы это. Как вы уже догадались, я не теоретизировал, а сравнил  заресайзанный gif и jpg заресайсанный и конвертированный из оригинального gif. Да, разница есть - характерные jpg-овские артефакты сжатия - серые облачка вокруг букв. Но заметны они при 500% масштабе - это когда на экране помещаются только 2 буквы по вертикали.
 
И ещё. Посмотрев на данные gif при сильном увеличении, у меня закралось подозрение, что сделаны они из jpg-ов.

Всего записей: 768 | Зарегистр. 04-11-2019 | Отправлено: 22:29 17-10-2023
hooddy



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager
все же текст заметно хуже оригинала, а вот к графическим страницам претензий на этот раз нет вообще. придется выбирать из двух зол. спасибо за мануал. и вы скорее всего правы, только это не скриншотер, а типа пдф принтер на стороне литреса видимо отдает в пикчи и автоматом выбирает джпг или гиф (думаю так, потому что он эти две страницы мог ошибочно принять за грейскейл по пороговому какому-нить значению, да даже если и человек это делает, то глаз замылился), но сути не меняет конечно.

Всего записей: 2113 | Зарегистр. 08-12-2006 | Отправлено: 22:34 17-10-2023 | Исправлено: hooddy, 22:39 17-10-2023
VadimirTT



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Да, разница есть - характерные jpg-овские артефакты сжатия - серые облачка вокруг букв.

А зачем ресайзить гифы в джипег? Есть же png и tif.

Всего записей: 3024 | Зарегистр. 22-03-2005 | Отправлено: 22:34 17-10-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
zvezdochiot
Тупое применение noteshrink к тому же материалу:

даже после обрезки полей 5 уникальных цветов вместо трёх оригинальных. То есть алгоритм создаёт градации, плавность. При кодировании будет резко завышенный размер.
 

Цитата:
zvezdochiot
Ты всё осуждаешь, но взамен то ничего  не даёшь.

так вроде и не должен.  
Я показал достаточно хитровы...й пример. Умный утащит его себе в копилочку и будет колдовать, увеличивая свой опыт.

Всего записей: 3144 | Зарегистр. 15-07-2010 | Отправлено: 22:52 17-10-2023
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot

Цитата:
Как раз ничего интересного. Такое даже STEX умеет:

после такой обработки текст ocr программами распознается очень неплохо.
 
VadimirTT

Цитата:
А зачем ресайзить гифы в джипег? Есть же png и tif.

А зачем png и tif в данном случае? Есть же pbm/ppm/pgm.

Всего записей: 7458 | Зарегистр. 08-09-2001 | Отправлено: 22:52 17-10-2023
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral say:

Цитата:
будет резко завышенный размер.

Опять флудим? У выложенных мной изображений вообще то размер есть. Что там завышено? Цифры давай.
 

Цитата:
так вроде и не должен.

Ну вот и цена всем твоим словам и твоей "копилки". Полный ноль. Дырка от бублика.
 
 





Самовольное моделирование, оскорбления

Всего записей: 599 | Зарегистр. 18-05-2023 | Отправлено: 22:57 17-10-2023 | Исправлено: Maz, 00:01 19-10-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
А вот для сегментации набор не подходит. "Идеальный случай" вреден для разработки.

Кажется, я написал слишком кратко.
- если программа ошибается на "идеальном" материале, значит такая программа непригодна к использованию
- если программа ошибается на "идеальном" материале, значит можно ткнуть разработчика носом в его недоработки
Проблема в том, что такой "идеальный" материал должен иметь характерные особенности, на которых будет повторяющийся и воспроизводимый отрицательный результат, который можно логически объяснить. Или наоборот - какого лешего программа отрабатывает именно так, хотя это никакой логике не поддаётся.
 

Цитата:
Ну и нахрен тогда автоматика

Я сейчас напишу не сильно точно (лень фактчекить, сорян), но думаю, что смысл поймёте.
10-15 лет назад, чтобы выделить объект в Фотошопе, надо было 100 раз кликнуть мышкой, чтобы обвести сложный контур для выделения объекта. Тупая монотонная неквалифицированная работа. Сейчас надо один раз кликнуть мышкой на объекте, и он будет выделен автоматически.
 

Цитата:
Что меня всегда прям вштыривало

А как вам такое ЕМНИП позаимствовал из темы про FR
 
 
 
Добавлено:
VadimirTT

Цитата:
А зачем ресайзить гифы в джипег? Есть же png и tif.

Чтобы все файлы были одного типа, т.к. цветные страницы изначально в jpg.
Можно, конечно, и в png и в tiff. Но вместо jpg размером 1 МБ мы получим png 5 МБ или tiff 11 МБ. Говорю сразу, я сначала проверил, а потом написал. Некоторые программы не любят загружать сразу 3-5 гигабайт графики. Тяжело им.
 
Также встречный вопрос(ы).
Вы можете выбрать значения параметров и объяснить почему именно так, и ещё с пруфами? Я могу 2-3 и то с трудом. Вы забываете, что мой пост был как бы учебный для любопытного новичка. а не инструкция для прошаренного профи.
Для перекодирования в png необходимо указать:
checkbox - Interlaced
checkbox - Set the transparency value to palette entry 0-9999
Compression level 0-9
Для перекодирования в tiff необходимо указать:
Color compression: None, Packbits, LZW, LZW+Predict, ZIP, JPEG
Binary compression: None, Packbits, LZW, ZIP, CCITT G3, CCITT G3-2D, CCITT G4
JPEG quality 0-100 (default 85)
checkbox - Only one strip
 
Кроме того. jpg - это более универсальный формат. Попробуйте сделать pdf из 3 гигабайт тиффов.
 
Добавлю, чтобы было понятнее. "Новичок любопытный", т.е. когда я написал, что в DjVuToy чекбокс OCR нельзя включать, потому что любопытные новички обязательно его включат, то я сразу получил вопрос "А почему?" На который раньше меня успел ответить TelecomUral. И если бы я начал рассказывать про все варианты кодирования со всеми их опциями - вы бы в простынях запутались бы, а я от встречных вопросов бы утонул.
 
Вы лучше скажите, чем djvu кодировали?

Всего записей: 768 | Зарегистр. 04-11-2019 | Отправлено: 23:16 17-10-2023 | Исправлено: jourmager, 23:55 17-10-2023
hooddy



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
когда я написал, что в DjVuToy чекбокс OCR нельзя включать

ну красная кнопка все равно не сработала, у меня офис 2013, а она хочет максимум 2007. тем не менее, разве распознавание не уменьшает размер и не улучшает начертание, подставляя шрифты?нафига оно тогда вообще, чтобы можно было текст в буфер копипастить?

Всего записей: 2113 | Зарегистр. 08-12-2006 | Отправлено: 00:07 18-10-2023
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager say:

Цитата:
Попробуйте сделать pdf из 3 гигабайт тиффов.

Что значит "попробуйте"? Так и делаем. Получается 10-20Mb pdf с помощью SK или ST + jbig2enc.
 
hooddy say:

Цитата:
разве распознавание не уменьшает размер и не улучшает начертание, подставляя шрифты?нафига оно тогда вообще, чтобы можно было текст в буфер копипастить?

Что то там Adobe пыталось намутить, но по факту все OCR до сих пор работают только в одном направлении и изображений текста не правят.

Всего записей: 599 | Зарегистр. 18-05-2023 | Отправлено: 00:08 18-10-2023 | Исправлено: zvezdochiot, 00:12 18-10-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
zvezdochiot
Что там завышено? Цифры давай.

на:
мой 121к 600дпи
https://disk.yandex.ru/d/E-vJyNdY6AaOAg
твой 137к 300дпи
https://disk.yandex.ru/d/GiwzQP4f5di1cQ
 
 
Добавлено:

Цитата:
jourmager
А как вам такое ЕМНИП позаимствовал из темы про FR

тоже неплохо

Всего записей: 3144 | Зарегистр. 15-07-2010 | Отправлено: 00:20 18-10-2023
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26

Компьютерный форум Ru.Board » Компьютеры » Программы » Формат DjVu и программы для работы с ним


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru