Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Формат DjVu и программы для работы с ним

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29

Открыть новую тему     Написать ответ в эту тему

73



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору


Формат DjVu и программы для работы с ним


Программы для печати (виртуальные принтеры в djvu):
Caminova DjVu Virtual Printer 6.5
Two Pilots DjVu Printer Pilot (freeware)
Распечатка в djvu под Suse Linux через Kprinter
Программы для просмотра и редактирования:
Саminova Document Express with DjVu - пакет приложений для создания и просмотра файлов в формате DjVu. Включает DjVu Plugin, DjVu Editor (Pro) и виртуальный принтер. Document Express Еnterprise - для пакетной обработки файлов.
Текущий официальный сайт: Cuminas & Старый офсайт & Бывший владелец
LizardTech DocumentExpress Enterprise 5.1.0.946
Качать по линку с японского сайта http://www.lizardtech.co.jp/download/djvu/modules/windows/enterprise/5.1/
DocumentExpressEnterprise_5.1.0.zip
(201 метр, пароль на архив: enteval). В дистрибутив входят плагин для браузера, виртуал-принтер, IFilter, GhostScript.
 
LizardTech DjVu Editor DocumentExpress Professional 5.0.0.16
Вариант максимум - качать по линку с японского сайта http://www.lizardtech.co.jp/download/djvu/modules/windows/editor/5.0/ProfessionalEditor.zip (55 метров, пароль на архив: editoreval). Ни плагин, ни виртуал-принтер в этот дистрибутив не входят.
 
Если надо, для русификации Эдитора положите файл DjVuEditorRes_0419.dll от Arcand (берем здесь: http://clubrus.kulichki.com/rus/d/Document%20Express%20Editor%205.0.0.16%20.zip <-Качать даунлоадером!) в папку \Program Files\LizardTech\Lizardtech Document Express Editor 5.0\bin.  
По ссылкам на японский сайт LizardTech идет переадресация на японский же филиал Celartem; ссылки на обе версии DocumentExpress с японских серверов не работают.
 
Вариант минимум - неинсталлируемый рип без Iris-OCR и help, русифицированный Arcand, берем здесь (около 2 метров, bmp->rar).
http://www.djvu-soft.narod.ru/DocExpress50016.rar
 
Если нужно только смотреть дежавю, то плагин к браузеру устанавливается без проблем с англоязычного сайта: http://www.lizardtech.com/download/dl_download.php?detail=doc_djvu_plugin&platform=win  
(иногда на сайте плагин обновляется с запаздыванием, последняя доступная версия 6.0.1, Released: 11.2005, Size: 900 Kb to 7.4 Mb)
Если надо, для русификации положите файл djvu0419.dll от Arcand (берем здесь: http://abab.front.ru/LizardTech_DjVu_Browser_Plug-in_6.0.1_rus.zip <-Качать даунлоадером!) в папку с плагином (\Program Files\LizardTech\Lizardtech DjVu Control\).

 
LizardTech DocumentExpress Pro 4.0.1.235 (30 MB) есть здесь: http://arhiv.org.ru/frikzona/programs/djvu/DocExpressPro4.0.exe RuIPs only. Включает в себя плагин и виртуал-принтер.  
 
Русский 4.1.0.333 без справки, слайд-шоу и распознавания, не требующий инсталляции, есть здесь (2.4 MB): http://hamradio.online.ru/ftp3/dw.php?DjVuEditor_Pro.zip
К нему еще бывают запускалки, брать здесь, bmp->rar.
 
Document Express Editor 6.0.1.1394
Document Express Editor 6.5.0.22420
LizardTech Virtual Printer Pro 4.1.7.1394 из Document Express with DjVu Professional Edition 6.0.1.1394 -- виртуальный принтер для создания DjVu-файлов из любого приложения имеющего функцию печати. Скачать. Serial от Document Express with DjVu Professional Edition 6.0 здесь.
PDF2DJVU 5.1 - конвертер из PDF в DjVu.   Читать обязательно!
DjVuToy -- очень полезная DjVu утилита, включающая в себя DjVuMaker, Merger, Splitter, Bookmarker и т.д.
Сайт автора Jian Ma (китайский) - наиболее интересные софты: ComicEnhancer Pro, DjVuToy, FreePic2Pdf, PdgCntEditor, TiffToy Скачать
Для конвертирования DjVu в PDF служит связка из последних версий DjVuToy + PDG Cnt Editor - неплохие результаты, выходной файл pdf сравнительно небольшого размера. Новое место хранения дистрибутивов
DjVuLibre -- open source реализация DjVu, включающая программу просмотра DjView, плагин для броузеров и утилиты.
WinDjView -- программа для просмотра DjVu-файлов на основе библиотек DjVu Libre.  
Обсуждение здесь, автор Андрей Жежерун (AndyZ)
Evince -- программа для просмотра файлов, в т.ч. DjVu. Часть проекта Gnome. Доступна под Windows.
Обсуждение здесь.
WinDjView c Sub Pixel Rendering  (Заметно улучшает отображение текста. Только для LCD мониторов) added by AciN
DjVuOCR -- программа для добавление текстового слоя в djvu-книги с помощью программы распознавания текста ABBYY FineReader версий 7-9.
Тема в Программах
ScanKromsator -- программа для нарезки страниц и обработки отсканированных изображений, изготовления PDF и DjVu.
Тема в Программах
ScanTailor -- программа для нарезки страниц и обработки отсканированных изображений.
Тема в Программах
DjVu Small -- компактная программа для создания DjVu-файлов (Версия 0.4.4).  
DjVu Small Mod -- программа для создания и декодирования DjVu-файлов. Обсуждение здесь
Sumatra Тема в Программах - бесплатная программа для просмотра разных типов файлов с открытым исходным кодом, в том числе и DjVu. Может использоваться как отдельно, так и плагином, например, к Total Commander.  
pdf2djvu -- польская (от Jakub Wilk) программа для конвертирования PDF-файлов. Проект на гитхабе переведён в read-only с ноября 2022г. анонсирован OCR и поддержка конвертирования аннотаций/гиперссылок.
 • Скрипт правки съехавших гиперссылок -- на Python и DjvuLibre  (Ссылка на ЯД).
 
Инструкции по сборке, для новичков
 
Прочее
 
Примечание
Топик был создан из варезного с аналогичным названием, поскольку там сплошной офтоп. Шапка скопирована с зачисткой всех варезных аспектов, которые остались в Варезнике. Здесь можно обсуждать любые темы DjVu, кроме варезных.  Для сканирования, обработки и всего прочего есть топик в eBookz и не только.

Всего записей: 1543 | Зарегистр. 18-08-2012 | Отправлено: 15:33 01-11-2022 | Исправлено: TelecomUral, 09:55 08-05-2024
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral say:

Цитата:
мой 121к 600дпи vs твой 137к 300дпи

А хде мой 600dpi? И "разница" меня так "поразила", что я аж "обомлел". Колоссальная величина, однако. Не флуди больше.

Всего записей: 983 | Зарегистр. 18-05-2023 | Отправлено: 00:25 18-10-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
jourmager
Кажется, я написал слишком кратко.
- если программа ошибается на "идеальном" материале, значит такая программа непригодна к использованию
- если программа ошибается на "идеальном" материале, значит можно ткнуть разработчика носом в его недоработки
Проблема в том, что такой "идеальный" материал должен иметь характерные особенности, на которых будет повторяющийся и воспроизводимый отрицательный результат, который можно логически объяснить. Или наоборот - какого лешего программа отрабатывает именно так, хотя это никакой логике не поддаётся.  

Это лишний шаг в тестировании сегментера. Для внешнего тестировщика лишний, у него свои наборы из жизни. А для разраба - ему самому видней на чём тестить. Вон как лихо звездочёт ответил про неуниверсальную универсальность.

Всего записей: 3608 | Зарегистр. 15-07-2010 | Отправлено: 00:25 18-10-2023
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Не понимаю, зачем нужно бинаризовать текст.
Можно сделать и так: https://cloud.mail.ru/public/DHAR/behDF4ioi
Фоновый цвет можно при желании сделать любой в ирфане.

Всего записей: 7279 | Зарегистр. 14-01-2005 | Отправлено: 02:27 18-10-2023
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg say:

Цитата:
Не понимаю, зачем нужно бинаризовать текст.

Очень "смешно":

Код:
 
djvudump step2.djvu  
  FORM:DJVU [82189]  
    INFO [10]         DjVu 3104x5638, v25, 600 dpi, gamma=2.2
    Sjbz [21234]      JB2 bilevel data
    FG44 [9974]       IW4 data #1, 100 slices, v1.2 (color), 259x470
    BG44 [5556]       IW4 data #1, 74 slices, v1.2 (color), 1035x1880
    BG44 [7422]       IW4 data #2, 10 slices
    BG44 [2084]       IW4 data #3, 4 slices
    BG44 [35849]      IW4 data #4, 9 slices
 

Угадай, что такое Sjbz, aka JB2 bilevel data. Действительно зачем? А размер BG44 и FG44 в твоём случае очень даже избыточный. По сути вместо FG44 вообще должен быть FGbz. И при этом автосегментация не справилась на наложении чёрной буквы "ш" и белой буквы "И".
 

Всего записей: 983 | Зарегистр. 18-05-2023 | Отправлено: 02:53 18-10-2023 | Исправлено: zvezdochiot, 03:03 18-10-2023
LonerD



Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
TelecomUral

Цитата:
а вот страницу (например) 243 бумажную - это так ST определил, что на ней рисунок ЧБ ? Всё ж пропало.

Никак не определил. Он вообще gifы не прожёвывает.
Это я их не глядя в чёрно-белое конвертировал и засунул в Djvu Small в битонал.
Там на многих страничках вертикальные финтифлюшки потерялись.
Подправил. https://disk.yandex.ru/d/XYvXz3a9iJkfBg
Не проверял правильность, может ещё косяки есть. Цель в данном случае была - восстановить в памяти и записать алгоритм, а полученный файл - это тестовый набросок "по-быстрому".

Всего записей: 904 | Зарегистр. 27-06-2006 | Отправлено: 04:13 18-10-2023 | Исправлено: LonerD, 04:19 18-10-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
оффтоп

Цитата:
shch_vg
Не понимаю, зачем нужно бинаризовать текст.

действительно, "очень смешно".
 
upd
можно и так книги делать
https://disk.yandex.ru/i/0yWWeMJYEvk2fQ
(md5=E618AAFF6926C92B815ACC49B0F10AA8)

Всего записей: 3608 | Зарегистр. 15-07-2010 | Отправлено: 06:52 18-10-2023 | Исправлено: TelecomUral, 07:30 18-10-2023
hooddy

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
хм, прикольно, что мейлру дает джву читать в онлайне

Всего записей: 2261 | Зарегистр. 08-12-2006 | Отправлено: 09:26 18-10-2023 | Исправлено: hooddy, 09:26 18-10-2023
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
у вас закодировалось неправильно, см. в ч/б режиме. Если  экспортировать и пережать cpaldjvu, то  
получится 46.5 кб. Видимо у вас кодек за фон взял белое, что не верно.
Результат, если использовать IM и cpaldjvu:
https://www.upload.ee/files/15824221/res2.djvu.html
код

Всего записей: 1007 | Зарегистр. 14-12-2005 | Отправлено: 11:04 18-10-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
hooddy

Цитата:
это не скриншотер, а типа пдф принтер на стороне литреса

Да. вы правы. Термин pdf-принтер лучше подходит в данном случае.

Цитата:
придется выбирать из двух зол

Для начала напомню, что я отвечал на ваш вопрос:

Цитата:
я думаю, меня вполне устроит такой сценарий. для идиота чуть подробнее можно?

Насколько я понял, вам нужно было практическое принципиальное решение вопроса с некоторыми подробностями, а не обсуждение теоретических вопросов кодирования книг.
Насколько я понял, у вас достаточная квалификация, чтобы применить полученные принципы в других случаях - это одна из причин, почему не затрагивались все возможные варианты изготовления книги.
Мы в теме "Формат DjVu и программы для работы с ним" и обсуждение альтернативных форматов (например, pdf) и программ для их обработки является оффтопом.
Кроме того, уход от темы djvu или обсуждение его недостатков привели бы к (если коротко) хаосу. Что мы сейчас и наблюдаем.
Формат DjVu в его правильном виде предполагает текст в виде бинаризированных 1-битных чёрно-белых (или серо-буромалиновых) изображений, что, естественно, хуже качеством, чем тот же текст в виде изображений с градациями серого (антиалиасинг - сглаживание лесенок на контурах букв) и уж тем более хуже, чем текст в виде векторных шрифтов.

Цитата:
разве распознавание не уменьшает размер и не улучшает начертание, подставляя шрифты?

Да, вы правы - уменьшает размер и улучшает начертание, но с этим в темы про pdf или электронные книги. потому что в djvu такого режима OCR нет вообще. Совсем нет.  
А в PDF - есть. Но такое умеют не все pdf-редакторы. Или умеют извращённым способом - как Adobe Acrobat. Но, повторюсь - тут это оффтоп.

Цитата:
нафига оно тогда вообще, чтобы можно было текст в буфер копипастить?

Да, вы правы - для копирования текста. А также, как побочный продукт копирования текста, - для создания электронных книг в форматах fb2 или epub. А ещё для возможности поиска какого-либо текста по электронной книге - т.н. полнотекстовый поиск.

Всего записей: 1016 | Зарегистр. 04-11-2019 | Отправлено: 11:26 18-10-2023 | Исправлено: jourmager, 12:33 18-10-2023
fozzie

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Да, вы правы - для копирования текста.

Это, скорее, вторичное. Основное - для возможности полнотекстового поиска.

Всего записей: 152 | Зарегистр. 03-09-2001 | Отправлено: 11:57 18-10-2023
hooddy

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager
я надеюсь, ничем вас не задел. я просто пару книг из сканов запилил (ну тут наверное над результатом поржут, но результат меня устроил). здесь же с куда лучшим исходником, чем скан, я столкнулся с проблемами, зачем и пришел. париться со слоями и консольными утилитами я не буду - ни времени ни скилов на это нет.  
 
результат преобразования текста оказывается не айс, потому что по сути не сильно отличается от бинарного, что странно. т.е. пресловутого сглаживания я не получил, по крайней мере не в том качестве, которое ожидал. наверное и размер шрифта тут не способствует желаемому. поколупаю еще по всякому.
 
в любом случае, мне тут все помогли.

Всего записей: 2261 | Зарегистр. 08-12-2006 | Отправлено: 11:58 18-10-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
hooddy

Цитата:
я надеюсь, ничем вас не задел

Нет. Абсолютно нет.

Цитата:
париться со слоями и консольными утилитами я не буду - ни времени ни скилов на это нет.

Я вас прекрасно понимаю. Сам стараюсь по возможности этого избегать. Время дороже, чем погоня за "идеальным" качеством.

Цитата:
результат преобразования текста оказывается не айс, потому что по сути не сильно отличается от бинарного, что странно. т.е. пресловутого сглаживания я не получил

А вот тут я не понял.
Если вы про djvu - то там только "бинарный" текст, и сглаживание контуров букв даже на 600 dpi будет условным, но лучше чем на 300 dpi. Главное - это книгу читать, и читать максимум при масштабе "подгонка по ширине", а изучать шрифты при 6-кратном масштабировании - можно, на практике не нужно. Понятное дело, что если при чтении кровь из глаз, ну тогда ой!
 
Если же вы про pdf - то там при правильном импорте jpg и gif всё будет как в оригинальных сканах, но это тут оффтоп, ибо pdf. А если заморочиться с распознаванием в ФайнРидере с подстановкой шрифтов, то вообще получите книгу "типографского" качества. Кстати, можете попробовать Adobe Acrobat с извращённым OCR - вот вариант от VadimirTT на 11-ом. Ой, опять в оффтоп скатился!
 
Добавлено:
fozzie

Цитата:
Это, скорее, вторичное. Основное - для возможности полнотекстового поиска.

Спасибо, что напомнили про поиск. Я поправлю свой предыдущий пост.
Углубляться в философию, что первично, а что вторично - наверное мне не стоит

Всего записей: 1016 | Зарегистр. 04-11-2019 | Отправлено: 12:25 18-10-2023 | Исправлено: jourmager, 12:27 18-10-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
U235
Результат, если использовать IM и cpaldjvu:

а вот это как раз пример высшего пилотажа. Спасибо.
Я так наверное тоже смогу, но придется похимичить в СК. Не чисто белый использовать.

Всего записей: 3608 | Зарегистр. 15-07-2010 | Отправлено: 13:29 18-10-2023
hooddy

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Мхм, выяснилось, что у меня DjVu Toy вообще древний. Да и сайт автора на вебархиве (в шапке ни слова), а текущие тулзы на шаре https://www.mediafire.com/folder/oajr60vu7zcls/MJ_Stronghorse_Apps#oajr60vu7zcls (там же и движок MODI для OCR). В общем пожал им получил приемлемый результат в 40 МБ.

Всего записей: 2261 | Зарегистр. 08-12-2006 | Отправлено: 16:30 18-10-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
hooddy

Цитата:
у меня DjVu Toy вообще древний

Опаньки. Пардон. Я подумал, что если не найдете, где найти последний DjVuToy, то спросите.

Цитата:
в шапке ни слова

Ага

Всего записей: 1016 | Зарегистр. 04-11-2019 | Отправлено: 16:39 18-10-2023
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
zvezdochiot
Юноша, гадать будете вы. Неужели еще успели побыть фидошником, чтобы всех тыкать.
Научитесь вести себя достойно, а потом только пишите что-нибудь.
На будущее: в вашем мнении я не нуждаюсь, оставляете его при себе.




Переход на личности, оффтоп

Всего записей: 7279 | Зарегистр. 14-01-2005 | Отправлено: 17:45 18-10-2023 | Исправлено: Maz, 00:06 19-10-2023
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg

Цитата:
Юноша,

Сам ты юноша, хамло. Лажу сморозил, так теперь все виновные вокруг. Неуч. Жизни меня тут будет учить. Ага! Щаз!
 
 





Переход на личности, оффтоп. Думаю, пары дней запрета вроде. Отдохните побольше

Всего записей: 983 | Зарегистр. 18-05-2023 | Отправлено: 18:20 18-10-2023 | Исправлено: Maz, 00:07 19-10-2023
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
TelecomUral

Цитата:
действительно, "очень смешно".

Я тоже хочу посмеяться, только над чем?
Вы выложили пример и свою обработку его.
Я обработал по-своему.
Не вижу, чтобы моя обработка в цвете ухудшила исходный пример.

Всего записей: 7279 | Зарегистр. 14-01-2005 | Отправлено: 18:22 18-10-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
shch_vg
Я тоже хочу посмеяться, только над чем?

да много лет слышу о бинаризации текста и вдруг читаю "а зачем?". На смысловом контрасте засмеялся.

Всего записей: 3608 | Зарегистр. 15-07-2010 | Отправлено: 18:43 18-10-2023
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
TelecomUral

Цитата:
да много лет слышу о бинаризации текста и вдруг читаю "а зачем?".

Разговор-то шел о конкретном скане, и имелась в виду бинаризация именно его.

Всего записей: 7279 | Зарегистр. 14-01-2005 | Отправлено: 19:02 18-10-2023
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29

Компьютерный форум Ru.Board » Компьютеры » Программы » Формат DjVu и программы для работы с ним


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2025

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru