Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Формат DjVu и программы для работы с ним

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29

Открыть новую тему     Написать ответ в эту тему

73



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору


Формат DjVu и программы для работы с ним


Программы для печати (виртуальные принтеры в djvu):
Caminova DjVu Virtual Printer 6.5
Two Pilots DjVu Printer Pilot (freeware)
Распечатка в djvu под Suse Linux через Kprinter
Программы для просмотра и редактирования:
Саminova Document Express with DjVu - пакет приложений для создания и просмотра файлов в формате DjVu. Включает DjVu Plugin, DjVu Editor (Pro) и виртуальный принтер. Document Express Еnterprise - для пакетной обработки файлов.
Текущий официальный сайт: Cuminas & Старый офсайт & Бывший владелец
LizardTech DocumentExpress Enterprise 5.1.0.946
Качать по линку с японского сайта http://www.lizardtech.co.jp/download/djvu/modules/windows/enterprise/5.1/
DocumentExpressEnterprise_5.1.0.zip
(201 метр, пароль на архив: enteval). В дистрибутив входят плагин для браузера, виртуал-принтер, IFilter, GhostScript.
 
LizardTech DjVu Editor DocumentExpress Professional 5.0.0.16
Вариант максимум - качать по линку с японского сайта http://www.lizardtech.co.jp/download/djvu/modules/windows/editor/5.0/ProfessionalEditor.zip (55 метров, пароль на архив: editoreval). Ни плагин, ни виртуал-принтер в этот дистрибутив не входят.
 
Если надо, для русификации Эдитора положите файл DjVuEditorRes_0419.dll от Arcand (берем здесь: http://clubrus.kulichki.com/rus/d/Document%20Express%20Editor%205.0.0.16%20.zip <-Качать даунлоадером!) в папку \Program Files\LizardTech\Lizardtech Document Express Editor 5.0\bin.  
По ссылкам на японский сайт LizardTech идет переадресация на японский же филиал Celartem; ссылки на обе версии DocumentExpress с японских серверов не работают.
 
Вариант минимум - неинсталлируемый рип без Iris-OCR и help, русифицированный Arcand, берем здесь (около 2 метров, bmp->rar).
http://www.djvu-soft.narod.ru/DocExpress50016.rar
 
Если нужно только смотреть дежавю, то плагин к браузеру устанавливается без проблем с англоязычного сайта: http://www.lizardtech.com/download/dl_download.php?detail=doc_djvu_plugin&platform=win  
(иногда на сайте плагин обновляется с запаздыванием, последняя доступная версия 6.0.1, Released: 11.2005, Size: 900 Kb to 7.4 Mb)
Если надо, для русификации положите файл djvu0419.dll от Arcand (берем здесь: http://abab.front.ru/LizardTech_DjVu_Browser_Plug-in_6.0.1_rus.zip <-Качать даунлоадером!) в папку с плагином (\Program Files\LizardTech\Lizardtech DjVu Control\).

 
LizardTech DocumentExpress Pro 4.0.1.235 (30 MB) есть здесь: http://arhiv.org.ru/frikzona/programs/djvu/DocExpressPro4.0.exe RuIPs only. Включает в себя плагин и виртуал-принтер.  
 
Русский 4.1.0.333 без справки, слайд-шоу и распознавания, не требующий инсталляции, есть здесь (2.4 MB): http://hamradio.online.ru/ftp3/dw.php?DjVuEditor_Pro.zip
К нему еще бывают запускалки, брать здесь, bmp->rar.
 
Document Express Editor 6.0.1.1394
Document Express Editor 6.5.0.22420
LizardTech Virtual Printer Pro 4.1.7.1394 из Document Express with DjVu Professional Edition 6.0.1.1394 -- виртуальный принтер для создания DjVu-файлов из любого приложения имеющего функцию печати. Скачать. Serial от Document Express with DjVu Professional Edition 6.0 здесь.
PDF2DJVU 5.1 - конвертер из PDF в DjVu.   Читать обязательно!
DjVuToy -- очень полезная DjVu утилита, включающая в себя DjVuMaker, Merger, Splitter, Bookmarker и т.д.
Сайт автора Jian Ma (китайский) - наиболее интересные софты: ComicEnhancer Pro, DjVuToy, FreePic2Pdf, PdgCntEditor, TiffToy Скачать
Для конвертирования DjVu в PDF служит связка из последних версий DjVuToy + PDG Cnt Editor - неплохие результаты, выходной файл pdf сравнительно небольшого размера. Новое место хранения дистрибутивов
DjVuLibre -- open source реализация DjVu, включающая программу просмотра DjView, плагин для броузеров и утилиты.
WinDjView -- программа для просмотра DjVu-файлов на основе библиотек DjVu Libre.  
Обсуждение здесь, автор Андрей Жежерун (AndyZ)
Evince -- программа для просмотра файлов, в т.ч. DjVu. Часть проекта Gnome. Доступна под Windows.
Обсуждение здесь.
WinDjView c Sub Pixel Rendering  (Заметно улучшает отображение текста. Только для LCD мониторов) added by AciN
DjVuOCR -- программа для добавление текстового слоя в djvu-книги с помощью программы распознавания текста ABBYY FineReader версий 7-9.
Тема в Программах
ScanKromsator -- программа для нарезки страниц и обработки отсканированных изображений, изготовления PDF и DjVu.
Тема в Программах
ScanTailor -- программа для нарезки страниц и обработки отсканированных изображений.
Тема в Программах
DjVu Small -- компактная программа для создания DjVu-файлов (Версия 0.4.4).  
DjVu Small Mod -- программа для создания и декодирования DjVu-файлов. Обсуждение здесь
Sumatra Тема в Программах - бесплатная программа для просмотра разных типов файлов с открытым исходным кодом, в том числе и DjVu. Может использоваться как отдельно, так и плагином, например, к Total Commander.  
pdf2djvu -- польская (от Jakub Wilk) программа для конвертирования PDF-файлов. Проект на гитхабе переведён в read-only с ноября 2022г. анонсирован OCR и поддержка конвертирования аннотаций/гиперссылок.
 • Скрипт правки съехавших гиперссылок -- на Python и DjvuLibre  (Ссылка на ЯД).
 
Инструкции по сборке, для новичков
 
Прочее
 
Примечание
Топик был создан из варезного с аналогичным названием, поскольку там сплошной офтоп. Шапка скопирована с зачисткой всех варезных аспектов, которые остались в Варезнике. Здесь можно обсуждать любые темы DjVu, кроме варезных.  Для сканирования, обработки и всего прочего есть топик в eBookz и не только.

Всего записей: 1543 | Зарегистр. 18-08-2012 | Отправлено: 15:33 01-11-2022 | Исправлено: TelecomUral, 09:55 08-05-2024
hooddy

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager
вполне возможно Вы правы про скриншоты на лету... уж я этого абсолютно точно не знаю.
 
Добавлено:

Цитата:
я от нечего делать в XnView проапскейлил все гифы и джипеги на 200%, потом загнал их в DjVuToy lossless/1 , 100%. Полный автомат, десяток кликов мышкой. На выходе djvu 44 МБ, качество от оригинала отличить можно, но трудно. Я так ещё в djvu уверую...

я думаю, меня вполне устроит такой сценарий. для идиота чуть подробнее можно?

Всего записей: 2261 | Зарегистр. 08-12-2006 | Отправлено: 18:21 16-10-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
hooddy

Цитата:
чуть подробнее можно?

Да, можно, но чуток позднее.

Всего записей: 1016 | Зарегистр. 04-11-2019 | Отправлено: 19:09 16-10-2023
VadimirTT



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Мой вариант книги, с оцр и оглавлением.
Ссылка

Всего записей: 3979 | Зарегистр. 22-03-2005 | Отправлено: 19:23 16-10-2023
LonerD



Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
LonerD

Цитата:
В ScanTailor есть разделение слоёв, осталось вспомнить как и с какими настройками их объединить потом. Может кто напомнит?

Потихоньку восстановил в памяти процесс обработки. Опишу процедуру. Может, кому полезно будет, да и я сам через несколько лет опять забуду.
 
Обработать файлы в Scan Tailor Advanced от 4lex4. На конечном шестом этапе поставить галочки в разделе Splitting (Split output) для формирования отдельных файлов для foreground и background.
(можно обработать в другой версии Scan Tailor, но тогда придётся задействовать утилиту ST Separator)
Из файлов foreground сформировать чёрно-белый DjVu. Например, в DjVu Small Mod, профиль Original, тип Bitonal.
Ключевой момент - руководство "Scan Tailor. Руководство пользователя"!
http://djvu-spec.narod.ru/st_manual_rus.pdf
Глава "13. Создание качественных DjVu методом вклейки иллюстраций" (п. 13.1, 13.2, 13.5)
Переименовать файлы из background *.tif -> *.sep.tif (иначе DjVu Imager из не "поймёт").
И дальше по инструкции всё делается в DjVu Imager - выбрать файлы фона (имена должны совпадать с именами файлов foreground, в которые фоны будут вклеиваться), пережать фоны с желаемыми настройками ухудшения качества (всего пару настроек), выбрать созданный ранее битональный djvu и вклеить фоны.
На этапе вклейки может возникнуть ошибка наподобие "The sizes of the illustration "000.sep.tif" do not correlate with the sizes of the corresponding pasted-on DjVu-page." В реальности размеры правильные, но проблема в том, что foreground 000.tif в моём случае был "пустышкой" (страница полностью состояла из фона), потому такие файлы можно пропустить и вклеить потом вручную.
 
В случае с книгой "Живопись маслом для чайников" обработка в Scan Tailor была простейшей и заключалась лишь в выделении зон картинок. А дальше уже всё автоматизировано, надо было только понять что и где нажимать.
Результат получился таким - 16.7 Мб  
https://disk.yandex.ru/d/XYvXz3a9iJkfBg
 
Полагаю, с помощью Кромсатора и понтов можно получить качество получше. Но это уже для совсем гуру.
А в описанном мною бытовом методе получается оптимальное соотношение качества DjVu и времязатрат на обработку.

Всего записей: 904 | Зарегистр. 27-06-2006 | Отправлено: 20:32 16-10-2023 | Исправлено: LonerD, 04:07 18-10-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
1) Создаём два каталога Original jpg и Original gif, куда копируем исходные "скриншоты" в виде соответственно jpg и gif
2) Создаём пустой каталог 2x
3) Запускаем XnView Classic
3а) В браузере XnView заходим в каталог Original jpg и выделяем (с shift) все файлы jpg
3б) меню XnView -> Tools -> Batch Processing -> на вкладке General в окошке Input уже есть все файлы, там же в разделе Output устанавливаем Directory как 2х, Format - JPG-JPEG/JIFF и в Options устанавливаем качество jpg 100% вместо 75% по умолчанию
3в) там же на вкладке Transformations в левом окошке выбираем Image -> Resize и нажимаем кнопку  Add между вкладками. В появившихся Parameters выбираем % >> 200
3г) жмём кнопку Go. Появляется окошко с прогреес-баром. Ждём. У меня на 100 файлов ушло 2 минуты.
4) аналогично с gif
4а) В браузере XnView заходим в каталог Original gif и выделяем (с shift) все файлы gif
4б) меню XnView -> Tools -> Batch Processing -> на вкладке General в окошке Input уже есть все файлы, там же в разделе Output устанавливаем Directory как 2х, Format - GIf - CompuServe GIF
4в) там же на вкладке Transformations в левом окошке выбираем Image -> Resize и нажимаем кнопку  Add между вкладками. В появившихся Parameters выбираем % >> 200
4г) жмём кнопку Go. Появляется окошко Save as - Color mode. Устанавливаем Grey Scale - 256. Жмём ОК. Появляется окошко с прогреес-баром. Ждём. У меня на 230 файлов ушло 6 минут.
5) Запускаем DjVuToy
5а) Выбираем вкладку Maker
5б) выбираем каталог "2х" с исходными файлами - окошко 1. Source folder or file, левая кнопка (правая - выбор файлов)
5в) в окошке 3. target DjVu file автоматически появится название выходного файла
5г) жмём кнопку 4. Options
- в разделе B/W image выбираем Compression -> Lossless, pages per dictionary -> 1
- в разделе Color image выбираем Quality 100% (можно 95% - тогда размер файла уменьшиться с 40 МБ до 30 МБ, можно и меньше, пока кровь из глаз не пойдёт) вместо 75% по умолчанию  
- в разделе Color image выбираем Content -> Document (3 layers)
- жмём ОК и возвращаемся на вкладку Maker
5д) смотрим на всякое разное: 2. Temp folder, Sort Alphabetical/Numerical, не включаем OCR
5е) жмём кнопку 5. Go
5ж) сначала идёт Analyzing - у меня на 330 файлов ушло 3 минуты
5з) после окончания анализа программа подвисает на минуту
5и) затем начинается собственно сам процесс создания djvu - сегментация, слияние слоёв, вот это вот всё. У меня это заняло 6 минут
5к) после окончания кодирования (кнопка ОК) переходим на вкладку DPI & Width, в окошке The source DjVu to be processed выбираем получившийся 2x.djvu, в левом разделе Fixed DPI for every page устанавливаем Fixed DPI -. 600, жмём кнопку Go
6) внимательно смотрим получившийся файл и сравниваем его с оригиналом, обращая внимание на возможные проблемные места - текст на картинках (стр. 20 файла), вертикальные серые линии во всему тексту, штриховые картинки (стр.53, 57) и конечно цветные изображения и обычный текст.

Всего записей: 1016 | Зарегистр. 04-11-2019 | Отправлено: 20:58 16-10-2023 | Исправлено: jourmager, 23:13 16-10-2023
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager say:

Цитата:
5) Запускаем DjVuToy

А как пропущенные страницы (как вариант белые) замещать? Ни у кого пока замещения пропусков не наблюдалось.
 

Всего записей: 983 | Зарегистр. 18-05-2023 | Отправлено: 21:47 16-10-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot

Цитата:
А как пропущенные страницы (как вариант белые) замещать?

Спасибо, что обратили на это внимание.
Лично я стараюсь по возможности всегда вставлять пустые белые страницы, чтобы не нарушать нумерацию.
С этим конкретным файлом в некоторых местах это придётся делать наугад.
Но делается это элементарно просто.

Всего записей: 1016 | Зарегистр. 04-11-2019 | Отправлено: 23:31 16-10-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
LonerD
а вот страницу (например) 243 бумажную - это так ST определил, что на ней рисунок ЧБ ? Всё ж пропало.
 
И вообще, поразглядывав повнимательнее кто что сделал - СК единственно приемлем. Как это было 20 последних лет, так и осталось. Хотя дело, собственно, и не в инструменте, а в пофигизме изготовителя.
Инструмент и обработчик - два сапога пара.

Всего записей: 3608 | Зарегистр. 15-07-2010 | Отправлено: 06:55 17-10-2023
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral say:

Цитата:
поразглядывав повнимательнее кто что сделал - СК единственно приемлем.

Это "слегка" наглость и бесстыдство, так как результата СК никакого в теме пока не наблюдается. Понятное дело, что возможностей у СК поболее, но хде сам результат? Хде он?
 

Всего записей: 983 | Зарегистр. 18-05-2023 | Отправлено: 07:34 17-10-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot
я не ставлю тут цель рассказать "СК - лучший!!" И тем более доказать это. Писал для hooddy, так как он отрицательно прокомментировал, пару раз, выложенное. Ну или авось кто прочтёт новенький/не в теме.
 
Ветка про формат djvu, а правильно закодированного джву, например, для упомянутой странички, или для странички 227, не углядел.
По идеологии стандарта 227я должна быть примерно такой:
https://disk.yandex.ru/d/QvwdJZsSUmmQeQ

Всего записей: 3608 | Зарегистр. 15-07-2010 | Отправлено: 09:11 17-10-2023
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral say:

Цитата:
я не ставлю тут цель рассказать "СК - лучший!!"

Именно так вы и сделали. А помимо этого умудрились причислить всех участников темы к безруких, ничего не умеющим проходимцам. Такие вот дела.
 
 





Оскорбления

Всего записей: 983 | Зарегистр. 18-05-2023 | Отправлено: 09:16 17-10-2023 | Исправлено: Maz, 00:02 19-10-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot
повторяю: ветка про формат djvu

Всего записей: 3608 | Зарегистр. 15-07-2010 | Отправлено: 09:47 17-10-2023
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
ветка про формат djvu

Вот именно! А ты конкретно заоффтопил.





Самовольное моделирование. Пару суток отдохнём

Всего записей: 983 | Зарегистр. 18-05-2023 | Отправлено: 09:49 17-10-2023 | Исправлено: Maz, 00:03 19-10-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
По идеологии стандарта 227я должна быть примерно такой

Да. Вы правы. Но вам не кажется, что в погоне буквой стандарта или формата можно упустить дух стандарта или формата?
 
DjVu как формат и как стандарт предполагает некий баланс (с точки зрения 2000 года) между размером, качеством и скоростью изготовления. Вы стандарт почитайте - там про это прямо написано. OCR даёт наилучшие результаты, но на тот момент (2000 год) трудозатраты были слишком велики, а уровень технологии слишком низок. И на то время PDF был закрытым проприетарным стандартом.
 
Автосегментер djvu, который существует 2 видов - djvulibre и DEE - имеет возраст 15-20 лет. И он явно не создавался под технологии вёрстки XXI века. И улучшать эти автосегментеры никто не будет. Потому что djvu мало кому интересен.
 
С точки зрения читателя все 227-ые страницы (включая оригинал) выглядят одинаково. Только сравнив их "в лоб" внимательный читатель увидит разницу. Что там под капотом - читателю всё равно.
 
А вот огрехи работы автосегментера на 20-й странице файла уже явно бросаются в глаза.
 
Ещё раз - если при сравнении оригинала и получившегося djvu читатель не увидит разницы, или разница будет пренебрежимо малой - то такой результат приемлем.
 

Цитата:
И вообще, поразглядывав повнимательнее кто что сделал - СК единственно приемлем. Как это было 20 последних лет, так и осталось. Хотя дело, собственно, и не в инструменте, а в пофигизме изготовителя. Инструмент и обработчик - два сапога пара.

Как я уже говорил, никто в здравом уме не будет спорить, что ручная сегментация на данный момент лучше чем автоматическая. Но какой ценой это достигается? Сколько надо времени на обработку этих сканов вручную в СК? Два часа? А у меня автообработка заняла 2 минуты.  
 
Негативный результат после СканТейлора могу объяснить только спешкой изготовителя.
 
Кстати, вас не удивляет, что за 20 лет никто не сделал конкурента СканКромсатору с более понятным интерфейсом? Там ведь ничего сложного нет - это не ИИ забабахать, подобный Topaz Photo или Adobe Firefly. А наоборот, все двигались в сторону максимальной автоматизации.
 
Теперь процитирую bolega  

Цитата:
Поясню: когда раскрашенные участки имеют идеально одинаковый цвет, фон идеально равномерный, граница тест/фон или цвет1/цвет2 идеально четкая, без градиентов, то сделать автосегментацию - это пустяк.


Цитата:
Таких идеальных условий на практике не бывает, поэтому в СК ее нет.

А теперь вопрос - является ли обсуждаемый нынче набор сканов идеальным? Идеальным для автосегментации, как это написал bolega.
 
Это я к тому. что разумная комбинация автоматики и ручного труда даёт наилучшее соотношение качества и трудозатрат. Но автоматики вам, сканкромсаторщикам, не видать. Если, конечно, bolega не изменит свою точку зрению. Изменить программу, добавив автоматику, для него - "пустяк", а вот изменить своё мнение...

Всего записей: 1016 | Зарегистр. 04-11-2019 | Отправлено: 12:00 17-10-2023 | Исправлено: jourmager, 12:00 17-10-2023
hooddy

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
не включаем OCR  

почему?

Всего записей: 2261 | Зарегистр. 08-12-2006 | Отправлено: 12:22 17-10-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
вам, сканкромсаторщикам

не надо приписывать мне несуществующие в реальности свойства
Я честно пробовал тейлор. Даже чего-то там предлагал улучшить с габаритами полей. Но когда я стремлюсь изготовить книгу хорошо ни один инструмент не так хорош как СК. Об этом я и написал.
 
А что такое "хорошо"?
Это для меня (!):
визуальная идентичность оригиналу как его видел автор
читабельность для конечного пользователя (ЧБ текст, отсутствие мути на рисунках)
минимально достижимый при этом размер
 
Вот по этим трём критериям я 227ю страничку и обрабатывал. Ничего не пытаясь кому бы то ни было доказать, убедить, попонтоваться. Лет 13, а то и поболее, назад я выявил критерии качественной работы, им и следую публично. Для себя, без распространения, я делаю много хуже. Ну, может не много, но существенно. Допускаю мусорины, неточные поля и тэ пэ. Даже разводы от низкого дпи в background допускаю. А в паблик то зачем потенциальную фигню класть. Кому-то разница 381кб против 155кб ну вообще никуда не упирается. А кому-то потом новый диск покупать, или батарейка модема в экспедиции разрядится невовремя. Я именно с этих позиций и стандарт читал, и тексты в интернете пишу. Люди должны видеть эталон, чтобы понимать как можно делать и жить.
 
Добавлено:
оффтоп
 
 
Добавлено:

Цитата:
jourmager
не включаем OCR

hooddy
потому что кое-в-каких djvutoy его вообще нет, а там где есть он потребует доустановки в винду модулей OCR от майкрософт. Тот ещё геморрой. И качество на выходе будет много хуже чем у тессеракта.

Всего записей: 3608 | Зарегистр. 15-07-2010 | Отправлено: 12:43 17-10-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Вот наглядное сравнение: Просто ради любопытства.
Слева направо:  
- автосегментация в редакторе OCR FineReader 16
- автосегментация - слой foreground в djvu полученном в FineReader 16
- автосегментация - как бы foreground в pdf полученном в Adobe Acrobat 11 при применении OCR ClearScan изготовления VadimirTT
- ручная сегментация - слой foreground в djvu полученном в ScanKromsator изготовления TelecomUral
 
Видно:
- автосегментация модуля OCR в FineReader даёт тот же самый результат, что и ручная сегментация
- автосегментация Adobe Acrobat 10-летней давности незначительно промахивается
- автосегментация модуля djvu в FineReader показывает неудовлетворительный результат
 
Что из этого следует? А ничего. Потому что это только 1 страница из существующих миллионов. Потому что кроме сегментации есть ещё множество действий, которые и определяют результат на выходе.
 
P.S. Конечно, я не настаиваю, но всё же интересно. Вы не ответили на мой вопрос - "является ли обсуждаемый нынче набор сканов идеальным? Идеальным для автосегментации"
P.P.S. Оффтоп. Или нет.
Цитата:
И окажет воздействие, неминуемо.

Я недавно искал фотографию картины. Художник известный, на уровне Рембрандта. Картина под названием что-типа "Женщина в красном платье". Ни на одной репродукции этой картины в интернете, ни в одной книге про этого художника я не увидел красного цвета. Вообще. При этом очень смешно под репродукциями читать описания искусствоведов, какой на этой картине чудесный красный цвет у платья.
Это я к тому, что человеки не такие дурные, чтобы на них оказала воздействие кривая автосегментация в книге про живопись. А вот мысли в книгах повлиять могут. И есть разница, или человек прочитаем одну прекрасно сделанную вручную книгу, или десять книг, сделанных незаметно на глаз хуже.

Всего записей: 1016 | Зарегистр. 04-11-2019 | Отправлено: 16:31 17-10-2023 | Исправлено: jourmager, 17:01 17-10-2023
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
jourmager

Цитата:
автосегментация модуля djvu в FineReader

Имеется в виду в djvu, получаемом после распознавания пдф/djvu в ФР?
У меня все такие djvu получаются в виде 300/100, правда в ФР15.

Всего записей: 7279 | Зарегистр. 14-01-2005 | Отправлено: 18:20 17-10-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg

Цитата:
Имеется в виду в djvu, получаемом после распознавания пдф/djvu в ФР?

FR16 OCR Editor -> Open Image -> исходник jpg 600 dpi > Save as djvu  
При этом FineReader ещё хочет распознать. Было разрешено.
djvu Options: text under page image, best quality, multiple layers - automatic
 
Получилось:
Sjbz - JB2 foreground mask - 600 dpi
IW44 foreground colors - 50 dpi
IW44 background - 200 dpi
 
При тех же djvu Options: text under page image, best quality, multiple layers - automatic у меня в FR15  аналогично 600-50-200
 
Распознаёт плохо.
'%М  5  ИШ  ^рО^ЛША/  КОФ^А  кишшь  МА6Л0М  НА
КА^Ш  5  БАННОЙ.  На  НОрМрШ€  Племянницы  Б
&0Л06АУ  МЫЛЬНАЯ  ИЩА,  А  Н06  5  0  0^^  НА^О  Ш-Н
ЬАКр^НЛЯМ!?,  ИМо5ы  Н€  КОМиА
 
P.S. Жалко тут не тема про FineReader, а то бы я щас любителям "раньше было лучше" продемонстрировал бы результаты FR8

Всего записей: 1016 | Зарегистр. 04-11-2019 | Отправлено: 18:43 17-10-2023 | Исправлено: jourmager, 19:19 17-10-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
jourmager
P.S. Конечно, я не настаиваю, но всё же интересно. Вы не ответили на мой вопрос - "является ли обсуждаемый нынче набор сканов идеальным? Идеальным для автосегментации"

а с какой целью интересуетесь??
Я это к чему: тут нет разработчиков алгоритмов автосегментации.  
 
оффтоп, причём сильный

Всего записей: 3608 | Зарегистр. 15-07-2010 | Отправлено: 20:16 17-10-2023
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29

Компьютерный форум Ru.Board » Компьютеры » Программы » Формат DjVu и программы для работы с ним


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2025

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru