Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Утилиты для DjVu: DjVuNMEditor, FR11 DTL Crutch и др.

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37

Открыть новую тему     Написать ответ в эту тему

NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

DjVu Nano Mega Editor
(DjVuNMEditor)

Программа для редактирования в DjVu-книгах:
1) текстового слоя;
2) аннотаций;
3) заголовков страниц (title);
4) метаданных;
5) закладок (bookmarks, outline); в текущей версии не реализовано
6) еще чего-то?
Описание
Скачать v3.6
Английская локализация

TurnTheText

Утилита TurnTheText предназначена для устранения несоответствия графического и текстового слоев в DjVu-книгах, возникающего при использовании FineReader версии 8 (и ниже) для распознавания текста..
Может быть использована, например, перед внедрением оглавления в DjVu-книгу с помощью программы DjVu Hyperlinks Editor..
Описание
Скачать v1.1

DjVu Annotations Editor

Программа для редактирования гиперссылок (annotations/hyperlinks) в файлах формата djvu, преимущественно, после создания оглавлений в книге при помощи DjVu Hyperlinks Editor'а..
Выполняет сдвиг, выравнивание, изменение размеров, цвета, свойств и др..
Описание
Скачать v0.2
Практически весь функционал программы реализован в DjVuNMEditor'е

HeadWorder

Программа для полуавтоматического извлечения заголовков словарных статей из DjVu-словарей, энциклопедий и т.п. и последующего внедрения их в книгу в виде закладок DjVu или WinDjView (с позиционированием)..
Программа устарела так и не выйдя в свет((

FR11 DjVu Text Layer Crutch

Программа для исправления текстового слоя в файле DjVu, созданного посредством ABBYY FineReader билд 11.0.102.583 и выше (в т.ч. ФР12)..
Выполняет следующие действия:
- удаляет блоки Char;
- создает зоны Line и Paragraph;
- объединяет две половинки слова, разделенного знаком переноса, в одно;
- позволяет переносить текстовый слой из одного файла в другой..
Описание
Скачать v0.3.3
Основной функционал программы реализован также в DjVuNMEditor'е

DjVu Chunk Remover

Программа для удаления блоков (чанков), а также страниц из файлов формата DjVu.. может удалять фон (BG44, BGjp), закладки (NAVM), аннотации (ANTa, ANTz), текст (TXTa, TXTz), информацию о цвете маски(FG44, FGbz) и др.. запрещено удаление блоков INFO, Sjbz, Djbz и INCL, содержащих ссылки на Djbz-словари символов..
Описание
Скачать v0.5

DjVu Text Mover

Программа позволяет поворачивать и двигать текстовый слой в файлах DjVu..
Скачать v0.1

DjVu Title Maker

Программа для создания заголовков страниц (переименования страниц) в файлах DjVu..  
Таким образом, страницы можно называть "Обложка", I, II, III, IV и т.п., автоматически или вручную переименовывать страницы со сдвинутой нумерацией (в т.ч. при удалении пустых страниц) для соответствия нумерации электронной книги её бумажному оригиналу..
Описание
Скачать v0.1
Основной функционал программы реализован также в DjVuNMEditor'е

DjVu Clean Page Inserter

Программа для быстрого создания и внедрения в книгу пустых страниц.. Нужна для восстановления соответствия бумажной и электронной нумерации, что облегчает навигацию по книге..
Описание
Скачать v0.1

DjVu Blits Merger

Программа для добавления на страницы djvu-книги графических изображений (mask-слоя) из другого djvu-файла.. Может применяться для добавления в книгу номеров страниц, колонтитулов, другой необходимой информации без перекодирования файла, а также для объединения графики с двух страниц, закодированных с разной степенью сжатия (например, aggressive и lossless)..
Описание
Скачать v0.1

DjVu Blits Hider

Программа для удаления со страниц djvu-книги графических изображений mask-слоя (blits).. может применяться для очистки страницы от "грязных пятен", лишних элементов маски и т.п. без перекодирования файла.. совместно с DjVu Blits Merger'ом позволяет редактировать mask-слой djvu-книги - Hider удаляет, а Merger вставляет на это место нужную графику..
Описание
Скачать v0.1.1

FR12 Parser

Программа для извлечения координат символов из проекта ФР12-16..
Описание
Скачать v2.6

Все программы в одной папке


Программы, которых еще нет, но, возможно, когда-нибудь сделаю..


аналог DjVu Hyperlinks Editor'у с бОльшим функционалом и предварительным просмотром.. DjVuNMEditor
программа для создания и внедрения в книгу пустых страниц.. DjVu Clean Page Inserter
программа для удаления страниц из книги.. DjVu Chunk Remover
программа для удаления пустых чанков, типа CIDa.. DjVu Chunk Remover
программа для добавления текста в нужное место на странице (+ к существующему) DjVuNMEditor
программа для удаления блитов со страницы DjVu Blits Hider
• программа для разделения разворотов на 2 страницы
программа для добавления новых блитов на существующую страницу (объединение графики с двух страниц на одну) DjVu Blits Merger
• программа для перемещения блитов на странице
• программа для кодирования ч/б растра без потерь одним или несколькими большими по размеру шейпами
• еще что-то хотел сделать.. но забыл.. вспомню - запишу))
 
если найдутся желающие сделать эти программы - добро пожаловать)) мыслями и наработками с удовольствием поделюсь)) это относится и к следующему блоку тоже..

Программы, которых нет, и я, к сожалению, наврядли осилю((..

визивиг-редактор текстового слоя.. DjVuNMEditor
Hyperlinks-редактор, типа Document Express Editor, но с возможностью групповой правки аннотаций.. DjVuNMEditor
• полноценный визивиг редактор графики DjVu с возможностью удаления, сдвига, правки шейпов в маске.. а может быть и корректировки фона тоже..
WinDjView с поиском текста в закладках.. ну и некоторыми другими дополнительными возможностями.. таки осилил))
 

продолжение следует..

Всего записей: 1465 | Зарегистр. 26-07-2007 | Отправлено: 22:57 06-02-2012 | Исправлено: NME, 20:07 23-05-2024
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
ох уж эта гордыня

это уже не первое стремление задеть.. прошу больше мне не писать, ответа не последует..

Всего записей: 1465 | Зарегистр. 26-07-2007 | Отправлено: 17:27 10-05-2022 | Исправлено: NME, 17:29 10-05-2022
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
доработал немного парсер, подробности в описании

Всего записей: 1465 | Зарегистр. 26-07-2007 | Отправлено: 19:25 13-05-2022
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NME
 
bolega не может сейчас писать на руборде и просил передать Вам следующее:  
 
Последняя версия парсера теперь отлично обрабатывает tab, за исключением одной проблемы: отточие и длинное тире превращается в один символ, который к сожалению не отделен в annotation пробелом от предыдущего и последующего слова. В итоге два слова плюс символ сливаются в одно слово. Просьба исправить это путем добавления пробела до и после замененного символа, или хотя бы после.  

Всего записей: 1023 | Зарегистр. 13-06-2013 | Отправлено: 09:11 14-05-2022
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013
попробую.. отточия в принципе можно было бы обрабатывать на уровне СК и самостоятельно вставлять пробелы при необходимости, т.к. их координаты отмечены отдельно в файле *.bookmarks, но, если надо, могу вставить на уровне парсера..
проблема в том, что в этом случае количество символов в строке будет отличаться от изначального количества символов и поэтому менять придется больше одной строчки кода, а вижуалстудио до понедельника мне будет недоступно.. попробую без отладчика это сделать, но, если не получится, то до понедельника..
 
Добавлено:
не, не получилось без отладчика.. теперь до понедельника (если к понедельнику это еще нужно будет)..

Всего записей: 1465 | Зарегистр. 26-07-2007 | Отправлено: 10:26 14-05-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NME

Цитата:
 (если к понедельнику это еще нужно будет)..

Нужно!

Всего записей: 4483 | Зарегистр. 09-09-2002 | Отправлено: 07:52 16-05-2022
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Ссылки на парсер обновил

Всего записей: 1465 | Зарегистр. 26-07-2007 | Отправлено: 14:55 16-05-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NME
Недавно обнаружилось, что парсер при извлечении не сохраняет естественный порядок сканов в проекте FR. Возможно, что FR из-за многопоточности сохраняет инфу об ocr не в порядке следования страниц, а по порядку отработки их разными потоками. Это моя гипотеза, возможно, что дело и в другом. Вы не могли бы посмотреть, может при парсинге можно вытащить истинный порядковый номер страницы.
Пример проблемы описан здесь: http://publ.lib.ru/cgi/forum/YaBB.pl?num=1336222925/310#310
http://publ.lib.ru/cgi/forum/YaBB.pl?num=1336222925/305#305
там файлы и видео

Всего записей: 4483 | Зарегистр. 09-09-2002 | Отправлено: 15:44 25-05-2022 | Исправлено: bolega, 15:46 25-05-2022
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
не могу воспроизвести проблему.. ФР12 билд 12.0.121.483 нормально отработал..
вероятные причины:
1) более старый билд ФР12, в котором что-то отличается в организации файла textStorage.dat;  
2) не сохранил проект, а работает с временной папкой
3) ручные правки в проекте (настораживает фраза "в файнридере я специально задал области как текста..")

Всего записей: 1465 | Зарегистр. 26-07-2007 | Отправлено: 18:52 25-05-2022
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
в общем, воспроизвёл проблему - пункт 2 является причиной..

Всего записей: 1465 | Зарегистр. 26-07-2007 | Отправлено: 20:58 25-05-2022
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NME
Спасибо!

Всего записей: 4483 | Зарегистр. 09-09-2002 | Отправлено: 07:47 26-05-2022
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Посмотрел очередное видео с "проблемой парсера" - 100% что юзер делает что-то не так.. скорее всего (99,9%) делает ручные правки в проекте - по этой причине программа может прекратить работу без создания файла..  
0,1% оставляю на то, что билд не подходящий.. но, это маловероятно, т.к. проверил и на 264, и на 483 сборке - нормально работает..  
 
Добавлено:
Чтобы точно проверить, нужны распознаваемые файлы и папка data
 
Добавлено:
Папка data сохранённая, а не из темпа выдернутая

Всего записей: 1465 | Зарегистр. 26-07-2007 | Отправлено: 14:45 26-05-2022
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
обновил DjVuNMEditor..
теперь отображение габаритов зоны при их изменении происходит сразу, а не после нажатия ОК..
полный список изменений в описании..

Всего записей: 1465 | Зарегистр. 26-07-2007 | Отправлено: 21:41 27-05-2022
bearjrgm



Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
А есть утилита, которая удаляет текстовій слой?

Всего записей: 784 | Зарегистр. 03-07-2005 | Отправлено: 21:18 05-07-2022
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А есть утилита, которая удаляет текстовій слой?

Удалить только текстовый слой
djvused foo.djvu -e remove-txt -s

Всего записей: 7443 | Зарегистр. 08-09-2001 | Отправлено: 22:40 05-07-2022
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NME
 
Касательно парсера, своих опытов и различия в структуре пакетов V8-V15....
 
Возможно, под Кромсатор, если это не сложно, разумеется, и стоит подумать о парсере к v8. Попытаюсь обосновать.
 
Структура пакета в V8 c отдельными FRF файлами (и возможностью простой подмены картинок в пакете простым копированием) существенно облегчает сопоставительную работу - страница—текст и минимизирует проблемы со всем пакетом при ручных махинациях.
 
Касательно замечаний об искажении - сам никогда не видел, но не буду исключать, что они есть... Но если они незаметны глазу - что мешает вместе с ТХТ информацией подменить файлы в пакете SK файлами из пакета FR или вообще из SK работать с пакетом FR как с папкой выхода (с автоматической финализацией) (тут и новая функция возможна — коррекция позиций блоков текста при изменении полей/разрешения - мало ли)...
 
Единственная проблема - меньшее количество поддерживаемых языков....В остальном, улучшения версий после 8 не компенсируют их недостатки или стоимость апгрейда, не говоря о покупке новой версии.

Всего записей: 3691 | Зарегистр. 17-09-2001 | Отправлено: 23:46 05-07-2022
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
niccolo
1. искажения на 8ке есть и они могут быть очень существенными
2. я не понимаю о каких ручных махинациях может идти речь - их не должно быть, работа программы при ручных махинациях не гарантирована
3. структура пакета 8 сильно отличается от 12-15 и тратить время (которого к сожалению не хватает даже на интересные мне проекты) на её изучение - вообще никакого желания нет, тем более, что это бесполезная трата времени (см. п. 1)
4. если кому-то очень хочется позаниматься сизифовым трудом - обращайтесь в личку, дам исходники и пилите их хоть под 8ку, хоть под 7ку.. я этим точно заниматься не буду..
 
и вообще, моё отношение к парсеру в последнее время изменилось после того как я подумал, каких дел можно натворить используя его при автоматической замене символов.. если делать автозамену на какой-нибудь беллетристике - тут всё равно, но если это делать в технической литературе с формулами и т.п. или в словарях - то тут всё отдаётся на откуп точности распознания файнридера, а она далеко не идеальная.. и книга будет испорчена, но читатель об этом не узнает.. но будет уверен, что 1+2=8, а "ядерный" по-английски "nudear" - потому что так написано в очень умной книге под редакцией очень умного человека..

Всего записей: 1465 | Зарегистр. 26-07-2007 | Отправлено: 01:42 06-07-2022
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NME

Цитата:
1. искажения на 8ке есть и они могут быть очень существенными

Вы их лично видели? На каких настройках?
 
Я нет, хотя нет - при экспорте в PDF даже с сохранением размеров оригинала иногда на выходе размеры страничек немного плавают. Полагаю, жёсткие искажения скорее исключения. Для мелких незаметных глазу но заметных программе, можно финальные файлы кромсатора заменить файлами из пакета FR - какая разница, если на глаз не отличишь?
 

Цитата:
2. я не понимаю о каких ручных махинациях может идти речь - их не должно быть, работа программы при ручных махинациях не гарантирована

Вы видимо никогда не сталкивались с кривой расстановкой зон распознавания в ФР, заскоками с неверным определением ориентации, незахватом в зоны распознавания текста на фоне, оторванного от основного и т.п., пропусков?
 
Эти ситуации в моей практике встречаются очень часто...
.

Цитата:
3. структура пакета 8 сильно отличается от 12-15 и тратить время (которого к сожалению не хватает даже на интересные мне проекты) на её изучение - вообще никакого желания нет, тем более, что это бесполезная трата времени (см. п. 1)

 
Понял. Этот пункт надо было сделать первым.
 

Цитата:
тут всё равно, но если это делать в технической литературе с формулами и т.п. или в словарях - то тут всё отдаётся на откуп точности распознания файнридера, а она далеко не идеальная.. и книга будет испорчена, но читатель об этом не узнает.. но будет уверен, что 1+2=8, а "ядерный" по-английски "nudear" - потому что так написано в очень умной книге под редакцией очень умного человека..
 

 
Это вполне можно было сделать и раньше просто в графическом редакторе....  
Я например так и делал нередко в словарях, интегрируя Errata в основной текст.
 
В формулы никто не полезет, т.к. файнридер их не распознаёт...
 
Ошибки подобные описанной регулярно появляются в вопросах на переводческих форумах... И для этого даже не надо изображения - у мозга и так есть особенность автозавершения слов по первым буквам....

Всего записей: 3691 | Зарегистр. 17-09-2001 | Отправлено: 21:40 06-07-2022
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
niccolo

Цитата:
Вы их лично видели?

Я для их минимизации в файлах djvu специально утилиту сделал, в шапке есть, турнзэтекст называется..  
А искажения бывают такие, что распознанный текст с графикой даже не пересекаются в некоторых местах..  
После кромсатора, скорее всего таких ужасов не будет, но всё равно неотключаемые "улучшалки" будут делать своё дело..

Цитата:
Вы видимо никогда не сталкивались с кривой расстановкой зон распознавания в ФР
конечно сталкивался.. но расставить зоны заново в 12-15 не сложнее, чем в 8ке..  
 
В общем, чтоб подытожить еще раз повторюсь - лично я не буду делать парсер под 8ку, для меня эта тема закрыта..

Всего записей: 1465 | Зарегистр. 26-07-2007 | Отправлено: 01:37 07-07-2022
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Продолжаю операцию по превращению DjVuNMEditor'а из Nano в Mega))
В версии 3.0 реализована возможность работы с djvu-аннотациями.. Если кто-то юзает мою утилитку DjVu Annotations Editor, то может смело её удалять и переходить на DjVuNMEditor - там реализован практически весь её функционал)) Получается, что вычеркнул еще один пункт в шапке, про который ранее думал, что никогда не реализую))
В процессе тестирования обнаружил одну неприятную особенность файнридера 12 - он принудительно увеличивает в 2 раза страницы с низким разрешением, в т.ч. со 150 и 200 дпи, даже отключение всех улучшалок не помогает.. Пришлось сделать масштабирование текста (при необходимости) при переносе его в другой документ.. Делает программа это автоматически, дополнительных действий от пользователя не требуется..
На английскую длл-ку решил пока забить, может быть потом при желании сделаю..

Всего записей: 1465 | Зарегистр. 26-07-2007 | Отправлено: 22:37 20-07-2022
sirius12

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Благодарю за программу FR11 DjVu Text Layer Crutch, она фактически решила проблему с оцифровкой текстов для встраивания слоя в DjVu, потому что я очень люблю FR12!

Всего записей: 15 | Зарегистр. 10-07-2022 | Отправлено: 11:23 24-07-2022
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37

Компьютерный форум Ru.Board » Компьютеры » Программы » Утилиты для DjVu: DjVuNMEditor, FR11 DTL Crutch и др.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru