Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Утилиты для DjVu: DjVuNMEditor, FR11 DTL Crutch и др.

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36

Открыть новую тему     Написать ответ в эту тему

NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

DjVu Nano Mega Editor
(DjVuNMEditor)

Программа для редактирования в DjVu-книгах:
1) текстового слоя;
2) аннотаций;
3) заголовков страниц (title);
4) закладок (bookmarks, outline); в текущей версии не реализовано
5) метаданных; в текущей версии не реализовано
6) еще чего-то?
Описание
Скачать v3.5
Английская локализация

TurnTheText

Утилита TurnTheText предназначена для устранения несоответствия графического и текстового слоев в DjVu-книгах, возникающего при использовании FineReader версии 8 (и ниже) для распознавания текста..
Может быть использована, например, перед внедрением оглавления в DjVu-книгу с помощью программы DjVu Hyperlinks Editor..
Описание
Скачать v1.1

DjVu Annotations Editor

Программа для редактирования гиперссылок (annotations/hyperlinks) в файлах формата djvu, преимущественно, после создания оглавлений в книге при помощи DjVu Hyperlinks Editor'а..
Выполняет сдвиг, выравнивание, изменение размеров, цвета, свойств и др..
Описание
Скачать v0.2
Практически весь функционал программы реализован в DjVuNMEditor'е

HeadWorder

Программа для полуавтоматического извлечения заголовков словарных статей из DjVu-словарей, энциклопедий и т.п. и последующего внедрения их в книгу в виде закладок DjVu или WinDjView (с позиционированием)..
Программа устарела так и не выйдя в свет((

FR11 DjVu Text Layer Crutch

Программа для исправления текстового слоя в файле DjVu, созданного посредством ABBYY FineReader билд 11.0.102.583 и выше (в т.ч. ФР12)..
Выполняет следующие действия:
- удаляет блоки Char;
- создает зоны Line и Paragraph;
- объединяет две половинки слова, разделенного знаком переноса, в одно;
- позволяет переносить текстовый слой из одного файла в другой..
Описание
Скачать v0.3.3
Основной функционал программы реализован также в DjVuNMEditor'е

DjVu Chunk Remover

Программа для удаления блоков (чанков), а также страниц из файлов формата DjVu.. может удалять фон (BG44, BGjp), закладки (NAVM), аннотации (ANTa, ANTz), текст (TXTa, TXTz), информацию о цвете маски(FG44, FGbz) и др.. запрещено удаление блоков INFO, Sjbz, Djbz и INCL, содержащих ссылки на Djbz-словари символов..
Описание
Скачать v0.5

DjVu Text Mover

Программа позволяет поворачивать и двигать текстовый слой в файлах DjVu..
Скачать v0.1

DjVu Title Maker

Программа для создания заголовков страниц (переименования страниц) в файлах DjVu..  
Таким образом, страницы можно называть "Обложка", I, II, III, IV и т.п., автоматически или вручную переименовывать страницы со сдвинутой нумерацией (в т.ч. при удалении пустых страниц) для соответствия нумерации электронной книги её бумажному оригиналу..
Описание
Скачать v0.1
Основной функционал программы реализован также в DjVuNMEditor'е

DjVu Clean Page Inserter

Программа для быстрого создания и внедрения в книгу пустых страниц.. Нужна для восстановления соответствия бумажной и электронной нумерации, что облегчает навигацию по книге..
Описание
Скачать v0.1

DjVu Blits Merger

Программа для добавления на страницы djvu-книги графических изображений (mask-слоя) из другого djvu-файла.. Может применяться для добавления в книгу номеров страниц, колонтитулов, другой необходимой информации без перекодирования файла, а также для объединения графики с двух страниц, закодированных с разной степенью сжатия (например, aggressive и lossless)..
Описание
Скачать v0.1

DjVu Blits Hider

Программа для удаления со страниц djvu-книги графических изображений mask-слоя (blits).. может применяться для очистки страницы от "грязных пятен", лишних элементов маски и т.п. без перекодирования файла.. совместно с DjVu Blits Merger'ом позволяет редактировать mask-слой djvu-книги - Hider удаляет, а Merger вставляет на это место нужную графику..
Описание
Скачать v0.1.1

FR12 Parser

Программа для извлечения координат символов из проекта ФР12-15..
Описание
Скачать v2.3.1

Все программы в одной папке


Программы, которых еще нет, но, возможно, когда-нибудь сделаю..


аналог DjVu Hyperlinks Editor'у с бОльшим функционалом и предварительным просмотром.. DjVuNMEditor
программа для создания и внедрения в книгу пустых страниц.. DjVu Clean Page Inserter
программа для удаления страниц из книги.. DjVu Chunk Remover
программа для удаления пустых чанков, типа CIDa.. DjVu Chunk Remover
программа для добавления текста в нужное место на странице (+ к существующему) DjVuNMEditor
программа для удаления блитов со страницы DjVu Blits Hider
• программа для разделения разворотов на 2 страницы
программа для добавления новых блитов на существующую страницу (объединение графики с двух страниц на одну) DjVu Blits Merger
• программа для перемещения блитов на странице
• программа для кодирования ч/б растра без потерь одним или несколькими большими по размеру шейпами
• еще что-то хотел сделать.. но забыл.. вспомню - запишу))
 
если найдутся желающие сделать эти программы - добро пожаловать)) мыслями и наработками с удовольствием поделюсь)) это относится и к следующему блоку тоже..

Программы, которых нет, и я, к сожалению, наврядли осилю((..

визивиг-редактор текстового слоя.. DjVuNMEditor
Hyperlinks-редактор, типа Document Express Editor, но с возможностью групповой правки аннотаций.. DjVuNMEditor
• полноценный визивиг редактор графики DjVu с возможностью удаления, сдвига, правки шейпов в маске.. а может быть и корректировки фона тоже..
WinDjView с поиском текста в закладках.. ну и некоторыми другими дополнительными возможностями.. таки осилил))
 

продолжение следует..

Всего записей: 1436 | Зарегистр. 26-07-2007 | Отправлено: 22:57 06-02-2012 | Исправлено: NME, 18:28 25-09-2022
AlexeiPetrov

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Как этот файл прикрепить? Или можно просто дать ссылку на него?

Всего записей: 21 | Зарегистр. 29-08-2021 | Отправлено: 19:50 29-08-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ссылку.
только небольшой, не сотни мегов.

Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 20:02 29-08-2021
AlexeiPetrov

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Вот, например - https://disk.yandex.ru/d/avV4GllDbdEblQ

Всего записей: 21 | Зарегистр. 29-08-2021 | Отправлено: 20:05 29-08-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Занятно. Жаль, но я не спец в ФР. Пользуюсь восьмым и доволен.
Можно грохнуть этот символ в текстовом файле xml.
Но вроде бы это стандартный символ новой строки, судя по вики. Его, типа, все юникодовские проги игнорить должны при копипасте. И как правильно игнорить - фиг знает.

Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 21:15 29-08-2021
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
AlexeiPetrov,
так лучше?
_https://workupload.com/file/zTwUBF7rsnd

Всего записей: 7336 | Зарегистр. 08-09-2001 | Отправлено: 21:31 29-08-2021
AlexeiPetrov

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
los
Так, конечно, лучше. Но вот как его, этот дурацкий символ, убирать? И чтобы абзацы были вменяемые.

Всего записей: 21 | Зарегистр. 29-08-2021 | Отправлено: 21:38 29-08-2021
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
AlexeiPetrov,
я убирал в vim, но можно и с помощью других программ - sed и т.п.
попробуйте заменить этот символ на newline(\n) или на u+2029(paragraph separator) возможно получится лучше.

Всего записей: 7336 | Зарегистр. 08-09-2001 | Отправлено: 22:51 29-08-2021
AlexeiPetrov

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
los
Для меня это темный лес.
Скачал Vim, а как им пользоваться, понять не могу.

Всего записей: 21 | Зарегистр. 29-08-2021 | Отправлено: 23:28 29-08-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
AlexeiPetrov
у вас три пути
1. изменить выдачу из ФР. можете проконсультироваться в их поддержке
2. понять, какой программой можно извлечь ваш текст корректно
3. в имеющемся дежавю исправить текст, для чего экспортировать его в xml или txt (допустим, через djvutoy), затем умным текстовым редактором поправить символ (я пользовался notepad++), и вставить xml обратно. hex-редактором (winhex и т.п.), вероятно, это можно сделать прямо в djvu. Но я не пробовал так.
 
Но эти пути тут оффтоп. Так что гуглите инструкции.
 
И вообще-то дежавю не предназначен для экспорта текста, тем более красиво оформленного, ocr там встраивается для поиска нужного места.

Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 04:19 30-08-2021
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
AlexeiPetrov
99,9% что текст сделан первыми версиями файнридера, позволяющими сохранять сразу в djvu - не помню, это 10ка или 11 билдом менее 11.0.102.583.. Тогда минимальная степень детализации была строка (LINE).. По хорошему, вердикт такому текстовому слою может быть один - перераспознание! Если перераспознать в 11.0.102.583 и выше (хоть до 15) с последующей обработкой DjVu Text Layer Crutch'ем, то будут и абзацы.. Если делать 8кой + DjVuOCR, то абзацев не будет - после каждой строки будет символ перевода строки 0x0A..
Либо ничего не делать, но тратить время чтобы из г сделать чуть лучшее г - имхо не целесообразно..

Всего записей: 1436 | Зарегистр. 26-07-2007 | Отправлено: 09:36 30-08-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
 то будут и абзацы..

Я покопался xml-ке, только блоки LINE. Правда, конец абзаца можно вычислить по отсутствию LSEP в конце строки.
 
upd


Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 13:13 30-08-2021 | Исправлено: TelecomUral, 13:17 30-08-2021
fozzie

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Страничка перераспознанная в соответствии с рекомендациями NME: https://disk.yandex.ru/d/cFUtmKTlOLPy6w

Всего записей: 143 | Зарегистр. 03-09-2001 | Отправлено: 22:56 30-08-2021
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Кто-нибудь пробовал? Работает? Как впечатление?
_https://github.com/trufanov-nok/tesseract2djvused

Всего записей: 7336 | Зарегистр. 08-09-2001 | Отправлено: 16:10 31-08-2021
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
los скомпилировал, попробовал.  tesseract2djvused просто транслирует hocr в dused формат и все.  Большого смысла в этой утилите, как самостоятельном продукте, на мой взгляд, нет, т.к. существует гораздо более продвинутая ocrdjvu.

Всего записей: 884 | Зарегистр. 14-12-2005 | Отправлено: 06:35 02-09-2021
corrector

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
U235
Можно поподробнее про ocrdjvu?

Всего записей: 218 | Зарегистр. 15-05-2006 | Отправлено: 12:11 03-09-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
corrector
https://github.com/jwilk/ocrodjvu

Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 12:35 03-09-2021
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
Вы нашли плохие буквы, а метода их исправить в готовом дежавю без перекодирования не существует. Всё равно расслаивать.

Существует на винде.. Blits Hider и Blits Merger в помощь..

Всего записей: 1436 | Зарегистр. 26-07-2007 | Отправлено: 09:10 21-09-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NME
да помню я про этот способ. Но уж больно трудоёмко. Вот если бы мышкой тягать... блит прихватил и по ПКМ в корзину, другой блит прихватил и наложил на неправильный.

Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 10:57 21-09-2021
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Можно что-то типа Template Matching использовать для массовой замены на уже выровненных сканах, без сильных искажений (и да, без перекодирования маски не получится). Описание тут: https://docs.opencv.org/4.5.2/d4/dc6/tutorial_py_template_matching.html
Как пример, замена буквы "и"  на скане. В архиве исходник (страница из djvu), скрипт, образец, результат поиска с красными рамками, результат с заменой.
https://www.upload.ee/files/13491676/template.zip.html

Всего записей: 884 | Зарегистр. 14-12-2005 | Отправлено: 07:34 22-09-2021 | Исправлено: U235, 07:34 22-09-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

U235
за ссылочку спасибо, буду иметь ввиду.
 
 
оффтоп
 
Подробнее...

Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 08:37 22-09-2021 | Исправлено: TelecomUral, 08:53 22-09-2021
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36

Компьютерный форум Ru.Board » Компьютеры » Программы » Утилиты для DjVu: DjVuNMEditor, FR11 DTL Crutch и др.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru