Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Утилиты для DjVu: DjVuNMEditor, FR11 DTL Crutch и др.

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36

Открыть новую тему     Написать ответ в эту тему

NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

DjVu Nano Mega Editor
(DjVuNMEditor)

Программа для редактирования в DjVu-книгах:
1) текстового слоя;
2) аннотаций;
3) заголовков страниц (title);
4) закладок (bookmarks, outline); в текущей версии не реализовано
5) метаданных; в текущей версии не реализовано
6) еще чего-то?
Описание
Скачать v3.5
Английская локализация

TurnTheText

Утилита TurnTheText предназначена для устранения несоответствия графического и текстового слоев в DjVu-книгах, возникающего при использовании FineReader версии 8 (и ниже) для распознавания текста..
Может быть использована, например, перед внедрением оглавления в DjVu-книгу с помощью программы DjVu Hyperlinks Editor..
Описание
Скачать v1.1

DjVu Annotations Editor

Программа для редактирования гиперссылок (annotations/hyperlinks) в файлах формата djvu, преимущественно, после создания оглавлений в книге при помощи DjVu Hyperlinks Editor'а..
Выполняет сдвиг, выравнивание, изменение размеров, цвета, свойств и др..
Описание
Скачать v0.2
Практически весь функционал программы реализован в DjVuNMEditor'е

HeadWorder

Программа для полуавтоматического извлечения заголовков словарных статей из DjVu-словарей, энциклопедий и т.п. и последующего внедрения их в книгу в виде закладок DjVu или WinDjView (с позиционированием)..
Программа устарела так и не выйдя в свет((

FR11 DjVu Text Layer Crutch

Программа для исправления текстового слоя в файле DjVu, созданного посредством ABBYY FineReader билд 11.0.102.583 и выше (в т.ч. ФР12)..
Выполняет следующие действия:
- удаляет блоки Char;
- создает зоны Line и Paragraph;
- объединяет две половинки слова, разделенного знаком переноса, в одно;
- позволяет переносить текстовый слой из одного файла в другой..
Описание
Скачать v0.3.3
Основной функционал программы реализован также в DjVuNMEditor'е

DjVu Chunk Remover

Программа для удаления блоков (чанков), а также страниц из файлов формата DjVu.. может удалять фон (BG44, BGjp), закладки (NAVM), аннотации (ANTa, ANTz), текст (TXTa, TXTz), информацию о цвете маски(FG44, FGbz) и др.. запрещено удаление блоков INFO, Sjbz, Djbz и INCL, содержащих ссылки на Djbz-словари символов..
Описание
Скачать v0.5

DjVu Text Mover

Программа позволяет поворачивать и двигать текстовый слой в файлах DjVu..
Скачать v0.1

DjVu Title Maker

Программа для создания заголовков страниц (переименования страниц) в файлах DjVu..  
Таким образом, страницы можно называть "Обложка", I, II, III, IV и т.п., автоматически или вручную переименовывать страницы со сдвинутой нумерацией (в т.ч. при удалении пустых страниц) для соответствия нумерации электронной книги её бумажному оригиналу..
Описание
Скачать v0.1
Основной функционал программы реализован также в DjVuNMEditor'е

DjVu Clean Page Inserter

Программа для быстрого создания и внедрения в книгу пустых страниц.. Нужна для восстановления соответствия бумажной и электронной нумерации, что облегчает навигацию по книге..
Описание
Скачать v0.1

DjVu Blits Merger

Программа для добавления на страницы djvu-книги графических изображений (mask-слоя) из другого djvu-файла.. Может применяться для добавления в книгу номеров страниц, колонтитулов, другой необходимой информации без перекодирования файла, а также для объединения графики с двух страниц, закодированных с разной степенью сжатия (например, aggressive и lossless)..
Описание
Скачать v0.1

DjVu Blits Hider

Программа для удаления со страниц djvu-книги графических изображений mask-слоя (blits).. может применяться для очистки страницы от "грязных пятен", лишних элементов маски и т.п. без перекодирования файла.. совместно с DjVu Blits Merger'ом позволяет редактировать mask-слой djvu-книги - Hider удаляет, а Merger вставляет на это место нужную графику..
Описание
Скачать v0.1.1

FR12 Parser

Программа для извлечения координат символов из проекта ФР12-15..
Описание
Скачать v2.3.1

Все программы в одной папке


Программы, которых еще нет, но, возможно, когда-нибудь сделаю..


аналог DjVu Hyperlinks Editor'у с бОльшим функционалом и предварительным просмотром.. DjVuNMEditor
программа для создания и внедрения в книгу пустых страниц.. DjVu Clean Page Inserter
программа для удаления страниц из книги.. DjVu Chunk Remover
программа для удаления пустых чанков, типа CIDa.. DjVu Chunk Remover
программа для добавления текста в нужное место на странице (+ к существующему) DjVuNMEditor
программа для удаления блитов со страницы DjVu Blits Hider
• программа для разделения разворотов на 2 страницы
программа для добавления новых блитов на существующую страницу (объединение графики с двух страниц на одну) DjVu Blits Merger
• программа для перемещения блитов на странице
• программа для кодирования ч/б растра без потерь одним или несколькими большими по размеру шейпами
• еще что-то хотел сделать.. но забыл.. вспомню - запишу))
 
если найдутся желающие сделать эти программы - добро пожаловать)) мыслями и наработками с удовольствием поделюсь)) это относится и к следующему блоку тоже..

Программы, которых нет, и я, к сожалению, наврядли осилю((..

визивиг-редактор текстового слоя.. DjVuNMEditor
Hyperlinks-редактор, типа Document Express Editor, но с возможностью групповой правки аннотаций.. DjVuNMEditor
• полноценный визивиг редактор графики DjVu с возможностью удаления, сдвига, правки шейпов в маске.. а может быть и корректировки фона тоже..
WinDjView с поиском текста в закладках.. ну и некоторыми другими дополнительными возможностями.. таки осилил))
 

продолжение следует..

Всего записей: 1436 | Зарегистр. 26-07-2007 | Отправлено: 22:57 06-02-2012 | Исправлено: NME, 18:28 25-09-2022
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
к выпуску первого релиза перенесу её в основное меню, а также постараюсь добавить кнопку на основной экран.. также сделаю команду "Сохранить как.."

Сделал..
Описание
 
Также набросал своё видение дальнейшего развития возможностей программы при редактировании текстового слоя:
1) Ручное рисование границ добавляемого элемента (в 1.1)
2) Вырезать/вставить несколько идущих подряд элементов (в 1.1)
3) Горячие клавиши на команды редактирования текста (в 1.1)
4) Добавление новых элементов на страницы, которые изначально были без текста
5) Поиск в дереве выделенного на странице текста (в 1.1)
6) Сдвиг блоков без изменения их размеров (в 2.1)
7) Запоминание текущей позиции экрана для восстановления его при повторном открытии документа или после команды "Сохранить как..."
8) Объединение нескольких зон в более крупные НОВЫЕ зоны (например, создание новых зон PARAGRAPH с включением в них существующих зон LINE)
9) Динамическое изменение размеров редактируемой зоны при правке её координат в соответствующем окне (в 2.1)
10) Изменение границ выделенной зоны ручным перетаскиванием этих границ на поле книги
11) Отмена действий
 
Есть и другие запланированные изменения, но они более мелкие и, скорее, технические, вспомогательные..
 
Далеко не факт, что все эти изменения удастся реализовать, но они пока внесены в ToDo, я про них знаю, вновь их предлагать особого смысла нет.. Но, если есть что-то новое, востребованное, улучшающее юзабельность или функционал программы - предлагайте, рассмотрю при возможности.. Ну и о замеченных багах тоже, естественно, пишите..

Всего записей: 1436 | Зарегистр. 26-07-2007 | Отправлено: 12:32 14-05-2021 | Исправлено: NME, 18:18 25-09-2022
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
нашел незначительный баг - при запуске с русской локализацией в строке заголовка программы осталось слово "beta".. кому принципиально, можете заменить dll-ку..
 
заменил dll в архиве с программой, ссылку в предыдущем сообщении обновил..

Всего записей: 1436 | Зарегистр. 26-07-2007 | Отправлено: 15:32 14-05-2021 | Исправлено: NME, 01:00 15-05-2021
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
выпустил релиз 1.1, ссылку и описание в предыдущем посте подправил..
сырцы также положил в общую папку с моими djvu-утилитами на яндексдиске..

Всего записей: 1436 | Зарегистр. 26-07-2007 | Отправлено: 14:47 10-06-2021
AlexeiPetrov

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подробнее...

Всего записей: 21 | Зарегистр. 29-08-2021 | Отправлено: 19:31 29-08-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
AlexeiPetrov
пример файла давайте.

Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 19:45 29-08-2021
AlexeiPetrov

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Как этот файл прикрепить? Или можно просто дать ссылку на него?

Всего записей: 21 | Зарегистр. 29-08-2021 | Отправлено: 19:50 29-08-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ссылку.
только небольшой, не сотни мегов.

Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 20:02 29-08-2021
AlexeiPetrov

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Вот, например - https://disk.yandex.ru/d/avV4GllDbdEblQ

Всего записей: 21 | Зарегистр. 29-08-2021 | Отправлено: 20:05 29-08-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Занятно. Жаль, но я не спец в ФР. Пользуюсь восьмым и доволен.
Можно грохнуть этот символ в текстовом файле xml.
Но вроде бы это стандартный символ новой строки, судя по вики. Его, типа, все юникодовские проги игнорить должны при копипасте. И как правильно игнорить - фиг знает.

Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 21:15 29-08-2021
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
AlexeiPetrov,
так лучше?
_https://workupload.com/file/zTwUBF7rsnd

Всего записей: 7334 | Зарегистр. 08-09-2001 | Отправлено: 21:31 29-08-2021
AlexeiPetrov

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
los
Так, конечно, лучше. Но вот как его, этот дурацкий символ, убирать? И чтобы абзацы были вменяемые.

Всего записей: 21 | Зарегистр. 29-08-2021 | Отправлено: 21:38 29-08-2021
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
AlexeiPetrov,
я убирал в vim, но можно и с помощью других программ - sed и т.п.
попробуйте заменить этот символ на newline(\n) или на u+2029(paragraph separator) возможно получится лучше.

Всего записей: 7334 | Зарегистр. 08-09-2001 | Отправлено: 22:51 29-08-2021
AlexeiPetrov

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
los
Для меня это темный лес.
Скачал Vim, а как им пользоваться, понять не могу.

Всего записей: 21 | Зарегистр. 29-08-2021 | Отправлено: 23:28 29-08-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
AlexeiPetrov
у вас три пути
1. изменить выдачу из ФР. можете проконсультироваться в их поддержке
2. понять, какой программой можно извлечь ваш текст корректно
3. в имеющемся дежавю исправить текст, для чего экспортировать его в xml или txt (допустим, через djvutoy), затем умным текстовым редактором поправить символ (я пользовался notepad++), и вставить xml обратно. hex-редактором (winhex и т.п.), вероятно, это можно сделать прямо в djvu. Но я не пробовал так.
 
Но эти пути тут оффтоп. Так что гуглите инструкции.
 
И вообще-то дежавю не предназначен для экспорта текста, тем более красиво оформленного, ocr там встраивается для поиска нужного места.

Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 04:19 30-08-2021
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
AlexeiPetrov
99,9% что текст сделан первыми версиями файнридера, позволяющими сохранять сразу в djvu - не помню, это 10ка или 11 билдом менее 11.0.102.583.. Тогда минимальная степень детализации была строка (LINE).. По хорошему, вердикт такому текстовому слою может быть один - перераспознание! Если перераспознать в 11.0.102.583 и выше (хоть до 15) с последующей обработкой DjVu Text Layer Crutch'ем, то будут и абзацы.. Если делать 8кой + DjVuOCR, то абзацев не будет - после каждой строки будет символ перевода строки 0x0A..
Либо ничего не делать, но тратить время чтобы из г сделать чуть лучшее г - имхо не целесообразно..

Всего записей: 1436 | Зарегистр. 26-07-2007 | Отправлено: 09:36 30-08-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
 то будут и абзацы..

Я покопался xml-ке, только блоки LINE. Правда, конец абзаца можно вычислить по отсутствию LSEP в конце строки.
 
upd


Всего записей: 3059 | Зарегистр. 15-07-2010 | Отправлено: 13:13 30-08-2021 | Исправлено: TelecomUral, 13:17 30-08-2021
fozzie

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Страничка перераспознанная в соответствии с рекомендациями NME: https://disk.yandex.ru/d/cFUtmKTlOLPy6w

Всего записей: 143 | Зарегистр. 03-09-2001 | Отправлено: 22:56 30-08-2021
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Кто-нибудь пробовал? Работает? Как впечатление?
_https://github.com/trufanov-nok/tesseract2djvused

Всего записей: 7334 | Зарегистр. 08-09-2001 | Отправлено: 16:10 31-08-2021
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
los скомпилировал, попробовал.  tesseract2djvused просто транслирует hocr в dused формат и все.  Большого смысла в этой утилите, как самостоятельном продукте, на мой взгляд, нет, т.к. существует гораздо более продвинутая ocrdjvu.

Всего записей: 884 | Зарегистр. 14-12-2005 | Отправлено: 06:35 02-09-2021
corrector

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
U235
Можно поподробнее про ocrdjvu?

Всего записей: 218 | Зарегистр. 15-05-2006 | Отправлено: 12:11 03-09-2021
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36

Компьютерный форум Ru.Board » Компьютеры » Программы » Утилиты для DjVu: DjVuNMEditor, FR11 DTL Crutch и др.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru