Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Утилиты для DjVu: DjVuNMEditor, FR11 DTL Crutch и др.

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39

Открыть новую тему     Написать ответ в эту тему

NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

DjVu Nano Mega Editor
(DjVuNMEditor)

Программа для редактирования в DjVu-книгах:
1) текстового слоя;
2) аннотаций;
3) заголовков страниц (title);
4) метаданных;
5) закладок (bookmarks, outline); в текущей версии не реализовано
6) еще чего-то?
Описание
Скачать v3.6
Английская локализация

TurnTheText

Утилита TurnTheText предназначена для устранения несоответствия графического и текстового слоев в DjVu-книгах, возникающего при использовании FineReader версии 8 (и ниже) для распознавания текста..
Может быть использована, например, перед внедрением оглавления в DjVu-книгу с помощью программы DjVu Hyperlinks Editor..
Описание
Скачать v1.1

DjVu Annotations Editor

Программа для редактирования гиперссылок (annotations/hyperlinks) в файлах формата djvu, преимущественно, после создания оглавлений в книге при помощи DjVu Hyperlinks Editor'а..
Выполняет сдвиг, выравнивание, изменение размеров, цвета, свойств и др..
Описание
Скачать v0.2
Практически весь функционал программы реализован в DjVuNMEditor'е

HeadWorder

Программа для полуавтоматического извлечения заголовков словарных статей из DjVu-словарей, энциклопедий и т.п. и последующего внедрения их в книгу в виде закладок DjVu или WinDjView (с позиционированием)..
Программа устарела так и не выйдя в свет((

FR11 DjVu Text Layer Crutch

Программа для исправления текстового слоя в файле DjVu, созданного посредством ABBYY FineReader билд 11.0.102.583 и выше (в т.ч. ФР12)..
Выполняет следующие действия:
- удаляет блоки Char;
- создает зоны Line и Paragraph;
- объединяет две половинки слова, разделенного знаком переноса, в одно;
- позволяет переносить текстовый слой из одного файла в другой..
Описание
Скачать v0.3.3
Основной функционал программы реализован также в DjVuNMEditor'е

DjVu Chunk Remover

Программа для удаления блоков (чанков), а также страниц из файлов формата DjVu.. может удалять фон (BG44, BGjp), закладки (NAVM), аннотации (ANTa, ANTz), текст (TXTa, TXTz), информацию о цвете маски(FG44, FGbz) и др.. запрещено удаление блоков INFO, Sjbz, Djbz и INCL, содержащих ссылки на Djbz-словари символов..
Описание
Скачать v0.5

DjVu Text Mover

Программа позволяет поворачивать и двигать текстовый слой в файлах DjVu..
Скачать v0.1

DjVu Title Maker

Программа для создания заголовков страниц (переименования страниц) в файлах DjVu..  
Таким образом, страницы можно называть "Обложка", I, II, III, IV и т.п., автоматически или вручную переименовывать страницы со сдвинутой нумерацией (в т.ч. при удалении пустых страниц) для соответствия нумерации электронной книги её бумажному оригиналу..
Описание
Скачать v0.1
Основной функционал программы реализован также в DjVuNMEditor'е

DjVu Clean Page Inserter

Программа для быстрого создания и внедрения в книгу пустых страниц.. Нужна для восстановления соответствия бумажной и электронной нумерации, что облегчает навигацию по книге..
Описание
Скачать v0.1

DjVu Blits Merger

Программа для добавления на страницы djvu-книги графических изображений (mask-слоя) из другого djvu-файла.. Может применяться для добавления в книгу номеров страниц, колонтитулов, другой необходимой информации без перекодирования файла, а также для объединения графики с двух страниц, закодированных с разной степенью сжатия (например, aggressive и lossless)..
Описание
Скачать v0.1

DjVu Blits Hider

Программа для удаления со страниц djvu-книги графических изображений mask-слоя (blits).. может применяться для очистки страницы от "грязных пятен", лишних элементов маски и т.п. без перекодирования файла.. совместно с DjVu Blits Merger'ом позволяет редактировать mask-слой djvu-книги - Hider удаляет, а Merger вставляет на это место нужную графику..
Описание
Скачать v0.1.1

FR12 Parser

Программа для извлечения координат символов из проекта ФР12-16..
Описание
Скачать v2.6

Все программы в одной папке


Программы, которых еще нет, но, возможно, когда-нибудь сделаю..


аналог DjVu Hyperlinks Editor'у с бОльшим функционалом и предварительным просмотром.. DjVuNMEditor
программа для создания и внедрения в книгу пустых страниц.. DjVu Clean Page Inserter
программа для удаления страниц из книги.. DjVu Chunk Remover
программа для удаления пустых чанков, типа CIDa.. DjVu Chunk Remover
программа для добавления текста в нужное место на странице (+ к существующему) DjVuNMEditor
программа для удаления блитов со страницы DjVu Blits Hider
• программа для разделения разворотов на 2 страницы
программа для добавления новых блитов на существующую страницу (объединение графики с двух страниц на одну) DjVu Blits Merger
• программа для перемещения блитов на странице
• программа для кодирования ч/б растра без потерь одним или несколькими большими по размеру шейпами
• еще что-то хотел сделать.. но забыл.. вспомню - запишу))
 
если найдутся желающие сделать эти программы - добро пожаловать)) мыслями и наработками с удовольствием поделюсь)) это относится и к следующему блоку тоже..

Программы, которых нет, и я, к сожалению, наврядли осилю((..

визивиг-редактор текстового слоя.. DjVuNMEditor
Hyperlinks-редактор, типа Document Express Editor, но с возможностью групповой правки аннотаций.. DjVuNMEditor
• полноценный визивиг редактор графики DjVu с возможностью удаления, сдвига, правки шейпов в маске.. а может быть и корректировки фона тоже..
WinDjView с поиском текста в закладках.. ну и некоторыми другими дополнительными возможностями.. таки осилил))
 

продолжение следует..

Всего записей: 1485 | Зарегистр. 26-07-2007 | Отправлено: 22:57 06-02-2012 | Исправлено: NME, 20:07 23-05-2024
amaid



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Aladdin2
удаление пустых страниц очень пригодилось бы! Djvu small при декодировании их либо пропускает (потом OCR внедряется не на свое место), либо прекращает работу. приходится искать и удалять вручную.

Всего записей: 578 | Зарегистр. 25-01-2006 | Отправлено: 09:01 05-02-2014
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
 Тут ещё один глюк нашёлся. Если имеется два чанка INCL, программа выдаёт ошибку

количество чанков тут не причем.. прога в основном и создавалась для того, чтобы удалять пустые чанки CIDa и ссылки на shared_anno.iff.. здесь другой баг - программа декодирует только 51200 байт, а в данном случае из-за длинных названий страниц нужно больше.. вообще-то я с этой проблемой уже сталкивался и победил ее, но в этой программе декодер видимо не исправил.. на днях подправлю..

Цитата:
Во-первых, позволить удалять чанк INCL (второй из приведённого выше примера), не знаю, может по имени, или по порядку их расположения.

это уже реализовано, удаляется по имени..

Цитата:
Тогда уж заодно можно включить удаление Sjbz

принципиально отключил эту возможность и включать не буду.. создать пустую страницу можно и другими способами, а испортить файл данной фичей не составит труда..

Цитата:
1) Возможность выбрать сразу несколько типов слоёв для их одновременного удаления (а то приходится 1 файл по нескольку раз прогонять).

даже не могу представить пример, когда это нужно сделать.. сейчас за 1 раз можно удалить закладки, ссылки на файл (в основном shared_anno.iff) и один из чанков - CIDa (при наличии), текст или аннотации.. когда нужно удалять все эти чанки одновременно, да еще и массово - видимо только ради спортивного интереса.. ради этого усложнять интерфейс и переделывать логику работы я не собираюсь..

Цитата:
2) Возможность указать не только файл, но и папку

блин, я прогу делал побаловаться, а тут уже речь идет о массовой обработке файлов)) возможно, проще поддержку ком.строки прикрутить..

Цитата:
3) Возможность автоматической замены существующего файла новым.

не знаю.. здесь уже вопросы безопасности.. мало ли еще какой баг проскочит.. не хватало мне еще выслушивать о загубленной книге да еще и в единственном экземпляре на просторах инета.. нет уж, проверяйте и удаляйте ручками..

Цитата:
P.S. А я со своей стороны сделаю прогу для пунктов:

вот это радует)) многие считают формат djvu умирающим.. отчасти это является правдой из-за прекращения его развития, как со стороны правообладателя, так и со стороны разработчиков софта для него (редакторов, просмотрщиков и т.п.).. но мне, например, данный формат нравится.. и одним из шагов его развития я считаю создание удобных для пользователя редакторов.. в моем представлении можно сделать массу всего полезного изучив спецификацию (ессно с кодом).. для спецов в программировании - это как 2 пальца.. но вот только пока что-то добровольцев не находится.. видимо, как всегда придется все делать самому (насколько позволят желание и возможности).. и прибытие в полку разработчиков у меня вызывает только положительные эмоции))
 
на нынешнем этапе освоения данного формата эти программы мне и самому несложно создать, но за неимением лишнего свободного времени лучше будет, если их сделает кто-то другой))

Всего записей: 1485 | Зарегистр. 26-07-2007 | Отправлено: 23:48 06-02-2014
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
подправил DjVu Chunk Remover..
исправил баги, добавил поддержку командной строки и др.. подробнее - в описании..

Всего записей: 1485 | Зарегистр. 26-07-2007 | Отправлено: 12:32 11-02-2014
Bu

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вопрос по FR11 DjVu Text Layer Crutch и по djvu в целом.
 
Почему при копировании текста абзацы разбиваются на строки? К примеру:

Цитата:
Lorem ipsum dolor sit amet, consectetur adipisicing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum.Lorem ipsum dolor sit amet, consectetur adipisicing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum.

Копируется так (FR11 DjVu Text Layer Crutch убирает переносы только по слогам):

Цитата:
Lorem ipsum dolor sit amet, consectetur adipisicing elit, sed do eiusmod tempor incididunt ut  
labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco  
laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in  
voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur sint occaecat cupidatat non  
proident, sunt in culpa qui officia deserunt mollit anim id est laborum.Lorem ipsum dolor sit  
amet, consectetur adipisicing elit, sed do eiusmod tempor incididunt ut labore et dolore magna  
aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea  
commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore  
eu fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia  
deserunt mollit anim id est laborum.

Это косяк FR11 DjVu Text Layer Crutch, формата djvu или просмотрщика (WinDjView)?

Всего записей: 79 | Зарегистр. 08-10-2001 | Отправлено: 16:27 12-02-2014 | Исправлено: Bu, 16:28 12-02-2014
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Bu
а как программа должна определить границы абзаца?
в исходном материале после ФР11 стоят знаки конца строки "\n", Crutch их убирает, помещая строку в зону типа "Line"..  
формат djvu предусматривает и другие зоны - Page, Column, Region, Paragraph, только вроде на копирование/вставку это не влияет, по крайней мере в WinDjview..

Всего записей: 1485 | Зарегистр. 26-07-2007 | Отправлено: 17:23 12-02-2014
Bu

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NME
В своем интерфейсе FR показывает что параграфы он распознает:
 
   
 
Там точно остается только один перенос?
 
Добавлено:
А, я понял, FR ставит \n в начале word'a, если это перенос внутри параграфа, и в конце, если это перенос на другой параграф.

Всего записей: 79 | Зарегистр. 08-10-2001 | Отправлено: 17:40 12-02-2014 | Исправлено: Bu, 17:42 12-02-2014
LonerDergunov



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
возможно, проще поддержку ком.строки прикрутить..

Да, да, да! Просим-просим

Всего записей: 2972 | Зарегистр. 11-07-2007 | Отправлено: 21:14 12-02-2014
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Bu
попробовал поиграться с зоной Paragraph - результат мне не понравился..
вставка текста после копирования его в 3х разных вьюверах дала 3 разных результата - и ни одного нужного.. чтобы текст в пределах параграфа был сплошным, надо убирать зоны Line, а это уже влияет на выделение его и т.п..
FR11 Crutch приводит текст к формату привычного старого доброго DjvuOCR и, пожалуй, лучше все так и оставить.. можно было бы еще подумать на эту тему, если бы проект WinDjView развивался, но т.к. там изменений не предвидится, то и я не вижу пользы в изменении разметки текста, скорее - наоборот..
LonerDergunov
в планах на ближайшие пару месяцев.. заодно избавлюсь от ненужных теперь дополнительных ехе-шников и длл-лек..

Всего записей: 1485 | Зарегистр. 26-07-2007 | Отправлено: 13:42 13-02-2014
Bu

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NME
Да, нашел файл со сплошным копированием (структура файла paragraph + word), но выделение у него странное - последнее слово в параграфе не выделяется и выделить можно только один параграф. Но параграф копируется как одна строка.
 
А можете скинуть пример файла со структурой paragraph + line + word?

Всего записей: 79 | Зарегистр. 08-10-2001 | Отправлено: 16:03 13-02-2014
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Bu
да я собственноручно эти параграфы делал - совсем несложно:
1) открываешь Crutch-ем книгу, лучше - уже исправленную
2) рядом с прогой ищешь файл result.dsed, открываешь его редактором типа блокнот
3) перед нужной зоной Line добавляешь (para х1 у1 х2 у2, после последнего нужного слова - ), где х1 у1 - минимальные первые 2 координаты из входящих в эту зону line, а х2 у2 - максимальные последние.. пример  
(para 193 1313 820 1438
 (line 193 1405 820 1438
  (word 193 1405 527 1435 "Тригонометрические")
  (word 541 1411 739 1431 "зависимости")
  (word 788 1413 820 1438 "23"))
 (line 195 1359 820 1392
  (word 195 1364 330 1390 "Плоские")
  (word 343 1359 463 1389 "фигуры")
  (word 788 1366 820 1392 "24"))
 (line 195 1313 818 1346
  (word 195 1313 400 1343 "Поверхности")
  (word 415 1319 435 1337 "и")
  (word 448 1319 565 1344 "объемы")
  (word 577 1320 626 1338 "тел")
  (word 789 1321 818 1346 "31")))
4) сохранить result.dsed, нажать "сохранить исправленный текстовый слой.."
вуаля, файл с параграфами))
 
 
 

Всего записей: 1485 | Зарегистр. 26-07-2007 | Отправлено: 18:09 13-02-2014
Bu

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NME
Нашел как сделать! Нужно удалить все line, и изменить para на line, тогда копирование происходит корректно. По вашему примеру будет так:

Цитата:
 (line 193 1313 820 1438
  (word 193 1405 527 1435 "Тригонометрические")
  (word 541 1411 739 1431 "зависимости")
  (word 788 1413 820 1438 "23")
  (word 195 1364 330 1390 "Плоские")
  (word 343 1359 463 1389 "фигуры")
  (word 788 1366 820 1392 "24")
  (word 195 1313 400 1343 "Поверхности")
  (word 415 1319 435 1337 "и")
  (word 448 1319 565 1344 "объемы")
  (word 577 1320 626 1338 "тел")
  (word 789 1321 818 1346 "31"))

FINALLY!
 
Видимо у параграфов какое то другое (сакралное ) предназначение.

Всего записей: 79 | Зарегистр. 08-10-2001 | Отправлено: 21:56 13-02-2014 | Исправлено: Bu, 21:59 13-02-2014
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Bu
эт сделать-то несложно - всего одну строку в коде закомментировать, только в этом случае инфа о конце строки пропадет.. надо подумать как сделать так, чтоб информация не терялась и, при необходимости, строки могли бы быть восстановлены..

Всего записей: 1485 | Зарегистр. 26-07-2007 | Отправлено: 19:16 14-02-2014
Bu

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NME
По-моему лучше дополнить интерфейс, чем думать как сохранить информацию. Может кому-то и понадобится разбиение абзацев на строки. Мой вариант:
   
Опция "в конце доп. перенос" добавляет перенос к последнему слову абзаца (точнее оставляет тот что остался после FR). Так, при вставке текста удобнее различать абзацы (добавляется пустая строка).

Всего записей: 79 | Зарегистр. 08-10-2001 | Отправлено: 20:42 14-02-2014 | Исправлено: Bu, 20:43 14-02-2014
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Bu
интерфейс - это самое простое, но он не решает проблему потери информации о строках.. в принципе, метки можно будет сделать дополнительными пробелами в зонах Char в конце строки и каким-то похожим образом метить конец абзаца, а в программе реализовать конвертацию одного способа в другой..
доп. перенос мало кому нужен, к тому же очень просто в любом текстовом редакторе заменить перевод строки на двойной..
слышал, что 12й фр то ли вышел, то ли на подходе.. м.б. они там сделали адекватный текстовый слой и надобность в костыле отпадет сама собой.. когда-то это ведь должно случиться..

Всего записей: 1485 | Зарегистр. 26-07-2007 | Отправлено: 23:40 14-02-2014
Bu

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NME
FR12 делает так же как FR11 DjVu Text Layer Crutch - делит абзац на строки. Но не соединяет слова и сжимает файл. Т.е. ничего не изменилось можно считать.
 
Можете, тогда, для меня сделать версию с абзацем в одну линию, и переносом после последнего слова? Или скинуть исходники, я сам сделаю.

Всего записей: 79 | Зарегистр. 08-10-2001 | Отправлено: 14:35 15-02-2014
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Bu
сначала надо 12 посмотреть..

Всего записей: 1485 | Зарегистр. 26-07-2007 | Отправлено: 18:51 15-02-2014
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Bu

Цитата:
FR12 делает так же как FR11 DjVu Text Layer Crutch

откуда такая информация? то, что я увидел, скачав с офсайта, это абсолютная копия текстового слоя FR11, но никак не FR11 DjVu Text Layer Crutch.. так что смысл развивать программу еще есть.. возможность разбиения по абзацам сделаю, а также возврат при необходимости к построчному разбиению и обратно.. ну и поддержку комстроки и др.. но все это чуть позже..

Всего записей: 1485 | Зарегистр. 26-07-2007 | Отправлено: 11:37 16-02-2014
ILHS

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вопрос про FR11 DjVu Text Layer Crutch:
Вроде все делаю как надо, но почему-то переносить текстовый слой из одного файла в другой не получается. При этом сообщение "Готово" вспливает на экран. Временные файлы создаются.
ОС: Win7 64bit Greek.
 
З.Ы. пробовал с файлом созданным FR8 и перенос работает.
Есть какие-нибудь идей, что тут происходит?

Всего записей: 610 | Зарегистр. 06-12-2004 | Отправлено: 21:05 09-04-2014 | Исправлено: ILHS, 21:06 09-04-2014
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ILHS
скорее всего проблемы с путями, именами файлов и т.п.. не латинские буквы нежелательны..
можно также попробовать из под ком.строки внедрить слой из result.dsed в нужный файл, если какая-то ошибка в djvused - в консоли об этом будет написано..
если не поможет - присылай файлы, буду посмотреть..
з.ы. в скором будущем новый билд доделаю, там проблем с именами и т.п. не должно возникать..

Всего записей: 1485 | Зарегистр. 26-07-2007 | Отправлено: 01:32 11-04-2014
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ILHS
проблема оказалась в том, что файл был модернизирован - в него были вставлены страницы с текстовым слоем не из FR11.. кроме того, имена некоторых страниц у 1й и 2й книги различались - поэтому слой и не копировался..  
в общем, слой я перенес, ссылку на файл кинул в личку.. в следующий раз перед обработкой файла не стОит вносить в него коррективы..

Всего записей: 1485 | Зарегистр. 26-07-2007 | Отправлено: 00:53 12-04-2014
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39

Компьютерный форум Ru.Board » Компьютеры » Программы » Утилиты для DjVu: DjVuNMEditor, FR11 DTL Crutch и др.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru