Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Утилиты для DjVu: DjVuNMEditor, FR11 DTL Crutch и др.

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39

Открыть новую тему     Написать ответ в эту тему

NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

DjVu Nano Mega Editor
(DjVuNMEditor)

Программа для редактирования в DjVu-книгах:
1) текстового слоя;
2) аннотаций;
3) заголовков страниц (title);
4) метаданных;
5) закладок (bookmarks, outline); в текущей версии не реализовано
6) еще чего-то?
Описание
Скачать v3.6
Английская локализация

TurnTheText

Утилита TurnTheText предназначена для устранения несоответствия графического и текстового слоев в DjVu-книгах, возникающего при использовании FineReader версии 8 (и ниже) для распознавания текста..
Может быть использована, например, перед внедрением оглавления в DjVu-книгу с помощью программы DjVu Hyperlinks Editor..
Описание
Скачать v1.1

DjVu Annotations Editor

Программа для редактирования гиперссылок (annotations/hyperlinks) в файлах формата djvu, преимущественно, после создания оглавлений в книге при помощи DjVu Hyperlinks Editor'а..
Выполняет сдвиг, выравнивание, изменение размеров, цвета, свойств и др..
Описание
Скачать v0.2
Практически весь функционал программы реализован в DjVuNMEditor'е

HeadWorder

Программа для полуавтоматического извлечения заголовков словарных статей из DjVu-словарей, энциклопедий и т.п. и последующего внедрения их в книгу в виде закладок DjVu или WinDjView (с позиционированием)..
Программа устарела так и не выйдя в свет((

FR11 DjVu Text Layer Crutch

Программа для исправления текстового слоя в файле DjVu, созданного посредством ABBYY FineReader билд 11.0.102.583 и выше (в т.ч. ФР12)..
Выполняет следующие действия:
- удаляет блоки Char;
- создает зоны Line и Paragraph;
- объединяет две половинки слова, разделенного знаком переноса, в одно;
- позволяет переносить текстовый слой из одного файла в другой..
Описание
Скачать v0.3.3
Основной функционал программы реализован также в DjVuNMEditor'е

DjVu Chunk Remover

Программа для удаления блоков (чанков), а также страниц из файлов формата DjVu.. может удалять фон (BG44, BGjp), закладки (NAVM), аннотации (ANTa, ANTz), текст (TXTa, TXTz), информацию о цвете маски(FG44, FGbz) и др.. запрещено удаление блоков INFO, Sjbz, Djbz и INCL, содержащих ссылки на Djbz-словари символов..
Описание
Скачать v0.5

DjVu Text Mover

Программа позволяет поворачивать и двигать текстовый слой в файлах DjVu..
Скачать v0.1

DjVu Title Maker

Программа для создания заголовков страниц (переименования страниц) в файлах DjVu..  
Таким образом, страницы можно называть "Обложка", I, II, III, IV и т.п., автоматически или вручную переименовывать страницы со сдвинутой нумерацией (в т.ч. при удалении пустых страниц) для соответствия нумерации электронной книги её бумажному оригиналу..
Описание
Скачать v0.1
Основной функционал программы реализован также в DjVuNMEditor'е

DjVu Clean Page Inserter

Программа для быстрого создания и внедрения в книгу пустых страниц.. Нужна для восстановления соответствия бумажной и электронной нумерации, что облегчает навигацию по книге..
Описание
Скачать v0.1

DjVu Blits Merger

Программа для добавления на страницы djvu-книги графических изображений (mask-слоя) из другого djvu-файла.. Может применяться для добавления в книгу номеров страниц, колонтитулов, другой необходимой информации без перекодирования файла, а также для объединения графики с двух страниц, закодированных с разной степенью сжатия (например, aggressive и lossless)..
Описание
Скачать v0.1

DjVu Blits Hider

Программа для удаления со страниц djvu-книги графических изображений mask-слоя (blits).. может применяться для очистки страницы от "грязных пятен", лишних элементов маски и т.п. без перекодирования файла.. совместно с DjVu Blits Merger'ом позволяет редактировать mask-слой djvu-книги - Hider удаляет, а Merger вставляет на это место нужную графику..
Описание
Скачать v0.1.1

FR12 Parser

Программа для извлечения координат символов из проекта ФР12-16..
Описание
Скачать v2.6

Все программы в одной папке


Программы, которых еще нет, но, возможно, когда-нибудь сделаю..


аналог DjVu Hyperlinks Editor'у с бОльшим функционалом и предварительным просмотром.. DjVuNMEditor
программа для создания и внедрения в книгу пустых страниц.. DjVu Clean Page Inserter
программа для удаления страниц из книги.. DjVu Chunk Remover
программа для удаления пустых чанков, типа CIDa.. DjVu Chunk Remover
программа для добавления текста в нужное место на странице (+ к существующему) DjVuNMEditor
программа для удаления блитов со страницы DjVu Blits Hider
• программа для разделения разворотов на 2 страницы
программа для добавления новых блитов на существующую страницу (объединение графики с двух страниц на одну) DjVu Blits Merger
• программа для перемещения блитов на странице
• программа для кодирования ч/б растра без потерь одним или несколькими большими по размеру шейпами
• еще что-то хотел сделать.. но забыл.. вспомню - запишу))
 
если найдутся желающие сделать эти программы - добро пожаловать)) мыслями и наработками с удовольствием поделюсь)) это относится и к следующему блоку тоже..

Программы, которых нет, и я, к сожалению, наврядли осилю((..

визивиг-редактор текстового слоя.. DjVuNMEditor
Hyperlinks-редактор, типа Document Express Editor, но с возможностью групповой правки аннотаций.. DjVuNMEditor
• полноценный визивиг редактор графики DjVu с возможностью удаления, сдвига, правки шейпов в маске.. а может быть и корректировки фона тоже..
WinDjView с поиском текста в закладках.. ну и некоторыми другими дополнительными возможностями.. таки осилил))
 

продолжение следует..

Всего записей: 1503 | Зарегистр. 26-07-2007 | Отправлено: 22:57 06-02-2012 | Исправлено: NME, 20:07 23-05-2024
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
VV123
не собираюсь изучать еще один язык программирования из-за чьих-то религиозных убеждений.. меня всё устраивает..

----------
DjVu Utils

Всего записей: 1503 | Зарегистр. 26-07-2007 | Отправлено: 22:38 05-02-2016
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
недавно выяснилось, что DjVu Solo (а м.б. и еще какие-либо древние кодеры) не соблюдают стандарт DjVu
Цитата:
8.3.12 INCL  
This is the counterpart to the FORM:DjVi chunk which provides document-level  
("shared") information. The INCL chunk simply contains the (unencoded) UTF8  
encoded ID of the included component file. To obtain the data for this chunk, the  
decoder should look for this ID at in the governing DIRM chunk. The corresponding  
chunk must be of type FORM:DJVI and contain the shared chunk.  
и пишут название (ID) чанков в кодировке Win-1251 вместо UTF8 - и после INCL, и в кодированную часть DIRM.. это имеет значение, если ID не на латинице, а, например, на кириллице.. в связи с этим DjVu Chunk Remover некорректно работал с данными файлами..
т.к. реализация всех фич, которые я хотел внести в ремувер, может занять продолжительное время, то я решил выпустить промежуточную версию только с данным багфиксом.. текущая версия 0.4.1, ссылки в шапке..
видимо, со временем и в другие программы надо будет ввести проверку на соответствие ID кодировке UTF8, ибо такие древние файлы с кириллицей в названии чанков хоть и очень редко, но встречаются..

Всего записей: 1503 | Зарегистр. 26-07-2007 | Отправлено: 11:05 26-02-2016
paveleon

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Блок word дает пробел для разделения слов. \n в конце слова дает конец абзаца. Блок char дает возможность размещать отдельно две части разорванного переносом слова.
А какие преимущества дает использование блоков line и paragraph в текстовом слое? Про page тоже не очень понятно, в коде, который создает djvuOCR он избыточен, все равно же там по страницам текстовый слой создается.
 
Я работаю над перловым скриптом, добавкой к djvuOCR, который позволил бы приводить текстовый слой к удобному для поиска и просмотра виду, а также редактировать его. Поэтому хотелось бы уяснить зачем эти разные блоки.

Всего записей: 57 | Зарегистр. 14-01-2007 | Отправлено: 13:06 11-03-2016
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
paveleon

Цитата:
Блок word дает пробел для разделения слов.

нет.. пробелы в конце слова добавляют некоторые редакторы (в т.ч. DjVuOCR) для удобства и уменьшения размера текстового слоя.. а вот ФР11 и 12 этого не делают, заключая пробел в блок char

Цитата:
\n в конце слова дает конец абзаца.

имхо не гуд помещать конец абзаца в блок word.. для этого существуют другие блоки, в которые word входит..

Цитата:
Блок char дает возможность размещать отдельно две части разорванного переносом слова.

странное заявление.. а как он это делает?

Цитата:
А какие преимущества дает использование блоков line и paragraph в текстовом слое?

а какие преимущества может давать форматирование текста кроме того, что текст отформатирован? для простого поиска по тексту - никаких, а вот для разных манипуляций с текстом - может дать..
например, есть слово в конце абзаца - если знак перевода строки \n впихнуть в блок word, то при копировании и вставке этого одного слова перевод строки также будет присутствовать.. не критично, но приятного тоже мало..
пример 2 - при выделении текста в просмотрщике (например, WinDjView) при наличии блоков line строки выглядят ровными, намного эстетичнее и приятнее глазу имхо, чем без них.. сравнить можно при просмотре текста из-под ФР11 или 12 и после обработки данной книги Crutch'ем (который помимо прочего вставляет блоки line)
можно еще примеров привести при необходимости, но по-моему и так понятно, что плюсы у форматирования есть..

Цитата:
Про page тоже не очень понятно, в коде, который создает djvuOCR он избыточен, все равно же там по страницам текстовый слой создается.

есть стандарт текстового слоя djvu, в нем предусмотрено 7 различных зон, в т.ч. "экзотические", такие как column и region.. зоны низшего порядка входят в зоны высшего.. от типа используемой зоны зависит, как она координируется относительно "родителя".. абсолютные координаты только у первого родителя.. то, что в извлеченном посредством утилит DjVuLibre текстовом слое стоят абсолютные координаты - это утилиты переводят все смещения "детей" относительно "родителей" в удобочитаемый вид.. видимо, такой порядок был придуман не зря, а для уменьшения размера конечного файла.. теоретически, можно попытаться сделать текстовый слой на одних word'ах, но это может вызвать неправильное отображение выделенного текста в просмотрщиках и увеличить результирующий файл..

Цитата:
Я работаю над перловым скриптом, добавкой к djvuOCR, который позволил бы приводить текстовый слой к удобному для поиска и просмотра виду, а также редактировать его. Поэтому хотелось бы уяснить зачем эти разные блоки.

про редактирование понятно, у меня самого в очень далеких планах сделать редактор текстового слоя djvu, а вот про поиск и тем более просмотр (скрытого текста) - не очень.. можно по-подробнее?

Всего записей: 1503 | Зарегистр. 26-07-2007 | Отправлено: 17:25 15-03-2016
paveleon

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Мне надо было сказать, что я смотрел только как отображает текстовый слой WinDjView. Через него мы можем либо забирать текст в буфер обмена, либо искать строку.
К концу подстрок, оформленных word, в буфере добавляется пробел, при поиске они тоже определяются отдельно. А если подстрока оформлена char, она вставляется в буфер как есть, приклеиваясь к следующей подстроке. При поиске также две соседних подстроки будут совпадать с целым словом.
Этим эффектом можно пользоваться для слов, разорванных переносом строки, или для китайского текста, в котором пробелов вообще нет.
(Если блок line означает графическую строку, он тоже будет усиливать эти разрывы.)
Что в других средствах просмотра я не знаю, надо проверять.
 

Цитата:
Блок char дает возможность размещать отдельно две части разорванного переносом слова.  

Первая часть этого слова (без символа переноса) оформляется блоком char. При копировании в буфер и при поиске слово будет целым. Но на странице графики две его части будут в отдельных прямоугольниках и могут выделяться по отдельности.
 

Цитата:
если знак перевода строки \n впихнуть в блок word, то при копировании и вставке этого одного слова перевод строки также будет присутствовать

Да, это верно. Еще и пробел от блока word появляется в начале следующей строки.  
 

Цитата:
текстовый слой на одних word'ах

Если точнее, то на char'ах. word эмулируется char с пробелом в конце, но не наоборот.
 

Цитата:
про поиск и тем более просмотр

Я только про то, что текст извлекается в удобочитаемом виде, правится редактором с проверкой орфографии и регулярными, затем вклеивается обратно. Тут важно сохранить соответствие подстрок-слов. При редактировании где-то надо будет их соединять и разбивать. Вставлять там '=' к примеру.
Еще, на самом первом этапе скрипт дает список разрывов строк с неопределившимся переносом, чтобы вручную указать настоящие дефисы. Это просто, так как отмечать дефисы надо только в 10-20% случаев.
Кстати, вы заметили, что можно вставлять в djvuOCR настоящий юникод, а не восьмеричные коды?
 

Всего записей: 57 | Зарегистр. 14-01-2007 | Отправлено: 19:17 20-03-2016
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
paveleon
что я понял из разговора
1) есть стремление сделать что-то положительное (и хоть это и является на мой взгляд изобретением велосипеда, всё равно, то что есть стремление - это положительный момент)
2) нет понимания, как устроен текстовый слой djvu
3) нет понимания, как реализованы поиск, выделение и копирование в WinDjView
без понимания 2 и 3 сложно сделать что-то стОящее..
касательно корректного поиска при наличии переносов - я заморачивался в своё время и реализовал его на уровне просмотрщика в модификации программы WinDjView Extended.. там есть специальный чекбокс "игнорировать переносы".. насколько помню, для корректного копирования тоже код как-то модифицировал.. рекомендую поюзать прогу, там есть масса удобных фич, отсутствующих в основной версии программы.. возможно, там уже есть всё, что нужно..
в основной версии WinDjView поиск происходит по сплошному тексту, не зависит от деления на блоки, но чувствителен к количеству пробелов между словами, наличию дефисов/переносов.. в Extended я постарался устранить эти недостатки..
DjVuOCR в свою очередь тоже "борется" с переносами, сливая 2 половинки слова в одно в документах, распознанных ФР8.. это же делает FR11 DjVu Text Layer Crutch для документов ФР11 и 12..  
таким образом, для нормального поиска по djvu-книге все инструменты есть.. исправлять вручную некоторые неправильно определенные файнридером переносы имхо не имеет смысла, т.к. во-первых - WinDjView Extended прекрасно справится с такими случаями при поиске, а во-вторых - следующий значимый этап по повышению качества текста - это вычитка.. исправление переносов вручную - это только мизерная часть данного процесса, дающая незначительную выгоду только при копировании текста..
если еще осталось желание этим заниматься, могу подсказать что надо делать, ибо всё это я уже проходил, нюансы мне известны.. конкретику лучше обсуждать в личке, т.к. здесь это уже оффтоп..
кстати, все манипуляции с txt-слоем djvu-файла проводит утилита djvused, а не DjVuOCR.. в т.ч. работа с юникодом вместо восьмиричного представления символов - это функция данной программы в относительно "свежих" версиях.. но она имеет ряд "нехороших" встроенных функций, влияющих на оформление текста - так она принудительно вставляет после блока line символ конца строки, после paragraph - 0x1F и т.п.. в Crutch'е есть выбор, что ставить после блоков или ничего не ставить.. но djvused имеет открытые исходники, так что при необходимости можно подправить под себя..

Всего записей: 1503 | Зарегистр. 26-07-2007 | Отправлено: 15:14 21-03-2016
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
обновил DjVu Chunk Remover до версии 0.5..
основные нововведения - это поддержка одностраничных документов, а также добавление BG44 белого цвета при удалении только фона и добавление  FGbz черного цвета при удалении только цвета маски - это позволяет корректно отображать цветные страницы при удалении либо фона, либо цвета маски..

Всего записей: 1503 | Зарегистр. 26-07-2007 | Отправлено: 13:12 11-04-2016
balik1982



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
такой вопрос по теме djvu
возможно есть уже программа которая бы позволяла извлекать из готового файла djvu нужный диапазон страниц, как это можно делать с pdf файлами?
 
спасибо!

Всего записей: 118 | Зарегистр. 23-02-2005 | Отправлено: 12:17 15-04-2016
Chimanalyt

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
balik1982

AVS Document Converter?

Всего записей: 343 | Зарегистр. 23-06-2006 | Отправлено: 12:37 15-04-2016
balik1982



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
скачал AVS Document Converter 3.0.2
с djvu он вообще не работает

Всего записей: 118 | Зарегистр. 23-02-2005 | Отправлено: 09:14 16-04-2016
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
balik1982
ну, прям чтоб 1 в 1 с акробатом - такого нет..
а вообще, DjVu Chunk Remover просто и быстро может удалять любые указанные страницы или диапазон.. например, нужно извлечь с 5 по 10 страницу -  открываешь книгу в программе, в поле "страницы" указываешь "1-4,11-", отмечаешь чекбокс "удалить страницы", жмешь "удалить" и "сохранить" - указываешь новое имя книги с извлеченными страницами или перезаписываешь старый файл.. получается типа извлечение..

Всего записей: 1503 | Зарегистр. 26-07-2007 | Отправлено: 19:55 17-04-2016
balik1982



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
это уже более интересно, попробую.
 
часто приходится с журналов в djvu извлекать статьи и в DjVuEditor это делать долго и не удобно

Всего записей: 118 | Зарегистр. 23-02-2005 | Отправлено: 10:15 18-04-2016
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
balik1982
я функционал по удалению страниц в ремувер встроил именно по той причине, что все другие известные мне методы "долгие и неудобные")))

Всего записей: 1503 | Зарегистр. 26-07-2007 | Отправлено: 11:54 18-04-2016
serg3001



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
не подскажите, а где можно найти программу djvutoy?
И чем лучше проводить перевод из формата djvu в картинки, или же в текст, чтобы потом можно было создать файл формата fb2/pdf?

Всего записей: 3906 | Зарегистр. 16-10-2010 | Отправлено: 17:10 31-07-2016 | Исправлено: serg3001, 17:15 31-07-2016
Engaged_Clown



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
serg3001

Цитата:
djvutoy?

https://www.upload.ee/files/6020609/DjVuToy_2.08_eng.zip.html

----------
Опросы ru-board'а

Всего записей: 8819 | Зарегистр. 08-06-2006 | Отправлено: 17:51 31-07-2016
serg3001



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Engaged_Clown
там пишет, что заблокировано: содержит вирус или шпион

Всего записей: 3906 | Зарегистр. 16-10-2010 | Отправлено: 19:15 31-07-2016
Engaged_Clown



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
serg3001
http://s019.radikal.ru/i621/1607/f8/0fddbb9b5a85.png
Всё там нормально, не советую пользоваться говноантивирусами. У меня вообще их нет.

Вот оффсайт вроде http://www.gratilog.net/xoops/modules/mydownloads/singlefile.php?cid=62&lid=2796

----------
Опросы ru-board'а

Всего записей: 8819 | Зарегистр. 08-06-2006 | Отправлено: 21:25 31-07-2016
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
serg3001

Цитата:
чем лучше проводить перевод из формата djvu в картинки, или же в текст

для меня удобнее всего переводить в картинки с помощью WinDjView Extended - доступны несколько форматов, в т.ч. tif  и png.. ну а в текст - файнридер.. кстати, новым файнридерам не требуется перевод из djvu в промежуточный графический формат, они и djvu неплохо хавают..
Engaged_Clown

Цитата:
Вот оффсайт вроде http://www.gratilog.net/xoops/modules/mydownloads/singlefile.php?cid=62&lid=2796

не, оффсайт здесь http://www.cnblogs.com/stronghorse/ , а здесь http://pan.baidu.com/s/1jGrnmsA папка с файлами, тока там всё на китайском..

Всего записей: 1503 | Зарегистр. 26-07-2007 | Отправлено: 10:48 01-08-2016
LonerD



Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору

Цитата:
не подскажите, а где можно найти программу djvutoy?  

Оф.сайт
http://www.cnblogs.com/stronghorse/

Всего записей: 889 | Зарегистр. 27-06-2006 | Отправлено: 13:28 01-08-2016 | Исправлено: LonerD, 13:29 01-08-2016
gf7777z

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
здесь http://pan.baidu.com/s/1jGrnmsA папка с файлами, тока там всё на китайском..  

Все печеньки тут.

Всего записей: 19 | Зарегистр. 08-11-2015 | Отправлено: 16:31 01-08-2016 | Исправлено: gf7777z, 16:33 01-08-2016
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39

Компьютерный форум Ru.Board » Компьютеры » Программы » Утилиты для DjVu: DjVuNMEditor, FR11 DTL Crutch и др.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru