Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Утилиты для DjVu: DjVuNMEditor, FR11 DTL Crutch и др.

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

Открыть новую тему     Написать ответ в эту тему

NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

DjVu Nano Mega Editor
(DjVuNMEditor)

Программа для редактирования в DjVu-книгах:
1) текстового слоя;
2) аннотаций; в текущей версии не реализовано
3) закладок (bookmarks, outline); в текущей версии не реализовано
4) метаданных; в текущей версии не реализовано
5) еще чего-то?
Описание
Скачать v1.1

TurnTheText

Утилита TurnTheText предназначена для устранения несоответствия графического и текстового слоев в DjVu-книгах, возникающего при использовании FineReader версии 8 (и ниже) для распознавания текста..
Может быть использована, например, перед внедрением оглавления в DjVu-книгу с помощью программы DjVu Hyperlinks Editor..
Описание
Скачать v1.1

DjVu Annotations Editor

Программа для редактирования гиперссылок (annotations/hyperlinks) в файлах формата djvu, преимущественно, после создания оглавлений в книге при помощи DjVu Hyperlinks Editor'а..
Выполняет сдвиг, выравнивание, изменение размеров, цвета, свойств и др..
Описание
Скачать v0.2

HeadWorder

Программа для полуавтоматического извлечения заголовков словарных статей из DjVu-словарей, энциклопедий и т.п. и последующего внедрения их в книгу в виде закладок DjVu или WinDjView (с позиционированием)..
может быть в будущем, когда описание сделаю..  

FR11 DjVu Text Layer Crutch

Программа для исправления текстового слоя в файле DjVu, созданного посредством ABBYY FineReader билд 11.0.102.583 и выше (в т.ч. ФР12)..
Выполняет следующие действия:
- удаляет блоки Char;
- создает зоны Line и Paragraph;
- объединяет две половинки слова, разделенного знаком переноса, в одно;
- позволяет переносить текстовый слой из одного файла в другой..
Описание
Скачать v0.3.1

DjVu Chunk Remover

Программа для удаления блоков (чанков), а также страниц из файлов формата DjVu.. может удалять фон (BG44, BGjp), закладки (NAVM), аннотации (ANTa, ANTz), текст (TXTa, TXTz), информацию о цвете маски(FG44, FGbz) и др.. запрещено удаление блоков INFO, Sjbz, Djbz и INCL, содержащих ссылки на Djbz-словари символов..
Описание
Скачать v0.5

DjVu Text Mover

Программа позволяет поворачивать и двигать текстовый слой в файлах DjVu..
Скачать v0.1

DjVu Title Maker

Программа для создания заголовков страниц (переименования страниц) в файлах DjVu..  
Таким образом, страницы можно называть "Обложка", I, II, III, IV и т.п., автоматически или вручную переименовывать страницы со сдвинутой нумерацией (в т.ч. при удалении пустых страниц) для соответствия нумерации электронной книги её бумажному оригиналу..
Описание
Скачать v0.1

DjVu Clean Page Inserter

Программа для быстрого создания и внедрения в книгу пустых страниц.. Нужна для восстановления соответствия бумажной и электронной нумерации, что облегчает навигацию по книге..
Описание
Скачать v0.1

DjVu Blits Merger

Программа для добавления на страницы djvu-книги графических изображений (mask-слоя) из другого djvu-файла.. Может применяться для добавления в книгу номеров страниц, колонтитулов, другой необходимой информации без перекодирования файла, а также для объединения графики с двух страниц, закодированных с разной степенью сжатия (например, aggressive и lossless)..
Описание
Скачать v0.1

DjVu Blits Hider

Программа для удаления со страниц djvu-книги графических изображений mask-слоя (blits).. может применяться для очистки страницы от "грязных пятен", лишних элементов маски и т.п. без перекодирования файла.. совместно с DjVu Blits Merger'ом позволяет редактировать mask-слой djvu-книги - Hider удаляет, а Merger вставляет на это место нужную графику..
Описание
Скачать v0.1.1

Все программы в одной папке


Программы, которых еще нет, но, возможно, когда-нибудь сделаю..


• аналог DjVu Hyperlinks Editor'у с бОльшим функционалом и предварительным просмотром..
программа для создания и внедрения в книгу пустых страниц.. DjVu Clean Page Inserter
программа для удаления страниц из книги.. DjVu Chunk Remover
программа для удаления пустых чанков, типа CIDa.. DjVu Chunk Remover
программа для добавления текста в нужное место на странице (+ к существующему) DjVuNMEditor
программа для удаления блитов со страницы DjVu Blits Hider
• программа для разделения разворотов на 2 страницы
программа для добавления новых блитов на существующую страницу (объединение графики с двух страниц на одну) DjVu Blits Merger
• программа для перемещения блитов на странице
• программа для кодирования ч/б растра без потерь одним или несколькими большими по размеру шейпами
• еще что-то хотел сделать.. но забыл.. вспомню - запишу))
 
если найдутся желающие сделать эти программы - добро пожаловать)) мыслями и наработками с удовольствием поделюсь)) это относится и к следующему блоку тоже..

Программы, которых нет, и я, к сожалению, наврядли осилю((..

визивиг-редактор текстового слоя.. DjVuNMEditor
• Hyperlinks-редактор, типа Document Express Editor, но с возможностью групповой правки гиперссылок..  
• полноценный визивиг редактор графики DjVu с возможностью удаления, сдвига, правки шейпов в маске.. а может быть и корректировки фона тоже..
WinDjView с поиском текста в закладках.. ну и некоторыми другими дополнительными возможностями.. таки осилил))
 

продолжение следует..

Всего записей: 1280 | Зарегистр. 26-07-2007 | Отправлено: 22:57 06-02-2012 | Исправлено: NME, 14:42 10-06-2021
asku



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
если же все-таки через djvused надо, то извлекать так
 
Код:
djvused tede.djvu -u -e "output-txt" > myfile.txt  
 
внедрять обратно так
 
Код:
djvused tede.djvu -f myfile.txt -s  

 
 
Извлек. В обычном Блокноте поменял символы в текстовом файле. А обратно внедрить не получается.

Всего записей: 228 | Зарегистр. 04-05-2016 | Отправлено: 12:41 23-02-2021
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А обратно внедрить не получается.

а что получается?
+ видать, спецсимволы расставили какие-нибудь.
++ двойную кавычку, например

Всего записей: 1653 | Зарегистр. 15-07-2010 | Отправлено: 14:24 23-02-2021 | Исправлено: TelecomUral, 14:41 23-02-2021
los

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
asku,
исходный файл можете выложить и указать символы которые хотите изменить. У файла myfile.txt  какая кодировка после изменения в Блокноте?

Всего записей: 4962 | Зарегистр. 08-09-2001 | Отправлено: 14:31 23-02-2021
asku



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
исходный файл можете выложить


Цитата:
а что получается?  

 
Архив. Здесь и исходник (дежавю), и извлеченный текстовый слой, и этот же текстовый слой после замены символов.
 
Кодировка UTF-8. Я открыл файл с текстовым слоем и сделал две замены:
Є поменял на Æ
є поменял на æ
 
Добавлено:
Не так отобразилась буква, на которую заменял. Это лигатура ае из датского алфавита. Не знаю, как ее здесь написать.

Всего записей: 228 | Зарегистр. 04-05-2016 | Отправлено: 20:23 23-02-2021
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
asku
У вас в строке в начале файла

Код:
select "�ᢟ0001.djvu"

произошла замена, а страницы с таким названием  нет. Вот и ошибка.
 
Добавлено:
https://dropmefiles.com/xKwHA

Код:
djvused cocko.djvu -f myfile3.txt -s

Всего записей: 744 | Зарегистр. 14-12-2005 | Отправлено: 22:18 23-02-2021 | Исправлено: U235, 22:19 23-02-2021
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
asku
можно название первых двух страниц в текстовом файле поменять на их номера, т.е. вместо select "��1_0001.djvu" должно быть select 1, вместо select "��ᢟ0001.djvu" вписать select 2 и будет счастье..  
 
 
Добавлено:
ну, либо как U235 предложил, вписать названия страниц.. есть и другие варианты, но эти самые простые..

Всего записей: 1280 | Зарегистр. 26-07-2007 | Отправлено: 23:08 23-02-2021
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
т.е. вместо select "��1_0001.djvu" должно быть select 1

вообще-то у меня видно название странички как "цъар1_0001.djvu" (если выбирать кодировку win1251 в notepad++).
В тотале так:

То есть имя файла странички пролезло с диска без изменений.
windjview кажет:

 
djvutoy так:

хи-хи. напишу Ма Цзяну, дам скриншот.
 
Это, часом, не баг djvused ? Может, заявить проблему разрабам?
 
+
Вот не надо, блин, пользоваться в файловой системе иначе чем семибитными ANSI "Уж сколько раз твердили миру..."

Всего записей: 1653 | Зарегистр. 15-07-2010 | Отправлено: 03:23 24-02-2021 | Исправлено: TelecomUral, 03:40 24-02-2021
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Это на форум так вставилось в тегах "код".  
NME я не вписывал названия страниц, я взял исходный myfile1.txt и просто сделал две замены заглавной и строчной буквы и сохранил как myfile3.txt. Редактор - Geany. Почему у asku изменились названия страниц не знаю. Может это стандартный Блокнот так портит файлы со смешанной кодировкой.
 

Всего записей: 744 | Зарегистр. 14-12-2005 | Отправлено: 03:58 24-02-2021
los

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
У кого-нибудь есть файл с корректно выставленными метаданными: Author, Title etc.?

Всего записей: 4962 | Зарегистр. 08-09-2001 | Отправлено: 13:09 27-02-2021
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
los

Цитата:
корректно выставленными

то есть??
Стандарт вроде только лишь рекомендует какой-то "XMP", и не более. И я краем уха слышал, что для PDF-ок есть стандарт метаданных.  
Это ж просто пары "ключ"-"значение", что впишете, то и будет читаться. В смысле: "правильных" djvu не бывает. В exiftool кажется тоже никаких упоминаний про djvu-теги нету. Не ругается на их неправильность, если сам чего-нибудь навставляешь.
 
А вообще я встречал насчет метаданных порядка 5-6 распространенных систем. Но ни одной не пользовался вживую. Допустим, в винде есть в свойствах файла некие поля, которые можно заполнить. Автор, название, ключевые слова и т.д. Но стандарт ли это?
Найдёте инфу - поделитесь, пожалуйста.

Всего записей: 1653 | Зарегистр. 15-07-2010 | Отправлено: 18:07 27-02-2021
los

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
то есть??  

чтобы откликалось на
djvused -e print-meta

Цитата:
В exiftool кажется тоже никаких упоминаний про djvu-теги нету.  

_https://exiftool.org/TagNames/DjVu.html

Цитата:
В смысле: "правильных" djvu не бывает.

это насовсем так.

Всего записей: 4962 | Зарегистр. 08-09-2001 | Отправлено: 19:43 27-02-2021
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
чтобы откликалось на
djvused -e print-meta

https://disk.yandex.ru/d/Hsj_lfjZ88ahgQ

Цитата:
author    "Alexeew \320\220\320\273\320\265\320\272\321\201\320\265\320\271 \320\222."
 

На самом деле там еще дофига индивидуальных тегов на пятой странице.
 
djvutoy вообще их кучу выдает, но врет Не отличает тег страницы и тег документа.
 
upd
и спасибо за ссылку на exiftool. Мне несколько лет назад эту страницу разыскать не удалось, только свод по функциям, где сказано что из джву он может только читать.
(в целом, всё-таки, маразматичное управление видом/типом ссылок - по заглавной букве и двойным кавычкам)
 
Добавлено:

Цитата:
это насовсем так.

к сожалению, комп не понимает "не совсем". Для него это "нет". Я тут из-за этих "цъар_" в именах страниц зарубился с Ма Цзяном, типа баг. А он меня носом ткнул в спецификацию djvu, мол, нет там указания на тип кодировки для этих имён. Я, говорит, и выдаю, как в djvulibre принято, в UTF-8. В итоге имеем ляпы как показал asku. Попросил его добавить "locale" данного компа.

Всего записей: 1653 | Зарегистр. 15-07-2010 | Отправлено: 07:11 01-03-2021 | Исправлено: TelecomUral, 07:26 01-03-2021
los

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral,
спасибо

Цитата:
author    "Alexeew \320\220\320\273\320\265\320\272\321\201\320\265\320\271 \320\222."  

интересно изначальное значение восстановить можно из '\320\220\320....'?
 
U235
ваш скрипт http://forum.ru-board.com/topic.cgi?forum=5&topic=38467&start=340#5
c переименованием страниц в файле cocko.djvu справляется?

Всего записей: 4962 | Зарегистр. 08-09-2001 | Отправлено: 11:55 01-03-2021
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
интересно изначальное значение восстановить можно из '\320\220\320....'?

да никаких проблем... только я тот сайт не могу теперь найти, куда подставлял такую строку
ключик -u добавите, будет вам

Цитата:
author    "Alexeew Алексей В."

 
upd
! часа три я просидел, пока нашёл сайт с приемлемым результатом перекодирования:
https://ittricks.ru/utilities/text-converter
Входной текст нужно обозвать "C/C++/PHP" с кодировкой UTF-8. Выходной - без кодировки, Raw.
 
Хотя, наверное, прямо в составе винды есть какие-нибудь мелкие утилитки, которые такую задачку решают на лету.

Всего записей: 1653 | Зарегистр. 15-07-2010 | Отправлено: 12:49 01-03-2021 | Исправлено: TelecomUral, 19:42 01-03-2021
los

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
ключик -u добавите, будет вам  

увы мне, постоянно забываю про '-u'

Всего записей: 4962 | Зарегистр. 08-09-2001 | Отправлено: 13:08 01-03-2021
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
los
Да, справился. Там только 3-ю строку заменить надо на:

Код:
djvmcvt -i cocko.djvu  test2 idx.djvu

Исходник - тот что в rar архиве был. Результат:
https://www.upload.ee/files/12950749/bundled.djvu.html

Всего записей: 744 | Зарегистр. 14-12-2005 | Отправлено: 18:45 01-03-2021 | Исправлено: U235, 18:51 01-03-2021
los

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
U235

Цитата:
Там только 3-ю строку заменить надо на:  

это понятно В моем случае понадобилось еще установить GNU coreutils - у BSD версий od, sed и т.д. синтаксис отличается. У od нет ключа --endian и еще по мелочи.
 
Кто-нибудь подскажет правильный синтаксис для файлов djvusedantfile и djvusedmetafile?
 

Всего записей: 4962 | Зарегистр. 08-09-2001 | Отправлено: 19:18 01-03-2021
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
los
кажется я внутри кода находил примеры этих файлов. Или прямо в папке с установленным djvulibre. Но там нетривиально искать.

Всего записей: 1653 | Зарегистр. 15-07-2010 | Отправлено: 19:49 01-03-2021 | Исправлено: TelecomUral, 19:49 01-03-2021
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
los
Можно взять какой-нибудь файл с анотацией, извлечь output-ant и посмотреть в редакторе. Во всяком случае, лично для меня так проще. А еще есть официальный ман, но там без примеров, к сожалению. http://djvu.sourceforge.net/doc/man/djvused.html

Всего записей: 744 | Зарегистр. 14-12-2005 | Отправлено: 19:50 01-03-2021
los

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
U235

Цитата:
Можно взять какой-нибудь файл с анотацией, извлечь output-ant и посмотреть в редакторе

на выходе будет файл для '-f', хотя нужно поэкспериментировать.
 

Цитата:
А еще есть официальный ман...

так из 'man djvused' вопрос о djvusedantfile и djvusedmetafile и возник.
 
TelecomUral,
_https://www.djvu.hu/content/img/djvu_metadata_draft_10.txt
 

Всего записей: 4962 | Зарегистр. 08-09-2001 | Отправлено: 16:21 02-03-2021
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

Компьютерный форум Ru.Board » Компьютеры » Программы » Утилиты для DjVu: DjVuNMEditor, FR11 DTL Crutch и др.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.Board
© Ru.Board 2000-2020

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru

Рейтинг.ru