Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Утилиты для DjVu: DjVuNMEditor, FR11 DTL Crutch и др.

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36

Открыть новую тему     Написать ответ в эту тему

NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

DjVu Nano Mega Editor
(DjVuNMEditor)

Программа для редактирования в DjVu-книгах:
1) текстового слоя;
2) аннотаций;
3) заголовков страниц (title);
4) закладок (bookmarks, outline); в текущей версии не реализовано
5) метаданных; в текущей версии не реализовано
6) еще чего-то?
Описание
Скачать v3.5
Английская локализация

TurnTheText

Утилита TurnTheText предназначена для устранения несоответствия графического и текстового слоев в DjVu-книгах, возникающего при использовании FineReader версии 8 (и ниже) для распознавания текста..
Может быть использована, например, перед внедрением оглавления в DjVu-книгу с помощью программы DjVu Hyperlinks Editor..
Описание
Скачать v1.1

DjVu Annotations Editor

Программа для редактирования гиперссылок (annotations/hyperlinks) в файлах формата djvu, преимущественно, после создания оглавлений в книге при помощи DjVu Hyperlinks Editor'а..
Выполняет сдвиг, выравнивание, изменение размеров, цвета, свойств и др..
Описание
Скачать v0.2
Практически весь функционал программы реализован в DjVuNMEditor'е

HeadWorder

Программа для полуавтоматического извлечения заголовков словарных статей из DjVu-словарей, энциклопедий и т.п. и последующего внедрения их в книгу в виде закладок DjVu или WinDjView (с позиционированием)..
Программа устарела так и не выйдя в свет((

FR11 DjVu Text Layer Crutch

Программа для исправления текстового слоя в файле DjVu, созданного посредством ABBYY FineReader билд 11.0.102.583 и выше (в т.ч. ФР12)..
Выполняет следующие действия:
- удаляет блоки Char;
- создает зоны Line и Paragraph;
- объединяет две половинки слова, разделенного знаком переноса, в одно;
- позволяет переносить текстовый слой из одного файла в другой..
Описание
Скачать v0.3.3
Основной функционал программы реализован также в DjVuNMEditor'е

DjVu Chunk Remover

Программа для удаления блоков (чанков), а также страниц из файлов формата DjVu.. может удалять фон (BG44, BGjp), закладки (NAVM), аннотации (ANTa, ANTz), текст (TXTa, TXTz), информацию о цвете маски(FG44, FGbz) и др.. запрещено удаление блоков INFO, Sjbz, Djbz и INCL, содержащих ссылки на Djbz-словари символов..
Описание
Скачать v0.5

DjVu Text Mover

Программа позволяет поворачивать и двигать текстовый слой в файлах DjVu..
Скачать v0.1

DjVu Title Maker

Программа для создания заголовков страниц (переименования страниц) в файлах DjVu..  
Таким образом, страницы можно называть "Обложка", I, II, III, IV и т.п., автоматически или вручную переименовывать страницы со сдвинутой нумерацией (в т.ч. при удалении пустых страниц) для соответствия нумерации электронной книги её бумажному оригиналу..
Описание
Скачать v0.1
Основной функционал программы реализован также в DjVuNMEditor'е

DjVu Clean Page Inserter

Программа для быстрого создания и внедрения в книгу пустых страниц.. Нужна для восстановления соответствия бумажной и электронной нумерации, что облегчает навигацию по книге..
Описание
Скачать v0.1

DjVu Blits Merger

Программа для добавления на страницы djvu-книги графических изображений (mask-слоя) из другого djvu-файла.. Может применяться для добавления в книгу номеров страниц, колонтитулов, другой необходимой информации без перекодирования файла, а также для объединения графики с двух страниц, закодированных с разной степенью сжатия (например, aggressive и lossless)..
Описание
Скачать v0.1

DjVu Blits Hider

Программа для удаления со страниц djvu-книги графических изображений mask-слоя (blits).. может применяться для очистки страницы от "грязных пятен", лишних элементов маски и т.п. без перекодирования файла.. совместно с DjVu Blits Merger'ом позволяет редактировать mask-слой djvu-книги - Hider удаляет, а Merger вставляет на это место нужную графику..
Описание
Скачать v0.1.1

FR12 Parser

Программа для извлечения координат символов из проекта ФР12-15..
Описание
Скачать v2.3.1

Все программы в одной папке


Программы, которых еще нет, но, возможно, когда-нибудь сделаю..


аналог DjVu Hyperlinks Editor'у с бОльшим функционалом и предварительным просмотром.. DjVuNMEditor
программа для создания и внедрения в книгу пустых страниц.. DjVu Clean Page Inserter
программа для удаления страниц из книги.. DjVu Chunk Remover
программа для удаления пустых чанков, типа CIDa.. DjVu Chunk Remover
программа для добавления текста в нужное место на странице (+ к существующему) DjVuNMEditor
программа для удаления блитов со страницы DjVu Blits Hider
• программа для разделения разворотов на 2 страницы
программа для добавления новых блитов на существующую страницу (объединение графики с двух страниц на одну) DjVu Blits Merger
• программа для перемещения блитов на странице
• программа для кодирования ч/б растра без потерь одним или несколькими большими по размеру шейпами
• еще что-то хотел сделать.. но забыл.. вспомню - запишу))
 
если найдутся желающие сделать эти программы - добро пожаловать)) мыслями и наработками с удовольствием поделюсь)) это относится и к следующему блоку тоже..

Программы, которых нет, и я, к сожалению, наврядли осилю((..

визивиг-редактор текстового слоя.. DjVuNMEditor
Hyperlinks-редактор, типа Document Express Editor, но с возможностью групповой правки аннотаций.. DjVuNMEditor
• полноценный визивиг редактор графики DjVu с возможностью удаления, сдвига, правки шейпов в маске.. а может быть и корректировки фона тоже..
WinDjView с поиском текста в закладках.. ну и некоторыми другими дополнительными возможностями.. таки осилил))
 

продолжение следует..

Всего записей: 1427 | Зарегистр. 26-07-2007 | Отправлено: 22:57 06-02-2012 | Исправлено: NME, 18:28 25-09-2022
AlexeiPetrov

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Всем спасибо за внимание к проблеме. И с радостью хочу сказать, что я научился бороться с этими символами 
 (L-sep). И гораздо проще, чем казалось бы.
Алгоритм следующий:
1. В программе "ABBYY FineReader 11" распознаем текст и сохраняем файл в формате PDF.
2. Готовый PDF через программу "Pdf 2 Djvu Converter" перегоняем в DJVU с разрешением 600 dpi с сохранением текстового слоя и оглавления (если есть). Данный DJVU не подходит для распространения, поскольку размер его будет очень и очень большой. Но...
3. При помощи программы "Djvu.OCR.v2.4b.Rus" из полученного DJVU извлекаем OCR-слой.
4. Теперь снова обращаемся к "ABBYY FineReader 11". В него загружаем уже готовый PDF и создаем новый DJVU без распознанного слоя, а только изображение.
5. В полученный файл DJVU при помощи программы Djvu.OCR.v2.4b.Rus внедряем готовый OCR-слой.
6. Еще один шаг (актуален, если у вас в PDF было оглавление и вы его сохранили, используя конвертер "Pdf 2 Djvu")  - при помощи программы "Editor 6.0" в первом DJVU (большого размера) заменяем все страницы на страницы второго DJVU (нормального размера, полученного после пункта 5) и сохраняем. Всё. Качественный DJVU с нормальным слоем распознанного текста и оглавлением готов.
 
PS: почему я предлагаю перегонять PDF сначала из FineReader'а, а потом обратно? В "ABBYY FineReader 11" для сохранения в PDF есть функция установки пользовательских полей, а для DJVU такой функции нет, и странички могут отличаться по размеру. Чтобы этого избежать, готовый PDF снова загружаем в FineReade и при создании DJVU все странички будут одинаковыми.

Всего записей: 21 | Зарегистр. 29-08-2021 | Отправлено: 16:05 26-12-2021 | Исправлено: AlexeiPetrov, 16:26 26-12-2021
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
как по мне - делать DJVU с помощью файнридера - то еще извращение..
есть масса способов получения качественных DJVU, отточенных на миллионах книг, но ни разу я не видел и не слышал хороших отзывов о качестве DJVU, полученных с помощью файнридера.. текст? - да! графика? - нет!!! я и сам много раз делал DJVU с помощью файнридера, но исключительно для получения текстового слоя, и всегда качество графики было намного хуже, чем у оригинала, а размер гораздо больше..
первое впечатление - что был изобретён велосипед с квадратными колёсами.. зачем? зачем плодить г, если можно сделать нормальную книгу с нормальным текстовым слоем более простыми способами?? гораздо лучше воспользоваться проверенными годами способами.. имхо..

Всего записей: 1427 | Зарегистр. 26-07-2007 | Отправлено: 01:42 29-12-2021
AlexeiPetrov

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
В том-то и беда, что из FR11 невозможно извлечь текстовой слой. А другого FR у меня нет. Приходится искать обходные пути. Качество графики и размер DJVU из FR11 приемлемое. Мне попадались образцы  файлов DJVU гораздо хуже по качеству и сделанные явно не с помощью FR. Вот только в текстовом слое для DJVU из FR есть небольшой косяк. Из-за него мои мучения.
Но для себя я проблему решил: делаю сначала PDF, потом в течение очень короткого времени преобразую готовый файл в DJVU.

Всего записей: 21 | Зарегистр. 29-08-2021 | Отправлено: 10:01 29-12-2021
fozzie

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
В том-то и беда, что из FR11 невозможно извлечь текстовой слой.

Возможно. Минимум тремя способами. Предпочитаю DjVuToy.
 
Но, как говорится, "каждый борется со скукой, как умеет"...

Всего записей: 141 | Зарегистр. 03-09-2001 | Отправлено: 10:58 29-12-2021 | Исправлено: fozzie, 11:00 29-12-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
оффтоп
fozzie
DjvuToy и FR ?? Это что-то новое. Можно мне в личку пояснения о трёх способах?

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 12:26 29-12-2021
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
Можно мне в личку пояснения о трёх способах?

считаете что другим не интересно?

Всего записей: 7322 | Зарегистр. 08-09-2001 | Отправлено: 13:03 29-12-2021
fozzie

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
 
Какие проблемы извлечь текстовый слой из сделанного в FR  djvu? Или AlexPetrov имел в виду нечто другое?

Всего записей: 141 | Зарегистр. 03-09-2001 | Отправлено: 13:16 29-12-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
считаете что другим не интересно?


да не - тут это оффтоп, а куда попросить написать - сходу не соображу.
 
fozzie
так вы про djvu! А пишете про ФР. Я понял вашу фразу так: "djvutoy умеет извлекать текст из пакета ФР11".

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 14:07 29-12-2021
AlexeiPetrov

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Какие проблемы извлечь текстовый слой из сделанного в FR  djvu? Или AlexPetrov имел в виду нечто другое?

Я имел ввиду, что текстовый слой в DJVU, сделанного в FR, содержит символы L-sep, которых не должно быть. Вот они меня и раздражают. Поэтому стал искать пути, как избавиться от этих символов. Вроде нашел. Чему и радуюсь.

Всего записей: 21 | Зарегистр. 29-08-2021 | Отправлено: 14:07 29-12-2021
fozzie

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
так вы про djvu! А пишете про ФР. Я понял вашу фразу так: "djvutoy умеет извлекать текст из пакета ФР11".

1. Где это я писал про FR ?
2. Что есть в вашем понимании "текстовый слой из FR" абстрагированный от формата выходного файла? При том, что эту фразу AlexPetrov писал в ответ на реплику NME, в которой речь шла именно о получении djvu при помощи FR.  

Всего записей: 141 | Зарегистр. 03-09-2001 | Отправлено: 14:38 29-12-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
оффтоп
Подробнее...

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 14:56 29-12-2021
shttd

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Я имел ввиду, что текстовый слой в DJVU, сделанного в FR, содержит символы L-sep, которых не должно быть. Вот они меня и раздражают. Поэтому стал искать пути, как избавиться от этих символов. Вроде нашел. Чему и радуюсь.

Добрый день, тоже интересует эта тема.
Я знаю только 2 способа получить текстовый слой из Файнридера (использую 15 версию):
 
Сохранить распознанный проект из ФР в djvu.
Извлечь текстовый слой с помощью Djvu OCR (v2.4b) или DjvuToy (v3.11).
 
Если вам известны еще методы - расскажите пожалуйста!

Всего записей: 43 | Зарегистр. 20-07-2008 | Отправлено: 11:12 30-12-2021
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
В том-то и беда, что из FR11 невозможно извлечь текстовой слой.

Все возможно, распознаете готовый обработанный djvu в FR11, сохраняете результаты в djvu с другим именем. Утилитой djvused  извлекаете из нового файла текстовой слой в файл, sed'ом (или продвинутым блокнотом с регулярками) удаляете/заменяете недужные символы или char блоки. Той же djvused добавляете отредактированный текстовой слой  в исходный файл.  Процесс извлечениеOCR-правка-вставкаOCR очень быстрый - буквально секунды.
Пример:

Код:
djvused mydjvu_fr11.djvu -u -e output-txt | sed /^.\(char.*/d >layer.txt
djvused mydjvu.djvu  -f layer.txt -s

Всего записей: 883 | Зарегистр. 14-12-2005 | Отправлено: 09:42 31-12-2021 | Исправлено: U235, 10:02 31-12-2021
AlexeiPetrov

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Утилитой djvused  извлекаете из нового файла текстовой слой в файл

 
Сегодня пробовал утилитой djvused извлечь текстовый слой из файла djvu, сделанного в FR11. Не знаю, что я делаю не так, но у меня упорно извлекаются только первые две страницы.

Всего записей: 21 | Зарегистр. 29-08-2021 | Отправлено: 17:00 03-01-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Не знаю, что я делаю не так

а надо бы чтоб и тут знали. Текст команды и пример файла.

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 17:58 03-01-2022
AlexeiPetrov

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
а надо бы чтоб и тут знали. Текст команды и пример файла.

Вот файл, над которым я работаю. Сохранил его в DJVU. Символы L-sep не убраны.  
https://disk.yandex.ru/d/ckeXMAeex1XfIw
 
Использую команду для извлечения текста: djvused myfile.djvu -u -e "output-all" > myfile.dsed
Читаю по инструкции, поэтому название файлу даю такое же, как в инструкции, чтобы быстрее освоиться.
 

Всего записей: 21 | Зарегистр. 29-08-2021 | Отправлено: 18:28 03-01-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
может, djvulibre древняя? У меня тоже облом:  

Код:
c:\Program Files (x86)\DjVuZone\DjVuLibre>djvused myfile.djvu -u -e "output-all" > myfile_005.dsed
*** [1-10100] Text layer hierarchy is corrupt"
*** (..\..\..\libdjvu\DjVuText.cpp:287)

 
upd
С виду ломается как раз на страничке с первым символом L-sep. Впору баг-репорт писать.

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 18:53 03-01-2022 | Исправлено: TelecomUral, 19:01 03-01-2022
AlexeiPetrov

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
может, djvulibre древняя?

Сегодня скачал последнюю версию. До этого данной утилитой и программой в целом не пользовался.
 
 
Добавлено:
Зато djvused прекрасно извлекает текст из файла DJVU, сделанного при помощи Pdf 2 Djvu Converter. Но то же самое делает DjvuOCR. И результат абсолютно одинаковый.
Так что хрен редьки не слаще.
 
Тут другая проблема нарисовалась. Если извлеченный текст обратно внедрить в DJVU-файл, то почему-то тире часто переносится на другую строчку. Получается что-то типа:

Цитата:
олжности. — Высказывание Дантона. — Указы, обнародованные при свете  
факелов.  
—  
Господа Майярдо, д'Обиньи и Карль убиты.  
—  
Четыре кельи  
монастыря фельянов.  
—  
Двадцать пять луидоров.  
—  
Законодательное  

Хотя все тире должны быть в тех же строчках, что и нижние или верхние фразы. Как-то с этим возможно бороться?

Всего записей: 21 | Зарегистр. 29-08-2021 | Отправлено: 18:54 03-01-2022 | Исправлено: AlexeiPetrov, 19:09 03-01-2022
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
AlexeiPetrov
давайте в тему Формат DjVu перейдём. Здесь всё такое - оффтоп.

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 19:11 03-01-2022
AlexeiPetrov

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
давайте в тему Формат DjVu перейдём. Здесь всё такое - оффтоп.

Всё, переезжаю.
 

Всего записей: 21 | Зарегистр. 29-08-2021 | Отправлено: 19:33 03-01-2022
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36

Компьютерный форум Ru.Board » Компьютеры » Программы » Утилиты для DjVu: DjVuNMEditor, FR11 DTL Crutch и др.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru