Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Утилиты для DjVu: DjVuNMEditor, FR11 DTL Crutch и др.

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36

Открыть новую тему     Написать ответ в эту тему

NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

DjVu Nano Mega Editor
(DjVuNMEditor)

Программа для редактирования в DjVu-книгах:
1) текстового слоя;
2) аннотаций;
3) заголовков страниц (title);
4) закладок (bookmarks, outline); в текущей версии не реализовано
5) метаданных; в текущей версии не реализовано
6) еще чего-то?
Описание
Скачать v3.5
Английская локализация

TurnTheText

Утилита TurnTheText предназначена для устранения несоответствия графического и текстового слоев в DjVu-книгах, возникающего при использовании FineReader версии 8 (и ниже) для распознавания текста..
Может быть использована, например, перед внедрением оглавления в DjVu-книгу с помощью программы DjVu Hyperlinks Editor..
Описание
Скачать v1.1

DjVu Annotations Editor

Программа для редактирования гиперссылок (annotations/hyperlinks) в файлах формата djvu, преимущественно, после создания оглавлений в книге при помощи DjVu Hyperlinks Editor'а..
Выполняет сдвиг, выравнивание, изменение размеров, цвета, свойств и др..
Описание
Скачать v0.2
Практически весь функционал программы реализован в DjVuNMEditor'е

HeadWorder

Программа для полуавтоматического извлечения заголовков словарных статей из DjVu-словарей, энциклопедий и т.п. и последующего внедрения их в книгу в виде закладок DjVu или WinDjView (с позиционированием)..
Программа устарела так и не выйдя в свет((

FR11 DjVu Text Layer Crutch

Программа для исправления текстового слоя в файле DjVu, созданного посредством ABBYY FineReader билд 11.0.102.583 и выше (в т.ч. ФР12)..
Выполняет следующие действия:
- удаляет блоки Char;
- создает зоны Line и Paragraph;
- объединяет две половинки слова, разделенного знаком переноса, в одно;
- позволяет переносить текстовый слой из одного файла в другой..
Описание
Скачать v0.3.3
Основной функционал программы реализован также в DjVuNMEditor'е

DjVu Chunk Remover

Программа для удаления блоков (чанков), а также страниц из файлов формата DjVu.. может удалять фон (BG44, BGjp), закладки (NAVM), аннотации (ANTa, ANTz), текст (TXTa, TXTz), информацию о цвете маски(FG44, FGbz) и др.. запрещено удаление блоков INFO, Sjbz, Djbz и INCL, содержащих ссылки на Djbz-словари символов..
Описание
Скачать v0.5

DjVu Text Mover

Программа позволяет поворачивать и двигать текстовый слой в файлах DjVu..
Скачать v0.1

DjVu Title Maker

Программа для создания заголовков страниц (переименования страниц) в файлах DjVu..  
Таким образом, страницы можно называть "Обложка", I, II, III, IV и т.п., автоматически или вручную переименовывать страницы со сдвинутой нумерацией (в т.ч. при удалении пустых страниц) для соответствия нумерации электронной книги её бумажному оригиналу..
Описание
Скачать v0.1
Основной функционал программы реализован также в DjVuNMEditor'е

DjVu Clean Page Inserter

Программа для быстрого создания и внедрения в книгу пустых страниц.. Нужна для восстановления соответствия бумажной и электронной нумерации, что облегчает навигацию по книге..
Описание
Скачать v0.1

DjVu Blits Merger

Программа для добавления на страницы djvu-книги графических изображений (mask-слоя) из другого djvu-файла.. Может применяться для добавления в книгу номеров страниц, колонтитулов, другой необходимой информации без перекодирования файла, а также для объединения графики с двух страниц, закодированных с разной степенью сжатия (например, aggressive и lossless)..
Описание
Скачать v0.1

DjVu Blits Hider

Программа для удаления со страниц djvu-книги графических изображений mask-слоя (blits).. может применяться для очистки страницы от "грязных пятен", лишних элементов маски и т.п. без перекодирования файла.. совместно с DjVu Blits Merger'ом позволяет редактировать mask-слой djvu-книги - Hider удаляет, а Merger вставляет на это место нужную графику..
Описание
Скачать v0.1.1

FR12 Parser

Программа для извлечения координат символов из проекта ФР12-15..
Описание
Скачать v2.3.1

Все программы в одной папке


Программы, которых еще нет, но, возможно, когда-нибудь сделаю..


аналог DjVu Hyperlinks Editor'у с бОльшим функционалом и предварительным просмотром.. DjVuNMEditor
программа для создания и внедрения в книгу пустых страниц.. DjVu Clean Page Inserter
программа для удаления страниц из книги.. DjVu Chunk Remover
программа для удаления пустых чанков, типа CIDa.. DjVu Chunk Remover
программа для добавления текста в нужное место на странице (+ к существующему) DjVuNMEditor
программа для удаления блитов со страницы DjVu Blits Hider
• программа для разделения разворотов на 2 страницы
программа для добавления новых блитов на существующую страницу (объединение графики с двух страниц на одну) DjVu Blits Merger
• программа для перемещения блитов на странице
• программа для кодирования ч/б растра без потерь одним или несколькими большими по размеру шейпами
• еще что-то хотел сделать.. но забыл.. вспомню - запишу))
 
если найдутся желающие сделать эти программы - добро пожаловать)) мыслями и наработками с удовольствием поделюсь)) это относится и к следующему блоку тоже..

Программы, которых нет, и я, к сожалению, наврядли осилю((..

визивиг-редактор текстового слоя.. DjVuNMEditor
Hyperlinks-редактор, типа Document Express Editor, но с возможностью групповой правки аннотаций.. DjVuNMEditor
• полноценный визивиг редактор графики DjVu с возможностью удаления, сдвига, правки шейпов в маске.. а может быть и корректировки фона тоже..
WinDjView с поиском текста в закладках.. ну и некоторыми другими дополнительными возможностями.. таки осилил))
 

продолжение следует..

Всего записей: 1436 | Зарегистр. 26-07-2007 | Отправлено: 22:57 06-02-2012 | Исправлено: NME, 18:28 25-09-2022
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
сделал программку DjVu Title Maker для внедрения заголовков в djvu-книгу.. ссылка в шапке..
Описание

Всего записей: 1436 | Зарегистр. 26-07-2007 | Отправлено: 12:15 29-09-2014 | Исправлено: NME, 17:08 16-05-2021
amaid



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NME, опять надоедаю, но в некоторых файлах кратч ¬ все-таки не обрабатывает
https://yadi.sk/d/PF3nF1vwbomur

Всего записей: 575 | Зарегистр. 25-01-2006 | Отправлено: 07:55 04-10-2014
amaid



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
блин, а есть еще такие вот файлики, тоже не исправляются
¬
  в конце строки
https://yadi.sk/d/BZ_J2oNkbpD8E

Всего записей: 575 | Зарегистр. 25-01-2006 | Отправлено: 18:01 04-10-2014 | Исправлено: amaid, 18:01 04-10-2014
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
amaid
болезни известные.. первая называется "я после файнридера уже правил текстовый слой с помощью djvused'а", вторая - "я юзаю файнридер 11 билда ниже 583".. обе лечатся перераспознанием..

Всего записей: 1436 | Зарегистр. 26-07-2007 | Отправлено: 10:38 05-10-2014
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
добавил в Chunk Remover возможность быстрого удаления произвольного диапазона страниц.. заодно англ. фейс прикрутил, перевод - в основном машинный.. версия 04 в шапке..
 
Добавлено:
да, еще и имя сохраняемого файла теперь можно указывать..

Всего записей: 1436 | Зарегистр. 26-07-2007 | Отправлено: 14:15 07-10-2014
amaid



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
может, на досуге, прикрутишь еще возможность удаления страниц без текстового слоя

Всего записей: 575 | Зарегистр. 25-01-2006 | Отправлено: 17:27 07-10-2014 | Исправлено: amaid, 17:27 07-10-2014
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
amaid

Цитата:
возможность удаления страниц без текстового слоя

а какой в этом практический смысл?

Всего записей: 1436 | Зарегистр. 26-07-2007 | Отправлено: 09:06 08-10-2014
amaid



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
если это хлопотно, то фиг с ним
смысл - ну, например, при перераспознании тех самых доков, которые кратч не хавает, DjvuSmall пропускает пустые страницы (а иногда виснет), потом OCR криво накладывается, приходится искать в доке пустые страницы и удалять вручную; иногда бывает нужно удалить тяжелые картинки, чтобы файл не тормозил и т.д.  
Добавлено:
сейчас мне приходится КАЖДЫЙ чужой документ по окончании добавления OCR проверять на последней странице - совпало или нет. Потому что в нем могла быть пустая страница, пропущенная DjvuSmall

Всего записей: 575 | Зарегистр. 25-01-2006 | Отправлено: 17:15 08-10-2014 | Исправлено: amaid, 17:20 08-10-2014
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
amaid
видимо, с момента первого поста в этом топике ничего не изменилось..  
для меня лично загадка, до какой степени нужно быть приверженцем DjvuSmall'а, чтобы использовать его недоделанную функцию извлечения графики, в то время как других простейших способов - целый вагон, не говоря о том, что фр уже давно djvu целиком хавает.. и именно для этого приходится портить книги.. это как рисовать карандашом на библиотечной книге - вроде и информация не потерялась, в то же время для следующего читателя это создает некоторые неудобства.. и нарушение комфортной навигации по эл. книге - это тоже дополнительное неудобство.. да, пометки можно стереть, а страницы вставить, но для этого нужен соответствующий инструмент и время.. кстати, на днях таки должен доделать DjVuCleanPageInserter, чтобы была возможность удобного восстановления того, что удалили или недосканировали отдельные граждане.. там осталось только сделать автоматическую вставку страниц в книги с заголовками страниц (title), если какие-то номера пропущены..
в общем, если хочешь продолжать юзать DjvuSmall - пожалуйста, мне все равно.. только я в этом смаллоизвращлечении участие принципиально принимать не буду..

Всего записей: 1436 | Зарегистр. 26-07-2007 | Отправлено: 10:24 09-10-2014
amaid



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
понял, понял, не трать так много букаф
пока DjvuSmall не имеет равных по удобству и широте настроек компиляции/декомпиляции djvu, придется пользоваться им (если знаешь что-то поудобнее - подскажи)
что касается файна, то, начиная с 10 версии, OCR стал хуже, поэтому те, кто пользуется новыми файнами для создания djvu РЕАЛЬНО УХУДШАЮТ КАЧЕСТВО книг ради маленького комфорта для себя лично. Предпочитаю мучиться с DjvuSmall и восьмым файном, и другим советую. Говнокниг в сети хватает, не стоит приумножать их количество.

Всего записей: 575 | Зарегистр. 25-01-2006 | Отправлено: 11:13 09-10-2014
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
amaid
про компиляцию речи не ведется, а экспортировать можно в том же WinDjView Extended - чем не устраивает?
по поводу качества распознания - вопрос холиварный.. в каких-то случаях 8ка лучше справляется, в каких-то новые версии, где-то одинаково.. возможно, в большем проценте случаев 8ка лучше распознает, я не знаю, не спорю и ничего не имею против 8ки.. я лишь против удаления страниц из книги.. и, если DjvuSmall подразумевает удаление пустых страниц из книги, то фтопку этот DjvuSmall (исключительно при экспорте в графику)..

Всего записей: 1436 | Зарегистр. 26-07-2007 | Отправлено: 12:35 09-10-2014 | Исправлено: NME, 12:37 09-10-2014
amaid



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
в DjvuSmall просто удобнее декодировать - в один клик (отдельная папка для изображений создается в заданном месте автоматически)
случаи, когда новые файны справлялись лучше версий 8-9, за долгую практику НИ РАЗУ не обнаружены, зато выявлена закономерность: чем хуже скан и чем больше языков в тексте, тем огромнее разница в качестве OCR. Не надо холиварных песен, дружище - проверь сначала на любом паршивом djvu, не поленись. Если найдешь хоть один файл, с которым новый файн справился лучше, публично покаюсь в ошибках.  
 
Добавлено:
дрожать за пустые странички, но при этом не желать разобраться с OCR - вот это я бы назвал извращением

Всего записей: 575 | Зарегистр. 25-01-2006 | Отправлено: 16:20 09-10-2014
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
amaid
в рамках работы над программой HeadWorder в качестве рабочего материала использовал какой-то словарь или энциклопедию, где распозание было препоганейшего качества.. завтра постараюсь потестировать ее на новых билдах..
с качеством ocr файридера пусть разбираются те, кто делает ocr-слой в книгах, я этим не занимаюсь, у меня других дел хватает.. а если надо будет заняться - то обязательно разберусь, можешь не сомневаться.. а пока что качество распознания в фр11 и 12 тех немногочисленных документов, что мне на работе приходится переводить для себя из сканов в текст, меня более чем устраивает..

Всего записей: 1436 | Зарегистр. 26-07-2007 | Отправлено: 23:38 09-10-2014
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
в общем, на тестируемой книге 12 показала еще более удручающие результаты.. сравниваемыми словами были заглавные слова с ударениями.. основные ошибки - Ё вместо Е и Й вместо Й.. у 8ки тоже таких ошибок полно, но гораздо меньше 12.. такое ощущение, что словарь на заглавных словах отключался - СИСТЁМА,  УСИЛЁНИЯ, РЕЗЁРВА.. без дополнительного обучения 8ка справилась лучше..
но это был отдельный вопрос, никак не влияющий на мое мнение, что ложку овна в виде удаления страниц в бочку меда класть не нужно..

Всего записей: 1436 | Зарегистр. 26-07-2007 | Отправлено: 11:33 10-10-2014
amaid



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
попробуй 9ку, она лучше всех распознает буквы (но иногда крупно косячит с форматированием)
жаль, что нет нормального способа внедрять OCR от 9ки в djvu...

Всего записей: 575 | Зарегистр. 25-01-2006 | Отправлено: 12:24 10-10-2014
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
в моем примере 1 слово из прибл. 200 девятка хуже восьмерки распознала АКСЕЛЕРОГРАФ    АКСЕЛЕРОТРАФ, в остальном полное совпадение, включая ошибки..

Всего записей: 1436 | Зарегистр. 26-07-2007 | Отправлено: 16:11 10-10-2014
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
amaid

Цитата:
жаль, что нет нормального способа внедрять OCR от 9ки в djvu...

на самом деле способ есть.. что такое DjVuOCR? это оболочка для frfgrab.. a frfgrab вроде как справляется с девяткой до определенного билда.. так что надо всего лишь сделать новую оболочку, правильно определяющую номер страницы.. не хочешь заняться?

Всего записей: 1436 | Зарегистр. 26-07-2007 | Отправлено: 00:12 11-10-2014
amaid



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
"многоделание - худшее из зол" (Платон)
занимались эксперты, не мне чета - всё без толку
 

Всего записей: 575 | Зарегистр. 25-01-2006 | Отправлено: 09:03 11-10-2014
antobog

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NME
А как сделать экспорт всех страниц документа в Вашей версии WinDjView extended? Вручную выделять все страницы? Ctrl+A не срабатывает

Всего записей: 92 | Зарегистр. 26-08-2012 | Отправлено: 19:45 09-11-2014
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
antobog

Цитата:
* Экспортировать все страницы можно из меню "Файл", меню настроек миниатюр (thumbnails), а также из меню, всплывающем по клику ПКМ по миниатюре/полю миниатюр..

Всего записей: 1436 | Зарегистр. 26-07-2007 | Отправлено: 21:53 09-11-2014
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36

Компьютерный форум Ru.Board » Компьютеры » Программы » Утилиты для DjVu: DjVuNMEditor, FR11 DTL Crutch и др.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru