Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » PDF & DjVu Bookmarker

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53

Открыть новую тему     Написать ответ в эту тему

StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Pdf & Djvu Bookmarker


 

 
Обсуждение программы Pdf & Djvu Bookmarker, предназначенной для автоматизации процесса создания bookmark-оглавлений в pdf и djvu файлах.
 
Проект с открытыми исходниками, написан на C# с использованием .NET Framework 2.0

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 14:16 30-11-2009 | Исправлено: ComboFZ, 20:38 04-12-2022
pazanru



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare
 

Цитата:
Поясните необходимость - это для борьбы с OCR-ошибками в распознавании номеров страниц?  

 
Да, например, но это не обязательно, просто при необходимости изменить нумерации одной страницы, приходится изменять следующую в обратном направлении,
но это в принципе не стоит того, чтобы загромождать интерфейс.  
 

Цитата:
Остался вопрос области применения - к выделенным строкам, ко всем элементам оглавления, к элементам с тем же предком, что и выделенный?

 
Я бы сказал ко всем элементам, т.к. точки либо есть, либо их нет, за исклучением OCR-ошибок, но это можно и вручную править.
 

Цитата:
представим оглавление, оканчивающееся следующими строками  
 
3.3.3 заголовок оглавления  
эта строка пойдет в 3.3.3  
а эта уже не пойдет - это индекс  
 
как мне отличить вторую строку от третьей? Пока что вижу только правку в ручном режиме...  
Главное, конечно, не забывать об этой особенности, и не публиковать оглавление с индексом внутри 3.3.3.  

 
Да, их не отличить, но такой случай встречается очень редко,  
в 99%, если последний уровень без нумерации, выглядит так:
.
.
3 заголовок оглавления
.
.
3.3 заголовок оглавления
.
.
3.3.3 заголовок оглавления  
заголовок оглавления
3.3.4 заголовок оглавления
индекс

Всего записей: 39 | Зарегистр. 25-07-2005 | Отправлено: 15:26 30-11-2009
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
pazanru
Насчет 99%, думаю, что вы погорячились.
Однако решение есть, хотя и довольно громоздкое. Оно заключается в перечислении через запятую кандидатов на вершину оглавления для каждого из уровней. Только разделитель уровней в виде пробела уже не подходит. Можно заменить его, скажем, тильдой.
И тогда стока для автоматического формирования для вашего случая превратится во что-то вида: #., индекс
 
Или в более сложных случаях  
http://www.onlinedisk.ru/image/281497/Ответы.png
может возникнуть монстр типа
Глава, Ответы~Занятие, Закрепление материала главы, Резюме главы, Основные термины, Упражнения, Рекомендуемые упражнения, Пробный экзамен
 
Теперь вот думаю, стоит оно того?  
 
Теоретически можно даже попытаться сделать движок для автоматического формирования таких запросов по повторяющимся строкам оглавления. Но, чую, штука получится не слишком банальная..

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 16:01 30-11-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare

Цитата:
Начал свой проектик на SF по автоматизации создания bookmark-оглавления.

ИМХО требования наличия ".NET Fremework 2.0, а также в некоторых случах Visual Studio 2008 SP1 Redistributable Packages" выглядит как неприемлемое.
Также ИМХО неэтично писать в заголовке "DjVu Bookmarker ... by StanFreeWare" - это выпячивание себя любимого на первый план.
 
Такую программу следует сделать ещё проще:
1. Текст TOC разумно автоматически вытягивать из распознанного DjVu - а не готовить руками.
2.ИМХО наиболее удобно затягивать Текст TOC из п.1. сначала в таблицу вроде Excel - и там править - уже потом в дереве.
3. Инструкция к программе написана непонятно.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 17:30 30-11-2009
pazanru



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Оно заключается в перечислении через запятую кандидатов на вершину оглавления для каждого из уровней

Это займёт больше времени чем сдвинуть уровень вручную
 

Цитата:
Или в более сложных случаях  

мда , в таких случаях наверно легче ручками
 
А что если ввести альтернативный постоянный маркер уровней?
например строка
 _Пробный экзамен
автоматически на первый уровень
__Подписывание и шифрование сообшений
на второй и.т.д.
В html эти знаки конечно же не пишутся.
 
При вынимании текстового слоя оглавления приходится ведь в любом случае просматривать результат, заодно можно и уровни расставить если требуется.

Всего записей: 39 | Зарегистр. 25-07-2005 | Отправлено: 17:40 30-11-2009
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000

Цитата:
выглядит как неприемлемое

IMHO, не более неприемлемое, чем необходимость устанавливать Excel или Adobe Acrobat, как предлагают некоторые альтернативные методики. Кстати, а вам пришлось устанавливать Redistributable Packages?  
Возможно, если полезность проекта подтвердится, попытаюсь переписать на том же QT (правда, для этого мне придется его сначала изучить).

Цитата:
неэтично писать

А что этично писать? Я недавно в opensource, просветите. Честно говоря, абсолютно безымянные проекты, последнюю версию которых можно получить только по почте у автора (и это еще хорошо, когда указана почта) - тоже не вариант. Даже к ST просится хотя бы ссылка на офсайт...

Цитата:
Текст TOC разумно автоматически вытягивать из распознанного DjVu

У меня даже на достаточно хорошем исходнике FR наделал немного, но достаточно ошибок, чтобы об автоматическом вытягивании не было и речи. К тому же, открыть djvu, выделить оглавление и вставить его в текстовый режим IMHO, вполне себе простая и понятная операция. Не намного сложнее, если не проще, чем указать на djvu-файл и проставить номера страниц начала и конца его оглавления. Я сейчас не говорю об абсолютно корректных вычитанных djvu - я таких пока не встречал..

Цитата:
ИМХО наиболее удобно затягивать Текст TOC из п.1. сначала в таблицу вроде Excel - и там править - уже потом в дереве

А я и не предлагаю оглавление ПОЛНОСТЬЮ править в дереве. Я лишь даю возможность вносить небольшие поправки в случае, если предварительная подготовка в текстовом редакторе оставила недочеты.

Цитата:
Инструкция к программе написана непонятно

Зато она есть. И вы сразу поняли из нее, например, про фреймворк. Но, конечно, в таком виде она останется недолго. В ближайшем будущем постараюсь написать попонятнее.
 
 
Добавлено:
pazanru

Цитата:
Это займёт больше времени чем сдвинуть уровень вручную

Возможно, но ошибок, по-идее, должно получиться меньше.

Цитата:
заодно можно и уровни расставить если требуется.

Ну, заодно тогда можно будет и тегами окружить... и мне работы не останется )
 
Добавлено:
Выпустил версию 0.6 с чисткой шума распознавания при вставке текста.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 19:30 30-11-2009 | Исправлено: StanFreeWare, 19:31 30-11-2009
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Выпустил версию 0.6 с чисткой шума распознавания при вставке текста.

я так понял, что вставляться должен "почищенный" в стороннем редакторе текст, и весь шум д.б. удален там.. ИМХО здесь - это уже перебор (тем более, как было написано ранее - "игрушка опасная")..  
StanFreeWare, наверное не стОит сгоряча реализовывать абсолютно все предложения.. м.б. некоторые из них отсеивать, а время тратить на реализацию более актуальных предложений и своих задумок..
 
 
Добавлено:
и еще вопрос, отчего в первом посте у вас ссылки на хттпс? при входе в документацию предлагает логиниться.. приходится вручную "с" удалять..

Всего записей: 1436 | Зарегистр. 26-07-2007 | Отправлено: 00:25 01-12-2009
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
приходится вручную "с" удалять..

Спасибо, поправил. Я-то уже залогинен был, когда ссылки копировал )

Цитата:
время тратить на реализацию более актуальных предложений и своих задумок..  

Так предлагайте.  
 
У меня из задумок пока что только кнопка Expand All, ну и перечисление элементов оглавления через запятую. По перечислению вроде бы пока что решили, что штука дюже сложная может получиться для пользователя? Или все-таки достаточно удобно будет?
 
А отсев шума можно и не производить. Достаточно в окне шумодаванажать на кнопку "Оставить все".
Вы его попробовали?
 
Вопрос к спецам
Насколько мне известно, Bookmark Tool 2.0 не имеет командной строки.
Как еще можно внедрить html непосредственно в djvu?
Желательно в виде ссылки на exeшник утилиты и рабочий batник с командой внедрения.
 
Добавлено:
Придумал еще одну полезную фичу - возможность загрузить экспортированный html обратно.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 06:53 01-12-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare

Цитата:
попытаюсь переписать на том же QT  

Отличная мысль.

Цитата:
А что этично писать?  

Напишите просто название программы - без "by такой-то".

Цитата:
У меня даже на достаточно хорошем исходнике FR наделал немного, но достаточно ошибок, чтобы об автоматическом вытягивании не было и речи.

Не путайте с автоматическим формированием - то, что автоматически вытягивается, потом предполагается вручную править.

Цитата:
IMHO, не более неприемлемое, чем необходимость устанавливать Excel или Adobe Acrobat,  

Я тоже так думаю. Я имел в виду, чтобы в своей программе реализовать элемент управления, внешне (и по поведению) схожий с Excel.
 
 
Добавлено:
StanFreeWare

Цитата:
Насколько мне известно, Bookmark Tool 2.0 не имеет командной строки.  
Как еще можно внедрить html непосредственно в djvu?  

Я бы вообще не заморачивался с Bookmark Tool - а внедрял бы букмарки при помощи djvused. В DjVuLibre есть библиотека MiniExp http://www.djvu-soft.narod.ru/miniexp.htm - по-видимому, с её помощью можно формировать входные данные для djvused. Bookmark Tool - это ИМХО как-то уж экзотично (хотя дело вкуса).

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 09:21 01-12-2009
VadimirTT



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare
Спасибо за прогу.  
Побаловался, что-то получилось Математическое моделирование нелинейных термогидрогазодинамических процессов в многокомпонентных струйных течениях
Я за то чтобы программу отшлифовать, юзабилити там, всплывающие подсказки, может быть мастер.
з.ы. но все равно, как то лениво делать для всех книг по этому алгоритму, может быть будет возможно (после того как Bookmark Tool  прикрутите) как это в DjVuHypEdit сделано (просто указал книгу с текстовым слоем... и там, оно как то само ), тогда и чистка от мусора реально пригодится.

Всего записей: 2871 | Зарегистр. 22-03-2005 | Отправлено: 10:02 01-12-2009
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000
 

Цитата:
Я имел в виду, чтобы в своей программе реализовать элемент управления, внешне (и по поведению) схожий с Excel

Зачем заводить еще и таблицу, чтобы править иерархию. Раз делаем иерархию, то и правим иерархию. Логично?

Цитата:
по-видимому, с её помощью можно формировать входные данные для djvused.

Я уже потратил кучу времени, пытаясь понять, как скармливать djvused'у оглавления. Пока безрезультатно. Поэтому прошу тех, у кого это РЕАЛЬНО получилось, дать ссылку на djvused, на котором получилось, и показать содержимое bat-ника и сам html-файл (а лучше ссылку на оба файла). Возможно, дело в кодировке - Bookmark Tool, например, требует UTF-8, а что требует djvused, никто не говорит.

Цитата:
Не путайте с автоматическим формированием

Тогда я, видимо, не понял вашу мысль. Пожалуйста, конкретизируйте, что вы имели в виду под процессом "вытягивания".
 
 
Добавлено:
VadimirTT
 
Выкладывайте результаты лучше через onlinedisk, с вашим файлообменником у меня не сраслось.
 

Цитата:
 оно как то само  

Ну никак не получится еще на этапе определения номеров бумажных страниц, пока на выходе ФР будет вместо номера страницы "10" будут получаться "Ю". И тут уже или вычитывать все оглавление перед внедрением OCR в djvu-книгу, либо не вычитывать, а править уже вручную на этапе работы с djvu bookmarker. И еще вопрос - чтО будет проще.. Так что для меня вообще-то загадка, как оно работает у DjVuHypEdit'a.
Боюсь, что любой результат подобной автоматики потом придется открывать в DjVu Editore и править, править...
 

Цитата:
юзабилити там

Жду конкретных предложений. Всплывающие подсказки - будут.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 10:06 01-12-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare

Цитата:
а что требует djvused, никто не говорит.

Да возьмите любой DjVu с внедрённым OCR, и извлеките оттуда текстовый слой посредством djvused - вот Вам будет и пример.

Цитата:
Зачем заводить еще и таблицу, чтобы править иерархию. Раз делаем иерархию, то и правим иерархию.

С этим трудно спорить - дело вкуса. Конечно, в дереве всё это выглядит полностью наглядно, зато в таблице а-ля Excel ИМХО проще и быстрее делать правки прототипа будущего дерева. Колонками таблицы можно обозначать уровни вложенности будующего дерева. Номера страниц, естественно, тоже в отдельные колонки помещать.
 
В такой таблице как-то сразу видны все ещё не исправленные косяки будующего дерева и их можно быстро и легко подправить.

Цитата:
Пожалуйста, конкретизируйте, что вы имели в виду под процессом "вытягивания".  

Извлечение текстового слоя посредством djvused.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 16:30 01-12-2009 | Исправлено: monday2000, 16:32 01-12-2009
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000
Интересно, при запросе Djvu Bookmarker в гугле ваш пост о моей неэтичности находится раньше чем ссылка на sourceforge. Спасибо за черный пиар! ))

Цитата:
Да возьмите любой DjVu

Цитата:
и извлеките

У вас получалось? А потом назад прикрутить? Где именно брали djvused и какой именно строкой прикручивали/извлекали?

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 19:56 01-12-2009
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare
1. сначала по поводу букмарков, гиперлинков и т.п.. сразу оговорюсь, что все нижесказанное является лишь моим скромным мнением, так что просьба помидорами не закидывать .. и еще.. речь пойдет преимущественно о технической литературе, т.к. в основном с такой приходится работать..
основным инструментом навигации по djvu-книге являются все-таки гиперлинки (обязательно на распознанном тексте).. и книга должна быть распознана НЕ ПОЛНОСТЬЮ!, а только оглавление, предметный указатель и, может быть, еще что-то (в основном то, где есть ссылки на страницы).. иначе придется долго добираться до нужного содержимого..  
исключение составляют словари, энциклопедии и им подобные.. возможно, если в книге нет предметного (алфавитного) указателя, то такую книгу тоже можно будет полностью распознать..
а порядок работы с книгой такой - в поиске набрал нужное слово, перешел на первый результат поиска, а он с гиперссылкой - кликнул на нее - и нашел то, что искал.. если же нет - клик по второму результату поиска и т.д.. таким способом довольно-таки быстро добираешься до нужной информации..
букмарки же дают не более 20% функциональности по сравнению с гиперлинками.. хотя, если AndyZ введет в своей программе возможность поиска по букмаркам, процент значительно возрастет.. а для словарей и т.п. вообще станет мощным средством навигации, наряду с OCR слоем..
но, т.к. проект DjVu Hyperlinks Editor заброшен, а проект DjVu Bookmarker набирает обороты, то я всецело поддерживаю автора в его начинании..
 
2. по поводу программы..
при запуске появляется сообщение об ошибке.. скрин лог система Виста х64 СП2.. на виртуальной машине с ХР СП3 лог чуть отличается  
попробовал сейчас на Висте х86 - те же яйца.. причем трабла на версиях 0.5 и 0.6.1.. на 0.4 не ругается.. кста, на Висте х64 была установлена Microsoft Visual Studio 2008 Professional с первым сервиспаком.. вообще, строчка D:\MyDocs.. как-то настораживает
 
3.
Цитата:
Достаточно в окне шумодаванажать на кнопку "Оставить все".  
Вы его попробовали?

сегодня попробовал.. вещь нужная.. так что беру свои слова обратно.. хотя на мой вкус в менюшке кое-что стоило бы поменять..
 
4. предложения по улучшению программы есть.. и их довольно-таки много.. завтра вечерком выложу все свои мысли по этому поводу.. думаю, в итоге (если, конечно, не пропадет энтузазизм) хорошая и главное востребованная прога получится..

Всего записей: 1436 | Зарегистр. 26-07-2007 | Отправлено: 22:14 01-12-2009
VadimirTT



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
При старте тоже, ошибка. но продолжать работу не мешает, также подобное было и в процессе
   
 
1. Хотелось бы, что бы переключался фокус мыши автоматом, т.е. я что-то делаю вне поля с оглавлением, а затем перевожу указатель мышки на оглавление и начинаю прокручивать колеса - прокрутка не работает, т.е. надо в оглавление тыкнуть, лишнее движение, лично меня напрягает
2. нет undo
3. Вы упоминули об экспорте html-ки - это типа сохранения проекта? было бы здорово
4. сделал еще одну книгу со сложным оглавлением, получается много ручного труда Материалы для низких и криогенных температур: Энциклопедический справочник  
5. может было бы нагляднее вводить руками общий сдвиг нумерации, помимо стрелочек?
 
насчет приставания monday2000 с именем, не понял наезда , чисто-пуризм какойто, единственно, потенциально это может отпугнуть человека который мог бы помочь с кодированием или передачей какого нибудь алгоритма

Всего записей: 2871 | Зарегистр. 22-03-2005 | Отправлено: 22:35 01-12-2009 | Исправлено: VadimirTT, 22:45 01-12-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare

Цитата:
ваш пост о моей неэтичности находится раньше чем ссылка на sourceforge.

Да, мне тоже смешно. Ничего, это ненадолго.

Цитата:
У вас получалось? А потом назад прикрутить?

Да многократно. Кстати, я это не сам придумал - мне кто-то посоветовал в своё время. Вот почитайте: http://djvu.sourceforge.net/doc/man/djvused.html#lbAJ
Сначала делаете так:

Цитата:
djvused myfile.djvu -e 'output-txt' > myfile.dsed

где myfile.djvu - любой DjVu-файл с распознанным OCR-слоем.
Вставка OCR-слоя назад:

Цитата:
djvused myfile.djvu -f myfile.dsed -s

Правда, у меня часто глючили эти команды. Если будут глюки - пробуйте кавычки вместо апострофов.

Цитата:
Где именно брали djvused

Возьмите из DjVuOCR последнего.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 22:42 01-12-2009
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
В ближайшее время переделаю интерфейс и немного порефакторю - думаю, будет одна полоса сверху, как у AcrobatReader, а все остальное пространство - это иерархия и предпросмотр картинки, разделенные сплитбаром.  
 
Ошибка при старте связана с ресайзом - она 100% уйдет.  
 
VadimirTT

Цитата:
может было бы нагляднее вводить руками общий сдвиг нумерации, помимо стрелочек?  

Возможно так и сделаю.
 
Еще бы как-нибудь иконки навигации позаимствовать у Adobe Reader. Сам я так, пожалуй, не нарисую...
 
Добавлено:

Цитата:
что-то получилось

Вообще-то нужно переделывать. По-хорошему, вы должны были заголовки раздела во внешнем редакторе склеить с самим словом Раздел i, и уже потом добавлять номер страницы.  
В принципе, можно попробовать добавить опцию "Допускать отсутствие номера страницы по шаблону" с автоматическим присвоением номера страницы по следующему элементу списка, т.к. такие "безадресные" разделы мне тоже периодически попадались.
 
С многострочными элеметами, разделенными номерами страниц, тоже хлебнули проблем..
 
Тут только разрешать вставлять что попало, а не только строки, заканчивающиеся номерами страниц, и шаблон неприменим, и давать возможность склеивать друг с другом выделенные элементы.
 
Речь идет о таком оглавлении -  
см. скриншот

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 23:31 01-12-2009 | Исправлено: StanFreeWare, 00:04 02-12-2009
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000
Спасибо, кое-что начинает проясняться. Я просто считал, что djvused'y можно html скормить - а у него, оказывается, своя, "скобчатая" нотация...
 
Добавлено:
Теперь подскажите, что это за кодировка, в которой
"\321\200\320\260\320\267\320\274\320\265\321\200\320\260 "
переводится как  
"размера"?

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 10:24 02-12-2009
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
а теперь, собственно, предложения..
1. раз уж заговорил по поводу менюхи фильтрации шума распознания, начну с нее.. количество кнопок выбора действия - избыточное.. после выбора удаляемых символов приходится выискивать и целиться в кнопку "удалить выбранные"..
наиболее логичным было бы оставить 2 кнопки "удалить" и "отмена", а над (или под) окном с чекбоксами для удобства добавить кнопки "выделить все" и "снять выделение"..
 
2. также в этом окне знаки [Tab] не отображаются (т.е. чекбокс без подписи).. эти знаки предлагаю вообще во всем документе автоматом заменять пробелами, т.к. в букмарках они совершенно не нужны (а может даже и вредны).. и, соответственно, в меню фильтрации его не должно быть..  
и, кстати, программа запоминает и предлагает установить галочки на ранее вводимый мусор, которого при данной вставке уже нет.. надо бы пофиксить..
 
3. а теперь по-порядку.. скопировал я оглавление из книги и вставил в ворд.. надо сказать, что когда я его распознавал в файнридере, то довольно-таки тщательно вычитывал, но все-равно без ошибок не обошлось.. самым трудоемким при работе в ворде оказалось объединение многострочного пункта в однострочный.. а это не редкость, особенно если оглавление состоит из нескольких колонок.. отсюда предложение - не запрещать вставку строк без номера, а объединять их с последующими строками автоматом при первоначальной вставке текста..
 
4. также в распознанном тексте оказалось много двойных пробелов.. в принципе, в том же ворде можно достаточно легко заменить двойные и более пробелы на одинарные (табы из п.2 кстати тоже), но т.к. в конечном счете надо будет отказываться от сторонних редакторов (вот тут идут разговоры об извлечении OCR-слоя непосредственно из djvu) наверное стоит предусмотреть данную фичу в программе..
 
5. после вставки оглавления в программу и частичного редактирования вложенности веток напоролся на строку следующего содержания ["имя первого пункта" "страница" "имя второго пункта"].. т.е. получилось, что я пропустил знак переноса строки и два пункта объединились в один.. но половина оглавления-то уже отредактирована! вот тут появилась необходимость разделения пункта на 2.. а точнее так - возможность добавлять вручную новые пункты оглавления (например, по ПКМ -> Добавить строки сверху, Добавить строки снизу).. правда ПКМ на данный момент уже задействована, но об этом ниже..
 
6. в дополнение к п.5 - возможность добавлять по ПКМ строки без ссылки на страницу.. причем, если в памяти несколько строк, то должно появиться несколько пунктов, объединения как в п.3 происходить не должно..
 
7. после каждой операции сдвига веток дерево полностью раскрывается.. блин, бесит ужасно надо чтоб запоминалась текущее состояние веток.. ну, и кнопки развернуть/свернуть дерево полностью тоже нужны (или развернуть/свернуть закладки верхнего уровня - как в WinDjvu)..
 
8. добавить в конец строки отображение номера страницы из книги и столбец номеров страниц, на которые осуществляется реальный переход.. причем последний столбец с возможностью правки номера вручную только в этой строке (не затрагивая последующие).. также можно ввести (хотя и не обязательно) еще и первый столбец с номером строки..
 
9. баг.. в версии 0.6.1 по-умолчанию строке "Оглавление" присваивается ссылка на первую страницу книги, а все остальные смещаются на 1 позицию.. а надо, чтоб изначально было 0.. и вообще, эта строка сейчас является лишней.. для того, чтоб она не была "лишней" нужно добавить возможность присвоения ей ссылки на любую страницу (т.е. на страницу с оглавлением в djvu-книге)..
 
10. сначала думал, что даблклик по пункту оглавления для его правки работает как-то неадекватно.. не с первого раза срабатывал.. потом понял, что действует не дабл, а одинарный клик по выделенной строке (действие аналогичное F2).. хм.. не знаю, что лучше - по двойному или все-таки одинарному клику входить в режим редактирования.. надо еще поработать, потестить, а потом уже делать выводы..
 
11. сдвиг веток вправо мышкой нужно изменить с ПКМ на ЛКМ+ПКМ, тогда ПКМ освобождается для вывода дополнительного меню, в котором можно будет добавить пункты для операций со строкой (редактировать, изменить номер страницы перехода, добавление строк (см.п.5) и т.д.)..  
а сдвиг влево соответственно ПКМ+ЛКМ.. для тех, кто юзает оперу данные сочетания клавиш мыши очень знакомы
 
12. также предусмотреть возможность сдвига мышой не только выбранной строки, но и всех нижележащих строк в данной редактируемой подветке (чтоб не приходилось каждый раз выделять с шифтом данные пункты).. осуществлять это также, как в п.11 с дополнительной клавишей, например 'Ctrl'.. реализация этого и предыдущего пункта должны офигенно сократить время формирования веток дерева, так что об экселе можно будет забыть напрочь))
 
13. поддержку просмотра формата djvu надо осуществлять обязательно.. тифы - это всего лишь костыли.. перегонять djvu в tiff, уменьшать размер и т.п. будет осуществлять далеко не каждый.. знаю, что проблема известная, но решил еще раз ее обозначить, т.к. она очень значимая..
 
14. внедрять букмарки непосредственно в книгу, минуя Bookmark Tool.. тем более уже понятно, как это делась.. а выявить соответствие кириллических букв цифровым кодам - дело несложное.. даже не стоит выяснять, что это за кодировка - просто назначить прямое соответствие между ними..
 
15. ну и косметические нововведения - иконку придумать, свойства exe-шника заполнить (версия программы, автор и т.п.) и т.д..
 
16. если будет желание, в будущем можно сделать из программы полноценный редактор - на входе djvu с OCR, на выходе djvu с bookmarks..  
а если еще сильнее загоняться - на вход подавать чистый djvu без OCR-слоя, а распознание текста проводить в букмаркере на основе бесплатных распознавалок но это уже из разряда фантастики)) и наврядли это целесообразно делать..
 
на этом пока все.. если где-то не до конца ясна мысль предложения - готов прокомментировать..

Всего записей: 1436 | Зарегистр. 26-07-2007 | Отправлено: 18:43 02-12-2009
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NME
Большое спасибо за подробный отчет.
Поддержку просмотра djvu.. Хорошо бы, но боюсь, это только коллективным разумом. По крайней мере, я пока что подхода к такому просмотру даже близко не вижу.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 20:10 02-12-2009
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53

Компьютерный форум Ru.Board » Компьютеры » Программы » PDF & DjVu Bookmarker


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru