Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 2)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154

Открыть новую тему     Написать ответ в эту тему

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Scan Tailor


Задача программы - пост-обработка сырых сканов книг для последующей сборки в PDF/DJVU,CBR/CBZ и т.д.
Программа обеспечивает большое удобство для использования, большую интерактивность и не меньшую автоматизацию процесса (по сравнению со СканКромсатором).
Кросс-платформенный (Windows,Mac OS, Linux) проект с открытыми исходниками.


Англоязычный топик по ScanTailor
Ветки:
Scan Tailor Plus (Vadim "DikBSD" Kuznetsov) >>>  последняя версия   (Отличия от авторской версии)
Scan Tailor Еnhanced (Petr "pejuko" Kovar) >>>  последняя версия   (Отличия от авторской версии)
Scan Tailor Featured (monday2000) >>>  последняя версия   (Отличия от авторской версии)
Scan Tailor Advanced (4lex4) >>>  последняя версия (Отличия от авторской версии); ветка develop
 
Документация:
Документация (Wiki) | Зоны картинок в ScanTailor | ScanTailor. Быстрое начало | Видеоуроки и скринкасты новых функций СТ от Tulona
Статья: Scan Tailor. Программа для обработки отсканированных книг
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
Использование Scan Tailor совместно с Djvu Imager (сборка djvu методом разделенных сканов)
Как собрать Scan Tailor из исходных кодов под Windows
Почему нельзя сделать сплошную нумерацию вывода


Автор проекта - Tulon. Почему его здесь не видно? .
DikBSD автор ветки ScanTailor Plus история повторяется.
Юзеры! Будьте скромнее!


Дистрибутивы, форки, дополнения

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 12:17 17-02-2010 | Исправлено: ndch, 16:47 18-07-2018
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare

Цитата:
а какой в этом смысл - все равно парсить придется

txt файл можно и batником парсить в цикле FOR, с xml сложнее.

Цитата:
Поясните, поподробнее, как именно?

Хотелось бы обработать отдельно синий и ч/б слои, но для того, чтобы собрать слои в конце в один файл надо знать углы поворота и параметры обрезки полей.
В идеале, как я представляю, после обработки должно быть получится 2  файла: ч/б/синий с текстом и lineart для малоцветного кодирования в cpaldjvu и  ч/б/синий - с растровыми картинками для кодирования в c44 , затем эти djvu файлы объединяются в один.  
 
 
 

Всего записей: 635 | Зарегистр. 14-12-2005 | Отправлено: 00:35 20-04-2010
alihv

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Добрых суток всем, я (Илья) наконец подумал над лицензией minidjvu и пришел к такому выводу. Тут надо не GPL 2+, а 3+, и вот почему. Лицензия на DjVu Reference Library, выданная LizardTech'ом, дает право только на некоторые патенты, связанные с DjVu, но не на все.
 
Конкретно,  
[quote="http://djvu.sourceforge.net/licensing.html"]
everyone is allowed to distribute a modified version of the DjVu Reference Library under the GPL, provided that this modified version does not contain additional patent infringements.  
[/quote]
 
minidjvu косвенно (через DjVuLibre) является модифицированной версией DjVu Reference Library, но предоставляет и дополнительную функциональность, а именно многостраничное сжатие. На него есть патенты - например, Леон объяснял мне, что просто сжать каждую страницу отдельно, а потом собрать общий словарь нельзя, потому что этот способ запатентован. На патенты, относящиеся к многостраничному сжатию, лицензия от LizardTech не распространяется. Следовательно, нужна хоть какая-то защита от патентных исков.
 
GPL 3 содержит весьма занимательное условие, что подающий в суд насчет патентов лишается лицензии сразу же и независимо от исхода дела. Это даст некоторую защиту от исков и позволит спокойнее реализовывать предположительно патентованные алгоритмы.
 
Есть ли какие-нибудь причины оставить GPL 2?

Всего записей: 3 | Зарегистр. 20-04-2010 | Отправлено: 21:17 20-04-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
alihv
Добро пожаловать, Илья.
 

Цитата:
Есть ли какие-нибудь причины оставить GPL 2?

Для себя таких причин не вижу.  ST идет под GPL3+
 
Чтобы лишний раз вас не напрягать, я собираюсь сам подготовить соответствующий патч, если не возражаете.  Только сообщите свою строку копирайта, типа:
Copyright (C)  John Smith <john.smith@gmail.com>
От anagnost96 жду того же самого.

----------
Вопрос: как насчет вот такой фичи для ST?
Ответ: не сейчас, когда - не знаю, и стоит ли вообще?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 23:38 20-04-2010
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
alihv

Цитата:
Тут надо не GPL 2+, а 3+, и вот почему.

А как тогда будет сочетать 3+ со своими программами в 2+?
 
Добавлено:

Цитата:
Леон объяснял мне, что просто сжать каждую страницу отдельно, а потом собрать общий словарь нельзя, потому что этот способ запатентован. На патенты, относящиеся к многостраничному сжатию, лицензия от LizardTech не распространяется.  

Непонятно. Можно подробнее?

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 13:59 22-04-2010
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
alihv

Цитата:
Тут надо не GPL 2+, а 3+, и вот почему.

Видимо, в случае перехода minidjvu на 3+, прийдётся сделать ответвление на 2+. Т.е. вместо одного нынешнего minidjvu появится два - на 2+ и на 3+.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 09:07 23-04-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Опубликовал ST Separator 2.1
Добавил масштабирование субсканов иллюстраций в меньшее разрешение и возможность по ходу разделения субсканов удалять содержимое папки Out.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 18:26 23-04-2010 | Исправлено: StanFreeWare, 09:41 24-04-2010
kvesda

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Автору ST:
Прежде всего - огромное спасибо за прогу!
Я очень давно не заглядывал сюда на форум, поэтому, если повторю, что уже было - простите.
Отсканировал несколько десятков толстых (по 1500 стр) книг, пропустил через ST, удалил по-глупости исходники, и только потом обнаружил, что некоторые сканы, полученные сканы после ST УРЕЗАНЫ по ШИРИНЕ, а некоторые - по ВЫСОТЕ!
На форумах, где обсуждается ST уже не раз писали пожелания о том, чтобы программа могла показывать самые МАЛЕНЬКИЕ сканы по ВЫСОТЕ и по ШИРИНЕ (как это есть сейчас для самых больших). Пожалуйста, может вы сделаете это в следующем релизе? Это не каприз юзеров - я реально запортил несколько десятков тысяч страниц - исходники не сохранил, чтобы прислать вам.
Спасибо за понимание...

Всего записей: 7 | Зарегистр. 24-04-2010 | Отправлено: 18:16 24-04-2010
alihv

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
 
Чтобы лишний раз вас не напрягать, я собираюсь сам подготовить соответствующий патч, если не возражаете.  Только сообщите свою строку копирайта, типа:
 

Спасибо, я попробую сам. Мне хочется обновить что-нибудь еще, кроме шапки.
 

Цитата:
 
А как тогда будет сочетать 3+ со своими программами в 2+?  
 

Кто?
 

Цитата:
 
Видимо, в случае перехода minidjvu на 3+, прийдётся сделать ответвление на 2+. Т.е. вместо одного нынешнего minidjvu появится два - на 2+ и на 3+.
 

Зачем?
 

Цитата:
 
Непонятно. Можно подробнее?
 

Точного текста Леона я не найду, но смысл такой. Самый простой способ разбить на кластеры все буквы в книге - это сначала отождествить буквы на каждой странице, выбрать из каждого кластера по представителю, а потом отождествлять глобально по всей книге эти представители. Но кто-то (то ли Samsung, то ли Motorola, не помню) что-то похожее уже запатентовал.

Всего записей: 3 | Зарегистр. 20-04-2010 | Отправлено: 20:44 24-04-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
kvesda
Я изначально планировал сделать переключаемую сортировку на ленте предпросмотра - по ширине рамки контента, по высоте, и обычную.  Однако в итоге решил, что отношение сложности реализации к полезности получается черезчур высокое.
Ничего не обещаю, но подумаю над этим вопросом.
 
alihv

Цитата:
Спасибо, я попробую сам. Мне хочется обновить что-нибудь еще, кроме шапки.  

Буду весьма признателен.

----------
Вопрос: как насчет вот такой фичи для ST?
Ответ: не сейчас, когда - не знаю, и стоит ли вообще?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 21:57 24-04-2010
McAaron

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Узнал, скачал, собрал, установил. Проект крайне нужный и судя по тому, что я успел сделать с 16-страничным сканом, удобный. Тем не менее, на этапе "Полезная область" ST падает на федоре 11 x86_64.  
Также 18 апреля было сообщение о падении на "Полезная область" в федоре 12-й.  
http://sourceforge.net/tracker/index.php?func=detail&aid=2988928&group_id=227253&atid=1070628.
Я запустил scantailor из-под valgrind
$ valgrind --trace-children=yes --log-file=scantailor.err --error-limit=no --leak-check=full --show-reachable=yes -v --malloc-fill=0x00 --free-fill=0x00  scantailor
Привожу конец отчета (14299 строк):
 
==18037== LEAK SUMMARY:
==18037==    definitely lost: 7,400 bytes in 21 blocks.
==18037==    indirectly lost: 21,280 bytes in 662 blocks.
==18037==      possibly lost: 160,313 bytes in 615 blocks.
==18037==    still reachable: 21,746,177 bytes in 21,422 blocks.
==18037==         suppressed: 0 bytes in 0 blocks.
--18037--  memcheck: sanity checks: 16101 cheap, 159 expensive
--18037--  memcheck: auxmaps: 3426 auxmap entries (219264k, 214M) in use
--18037--  memcheck: auxmaps_L1: 5146552 searches, 48075016 cmps, ratio 93:10
--18037--  memcheck: auxmaps_L2: 728606 searches, 3426 nodes
--18037--  memcheck: SMs: n_issued      = 16280 (260480k, 254M)
--18037--  memcheck: SMs: n_deissued    = 15526 (248416k, 242M)
--18037--  memcheck: SMs: max_noaccess  = 524287 (8388592k, 8191M)
--18037--  memcheck: SMs: max_undefined = 433 (6928k, 6M)
--18037--  memcheck: SMs: max_defined   = 6471 (103536k, 101M)
--18037--  memcheck: SMs: max_non_DSM   = 1389 (22224k, 21M)
--18037--  memcheck: max sec V bit nodes:    133842 (11502k, 11M)
--18037--  memcheck: set_sec_vbits8 calls: 2098820 (new: 157128, updates: 1941692)
--18037--  memcheck: max shadow mem size:   37870k, 36M
--18037-- translate:            fast SP updates identified: 129,328 ( 86.5%)
--18037-- translate:   generic_known SP updates identified: 19,670 ( 13.1%)
--18037-- translate: generic_unknown SP updates identified: 476 (  0.3%)
--18037--     tt/tc: 3,268,435 tt lookups requiring 39,778,656 probes
--18037--     tt/tc: 3,268,435 fast-cache updates, 8 flushes
--18037--  transtab: new        126,771 (3,371,448 -> 55,973,921; ratio 166:10) [0 scs]
--18037--  transtab: dumped     0 (0 -> ??)
--18037--  transtab: discarded  178 (3,947 -> ??)
--18037-- scheduler: 1,600,611,603 jumps (bb entries).
--18037-- scheduler: 16,101/4,198,464 major/minor sched events.
--18037--    sanity: 16102 cheap, 159 expensive checks.
--18037--    exectx: 98,317 lists, 76,897 contexts (avg 0 per list)
--18037--    exectx: 1,105,810 searches, 1,109,489 full compares (1,003 per 1000)
--18037--    exectx: 6,172,993 cmp2, 1,867 cmp4, 0 cmpAll
--18037--  errormgr: 1,025 supplist searches, 80,506 comparisons during search
--18037--  errormgr: 1,855 errlist searches, 1,890 comparisons during search
 
 

Всего записей: 3 | Зарегистр. 25-04-2010 | Отправлено: 03:01 25-04-2010 | Исправлено: McAaron, 03:08 25-04-2010
kvesda

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
kvesda  
Я изначально планировал сделать переключаемую сортировку на ленте предпросмотра - по ширине рамки контента, по высоте, и обычную.  Однако в итоге решил, что отношение сложности реализации к полезности получается черезчур высокое.  
Ничего не обещаю, но подумаю над этим вопросом.

Спасибо! Это очень важно! Забыл написать, что урезание по ширине и высоте на некоторых сканах было не до номеров страниц, а до некоторых абзацев (по высоте), или урезка целых слов (по ширине)...
Еще раз спасибо!

Всего записей: 7 | Зарегистр. 24-04-2010 | Отправлено: 11:59 25-04-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
McAaron
Стандартный вопрос: падение воспроизводится?  На проекте из одного файла можете воспроизвести?
В логе valgrind'а ничего интересного нет, а в трассировке стека из багрепорта на sourceforge видно, что упало при отрисовке интерфейса темой Oxygen.  Возможно причина как раз в ней.  Попробуйте переключить тему.
 
Добавлено:
kvesda

Цитата:
Забыл написать, что урезание по ширине и высоте на некоторых сканах было не до номеров страниц, а до некоторых абзацев (по высоте), или урезка целых слов (по ширине)...  

Обрезание целого абзаца - это интересно.  Выкладывайте пример.

----------
Вопрос: как насчет вот такой фичи для ST?
Ответ: не сейчас, когда - не знаю, и стоит ли вообще?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 14:06 25-04-2010
LazyKent

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon, у меня такой вопрос.
 
Стоит ли мне пересобирать пакеты для openSUSE с учётом изменений, которые вы регулярно вносите в git? Или же ждать следующего релиза?
Пока я внёс патч касаемый despecling. Но смотрю, у вас в логах фигурирует слово Fix. Вот я и в раздумьях.

Всего записей: 174 | Зарегистр. 17-08-2006 | Отправлено: 18:15 25-04-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
LazyKent
Я как раз сегодня вечером планирую выпустить 0.9.8.1

----------
Вопрос: как насчет вот такой фичи для ST?
Ответ: не сейчас, когда - не знаю, и стоит ли вообще?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 18:54 25-04-2010
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
alihv

Цитата:
Зачем?

Если minidjvu будет под GPL 3+ - то смогу ли я, к примеру, скомпилировать его совместно с графической библиотекой FreeImage, идущей под GPL 2+?
 
Как Вы сами оцениваете - способен ли miniDjVu полноценно заменить коммерческие DjVu-кодировщики (хотя бы в части чёрно-белого кодирования)? Я считаю - нет, пока не способен. Причин как минимум 2:
 
- Плохой контур букв в DjVu, созданных посредством miniDjVu (рваный, зазубренный).
 
- Больший размер получаемого DjVu - по сравнению с коммерческими кодировщиками (в среднем на 13% при всех одинаковых условиях).
 
Скорость создания DjVu и потребность в оперативной памяти даже не рассматриваю пока.
 

Цитата:
На патенты, относящиеся к многостраничному сжатию, лицензия от LizardTech не распространяется

А что это значит? Что значит "многостраничное сжатие"? Его miniDjVu и использует - раз уж иное запрещено патентами?
 
Объясните, пожалуйста, ещё попроще - я всё равно ничего не понял в Ваших объяснениях. Какие такие "кластеры"? Что значит "выбрать из каждого кластера по представителю"?

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 18:54 25-04-2010
anagnost96

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000

Цитата:
- Плохой контур букв в DjVu, созданных посредством miniDjVu (рваный, зазубренный).  

 
Какая зазубренность, о чем Вы? Если включено усреднение образцов, то никакой зазубренности не может быть в принципе: все шероховатости отдельных знаков неизбежно сглаживаются.
 

Цитата:
- Больший размер получаемого DjVu - по сравнению с коммерческими кодировщиками (в среднем на 13% при всех одинаковых условиях).  

 
Ну, положим, 13% -- это величина, которой можно пренебречь. Однако в моих тестах при максимальном уровне агрессивности minidjvu дает несколько большее сжатие, чем documenttodjvu. И мне припоминается, что в нашей с Вами переписке Вы это подтверждали.

Всего записей: 132 | Зарегистр. 01-05-2009 | Отправлено: 21:06 25-04-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вспомнил, что еще нужно обновить переводы.  Так что с релизом придется несколько дней подождать.

----------
Вопрос: как насчет вот такой фичи для ST?
Ответ: не сейчас, когда - не знаю, и стоит ли вообще?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 00:37 26-04-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Выпустил релиз 0.9.8.1.  Брать на оффсайте.

----------
Вопрос: как насчет вот такой фичи для ST?
Ответ: не сейчас, когда - не знаю, и стоит ли вообще?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 01:25 27-04-2010
alihv

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Если minidjvu будет под GPL 3+ - то смогу ли я, к примеру, скомпилировать его совместно с графической библиотекой FreeImage, идущей под GPL 2+?  

Да. "+" означает "или любая последующая версия". Результат скрещивания Вы можете распространять под GPL 3 или GPL 3+, на Ваше усмотрение
 

Цитата:
Как Вы сами оцениваете - способен ли miniDjVu полноценно заменить коммерческие DjVu-кодировщики (хотя бы в части чёрно-белого кодирования)? Я считаю - нет, пока не способен.

Ну ОК. А вопрос был при чем-то или просто так?
 

Цитата:
А что это значит? Что значит "многостраничное сжатие"? Его miniDjVu и использует - раз уж иное запрещено патентами?

Это значит сжатие с учетом общей информации между страницами: они напечатаны одним шрифтом. Запатентовано не это, а некий способ это делать.  
 

Цитата:
Объясните, пожалуйста, ещё попроще - я всё равно ничего не понял в Ваших объяснениях. Какие такие "кластеры"? Что значит "выбрать из каждого кластера по представителю"?

Идея сжатия в том, что из двадцати отсканированных вариантов одной и той же буквы мы показываем пользователю только один и надеемся, что он не заметит. Вот этот один вариант и надо выбрать. Кластер - это набор похожих друг на друга картинок, которые мы объявляем неотличимыми для пользователя.

Всего записей: 3 | Зарегистр. 20-04-2010 | Отправлено: 02:14 27-04-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Может быть будет интересно, что в новой версии:

Цитата:
Мелкие улучшения и исправления на стадиях "Компенсация наклона" и "Макет страницы"

это (как минимум)
1) на стадии Компенсация наклона появилась возможность быстрого вращения по Ctrl+колесико (в статусной строке - подробности)
2) на стадии Макет страницы связь между смежными полями (кнопка с изображением сегмента цепи) теперь остается разорванной при переходе на страницы с разными значениями смежных полей.
 

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 04:30 27-04-2010
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 2)

Имя:
Пароль:
Сообщение

Для вставки имени, кликните на нем.

Опции сообщенияДобавить свою подпись
Подписаться на получение ответов по e-mail
Добавить тему в личные закладки
Разрешить смайлики?
Запретить коды


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.Board
© Ru.Board 2000-2018

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru