Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator / СканКромсатор (Часть 3)

Модерирует : gyra, Maz

gyra (14-11-2018 10:38): ScanKromsator / СканКромсатор (Часть 4)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199

   

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ScanKromsator

Знаменитый Кромсатор для обрезки получаемых при сканировании изображений, а также для разделения страниц, очистки от мусора и т.п.  
Автор: bolega. http://bolega.hotmail.ru/.  
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Аналог ScanKromsator - Scan Tailor
 
Начало обсуждения - 1 часть, 2 часть.
 
Текущая версия: ScanKromsator v6.00.5 (2,1 МБ) Настройка внешних утилит  
Предыдущая версия: 5.96.2  (файл sk.exe), утилиты к ней можно взять из v5.96.1  
 
Старые версии: Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон


Подборка ответов bolega про работу ScanKromsator (версия 1.0.1 с закладками и сносками), 2016 г.
 
Хрестоматия материалов про СК , 2017 г.
(25 Mb, для открытия файла chm может потребоваться его разблокировать в свойствах файла, кликнув ПКМ)  
Включает, в том числе:
Видеоуроки про ScanKromsator Подробнее...
 
Обработка пикчур-зон от TelecomUral Подробнее...
 
English texts Подробнее...
 
Что делать, если ScanKromsator не делает то, что хотелось бы... И ещё bolega о том же самом...

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 18:07 30-03-2009 | Исправлено: Maz, 09:43 22-08-2018
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
Я нашел, как легко обойти эту проблему (без изменения размера файлов и без перекодирования переднего слоя): СК просто делает небольшую шаманскую модификацию sjbz-чанка.

Прописываете в INFO-чанк нужные размеры? А не получатся ли потом неприятные побочные эффекты? Что если некоторые DjVu-вьюверы будут потом на таких DjVu вываливаться - кто знает?

Цитата:
В итоге сделал так, что СК сам формирует raw-чанк FGbz. От использования djvulibre для этого отказался, т.к. в некоторых случаях он оказался бессилен, и главное, его результат был заранее непредсказуем.

А как это "От использования djvulibre для этого отказался"? Насколько я знаю, FGbz-чанк обязан быть сжат архиватором bzz (который есть только в DjVuLibre) - перед вставкой в DjVu. Или оказалось возможным применять FGbz-чанк без сжатия? В принципе, можно, наверное, заставить сжимать в bzz самостоятельно приготовленный прототип FGbz-чанка уже внутри djvumake (путём модификации djvumake).

Цитата:
чтобы djvu делался с помощью JPG2000 (хотя стандарт djvu это и позволяет).

Что-то не увидел такой информации в спецификации DjVu. Откуда такие сведения? Можно простой JPEG помещать в DjVu - это да. Но вряд ли это кому нужно - качество гораздо хуже.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 19:33 24-01-2011 | Исправлено: monday2000, 19:34 24-01-2011
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000

Цитата:
Прописываете в INFO-чанк нужные размеры?

Ну, это слишком грубо и, наверное, приведет к ошибке (если изменять только его). Я же говорил, что изменения вносятся непосредственно в раскодированный sjbz-чанк.
При этом никаких побочных эффектов не возникнет. Чанк, как и структура страницы, остаются абсолютно правильными с точки зрения стандарта.
Если посмотреть на структуру sjbz-чанка, то он начинается с размеров канвы, на которую наносятся блиты. Теоретически, эта канва может быть любой, это всего лишь белая так сказать подложка. Вот ее размеры я слегка и изменяю (на 1-11 пикселей), чтобы достичь нужной кратности. Естесственно, такие же размеры нужно подставить и в INFO-чанк. При этом нужно помнить, что начало координат у блитов (как и у djvu-страницы) находится в левом нижнем углу, а не в верхнем. Поэтому зоны, помещаемые затем с помощью вашего метода МПФ, нужно соответствующим образом сдвигать вниз на столько же пикселей.  
 

Цитата:
А как это "От использования djvulibre для этого отказался"?

Я имел ввиду от специального синтаксиса djvumake, введенного в последней версии djvulibre, когда раскраска задается последовательностью прямоугольников. Отказался по той причине, что блит в djvu как оказалось, не является связным черным компонентом, а может состоять из нескольких раздельных (на большое расстояние!)кусков. Может так оказаться (у меня такое встретилось), что эти куски одного блита могут принадлежать разным раскрашенным зонам. И здесь плохо не то, что такие зоны невозможно раскрасить как нужно, а то, что заранее нельзя определить этот факт, и в итоге юзер получит непредсказуемый результат (раскраску). Если вам интересно, могу привести пример такой ситуации.
Кстати, пока я это не понял, я разработал алгоритм автоматического формирования пересекающихся раскрашивающих прямоугольников. Ранее я ошибочно писал, что это невозможно. Но оказалось, что эту задачу можно изящно решить методом графов. Интересно, что если области невозможно было закрасить с помощью ряда прямоугольников, то это соответствовало тому, что в графе появлялись циклы. Но, вообщем, алгоритм я полностью реализовал, пока не понял, что он бесполезен, т.к. он полагался на связные "блиты" исходного тифа, а не на то, какими они становились после кодирования в DEE. Но это и к лучшему: теперь СК использует исключительно блиты после DEE, что гарантирует 100% правильность раскраски (или ее невозможность с помощью FGbz).
 
Кстати, как побочный эффект всего этого, я ввел в СК команду, которая открывает нужный djvu-файл, интерактивно позволяет расставить на страницах зоны раскраски, и по команде ввести эту раскраску в исходный djvu.
 

Цитата:
Откуда такие сведения? Можно простой JPEG помещать в DjVu - это да

Я это и имел ввиду. Т.е. jpg как бы становится чанком заднего фона.

Всего записей: 4387 | Зарегистр. 09-09-2002 | Отправлено: 09:26 25-01-2011 | Исправлено: bolega, 09:33 25-01-2011
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
Если посмотреть на структуру sjbz-чанка, то он начинается с размеров канвы, на которую наносятся блиты.

Этого я не знал. В спецификации DjVu о структуре Sjbz-чанка пока увидел следующее:

Цитата:
11 Appendix 2: JB2 coding.
11.1 General considerations.

An Sjbz chunk contains a single arithmetically encoded data stream, coded using the Z'-  
Coder (Appendix 3). All data, including headers and record types, is coded in this arithmetically coded string.

В Приложении 3 там говорится уже просто о Z-кодёре, и как он работает. Поищу ещё в спецификации.

Цитата:
блит в djvu как оказалось, не является связным черным компонентом, а может состоять из нескольких раздельных (на большое расстояние!)кусков.

Ничего себе! Вы точно уверены? Я, разумеется, думал, что блит всегда связен. Если не связен - тогда вообще раскраска блитов теряет смысл. Тогда нужно бы в идеале перекодировать маску - до связных блитов.

Цитата:
Если вам интересно, могу привести пример такой ситуации.

Давайте, очень интересно.

Цитата:
Кстати, как побочный эффект всего этого, я ввел в СК команду, которая открывает нужный djvu-файл, интерактивно позволяет расставить на страницах зоны раскраски, и по команде ввести эту раскраску в исходный djvu.

Полезная вещь. У меня тоже есть аналогичная программа - DjVu Pal.

Цитата:
теперь СК использует исключительно блиты после DEE, что гарантирует 100% правильность раскраски (или ее невозможность с помощью FGbz).  

Так а как СК может раскрасить блиты DjVu вообще без применения DjVuLibre API (как Вы написали)?

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 13:18 25-01-2011 | Исправлено: monday2000, 13:19 25-01-2011
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000

Цитата:
Вы точно уверены? Я, разумеется, думал, что блит всегда связен

Уверен точно. Возможно, что несвязность возникает только для больших блитов. Но это не отменяет сам факт.
 
Вот пример несвязности блитов: http://www.onlinedisk.ru/file/600411/
В архиве 3 djvu:
normal.djvu - это то, что необходимо получить (правильный вариант)
bad.djvu - это то, что получилось при раскрашивании 4-мя прямоугольниками (последовательность была такая: синий, черный, красный, черный. черные нужны были, чтобы вернуть цвет тексту в прозрачной области зон).
bw.djvu - ч/б djvu, из которого доставались блиты
Сами блиты, точнее, часть их, находятся в папке blits. Номера файлов соответствуют номерам в sjbz-чанке.
Положил также образец сложной раскраски example.djvu, сделанной СК.
 

Всего записей: 4387 | Зарегистр. 09-09-2002 | Отправлено: 13:52 31-01-2011
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
Вот пример несвязности блитов: http://www.onlinedisk.ru/file/600411/

Спасибо, посмотрю внимательно.
Раз уж блиты могут быть несвязными, то это, конечно, плохо. Надо бы ещё копнуть поглубже в формат DjVu - наверняка блиты не являются элементарными объектами, и их несвязные части можно разделить (т.е. получить только связные блиты).
 
А я вот, как ни забавно, до сих пор не прочитал полностью спецификацию DjVu. Некогда. Заткнуть бы самые большие дыры в технологии DjVu-книгосканирования - а там уж можно будет и в деталях разбираться.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 11:59 01-02-2011
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000

Цитата:
их несвязные части можно разделить (т.е. получить только связные блиты).  

Да, судя по всему, это сделать не сложно. При условии, что эти блиты не находятся в общем словаре и не помечены как разделяемые, т.е. на их базе не строятся другие блиты.
 
Кстати, реализованный мною способ правки размера sjbz позволяет в принципе реализовать еще одну фичу (которая есть в acrobat, но нет в djvu): обрезание, или наоборот, наращивание, полей в готовом djvu - т.е. crop. Правда, сложность там будет с другими слоями (FG,BG и т.д.). Как их безболезненно кропить, я еще не смотрел.
 

Всего записей: 4387 | Зарегистр. 09-09-2002 | Отправлено: 13:06 01-02-2011
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Я помню, что в СК была возможность задавать после бинаризации цвет текста и фона. Только не помню - это только для зон возможно или для всего файла целиком. Может быть, можно как-то задавать цвета текста/фона уже на этапе постобработки в окне RV?
 
В общем, хотел бы спросить, какой наиболее оптимальный путь обработки Вы могли бы предложить для такой обложки:
http://ifile.it/qn6dh9s/Image%200001.tif
 
Вот, что получилось с применением зон:
http://ifile.it/gd7mzta/test.rar
Вроде, неплохо, но повторяю, почему-то мне казалось, что есть путь без выделения зон. Или я не прав?

----------
пропадет-растает

Всего записей: 6808 | Зарегистр. 21-09-2002 | Отправлено: 22:29 05-02-2011 | Исправлено: ghosty, 03:40 06-02-2011
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ghosty

Цитата:
Только не помню - это только для зон возможно или для всего файла целиком

Только для зон.
 

Цитата:
Может быть можно как-то задавать цвета текста/фона уже на этапе постобработки в окне RV?  

Да, можно конечно. Т.е. цвета можно менять на лету, при этом переобработка не требуется. Единственное условие - страница с зоной должна быть финализирована. Иначе свойства зоны в окне VR не вызвать. Свойства зоны можно менять в окне постобработки. Для этого нужно дважды щелкнуть на зоне.
Ваш вариант мне вполне нравится. Но  я бы в свойствах данной зоны не использовал бы denoise и smart blur. Эти опции больше подходят к серым/цветным зонам. Для изначально ч/б по сути иллюстраций они иногда приводят к потерям деталей. И раз уж Вы обрабатываете обложку как зону, то еще бы я в избавился далее от белых полей: в контекстном меню зоны (в окне VR) вызвал бы команды Adjust (crop) page->width и Adjust (crop) page->height. Эти команды подгоняют размер страницы под размеры (или координаты) зоны.
Кстати, для smart blur я бы рекомендовал увеличивать радиус до 6-7, а порог уменьшать до 20. Это позволить получать более сильное сглаживание (однородность) не боясь при этом размывания резких деталей (букв, штрихов и т.п.)
 
================
Вот здесь положил 4 тифа: http://www.onlinedisk.ru/file/603672/.
Первый тиф - это исходный обработанный ч/б скан. 2-й тиф - это полученный из 1-го, обработанный по технологии, очень похожей на акробатовской clearscan (смотреть все лучше при большом увеличении). Как видите, результат - почти сказка. Если бы не одно но: изображение стало серым. После бинаризации (3-й тиф) уже не все так красиво, но тем не менее сглаживание букв все таки имеет место. Качество можно сохранить, если перед бинаризацией удвоить разрешение до 1200dpi - 4-й тиф. При этом размер djvu конечно возрастает. djvu прилагается.
Данный пример показывает, что технология типа clearscan хороша в основном для просмотра на экране и при печати. При бинаризации же результата ее преимущества уже не так заметны (при том же dpi). Если же dpi увеличить, то результат вполне ничего. Однако это надо еще будет исследовать на полной книге. В моем примере выбрана только одна страница, причем с иллюстрацией, которая заметно добавляет веса в djvu-файл. Возможно, что для книги с общим словарем размер будет вполне приемлим, т.к. буквы получаются очень гладкими.
 
=================
Еще одна фича из новой версии СК: опция для зон descreen. В архиве два типичных примера обработки с помощью этой опции (смотреть с увеличением). Как видите, качество картинки улучшается кардинально.  
http://www.onlinedisk.ru/file/603673/
Descreen - это опция без параметров настройки. Все делается автоматом. Для ее работы требуется fftw.dll с сайта http://www.fftw.org/. DLL выполняет быстрое преобразование Фурье.
Идеей и алгоритмом descreen любезно поделился Cptn_Cook  

Всего записей: 4387 | Зарегистр. 09-09-2002 | Отправлено: 02:44 06-02-2011 | Исправлено: bolega, 03:09 06-02-2011
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Спасибо за рекомендации.

Цитата:
Но  я бы в свойствах данной зоны не использовал бы denoise и smart blur.
Я подумал, что они помогут лучше отфильтровать грязь на обложке, как бы "дефрагментировав" ее.
 

Цитата:
Первый тиф - это исходный обработанный ч/б скан. 2-й тиф - это полученный из 1-го, обработанный по технологии, очень похожей на акробатовской clearscan (смотреть все лучше при большом увеличении).
В каком смысле похожей? Векторизация без OCR (рисунок, вроде, тоже векторизован)? И СК это теперь умеет делать?

Цитата:
Данный пример показывает, что технология типа clearscan хороша в основном для просмотра на экране и при печати.
На мой взгляд, это и станет теперь приоритетом - максимальная эргономичность, комфорт для глаз, качество печати. Уже нет смысла этим пренебрегать за счет уменьшения объема файла.
 

Цитата:
Descreen - это опция без параметров настройки. Все делается автоматом.
Для автоматического режима действительно очень неплохо. Хотя явно виден краевой эффект и, похоже, снижение качества descreen в темных зонах. Хорошего descreen-алгоритма в СК очень не хватало.

Всего записей: 6808 | Зарегистр. 21-09-2002 | Отправлено: 03:34 06-02-2011 | Исправлено: ghosty, 03:38 06-02-2011
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ghosty

Цитата:
Я подумал, что они помогут лучше отфильтровать грязь на обложке, как бы "дефрагментировав" ее

Да, мусора станет меньше. Но denoise я не рекомендую применять. SBlur вполне хватит, и он на порядок быстрее делается.
 

Цитата:
И СК это теперь умеет делать?

Я еще окончательно не решил, стоит ли добавлять в СК эту возможность. Нужны еще эксперименты.
 

Цитата:
Хотя явно виден краевой эффект и, похоже, снижение качества descreen в темных зонах

Нет, дело не в краевом эффекте. Просто алгоритм вносит побочный шум в однородный фон, независимо от его цвета. Но учитывая, что descreen предназначен именно для картинок такого качества, в котором однородного содержимого намного меньше, чем неоднородного, то эффект от опции намного перекрывает ее недостатки. Теоретически и этот недостаток можно исправить, если научиться маскировать descreen однородных участков.

Всего записей: 4387 | Зарегистр. 09-09-2002 | Отправлено: 12:14 06-02-2011
Dimock



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Если одновременно запустить обработку 2-х словарей в СканКромсаторе, по одному в каждой программе, процесс каждого замедлится наполовину?
 
Система Win 7, 32 bit, Microsoft Office 2003 SP3, процессор AMD Phenom(tm) II X4 810, 2.59 Гц, ОЗУ – 4.00 Гб (3.52 Гб доступно).
 
Версия v5.93 стабильна?

Всего записей: 715 | Зарегистр. 06-02-2006 | Отправлено: 17:38 10-02-2011
Melirius



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Dimock
 
Нет, замедление возможно только из-за одновременных обращений к диску. Поэтому я Вам советую финт ушами: сделайте себе RAM-диск и положите туда сканы для обработки + переместите папку temp для SK. Станет намного быстрее. А то у Вас и так 500Мб памяти пропадает...  

Всего записей: 318 | Зарегистр. 01-04-2005 | Отправлено: 18:03 11-02-2011
Dimock



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Melirius
 

Цитата:
Поэтому я Вам советую финт ушами: сделайте себе RAM-диск и положите туда сканы для обработки + переместите папку temp для SK.  

 
Как сделать этот диск? Потом путь к папке temp для SK прописать в программе? Можно подробнее? Спасибо.

Всего записей: 715 | Зарегистр. 06-02-2006 | Отправлено: 11:34 12-02-2011
VadimirTT



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Dimock
например
SuperSpeed RamDisk

Всего записей: 2855 | Зарегистр. 22-03-2005 | Отправлено: 12:15 12-02-2011
Melirius



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Dimock
 
У меня SK запускает такой bat-ничек
 
setlocal
set TEMP=q:
set TMP=q:
start sk.exe %*
 
q — соответственно RAM-диск.
 
Берите SuperSpeed RamDisk Plus или бесплатный VSuite.Ramdisk.  

Всего записей: 318 | Зарегистр. 01-04-2005 | Отправлено: 16:32 12-02-2011
Dimock



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
VadimirTT
Melirius
 
Спасибо.

Всего записей: 715 | Зарегистр. 06-02-2006 | Отправлено: 20:16 12-02-2011
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я сделал в Википедии статью о ScanKromsator:
 
http://ru.wikipedia.org/wiki/ScanKromsator
 
Надеюсь, её не сотрут. Но даже если и сотрут - то мы хотя бы будем знать, что их не устроило.
 
Приглашаю всех желающих дополнить эту статью (но не нарушайте при этом правил Википедии).

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 10:05 18-02-2011
Nick222

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Правильно ли я понимаю, что версии СК под Линукс нет?

Всего записей: 2283 | Зарегистр. 28-11-2004 | Отправлено: 00:40 22-02-2011
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Nick222

Цитата:
Правильно ли я понимаю, что версии СК под Линукс нет?

Нет, но можно запустить через Wine:
 
http://biotex.ibss.org.ua/libsoft_profile.html?id=31

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 09:45 22-02-2011
Eduardo2

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
У меня СК из сине-белых тиффов делает черно-белые. Как его настроить, чтобы сохранить книжные цвета?

Всего записей: 207 | Зарегистр. 26-05-2006 | Отправлено: 01:21 23-02-2011
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator / СканКромсатор (Часть 3)
gyra (14-11-2018 10:38): ScanKromsator / СканКромсатор (Часть 4)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru