Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator / СканКромсатор (Часть 3)

Модерирует : gyra, Maz

gyra (14-11-2018 10:38): ScanKromsator / СканКромсатор (Часть 4)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199

   

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ScanKromsator

Знаменитый Кромсатор для обрезки получаемых при сканировании изображений, а также для разделения страниц, очистки от мусора и т.п.  
Автор: bolega. http://bolega.hotmail.ru/.  
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Аналог ScanKromsator - Scan Tailor
 
Начало обсуждения - 1 часть, 2 часть.
 
Текущая версия: ScanKromsator v6.00.5 (2,1 МБ) Настройка внешних утилит  
Предыдущая версия: 5.96.2  (файл sk.exe), утилиты к ней можно взять из v5.96.1  
 
Старые версии: Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон


Подборка ответов bolega про работу ScanKromsator (версия 1.0.1 с закладками и сносками), 2016 г.
 
Хрестоматия материалов про СК , 2017 г.
(25 Mb, для открытия файла chm может потребоваться его разблокировать в свойствах файла, кликнув ПКМ)  
Включает, в том числе:
Видеоуроки про ScanKromsator Подробнее...
 
Обработка пикчур-зон от TelecomUral Подробнее...
 
English texts Подробнее...
 
Что делать, если ScanKromsator не делает то, что хотелось бы... И ещё bolega о том же самом...

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 18:07 30-03-2009 | Исправлено: Maz, 09:43 22-08-2018
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg

Цитата:
Вот, что получилось.  
Соотношение: Ваша страница (первая) - 64 кб, после СТ - 47,9 кб.
Так сравнивать не очень корректно, в дежавю из нескольких страниц начинает работать словарь и размер страниц (который в свойствах страницы/документа) меньше, чем закодированных отдельно. И эта разница тем больше, чем дальще страница от начала. При кодировании 00006.tif из архива профилем Bitonal 600 (самое агрессивное сжатие) размер дежавю 48,9 КБ (50 139 байт).
Извиняюсь за офтоп.

Всего записей: 2493 | Зарегистр. 28-05-2004 | Отправлено: 06:00 17-10-2010
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Arcand

Цитата:
При кодировании 00006.tif из архива профилем Bitonal 600 (самое агрессивное сжатие) размер дежавю 48,9 КБ (50 139 байт).  

Я это знаю, но если точно тем же профилем обработать страницу после задания ghosty, то она будет не 64, а 66 кб.
А вот почему такое сравнение не совсем корректно, я не понял.
При сравнении важно не конкретное значение каждой страницы, а их соотношение.
В одной и той же компиляции параллельно обрабатываются две одинаковые по содержанию страницы, поэтому очень легко определить, какая сжимается сильнее.
А раздельное кодирование, которое Вы упоминаете, лишь подтверждает это.
 
P.S. Сравнение результатов обработки после СК и после СТ вряд ли можно считать здесь офтопиком, а одним из критериев такого сравнения является компиляция этих результатов. Мы же пытаемся понять правомочность такого сравнения вполне конкретного варианта сравнения, ИМХО.
Если же упоминание СТ в этой теме запрещено, тогда другое дело.

Всего записей: 6970 | Зарегистр. 14-01-2005 | Отправлено: 13:39 17-10-2010 | Исправлено: shch_vg, 13:40 17-10-2010
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А вот почему такое сравнение не совсем корректно, я не понял.  

Цитата:
в дежавю из нескольких страниц начинает работать словарь и размер страниц (который в свойствах страницы/документа) меньше, чем закодированных отдельно. И эта разница тем больше, чем дальще страница от начала.

Если бы две страницы прошли одинаковую обработку и были нормального качества, то вторая страница в дежавю могла бы быть по весу всегда меньше чем первая вне зависимости от того, какая из них первая.
В данном случае разница в весе страниц и жирности букв значительная, поэтому порядок не важен. А вообще имеет значение, поэтому все таки надо сравнивать отдельно закодированные.

Всего записей: 2493 | Зарегистр. 28-05-2004 | Отправлено: 17:24 17-10-2010
melodan

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Здрасьте.
В версии 5.92 у СК был такой глюк - в режиме просмотра результатов обработки после того как воспользуешься инструментом переноса выделенной области (переношу область в разных направлениях) на правой стороне выделения остаются следы символов. В последней версии это исправили?
Еще такая тема - на скане с одноцветной зоной (трехцветном скане) я выделяю эту зону, назначаю ей цвет бэкграунда (пусть серый), процессю - и получаю желаемый вариант - то бишь tif с тремя цветами - черным, белым и серым. Вопрос, как и чем (каким профилем) дальше обрабатывать эту страницу, если я хочу получить djvu-страницу?

Всего записей: 33 | Зарегистр. 09-03-2010 | Отправлено: 13:52 21-10-2010 | Исправлено: melodan, 13:55 21-10-2010
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
В 5.93 начались странные глюки - после обработки отдельной страницы процесс подвисает, загружая CPU на 100%. При этом СК остается функциональным, но выйти из него нельзя - только через TM.

Всего записей: 6808 | Зарегистр. 21-09-2002 | Отправлено: 19:20 21-10-2010
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
ghosty
Работаю только в 5.93, часто обрабатываю отдельные страницы и развороты, но с подобным явлением не сталкивался.
М.б. какие-то проблемы с системой?

Всего записей: 6970 | Зарегистр. 14-01-2005 | Отправлено: 21:56 21-10-2010 | Исправлено: shch_vg, 22:05 21-10-2010
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Что-то давно меня СК так не расстраивал - как будто рассыпаться начинал вдруг. Теперь он у меня напрочь перестал воспринимать изменения параметров Ill.Corr. Т.е. значение "1" теперь дает ровно такой же результат, как и значение "50".
Думал, этот глюк как-то был завязан на задании. Создал новое - та же история.  
Думал, он завязан как-то на установленной версии. Поставил заново в другую папку - то же самое.  
Голова болеть начинает  
bolega, help!
 
Добавлено:
melodan

Цитата:
В версии 5.92 у СК был такой глюк - в режиме просмотра результатов обработки после того как воспользуешься инструментом переноса выделенной области (переношу область в разных направлениях) на правой стороне выделения остаются следы символов. В последней версии это исправили?
Удивительно, но только что тоже столкнулся в 5.93...
 
Добавлено:

Цитата:
М.б. какие-то проблемы с системой?
Не знаю, только с СК проблемы. Да и проблемы специфичны именно для софта, а не для системы, ИМХО.

Всего записей: 6808 | Зарегистр. 21-09-2002 | Отправлено: 01:33 22-10-2010 | Исправлено: ghosty, 01:35 22-10-2010
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
melodan

Цитата:
В версии 5.92 у СК был такой глюк - в режиме просмотра результатов обработки после того как воспользуешься инструментом переноса выделенной области (переношу область в разных направлениях) на правой стороне выделения остаются следы символов. В последней версии это исправили?  

 
Имеется ввиду команда move selection?
Какой windows? Это проявляется на b/w файлах? Следы остаются в месте выреза или множатся по траектории перемещения?
 
ghosty

Цитата:
Голова болеть начинает

Я могу Вам дать 5.94 потестировать, я там много багов исправил

Всего записей: 4428 | Зарегистр. 09-09-2002 | Отправлено: 10:14 22-10-2010
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Послал сообщение в ПМ.
 

Цитата:
Имеется ввиду команда move selection?  
Какой windows? Это проявляется на b/w файлах? Следы остаются в месте выреза или множатся по траектории перемещения?

Да, move selection в Results Viewer'e. WinXP SP3. Следы - на месте выреза по правому краю.

Всего записей: 6808 | Зарегистр. 21-09-2002 | Отправлено: 11:36 22-10-2010 | Исправлено: ghosty, 12:22 22-10-2010
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega

Цитата:
Имеется ввиду команда move selection?

Я это делаю через Ctrl+M

Цитата:
Какой windows?

Наблюдал это и сервер2003, и в вин2к.

Цитата:
Это проявляется на b/w файлах?

Я замечал только на ч/б. Правда, не помню, использовал ли я эту команду на серых.

Цитата:
Следы остаются в месте выреза или множатся по траектории перемещения?

У меня только по правой стороне выреза.
При сдвиге вправо не замечал таких следов.

Всего записей: 6970 | Зарегистр. 14-01-2005 | Отправлено: 12:13 22-10-2010 | Исправлено: shch_vg, 12:16 22-10-2010
melodan

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Следы остаются в месте выреза или множатся по траектории перемещения?

После перемещения области с правой стороны контура вдоль вертикальной границы остается линия, которая повторяет расположение символов.. В общем - см. рисунок .
 
А еще, кому интересно, здесь (5,5 Мб) выложил пример отфотканного и закодированного старого журнала. Возможно ли его реставрировать и привести в нормальный вид (естесно с помощью СК), сократив размер новой дежавюшки в разы? Задача усложняется тем, что разрешение исходника небольшое, много затенений, геометрические искажения. В общем - работы море))

Всего записей: 33 | Зарегистр. 09-03-2010 | Отправлено: 12:33 22-10-2010 | Исправлено: melodan, 12:55 22-10-2010
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
melodan
Если нужно перемещать все содержимое, то лучше наверное использовать Ctrl-стрелки, а не move selection

Всего записей: 4428 | Зарегистр. 09-09-2002 | Отправлено: 14:54 22-10-2010
Melirius



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
melodan
 
msepdjvu Вам в помощь.

Всего записей: 318 | Зарегистр. 01-04-2005 | Отправлено: 19:56 22-10-2010
melodan

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Спасибо за совет, но баг таки надо исправить
Melirius
Интересно, спасибо А можно чуть подробнее о возможностях этой проги? Покамест изображения с тремя тонами (и более) я кодирую в режиме Scanned.

Всего записей: 33 | Зарегистр. 09-03-2010 | Отправлено: 20:12 22-10-2010
Melirius



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
melodan
 
Ну если там у Вас чисто прямоугольник фона для текста - так можно и Scanned, а ежли рисунки многоцветные, так лучше msepdjvu - она, в отличие от documenttodjvu при --jb2-format=color, поддерживает соприкасающиеся символы разных цветов.

Всего записей: 318 | Зарегистр. 01-04-2005 | Отправлено: 01:00 23-10-2010
Melirius



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
 
А кто тут хотел странички маленькие из-под СканКромсатора, да налетай, пока не разобрали!
 
spt-файл:

Код:
V5.86
1
[CMNT]=
[A]=;C:\!Hi-Fi DjVu\tif\out;;1;0
[B]=1,0,3,2,1,100,0,0,0,0,2,0,0,0,0,0,0,0,0,0,100,0,0,0,2,0,1,0,0,0,1,1,2,4,7,180,160,150,2,0,0,1,3,5,6,10,0,0,0,12880,3,67175426
[MPTIF]=0
[PROCRES]=
[FILES]
[A]=1
[FFNAME]=C:\!Hi-Fi DjVu\tif\_0000.tif
[FNAME]=_0000.tif
[B]=1,1,1,0,23145,0,0,1720,1867,346,3258,1,1,1,1,0,0,0,0,0,1,1,1,1,1,2,2,0,0,0,0,0,0,0,0,0,0,0,91,2368,0,0,1,1,0,0,0,1,1,0,0,0,0,0,1,0,7,0,1,0,0,0,2,0,0,0,0,1,1,0,0,0,0,0,0,0
[E]=1665,3,2,2,2,1,0,164,2,3,20,0,20,20,0,1,0,4,0,3,0,1,2,0,0,0,0,0,1,0,0,17,20,0,2,2,30,255,120,10,70,1,2,10,50,2,1,2,0,3,100,1,0,6,5,1,0,0,2,50,3,12,0,0
[ENDF]
 

 
Али настройки руками нижеследующие
Background cleaner: Correct low contrast +, increase Black -, ignore light pixels +
Blur: Mean filter +, Passes 2
Convert threshold: High Dark
 
Результат с пылу с жару из-под SK: http://ifile.it/gzvw2os
Кодируется в 46927 байт.

Всего записей: 318 | Зарегистр. 01-04-2005 | Отправлено: 06:38 23-10-2010 | Исправлено: Melirius, 06:40 23-10-2010
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Melirius
Большое спасибо за пример, результат действительно впечатляющий, возвращающий веру в СК .
Для сравнения результаты после компиляции при раздельном кодировании:
после СТ (с определенной очисткой) - 49 кб (50 139 bytes)
после СК (даже без малейшей очистки) - 46,3 кб (47 388 bytes)
Кстати, как Вам удалось закодировать его сильнее, чем я? Использовал самый сильносжимаемый профиль в DEE5.1.
Интересно, Вы долго подбирали эти параметры или уже изначально примерно знали, что может повлиять на размер?
 
Arcand
Немного странноватый результат получается при совместном кодировании страниц после СК и СТ:
вариант СК+СТ - 45,2 и 47,8
вариант СТ+СК - 47,6 и 45,4,
т.е. нахождение на первом месте уменьшает величину на 0,2 для обоих способов обработки.

Всего записей: 6970 | Зарегистр. 14-01-2005 | Отправлено: 14:12 23-10-2010 | Исправлено: shch_vg, 14:21 23-10-2010
melodan

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Спасибо, Melirius
Нашел еще один глюк в СК, уже в последней версии. На вкладке Book в поле H.Gap value выделяем значение 0, нажимаем клавишу "0" и получаем "00"
А еще большая просьба - убрать окно подтверждения про уеличение выходного разрешения. Когда обрабатываешь страницы по отдельности - постоянно вылезает это окошко. Решение - убрать совсем, либо сделать пункт в настройках, чтобы не появлялось это окно предупреждения.

Всего записей: 33 | Зарегистр. 09-03-2010 | Отправлено: 17:35 23-10-2010 | Исправлено: melodan, 17:36 23-10-2010
Melirius



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
melodan
 

Цитата:
А еще большая просьба - убрать окно подтверждения про уеличение выходного разрешения. Когда обрабатываешь страницы по отдельности - постоянно вылезает это окошко. Решение - убрать совсем, либо сделать пункт в настройках, чтобы не появлялось это окно предупреждения.

 
Оно отключается в настройках: File > Options... > Processing > DPI Resample warning.
 
shch_vg
 
Ну я изначально знал, что нужно выровнять освещённость (BG Cleaner или Ill. Corr.) + какое-то размытие + порог подобрать. Ill. Corr. на этой картинке оказалось слишком агрессивным при любых настройках, остался BG Cleaner, размытие пробовал разное, наилучшее зависит от типа порога.
 
Но Вы сейчас будете смеяться: результат в 31058 (!!!) байт в 600dpi получается следующим образом:
Output 300dpi (!!!)
Background cleaner: Correct low contrast -  
Blur: Median filter  
Convert threshold: Middle Dark
 
затем CPCtion, декодирование, upsampling до 600dpi bspline в XnView, кодирование.  
 
Или вместо Median Gauss +, Radius 1, тогда размер 34469, но в короне чёрного короля все 4 точки остаются.
 
Выкладываю настройки моего профиля кодирования:
 
#@displayName:Bitonal (600 dpi) new
Bit600new: bitonal600
description=Bitonal (600 dpi) with big dictionary
pages-per-dict=3000
fg-quality=1
render-size=1
 
+ --disable-halftone в командной строке.
 
Похоже, что такие книги дают пример для моего символа веры: сканируйте только в 600dpi!  

Всего записей: 318 | Зарегистр. 01-04-2005 | Отправлено: 20:37 23-10-2010 | Исправлено: Melirius, 20:46 23-10-2010
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Melirius
Еще раз спасибо за подробные ответы, однако есть в связи с этим несколько вопросов.
1. В описании обработки в 300дпи что делать с Blur: Median filter?
2. Я понимаю, что, привлекая много доп.программ, можно добиться многого, однако хотелось бы минимизировать их количество, чтобы облегчить другим подобную обработку. В связи с этим, в цепочке "затем CPCtion, декодирование, upsampling до 600dpi bspline в XnView, кодирование" что будет, если убрать CPCtion и делать декодирование и upsampling до 600dpi в СК?
Если ответы на эти вопросы выходят за рамки этой темы, не могли бы Вы мне написать в Личный Ящик.
3. Не понял смысл фразы "Или вместо Median Gauss +, Radius 1".
4. Возможно, девиз "сканируйте только в 600dpi!" и верен, но в данном конкретном случае практически невыполним. В нашей теме удается подвигнуть имеющих шахматную литературу на сканирование ее, но на обработку их другими они выкладывают сканы в лучшем случае в 300дпи (больше приводит к резкому возрастанию объема пересылки), заключенные в пдф либо с помощью СК с установками по умолчанию, либо с помощью других программ с еще более крутыми параметрами сжатия в пдф.
 
P.S. Как реализовать "--disable-halftone в командной строке"?
Без этого параметра результат работы Вашего профиля идентичен моему с точностью до байта.
Я в DEE5.1 работал только в GUI.

Всего записей: 6970 | Зарегистр. 14-01-2005 | Отправлено: 23:22 23-10-2010 | Исправлено: shch_vg, 00:01 24-10-2010
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator / СканКромсатор (Часть 3)
gyra (14-11-2018 10:38): ScanKromsator / СканКромсатор (Часть 4)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru