Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator / СканКромсатор (Часть 3)

Модерирует : gyra, Maz

gyra (14-11-2018 10:38): ScanKromsator / СканКромсатор (Часть 4)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199

   

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ScanKromsator

Знаменитый Кромсатор для обрезки получаемых при сканировании изображений, а также для разделения страниц, очистки от мусора и т.п.  
Автор: bolega. http://bolega.hotmail.ru/.  
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Аналог ScanKromsator - Scan Tailor
 
Начало обсуждения - 1 часть, 2 часть.
 
Текущая версия: ScanKromsator v6.00.5 (2,1 МБ) Настройка внешних утилит  
Предыдущая версия: 5.96.2  (файл sk.exe), утилиты к ней можно взять из v5.96.1  
 
Старые версии: Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон


Подборка ответов bolega про работу ScanKromsator (версия 1.0.1 с закладками и сносками), 2016 г.
 
Хрестоматия материалов про СК , 2017 г.
(25 Mb, для открытия файла chm может потребоваться его разблокировать в свойствах файла, кликнув ПКМ)  
Включает, в том числе:
Видеоуроки про ScanKromsator Подробнее...
 
Обработка пикчур-зон от TelecomUral Подробнее...
 
English texts Подробнее...
 
Что делать, если ScanKromsator не делает то, что хотелось бы... И ещё bolega о том же самом...

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 18:07 30-03-2009 | Исправлено: Maz, 09:43 22-08-2018
alterEgo16



Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
asku

Цитата:
изменения опций на некоторых вкладках почему-то не распространяются на все файлы

лучше щелкнуть пкм в окне параметра и выбрать apply option to...
или другой вариант - после изменения параметра скинуть и снова установить галочку(с ctrl).

Всего записей: 22 | Зарегистр. 20-05-2016 | Отправлено: 23:44 07-06-2016
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
лучше щелкнуть пкм в окне параметра и выбрать apply option to...  

 
Получилось! ) Только там не apply option to..., а copy to...

Всего записей: 525 | Зарегистр. 04-05-2016 | Отправлено: 00:01 08-06-2016
BKSRU

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Имеются рисунки на весь разворот. Симметрично разрезать не получается без потерь небольшой части рисунка. Предварительно в главном окне не плохо бы сдвинуть одну часть рисунка. Не нашел такой возможности. Нет такой?

Всего записей: 1555 | Зарегистр. 29-01-2009 | Отправлено: 16:53 08-06-2016 | Исправлено: BKSRU, 16:59 08-06-2016
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Имеются рисунки на весь разворот. Симметрично разрезать не получается без потерь небольшой части рисунка. Предварительно в главном окне не плохо бы сдвинуть одну часть рисунка. Не нашел такой возможности. Нет такой?

 
Я бы развороты клонировал. И из одного изготавливал левую, а из другого - правую стр.

Всего записей: 1014 | Зарегистр. 13-06-2013 | Отправлено: 17:25 08-06-2016
BKSRU

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013

Цитата:
Я бы развороты клонировал. И из одного изготавливал левую, а из другого - правую стр.

Не понял как это может помочь?
Середка разворота не симметричная относительно текста. И если я хочу сделать поля одинаковыми, при этом не потерять стык половинок рисунка, то как то надо сдвинуть одну часть до линии резака. Это было бы удобно сделать в главном окне.
 
P.S. Разобрался. Режем как есть. В окне редактирования сдвигаем большую часть на необходимый шаг. Желтой рамкой кропим по новый край рисунка. Финализируем.

Всего записей: 1555 | Зарегистр. 29-01-2009 | Отправлено: 18:30 08-06-2016 | Исправлено: BKSRU, 18:41 08-06-2016
Benoni50



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
BKSRU
Или Выделяем ту часть рисунка, которую надо сдвинуть. Дальше Ctrl+M. И эту частью продолжаем сдвигать, поднимать, опускать.

Всего записей: 178 | Зарегистр. 09-11-2015 | Отправлено: 19:27 08-06-2016
BKSRU

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Benoni50

Цитата:
Или Выделяем ту часть рисунка, которую надо сдвинуть. Дальше Ctrl+M. И эту частью продолжаем сдвигать, поднимать, опускать.

На самом деле оба варианта не годятся. Поспешил сделать выводы. При желтой рамке редактирование не возможно.
 
Но все таки способ нашел:
- Режем по линии стыка.
- Выравниваем обрезки по краю страниц в стык картинок.
- В редакторе финализируем страницы.
- На странице с большим выступающим рисунком выделяем не сам рисунок, а текстовый блок. Если блоки сверху и снизу рисунка, то через Shift оба блока.
- Сдвигаем к краю выделенные блоки, выравнивая отступ от центра разворота под размер отступа второй половинки.
 
Опять же жаль, что нет возможности пиксельной точности сдвига при мелких масштабах (кроме описанного выше).

Всего записей: 1555 | Зарегистр. 29-01-2009 | Отправлено: 19:53 08-06-2016 | Исправлено: BKSRU, 20:07 08-06-2016
Benoni50



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
BKSRU

Цитата:
При желтой рамке редактирование не возможно.

Правильно, нужна финализация. А после неё  

Цитата:
Выделяем ту часть рисунка, которую надо сдвинуть. Дальше Ctrl+M. И эту частью продолжаем сдвигать, поднимать, опускать.

Всего записей: 178 | Зарегистр. 09-11-2015 | Отправлено: 20:12 08-06-2016
BKSRU

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Benoni50
Рисунок не получится сдвинуть. Как раз надо добиться, что бы не было его кропа. Сдвигая рисунок, конечно можно добиться одинакового сдвига края рисунка от текста. Но затем надо будет двигать весь скан обратно к краю страницы, для совмещения рисунков в стык. Приемлемо, но на одну операцию больше .  
 
Ну в общем выходы есть.

Всего записей: 1555 | Зарегистр. 29-01-2009 | Отправлено: 20:19 08-06-2016 | Исправлено: BKSRU, 20:20 08-06-2016
kardamon2

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Раз уж речь зашла о рисунках на стыке разворота, да и вообще о рисунках на краях.
Опишу как делаю я.  
Если разворот, то как правильно указал daa2013, клонируем в списке файлов, чтобы каждую половику резать отдельно, причем с явным перехлестом. Это не страшно, потом отрежется лишнее. Для левой части ставим гориз. выравнивание=right, для правой = left. Кроме того, для левой страницы ставим галку на Spec.gaps (на R), для правой - на L. Это означает, что поля в этих местах будут нулевые. Для страниц, где зоны касаются краев страницы, также взводим соответствующие spec.gaps.
После обработки нужно до финализации и расчета размеров, откропить все зоны, которые касаются краев. СК не позволяет чистить/изменять страницы до финализации, но для зон можно делать все. Я зоны кроплю так: чищу периметр зоны, удаляя все лишнее. Затем hotkey Autocrop. Либо в параметрах VR выставляю опцию autocrop, тогда перед сохранением зон СК сам будет кропить (т.е. уменьшать размеры зоны за счет чисто белых рядов пикселей, если они есть). Затем ПКМ > Show > show page bounds by zones panel. Будет панелька с 8 кнопками. Например, если нажать на кнопку со стрелкой вправо, то правая сторона желтого габарита страницы встанет на самый правый край из всех зон. Т.е. получится идеальное совмещение стороны зоны и края страницы. Никаких линеек и ручных сдвигов.
Если картинка на разворот, то после расчета размеров книги и до финализации еще раз проверка: режим показа двух страниц и визуальный контроль совпадения половинок по высоте. Если не совпадают, подвигать верхний/нижний край желтого габарита до нужного совпадения. Не факт, что совпадут и низ, и вверх: часто не совпадает сам оригинал.
Надеюсь, описал доходчиво.
 
 
Добавлено:
asku

Цитата:
то изменения опций на некоторых вкладках почему-то не распространяются на все файлы

Так и задумано. Дело в том, что копирование каждой такой под-опции, напр., радиуса фильтра, не предусмотрено. Можно копировать только все параметры фильтра целиком.
 
shch_vg

Цитата:
Нигде в Options я не встречал dpi, просто там задается размер спекла, который будет удаляться при очистке выбранной области.

Есть размер Despeckle, которые СК использует при обработке, и он разный для разных dpi. А есть размер, который задается в окне VR, и он используется только при ручной чистке, т.е. красной метелкой.
 
TelecomUral

Цитата:
Некоторые функции СК используют значение DPI скана при работе с пикселями

Да, DPI является метрикой для многих алгоритмов СК, начиная с draft и кончая upsample/downsample (масштабирование), despeckl-ом, удалением фона и т.п.

Всего записей: 86 | Зарегистр. 08-11-2015 | Отправлено: 21:12 08-06-2016 | Исправлено: kardamon2, 21:14 08-06-2016
BKSRU

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
kardamon2

Цитата:
...
Если картинка на разворот, то после расчета размеров книги и до финализации еще раз проверка: режим показа двух страниц и визуальный контроль совпадения половинок по высоте. Если не совпадают, подвигать верхний/нижний край желтого габарита до нужного совпадения. Не факт, что совпадут и низ, и вверх: часто не совпадает сам оригинал.
Надеюсь, описал доходчиво.  

Более/менее ясно. Но не ясно где это пересекается с моим случаем?
Ситуация на самом деле не сложная:  
Рисунок на весь разворот. На развороте достаточно ясная граница раздела, но она не по центру текстовых блоков левой и правой страницы. Т.е. если необходимы одинаковые поля от края текстовых блоков страниц разворота и при этом не потерять полезную часть рисунка, надо либо выдвинуть один или задвинуть другой рисунок (вернее часть рисунка). Т.е. перемещение по горизонтали. Как бы вы поступили, что бы работа была произведена точно и быстро?

Всего записей: 1555 | Зарегистр. 29-01-2009 | Отправлено: 04:38 09-06-2016 | Исправлено: BKSRU, 14:17 09-06-2016
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
BKSRU
покажите скан, пожалуйста.

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 05:00 09-06-2016
BKSRU

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
покажите скан, пожалуйста.

http://rgho.st/6FkFfbYD5
 
Для моих скромных целей оказалось, чем меньше использование улучшайзеров тем лучше распознавание текста. Отключил все настройки улучшайзеров, только разрезаю, выравниваю и чищу от мусора. Разрешение оставил как есть, оно не высоко 200dpi, но при этом ошибок распознавания куда меньше и распознанный текст выглядит куда ровнее и структурнее. Однако, при этом СК некоторые страницы не смог выровнять, приходится вручную.

Всего записей: 1555 | Зарегистр. 29-01-2009 | Отправлено: 05:21 09-06-2016 | Исправлено: BKSRU, 05:23 09-06-2016
BKSRU

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Поэкспериментировал с влиянием улучшайзеров на распознавание в FineReader 12.
 
Исходник tif рисунки книги на 60 страниц: серые/200dpi.
 
1. Удвоение до 400 dpi дает положительный результат. Увеличение/уменьшение дает больше ошибок. Дальше экспериментировал с 400dpi.
 
2. Черно-белый вариант дает больше ошибок. Может это для этого конкретного случая или отсутствие опыта повышения общего качества. Но эксперименты  с бинаризацией и с прочими улучшайзерами не дали результат.
 
Далее экспериментировал с серым вариантом и апскейлом до 400dpi. Ну понятно вроде, что бинаризация в этом случае не влияет ни на что.  
 
3. Эксперименты с ресемплом. Здесь довольно сложно уловить разницу. Дело в том, что она есть, но ошибки разные и приходиться субъективно оценивать количество и качество ошибок просматривая одновременно распознанных несколько страниц.
В целом субъективно наиболее меньше ошибок выдают: Lanczos3/FastLinear/Bicubic. Дают разные ошибки распознавания, на одних страницах одних ошибок больше на других других.
Но путем волевого решения принято, что все таки Lanczos3 дает меньше всего ошибок. Причем дело не  только в ошибках распознавания, но и в том, что FineReader как то красивее оформил текст.
 
4. Далее попытался поэкспериментировать с улучшайзерами: smooth/blur/sharpen. Дают ухудшение распознавания. Хотя с blur долго не мог решить. Вроде бы ошибок меньше и в целом на странице меньше красноты (word), но все таки пришел к выводу, что blur не вариант. Дело в том, что основная проблема с интервалами между букв (возможно для данных конкретных сканов в 200dpi). И больше всего ошибок в том, что слова сливаются в одно слово. С blur таких ошибок меньше, но появляются наоборот разрывы в словах. Но все же ошибок вроде меньше в целом и это бросается в глаза. Однако, как показалось качество распознавания ухудшилось, т.е. настоящих ошибок больше.  
 
Однако улучшайзеры применял раздельно и все со значением 1.
5. Решил проверить пару blur/sharpen. По началу показалось, наконец то нашел то, что искал. Там лучше, там хуже. Не выбор.
Вторая пара smooth/blur. Я бы сказал, что это лучший вариант из всех пока найденных. Явно ошибок меньше. Опять же дело в каких ошибках? Если бы дело заключалось в количестве одних и тех же ошибках. А так одно лечим, другое калечим...
Третья пара smooth/sharpen. Преимуществ не нашел.
 
6. Чем черт не шутит, опробовал связку smooth/blur/sharpe. Ничего хорошего не получил.
 
7. Опробовал blur2/sharpen2. Не наш вариант.
 
8. sharpe со значением 2. Вариант отметается.
blur со значением 2. Все таки не лучший вариант.
 
9. Последнее на что хватило сил: smooth со значением 1 + blur со значением 2. В целом не плохо, и скорее всего ошибок в среднем меньше. Но все таки не мой выбор.  
 
Так, что в поисках чаши грааля, не нашел таковой. Конечно тут все субъективно и в глобальные настройки я не лез в силу неопытности. Одни ошибки характерны для одних настроек, другие для других. Для многих настроек явных фаворитов нет. Так, что линейной зависимости нет и приходится делать усредненный субъективный выбор.  
Типичные ошибки для данной книги:  
- Промежутки между слов - слова либо сливаются, либо слоги расходятся.
- Для некоторых характерно:  
ll распознавать как U.  
е как с.  
l как i
 
Однако учитывая, что на самом деле с ошибками распознавания не так все плохо и беря во внимание их количество/качество/внешний вид распознанного макета в word после распознавания/простоты настроек, мой вариант:
400dpi(удвоение)/Lanczos3/без всяких улучшайзеров.

Всего записей: 1555 | Зарегистр. 29-01-2009 | Отправлено: 12:53 09-06-2016 | Исправлено: BKSRU, 20:22 09-06-2016
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
BKSRU

Цитата:
Рисунок на весь разворот. На развороте достаточно ясная граница раздела, но она не по центру текстовых блоков левой и правой страницы.


Цитата:
http://rgho.st/6FkFfbYD5

Непонятно, какое отношение имеет приведенный пример к к тому, что написано выше. М.б. по ссылке уже обработанный вариант?
Что-то понять здесь можно только по sub-task этого разворота.

Всего записей: 6966 | Зарегистр. 14-01-2005 | Отправлено: 13:59 09-06-2016
BKSRU

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg

Цитата:
Непонятно, какое отношение имеет приведенный пример к к тому, что написано выше. М.б. по ссылке уже обработанный вариант?
Что-то понять здесь можно только по sub-task этого разворота.

Это исходник, так как СК вытащил его из PDF. Наверное до определенной степени обрабатывали. Но сканы не выровнены, мусор не убран. Приведенный пример более менее ровный. Однако он имеет прямое отношение к сказанному выше. Граница ясная. От центра разворота расстояние до текстового блока на левой странице меньше, чем на правой. Не много, но несколько миллиметров есть (миллиметра 3), которые нет желания срезать, но есть желание подравнять поля.
Выровнять по вертикали, а затем разрезать по центру не очень хорошая затея, так как рисунок имеет смещение по вертикали.

Всего записей: 1555 | Зарегистр. 29-01-2009 | Отправлено: 14:06 09-06-2016 | Исправлено: BKSRU, 14:22 09-06-2016
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
BKSRU
Попробовал обработать просто с точки зрения полей. Что получилось не так, как вы хотели?
http://rgho.st/7gBZ2XqJ2
Ваши комментарии насчёт трёх миллиметров, выравнивания, срезания, сдвига и тэ пэ - непонятны. Запутаны. Проще уж так, на примере. Сделал дубль вашего файла, и на каждом настроил необходимые spec.gaps (справа ноль, или слева) и центровку (вправо или авто).

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 17:43 09-06-2016
BKSRU

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
Попробовал обработать просто с точки зрения полей. Что получилось не так, как вы хотели?  

Поля должны быть одинаковы: a = b.

 
Вы же просто разрезали разворот по линии стыка.

Всего записей: 1555 | Зарегистр. 29-01-2009 | Отправлено: 19:17 09-06-2016 | Исправлено: BKSRU, 19:18 09-06-2016
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
BKSRU

Цитата:
Не много, но несколько миллиметров есть (миллиметра 3), которые нет желания срезать, но есть желание подравнять поля.

Вы уверены, что приведенный пример заслуживает такого внимания?
Если Вы его хотите видеть в виде разворота, то в первую очередь стоит подумать о равенстве полей слева и справа, а не выравнивать какие-то миллиметры.
Сравните края текста и рисунка под ним, они совпадают.
Любой сдвиг текста вместе с рисунком в сторону противоположной страницы для выравнивания внутренних полей текста приведет к залезанию рисунка одной стороны на рисунок другой.
На мой взгляд это вообще не тот случай, когда нужно терять время на подобное.
Впрочем если все-таки очень хочется, скопируйте нужный текст сам на себя, затем прежде чем зафиксировать, потащите нужную сторону в нужном направлении на нужное количество миллиметров.

Всего записей: 6966 | Зарегистр. 14-01-2005 | Отправлено: 22:05 09-06-2016 | Исправлено: shch_vg, 02:02 10-06-2016
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Поля должны быть одинаковы: a = b.

Аа, ясно. Ну, разрезать можно и не в точке сдвига рисунка, а на полтора миллиметра правее.  
Только это всё бессмысленно - оригинал должен быть безупречен, в чём я не уверен. Вероятно, оригинал был отсканирован с утратой у корешка (может быть и типографский брак - виднеется вертикальная чёрточка - то есть страница при брошировании согнута не точно посредине, и эти 2-3мм ушли под соседнюю страницу). Надо искать другой оригинал, тут ничего нельзя сделать кроме как оставить белую полосу взамен утраты. Арифметика на пару с симметрией иначе не позволят.
 
А уж сдвигать рисунок относительно текста, то есть нарушать форматирование, вообще дурной тон. ИМХО. Это ничем не вызвано. Да и некрасиво будет, симметрия нарушится больше, чем есть в моём варианте, потому что картинка занимает ведущее смысловое положение по сравнению с текстовыми блоками. Она крупнее, выделяется сильнее, имеет точку вертикальной симметрии (этот самый сдвиг).

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 02:25 10-06-2016
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator / СканКромсатор (Часть 3)
gyra (14-11-2018 10:38): ScanKromsator / СканКромсатор (Часть 4)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru