Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator / СканКромсатор (Часть 3)

Модерирует : gyra, Maz

gyra (14-11-2018 10:38): ScanKromsator / СканКромсатор (Часть 4)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199

   

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ScanKromsator

Знаменитый Кромсатор для обрезки получаемых при сканировании изображений, а также для разделения страниц, очистки от мусора и т.п.  
Автор: bolega. http://bolega.hotmail.ru/.  
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Аналог ScanKromsator - Scan Tailor
 
Начало обсуждения - 1 часть, 2 часть.
 
Текущая версия: ScanKromsator v6.00.5 (2,1 МБ) Настройка внешних утилит  
Предыдущая версия: 5.96.2  (файл sk.exe), утилиты к ней можно взять из v5.96.1  
 
Старые версии: Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон


Подборка ответов bolega про работу ScanKromsator (версия 1.0.1 с закладками и сносками), 2016 г.
 
Хрестоматия материалов про СК , 2017 г.
(25 Mb, для открытия файла chm может потребоваться его разблокировать в свойствах файла, кликнув ПКМ)  
Включает, в том числе:
Видеоуроки про ScanKromsator Подробнее...
 
Обработка пикчур-зон от TelecomUral Подробнее...
 
English texts Подробнее...
 
Что делать, если ScanKromsator не делает то, что хотелось бы... И ещё bolega о том же самом...

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 18:07 30-03-2009 | Исправлено: Maz, 09:43 22-08-2018
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
iMiKED

Цитата:
Если можно эти проблемы решить в текущей версии SK - может кто подскажет как?

Чтобы что-то советовать, надо понимать, что означает
Цитата:
использую SK для раздирания сканированных многостраничных djvuх на отдельные pdfки по документам.

Опишите этот процесс подробно.
 
P.S. Если это то, что я думаю, то никаких этих "ужасов" быть не может.

Всего записей: 6966 | Зарегистр. 14-01-2005 | Отправлено: 15:57 05-03-2014 | Исправлено: shch_vg, 16:01 05-03-2014
iMiKED



Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
shch_vg, окей. Есть сканированная многостраничная djvuха, в которой много, под 100 страниц. Страницы все, как правило, А4 формата, но с различной ориентацией - горизонтальной/вертикальной. Что это за файл - много отдельных документов (смет, расчётов, протоколов), сканированные в один файл. Секретарь засовывает всю пачку документов в сканер и всё сканирует в один файл.
Мне требуется этот файл разодрать на отдельные документы по содержанию, т.е. каждая смета в отдельную pdfку экспортируется, каждый протокол, каждый расчёт. В результате получается штук 20 pdfок.


----------
The GENiUS Team | Jimm aspro Mod | warez.nsk.ru

Всего записей: 305 | Зарегистр. 10-08-2006 | Отправлено: 05:27 06-03-2014 | Исправлено: iMiKED, 05:28 06-03-2014
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
iMiKED
Вы не рассказали главное: что Вы делаете с этим djvu в СК и как в нем получаете pdf (желательно поподробнее).
Пока по Вашему описанию я не вижу никаких проблем.
Если это несекретные данные, то можно привести пример с описанием, в каком виде хотелось бы это получить.

Всего записей: 6966 | Зарегистр. 14-01-2005 | Отправлено: 14:19 06-03-2014 | Исправлено: shch_vg, 14:22 06-03-2014
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
Проблема там на самом деле есть. Когда СК считает размеры, то наличие ландшафтных страниц приводит к завышенному размеру по ширине.
Раньше в СК в special была специальная опция, которая помечала ландшафтные страницы, и тогда для них СК считал размеры особо, т.е. за ширину брал высоту и наоборот. И все было как надо. Это опция и сейчас там есть, но она из всех расчетов убрана, причем лет 5 назад. Видимо, по той причине, что смесь ландшафта и портрета считается дурным тоном: лучше размеры страниц всегда использовать портретные, а текст там будет просто повернут по вертикали.  
Если уж очень захочется, то в постобработке можно повернуть - там есть для этого две спец. кнопки.
Поэтому я бы рекомендовал так: обработать все страницы (т.е. полностью импортировать djvu) в портретном режиме. В постобработке нужные страницы развернуть. Создать out-задание, и в нем сделать pdf. Если нужно несколько pdf, то в out-задании (теперь работаем только с ним) выделять красным нужную группу, задавать имя Pdf, генерировать его (process selected). Потом убирать выделения, выделять следующую группу и т.д.  Мне кажется, так быстрее, чем все время подгружать новую порцию импортированных страниц, долбаться с переключением размеров и т.п.

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 15:10 06-03-2014
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
Достаточно много делаю pdf из сканов, причем попадаются сканы-развороты (как я понимаю, аналог ландшафтных?), но никаких проблем с этим я не имею.
Поэтому и уточнял процесс обработки в СК.
Я бы просто разобрал djvu в СК на сканы, в этом же задании пометил все сканы через правую из четырех кнопок слева внизу, если нужно, развернул бы повернутые страницы (для этого хватает параметра Potate angle на закладке Page), а потом без использования out-задания выделением нужных для конкретного pdf страниц, создавал бы их.
Если же после извлечения сканов из djvu нужно навести еще дополнительный марафет, то это тоже можно сделать в рамках этого же задания, но в этом случае уже можно использовать out-задание.

Всего записей: 6966 | Зарегистр. 14-01-2005 | Отправлено: 17:02 06-03-2014 | Исправлено: shch_vg, 17:04 06-03-2014
dvkkk

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Добрый день, уважаемые форумчане.
Подскажите пож. какие настройки нужно выставить в СканКромсатор-е v 5.91
чтобы удалить серый фон для дальнейшего корректного распознавания текста?
Пример фото прилагаю:
http://rghost.ru/private/52860916/da7ac47729e41ecc4cd079076f9581f7
Заранее благодарен

Всего записей: 40 | Зарегистр. 22-11-2007 | Отправлено: 17:26 06-03-2014
Torino



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Подскажите пож. какие настройки нужно выставить в СканКромсатор-е v 5.91  

Gray enhance -> Background cleaner -> Enable

Всего записей: 412 | Зарегистр. 20-09-2005 | Отправлено: 17:48 06-03-2014
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
dvkkk
Для дальнейшего корректного распознавания текста в данном случае недостаточно удалить серый фон (т.е. бинаризовать скан). Гораздо сложнее будет исправить кривизну текста по бокам скана. В этом деле СК Вам не помощник.

Всего записей: 6966 | Зарегистр. 14-01-2005 | Отправлено: 21:42 06-03-2014 | Исправлено: shch_vg, 22:16 06-03-2014
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg

Цитата:
 причем попадаются сканы-развороты (как я понимаю, аналог ландшафтных

Нет, Вы не поняли. Речь идет о том, что человек хочет на _выходе_ оставить файлы в разной ориентации. Для книг так обычно никогда не делают, т.к. это смотрится неэстетично. Для всяких финансовых документов - наоборот, довольно распространенный случай. По себе знаю
 
Torino

Цитата:
Gray enhance -> Background cleaner -> Enable

Я бы рекомендовал Correct illumination, method=safe. Я кстати только им пользуюсь. Все остальные методы могут повреждать крупные черные буквы и прочие черные "жирные" иллюстрации (делают дырки)

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 21:59 06-03-2014
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega

Цитата:
Речь идет о том, что человек хочет на _выходе_ оставить файлы в разной ориентации.

Тогда я действительно не понимаю, в чем проблема.
Сделать импорт дежавю, пометить все сканы, выделить относящиеся к одному пдф, а потом создать его.
Или я опять что-то не понимаю?

Всего записей: 6966 | Зарегистр. 14-01-2005 | Отправлено: 22:20 06-03-2014
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
Возьмем для простоты две страницы. После обработки 1-я имеет размер 100Х200 (портрет), 2-я - 200х100 (ландшафт). СК будет считать размер книги и получит 200х200, т.к. грубо говоря, придется складывать ширину с высотой. Раньше в СК была опция, которая предписывала ему при расчете размеров книги для ландшафтных (на выходе!) страниц размеры брать наоборот: использовать высоту вместо ширины и ширину вместо высоты. Тогда размер книги был бы правильный: 100х200.  
Гы: продвинутая секретарша - сканирует в djvu. Где таких готовят?
У меня на работе секретарши делаю все проще: сканят сразу в pdf, потом нужные страницы переводят в ландшафт с помощью Acrobata Prof.

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 22:28 06-03-2014 | Исправлено: bolega, 22:35 06-03-2014
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
Это все понятно, но работает только при обработке в СК сканов в режиме automargins. Я же предлагаю перевод дежавю в сканы и сразу же сканы в пдф.
В этом случае размеры будут равны размерам в дежавю.
Или уже в дежавю они имеют кривые размеры?
 
Кстати, вроде бы есть возможность для развернутых страниц указать, чтобы они не участвовали в формировании размера страницы в варианте automargins.

Всего записей: 6966 | Зарегистр. 14-01-2005 | Отправлено: 00:01 07-03-2014 | Исправлено: shch_vg, 00:05 07-03-2014
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
Человек писал, что ему нужно равнять размеры страниц. Трудно судить, насколько это критично. Но если так, то все Ваши варианты  не годятся. Исключить из формирования размера можно, но тогда и их размеры останутся неприведенными

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 08:12 07-03-2014
Gazoved

Junior Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Повторюсь.
 
Может кто-нибудь посоветовать как обработать такие сканы:

Оригинал скана  - http://rusfolder.com/40013998
 
Проблема в том, что фоном идет картинки, которую хочется оставить.
 
bolega
И все-таки есть ли возможность из всех страниц скопом вырезать один и тот же элемент ну или как я писал выше "скопировать выделение Picture Zone на все страницы пакета"?
 
Еще вопрос, возможно ли при обработке сразу бороться  и с черными спеклами и с белыми "дырками" Почему-то не получается приходится делать 2 задания, в одном бинаризовать и удалять черные спеклы, а  во втором удалять белые "дырки".
 
Еще проблема при обработке. Берется изображение, инвертируется (инверсия цветов), далее бинаризуется и необходима обратно инвертировать, вопрос, возможно ли второе инвертирование сделать не правым кликом по странице special - Invert, а для всех страниц скопом?

Всего записей: 111 | Зарегистр. 03-05-2006 | Отправлено: 12:50 07-03-2014
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Gazoved
Попробуйте обработать в цвете в 300dpi.
Для сохранения целостности фонового рисунка придется обрабатывать разворотами, что потребует более аккуратного сканирования.

Всего записей: 6966 | Зарегистр. 14-01-2005 | Отправлено: 15:51 07-03-2014 | Исправлено: shch_vg, 15:54 07-03-2014
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Gazoved
 
Ну, я бы как-то так делал. Это без СК.  (ST+DEE+XnView+FSD)
http://rghost.ru/52884177
В СК тут надо будет вручную повозиться там, где в буквах перемычки пропадают.
В пдф это потом можно будет перегнать с помощью Adobe InDesign.
 
PS
Может, для спасения перемычек поможет в самом начале приподнять контрастность Фотошопом.  
Но это надо экспериментировать, а мне некогда.
(Это лишь пример, если не сутки возиться, а за 5 минут по-быстренькому сделать. Идея только.)
Ну и всю книгу, конечно, надо видеть.

Всего записей: 1014 | Зарегистр. 13-06-2013 | Отправлено: 16:02 07-03-2014 | Исправлено: daa2013, 21:06 07-03-2014
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013
В вашем примере не увидел вообще никакой обработки, эффект такой же, как просто загнали скан в djvu стандартным профилем: перемычки, краешки букв, да и не только, ушли в фон. Вторая страница обрезана справа
 
Gazoved
 
В СК можно как-то так: http://rusfolder.com/40057732
Если кратко, то для сохранения фона текста в СК используется такой метод: создается зона, в которой clear source area отключен. dpi зоны желательно сделать равным dpi самой страницы, т.е. 600. Понизить его нужно уже при создании djvu. После обработки переключиться в режим Zones и в контекстном меню зоны дать команду Get transparency mask from image. Потом Files->Create out-task, в out-task Tools->create djvu и т.д. Прочие обработки опускаю, это уже детали.
Описанный метод сохранения фона прокатывает, если фон - не яркий и при бинаризации исчезает. Если фон - темный, то так уже не получится.
 
Добавлено:
daa2013

Цитата:
В СК тут надо будет вручную повозиться там, где в буквах перемычки пропадают.

Это у вас в ST пропадают. В СК ничего не пропадает. Не пишите того, чего не знаете. Смешно слышать советы по СК от очередного адепта СТ. Вы случаем форум не перепутали?

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 22:25 07-03-2014
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Ну, круто, чо.
Век живи, век учись.

Всего записей: 1014 | Зарегистр. 13-06-2013 | Отправлено: 02:20 08-03-2014
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega

Цитата:
В СК можно как-то так

Вот если бы не на словах, а в task.rar...

Всего записей: 6966 | Зарегистр. 14-01-2005 | Отправлено: 13:49 08-03-2014
Gazoved

Junior Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega, присоединяюсь к shch_vg, не  могли бы приложить задание, чтобы можно было повторить. Спасибо за Ваши советы.

Всего записей: 111 | Зарегистр. 03-05-2006 | Отправлено: 14:00 08-03-2014 | Исправлено: Gazoved, 14:01 08-03-2014
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator / СканКромсатор (Часть 3)
gyra (14-11-2018 10:38): ScanKromsator / СканКромсатор (Часть 4)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru