Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Закладки » ScanKromsator / СканКромсатор (Часть 3)

Модерирует : gyra, Maz

gyra (14-11-2018 10:38): ScanKromsator / СканКромсатор (Часть 4)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199

   

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ScanKromsator

Знаменитый Кромсатор для обрезки получаемых при сканировании изображений, а также для разделения страниц, очистки от мусора и т.п.  
Автор: bolega. http://bolega.hotmail.ru/.  
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Аналог ScanKromsator - Scan Tailor
 
Начало обсуждения - 1 часть, 2 часть.
 
Текущая версия: ScanKromsator v6.00.5 (2,1 МБ) Настройка внешних утилит  
Предыдущая версия: 5.96.2  (файл sk.exe), утилиты к ней можно взять из v5.96.1  
 
Старые версии: Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон


Подборка ответов bolega про работу ScanKromsator (версия 1.0.1 с закладками и сносками), 2016 г.
 
Хрестоматия материалов про СК , 2017 г.
(25 Mb, для открытия файла chm может потребоваться его разблокировать в свойствах файла, кликнув ПКМ)  
Включает, в том числе:
Видеоуроки про ScanKromsator Подробнее...
 
Обработка пикчур-зон от TelecomUral Подробнее...
 
English texts Подробнее...
 
Что делать, если ScanKromsator не делает то, что хотелось бы... И ещё bolega о том же самом...

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 18:07 30-03-2009 | Исправлено: Maz, 09:43 22-08-2018
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Подумал, а может быть в текущей версии есть какая-то возможность очистить фон цветного скана до бела?
Никак не получается - Illumination Correction все выравнивает до 248,248,248, а дальше - ни в какую

----------
пропадет-растает

Всего записей: 6808 | Зарегистр. 21-09-2002 | Отправлено: 16:19 10-04-2009
realwhistle

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ghosty  
 
посоветуйте пожалуйста как делать греческие тексты.. действительно ли лучше в сером? или ч/б сканировать?  и какие настройки выставлять для серого..  ибо не понимаю что за что отвечает...
 
+ ещё один вопрос, как настраивать во сколки см от текста кромсатор обрезает страницу? и что значит розовая полоса, вместо синий?

Всего записей: 13 | Зарегистр. 08-04-2009 | Отправлено: 16:23 10-04-2009
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
realwhistle
Очень Вас прошу, прочитайте мою "Самую краткую инструкцию" из шапки - она действительно очень невелика, и там ответы на все Ваши вопросы. Если после прочтения вопросы останутся/появятся новые, обязательно задавайте, не стесняйтесь.
Еще раз скажу: то, что обрабатывали Вы, обработано очень хорошо. С греческими символами, особенно напечатанными курсивом, может быть очень много проблем при обработке, а у Вас все чисто (не то, что у руководителя ).
 
Добавлено:
bolega, сдаюсь Помогите, пожалуйста:
http://rapidshare.com/files/219664907/test.rar
Необходимо очистить фон до белого - никакие параметры обработки не помогают (постобработкой - долго). Спасибо.

----------
пропадет-растает

Всего записей: 6808 | Зарегистр. 21-09-2002 | Отправлено: 16:37 10-04-2009 | Исправлено: ghosty, 16:37 10-04-2009
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ghosty

Цитата:
Необходимо очистить фон до белого

Причина здесь в том, что выходной формат задан 4-битным. При уменьшении кол-ва цветов идет автоматический подбор палитры, максимально близкой к исходным 24-битным цветам. Отсюда и получился 248. И постобработка не поможет: при сохранении кромсатору негде будет хранить цвет 255, палитра то уже заполнена оптимальными цветами, и еще один цвет добавлять некуда, поэтому 255 снова станет 248.
Кстати, если поставить 8-битный формат, то получится уже 251. Неужели это для Вас так важно? В крайнем случае можете отмазаться, мол, это не цвет не белый, а монитор давно не мытый
 
А в принципе для забеления фона можно воспользоваться опцией histogram из grey enhance, но здесь это из-за палитры не поможет.

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 18:30 10-04-2009 | Исправлено: bolega, 18:31 10-04-2009
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
Отсюда и получился 248. И постобработка не поможет: при сохранении кромсатору негде будет хранить цвет 255, палитра то уже заполнена оптимальными цветами, и еще один цвет добавлять некуда, поэтому 255 снова станет 248.
Да, я об этом догадывался. Но, с одной стороны, и если поставить 24-bit, то выбеливание невозможно, а, с другой стороны, может быть, можно как-то редактировать палитру? Почему, к примеру, СК подумал, что оптимальным цветом для фона будет именно 248?
На самом деле, я все о том же (выше был лишь пример) - об облегчении обработки цветных сканов - в тех случаях, когда выделение зон невозможно/сложно. Т.е. для зон уже есть функция замены цвета фона с определением порога, и я ищу аналог этой функции среди параметров обработки книги...

----------
пропадет-растает

Всего записей: 6808 | Зарегистр. 21-09-2002 | Отправлено: 18:44 10-04-2009
realwhistle

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ghosty
 
спасибо, в прошлый праз не поняла где читать)) (скачала всю програмку и потеряла её в компе..) теперь немного разобралась с обрезкой...  
 
Но в вашей инструкции нет ничего про настройки обрботки. перевода из грейскейла в ч/б, какой лучше загружать и чего выставлять в "Sharpen", ""Blur" и т.д...  
 
еще есть проблема того что все, где текст не на полную страницу он мне его как-то преобразовывает что, если в верху две строки, они оказываются внизу(( при этому страница целая...  (у вас что-то про это говориться, но я недопоняла.. тот ли это случай, она ведь не обрезает чтоб маленькая была)
 
+ сейчас отсканировала старую книгу (1917г)  делала 600 dpi в градации серого.. но при прогонке через кромсатор, там где буквы на бумаге нормально пропечатанны, сдела как будто оч плохо, кусками отсутствуют..  
 
 http://files.mail.ru/7LK331 (на ней заодно и перенос видно)
http://files.mail.ru/24VYM7 (серый оригинал)

Всего записей: 13 | Зарегистр. 08-04-2009 | Отправлено: 00:56 11-04-2009
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
realwhistle

Цитата:
Но в вашей инструкции нет ничего про настройки обрботки. перевода из грейскейла в ч/б, какой лучше загружать и чего выставлять в "Sharpen", ""Blur" и т.д...  
Вы невнимательно читали инструкцию. Там сказано, что она работает с моей 'сборкой', в которой все уже выставлено - и "Sharpen", и "Blur", и все остальное. Для 60-70% современных книг этот профиль вполне подходит - возможно, необходимо будет выставить только порог бинаризации (закладка "Convert") в том случае, если текст будет слишком бледным или слишком жирным. Для той страницы, которую Вы приводите в качестве примера, необходимо увеличить этот порог (однако в данном случае и этого мало - см. ниже).
 

Цитата:
еще есть проблема того что все, где текст не на полную страницу он мне его как-то преобразовывает что, если в верху две строки, они оказываются внизу(( при этому страница целая...  (у вас что-то про это говориться, но я недопоняла.. тот ли это случай, она ведь не обрезает чтоб маленькая была)
Две строчки вверху никак не могут оказаться снизу, если Вы сами не выставили (возможно, случайно) выравнивание блока текста по нижней кромке страницы (закладка Page->Page v. Align = B). В моем профиле это значение - А, что означает выравнивание по верхней кромке. Это хорошо для большинства страниц, кроме тех, на которых текст начинается, к примеру, с середины страницы (начало главы). Для таких страниц, к сожалению, вручную придется выставлять В. Делается это обычно в ходе проверки правильности расстановки резаков.
 

Цитата:
+ сейчас отсканировала старую книгу (1917г)  делала 600 dpi в градации серого.. но при прогонке через кромсатор, там где буквы на бумаге нормально пропечатанны, сдела как будто оч плохо, кусками отсутствуют..  
Эк Вы от греческого текста да к старым книгам сразу - это же все самый трудный материал для обработки. Потренируйтесь сначала на современных. Можно поинтересоваться, что за книжка, кстати? Это оригинал или репринт?
 
К счастью,  и для старых книг в моей сборке Вы найдете специальный профиль - OLD_BOOKS Вы можете сменить профиль в File->Profiles.  
В случае с профилем, используемым по умолчанию (DEFAULT) от Вас требовалось настроить только порог бинаризации. В данном случае если изменение этого параметра не поможет, придется повозиться с настройками выравнивания освещения (Quality->Grey Enhance->Illumination) - будут пропадать плохо пропечатанные элементы символов, уменьшите значение, начнет появляться мусор, увеличьте.
Если все это покажется сложным поначалу, отложите эту книжку, обработайте пока современную. Если ее небходимо обработать срочно, а мои советы не помогли, дайте побольше страниц (около 20-ти), и я составлю профиль под эту книгу.

----------
пропадет-растает

Всего записей: 6808 | Зарегистр. 21-09-2002 | Отправлено: 01:58 11-04-2009 | Исправлено: ghosty, 02:39 13-04-2009
realwhistle

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ghosty
 
спасибо большое за ответы))) к сожалению нет возможности тренироваться.. какие книги дают - те и обрабатываю(( работа такая),  большинство идет либо греческие, либо старые (одна была 1880 года.. ппц какой-то.. страшно было прикасаться..)  редко современные(  
 
скачаю ваш кромсатор и попробую ваши настройки.. если что - напишу) ещё раз большое спасибо за помощь)
 
Добавлено:
ghosty  
 
забыла написать что за книжка) Христианский восток. Серия посвещенная изучению христианской культуры народов африки и азии (издание российской академии наук петроград. оригинал)  
 
Добавлено:
ghosty
 
скачала Ваш кромсатор.. может я дура конечно.. но не поняла с профилями((по моему ничего не меняется вообще(( или я просто не активировала.. File->Profiles в появившемся окошке выбираю OLD_BOOKS и нажимаю значек Apply, затем галочка All marks (выбираю профиль после Draft Kromsate) правильно? у меня ничего не меняется и если зайти в профили, то там опять будет старый профиль выбран...  
 
ужас какой-то, а сегодня должна была уже сдать.. но как-то всё проблемно(( за какую книгу не возьмусь из 5... всё не так получается(((
 
Добавлено:
ghosty
 
ещё, сначала для ч/б использовала следущие настройки : http://files.mail.ru/CI3RRP
 при них все обрезались ровно, а теперь даже с ручным выравниваем почему-то режет а бы как((  а одну книгу вообще посередине текста режет(( и ни мои ручные, ни фиксированный размер ничего не помогает... может можно вообще убрать обрезание (я лучше в FR в ручную это сделаю.. хотя и времени на это нет..)

Всего записей: 13 | Зарегистр. 08-04-2009 | Отправлено: 01:26 13-04-2009
Torino



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
>>Bolega
я все со своими тараканами ))
 
Сильно не хватает функции, про которую я писал раньше:
полная очистка изображения за пределами textbox перед финализацией.
 
Или как вариант - Crop по textbox перед финализацией.

Всего записей: 412 | Зарегистр. 20-09-2005 | Отправлено: 20:56 13-04-2009 | Исправлено: Torino, 17:05 14-04-2009
realwhistle

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ghosty
 
у меня таки заработал Ваш профиль OLD_BOOKS, но ужасжно сделал((((
http://files.mail.ru/85IHEK
хотя книга хорошая и поновее немного.. 1926..  вот... в общем совсем расстроилась((

Всего записей: 13 | Зарегистр. 08-04-2009 | Отправлено: 04:58 14-04-2009
Gazoved

Junior Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
Я поддерживаю Torino

Цитата:
Сильно не хватает функции...полная очистка изображения за пределами textbox перед финализацией.

Например, страницы криво лежали, а расставляьть резаки под углами - долго, а так, удалил весь мусор за пределами и да будет нам счастье. обрабатывать в 2 этапа, т.е. 0 поля, а потом уже нормальные - долго получается.
 
Да прошу прощения за то, что в свое время не ответил на Ваш вопрос (срочно уезжал в экспедицию в Сибирь на 3 недели), по преобразованию в b/w, как-то позже само все устранилось, точнее я просто привык делать все сразу.
 
Вот какой вопрос еще, иногда бывает такая ситуация, когда после DK и Process, не возможно посчитать размер книги, т.е. менюшка открывается, а реально ничего посчтать не возможно, просо кнопка "Ok" не доступна, где крыжики не расставляй приходится заново прогонять, акое бывает периодически и как продолжить из этого момента я не знаю. Это происходит примерно 1 раз из 20

Всего записей: 111 | Зарегистр. 03-05-2006 | Отправлено: 09:20 14-04-2009 | Исправлено: Gazoved, 09:25 14-04-2009
alexsk777

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
realwhistle
Отключите Quality -> Gray Enhance -> Contrast -> Auto-levels (снимите птичку)
И попробуйте Quality -> Gray Enhance -> Gamma поставить значение гаммы, например, 2.
Не забывайте что эти настройки действуют только на текущую страницу если не нажать Ctrl.

Всего записей: 9 | Зарегистр. 05-05-2007 | Отправлено: 13:24 14-04-2009
realwhistle

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
alexsk777
 
 
Ctrl? никогда его не  нажимала... черт...

Всего записей: 13 | Зарегистр. 08-04-2009 | Отправлено: 13:36 14-04-2009
Torino



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Можно еще Alt прижать (без Ctrl) - даже интересней будет  ))

Всего записей: 412 | Зарегистр. 20-09-2005 | Отправлено: 13:38 14-04-2009
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
realwhistle
Профили - это всего лишь наборы таких параметров обработки, которые с большей вероятностью применимы для того или иного типа книг.
Профиль по умолчанию, по моим оценкам, подходит для 50-60% новых книг и для 80-90% (так же новых книг) - при настройке порога бинаризации.
Настройки профиля OLD_BOOKS подходят примерно для 20-40% старых книг. При условии установки параметров бинаризации и коррекции освещения для конкретной книги этот же профиль подойдет для 50-60% старых книг. Почему такой низкий процент? Потому что специфика старых книг состоит в следующем:
1) Для них приходится подбирать такой набор параметров, который сработает для большей части всех обрабатываемых страниц. В самом удачном случае это будет около ~70% страниц, в самом неудачном - чуть больше половины. Соответственно для всех остальных страниц приходится использовать другой набор параметров. Т.е. завершили первый "прогон" обработки, в режиме просмотра проверяем правильность обработки. Если видим, что какая-то страница обработана неудачно, нажимаем F2 (в списке файлов она помечается красным). Таким образом у нас формируется еще одна группа страниц для обработки. Устанавливаем параметры теперь уже для этой группы и выбираем в меню Process->Group->Process Selected.  
2) Процесс обработки старых книг, как правило, не ограничивается только автоматической обработкой - потребуется также и, подчас кропотливый, ручной труд (как на этапе предобработки, так и на этапе постобработки).
Вот, это как бы совсем вкратце
 
Кстати, Вы помните, что эти профили составлены под сырые сканы 300dpi в полутонах серого?
 
 
alexsk777

Цитата:
Отключите Quality -> Gray Enhance -> Contrast -> Auto-levels (снимите птичку)  
И попробуйте Quality -> Gray Enhance -> Gamma поставить значение гаммы, например, 2.
Вы же не видели книжку целиком, как Вы можете советовать?


----------
пропадет-растает

Всего записей: 6808 | Зарегистр. 21-09-2002 | Отправлено: 15:10 14-04-2009 | Исправлено: ghosty, 15:58 14-04-2009
alexsk777

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ghosty

Цитата:
Вы же не видели книжку целиком, как Вы можете советовать?

Я видел обработанную часть в pdf - этого достаточно. И в этой книге 26г и в той страничке из книги 17г из-за автоуровней пропадают части символов. Нужно использовать ручные настройки. Автоуровни на малоконтрастных сканах зачастую так смещают гистограмму что при бинаризации светлые части текста попадают выше порога и пропадают.

Всего записей: 9 | Зарегистр. 05-05-2007 | Отправлено: 17:19 14-04-2009
Torino



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Из моего опыта: светлые участки текста при использовании gray enhance, можно сохранить, сняв галку ignore light pixels на вкладке backgroudn cleaner.

Всего записей: 412 | Зарегистр. 20-09-2005 | Отправлено: 19:25 14-04-2009
realwhistle

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ghosty
я на 400 dpi  сканирую... 300-ам не доверяю..  некоторые даже на 600, совсем старые или греческий...

Всего записей: 13 | Зарегистр. 08-04-2009 | Отправлено: 05:37 15-04-2009
Gazoved

Junior Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Вопрос такой, знает ли кто-нибудь, возможно ли повернуть Picture zone если она выделена прямоугольником, или наклонные картинки можно выделить только ломаной?

Всего записей: 111 | Зарегистр. 03-05-2006 | Отправлено: 19:15 15-04-2009
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Gazoved
Зоны поворачиваются при deskew на такой же угол, что и вся страница. Форма зоны здесь роли не играет. Координаты вершин после поворота пересчитываются. И вот здесь форма имеет значение: прямоугольные зоны становятся несколько больше (за счет того, что при повороте они уже превращаются в наклонные прямоугольники, СК как бы создает новую прямоуг. зону, в которую вписан повернутый, и поэтому габариты зоны становятся больше). Непрямоугольные же зоны габариты не меняют.

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 08:57 16-04-2009
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199

Компьютерный форум Ru.Board » Компьютеры » Программы » Закладки » ScanKromsator / СканКромсатор (Часть 3)
gyra (14-11-2018 10:38): ScanKromsator / СканКромсатор (Часть 4)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru