Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Закладки » ScanKromsator / СканКромсатор (Часть 3)

Модерирует : gyra, Maz

gyra (14-11-2018 10:38): ScanKromsator / СканКромсатор (Часть 4)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199

   

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ScanKromsator

Знаменитый Кромсатор для обрезки получаемых при сканировании изображений, а также для разделения страниц, очистки от мусора и т.п.  
Автор: bolega. http://bolega.hotmail.ru/.  
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Аналог ScanKromsator - Scan Tailor
 
Начало обсуждения - 1 часть, 2 часть.
 
Текущая версия: ScanKromsator v6.00.5 (2,1 МБ) Настройка внешних утилит  
Предыдущая версия: 5.96.2  (файл sk.exe), утилиты к ней можно взять из v5.96.1  
 
Старые версии: Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон


Подборка ответов bolega про работу ScanKromsator (версия 1.0.1 с закладками и сносками), 2016 г.
 
Хрестоматия материалов про СК , 2017 г.
(25 Mb, для открытия файла chm может потребоваться его разблокировать в свойствах файла, кликнув ПКМ)  
Включает, в том числе:
Видеоуроки про ScanKromsator Подробнее...
 
Обработка пикчур-зон от TelecomUral Подробнее...
 
English texts Подробнее...
 
Что делать, если ScanKromsator не делает то, что хотелось бы... И ещё bolega о том же самом...

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 18:07 30-03-2009 | Исправлено: Maz, 09:43 22-08-2018
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
qazazel

Цитата:
А что стало со вкладкой denoise?

Нет ее больше...
Вместо нее можно использовать smart blur. Параметры sb по умолчанию "нежные". Если нужно большее сглаживание, нужно увеличивать радиус до 7-8, одновременно уменьшая порог threshold до 10-20 (чтобы не размыть края букв). Степень размытия также регулируется параметром Strength.
Кстати, smart blur прекрасно давит артефакты jpg.

Всего записей: 4432 | Зарегистр. 09-09-2002 | Отправлено: 12:48 30-12-2010
ILHS

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Как можно убрать засечки между букв? Вся книга в таком виде. Есть решение?

Всего записей: 610 | Зарегистр. 06-12-2004 | Отправлено: 10:55 31-12-2010 | Исправлено: ILHS, 11:04 31-12-2010
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ILHS
Кардинального решения до сих пор предложено не было, если правильно помню. В СК можно попробовать увеличить размер спекла (File->Options->Processing). В ходе обработки все засечки все равно удалить не удастся, поэтому на этапе постобработки в режиме Results View придется удалять в полуавтоматическом режиме Mouse-Up Despeckle. Параметры этого режима (размер спекла) можно изменить, вызвав контекстное меню и выбрав Clear Options. Также может помочь опция подсветки спеклов (Highlight speckles). (Можете посмотреть мои мультики о постобработке в СК из шапки).
 
Сейчас в нашем распоряжении появилась довольно мощная программка для обработки ЧБ сканов - ScanFix. В ней есть много разных методов очистки и способов задать размер и форму засечек. Например, в Вашем скане это в большинстве своем вертикальные линии, толщина которых меньше толщины символов. Можете поэкспериментировать.
 
P.S. Всех с Новым годом! Желаю, чтобы было больше хороших книг и времени на их чтение

Всего записей: 6808 | Зарегистр. 21-09-2002 | Отправлено: 13:07 31-12-2010 | Исправлено: ghosty, 13:17 31-12-2010
LVitek



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
как убрать эти полосы?

Всем спасибо за помощ,все свободны.

Всего записей: 48 | Зарегистр. 22-10-2005 | Отправлено: 18:25 01-01-2011
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
kimserge
Вручную выделять цветные зоны, наверное, будет довольно трудно. У Arcand'a, вроде, был неплохой кореловский скрипт для автоматической обработки текста с цветными словами. Спросите в топике по обработке.
 
bolega
А алгоритм автоматического выделения цветного текста в рамки очень сложен?
 
LVitek

Цитата:
Всем спасибо за помощ,все свободны.
Последствия бурного празднования? Вообще-то, здесь никто никому не обязан. Тем более никто не обязан скачивать 260-меговую книгу только для того, чтобы узнать, действительно ли на некоторых страницах получаются красные полосы. Что за издевательство?
 
 

Всего записей: 6808 | Зарегистр. 21-09-2002 | Отправлено: 19:54 01-01-2011 | Исправлено: ghosty, 00:09 02-01-2011
BlackBerry

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Как обработать ScanKromsator'ом файл
 
http://depositfiles.com/files/fb248g9od             62Mb
 
То что большие черные поля не главное. ScanKromsator определяет разрешение 72dpi ,хотя она выше.
Поэтому обработка ухудшает качество книги.

Всего записей: 196 | Зарегистр. 08-09-2004 | Отправлено: 20:55 18-01-2011
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
BlackBerry

Цитата:
ScanKromsator определяет разрешение 72dpi ,хотя она выше

СК указывает то, что стоит в файле.
Найдите djvu любой книги примерно такого же размера и посмотрите, какие в ней dpi и размеры в пикселях.
Возьмите размеры своей книги в пикселях (из СК) и с помощью пропорций вычислите примерно правильный dpi своей книги. Затем в СК через меню Tools->Correct DPI... проставьте это (или ближайшее красивое ) значение всем страницам.
 
P.S. Думаю, что желающих качать 62 мб нашлось мало, по крайней мере я этого не делал. Можно было выложить одну страницу после СК.

Всего записей: 6970 | Зарегистр. 14-01-2005 | Отправлено: 13:38 19-01-2011
BlackBerry

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg

Цитата:
Думаю, что желающих качать 62 мб нашлось мало, по крайней мере я этого не делал. Можно было выложить одну страницу после СК.

 
Выкладываю страницу до и после СК:
 
http://ifile.it/cag81un/SK_Problem.rar
 
ScanKromsator v5.93

Всего записей: 196 | Зарегистр. 08-09-2004 | Отправлено: 16:17 19-01-2011 | Исправлено: BlackBerry, 16:17 19-01-2011
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
BlackBerry
Каким образом получен скан Befor_SK.tif?
Вытащен из pdf в СК?
Или другим способом?

Всего записей: 6970 | Зарегистр. 14-01-2005 | Отправлено: 18:13 19-01-2011
BlackBerry

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
 

Цитата:
Вытащен из pdf в СК?

 
Да. Загружен СК через импорт PDF и записан в каталог Tempsk.
 

Всего записей: 196 | Зарегистр. 08-09-2004 | Отправлено: 19:32 19-01-2011
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
BlackBerry
Сравнение выложенного Вами скана с аналогичными, но с правильным значением dpi, показывает, что Ваш был сделан, по-видимому, в 150dpi. Сканы с таким dpi обрабатываются довольно плохо, придется тщательно подбирать параметры обработки в СК, чтобы получить какой-нибудь мало-мальски читаемый вариант.
Так что меняйте у всех сканов dpi на 150 и пробуйте подобрать эти параметры, т.к. значения по умолчанию заведомо будут недостаточны.
Для начала попробуйте обработать один разворот, выбрав на закладке Binarization значение Auto, но потом его через значение Custom придется увеличивать. Есть и другие дополнительные методы улучшения, но это долго объяснять, да и у каждого они свои.
Судя по скану делался он с помощью фотоаппарата, отсюда такой dpi.
У букв тонкие перемычки, так что сохранить их будет довольно трудно.
Сделал примерную обработку этого скана, посмотреть результат можно здесь.

Всего записей: 6970 | Зарегистр. 14-01-2005 | Отправлено: 21:53 19-01-2011 | Исправлено: shch_vg, 21:54 19-01-2011
BlackBerry

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
Спасибо за внимание и потраченное время.

Всего записей: 196 | Зарегистр. 08-09-2004 | Отправлено: 18:44 20-01-2011 | Исправлено: BlackBerry, 18:45 20-01-2011
kalyambus



Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
От каких параметров исходного изображения зависит скорость обработки ScanKromsator'ом? Мне нужно было переконвертировать несколько электронных книг. Были книги в форматах pdf, djvu, многостраничные tiff, разрешение от 150 до 600 dpi. Всё конвертировал в djvu 600 dpi для улучшения читаемости, кое где просто делал обрезку. Но попалась книга (исходник djvu 300 dpi) на которой кромсатор почти зависает, импорт с djvu происходит неимоверно долго, драфт около 30 сек на страницу, об обработке я вообще молчу. Странно то что книга, при 300 dpi имеет разрешение разворота примерно 6000х5000. Прикреплю несколько страниц книги, может кто поможет разобраться что за странный djvu?

Всего записей: 7 | Зарегистр. 08-09-2007 | Отправлено: 12:46 22-01-2011
NAATH

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
kalyambus
у меня вот так получилось (можно было еще подчистить):
Название: test.o.pdf  
Размер: 86.67KB
http://multi-up.com/417289
 
сперва распечатал в PDF, потом в LuraDocument PDF Compressor Desktop - ужал в Ч/Б, потом почистил Кромсатором, - и снова ужал. Было 422Кб djvu, а стало 87Кб pdf.

Всего записей: 816 | Зарегистр. 20-11-2008 | Отправлено: 13:15 22-01-2011 | Исправлено: NAATH, 13:19 22-01-2011
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Возню с созданием djvu из-под СК закончил. Больше всего хлопот доставили раскрашенные зоны. В итоге сделал так, что СК сам формирует raw-чанк FGbz. От использования djvulibre для этого отказался, т.к. в некоторых случаях он оказался бессилен, и главное, его результат был заранее непредсказуем. При обработке раскрашенных зон СК извлекает и декодирует sjbz чанк (полученный кодированием текста в DEE) и проверяет на возможность его (точнее, составляющих его блитов) правильной раскраски чанком FGbz. Зоны при этом могут быть любыми, включая непрямоугольные и перкрывающие друг друга (напр., когда одна раскрашенная зона лежит целиком внутри другой). Если в результате анализа СК выясняет, что раскраска с помощью FGbz невозможна (напр., блиты с разными цветами соприкасаются или вообще включены в разные зоны - такое как оказалось бывает!), она выполняется тогда с помощью чанка FG44. Все это естественно делается быстро и на полном автомате.
 
Решил также очень большую проблему, возникающую при кодировании зон методом подклейки фона, а именно, когда размеры страницы (tif-файла) не кратны соотношению dpi зоны и страницы (это соотношение обычно составляет 1..12) . Это довольно таки частая ситуация. В программе monday2000 в этом случае выдается сообщение о невозможности кодирования. Я нашел, как легко обойти эту проблему (без изменения размера файлов и без перекодирования переднего слоя): СК просто делает небольшую шаманскую модификацию sjbz-чанка. При этом перекодировать маску-передний план (в DEE) не требуется, также как и не требуется физическое изменение размеров тиф-файла. В идеале, конечно, размеры исходных тифов изначально должны быть кратны упомянутому соотношению, но это не всегда можно выполнить, тем более это соотношение не всегда заранее известно.
 
Кстати, в процессе отладки мне пришлось написать свой native-просмотрщик блитов словаря djvu.
 
Добавлено:
kalyambus

Цитата:
при 300 dpi имеет разрешение разворота примерно 6000х5000

Проблема в том, что это неправильное dpi. На самом деле это не 300, а 600 dpi. Поэтому и СК так долго у Вас работает и обрабатывает: ведь он удваивает разрешение (якобы 300) до реальных 1200! Чтобы решить проблему, после импорта на закладке Files задайте в поле Input dpi=300 и снимите там галку с "only for uknown dpi". В этом случае СК будет брать dpi отсюда, а не из файлов.
 
Добавлено:
Тут недавно обратили мое внимание на то, что в окне result view в режиме правки мышкой границ полезной области это происходит слишком медленно. Я исправил это.

Всего записей: 4432 | Зарегистр. 09-09-2002 | Отправлено: 13:31 22-01-2011 | Исправлено: bolega, 14:25 22-01-2011
kalyambus



Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NAATH, 87Кб это конечно показатель, только мне pdf в принципе не подходит. Нужно делать именно djvu 600 dpi
 
bolega

Цитата:
Проблема в том, что это неправильное dpi

Может оно и не правильное, но проблемы ведь не только в обработке. У меня и время импорта в 10 раз больше по сравнению с другими файлами.

Цитата:
Чтобы решить проблему, после импорта на закладке Files задайте в поле Input dpi=300 и снимите там галку с "only for uknown dpi".

На этом этапе SK "Не отвечает". Ув. bolega, если у Вас есть пару свободных минут, подскажите что с этим файлом не так кроме неправильного dpi, почему он такой тяжелый для SK?

Всего записей: 7 | Зарегистр. 08-09-2007 | Отправлено: 14:29 22-01-2011 | Исправлено: kalyambus, 15:05 22-01-2011
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
kalyambus

Цитата:
почему он такой тяжелый для SK?

Здесь это уже обсуждалось.
По-видимому, djvu делалось с использованием компрессора JPG2000, а т.к. он доступен бесплатно только в сторону компрессии, то декомпрессия делается обычным декомпрессором, что и является причиной медленного импорта.
Можете проверить сами, если создадите в СК djvu с использованием компрессора JPG2000 (см. свойства СК, только версии 5.93), а затем попробуйте его импортировать.

Всего записей: 6970 | Зарегистр. 14-01-2005 | Отправлено: 17:14 22-01-2011 | Исправлено: shch_vg, 17:16 22-01-2011
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
kalyambus
Импортировал файл довольно быстро.

Цитата:
У меня и время импорта в 10 раз больше по сравнению с другими файлами.  

Если сравнивать с ч/б файлами, то импорт 24-битного djvu безусловно будет происходить намного медленнее.  
СК делает импорт djvu с помощью утилиты djvudecode, поэтому убыстрить процесс я никак не могу.
 

Цитата:
подскажите что с этим файлом не так кроме неправильного dpi, почему он такой тяжелый для SK?

Дело в том, что СК сам по себе обрабатывает 600dpi файлы (да еще и развороты) гораздо медленнее, чем 300dpi. А если к тому же не выставить правильное dpi а работать по сути с 1200dpi, то дела будут еще хуже. Поэтому первым делом нужно задать правильные 600dpi. Но обработка все равно будет медленной, особенно если оперативки не более 1Гб.
 
shch_vg

Цитата:
djvu делалось с использованием компрессора JPG2000

Я еще не видел такого чуда, чтобы djvu делался с помощью JPG2000 (хотя стандарт djvu это и позволяет).  

Цитата:
СК djvu с использованием компрессора JPG2000

СК не создает djvu, тем более с помощью JPG2000. Не путайте с pdf.
 
 
Добавлено:
kalyambus
Вот djvu после обработки: http://www.onlinedisk.ru/file/595145/

Всего записей: 4432 | Зарегистр. 09-09-2002 | Отправлено: 17:42 22-01-2011
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega

Цитата:
Не путайте с pdf.

Действительно, я не прав .
В последнее время настолько часто работаю с компрессией в pdf c помощью JPG2000, что у меня эти два варианта смешались, хотя перед тем, как написать я специально уточнял по сообщению, откуда производится импорт. Пора отдыхать .

Всего записей: 6970 | Зарегистр. 14-01-2005 | Отправлено: 18:47 22-01-2011
kalyambus



Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega, спасибо за исчерпывающее разъяснение. Мой файл после Вашей обработки именно то что мне нужно, буду изучать работу SK поглубже К стати, может Вам попадался на глаза мануал по обработке "Создание электронных книг из сканов" by TWDragon? Если да, то все ли там правильно написано?

Всего записей: 7 | Зарегистр. 08-09-2007 | Отправлено: 14:00 23-01-2011
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199

Компьютерный форум Ru.Board » Компьютеры » Программы » Закладки » ScanKromsator / СканКромсатор (Часть 3)
gyra (14-11-2018 10:38): ScanKromsator / СканКромсатор (Часть 4)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru