Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Закладки » ScanKromsator / СканКромсатор (Часть 3)

Модерирует : gyra, Maz

gyra (14-11-2018 10:38): ScanKromsator / СканКромсатор (Часть 4)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199

   

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ScanKromsator

Знаменитый Кромсатор для обрезки получаемых при сканировании изображений, а также для разделения страниц, очистки от мусора и т.п.  
Автор: bolega. http://bolega.hotmail.ru/.  
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Аналог ScanKromsator - Scan Tailor
 
Начало обсуждения - 1 часть, 2 часть.
 
Текущая версия: ScanKromsator v6.00.5 (2,1 МБ) Настройка внешних утилит  
Предыдущая версия: 5.96.2  (файл sk.exe), утилиты к ней можно взять из v5.96.1  
 
Старые версии: Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон


Подборка ответов bolega про работу ScanKromsator (версия 1.0.1 с закладками и сносками), 2016 г.
 
Хрестоматия материалов про СК , 2017 г.
(25 Mb, для открытия файла chm может потребоваться его разблокировать в свойствах файла, кликнув ПКМ)  
Включает, в том числе:
Видеоуроки про ScanKromsator Подробнее...
 
Обработка пикчур-зон от TelecomUral Подробнее...
 
English texts Подробнее...
 
Что делать, если ScanKromsator не делает то, что хотелось бы... И ещё bolega о том же самом...

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 18:07 30-03-2009 | Исправлено: Maz, 09:43 22-08-2018
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
В ней имеются страницы с плохо пропечатанными областями

Для таких страниц включайте:
Unsharp 6/5/1
Gauss blur=1
Enhance contour=10/70/1/Auto=on

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 16:53 26-06-2009
Alexx S



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Не удержался, краем глаза глянул.  
Порог действительно ниже нужного на 10-20ед.
Наткнулся на ошибки descrew, причем в одном случае поворот был в разные стороны в зависимости от порга (при отключенном GE). Завтра-послезавтра попробую выловить закономерность на чистой версии (записывал поверх старой версии в сборке от ghostly)

Всего записей: 1580 | Зарегистр. 15-04-2004 | Отправлено: 17:22 26-06-2009
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Alexx S
Если сможете выложить файлы, где неправильно deskew, будет хорошо.  
Deskew действительно полагается на тот порог, что Вы указали (либо использует адаптивный, если выходной формат - не b/w). Поэтому от фонаря его ставить не стоит. СК предполагает также, что нет теней - удалены либо bckgr clean-ом, либо corr.illum-ом (это не относится к случаю когда на выходе - не b/w). Если оба условия не выполняются, то и смысла в deskew нет - на выходе все равно ничего хорошего не получится. Т.е. если пытаться проверять deskew просто так, по принципу "а если ломом его?", то результат может быть не тот, что ожидается.

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 17:31 26-06-2009 | Исправлено: bolega, 17:43 26-06-2009
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Некоторые непонятные аспекты работы програмы:
 
импорт pdf(если изображение jpeg2000) = чёрный экран.
Странно, pdfimages извлекает нормально.
 
Ошибка склейки "лоскутной структуры"
http://rapidshare.com/files/248882642/segmented.pdf.html
http://ipicture.ru/uploads/090626/52469/I7w964zf5W.jpg
http://ipicture.ru/uploads/090626/52469/c9CU1EJdDs.png
 
импорт  pdf  -   если pdf сделано при помощи Adobe Acrobat x.xx, Paper
Capture  Plug-in with ClearScan, то непонятно для чего делается
такой импорт.
про лоскутную структуру уведомляет, а про cleanscan нет.
непонятно для чего уведомляет.
 
если kdu_compress.exe лежит в path (в путях) всё равно ругается
Warning JPG2000 codec are not found!
Но при  этом  наличае  kdu_v61R.dll  не  проверяется. Странно.
 
для выбора пути kdu кодека - надпись FRGrab application
 
Для сохранения в jpeg2000 используется JasPer Version 1.600.0
хотя достаточно давно существует JasPer Version 1.900.1
Непонятно.
 

Всего записей: 6477 | Зарегистр. 31-08-2008 | Отправлено: 18:23 26-06-2009
Alexx S



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Вот тот файл, на котором споткнулся. Порог, конечно, немного завышен, но версия 5,92 обрабатывает его корректно, 5,93- ошибка поворота, sub-task сделал, вообще пишет ошибку "Floating point division by zero" на smart blur, поэтому включил в задание выходные файлы.
http://www.onlinedisk.ru/file/167723/
Кстати, може заодно посмотрите - как лучше применить фильтры сглаживания на таких вот хороших исходниках? С плохими иногда даже проще - там четко видно в каком направлени двигаться, а тут изначально качество хорошее, сложно поймать набор фильтров, дающих максимально гладкие буквы и минимально "слипшиеся" буквы.

Всего записей: 1580 | Зарегистр. 15-04-2004 | Отправлено: 20:13 26-06-2009 | Исправлено: Alexx S, 20:32 26-06-2009
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ndch

Цитата:
импорт pdf(если изображение jpeg2000) = чёрный экран

Можно глянуть на файл или лучше на одну страницу из него?
 
Сразу скажу, что импортировать некоторые pdf средствами СК абсолютно бесполезно. СК при импортировании сохраняет "зонную" структуру оригинала. Но ряд pdf невозможно воспроизвести таким способом (чтобы они выглядели правильно, нужно именно рендерить их, так, как это делает acrobat или некторые другие извлекатели. Т.е. зоны поверх скана - этого мало, нужно еще воспроизвести еще довольно сложные методы наложения их друг на друга, а это СК не подерживает). Пример таких pdf - от google и microsoft. Но надо сказать, что процент таких pdf очень мал. Например, для тестирования я пропускаю через СК все сканированные pdf из гигапедии, процент неимпортируемых из них - 1%.
 

Цитата:
Ошибка склейки "лоскутной структуры"  

Есть такое дело. СК склеивает путем пристыковки одной полосы к другой. До сих пор я только такие встречал. А здесь незнакомый мне случай - перехлест лоскутков (непонятно только, зачем утилита doPDF ver 6.2 так делает. Ну да ладно, ничего не поделаешь).
 

Цитата:
Plug-in with ClearScan, то непонятно для чего делается  
такой импорт.  

Clearscan - это уже векторный pdf. А такие pdf СК не импортирует. Иначе придется писать целый GS. А это мне не под силу. СК - это программа обработки сканов, а не всего, где есть текст. Под сканами подразумевается любой граф. формат - изображения, djvu, растровые pdf. Векторные шрифты, так же как и файлы word, СК не обрабатывает.
 

Цитата:
то непонятно для чего делается такой импорт.  

С таким подходом я не согласен. Это как если сказать: на фига мне фотошоп, если он не может открыть векторные autocad-файлы. Clearscan - это вектор, и что там можно улучшать/обрабатывать, мне не понятно.
 

Цитата:
Но при  этом  наличае  kdu_v61R.dll  не  проверяется

Не подумал про это. Хотя в whatsnew написал, куда должна быть помещена dll.
 

Цитата:
для выбора пути kdu кодека - надпись FRGrab application

Здесь Вы что-то путаете - на закладке Apps задается три внешних утилиты: djvudecode, FRGrab и кодек. Так что все правильно. Напротив каждой надписи свое поле ввода пути к утилите.
 

Цитата:
Для сохранения в jpeg2000 используется JasPer Version 1.600.0

Считайте, что это недоразумение (забыл убрать). Сохранение в jpg2000 я уберу совсем. Это для СК не нужно. Останется только в Services.
 
Alexx S
Спасибо! Качаю.
 

Цитата:
как лучше применить фильтры сглаживания на таких вот хороших исходниках

Лично я на хороших исходниках вообще фильтры не использую. В этом смысле я не  эстет.

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 21:12 26-06-2009 | Исправлено: bolega, 21:29 26-06-2009
Melirius



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Окошко Grey Image Enhance открывается так, что нижних элементов управления не видно. Это бы не беда, но его размер не запоминается, так что каждый раз приходится его мышкой растягивать. Исправьте этот баг, пожалуйста. Cкриншот проблемы http://ifile.it/0gqoxah .

Всего записей: 318 | Зарегистр. 01-04-2005 | Отправлено: 22:02 26-06-2009
Alexx S



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Окошко Grey Image Enhance открывается так, что нижних элементов управления не видно. Это бы не беда, но его размер не запоминается, так что каждый раз приходится его мышкой растягивать. Исправьте этот баг, пожалуйста. Cкриншот проблемы http://ifile.it/0gqoxah .

Есть такое дело

Всего записей: 1580 | Зарегистр. 15-04-2004 | Отправлено: 22:09 26-06-2009
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Melirius
Alexx S
Понятно. Проблемы начинаются, когда в системе выбран крупный системный шрифт. Учту.

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 22:34 26-06-2009
Melirius



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Если на скане есть выделенная область, открыто окно Grey Image Enhance и включен Background Cleaner, то попытка применить Preview приводит к ужасающим следствиям - не для слабонервных . Это тоже баг.

Всего записей: 318 | Зарегистр. 01-04-2005 | Отправлено: 23:19 26-06-2009
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Обрабатывая вторую книжку, словил первый баг ДК: на одной из страниц резаки вообще расставлены не были, хотя после ДК она была помечена. Баг воспроизвести не удалось - скармливал ту же книгу полностью.
 
Добавлено:
Melirius

Цитата:
Это тоже баг.
Заинтриговали, но воспроизвести не удалось
 
 
Добавлено:
bolega

Цитата:
Для таких страниц включайте:  
Unsharp 6/5/1  
Gauss blur=1  
Enhance contour=10/70/1/Auto=on

Спасибо. Я понемногу начну составлять профили для новой версии. Буду премного благодарен, если дадите какие-то рекомендации с учетом появления новых алгоритмов.  
 
Возможно, добавлю профиль для книг с неравномерно пропечатанными страницами...
 
 
 
Добавлено:
Да, кстати, если уж значение порога бинаризации отображается теперь для Auto, то нельзя ли сделать подобное для всех пресетов?

Всего записей: 6808 | Зарегистр. 21-09-2002 | Отправлено: 23:32 26-06-2009
Melirius



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ghosty
 
Полюбуйтесь:
 
http://ifile.it/crk90a4
 
У меня стабильно, уже несколько версий так (и на нескольких компах).
 
Работе, впрочем, не мешает .

Всего записей: 318 | Зарегистр. 01-04-2005 | Отправлено: 00:17 27-06-2009 | Исправлено: Melirius, 00:32 27-06-2009
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Melirius
Странно, у меня такое наблюдалось только на версиях вплоть до... 5.91 (не помню точно) и в том числе при обработке.
 
Добавлено:
bolega
У меня сложилось впечатление (или мне это только снится? ), что теперь СК сам пытается определить вертикальное выравнивание блока текста по странице. И похоже, делает он это очень даже неплохо.

Всего записей: 6808 | Зарегистр. 21-09-2002 | Отправлено: 01:46 27-06-2009
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
Можно глянуть на файл или лучше на одну страницу из него?

http://rapidshare.com/files/249091805/01.pdf.html
 

Цитата:

Цитата:
для выбора пути kdu кодека - надпись FRGrab application  

Здесь Вы что-то путаете

Да, криво описал. Изображаю в лицах:
http://ipicture.ru/uploads/090627/52469/JLDzLR2jag.png
 

Цитата:

Цитата:
то непонятно для чего делается такой импорт.

С таким подходом я не согласен. Это как если сказать: на фига мне фотошоп, если он не может открыть векторные autocad-файлы. Clearscan - это вектор, и что там можно улучшать/обрабатывать, мне не понятно.

Не понял смысла. Не могли бы перефразировать ?

Всего записей: 6477 | Зарегистр. 31-08-2008 | Отправлено: 08:11 27-06-2009
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Недоработка, врочем как и 80% остального софта (на удивление, за исключением встроеного в ХР просмотрщика) - некорректная работа с jpeg-cmyk.

Всего записей: 6477 | Зарегистр. 31-08-2008 | Отправлено: 14:54 27-06-2009 | Исправлено: ndch, 21:20 27-06-2009
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Странно импортирует повёрнутые объекты.
Пример в чистом виде:
http://rapidshare.com/files/249387867/rotate.pdf.html

Всего записей: 6477 | Зарегистр. 31-08-2008 | Отправлено: 02:48 28-06-2009
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ndch

Цитата:
http://rapidshare.com/files/249091805/01.pdf.html  

Спасибо за экземпляр. Исправил.  
 

Цитата:
Странно импортирует повёрнутые объекты

А вот это так в СК и задумано. Поворачивать сканы - это прерогатива задания, а не импортера. Пользователь должен видеть оригинальные сканы, а не то, как они развернуты средствами (командами) pdf. Исключение делается только для поворотов на 90 или 180 градусов, потому, что они losseless. Все остальное - lossy, и возможно, пользователь захочет улучшить изображение перед его поворотом, или выбрать нужный метод поворота.
 

Цитата:
Да, криво описал. Изображаю в лицах:  

Понял. Исправил.
 

Цитата:
Недоработка, врочем как и 80% остального софта

А Вы не думали, что дело здесь не в просмотрщиках, а в самом файле, может в нем неправильно формат указан? Т.е. на самом деле он не cmyk.
 

Цитата:
Не понял смысла. Не могли бы перефразировать ?

Вы знаете, что такое clearscan? Это векторный шрифт. А векторные шрифты СК не импортирует.
 
ghosty

Цитата:
У меня сложилось впечатление  

Правильное впечатление Об этом я и написал в wahtsnew.
 
Alexx S

Цитата:
Вот тот файл, на котором споткнулся

Спасибо за интересный экземпляр (многоколоночный текст+рисунок).
Подрегулировал deskew. Стало лучше.
 
 
 
 
 

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 18:38 28-06-2009 | Исправлено: bolega, 19:51 28-06-2009
VadimirTT



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
СК сам пытается определить вертикальное выравнивание блока текста по странице. И похоже, делает он это очень даже неплохо.

Да, я то же заметил, у меня получилось - если текст занимает менее страницы, то все пытался загнать по центру, приходилось быть внимательным, что бы не пропустить и поправить, можно ли это отключить, есть ли где опция?

Всего записей: 2864 | Зарегистр. 22-03-2005 | Отправлено: 07:21 29-06-2009
Alexx S



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Спасибо за интересный экземпляр (многоколоночный текст+рисунок).  
Подрегулировал deskew. Стало лучше.

В этой книге таких ошибок прилично, могу для теста выбрать файлы с ошибками

Всего записей: 1580 | Зарегистр. 15-04-2004 | Отправлено: 10:25 29-06-2009
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Alexx S
Хорошо бы
 
Добавлено:
VadimirTT

Цитата:
то все пытался загнать по центру

Нет, по центру делает если снизу и сверху слишком много пустого места. Для нормальных сканов это нехарактерно. Но бывают и такие, где область сканирования зачем-то делается огромной. В этом случае определить выравнивание проблематично - то ли это выравнивание такое, то ли лишнее пространство, не относящееся к книге. Эту проблему я буду решать, путем анализа не конкретной страницы (как сейчас), а всей книги.
Сейчас наиболее достоверно align определяется для разворотов - по двум сстраницам СК легче судить.

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 11:00 29-06-2009 | Исправлено: bolega, 11:25 29-06-2009
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199

Компьютерный форум Ru.Board » Компьютеры » Программы » Закладки » ScanKromsator / СканКромсатор (Часть 3)
gyra (14-11-2018 10:38): ScanKromsator / СканКромсатор (Часть 4)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru