Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator / СканКромсатор (Часть 4)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22

Открыть новую тему     Написать ответ в эту тему

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ScanKromsator

Знаменитый Кромсатор для обрезки получаемых при сканировании изображений, а также для разделения страниц, очистки от мусора и т.п.  
Автор: bolega. http://bolega.hotmail.ru/.  
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Аналог ScanKromsator - Scan Tailor
 
Начало обсуждения - 1 часть, 2 часть, 3 часть
 
Текущая версия: ScanKromsator v6.00.5 (2,1 МБ) Настройка внешних утилит  
Предыдущая версия: 5.96.2  (файл sk.exe), утилиты к ней можно взять из v5.96.1  
 
Старые версии: Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон


Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
 
Хрестоматия материалов про СК , 2017 г.
(25 Mb, для открытия файла chm может потребоваться его разблокировать в свойствах файла, кликнув ПКМ)  
Включает, в том числе:
Видеоуроки про ScanKromsator Подробнее...
 
Обработка пикчур-зон от TelecomUral Подробнее...
 
English texts Подробнее...
 
Что делать, если ScanKromsator не делает то, что хотелось бы... И ещё bolega о том же самом...

Всего записей: 7239 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: TelecomUral, 15:00 20-12-2018
TelecomUral

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
igogo22
дескрин text&line и инверсный дизеринг.

Всего записей: 547 | Зарегистр. 15-07-2010 | Отправлено: 18:14 10-12-2018
igogo22

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
дескрин text&line и инверсный дизеринг.

 
Извиняюсь. Мне это ничего не говорит к сожалению. Можете подсказать, какие пункты меню?

Всего записей: 36 | Зарегистр. 05-12-2011 | Отправлено: 19:08 10-12-2018
TelecomUral

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
igogo22
вы не извиняйтесь, вы в шапку загляните и материалы про СК почитайте. они для того и писаны, чтоб время моё не тратить зря.

Всего записей: 547 | Зарегистр. 15-07-2010 | Отправлено: 20:10 10-12-2018
daa2013

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
На png файле без разрешения (=1), на закладке  DPI = ORIGINAL, в начале обработке варнинг:    Invalid dpi   , выбрано значение   select value   = 300
 
а вот далее проблема:  
в Result view  не выпадает список  Изменить глубину цвета,
и предупреждений никаких при этом не выдаётся.
 
Если же на закладке поставить Input DPI = 300  , то всё норм, список есть.

Всего записей: 570 | Зарегистр. 13-06-2013 | Отправлено: 20:55 10-12-2018
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
Включаю для обработки входного скана Correct illumination, создаю b/w picture-зону, в которой стоит галка на Protect from illum.correction, и запускаю обработку этой зоны. В процессе обработки первое сообщение, появляющееся в окне Processing... это Correct illumination.
Вопрос: отключает ли вышеуказанная галка Correct illumination или нет?
 
P.S. Проверил на серой зоне с фото и выяснил, что отключает.
Может быть, стоит убрать появление сообщения Correct illumination при включенной галке, т.к. это несколько сбивает с толку?

Всего записей: 5410 | Зарегистр. 14-01-2005 | Отправлено: 14:24 11-12-2018 | Исправлено: shch_vg, 14:41 11-12-2018
Nitrofest

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я несколько лет не занимался сканированием книг, забросил как-то это дело. Вот сейчас возвращаюсь к делу. И возник вопрос, который долгое время раньше меня "мучал". Обычно я сканирую литературы по физ-мат тематике, с минимумом картинок. Расставить вручную десяток-другой picture зон никогда не было проблемой (обычно в книге больше не попадалось). А вот сейчас попалась книжица, где иллюстрации почти на каждой второй странице. Скажите, не появилось ли в СК функции с автоматическим выделением картинки? Или хотя бы чтобы по клику она автоматом "обводила" картинку по контуру... Можно было бы пользоваться ScanTailor, в котором эта функция кое-как реализована, но компенсировать тонкую настройку СК он, конечно, и близко не может. А вручную выделять зоны на >400-х страницах я задолбаюсь.

Всего записей: 44 | Зарегистр. 04-09-2009 | Отправлено: 23:21 16-12-2018
slava_kry

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Nitrofest
Нет, не появилось. Это принципиальный взгляд bolega.
По сути он прав, т.к. СТ картинки выделяет, но ты потом сидишь и "уточняешь" зоны картинок... дык какая разница?
Сам СК почти не пользуюсь.
Нормального сегментатора как не было, так и нет.

----------
Вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом

Всего записей: 4117 | Зарегистр. 18-09-2003 | Отправлено: 06:54 17-12-2018
TelecomUral

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
оффтоп

Цитата:
Нормального сегментатора как не было, так и нет

Угу. причём понасмотревшись сканов, я предполагаю, что и не будет, нормального-то. Художники как только не извращаются.
Правда, отсюда следует вывод: программировать "вспомогательные" инструменты, для типичных ситуаций. То есть оставлять на откуп обработчику, тыкать ему на конкретном скане в конкретном месте "найти картинку, она здесь такого-то типа", или нет. К примеру, типичный советский вариант НПС, НБЛ: фотки строго отделены от текста, овальные или прямоугольные. Цветной текст (слово, фразу) тоже можно задетектировать, исходя из соотношений геометрии (по аналогии с тем, как ищется блок текста на скане). А в целом - задача нерешаемая. Какая-нибудь подкладка акварельная, под синеньким шрифтом, как её опознаешь.
 
по сути:
Nitrofest
вы не забывайте, что есть режим mouse-up. Для однотипных картинок он идеален: растягиваете прямоугольник над картинкой, по отпусканию мышки зона создаётся автоматом. Простые книжки, без пиксельной точности выделения, зонируются за десяток минут, только успевай листать. Непрямоугольные - с помощью лассо.

Всего записей: 547 | Зарегистр. 15-07-2010 | Отправлено: 07:13 17-12-2018
Archivist

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
В FineReader 12 MRC достаточно хорошо работает автосегментирование, но пожинать эти плоды сейчас похоже нечем. Хотя слои в выходном PDF лежат в открытом виде и легко извлекаются.

Всего записей: 73 | Зарегистр. 10-08-2018 | Отправлено: 11:27 17-12-2018
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
В FineReader 12 MRC достаточно хорошо работает автосегментирование

У меня нет FR12, можно пример исходного скана с картинками, и pdf после FR? Желательно, чтобы скан был естественный (т.е. с небольшим перекосом), а в FR был бы отключен deskew

Всего записей: 3693 | Зарегистр. 09-09-2002 | Отправлено: 11:57 17-12-2018
Archivist

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
У меня нет FR12, можно пример исходного скана с картинками, и pdf после FR? Желательно, чтобы скан был естественный (т.е. с небольшим перекосом), а в FR был бы отключен deskew

 
https://yadi.sk/d/g-My-eH8L8gt5Q
 
В архиве 3 примера:
- skewed (сырой скан с перекосом). Исходник - https://yadi.sk/i/0J57dT0-A6MM5Q
- sample (сырой скан с малым перекосом)
- Compas (обработанный в ФШ журнал)
 
К первым двум приложил рабочие папки проектов FR. Возможно, там есть информация непосредственно о зонах картинок.
 

 

Всего записей: 73 | Зарегистр. 10-08-2018 | Отправлено: 13:08 17-12-2018
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Archivist
Спасибо!
Заметил, что в pdf dpi заднего слоя уменьшился в 2 раза относительно исходного скана. FR всегда так делает или это поддается регулировке?

Всего записей: 3693 | Зарегистр. 09-09-2002 | Отправлено: 15:01 17-12-2018
Archivist

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
FR всегда так делает или это поддается регулировке?

Похоже, что именно для MRC не предусмотрена выдача картинок исходного разрешения. Не смог этого добиться. Хотя при экспорте обычного PDF с подложенным слоем текста все получается при аналогичных настройках. Тогда остается надеяться на читаемость информации о зонах картинок

Всего записей: 73 | Зарегистр. 10-08-2018 | Отправлено: 16:06 17-12-2018
TelecomUral

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
обнаружил в 6.00.5 странность: если взять BMP с BW-содержимым (ирфан кажет, что палитра - однопиксельная), то мелкие точки внутри зоны стираются деспеклом страницы. Причём не у всех зон. Зависит от места точек на скане, что ли. Потому что я пробовал зоны перетаскивать, и всё равно в уголке снизу микроточки сохраняются, а наверху справа - нет.
Если картинку перевести в цветовое пространство 24бита, то всё ОК.
задание с файлами https://yadi.sk/d/ZOsDJCNLljUjCg
В бете 6.20 то же самое.

Всего записей: 547 | Зарегистр. 15-07-2010 | Отправлено: 18:36 17-12-2018
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
TelecomUral
Не пробовали в свойствах зоны убрать галку в Clear source area?

Всего записей: 5410 | Зарегистр. 14-01-2005 | Отправлено: 02:11 18-12-2018
TelecomUral

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
сейчас попробовал, помогло. я и говорю: странное поведение.
Это картинка с рутрекера, она через старые DEE и DSM и DjvuLibre не пролазит. Вот я и захотел превратить с помощью СК её дизеринговые чб-точки в серый цвет.

Всего записей: 547 | Зарегистр. 15-07-2010 | Отправлено: 04:26 18-12-2018 | Исправлено: TelecomUral, 04:29 18-12-2018
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
TelecomUral
А что в этом странного?
Этот параметр может действовать только на черно-белый скан, а после перевода его в серый (в частности в 24бита) он перестает действовать (а м.б. действует как-то по-своему?).
Другой вопрос, зачем он здесь нужен, т.к. на закладке Filters есть параметр Despeckle.

Всего записей: 5410 | Зарегистр. 14-01-2005 | Отправлено: 14:03 18-12-2018 | Исправлено: shch_vg, 14:20 18-12-2018
TelecomUral

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
оффтоп
shch_vg
нуу... лично мне странно то, что в разных местах скана деспекл страницы на зону то воздействует, то не воздействует. При том, что по умолчанию зона от деспекла защищена. Я ж ни одной галочки при создании трёх зон не поменял, они все дефолтные. Более того, перетащил зону 1 на место зоны три, а третью - на место первой. Один шут при переобработке точки в правой верхней четверти исчезли, а внизу остались.  
Но не суть. Я "прокукарекал".

Всего записей: 547 | Зарегистр. 15-07-2010 | Отправлено: 14:26 18-12-2018
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Все верно подметил TelecomUral. Это баг, причем серьезный. Я пока даже не знаю, как его обойти, чтобы малой кровью и не наделать новых багов. Проблема в том, что despeckle для ч/б сканов выполняется до того, как вырезаются и формируются зоны. Т.е. к моменту создания зоны точек уже нет. Костыли можно сделать, но они не будут универсальными. Если убрать Clear source area, точки останутся в зоне, но они останутся и на странице, а это возможно не то, что ожидает юзер. Можно вокруг pic-зоны создать exclude-зону (выделить pic-зону и держа нажатым Ctrl, щелкнуть по кнопке с exclude-зоной), но это лишнее действие.
По хорошему, чтобы вылечить баг, нужно в корне поменять последовательность обработки ч/б сканов, т.е. despeckle делать последним, как это делается в случае  серых/цветных сканов.

Всего записей: 3693 | Зарегистр. 09-09-2002 | Отправлено: 15:48 18-12-2018
TelecomUral

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
создавайте exclude-зону на лету. как вариант. костыли, конечно.  
или предупреждение давайте.

Всего записей: 547 | Зарегистр. 15-07-2010 | Отправлено: 16:43 18-12-2018
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator / СканКромсатор (Часть 4)

Имя:
Пароль:
Сообщение

Для вставки имени, кликните на нем.

Опции сообщенияДобавить свою подпись
Подписаться на получение ответов по e-mail
Добавить тему в личные закладки
Разрешить смайлики?
Запретить коды


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.Board
© Ru.Board 2000-2018

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru