Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
igogo22
дескрин text&line и инверсный дизеринг.

Всего записей: 3047 | Зарегистр. 15-07-2010 | Отправлено: 18:14 10-12-2018
igogo22

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
дескрин text&line и инверсный дизеринг.

 
Извиняюсь. Мне это ничего не говорит к сожалению. Можете подсказать, какие пункты меню?

Всего записей: 45 | Зарегистр. 05-12-2011 | Отправлено: 19:08 10-12-2018
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
igogo22
вы не извиняйтесь, вы в шапку загляните и материалы про СК почитайте. они для того и писаны, чтоб время моё не тратить зря.

Всего записей: 3047 | Зарегистр. 15-07-2010 | Отправлено: 20:10 10-12-2018
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
На png файле без разрешения (=1), на закладке  DPI = ORIGINAL, в начале обработке варнинг:    Invalid dpi   , выбрано значение   select value   = 300
 
а вот далее проблема:  
в Result view  не выпадает список  Изменить глубину цвета,
и предупреждений никаких при этом не выдаётся.
 
Если же на закладке поставить Input DPI = 300  , то всё норм, список есть.

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 20:55 10-12-2018
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
Включаю для обработки входного скана Correct illumination, создаю b/w picture-зону, в которой стоит галка на Protect from illum.correction, и запускаю обработку этой зоны. В процессе обработки первое сообщение, появляющееся в окне Processing... это Correct illumination.
Вопрос: отключает ли вышеуказанная галка Correct illumination или нет?
 
P.S. Проверил на серой зоне с фото и выяснил, что отключает.
Может быть, стоит убрать появление сообщения Correct illumination при включенной галке, т.к. это несколько сбивает с толку?

Всего записей: 6970 | Зарегистр. 14-01-2005 | Отправлено: 14:24 11-12-2018 | Исправлено: shch_vg, 14:41 11-12-2018
Nitrofest

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я несколько лет не занимался сканированием книг, забросил как-то это дело. Вот сейчас возвращаюсь к делу. И возник вопрос, который долгое время раньше меня "мучал". Обычно я сканирую литературы по физ-мат тематике, с минимумом картинок. Расставить вручную десяток-другой picture зон никогда не было проблемой (обычно в книге больше не попадалось). А вот сейчас попалась книжица, где иллюстрации почти на каждой второй странице. Скажите, не появилось ли в СК функции с автоматическим выделением картинки? Или хотя бы чтобы по клику она автоматом "обводила" картинку по контуру... Можно было бы пользоваться ScanTailor, в котором эта функция кое-как реализована, но компенсировать тонкую настройку СК он, конечно, и близко не может. А вручную выделять зоны на >400-х страницах я задолбаюсь.

Всего записей: 46 | Зарегистр. 04-09-2009 | Отправлено: 23:21 16-12-2018
slava_kry

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Nitrofest
Нет, не появилось. Это принципиальный взгляд bolega.
По сути он прав, т.к. СТ картинки выделяет, но ты потом сидишь и "уточняешь" зоны картинок... дык какая разница?
Сам СК почти не пользуюсь.
Нормального сегментатора как не было, так и нет.

----------
Вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом

Всего записей: 4308 | Зарегистр. 18-09-2003 | Отправлено: 06:54 17-12-2018
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
оффтоп

Цитата:
Нормального сегментатора как не было, так и нет

Угу. причём понасмотревшись сканов, я предполагаю, что и не будет, нормального-то. Художники как только не извращаются.
Правда, отсюда следует вывод: программировать "вспомогательные" инструменты, для типичных ситуаций. То есть оставлять на откуп обработчику, тыкать ему на конкретном скане в конкретном месте "найти картинку, она здесь такого-то типа", или нет. К примеру, типичный советский вариант НПС, НБЛ: фотки строго отделены от текста, овальные или прямоугольные. Цветной текст (слово, фразу) тоже можно задетектировать, исходя из соотношений геометрии (по аналогии с тем, как ищется блок текста на скане). А в целом - задача нерешаемая. Какая-нибудь подкладка акварельная, под синеньким шрифтом, как её опознаешь.
 
по сути:
Nitrofest
вы не забывайте, что есть режим mouse-up. Для однотипных картинок он идеален: растягиваете прямоугольник над картинкой, по отпусканию мышки зона создаётся автоматом. Простые книжки, без пиксельной точности выделения, зонируются за десяток минут, только успевай листать. Непрямоугольные - с помощью лассо.

Всего записей: 3047 | Зарегистр. 15-07-2010 | Отправлено: 07:13 17-12-2018
Archivist

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
В FineReader 12 MRC достаточно хорошо работает автосегментирование, но пожинать эти плоды сейчас похоже нечем. Хотя слои в выходном PDF лежат в открытом виде и легко извлекаются.

Всего записей: 327 | Зарегистр. 10-08-2018 | Отправлено: 11:27 17-12-2018
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
В FineReader 12 MRC достаточно хорошо работает автосегментирование

У меня нет FR12, можно пример исходного скана с картинками, и pdf после FR? Желательно, чтобы скан был естественный (т.е. с небольшим перекосом), а в FR был бы отключен deskew

Всего записей: 4432 | Зарегистр. 09-09-2002 | Отправлено: 11:57 17-12-2018
Archivist

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
У меня нет FR12, можно пример исходного скана с картинками, и pdf после FR? Желательно, чтобы скан был естественный (т.е. с небольшим перекосом), а в FR был бы отключен deskew

 
https://yadi.sk/d/g-My-eH8L8gt5Q
 
В архиве 3 примера:
- skewed (сырой скан с перекосом). Исходник - https://yadi.sk/i/0J57dT0-A6MM5Q
- sample (сырой скан с малым перекосом)
- Compas (обработанный в ФШ журнал)
 
К первым двум приложил рабочие папки проектов FR. Возможно, там есть информация непосредственно о зонах картинок.
 

 

Всего записей: 327 | Зарегистр. 10-08-2018 | Отправлено: 13:08 17-12-2018
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Archivist
Спасибо!
Заметил, что в pdf dpi заднего слоя уменьшился в 2 раза относительно исходного скана. FR всегда так делает или это поддается регулировке?

Всего записей: 4432 | Зарегистр. 09-09-2002 | Отправлено: 15:01 17-12-2018
Archivist

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
FR всегда так делает или это поддается регулировке?

Похоже, что именно для MRC не предусмотрена выдача картинок исходного разрешения. Не смог этого добиться. Хотя при экспорте обычного PDF с подложенным слоем текста все получается при аналогичных настройках. Тогда остается надеяться на читаемость информации о зонах картинок

Всего записей: 327 | Зарегистр. 10-08-2018 | Отправлено: 16:06 17-12-2018
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
обнаружил в 6.00.5 странность: если взять BMP с BW-содержимым (ирфан кажет, что палитра - однопиксельная), то мелкие точки внутри зоны стираются деспеклом страницы. Причём не у всех зон. Зависит от места точек на скане, что ли. Потому что я пробовал зоны перетаскивать, и всё равно в уголке снизу микроточки сохраняются, а наверху справа - нет.
Если картинку перевести в цветовое пространство 24бита, то всё ОК.
задание с файлами https://yadi.sk/d/ZOsDJCNLljUjCg
В бете 6.20 то же самое.

Всего записей: 3047 | Зарегистр. 15-07-2010 | Отправлено: 18:36 17-12-2018
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
TelecomUral
Не пробовали в свойствах зоны убрать галку в Clear source area?

Всего записей: 6970 | Зарегистр. 14-01-2005 | Отправлено: 02:11 18-12-2018
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
сейчас попробовал, помогло. я и говорю: странное поведение.
Это картинка с рутрекера, она через старые DEE и DSM и DjvuLibre не пролазит. Вот я и захотел превратить с помощью СК её дизеринговые чб-точки в серый цвет.

Всего записей: 3047 | Зарегистр. 15-07-2010 | Отправлено: 04:26 18-12-2018 | Исправлено: TelecomUral, 04:29 18-12-2018
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
TelecomUral
А что в этом странного?
Этот параметр может действовать только на черно-белый скан, а после перевода его в серый (в частности в 24бита) он перестает действовать (а м.б. действует как-то по-своему?).
Другой вопрос, зачем он здесь нужен, т.к. на закладке Filters есть параметр Despeckle.

Всего записей: 6970 | Зарегистр. 14-01-2005 | Отправлено: 14:03 18-12-2018 | Исправлено: shch_vg, 14:20 18-12-2018
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
оффтоп
shch_vg
нуу... лично мне странно то, что в разных местах скана деспекл страницы на зону то воздействует, то не воздействует. При том, что по умолчанию зона от деспекла защищена. Я ж ни одной галочки при создании трёх зон не поменял, они все дефолтные. Более того, перетащил зону 1 на место зоны три, а третью - на место первой. Один шут при переобработке точки в правой верхней четверти исчезли, а внизу остались.  
Но не суть. Я "прокукарекал".

Всего записей: 3047 | Зарегистр. 15-07-2010 | Отправлено: 14:26 18-12-2018
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Все верно подметил TelecomUral. Это баг, причем серьезный. Я пока даже не знаю, как его обойти, чтобы малой кровью и не наделать новых багов. Проблема в том, что despeckle для ч/б сканов выполняется до того, как вырезаются и формируются зоны. Т.е. к моменту создания зоны точек уже нет. Костыли можно сделать, но они не будут универсальными. Если убрать Clear source area, точки останутся в зоне, но они останутся и на странице, а это возможно не то, что ожидает юзер. Можно вокруг pic-зоны создать exclude-зону (выделить pic-зону и держа нажатым Ctrl, щелкнуть по кнопке с exclude-зоной), но это лишнее действие.
По хорошему, чтобы вылечить баг, нужно в корне поменять последовательность обработки ч/б сканов, т.е. despeckle делать последним, как это делается в случае  серых/цветных сканов.

Всего записей: 4432 | Зарегистр. 09-09-2002 | Отправлено: 15:48 18-12-2018
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
создавайте exclude-зону на лету. как вариант. костыли, конечно.  
или предупреждение давайте.

Всего записей: 3047 | Зарегистр. 15-07-2010 | Отправлено: 16:43 18-12-2018
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)
Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru