Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 5)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69

Открыть новую тему     Написать ответ в эту тему

Maz



Дед Мазай
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть | 4 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v7.00 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


О Хрестоматии 2.1 SK
 
Чтобы русифицировать СканКромсатор
В ini-файле в секции Options должен присутствовать параметр LangInt=1. Вернуть в исходный язык: LangInt=0. Пока русифицировано только MW.
 
ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 39181 | Зарегистр. 26-02-2002 | Отправлено: 21:56 14-09-2023 | Исправлено: TelecomUral, 07:06 04-12-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
daa2013
я не помню, чтобы вы об этом писали

было примерно тут
12:36 04-05-2023
 
 
Добавлено:

Цитата:
bolega
кстати, интересно, а есть графические редакторы (пиксельные, не векторные), которые поддерживают редактирование непрерывной полосы изображений?

где-то лет 25 назад попадался. Возможно, как пример в книге по обучению программированию. Я с тех пор отметил что ничего архисложного нет, но надо о такой возможности думать сразу - чтобы окно пересчета координат ездило.

Всего записей: 3386 | Зарегистр. 15-07-2010 | Отправлено: 09:04 11-01-2025
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я почитал обсуждение 04-05-2023. Я его хорошо помню. Инфы, что
Цитата:
движок СК  умеет отображать ... только одиночное изображение  
я там не нашёл.
Почему мне казалось, что это несложно - ведь лента тумбнейлов в СК пролистывается непрерывно. Но да, сейчас я понимаю, что они там не масштабируются.
 
Пока нагуглились просмотрщики (ищу-то я редакторы) со скроллингом.
 
https://github.com/luejerry/html-mangareader/releases
https://github.com/Sirosky/go-reader/releases
 
Я когда-то очень давно сравнивал редакторы, заточенные на создание мультфильмов. Мне, кажется, там такое было.

Всего записей: 1094 | Зарегистр. 13-06-2013 | Отправлено: 10:08 11-01-2025
asku



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Добрый день. Подскажите пожалуйста, можно ли в СК как-то регулировать «чувствительность» желтой рамки после обработки сканов и перед их финализацией, чтобы желтый фон захватывал такие черные детали?
 

Всего записей: 618 | Зарегистр. 04-05-2016 | Отправлено: 16:56 12-01-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
asku
а text sensitivity не помогает?

Всего записей: 3386 | Зарегистр. 15-07-2010 | Отправлено: 17:00 12-01-2025
asku



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
 
Вы имеете в виду это?

 
Так резаки расставлены правильно. А уже после обработки скана желтый фон эти участки не включает.

Всего записей: 618 | Зарегистр. 04-05-2016 | Отправлено: 17:42 12-01-2025
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Так резаки расставлены правильно. А уже после обработки скана желтый фон эти участки не включает.

иногда это и к лучшему, например, если выравнивание задано по центру. Тогда равняет по габариту текста, а не по тонким выступам. То, что попало за пределы желтого, после финализации все равно никуда не денется.
А вообще чувствительность к таким выступающим элементам задается Files > Options > Processing > Text vert. sensivity. Она учитывается в двух местах: в процессе обработки, а также в окне VR при пересчете габарита, который будет выполнен, если дважды щелкнуть на самой границе желтого прямоугольника (левой/правой/верхней/нижней).

Всего записей: 4602 | Зарегистр. 09-09-2002 | Отправлено: 18:15 12-01-2025
asku



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega, спасибо, все получилось.
 
Еще такой вопрос.
Как вот здесь лучше обработать этот черный рисунок, чтобы на выходе такое не получалось:

 
Вот тест: Ссылка
 
Лучше взять в зону Picture? Рисунок черно-белый, я думал, можно как-то без Picture обойтись.

Всего записей: 618 | Зарегистр. 04-05-2016 | Отправлено: 00:34 13-01-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
можно поменять метод сглаживания illumination с safe на normal.

Всего записей: 3386 | Зарегистр. 15-07-2010 | Отправлено: 06:24 13-01-2025
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Как вот здесь лучше обработать этот черный рисунок, чтобы на выходе такое не получалось:  

в illumination включите опцию protect edges. Иногда помогает, как в данном случае

Всего записей: 4602 | Зарегистр. 09-09-2002 | Отправлено: 08:26 13-01-2025
Fire_Dragon



Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подскажите пожалуйста, если кто знает, как сделать малоцветный djvu таким образом чтобы чёрные пиксели на исходном изображении автоматически сегментировались в чёрно-белый слой, а цветные элементы сегментировались в задний слой маской по одному слою на цвет. Как это сделать наиболее грамотно и с наименьшими усилиями.
 
Пример исходного четырёхцветного изображения:
   
 
Чёрно-белый слой получается так:
   
 
Нужно чтобы было так, а остальные слои были в заднем фоне:
   
 
 
Добавлено:
Есть ли возможность в СК задавать порядок применения фильтров установленных в окне "Enhance image" и есть ли информация какой порядок применяется по-умолчанию?

Всего записей: 22 | Зарегистр. 19-11-2010 | Отправлено: 23:13 13-01-2025 | Исправлено: Fire_Dragon, 23:28 13-01-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Fire_Dragon
цветные элементы сегментировались в задний слой маской по одному слою на цвет

в дежавю всего два слоя - передний и задний.  
Если вы хотите все цветные элементы (не-черные) загнать в задний слой, то это не называют "малоцветный дежавю". Это "стандартный трехслойный дежавю".
Как я понимаю, достаточно отключить галку МПФ в визарде. DEE сам уберет цвета в фон. Возможно,  нужно поиграться порогом перевода в задний слой.

Цитата:
есть ли информация какой порядок применяется по-умолчанию

вроде в "вопросах и ответах по СК" что-то такое было от разработчика.

Всего записей: 3386 | Зарегистр. 15-07-2010 | Отправлено: 04:53 14-01-2025
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Небольшое дополнение про мои пожелания  
 
"Подсовывать подсвеченные спеклы пользователю на центр экрана. Т.е. не он глазами такое ищет, а СК перемещает фокус вьюера на сомнительное место."
 
"Определять наличие спеклов в ячейках букв (окрестностях ячеек) и автоматически перемещаться по таким ячейкам."
 
Я сейчас оставшиеся после глифирования черты от ужирнённых букв т, ш, п   , которые даже красным как спеклы не выделяются (вероятно, в СК есть некий встроенный порог ширина/высота на спеклы),  ловлю так:
 
сделал на закладке глифов активными только эти буквы, проанализировал, и спускаюсь стрелочками по списку вниз, отслеживая их в окошке Preview справа .  Там эти черточки как раз красным показываются. В это время в основном окне изображение само прыгает на нужное место. При достаточно крупном увеличении искомая буква оказывается практически в центре экрана.
 
Это я к чему, если бы при анализировании (естественно, некотором специальном режиме анализирования) в этот список попадали только буквы, в ячейках которых и в окрестности ячеек которых (размер +N пикселей к ячейке даже может задавать пользователь)  имеются спеклы (можно размера, как в опциях RV, можно заново указанного), то думаю, что это дало бы желаемую функциональность.  
 
Добавлено:

Цитата:
цветные элементы сегментировались в задний слой

Вот да, если на исходном изображении УЖЕ всего четыре чистых цвета, то его надо просто кодировать малоцветкой. Если это джипеги, где чистые цвета могут быть размыты, или из векторного пдф конвертация, где тоже пошло размытие по краям линий, то сначала надо провести постеризацию - преобразовать в картинку с 4 чистыми цветами.
 
Если чёрный и белый цвета на исходниках чистые, а оттенки серого плавают, то есть программы, которые позволяют ч.б вывести в один слой, а всё, что не ч.б. - в другой. Только если серые плавают, то скорее всего и у ч.б . флуктуации цвета будут.   Там не 0 0 0 , а например   0 0 5  
UPDATE  проверьте в XnVIEW инструментом  "карта цветов" число чистых цветов и корректность ч.б :    0 0 0   и 255 255 255.  
 
Добавлено:
Кстати, джву-кодер DEE  при кодировании должен сам разделить ч.б в маску , а остальное в фон. Поэтому для сегментированя фон-маска, я сначала кодирую джву без уменьшения фона. (пропорция фон-маска -  1-1). Т.е. одна из возможных программ-сегментёров - это сам DEE.  А потом, если какие-то буквы ушли вдруг в фон, дорабатываю их в СК. Потом из готовых слоёв собираю джву с понижением разрешения у фона.

Всего записей: 1094 | Зарегистр. 13-06-2013 | Отправлено: 09:01 14-01-2025 | Исправлено: daa2013, 09:22 14-01-2025
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Если вы хотите все цветные элементы (не-черные) загнать в задний слой

автор не дал исходника, поэтому насколько там чистые цвета, не известно, поэтому сужу по скриншотам и исходя из заявленных 4-х цветов: тут напрашивается обычная малоцветка без всякого фона.
 
 
Добавлено:

Цитата:
а СК перемещает фокус вьюера на сомнительное место

в свете вашего недавнего примера с дизерингом (тысячи подсветок), так себе предложение
 
Добавлено:

Цитата:
оставшиеся после глифирования черты от ужирнённых букв т, ш, п   , которые даже красным как спеклы не выделяются (вероятно, в СК есть некий встроенный порог ширина/высота на спеклы

вы не путаете спеклы и марашки?
 
Добавлено:

Цитата:
Это я к чему, если бы при анализировании (естественно, некотором специальном режиме анализирования) в этот список попадали только буквы, в ячейках которых и в окрестности ячеек которых (размер +N пикселей к ячейке даже может задавать пользователь)  имеются спеклы (можно размера, как в опциях RV, можно заново указанного),

а почему важна именно привязка к буквам? это конечно облегчает задачу (иначе нужно придумывать какую-то воображаемую сетку), но все-таки.

Всего записей: 4602 | Зарегистр. 09-09-2002 | Отправлено: 10:13 14-01-2025
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
вы не путаете спеклы и марашки?

 
В описываемом мной случае, это и не спекл, и не марашка, а ошмёток (он остался, невзирая на кнопку Remove speckles that touch):
 
https://disk.yandex.ru/i/cIR0eBamYaP2rw
 
Но я хочу, чтобы по такому же принципу ловился любой объект в ячейке буквы и некоей её окрестности, при этом буквой не являющийся.
 
Добавлено:

Цитата:
а почему важна именно привязка к буквам?

 
Изначально пожеланий было два: в привязке и не в привязке к букве.
Но я осознал, что то, что я сейчас делаю, это практически и есть то, что я хотел от СК.
 
Если бы было можно любой спекл туда загнать, было бы неплохо.
А потом. Если окрестность, например, не в 10, а в 200 пикселей задать, то может она и много чего поймает.
 
Добавлено:

Цитата:
иначе нужно придумывать какую-то воображаемую сетку

 
Идея с сеткой - ИМХО просто гениальная.

Всего записей: 1094 | Зарегистр. 13-06-2013 | Отправлено: 10:37 14-01-2025 | Исправлено: daa2013, 10:45 14-01-2025
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
не спекл, и не марашка, а ошмёток

на самом деле СК классифицирует ошметок при его удалении как 1) спекл (с любой стороны) 2) марашку (только слева от буквы или справа). В последнем примере ошметок ни то, ни другое, но он красный потому что не закрылся глифом-эталоном. Он слишком большой чтобы быть спеклом, и не годится на роль марашки, т.к. сверху. В режиме подсветки вы его никогда не отловите, т.к. он размером с букву, если же задать допустимый размер спекла такой величины, покраснеет вообще почти все. Т.е. тот режим, что вы просите, не поможет его отловить, учтите это.
 
 
Добавлено:

Цитата:
Есть ли возможность в СК задавать порядок применения фильтров установленных в окне "Enhance image" и есть ли информация какой порядок применяется по-умолчанию?

порядок поменять нельзя.  
Порядок примерно такой: сначала фильтры из окошка image enhancement, потом с основной закладки. По типу: сначала blur-фильтры, потом sharp-фильтры, потом smooth-фильтры, потом бинаризация, после нее c.smooth, despeckle и т.п. Deskew и resample могут быть в разных местах, в зависимости от того, увеличивается или уменьшается dpi.

Всего записей: 4602 | Зарегистр. 09-09-2002 | Отправлено: 11:35 14-01-2025 | Исправлено: bolega, 11:37 14-01-2025
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я задавал размер спекла, который был больше по числу пикселей, чем  ошмёток.
Красным он при этом не становился.
Насколько я понимаю (догадываюсь), есть какие-то внутренние ограничения/фильтры на пропорции спеклов и их близость к буквам/другим объектам. Разрыв-то там однопиксельный, думаю в этом дело.
Поэтому смысл ловить в окрестностях ячеек букв и вычитать эталонные буквы ещё и в том, чтобы ослабить или отменить эти ограничения в "зоне особого внимания".

Всего записей: 1094 | Зарегистр. 13-06-2013 | Отправлено: 12:42 14-01-2025 | Исправлено: daa2013, 12:45 14-01-2025
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Красным он при этом не становился.

еще не забывайте про влияние размера на обычную подсветку и на удаление ошметков, в случае, если задана опция use optimal size как у вас на скриншоте давеча:
http://forum.ru-board.com/topic.cgi?forum=5&topic=51231&start=1280#5
если она включена, тек. размер спеклов влияет только на подсветку спеклов, и
не влияет на удаление ошметков, т.к. СК во втором случае сам выбирает допуск и игнорирует заданный вами размер.
 

Всего записей: 4602 | Зарегистр. 09-09-2002 | Отправлено: 14:00 14-01-2025
asku



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
в illumination включите опцию protect edges. Иногда помогает, как в данном случае

 
А если опцию protect edges всегда держать включенной? Минус только в том, что это уменьшит скорость обработки скана?

Всего записей: 618 | Зарегистр. 04-05-2016 | Отправлено: 22:00 14-01-2025
Fire_Dragon



Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
порядок поменять нельзя.  
Порядок примерно такой: сначала фильтры из окошка image enhancement, потом с основной закладки. По типу: сначала blur-фильтры, потом sharp-фильтры, потом smooth-фильтры, потом бинаризация, после нее c.smooth, despeckle и т.п. Deskew и resample могут быть в разных местах, в зависимости от того, увеличивается или уменьшается dpi.

 
Было бы полезно чтобы такая возможность была, хотя бы ограниченная. Для начала хорошо бы просто сделать возможность пользователю видеть этот порядок, например, при активации фильтров в окне image enhancement, сделать возможным открыть окно в котором будет указан список фильтров в порядке их активации. У меня была ситуация: протестировал фильтр коррекции освещённости и фильтр очистки фона, запускаю обработку - получается дребедень, оказывается порядок вызова изменился и для того чтобы получить желаемый результат нужно делать через промежуточные задания, а это не очень то и удобно, поскольку таких заданий в сумме может получиться немало.
 
Добавлено:

Цитата:
автор не дал исходника, поэтому насколько там чистые цвета, не известно, поэтому сужу по скриншотам и исходя из заявленных 4-х цветов: тут напрашивается обычная малоцветка без всякого фона.  

 
Это и есть исходник, а не скриншот - специально подготовленное изображение с количеством цветов фактически равным четырём. С какими параметрами такие изображения надо кодировать в djvu, нужно ли предварительно создавать зоны?
 
Добавлено:

Цитата:
в дежавю всего два слоя - передний и задний.  
Если вы хотите все цветные элементы (не-черные) загнать в задний слой, то это не называют "малоцветный дежавю". Это "стандартный трехслойный дежавю".

 
Там ещё есть такая штука как слой маски, но не очень понятно когда и в каких случаях он добавляется, хочется этим процессом управлять.

Всего записей: 22 | Зарегистр. 19-11-2010 | Отправлено: 12:21 15-01-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Fire_Dragon
С какими параметрами такие изображения надо кодировать в djvu


 
итого:
https://disk.yandex.ru/d/zplkTUYTfaVtFw
 

Цитата:
есть такая штука как слой маски, но не очень понятно когда и в каких случаях он добавляется, хочется этим процессом управлять.

это "маска", она указывает своими нулями и единицами из какого слоя брать цвет пикселя.

Всего записей: 3386 | Зарегистр. 15-07-2010 | Отправлено: 15:21 15-01-2025
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru

Рейтинг.ru