Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 5)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104

Открыть новую тему     Написать ответ в эту тему

Maz



Дед Мазай
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть | 4 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v7.04 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


О Хрестоматии 2.1 SK
 
Чтобы русифицировать СканКромсатор
В ini-файле в секции Options должен присутствовать параметр LangInt=1. Вернуть в исходный язык: LangInt=0. Пока русифицировано только MW.
 
ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 39707 | Зарегистр. 26-02-2002 | Отправлено: 21:56 14-09-2023 | Исправлено: TelecomUral, 05:50 28-09-2025
asku



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Добрый день. Применяю пастеризацию.

Белый цвет меняю на красный. Можно ли как-то контролировать размер белых точек, чтобы белый фон за красной фигурой не был затронут?
Я могу  выделять с помощью инструмента полигонального выделения, но можно ли просто выделять квадрат, чтобы захватывался и белый фон.
 
Вот тест, на всякий случай:
Ссылка

Всего записей: 701 | Зарегистр. 04-05-2016 | Отправлено: 10:28 06-11-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
asku
задание не смотрел, но, думаю, вы просто неверно выбрали точку красного в палитре, если так много проплешин после постеризации. Отсюда возник ненужный геморрой с точками. Я обычно делаю постеризацию в два-три этапа: усредняю оригинал (контраст/насыщенность/etc), потом сначала постеризую цветами, максимально приближенными к оригиналу, возможно даже участками где применяю разные палитры, и уж затем свожу участки к одной конечной палитре. Это в общем "тяжёлом" неравномерном по окраске случае. Типа жёлтой бумаги градиентом, или частичных непропечаток, тоже видно как градиент насыщенности. Подобрать одну палитру в общем случае не удается, либо цветов надо штук 20-25 и смысла в постеризации уже никакого.
 
upd
ещё два лайфхака:  
 - сильно приблизьте пиксели, которые собираетесь превращать из белых в красные. будет много, но квадратов
 - выделите красное волшебным выделением, а потом два-три увеличения и уменьшения выделенного. Затем заливка магическим (красным). Внутренние "некрасные" участки схлопнутся. обычно получившиеся утраты глазу не видны, если рисунок крупными мазками.

Всего записей: 3635 | Зарегистр. 15-07-2010 | Отправлено: 10:49 06-11-2025 | Исправлено: TelecomUral, 11:25 06-11-2025
asku



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral, наверное вы правы. Надо было предварительно поработать с оригиналом.

Всего записей: 701 | Зарегистр. 04-05-2016 | Отправлено: 19:11 06-11-2025
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Ув. bolega
В ScanKromsator ver. 7.04 в качестве Deskew method можно выбрать такие методы:
Auto(shear) (default), Fast, Antialias, Interpolate, Shear, Auto(a/alias)
В далёком 2008 в этой теме была такая рекомендация:

Цитата:
следует использовать только Auto(Shear)

Отсюда вопросы:
1) т.к. в версии 7.04 метод Auto(shear) является дефолтным, то можно заключить, что рекомендация 2008 года - использовать только Auto(shear) - верна и сегодня. Так ли это?
2) если рекомендация использовать только Auto(shear) остается в силе, то почему бы не убрать с глаз долой опции:
- Interpolate (который должен вызываться автоматом из Auto(shear) для серых/цветных сканов, если ничего не поменялось),  
- Shear (с компенсацией артефактов) (который должен вызываться автоматом из Auto(shear) для b/w сканов),  
- Antialias (который вроде бы уже вообще не нужен, т.к. создавался для b/w сканов, для которых теперь Shear)
- Fast (который уже давным-давно не самый быстрый)
3) ещё есть Auto(a/alias), про который я не нашел информации ни в этой теме, ни в Хрестоматии, ни в Whats New. Нужен ли он?
4) Имеет ли какое-то влияние выбор метода Resample filter (Linear, FastLinear, Lanczos3 (default), Bilinear, Bicubic, Mitchel) на результат Deskew, если не было upsample?
5) В Resample filter такие методы, как FastLinear, Linear, Bilinear, Bicubic, Lanczos3 хорошо известны - я их выписал по возрастанию качества, а вот Mitchell лично мне незнаком. И не нашел информации ни в этой теме, ни в Whats New, только в Хрестоматии есть упоминание "Mitchell работает быстрее Lancoz3 (и буквы чуть тоньше получаются), однако, проигрывает ему на плохих сканах". Для чего его можно использовать, и нужно ли, и как он по качеству относительно остальных?  
6) Вообще есть ли какие-то рекомендации по использованию методов Resample filter кроме
Цитата:
мне казалось, что отличия между ними в общем случае минимальные. В теории самым оптимальным из простых фильтров является Lanczos. При upsample ч/б сканов bicubic дает более гладкие контуры
. Всё-таки за 17 лет что-то могло поменяться.

Всего записей: 1060 | Зарегистр. 04-11-2019 | Отправлено: 03:21 07-11-2025
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Для списка букв под замену, как вы писали
 

Цитата:
можно из списка удалить все без галки: КМ > delete items...  

 
Но там на самом деле две команды Hide  и Delete
 
Я после вашего совета стал пользоваться Hide   . Но вот сейчас захотел сделать Unhide    и не нашёл.
А в чем тогда её отличие от Delete    ?

Всего записей: 1187 | Зарегистр. 13-06-2013 | Отправлено: 06:26 07-11-2025
asku



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Добрый день. Подскажите, пожалуйста, как здесь лучше обработать.
 

 
Вот тест:
Ссылка

Всего записей: 701 | Зарегистр. 04-05-2016 | Отправлено: 12:17 12-11-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
навскидку я бы делал второй зоной, захватывающей только текст. Полноцвет, постеризация в три цвета, удаление красного цвета заменой.
Попробовал, получается тонковато. ужирнил с помощью thicking фильтра
https://disk.yandex.ru/d/2cns0tRuQcEDcA
 
Наверное как-то можно через канал чёрного, будет явно лучше. bolega не объяснял как работают все фильтры в image adjustments. мне например не удалось сначала задействовать thining/thicking на тексте. звук ошибки при нажатии на apply. потом понял что надо цветность зоны понизить до bw, тогда получилось.

Всего записей: 3635 | Зарегистр. 15-07-2010 | Отправлено: 13:09 12-11-2025
asku



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral, у вас неплохо получилось )

Всего записей: 701 | Зарегистр. 04-05-2016 | Отправлено: 13:37 12-11-2025
sovokr

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
asku
https://cloud.mail.ru/public/8QQU/CtFs1jRqL
в "другой программе" более менее постеризация сработала, немного потом ее допилил в faststone viewer (яркость, контраст + уменьшение кол-ва цветов до 4), и затем в djvu "малоцветное кодирование".
 
Если кто расскажет, есть ли в СК возможность постеризовать целиком страницы, буду признателен.

Всего записей: 18 | Зарегистр. 25-07-2024 | Отправлено: 19:52 13-11-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
sovokr
есть ли в СК возможность постеризовать целиком страницы

 
зону на полную страницу
 
Добавлено:

Цитата:
sovokr
затем в djvu "малоцветное кодирование".

120дпи - ?

Всего записей: 3635 | Зарегистр. 15-07-2010 | Отправлено: 20:17 13-11-2025
sovokr

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
120дпи - ?

не совсем понял вопрос. скан в примере был 300дпи. в "другой программе" вывод делал в 600дпи. его дальше и допиливал.
 
upd.
хотя да, понял вопрос. в свойствах djvu 120dpi. видать faststone viewer побаловался. нужно следить за этим. согласен.

Всего записей: 18 | Зарегистр. 25-07-2024 | Отправлено: 22:48 13-11-2025 | Исправлено: sovokr, 23:30 13-11-2025
VadimirTT



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
А какой метод бинаризации и порог для такого?

Всего записей: 4021 | Зарегистр. 22-03-2005 | Отправлено: 20:30 15-11-2025
sovokr

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
VadimirTT
А чем Auto метод плох? Разве что добавить аншарп зону для справочных значений справа можно, чтоб почетче было.
https://cloud.mail.ru/public/geeg/9cmTESxTT

Всего записей: 18 | Зарегистр. 25-07-2024 | Отправлено: 01:22 16-11-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
VadimirTT
какой метод бинаризации и порог

вольф 5-30-5 при гамме 3.2.  
все прочие улучшалки отключены, деспекл тоже.
https://disk.yandex.ru/d/R2Cp4xCwTsk-bw
 
Обращаю внимание, коэф. Cymax=0,995, а не 0,905. Вообще, хороший пример,  почему надо старые книжки сканить в 600дпи и не сжимать джипегами.

Всего записей: 3635 | Зарегистр. 15-07-2010 | Отправлено: 06:14 16-11-2025
VadimirTT



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
sovokr
Если запустить Ваше задание, получается как у Вас на отлично.
Беру версию 7.04 делаю драфт кромсейт, для справочных данных в аншарп зону, запускаю, получаю хрень (остальные параметры по умолчанию. как там сделал bolega). Ауто улетает в 215, все черным черно, если уровень бинаризации принудительно сделать 150, как у Вас в задании получилось, то получается бледная немочь. А Вас на отлично. Как это?
 
TelecomUral
Ничего не понял. И там без сжатия скан (скан не мой).

Всего записей: 4021 | Зарегистр. 22-03-2005 | Отправлено: 10:34 16-11-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
VadimirTT
Ничего не понял. И там без сжатия скан (скан не мой).

Начну со второго.
я знаю что скан без сжатия. Сказано же: приглядитесь к циферке "9" в правой табличке в указанном значении. Отчего у sovokr там "0" - ? Оттого что посглаживал и деспекл сделал. Был бы четкий 600-дпишный скан (и не был притом этот скан сильнопожатым джипегом), возможно девятка в нолик бы не превратилась. Это, насколько я вижу, сканы от Usama79 с рутрекера, я с ними возился немного. Книги он вытаскивает редкостные, но в 600дпи сканы делать не захотел. Говорит что сканить долго. Ну вот, результатом имеет ошибки обработки. Смысловые.
 
Теперь о первом.
Вы что спросили, я то и ответил. какой метод какой порог - метод AutoW, три его параметра 5/30/5. В Quality\Enhance filter включена коррекция Gamma с ползунком, выведенным в значение 3.2.

Всего записей: 3635 | Зарегистр. 15-07-2010 | Отправлено: 10:44 16-11-2025 | Исправлено: TelecomUral, 10:47 16-11-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
VadimirTT say:
Цитата:
А какой метод бинаризации и порог для такого?

"Слегка" лезу не в своё дело. Но!...
Данный вопрос "слегка" странно звучит в рамках SK.
 
Полуоффтоп:
 
В другой программе этот вопрос уже не так странен, но не в силу природы данного вопроса, а в силу вопроса удобства. И ежели в другой программе нет возможности удобным образом организовать бинаризацию, кроме как вводом списка различных порогов, то в SK в точности до наоборот.
 
Что не так с природой порога?
 
Ежели обратиться к моей любимой книге Д.Е. Кнут "Компьютерная типография", то становится очевидно, что любой самый сложный порог представим простым тупым отсечением и любой сложности нормировкой (префильтрацией) перед этим отсечением.
 
И вот тут и начинается "затуп"! С какой "радости" рассматривать в SK какие то "сорта" порогов, ежели всё указывает, что этой программе уместно рассматривать именно нормировки (префильтрации) исходного изображения перед отсечением (простым порогом)? Причём нормировок в таком варианте может быть несколько, либо нормировка может микшироваться из нескольких различающихся видов префильтрации исходного изображения.
 
Подробнее про нормировку:
  • GIMP: пороговые карты и их применение
  • GIMP: префильтрация перед порогом
  • GIMP: «Сложный» порог

  • Всего записей: 1030 | Зарегистр. 18-05-2023 | Отправлено: 10:58 16-11-2025 | Исправлено: zvezdochiot, 11:49 16-11-2025
    fbm

    Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Может кто подскажет, как отключить финализацию, чтобы делать обработку в один этап?

    Всего записей: 202 | Зарегистр. 04-02-2006 | Отправлено: 11:50 16-11-2025
    TelecomUral

    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    fbm

    Цитата:
    как отключить финализацию, чтобы делать обработку в один этап?

    есть много способов сломать стандартный процесс. Снимите, например, галку automargins на закладке Page. Или расставьте рамки. Или назначьте gap=0 на закладке Book. Еще можно в новом задании авторазмножить настройки правой из четырёх крупных кнопок. Есть и другие способы.
     
    Встречный вопрос: зачем? надставка рассчитанных полей это всего лишь одна дополнительная команда в меню. Я ее даже не замечаю, настолько это незначительная заминка. При явном плюсе одинаковости размера страниц.

    Всего записей: 3635 | Зарегистр. 15-07-2010 | Отправлено: 12:10 16-11-2025
    fbm

    Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    TelecomUral
    Печально. Тем не менее спасибо, попробую.
     
    Отвечаю на вопрос зачем: просто привык работать со старой версией, когда выходные файлы с одного этапа обработки становятся входными для следующего этапа. Сама идея все взять и слить в один этап обработки вызывает у меня отторжение, ибо это ересь. И сейчас приходится жать на две кнопки там, где раньше хватало нажатия на одну. Увы, старые версии на 10 не работают: некоторые важные элементы интерфейса не отображаются.

    Всего записей: 202 | Зарегистр. 04-02-2006 | Отправлено: 12:22 16-11-2025 | Исправлено: fbm, 12:51 16-11-2025
    Открыть новую тему     Написать ответ в эту тему

    Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104

    Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 5)


    Реклама на форуме Ru.Board.

    Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
    Modified by Ru.B0ard
    © Ru.B0ard 2000-2025

    LiteCoin: LgY72v35StJhV2xbt8CpxbQ9gFY6jwZ67r

    Рейтинг.ru