Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 5)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69

Открыть новую тему     Написать ответ в эту тему

Maz



Дед Мазай
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть [?] | 2 часть [?] | 3 часть [?] | 4 часть [?]

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка [?]  
 
Текущая версия программы : ScanKromsator v7.00 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 [?] |к v6.8 [?] | к v6.75 [?]
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка [?].
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее... [?]
 

Новое в 6-й версии [?]
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов) [?]
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
 

Работа с автоглифами
Как подключить: шаги [?]
Парсер    версия 2.3.1 из ветки утилит NME [?]
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... [?] | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее... [?]


О Хрестоматии 2.1 SK  [?]
 
Чтобы русифицировать СканКромсатор
В ini-файле в секции Options должен присутствовать параметр LangInt=1. Вернуть в исходный язык: LangInt=0. Пока русифицировано только MW.
 
ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...  [?]
И ещё bolega о том же самом... [?]  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ [?].

Всего записей: 39180 | Зарегистр. 26-02-2002 | Отправлено: 21:56 14-09-2023 | Исправлено: TelecomUral, 07:06 04-12-2024
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Fire_Dragon

Цитата:
С какими параметрами такие изображения надо кодировать в djvu, нужно ли предварительно создавать зоны?  

не нужно, сделайте как показал TelecomUral и СК сделает djvu абсолютно без потери качества

Всего записей: 4601 | Зарегистр. 09-09-2002 | Отправлено: 16:48 15-01-2025
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
а почему важна именно привязка к буквам?

Кстати, речь про анализ окрестности ячейки буквы была, насколько я помню, когда у меня обнаружились торчащие за пределы ячейки элементы. Т.е. OCR был выполнен с ошибками. Такая ситуация (я её назвал "торчки букв") была и с формулами, и с некорректным позиционированием буквы в ячейке.
 
Файл примеров собираю, но немного застрял, так как уже обработанные книги надо ребинаризовать и перераспознать. Но вот пара извлечений из него:
 
 
1) буква непропечатана, ячейка не учитывает верх. По умолчанию идёт сдвиг вниз. Хотя в данном случае, поскольку она распознана правильно, можно было бы сделать смещение вверх. Как вариант перебрать все четыре точки вклеивания (угла ячейки), от которых идет отсчёт и выбрать наилучшее соответствие:
https://disk.yandex.ru/i/oucFkHPO1XsnnA
 
 
2)  тут проблем нет. буква первая в списке, и сразу ловится, так как ячейка опознана правильно. Но вот если бы ячейка была неправильная, то это как раз пример того, что я и предлагаю ловить, когда из буквы явно торчит что-то серьезное (не марашка).
https://disk.yandex.ru/i/XVJc6QyUnUBgEQ

Всего записей: 1094 | Зарегистр. 13-06-2013 | Отправлено: 02:41 16-01-2025
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
 У меня была ситуация: протестировал фильтр коррекции освещённости и фильтр очистки фона, запускаю обработку - получается дребедень, оказывается порядок вызова изменился и для того чтобы получить желаемый результат нужно делать через промежуточные задания, а это не очень то и удобно, поскольку таких заданий в сумме может получиться немало.  

а у меня ситуация, когда пользователи на что-то жалуются, но примеров заданий не дают (красным в шапке для кого написано!). Подразумевается, что я должен включить телепатию, сам подбирать примеры для "багового" случая и уже тогда есть возможность в отладке искать причину. За исключением редких простых случаев, если примера нет, то я даже не берусь ковыряться в багах/хотелках, и т.п. Я не теоретик, я практик, и мое свободное время не безгранично.

Всего записей: 4601 | Зарегистр. 09-09-2002 | Отправлено: 08:03 16-01-2025 | Исправлено: bolega, 08:04 16-01-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
в защиту вопрошающего скажу, что и у меня редко, но бывало, что включение комбинации фильтров на пару с определенным типом бинаризации кардинально меняло результат обработки. Не ожидаемый результат. Типа легкая гамма плюс autoW плюс illjum correction плюс или минус несильный sharpen - и зависимость результата от ничтожных сдвигов параметров в гамме или шарпене просто поражала. Поодиночке же параметры можно подобрать очень плавно.
Конечно, визуальное перечисление порядка применения фильтров, а тем более их перемешивание, это глупость. Там явно не все так линейно-тривиально, как кажется неспециалисту. Но некоторой суммирующей доки по обработке не хватает до сих пор.
 
upd
я-то не присылал примеров, потому что догадывался что перемудрил с настройками. Всё отменял и пробовал другие пути обработки, попроще. И всегда находил.

Всего записей: 3386 | Зарегистр. 15-07-2010 | Отправлено: 08:25 16-01-2025 | Исправлено: TelecomUral, 08:32 16-01-2025
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
в защиту вопрошающего скажу, что и у меня редко, но бывало, что включение комбинации фильтров на пару с определенным типом бинаризации кардинально меняло результат обработки.

я с этим и не спорю. Моя мысль такая: если какой-то маршрут фильтров дает лучший результат, чем существующий сейчас, то дайте мне такой пример, его вариации. чтобы я лично воспроизвел и убедился, чтО становится лучше (или наоборот) и почему. Вот тогда я смогу поэкспериментировать и продумать стратегию применения фильтров. По голым заявлениям, что от такого то порядка то-то становится хуже или лучше я ничего сделать не смогу! Да и так понятно, что порядок фильтров важен, но это не повод, чтобы превращать СК в конструктор, это не полноценный редактор. Я должен воочию убедиться, что нестандартные маршруты обработки того стоят (и на большой выборке сканов), чтобы переписывать весь код обработки.
Например, у unsharp есть опция применять его до иллюминации или после, результат будет заметно отличаться. Я это предусмотрел.
 
Добавлено:

Цитата:
я-то не присылал примеров

я жду примеров только от того, кто что-то требует поменять или исправить.
 
Добавлено:
С preview все не очень удобно. Но по другому не получается. Лучший preview - это сама обработка. Сделать по классическому сценарию не получится, т.к. по сути потребуется та же самая полноценная обработка. Если делать preview какого-то фильтра, то не удивительно что после обработки будет по другому, preview делается над исходным сканом, а в реальности фильтр применится уже например после resample, где условия будут уже совсем другие.

Всего записей: 4601 | Зарегистр. 09-09-2002 | Отправлено: 10:43 16-01-2025 | Исправлено: bolega, 10:48 16-01-2025
Fire_Dragon



Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
а у меня ситуация, когда пользователи на что-то жалуются, но примеров заданий не дают (красным в шапке для кого написано!). Подразумевается, что я должен включить телепатию, сам подбирать примеры для "багового" случая и уже тогда есть возможность в отладке искать причину. За исключением редких простых случаев, если примера нет, то я даже не берусь ковыряться в багах/хотелках, и т.п. Я не теоретик, я практик, и мое свободное время не безгранично.

 
Мысль была в том, что когда устанавливаешь фильтры неочевидно в какой последовательности они будут применены и это не зависит от частного случая, а чтобы определить что получится после нажатия кнопки обработки может потребоваться слишком много итераций тестирования.
Я же правильно понимаю, что последовательность нажатия галки "Enable" для фильтроа не меняет порядок его применения, а СК руководствуется своим предопределённым порядком?
 
Добавлено:

Цитата:
итого:
https://disk.yandex.ru/d/zplkTUYTfaVtFw

 
Спасибо, посмотрим.

Всего записей: 22 | Зарегистр. 19-11-2010 | Отправлено: 21:46 16-01-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
оффтоп

Цитата:
Fire_Dragon
может потребоваться слишком много итераций тестирования.

остальное я ещё понял. А вот эта фраза напоминает "до булочной слишком много шагов, посижу голодным". Вам результат-то нужен? Если да, то число тестов параметр существенный, но не определяющий. Мне приходилось и по два дня над одним сканом сидеть.
И напоследок замечание: от того что появится удобный редактор применения фильтров число их комбинаций явно не уменьшится.

Всего записей: 3386 | Зарегистр. 15-07-2010 | Отправлено: 05:08 17-01-2025
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
При определении последовательности принимается во внимание следующее:
1) первым делом выполняется корректировка освещенности и удаление фона, т.к. любой фильтр или поворот может нарушить его "естественность" (плавность), что отрицательно скажется на удалении. Исключение только для unsharp. При сильном фоне уголки и перемычки букв могут сливаться с фоном и будут деградированы. Чтобы это минимизировать, достаточно перед удалением фона выполнить unsharp, потом его польза будет намного меньше.
2) Если есть повышение dpi, то СК старается сначала его повысить, и только потом применять фильтры. Так влияние фильтров будет более мягким (но при этом, не таким сильным, как хотелось бы). Если есть зоны, то сначала нужно их вырезать, чтобы resample не сказался на них, у них ведь могут свои требования к dpi. Раз сперва идет вырезка зон, то перед этим нужно исправить наклон (deskew), чтобы зоны уже были в правильном положении. Если нет зон, то deskew выполнятся после upsample, качество будет выше. Если вместо upsample задано downsample, то последовательность будет уже другая - сначала фильтры, поворот и только потом resample. И т.д. и т.п. Как видите, маршрут обработки сильно зависит от основных базовых опций: наличия pic-зон, resample, deskew. Именно поэтому сделать его произвольно настраиваемым по желанию пользователя практически невозможно в текущей реализации СК.
 
Но если у вас есть пример когда иной порядок фильтров дает гораздо лучший результат на выходе, то я готов рассмотреть пример. Но не голословно, как сейчас: "я сделал несколько итераций, что менял в них не скажу, что получил с ними и без них, не покажу, но дайте мне возможность в СК делать как я хочу, я лучше знаю как надо".

Всего записей: 4601 | Зарегистр. 09-09-2002 | Отправлено: 11:33 17-01-2025 | Исправлено: bolega, 11:37 17-01-2025
Fire_Dragon



Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
При определении последовательности принимается во внимание следующее:  

 
Спасибо за достаточно обстоятельный ответ, здесь есть любопытные моменты. Я даже так глубоко и не смотрел.
Но задам тогда вопрос прямой и простой: когда активируем два фильтра - коррекция освещённости и очистка фона, какой из них будет выполнен первым, а какой вторым после нажатия на кнопку обработки? Этот порядок будет всегда фиксированным или это определяется каждый раз заново? Результат то будет разным и поэтому это имеет значение.
 

Цитата:
остальное я ещё понял. А вот эта фраза напоминает "до булочной слишком много шагов, посижу голодным". Вам результат-то нужен? Если да, то число тестов параметр существенный, но не определяющий. Мне приходилось и по два дня над одним сканом сидеть.  

 
Я поясню нюансы моего использования СК и почему такие вопросы появляются, а то мы как будто используем инструмент по-разному. Моя задача получить максимально возможно качественный результат, или близкий к нему, поэтому много приходится эксперементировать. Когда я подбираю фильтры, я использую возможности предпросмотра и шаг за шагом применяю фильтры оценивая выход, когда цепочка желаемых фильтров подобрана - соответствующие галки активированы. И тут на арену выходит неопределённость. Из-за отсутствия понимания будет ли подобранная последовательность выполняться в том порядке который задуман, результат может отличаться от задуманного. Есть такая старая программа как  Book Restorer, так вот там фильтры устанавливаются пользователем и исполняются в задуманной последовательности, поэтому нет и шаманства; не надо гадать и предполагать, в СК же нет интуитивности даже в простых случаях, как в случае с коррекцией освещённости и очисткой фона, обозначенных выше. Причём, я не против внутренней магии, как выше описано автором - в данном случае это может быть разумно. Но ящик должен быть чёрным, в данном случае, в меру, что бы это не превращалось в борьбу с инструментом, хотя бы в простых случаях.
 
Добавлено:

Цитата:
итого:
https://disk.yandex.ru/d/zplkTUYTfaVtFw

 
Это как раз тот результат что был указан в моём первоначальном вопросе: http://forum.ru-board.com/topic.cgi?forum=5&topic=51231&start=1320#11 [?]
Пока варианта лучше не нашлось, если у кого появятся мысли - милости просим! Эксприменты с другими режимами кодирования приемлемых результатов не дали.
 
Добавлено:
Кстати, возможно, эта тема уже поднималась - почему в СК нет возможности выравнивания строк. Могу предположить что сложновато в реализации.

Всего записей: 22 | Зарегистр. 19-11-2010 | Отправлено: 20:22 17-01-2025
esys

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Могу предположить что сложновато в реализации.
 

Да, судя по тому, что этой функции нормально работающей нет нигде. Или где-то есть?  

Всего записей: 520 | Зарегистр. 22-06-2016 | Отправлено: 12:29 18-01-2025
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
В некоторых местах программы (например, RV) для перехода на нужное место используются списки, которые порой содержат сотни, а иногда более 1000-2000 элементов.
Есть ли возможность сделать переход на нужный, указывая в поле списка номер, как это делается во многих стандартных приложениях?

Всего записей: 7220 | Зарегистр. 14-01-2005 | Отправлено: 13:56 19-01-2025
asku



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подскажите пожалуйста, можно ли в режиме Result view копировать зону и вставлять ее на другую страницу?
 

Всего записей: 618 | Зарегистр. 04-05-2016 | Отправлено: 16:49 19-01-2025
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Fire_Dragon

Цитата:
коррекция освещённости и очистка фона, какой из них будет выполнен первым

сначала очистка. Кстати, никогда не предполагал использовать обе опции одновременно, т.к. одной после другой как правило уже нечего делать.
 
shch_vg

Цитата:
Есть ли возможность сделать переход на нужный, указывая в поле списка номер, как это делается во многих стандартных приложениях

для RV сделаю
 
asku

Цитата:
можно ли в режиме Result view копировать зону и вставлять ее на другую страницу?  

в текущей версии - нет. Файл зоны в RV - это следствие наличия picture-зоны на исходном скане, т.е. в задании. Нет описания зоны - нет файла в RV. Пока так. Если оторвать файл от описания, непонятно, что делать когда скан переобрабатывается, да и все bulk команды ориентированы на работу с описателями зон, а не просто с файлами.
Но разрешено копировать эту же зону в out-задании, т.к. там она появится в задании как внешняя.
 

Всего записей: 4601 | Зарегистр. 09-09-2002 | Отправлено: 13:53 20-01-2025 | Исправлено: bolega, 13:57 20-01-2025
asku



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
в текущей версии - нет.

 
 
Как жаль. А я расчистил все сканы от этих узоров (они очень плохо и криво отсканированы). Оставил только на одном развороте, заключив в зоны. Там они хорошо отсканированы. И сами узоры одинаковые на всех страницах. Думал, в RV расставлю на всех страницах в нужных местах и на выходе будет идеальный результат.
 

Цитата:
Но разрешено копировать эту же зону в out-задании, т.к. там она появится в задании как внешняя.

 
Надо будет попробовать.
 
Добавлено:

Цитата:
Надо будет попробовать.

 
А в out-задании сразу несколько зон на странице нельзя скопировать? Только одну? Чтобы на другой странице вставить эти несколько зон сразу.

Всего записей: 618 | Зарегистр. 04-05-2016 | Отправлено: 14:22 20-01-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
asku
 
 
можно

Всего записей: 3386 | Зарегистр. 15-07-2010 | Отправлено: 14:43 20-01-2025
asku



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Чтобы на другой странице вставить эти несколько зон сразу.

 
Да и просто двигать две выделенные зоны одновременно на одной странице было бы удобно.
 
Добавлено:
TelecomUral

Цитата:
можно

 
Как? Вроде только одну зону можно скопировать.
 
bolega
В out-задании все получилось. Результат отличный. Спасибо.

Всего записей: 618 | Зарегистр. 04-05-2016 | Отправлено: 14:43 20-01-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
asku
Как?

со шифтом или через добавление:
 

 
и вставляете
 

 
итого
 

Всего записей: 3386 | Зарегистр. 15-07-2010 | Отправлено: 21:13 20-01-2025
asku



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral, это разве в режиме out?

Всего записей: 618 | Зарегистр. 04-05-2016 | Отправлено: 17:05 21-01-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
asku
это разве в режиме out?

я не знаю такого режима.
 
На экранах все видно, что необходимо для размножения нескольких зон на другие страницы. Что спросили, то и ответил.

Всего записей: 3386 | Зарегистр. 15-07-2010 | Отправлено: 17:08 21-01-2025
asku



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
bolega пишет: «Но разрешено копировать эту же зону в out-задании, т.к. там она появится в задании как внешняя».
 
Вот в out-задании не получается выделить больше одной зоны.

Всего записей: 618 | Зарегистр. 04-05-2016 | Отправлено: 17:28 21-01-2025 | Исправлено: asku, 17:29 21-01-2025
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru

Рейтинг.ru