Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bearjrgm

Цитата:
при это м все диаграммы (подмененные) разные по размеру.  

А что мешает делать их одинаковыми в той программе, где вы их подменяете (DiagrammsPy?)
В конце концов, создаете зону, затем делаете идентичные копии через copy-paste. Это не оно?
 

Цитата:
И как-то можно выровнять эти зоны на странице, например, когда идет три картинки в ряд?  

Да, такая команда у меня в ппанах на реализацию есть.  

Всего записей: 4577 | Зарегистр. 09-09-2002 | Отправлено: 13:00 16-06-2020
bearjrgm



Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору

Цитата:
А что мешает делать их одинаковыми в той программе, где вы их подменяете (DiagrammsPy?)
В конце концов, создаете зону, затем делаете идентичные копии через copy-paste. Это не оно?

 
Ок, спасибо за ответ.
 
И еще вопрос, зоны можно перенумеровать?

Всего записей: 789 | Зарегистр. 03-07-2005 | Отправлено: 13:25 16-06-2020 | Исправлено: bearjrgm, 13:27 16-06-2020
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
зоны можно перенумеровать?

А смысл?

Всего записей: 4577 | Зарегистр. 09-09-2002 | Отправлено: 13:35 16-06-2020
bearjrgm



Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору

Цитата:
А смысл?

я пользовался Mouse-up созданием зон, пару раз промазал, что-то удалил, но эти зоны уже как бы есть и нумерация слетает.

Всего записей: 789 | Зарегистр. 03-07-2005 | Отправлено: 15:48 16-06-2020
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Это внутренний идентификатор зоны, участвует и в имени зоны. Я не пойму, что из того, что там пропуски? На что это влияет? Сделать ренумерацию можно, я просто не пойму, зачем это.  
 
Добавлено:

Цитата:
но эти зоны уже как бы есть  

Бред. Удалили, значит нет их.

Всего записей: 4577 | Зарегистр. 09-09-2002 | Отправлено: 16:04 16-06-2020
bearjrgm



Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору

Цитата:
На что это влияет?

на номера выходных файлов, которые становятся не последовательными, а с пропусками.

Всего записей: 789 | Зарегистр. 03-07-2005 | Отправлено: 17:02 16-06-2020
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Так я и хочу понять, зачем вам нужны именно последовательные номера.

Всего записей: 4577 | Зарегистр. 09-09-2002 | Отправлено: 18:08 16-06-2020
Benoni



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
Сделать ренумерацию можно
Как?
 

Цитата:
зачем вам нужны именно последовательные номера.
На странице 12 шахматных диаграмм. Все диаграммы заключаю в зоны. Обрабатываю, скажем, 100 страниц. Где-то, случайно, диаграмма была без зоны или дважды заключена в зону.
После обработки, в VR, каждая диаграмма (зона) получила свой pic.****. Желательно, чтобы номер этого pic.**** совпадал с номером диаграммы. Хотя бы для правки. Для нахождения диаграммы.  
А то разнобой в нумерации затрудняет нахождения нужной, сравнения диаграмм реальных и обработанных.
Вот, наверное, это имел ввиду  bearjrgm.

Всего записей: 1866 | Зарегистр. 15-06-2006 | Отправлено: 18:36 16-06-2020 | Исправлено: Benoni, 19:55 16-06-2020
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Benoni

Цитата:
Желательно, чтобы номер этого pic.**** совпадал с номером диаграммы. Хотя бы для правки. Для нахождения диаграммы.

Можно, конечно, менять и тифы pic, но зачем, когда это просто делается в СК?
Для этого есть режим отображения Zones.
Другой вариант - сделать слияние всех зон с диаграммами, а потом заменять их в окне VR.
И не надо следить за какой-то нумерацией, создавайте зоны хоть стохастическим способом.

Всего записей: 7212 | Зарегистр. 14-01-2005 | Отправлено: 20:44 16-06-2020 | Исправлено: shch_vg, 20:52 16-06-2020
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
А если в книге кроме диаграмм будут зоны с фото шахматистов. На разных страницах, вперемешку с диаграммами. Тогда что? Чтобы не сбивать нумерацию диаграмм, забьете на прочие иллюстрации?

Цитата:
А то разнобой в нумерации затрудняет нахождения нужной

Расскажите, как появляется потребность в нахождении нужной.  
Т.е. вдруг возникает необходимость найти диаграмму № 256. Вот просто с потолка 256? Я понимаю если вы на определенной странице книги натыкаетесь на диаграмму 256 и хотите ее найти в СК. Но зачем вам ее номер внутри СК, если вы знаете номер страницы? Переходите на страницу и быстро находите pic. Зайдем с другой стороны. Вы видите pic256 и хотите узнать где он в задании. Легко: Zones > Picture zones > Find by id.
Других вариантов зачем нужно искать по номеру я не представляю

Всего записей: 4577 | Зарегистр. 09-09-2002 | Отправлено: 20:59 16-06-2020
Benoni



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
А если в книге кроме диаграмм будут зоны с фото шахматистов
Как правило, в книгах по шахматам множество диаграмм. Фото мало. И их можно обработать после диаграмм.

Цитата:
Зайдем с другой стороны. Вы видите pic256 и хотите узнать где он в задании. Легко: Zones > Picture zones > Find by id.
Согласен. Есть такой вариант. Но всегда хочется по номеру диаграммы иметь pic того же номера.
Всё таки:

Цитата:
Сделать ренумерацию можно

Как?
 

Всего записей: 1866 | Зарегистр. 15-06-2006 | Отправлено: 21:33 16-06-2020 | Исправлено: Benoni, 21:34 16-06-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
оффтоп
Benoni
А если диаграммы имеют несквозную нумерацию, н-р 34а и 34б ?  
Меня прям разбирает любопытство - зачем "хочется"? (Да и bolega лишняя работа.) А если "захочется" иметь соответствие не номерам, а страницам, на которых они расположены?..

Цитата:
Вы видите pic256 и хотите узнать где он в задании.

Как вариант, report с экспортом списка соответствия.

Всего записей: 3354 | Зарегистр. 15-07-2010 | Отправлено: 06:24 17-06-2020
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
Как вариант, report с экспортом списка соответствия.  

Вы прям мысли мои читаете. Я безуспешно пытаюсь выяснить, зачем нужно такое жесткое соответствие. Т.к. разумного ответа не дают, кроме "хочется", прихожу к выводу, что эта потребность никакого отношения к задачам СК не имеет. Какие-то чисто шахматные заморочки. А такие вещи решать можно, но вспомогательными средствами (отчет, генерация скрипта и т.п.).
Если проводить аналогию с БД, номер зоны - это авто инкрементальное поле (используемое в индексах, в ссылках и т.д). Его ренумерация - это безумие, кто знаком с БД, тот поймет. К тому же в случае багов или внешних факторов, прерывающих процедуру, просто угробит задание. Поэтому о такой операции не может быть и речи. Но есть обходные пути, напр., генерация скрипта, который бы копировал файлы зон с заданной ренумерацией, т.е. не трогая задание. Можно добавить в свойства зоны новую опцию - еще один числовой тэг, и его заполнение и использование дать на откуп пользователю.

Всего записей: 4577 | Зарегистр. 09-09-2002 | Отправлено: 09:03 17-06-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega, надо что-то сделать с автопостеризацией. Нынеиспользуемый алгоритм - полная фигня. Вот на таких картинках, видимо, черный равен темнозеленому в неких внутренних координатах, и нормально постеризуется при числе цветов под 40. Что для кодера дежавю уже не имеет смысла. А при меньшем числе цветов черные стрелки становятся такими же зелеными, как линии сигналов. Я думал, что играет роль относительная доля площади цвета, но непохоже.
 

 
Может, сюда заходят математики, которые знают более приемлемый алгоритм. С учетом пространственной связности, например.  
 
Обходные пути, конечно, есть. Можно и цвета предварительно сгладить через clear magic, и разнести путающийся цвет заменой с ненулевой tolerance. Можно и hue, видимо, сдвинуть. Но всё это значительно более трудоемко из-за вариативности. Важно упростить первое окорачивание палитры.

Всего записей: 3354 | Зарегистр. 15-07-2010 | Отправлено: 12:37 17-06-2020
AlVaKo

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Если что, то я не математик.
Вот картинка с преобразованием. Тут яркость пиксела есть функция расстояния цвета у пиксела исходной картинки от некоторого базового цвета.  Считается расстояние в трехмерном цветовом пространстве(подобие HSL). Базовый цвет я задал вручную (RGB=56,104,118), у меня он скорее серо-голубой, а не темно-зеленый.  
 

 
 
Чем темнее пиксел, тем более он похож на базовый.  Попробуйте отбинаризировать эту картинку, поиграйтесь порогом. И станет видно, что часть пикселов "стрелок" очень близка к пикселам "сигналов". Алгоритмам автоматических постеризаторов тяжело будет "правильно" раскидать пикселы на малое число цветов.
 

Всего записей: 58 | Зарегистр. 06-07-2011 | Отправлено: 10:24 19-06-2020 | Исправлено: AlVaKo, 10:44 19-06-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
AlVaKo
близка к вертикальным палочкам, вы хотели сказать?
Зато на исходной картинке эти  желтые палочки от черных стрелок весьма далеко. Комбинация таких масок авось чего-нибудь бы и дала... для алгоритма.

Всего записей: 3354 | Зарегистр. 15-07-2010 | Отправлено: 13:58 19-06-2020
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Исправьте пожалуйста шапку - половина ссылок не работает.

Всего записей: 7020 | Зарегистр. 31-08-2008 | Отправлено: 14:53 19-06-2020
AlVaKo

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Я про другое пространство, не пространство скана. Про близость цветов у пикселей "осциллограммы" и пикселей "стрелок".
 
Вот более "жесткое" преобразование. Вертикальные палочки вообще не видны. Т.к. отсечена область цветных тонов даже близко не соприкасающихся с тоном базового цвета, выбранного для выделения пикселов "осциллограммы".  
 

 
Вот бинаризация с порогом 100.  Ошметки от "стрелок", "текста" хорошо видны.
 

 
 
Вот бинаризация с порогом 60. Что-то осталось от "стрелок". А контур "осциллограммы" начал деградировать.  
 

 
Где-то между двумя последними картинками,  можно надеятся увидить результат автоматической постеризации.  Вы хотите, "ошметки" чистить ещё каким-то дополнительным алгоритмом?  

Всего записей: 58 | Зарегистр. 06-07-2011 | Отправлено: 15:55 19-06-2020 | Исправлено: AlVaKo, 16:20 19-06-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
AlVaKo
а, понял. Вы берете один цвет. Для примера. Так?
 

Цитата:
Вы хотите, "ошметки" чистить ещё каким-то дополнительным алгоритмом?

Нет, это было бы и так неплохо получить на автомате, но если получится именно автомат по всем базовым цветам сразу. Дальше ручная чистка. И базовые цвета чтоб не вручную ставить. Ну чего сложного-то...
Пока что ручная постеризация вот таких геморройно отпечатанных картинок - очень трудоемко. Да, выходит, но за десяток-другой минут:

и черные линии все равно особо обрабатывать в отдельных зонах.

Всего записей: 3354 | Зарегистр. 15-07-2010 | Отправлено: 16:27 19-06-2020
AlVaKo

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Да, я хотел показать ситуацию, какие существуют проблемы при в общем правильно выбранном "базовом" цвете, для выделения всего лишь одного заранее выбранного цвета.  
 
По поводу автомата. Думаю, надо смотреть в сторону постеризатора на основе кластеризации. Простые алгоритмы сокращения палитры цветов слишком грубые.

Всего записей: 58 | Зарегистр. 06-07-2011 | Отправлено: 16:59 19-06-2020
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)
Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru