Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg

Цитата:
всего содержимого папки в СК без предварительной загрузки хотя бы одного скана?  

Пустое задание. Как СК узнает что за папка?
 

Цитата:
А нельзя ли реализовать

Можно: выделите папку в проводнике, перетащите в окно СК и киньте ее там в редактор. СК поддерживает drag&drop файлов и папок

Всего записей: 4441 | Зарегистр. 09-09-2002 | Отправлено: 07:57 05-07-2021
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
почему бы не управлять этим параметром через файл ini

На самом деле параметр всегда сохранялся в Ini-файл. И восстанавливался. Но в какой-то версии я ошибочно переставил местами несколько строчек кода, и в итоге восстановление происходит до того, как читается ini. Исправил баг. Спасибо.
 
Smart-сортировку я просто переделаю, сделаю более универсальную. Сейчас она рассчитана на одно число в имени. Если их несколько, то smart или работает не так как надо, или вообще отключается. Сделаю, чтобы он распознавал до трех числовых последовательностей в имени.

Всего записей: 4441 | Зарегистр. 09-09-2002 | Отправлено: 11:21 05-07-2021 | Исправлено: bolega, 11:38 05-07-2021
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega

Цитата:
Цитата:
всего содержимого папки в СК без предварительной загрузки хотя бы одного скана?  
 
Пустое задание. Как СК узнает что за папка?

Я имел в виду, что после входа в диалоговое окно "Открыть " по Files > Open images...,если нажата комбинация Ctrl+Shift, то достаточно выбрать любой файл из нужной директории, чтобы загрузить все файлы.

Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 12:11 05-07-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
распознавал до трех числовых последовательностей в имени

и чтоб длинные числа верно отрабатывал. Если можно. С МФУ РГБ идут типа "doc43125920200206203133_002.jpg", хорошо бы общую часть цифр в папке считать именем. И что-то подобное.

Всего записей: 3055 | Зарегистр. 15-07-2010 | Отправлено: 12:13 05-07-2021
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
В именах вида doc43125920200206203133_002.jpg
надеюсь в списке меняется только последнее число?

Всего записей: 4441 | Зарегистр. 09-09-2002 | Отправлено: 13:03 05-07-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
не-ет  
я щас на новой винде (10ке) ничего из старых привычных папок найти не могу толком. Все попеременилось, что-то недоступно. Никак до ума не доведу переезд. Но по памяти - мне академии обложки и утраты человек присылал, ходил ногами и сканил - там в одной папке могло быть три-четыре разных больших числа группами, и последними знаками они тоже различались. Типа 43125920200206203133, 43125920200206203134, и 43126020200206203205. Примерно так. То есть номер задания в начале и временная метка в конце. Кабы было стандартно, префикс, я б сам заменял тоталкоммандером.
При этом после подчеркивания номер идёт обычным инкрементом в пределах номера задания. Насколько помню.
 
Добавлено:
UPD. Мне кажется, будет достаточно ввести логику обнаружения и игнорирования слишком большого числа. Просто считать его начало (не все число!) "одной большой буквой" для сортировки.

Всего записей: 3055 | Зарегистр. 15-07-2010 | Отправлено: 16:02 05-07-2021
Archivist

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
А собственно, для чего вообще сохранять эти многосложные оригинальные названия? Ну прислал человек пачку сканов со своими названиями, переименовали как надо и загрузили. Удобнее ведь когда название файла соответствует номеру страницы. Обложку, форзац и прочее назвать 000a, 000b итд.

Всего записей: 327 | Зарегистр. 10-08-2018 | Отправлено: 19:20 05-07-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Archivist
лишняя возможность накосячить при ручном переименовании. сбить исходный порядок.

Всего записей: 3055 | Зарегистр. 15-07-2010 | Отправлено: 19:48 05-07-2021
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
Еще одно странное поведение последней версии СК.
Загрузил в программу сканы, пронумерованные от 001 до 503 без пропусков.
Обычно в поле Output prefix я автоматически ставлю *, чтобы не заморачиваться с именами выходных сканов, а в данном случае забыл это сделать и по умолчанию получил имена выходных сканов от 0001 до 0503. Обработав задание, сохранил его.
Через некоторое время выяснилось, что перед 228-м входным сканом нужно вставить два пропущенных скана, имена которых были 227(170) и 227(171) (чтобы облегчить нахождение места вставки).
Загружаю сохраненное задание и замечаю, что в поле Output prefix нет *.
Так как выходные файлы задания были использованы как входные в следующем задании, то просто вставить их в нужное место я не могу, т.к. имена последующих выходных файлов увеличатся на 2.
Решаю, что ничего страшного, вставляю эти два скана в нужное место задания и проставляю в поле Output prefix "*". Расчет такой, что, конечно, в рамках этого задания я не смогу уже посмотреть выходные файлы ранее обработанных сканов, но мне это и не нужно, т.к. они уже задействованы в следующем задании, зато я буду иметь выходные файлы двух добавленных, которые смогу вставить в следующее задание.
Задумано - сделано!
Обработываю только эти два добавленные сканы и получаю на выходе их же с их именами. Все вроде замечательно. Захожу в выходную папку первого задания и вижу сканы с добавленными именами, НО выходные файлы 0228 и 0229 исчезли, а все последующие выходные файлы сдвинулись на два номера выше.
Как говорил один алкаш: вот такая загогулина!
 
Понимаю, что поставил программу в критическое положение, но на такой результат никак не расчитывал.
 
P.S. Думаю, что если бы я первоначально выбрал бы 3 в списке Name length, т.е. выровнял бы полностью имена входных и выходных файлов в первоначальном задании, то результат был бы тот же.
 
P.P.S. Еще одно предположение из всего вышесказанного, что значение поля Output prefix берется из ini-файла и не может быть изменено в процессе работы с заданием. Только его можно поменять, сохранив задание, закрыв его и вызвав заново.
Но тогда возникает вопрос, почему при обработке этих двух добавленных сканов было учтено текущее значение этого поля, т.к. выходные имена двух сканов были равны входным, а не присвоены порядковые номера, хотя сдвиг имен последующих файлов произошел?

Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 16:32 08-07-2021 | Исправлено: shch_vg, 17:01 08-07-2021
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
СК сделал все правильно. Это вы ошиблись.
Вы пишете, что сначала вставили файлы в задание, а потом только изменили prefix. Но я писал не раз (в том числе и в whatsnew 6.00.5), что СК переименовывает выходные файлы автоматически при их перетасовке. Если бы вы сначала поменяли префикс, и только потом тасовали, то ничего бы не произошло!
Трагедии никакой не вижу, уберите префикс и уберите два вставленных файла (или в конец их), тогда нумерация придет снова в исходное состояние. Только именно в такой последовательности.
 
Добавлено:
И честно говоря, не очень понял ваших манипуляций с префиксом. Можно было просто добавить новые файлы в конец, то же самое в Out-задании

Всего записей: 4441 | Зарегистр. 09-09-2002 | Отправлено: 17:01 08-07-2021 | Исправлено: bolega, 17:03 08-07-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Можно было просто добавить новые файлы в конец

вот-вот. Согласно логике обработки я так и делаю. Выгоняю в конец out-задания все что позабыл, а уже в нем передвигаю файлы в нужные места в списке. Вроде проблем не наблюдал при таком порядке действий.
Ну, разве что имена страниц внутри дежавю плывут. Какой-нибудь 183й между 32м и 33м.

Всего записей: 3055 | Зарегистр. 15-07-2010 | Отправлено: 17:58 08-07-2021
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega

Цитата:
И честно говоря, не очень понял ваших манипуляций с префиксом. Можно было просто добавить новые файлы в конец, то же самое в Out-задании

В задании собраны сканы журналов за целый год. Потерян лист в одном из журналов.
Обработка поэтапная: сначала просто выравнивание всех сканов, на следующем этапе конкретная обработка каждого скана. По мере ручной обработки отдельные номера выводятся в пдф, поэтому желательно их иметь вместе в нужном порядке.
 
Добавлено:
TelecomUral

Цитата:
Вроде проблем не наблюдал при таком порядке действий.
Ну, разве что имена страниц внутри дежавю плывут. Какой-нибудь 183й между 32м и 33м.

А разве это не проблема?

Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 19:45 08-07-2021
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А разве это не проблема?

Что еще раз подтверждает, что ваш подход некорректен. Если вы добавляете пропущенные страницы куда-то в середину задания, то логично переименовывать выходные файлы, а не изголяться с префиксом, т.к. это создает путаницу (по сути рассинхрон), что рано или поздно приведет к проблемам.  
Например, я делаю так. Если есть пропуски, то я вместо них вставляю пустые сканы, чтобы на выходе поддерживать правильную нумерацию. Когда отсутствующие страницы наконец-то находятся, я заменяю пустышки на них. И ничего переделывать (в плане нумерации) не надо, даже если выходные файлы использовались в out-задании.

Всего записей: 4441 | Зарегистр. 09-09-2002 | Отправлено: 20:34 08-07-2021
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
Вы описываете совсем другую ситуацию, чем та, которая была у меня. То, что сканы были пропущены, обнаружилось только после того, как выходные данные первого задания были задействованы во втором. Поэтому ни о каких предварительных вставках пустых страниц речи идти не могло.
 
P.S. Отквоченные Вами слова в предыдущем сообщении, относились не к Вам.

Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 21:46 08-07-2021 | Исправлено: shch_vg, 21:56 08-07-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg

Цитата:
А разве это не проблема?

проблема
Для чего я и замодулировал автора DjvuToy добавить функционал переименования страничек в его прогу. (а не ввести ли в СК фичу в визард дежавю? поле спец.имени вместо имени файла из задания. )
Но в вашем случае - я более внимательно почитал "условия задачи" - даже это не требовалось. Мысль ваша пошла зачем-то сохранять цепочку файлов от самого первоначального пуска СК. А это не было нужно. Во втором задании приаттачить новьё в конец и затем передвинуть, заранее поставив файлам "правильные" имена вручную.

Всего записей: 3055 | Зарегистр. 15-07-2010 | Отправлено: 04:22 09-07-2021 | Исправлено: TelecomUral, 04:30 09-07-2021
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я придумаю какой-нибудь способ информировать out-задание (и перестраивать его) при изменении порядка в исходном задании. Сейчас СК поддерживает только постраничное уведомление об изменениях в зонах

Всего записей: 4441 | Зарегистр. 09-09-2002 | Отправлено: 08:33 09-07-2021
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
TelecomUral

Цитата:
Мысль ваша пошла зачем-то сохранять цепочку файлов от самого первоначального пуска СК. А это не было нужно. Во втором задании приаттачить новьё в конец и затем передвинуть, заранее поставив файлам "правильные" имена вручную.

Именно этого мне в тот момент и не хотелось, слишком много ручной работы.
И двигалась она ИМХО в правильном направлении, а именно, обработать вставляемые уже с нужным именем сканы в режиме префикса *.
Ошибка была в порядке действий.
Я не хочу это проверять, т.к. придется снова кое-что перерабатывать, поэтому поверю автору программы, что если бы я сначала проставил в префикс *, а затем вставил недостающие и обработал их, то получил бы желаемый результат. Осталось бы только ввести выходные файлы во второе задание, и не было бы никаких проблем.
А из-за неправильного порядка (сначала вставка с пустым полем префикса и только потом вставка префикса *), нужную обработку вставляемых файлов я получил, но это привело к сдвигу имен выходных сканов после вставляемых на два значения вверх.
 
bolega
Мне как-то неловко это спрашивать, но мой склероз мне подсказывает, что в каких-то ранних версиях программы при манипуляциях с заданием с пустым префиксом на предмет вставки, удаления, перемещения строк она спрашивала, надо ли сдвигать имена файлов.
Это так или я снова что-то напутал?

Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 15:40 09-07-2021 | Исправлено: shch_vg, 15:57 09-07-2021
SorokaSV

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Нельзя ли сделать круглый ластик поменьше?

Всего записей: 15 | Зарегистр. 31-07-2010 | Отправлено: 12:20 10-07-2021
alexarbuzik

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
SorokaSV

Цитата:
Нельзя ли сделать круглый ластик поменьше?

Этот ластик и так уже достаточно маленький, а чтобы им было удобно оперировать в мелких частях пикселей букв, надо просто увеличивать изображение в постобработке, лично я делаю увеличение до того момента, как фон станет серым и клетчатым, по которым очень удобно кругленьким ластиком филигранно-ювелирно оттачивать любую букву до нужного варианта или рисовать им.

Всего записей: 48 | Зарегистр. 19-05-2016 | Отправлено: 15:49 10-07-2021
SorokaSV

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
alexarbuzik
 
надо просто увеличивать изображение в постобработке
 
Я конечно это знаю, но как раз это крайне неудобно. Хотелось бы ластик поменьше (а лучше, чтобы изменялся размер, как в фотошопе). Приходится пользоваться фотошопом (в этом моменте), но он очень плохо работает с черно-белыми изображениями.

Всего записей: 15 | Зарегистр. 31-07-2010 | Отправлено: 16:18 10-07-2021
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)
Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru