Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору


Цитата:
Сделал по Вашему алгоритму, на Win 8.1 все ок, никаких дублей и мисиматчей  

Так как это обсуждалось несколько ранее, я в порядке действия этого не указывал.
После копирования зоны через км надо вызвать из меню Zones - > Paste zones to pages

Всего записей: 1014 | Зарегистр. 13-06-2013 | Отправлено: 23:50 27-01-2019
sergiokapone



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я получил мисиматчи, но пока свой пред пост изменял, вы успели ответить

Всего записей: 556 | Зарегистр. 07-06-2011 | Отправлено: 23:54 27-01-2019 | Исправлено: sergiokapone, 00:01 28-01-2019
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
надо запускать процесс все страницы.
Если обработать одну страницу (через меню - Process - Current file), то нормально.

Всего записей: 1014 | Зарегистр. 13-06-2013 | Отправлено: 00:16 28-01-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013
мисиматчи получил.
Я совсем запутался, вы в какой момент запускали Paste zones to pages, до или после мисиматч. А если делать пасте вручную, без вызова Paste zones to pages, баг остается? Я просто не пойму, баг из-за Paste zones to pages или из-за ручной вставки.
У меня никак не воспроизводится.
 
 
Добавлено:

Цитата:
А как тогда точно проверить ?

Я на всякий случай спросил, т.к. намедни обсуждалось поведение, когда в одной папке сразу несколько версий СК. При обработке одна версия используется, при запуске out-task может уже другая (та, к которой привязан spt)
 
Добавлено:
Ага, нашел. В настройках СК отключил использование более одного ядра при обработке и баг воспроизвелся. При обработке в нескольких потоков баг не проявлялся.

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 08:04 28-01-2019
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
вы в какой момент запускали Paste zones to pages, до или после мисиматч.  

Если я копирую зону, делаю пасте ту пажес, то я наблюдаю сообщение о мисматч.
 

Цитата:
т.к. намедни обсуждалось поведение, когда в одной папке сразу несколько версий СК. При обработке одна версия используется, при запуске out-task может уже другая (та, к которой привязан spt)

нет, у меня всё отдельно стоит
 
 

Цитата:
Я просто не пойму, баг из-за Paste zones to pages или из-за ручной вставки.  

 
Я так понимаю, что это две разные ошибки, хотя имеющие схожую природу.
Ошибка с дублями воспроизводится вне зависимости от того, делал или нет я перед этим пасте ту пажес.
 
Я скачиваю субтаск на новой машине, делаю указанные действия и получаю дубли.  
 
Вот вообще с нуля, с загрузки этих 10 файликов из субтаска вместо его открытия:
 
 
Запускаю 6.4
Файл - Оупен имажес
4-я маркировочная кнопка
иду на 4 файл
создаю раскрашенную зону (синий текст) на колонтитуле
копирую зону через км в клипборд
иду (через список) на 5 стр и вставляю на 5-ю
процесс все  
= 4 и 5 страницы дубли
 
АПДЕЙТ
 

Цитата:
Ага, нашел. В настройках СК отключил использование более одного ядра при обработке и баг воспроизвелся. При обработке в нескольких потоков баг не проявлялся.

 
Ага, увидел, что вы добавили.
А с ошибкой ctr+z разобрались ?

Всего записей: 1014 | Зарегистр. 13-06-2013 | Отправлено: 08:56 28-01-2019 | Исправлено: daa2013, 09:16 28-01-2019
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
показ floodfill limiter: наблюдаю отрисовку этих областей по краю окошка редактирования зоны.
Влепить скриншот наверное не смогу, но суть простая: рисую вертикальный прямоугольник limiter'а вблизи левого края зоны. Потом увеличиваю масштаб колёсиком, и когда этот прямоугольник уходит за пределы окна, по краешку остаётся тонкая красная линия. Справа то же.

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 15:20 28-01-2019
VidelSamogO



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Где скачать новую 6.4?

Всего записей: 765 | Зарегистр. 16-08-2008 | Отправлено: 15:25 28-01-2019 | Исправлено: VidelSamogO, 15:25 28-01-2019
allo04

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
VidelSamogO   нигде. Это для тестирования особо доверенными камрадами.

Всего записей: 197 | Зарегистр. 15-10-2009 | Отправлено: 17:55 28-01-2019 | Исправлено: allo04, 17:55 28-01-2019
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
лассо становится фактически прямоугольником, если сделать так:
в Zones выбрать инструмент лассо
выделить кусок, установить limiter
щелкнуть на поле, которое буду зачищать (ctrl+shift+click)
нажать Del
нажать ctrl+z
попробовать сделать выделение. Должно быть лассо, кнопка его и показывает, а тянется прямоугольник.
 
Upd
нажимать ctrl+z необязательно. Первое выделение идёт прямоугольником. Потом лассо.
 
Upd2
нет ли тут ошибки с расчётом? не пойму, отчего чёрная полоска.
 

 
субтаск
https://yadi.sk/d/B9FyroGk6RJxWg

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 12:51 29-01-2019 | Исправлено: TelecomUral, 16:30 29-01-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
нет ли тут ошибки с расчётом?  

Нет, такой расчет и заложен, очищается под зоной с запасом.  
Нужно в VR подчищать такие ошметки, т.к. в djvu они вылазят на передний слой. Но их бы не было, если бы край зоны был чуть дальше от картинки.  
Я кажется как-то писал вам про причину этого "запаса". Если имеется перекос скана и картинка вблизи текста (например, подпись под ним), то прямоугольную зону поставить будет проблематично - она залезет на текст и сотрет его (при включенной опции clear source area). Расстановка непрямоугольных зон более затратна по времени и по движениям. Поэтому прямоугольную зону при не очень большом перекрытии текста все-таки можно оставить, т.к. она хоть и залазит на текст, но СК не сотрет его именно из-за этого "запаса". Минус такого подхода - иногда нужно чистить ошметки на выходе в случае, если край зоны очень близко к ее содержимому. Кстати, такое поведение СК идет от самой первой версии, в которой появились зоны (не помню уже какой).
 

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 18:59 29-01-2019
VidelSamogO



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
нигде. Это для тестирования особо доверенными камрадами.  

Дайте потестировать. Интрересно, что там такого особо недоверяемого.

Всего записей: 765 | Зарегистр. 16-08-2008 | Отправлено: 19:21 29-01-2019
romanef



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
 
 

Цитата:
 
Это можно сделать, но только в новой версии.  
Желательно предварительно все страницы deskew-ть.  
Вместо рамки используется временная picture-зона.  
Делается это так: выбирается произвольный файл в списке. Все четыре резака ставятся почти вплотную друг к другу в районе центра. Затем положение резаков копируется на все страницы (диалог copy cutters state/position to...). Затем создается pic-зона размера, равного размеру необходимой рамки, тоже с центром в районе центра страницы. Зона размножается на все файлы (copy zone to clipboard + Zones > Paste zones to pages...). Затем проход по всем файлам и выставление зоны (по сути рамки) в нужную позицию. Затем нажатие новой кнопки Adjust cutters - в результате резаки выставляются строго по сторонам зоны-рамки. Когда все расставлено - удаление скопом всех зон на всех страницах (Zones > Picture zones > Delete...).  
Т.е. главная фишка - в новой команде Adjust cutters: если резак стоит внутри зон, то он сдвигается на е край, если стоит извне их - ничего не делается.  
Во время прохода желательно отключить фильтр отображения, чтобы быстрее двигать зону (Image > Special > No zoom filter)
 
 

 
Спасибо.  
Так как новой версии SK у меня нет, то я пока использую след. способ как делать кромсание рамкой-резаком фиксированного размера:
 
1. Сбрасываем положение резаков, чтобы они запарковались по краям страниц
2. Создаем на одной из страниц пикча-зону строго по размерам рамки для кромсания, которая будет  обрезать все лишнее
3. Копируем эту зону-"резак" на все страницы задания
4. Пробегаем по страницам, двигая мышкой эту зону-"резак" в нужное положение, чтобы кропнуть лишнее за ее пределами
5. Запускаем задание и ждем выполнения
6. В папке OUT забираем файлы pic.xxxx - это и есть наши откромсанные страницы строго фиксированного размера, и работаем дальше с ними, импортировав в новое задание.
 
 
 
 
 
 
 

Всего записей: 668 | Зарегистр. 14-11-2003 | Отправлено: 22:57 29-01-2019 | Исправлено: romanef, 01:12 30-01-2019
sergiokapone



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
romanef
Что это было? А главное, зачем?

Всего записей: 556 | Зарегистр. 07-06-2011 | Отправлено: 23:02 29-01-2019 | Исправлено: sergiokapone, 23:07 29-01-2019
romanef



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
отмотайте пару страниц назад

Всего записей: 668 | Зарегистр. 14-11-2003 | Отправлено: 23:12 29-01-2019
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
очищается под зоной с запасом

Слово "запас" я воспринимал иначе. Выходит, этот "запас" фиксирован по толщине? А я думал, что он рассчитывается, исходя из угла наклона скана. Тут угол близок к нулю, и запаса быть по моему мнению не должно.  
Ясно, спасибо. Надо было резак повыше отодвинуть.
 
 
Добавлено:
bolega
Попробовал в визарде прицепить внешний файл дежавю. Жму кнопку Attach external djvu, она даже визуально как-то "дёргается" вместе с окном визарда (типа некий процесс отработал и вернул управление, окно перерисовалось), но циферка этапа не появляется, и остается красная надпись "число нераспределенных файлов =1".
Однако когда я решил плюнуть и просто закодить с одним нераспределенным файлом, по факту дежавюшка страницы прикрутилась.
Один нюанс, может, в нём дело: чтобы добавить дежавю-страничку в конец, я в out-task задублировал последнюю страницу в списке входных файлов. Была "g0097.tif", стало их две. дежавю обозвал g0097.djvu.
 
оффтоп
bolega, а как вы в своих книгах получаете OCR-слой для цветного текста? Экспортируете все страницы из готового дежавю и скармливаете распознавалке? У меня таким способом ФР-проект ДЭ8 больше 30Гб сожрал пока я сгенерировал все 700 страниц текста. Может, есть поэкономнее путь.

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 06:45 30-01-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
А я думал, что он рассчитывается, исходя из угла наклона скана

так и есть
 

Цитата:
Тут угол близок к нулю

ничего себе "близок". 0,7 градуса это значительный перекос. Запас зависит от угла и ширины зоны (по сути проекция, можно сказать тень на текст под зоной). Чем меньше ширина, тем меньше запас выходит. И наоборот, чем шире, тем сильнее (на крае особенно) прямоугольная зона выйдет за пределы и закроет собой текст.
 

Цитата:
как вы в своих книгах получаете OCR-слой для цветного текста?

сохраняю временно все out-файлы. Во всех зонах отключаю скопом раскраску. Делаю merge всех b/w-зон. Делаю ocr. Восстанавливаю out-файлы.
 

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 18:24 30-01-2019
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
отключаю скопом раскраску

О! Спасибки, не додумался.

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 18:41 30-01-2019
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Имею страницу  3568*4645, на ней выставлена зона во всю страницу (3567*4644) - писал уже, что почему-то зарезает на пиксель, и пара раскрашенных зон поменьше.
Djvu   генерируется в размере   3570*4647, и я теряю совпадение пиксельных размеров страниц в книге.
 
Провёл обработку в 6.00.5:  размер остался нормальный 3568*4645
(если же открыть в 6.00.5 оут-задание от 6.4, то получаю те же гадкие 3570*4647)

Всего записей: 1014 | Зарегистр. 13-06-2013 | Отправлено: 08:27 31-01-2019 | Исправлено: daa2013, 08:48 31-01-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013

Цитата:
на ней выставлена зона во всю страницу  

Командой fit to page?
Зоны внешние или внутренние? На закладке Book что задано в size multiply? Что пишет лог визарда по поводу resize sjbz? И еще можно было бы несколько вопросов задать, чтобы реально начать разбираться в причине, а не просто наугад анализировать тысячи строк кода СК. Но не буду. В таких случаях пишут "телепаты в отпуске"

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 10:40 31-01-2019
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Да я просто не знаю, что выкладывать.
Вот тут две папки:
https://dropmefiles.com/XzR5j
 
0003 - проект с 6.4
0004 - проект с 6.00.5
в каждой лежит свой таск, оут-таск, и сделал ещё по субтаску.
 
Не знал про команду fit to page   в 6.4. (она же новая), руками на максимум растягивал. В 6.00.5., кстати, зона тоже на пиксель меньше получается.  
 
джву генерил из оут-таска, так что зоны внешние. В size multiply задано 12, размер none.  
В 6.4. вижу resize sjbz = Done  в 6.00.5 нет.  
Я догадываюсь, что тут ресайз сыграл (негодный размер кратен 6 для ширины и 3 для высоты), но в 6.00.5 его же нет. А потом как размер за пределы страницы-то вылез ? Я же делаю одинаковые действия что в 6.00.5 , что в 6.4., а результат получаю разный. (Зоны конечно не с пиксельной точностью идут) .
Вот сейчас из 6.4. запустил оуттаск для 6.00.5 - тоже размер нормальный.
Как уже писал, если из 6.00.5 запускаю оуттаск для 6.4. - размер ненормальный.
 
Получается, что в момент создания оут-таска что-то происходит.
 
Добавлено:
А что это за закладка в джву визарде  EITabSheet4 ??

Всего записей: 1014 | Зарегистр. 13-06-2013 | Отправлено: 11:23 31-01-2019
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)
Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru