Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator / СканКромсатор (Часть 4)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

Открыть новую тему     Написать ответ в эту тему

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ScanKromsator

Знаменитый Кромсатор для обрезки получаемых при сканировании изображений, а также для разделения страниц, очистки от мусора и т.п.  
Автор: bolega. http://bolega.hotmail.ru/.  
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Аналог ScanKromsator - Scan Tailor
 
Начало обсуждения - 1 часть, 2 часть, 3 часть
 
Текущая версия: ScanKromsator v6.00.5 (2,1 МБ) Настройка внешних утилит  
Предыдущая версия: 5.96.2  (файл sk.exe), утилиты к ней можно взять из v5.96.1  
 
Старые версии: Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон


Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
 
Хрестоматия материалов про СК , 2017 г.
(25 Mb, для открытия файла chm может потребоваться его разблокировать в свойствах файла, кликнув ПКМ)  
Включает, в том числе:
Видеоуроки про ScanKromsator Подробнее...
 
Обработка пикчур-зон от TelecomUral Подробнее...
 
English texts Подробнее...
 
Что делать, если ScanKromsator не делает то, что хотелось бы... И ещё bolega о том же самом...

Всего записей: 7198 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: TelecomUral, 15:00 20-12-2018
daa2013

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору


Цитата:
Сделал по Вашему алгоритму, на Win 8.1 все ок, никаких дублей и мисиматчей  

Так как это обсуждалось несколько ранее, я в порядке действия этого не указывал.
После копирования зоны через км надо вызвать из меню Zones - > Paste zones to pages

Всего записей: 539 | Зарегистр. 13-06-2013 | Отправлено: 23:50 27-01-2019
sergiokapone



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я получил мисиматчи, но пока свой пред пост изменял, вы успели ответить

Всего записей: 480 | Зарегистр. 07-06-2011 | Отправлено: 23:54 27-01-2019 | Исправлено: sergiokapone, 00:01 28-01-2019
daa2013

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
надо запускать процесс все страницы.
Если обработать одну страницу (через меню - Process - Current file), то нормально.

Всего записей: 539 | Зарегистр. 13-06-2013 | Отправлено: 00:16 28-01-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013
мисиматчи получил.
Я совсем запутался, вы в какой момент запускали Paste zones to pages, до или после мисиматч. А если делать пасте вручную, без вызова Paste zones to pages, баг остается? Я просто не пойму, баг из-за Paste zones to pages или из-за ручной вставки.
У меня никак не воспроизводится.
 
 
Добавлено:

Цитата:
А как тогда точно проверить ?

Я на всякий случай спросил, т.к. намедни обсуждалось поведение, когда в одной папке сразу несколько версий СК. При обработке одна версия используется, при запуске out-task может уже другая (та, к которой привязан spt)
 
Добавлено:
Ага, нашел. В настройках СК отключил использование более одного ядра при обработке и баг воспроизвелся. При обработке в нескольких потоков баг не проявлялся.

Всего записей: 3668 | Зарегистр. 09-09-2002 | Отправлено: 08:04 28-01-2019
daa2013

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
вы в какой момент запускали Paste zones to pages, до или после мисиматч.  

Если я копирую зону, делаю пасте ту пажес, то я наблюдаю сообщение о мисматч.
 

Цитата:
т.к. намедни обсуждалось поведение, когда в одной папке сразу несколько версий СК. При обработке одна версия используется, при запуске out-task может уже другая (та, к которой привязан spt)

нет, у меня всё отдельно стоит
 
 

Цитата:
Я просто не пойму, баг из-за Paste zones to pages или из-за ручной вставки.  

 
Я так понимаю, что это две разные ошибки, хотя имеющие схожую природу.
Ошибка с дублями воспроизводится вне зависимости от того, делал или нет я перед этим пасте ту пажес.
 
Я скачиваю субтаск на новой машине, делаю указанные действия и получаю дубли.  
 
Вот вообще с нуля, с загрузки этих 10 файликов из субтаска вместо его открытия:
 
 
Запускаю 6.4
Файл - Оупен имажес
4-я маркировочная кнопка
иду на 4 файл
создаю раскрашенную зону (синий текст) на колонтитуле
копирую зону через км в клипборд
иду (через список) на 5 стр и вставляю на 5-ю
процесс все  
= 4 и 5 страницы дубли
 
АПДЕЙТ
 

Цитата:
Ага, нашел. В настройках СК отключил использование более одного ядра при обработке и баг воспроизвелся. При обработке в нескольких потоков баг не проявлялся.

 
Ага, увидел, что вы добавили.
А с ошибкой ctr+z разобрались ?

Всего записей: 539 | Зарегистр. 13-06-2013 | Отправлено: 08:56 28-01-2019 | Исправлено: daa2013, 09:16 28-01-2019
TelecomUral

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
показ floodfill limiter: наблюдаю отрисовку этих областей по краю окошка редактирования зоны.
Влепить скриншот наверное не смогу, но суть простая: рисую вертикальный прямоугольник limiter'а вблизи левого края зоны. Потом увеличиваю масштаб колёсиком, и когда этот прямоугольник уходит за пределы окна, по краешку остаётся тонкая красная линия. Справа то же.

Всего записей: 491 | Зарегистр. 15-07-2010 | Отправлено: 15:20 28-01-2019
VidelSamogO



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Где скачать новую 6.4?

Всего записей: 723 | Зарегистр. 16-08-2008 | Отправлено: 15:25 28-01-2019 | Исправлено: VidelSamogO, 15:25 28-01-2019
allo04

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
VidelSamogO   нигде. Это для тестирования особо доверенными камрадами.

Всего записей: 150 | Зарегистр. 15-10-2009 | Отправлено: 17:55 28-01-2019 | Исправлено: allo04, 17:55 28-01-2019
TelecomUral

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
лассо становится фактически прямоугольником, если сделать так:
в Zones выбрать инструмент лассо
выделить кусок, установить limiter
щелкнуть на поле, которое буду зачищать (ctrl+shift+click)
нажать Del
нажать ctrl+z
попробовать сделать выделение. Должно быть лассо, кнопка его и показывает, а тянется прямоугольник.
 
Upd
нажимать ctrl+z необязательно. Первое выделение идёт прямоугольником. Потом лассо.
 
Upd2
нет ли тут ошибки с расчётом? не пойму, отчего чёрная полоска.
 

 
субтаск
https://yadi.sk/d/B9FyroGk6RJxWg

Всего записей: 491 | Зарегистр. 15-07-2010 | Отправлено: 12:51 29-01-2019 | Исправлено: TelecomUral, 16:30 29-01-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
нет ли тут ошибки с расчётом?  

Нет, такой расчет и заложен, очищается под зоной с запасом.  
Нужно в VR подчищать такие ошметки, т.к. в djvu они вылазят на передний слой. Но их бы не было, если бы край зоны был чуть дальше от картинки.  
Я кажется как-то писал вам про причину этого "запаса". Если имеется перекос скана и картинка вблизи текста (например, подпись под ним), то прямоугольную зону поставить будет проблематично - она залезет на текст и сотрет его (при включенной опции clear source area). Расстановка непрямоугольных зон более затратна по времени и по движениям. Поэтому прямоугольную зону при не очень большом перекрытии текста все-таки можно оставить, т.к. она хоть и залазит на текст, но СК не сотрет его именно из-за этого "запаса". Минус такого подхода - иногда нужно чистить ошметки на выходе в случае, если край зоны очень близко к ее содержимому. Кстати, такое поведение СК идет от самой первой версии, в которой появились зоны (не помню уже какой).
 

Всего записей: 3668 | Зарегистр. 09-09-2002 | Отправлено: 18:59 29-01-2019
VidelSamogO



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
нигде. Это для тестирования особо доверенными камрадами.  

Дайте потестировать. Интрересно, что там такого особо недоверяемого.

Всего записей: 723 | Зарегистр. 16-08-2008 | Отправлено: 19:21 29-01-2019
romanef



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
 
 

Цитата:
 
Это можно сделать, но только в новой версии.  
Желательно предварительно все страницы deskew-ть.  
Вместо рамки используется временная picture-зона.  
Делается это так: выбирается произвольный файл в списке. Все четыре резака ставятся почти вплотную друг к другу в районе центра. Затем положение резаков копируется на все страницы (диалог copy cutters state/position to...). Затем создается pic-зона размера, равного размеру необходимой рамки, тоже с центром в районе центра страницы. Зона размножается на все файлы (copy zone to clipboard + Zones > Paste zones to pages...). Затем проход по всем файлам и выставление зоны (по сути рамки) в нужную позицию. Затем нажатие новой кнопки Adjust cutters - в результате резаки выставляются строго по сторонам зоны-рамки. Когда все расставлено - удаление скопом всех зон на всех страницах (Zones > Picture zones > Delete...).  
Т.е. главная фишка - в новой команде Adjust cutters: если резак стоит внутри зон, то он сдвигается на е край, если стоит извне их - ничего не делается.  
Во время прохода желательно отключить фильтр отображения, чтобы быстрее двигать зону (Image > Special > No zoom filter)
 
 

 
Спасибо.  
Так как новой версии SK у меня нет, то я пока использую след. способ как делать кромсание рамкой-резаком фиксированного размера:
 
1. Сбрасываем положение резаков, чтобы они запарковались по краям страниц
2. Создаем на одной из страниц пикча-зону строго по размерам рамки для кромсания, которая будет  обрезать все лишнее
3. Копируем эту зону-"резак" на все страницы задания
4. Пробегаем по страницам, двигая мышкой эту зону-"резак" в нужное положение, чтобы кропнуть лишнее за ее пределами
5. Запускаем задание и ждем выполнения
6. В папке OUT забираем файлы pic.xxxx - это и есть наши откромсанные страницы строго фиксированного размера, и работаем дальше с ними, импортировав в новое задание.
 
 
 
 
 
 
 

Всего записей: 587 | Зарегистр. 14-11-2003 | Отправлено: 22:57 29-01-2019 | Исправлено: romanef, 01:12 30-01-2019
sergiokapone



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
romanef
Что это было? А главное, зачем?

Всего записей: 480 | Зарегистр. 07-06-2011 | Отправлено: 23:02 29-01-2019 | Исправлено: sergiokapone, 23:07 29-01-2019
romanef



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
отмотайте пару страниц назад

Всего записей: 587 | Зарегистр. 14-11-2003 | Отправлено: 23:12 29-01-2019
TelecomUral

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
очищается под зоной с запасом

Слово "запас" я воспринимал иначе. Выходит, этот "запас" фиксирован по толщине? А я думал, что он рассчитывается, исходя из угла наклона скана. Тут угол близок к нулю, и запаса быть по моему мнению не должно.  
Ясно, спасибо. Надо было резак повыше отодвинуть.
 
 
Добавлено:
bolega
Попробовал в визарде прицепить внешний файл дежавю. Жму кнопку Attach external djvu, она даже визуально как-то "дёргается" вместе с окном визарда (типа некий процесс отработал и вернул управление, окно перерисовалось), но циферка этапа не появляется, и остается красная надпись "число нераспределенных файлов =1".
Однако когда я решил плюнуть и просто закодить с одним нераспределенным файлом, по факту дежавюшка страницы прикрутилась.
Один нюанс, может, в нём дело: чтобы добавить дежавю-страничку в конец, я в out-task задублировал последнюю страницу в списке входных файлов. Была "g0097.tif", стало их две. дежавю обозвал g0097.djvu.
 
оффтоп
bolega, а как вы в своих книгах получаете OCR-слой для цветного текста? Экспортируете все страницы из готового дежавю и скармливаете распознавалке? У меня таким способом ФР-проект ДЭ8 больше 30Гб сожрал пока я сгенерировал все 700 страниц текста. Может, есть поэкономнее путь.

Всего записей: 491 | Зарегистр. 15-07-2010 | Отправлено: 06:45 30-01-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
А я думал, что он рассчитывается, исходя из угла наклона скана

так и есть
 

Цитата:
Тут угол близок к нулю

ничего себе "близок". 0,7 градуса это значительный перекос. Запас зависит от угла и ширины зоны (по сути проекция, можно сказать тень на текст под зоной). Чем меньше ширина, тем меньше запас выходит. И наоборот, чем шире, тем сильнее (на крае особенно) прямоугольная зона выйдет за пределы и закроет собой текст.
 

Цитата:
как вы в своих книгах получаете OCR-слой для цветного текста?

сохраняю временно все out-файлы. Во всех зонах отключаю скопом раскраску. Делаю merge всех b/w-зон. Делаю ocr. Восстанавливаю out-файлы.
 

Всего записей: 3668 | Зарегистр. 09-09-2002 | Отправлено: 18:24 30-01-2019
TelecomUral

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
отключаю скопом раскраску

О! Спасибки, не додумался.

Всего записей: 491 | Зарегистр. 15-07-2010 | Отправлено: 18:41 30-01-2019
daa2013

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Имею страницу  3568*4645, на ней выставлена зона во всю страницу (3567*4644) - писал уже, что почему-то зарезает на пиксель, и пара раскрашенных зон поменьше.
Djvu   генерируется в размере   3570*4647, и я теряю совпадение пиксельных размеров страниц в книге.
 
Провёл обработку в 6.00.5:  размер остался нормальный 3568*4645
(если же открыть в 6.00.5 оут-задание от 6.4, то получаю те же гадкие 3570*4647)

Всего записей: 539 | Зарегистр. 13-06-2013 | Отправлено: 08:27 31-01-2019 | Исправлено: daa2013, 08:48 31-01-2019
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013

Цитата:
на ней выставлена зона во всю страницу  

Командой fit to page?
Зоны внешние или внутренние? На закладке Book что задано в size multiply? Что пишет лог визарда по поводу resize sjbz? И еще можно было бы несколько вопросов задать, чтобы реально начать разбираться в причине, а не просто наугад анализировать тысячи строк кода СК. Но не буду. В таких случаях пишут "телепаты в отпуске"

Всего записей: 3668 | Зарегистр. 09-09-2002 | Отправлено: 10:40 31-01-2019
daa2013

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Да я просто не знаю, что выкладывать.
Вот тут две папки:
https://dropmefiles.com/XzR5j
 
0003 - проект с 6.4
0004 - проект с 6.00.5
в каждой лежит свой таск, оут-таск, и сделал ещё по субтаску.
 
Не знал про команду fit to page   в 6.4. (она же новая), руками на максимум растягивал. В 6.00.5., кстати, зона тоже на пиксель меньше получается.  
 
джву генерил из оут-таска, так что зоны внешние. В size multiply задано 12, размер none.  
В 6.4. вижу resize sjbz = Done  в 6.00.5 нет.  
Я догадываюсь, что тут ресайз сыграл (негодный размер кратен 6 для ширины и 3 для высоты), но в 6.00.5 его же нет. А потом как размер за пределы страницы-то вылез ? Я же делаю одинаковые действия что в 6.00.5 , что в 6.4., а результат получаю разный. (Зоны конечно не с пиксельной точностью идут) .
Вот сейчас из 6.4. запустил оуттаск для 6.00.5 - тоже размер нормальный.
Как уже писал, если из 6.00.5 запускаю оуттаск для 6.4. - размер ненормальный.
 
Получается, что в момент создания оут-таска что-то происходит.
 
Добавлено:
А что это за закладка в джву визарде  EITabSheet4 ??

Всего записей: 539 | Зарегистр. 13-06-2013 | Отправлено: 11:23 31-01-2019
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator / СканКромсатор (Часть 4)

Имя:
Пароль:
Сообщение

Для вставки имени, кликните на нем.

Опции сообщенияДобавить свою подпись
Подписаться на получение ответов по e-mail
Добавить тему в личные закладки
Разрешить смайлики?
Запретить коды


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.Board
© Ru.Board 2000-2018

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru

Рейтинг.ru